A Magyar Levéltárosok Egyesületének Informatikai Szekciója és Forráskiadási Szekciója 2025. október 7-én tartotta őszi továbbképzését Budapest Főváros Levéltárában. A rendezvény központi témája a digitális szövegkiadások előkészítése, publikálása, valamint a szemantikus webtechnológia és a mesterséges intelligencia alapú eszközök levéltári és tudományos alkalmazása volt. A képzés szakmai partnerei az ELTE Humán Tudományok Kutatóközpontja Irodalomtudományi Intézet és a Digitális Örökség Nemzeti Laboratórium voltak.
A program a digitális filológia elméleti alapjaitól a legkorszerűbb mesterséges intelligencia-megoldásokig vezette végig a résztvevőket. Fellegi Zsófia Digitális tudományos szövegkiadások készítése és publikálása című kurzusa átfogó képet adott a digitális filológia történetéről és a nemzetközi szabványok (különösen a TEI – Text Encoding Initiative) alkalmazásáról. Bemutatta a magyarországi kezdeményezéseket – köztük a DigiPhil rendszert és az ITIdata szemantikus adatbázist –, valamint a FAIR elvek szerinti adatkezelést. Kiemelte, hogy a digitális kiadások nem pusztán digitalizált változatok, hanem a kutatást és adatgazdagítást támogató, önálló tudományos produktumok.

Ezt követően Dobás Kata előadása (Irodalomtudományi adatbázis-fejlesztés szemantikus web alapon) a bibliográfiai adatok szemantikus hálózatokba rendezésének módszereit és az ITIdata rendszer működését ismertette. Rávilágított, hogy a szemantikus adatstruktúrák révén a források közötti kapcsolatok gépileg értelmezhetők, ezáltal a levéltári anyagok új szintű összekapcsolhatósága és újrafelhasználhatósága válik lehetővé.

A délutáni szekciót Kovács-Bobák Barbara előadása (Kézírásfelismerés magyar és latin nyelvű szövegeken saját fejlesztésű eszközökkel) nyitotta, amely a Digitális Örökség Nemzeti Laboratórium saját fejlesztésű HTR-megoldásait (Handwritten Text Recognition) mutatta be. A korábbi Transkribus-alapú kísérletek után a laboratórium nyílt forráskódú TrOCR-modelljei magyar és latin kéziratok feldolgozását teszik lehetővé. A projekt célja, hogy az ingyenes, nyílt hozzáférésű eszközök révén a kézírásos források feldolgozása szélesebb szakmai kör számára is elérhetővé váljon.

A napot Palkó Gábor előadása zárta (Mesterséges intelligencia és digitális filológia), amely a generatív mesterséges intelligencia alkalmazásait és korlátait ismertette a filológiai kutatásban. Az előadás bemutatta, miként segíthetik a nagy nyelvi modellek (LLM-ek) a szövegelemzést, adatgazdagítást és korpuszépítést, ugyanakkor felhívta a figyelmet a modellek tudományos átláthatóságának és a forráskorpuszok reprezentativitásának kérdéseire is.

A gyakorlati blokkok során a résztvevők saját számítógépeiken próbálhatták ki az ismertetett eszközöket, betekintést nyerve a szövegkódolás, adatgazdagítás és kézírásfelismerés lépéseibe. A rendezvény egyszerre szolgálta a levéltári digitalizálási gyakorlat fejlesztését és a digitális bölcsészet legújabb eredményeinek megismertetését.
A továbbképzés – amelyen a Magyar Levéltárosok Egyesületének tagjai térítésmentesen, de előzetes regisztrációval vehettek részt – jól példázta, hogy a digitális örökség megőrzéséhez és újraértelmezéséhez elengedhetetlen a technológiai és bölcsészeti tudás összekapcsolása.