• contact@dh-lab.hu
  • 1088 Budapest Múzeum krt. 6-8

A Digitális Örökség Nemzeti Laboratórium (DH-LAB) elnyerte a Kulturális és Innovációs Minisztérium Társadalmi Innovációs Díját Arany János hivatali iratainak mesterséges intelligencia (MI) alapú feldolgozásáért. Az elismerést 2024. november 13-án adták át a Minisztérium Könyvtártermében. A díjat Balogh Balázs, a HUN-REN Bölcsészettudományi Kutatóközpont főigazgatója vette át Zsigó Róbert miniszterhelyettestől. A nyertes fejlesztésben a HUN-REN BTK munkatársai közül Palkó Gábor, Fellegi Zsófia és Bobák Barbara, a Laboratórium részéről Fekete Norbert, Nemeskey Dávid és Szekrényes István vett részt. A DH-LAB projektje mellett a másik idei díjazott a Szabadtéri Néprajzi Múzeum demenciaprogramja volt.

A DH-LAB projektjében a HUN-REN Bölcsészettudományi Kutatóközpont Irodalomtudományi Intézetének munkatársai, a Miskolci Egyetem, az ELTE BTK Digitális Bölcsészet Tanszék és az ELTE IK Mesterséges Intelligencia Tanszék hallgatói működtek együtt. A fejlesztés célja a magyar nyelvre optimalizált MI-alapú kézírásfelismerő modellek kialakítása, amelyek közgyűjteményekben alkalmazhatók.

 

Palkó Gábor projektvezető

Arany János iratainak digitalizálása

A projekt egyik legfontosabb eredménye a Magyar Tudományos Akadémia Könyvtárában őrzött, Arany János hivatali iratait tartalmazó korpusz feldolgozása. Az 1859 és 1877 között, főtitkárként végzett adminisztratív munkája során Arany több mint 9200 dokumentumot hozott létre, ami közel 30.000 kéziratoldalt jelent. Az iratok digitalizálását és kereshetővé tételét egy speciális HTR (Handwritten Text Recognition) modell tette lehetővé, amelyet Arany és titkára, Ring Adorján kézírásai, valamint további kézírásminták alapján tanítottak. A modell hibaaránya mindössze 5%, és a dokumentumok kétrétegű PDF formában érhetők el az MTA Könyvtár repozitóriumában.

 

Fellegi Zsófia, Palkó Gábor, Kecskeméti Gábor és Balogh Balázs

A projekt innovatív hatása

A DH-LAB által fejlesztett kézírásfelismerő modell nemcsak az Arany-kéziratok feldolgozására alkalmas, hanem más közgyűjtemények is szabadon alkalmazhatják. A fejlesztés során olyan technológiai tudás (know-how) jött létre, amely a kulturális örökség digitális feldolgozásának európai trendjeihez igazodik, és akár a céges dokumentumok MI-alapú kezelésében is hasznosítható.

A projektben kizárólag magyar szakemberek és eszközök vettek részt, így teljes mértékben a hazai innovációt képviseli. A magyar nyelvű kézírás digitalizálása különösen fontos, mivel a nemzetközi MI modellek elsősorban nagy világnyelvekhez optimalizáltak, a kisebb nyelvek, mint a magyar, alulreprezentáltak.

A DH-LAB fejlesztését a 2024. november 21-23. között megrendezett World Science Forumon is bemutatják a Szépművészeti Múzeumban. A projekt nemcsak a magyar kulturális örökség feldolgozását forradalmasítja, hanem nemzetközi szinten is példát mutathat az MI technológiák alkalmazásában.

 

Fotók: Szőts-Rajkó Kinga/HUN-REN BTK

Megosztás

Add Your Comments

Icon

Your email address will not be published. Required fields are marked *