• contact@dh-lab.hu
  • 1088 Budapest Múzeum krt. 6-8
A gépi intelligencia nyelvfeldolgozó algoritmusainak fejlesztése
NLP eszközök fejlesztése kiemelt feladat. A magyar nyelvi elemző gépi intelligencia fejlesztése mind a nemzeti digitális örökség feltárásának és megőrzésének, mind pedig a fejlesztett speciális eszközök piaci hasznosításának előfeltétele.
Gold standard korpusz fejlesztése
Egy magyar nyelvű kézzel annotált referencia korpusz (gold standard korpusz) a gépi tanulás alapja. A DH-LAB-féle magyar referencia korpusz minőségének javítása a gépi tanuláson alapuló módszerek fejlesztésének és a teljesítményük összehasonlításának elengedhetetlen tényezője.
Magyar nyelvű anyagok webaratása
Magyarországon jelenleg kevés széles körű, koncentrált kulturális és tudományos célú archiválás folyik, ezért az adatvesztés nyilvánvaló és folyamatos. Ennek kiküszöbölésére a DH-LAB folyamatosan végzi a kutatási és innovációs szempontból releváns webes források kiválasztását és webaratását.
Irodalmi korpuszok
A projekt célja olyan gépileg annotált, nagy méretű irodalmi korpuszok létrehozása, amelyek lehetővé teszik a magyar irodalom kvantitatív alapú vizsgálatát.
„Born digital” labor
A magyar kulturális örökség nagy mennyiségű adatvesztést szenved el azáltal, hogy korlátozott az infrastruktúra, és kevés a szakember a digitálisan született (born-digital) anyagok archiválására, kezelésére. A born-digital anyagok kezelése nem csak gyűjteményi vagy tudományos kérdés, piaci szereplők is igénybe vehetik, hiszen a különféle, adott esetben elavult hordozókon tárolt és/vagy elavult formátumú anyagok kezelése speciális szaktudást igényel.
Wikibase
A Wikibase alprojekt prozopográfiai kutatócsoportok forrásanyagainak, illetve bibliográfiáinak szemantikus adathálózatba rendezésével foglalkozik.