• contact@dh-lab.hu
  • 1088 Budapest Múzeum krt. 6-8

Az együttműködés keretein belül az ELTE IK három hallgatója vesz részt a Laboratórium alprojektjeiben és fejlesztéseiben.

Fodor Andor Kristóf egy olyan szoftveren dolgozik, amivel a felhasználó képes regények adatbázisában keresni a metaadatok, a Full-text és az entitás alapú keresést kombinálva. A metaadat-os és a full-text szűrés alapján lehet keresni a regényekre, az entitás alapú szűrés alapján pedig konkrét bekezdésekre, amik tartalmazzák a megadott wikidata entitást/entitásokat.

Az alábbi képen látszik, hogy több entitásra is rá kereshetünk egyszerre. Jelen működés alapján ilyenkor azokat a bekezdéseket adja vissza, amikben vagy az egyik vagy a másik query alapján talált entitások vannak. Jelenleg tervezési fázisban van az, hogy rá lehessen keresni azokra a bekezdésekre, amikben mind a két entitás szerepel.

 

Csépán Botond feladata egy olyan keresőeszköz fejlesztése, amely kombinálja a szemantikus keresők feltételeken alapuló keresési mechanizmusát a szabadszavas keresőkkel. A fejlesztés célja, hogy az ELTE DH projektjéhez tartozó ELTEdata felületen úgy lehessen cikkeket keresni, hogy a feltételeknek megfelelő objektumok nevei (pl. európai fővárosoké) a külön megadott keresőszavak

közelében legyenek (pl. „koszos” stb.) a keresett cikkek tartalmán belül.
A képen a kereső felülete látható.

Gortka Bence egy olyan eszköz készítésén dolgozik mely a meglévő ocr-t vagy új ocr-t felhasználva, esetleg ezeket kombinálva és további feldolgozási folyamatokkal kiegészítve hoz létre tagolt xml fájlt, amiben az egyes dokumentum elemek a megfelelő xml tagek közé kerülnek.

Az eszköz felhasználója lehetőséget kap, hogy a különböző feldolgozási lehetőségek közül a neki megfelelőt válassza ki. Ebben segít egy előnézet, ahol lehet lapozni a pdf-ben és ezzel egyidőben a program kiszámítja az adott oldal xml előnézeteit a két választható ocr lehetőség szerint. Ezután a menüben kiválasztott opciók szerint elindítható a feldolgozás ami mentésre kerül a megadott helyre. A jövőben a program igény szerint további funkciókkal is bővíthető.
A képen a program fejlesztése látható.
2022.05.07.
Megosztás

Add Your Comments

Icon

Your email address will not be published. Required fields are marked *