• contact@dh-lab.hu
  • 1088 Budapest Múzeum krt. 6-8

A Digitális Örökség Nemzeti Laboratórium Webaratás alprojektje a Digitális korszak nagy mértékű információtermeléssel és -fogyasztással összefüggő adatvesztését igyekszik csökkenteni. A tudományos célú archiválási projekt magyar nyelvű kulturális, politika, és közéleti témákban online megjelenő sajtótermékek megfelelő hosszútávú tárolását és kereshetővé tételét eszközölte. A több éve folyó kutatás eredményeképp a learatott webes tartalmakból nagyméretű, kutatható szövegkorpusz jött létre, melyet a projekt egyik kutatója, Nagy Mihály már saját doktori értekezéséhez is fel tudott használni.

Nagy Mihály a közelmúltban megjelent esettanulmányában az orosz-ukrán konfliktusról 2014-ben a magyar online sajtóorgánumokban publikált cikkek tartalmi elemzésének módszertani lehetőségeit boncolgatja. Az elemzés Dror Walter és Yotam Ophir Analysis of Topic Model Networks (ANTMN) elnevezésű automatizált keretelemző módszerének és egy újszerű, mesterséges intelligencia alapú topikmodellező eszköznek, a BERTopic-nak az alkalmazásával tesz kísérletet az adatkorpusz feltérképezésére.

A korábbi szófrekvenciákra épülő, szóalapú, topikmodellező alkalmazásokkal ellentétben az új, nyelvmodelleket használó apparátus már a szövegen belüli szemantikai kapcsolatokat is képes figyelembe venni a különböző témák meghatározásában. Az ilyen módon kinyert témák ezt követően hálózatba helyezhetők, így többek között kimutathatóvá válik a különböző sajtóorgánumok témakeretező attitűdje, az azonos topikok előfordulásainak, vagy az egyes témák gyakori együttállásának kapcsolata.

Az idei IFLA konferencián is bemutatott kutatási eredmények egyebek mellett felmutatták, jellemző a hazai sajtóban 2014-ben megjelenő nagy hírértékű, külföldi háborús hírek egymással azonos módon való tematizálása, kontextualizálása, valamint a korabeli Magyar Távirati Iroda közleményeinek meghatározó befolyása az információáramlásra.

Mihály kvantitatív kutatásában vázolt automatizált keretelemzés célja nem utolsó sorban a korábbi kvalitatív alapú keretezési módszertanokban megjelenő szubjektív értékítéletek, a kutatói elfogultság visszaszorítása a statisztikai elemzés érvényesítésével, illetve, természetesen, a hatékonyabb adatfeldolgozás, és -elemzés technikai lehetőségeinek kihasználása.

Fontos megjegyezni, hogy a fent vázolt kutatási részeredmények a 2014-es állapot statikus képét vázolják, ellenben az orosz-ukrán háború témakeretezésének vizsgálata szempontjából a szerző célja további idősíkok, s így egy bővített korpusz vizsgálata, mely a magyar diplomáciai és politikai vonatkozás időben végbemenő változásait is képes felmutatni.

A kutatási eredményeket közlő írás itt olvasható.

Megosztás

Add Your Comments

Icon

Your email address will not be published. Required fields are marked *