Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Kynntu þér reglur ritstjórnar um skoðanagreinar. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Lygin um að á Íslandi sé nauðgunarmenning Huginn Þór Grétarsson Skoðun Þjóðaröryggishætta Nýja Landspítalans Sigurður Sigurðsson Skoðun Hjúkrunarfræðingurinn sem skuldar meira, græðir helling og vill kíkja í pakka Haraldur Ólafsson Skoðun Ummæli Sönnu kalla á svör - hver er „freki karlinn“? Bergljót Gunnlaugsdóttir,Birna Gunnlaugsdóttir,Geirdís H. Kristjánsdóttir,Hallfríður Þórarinsdóttir,Júnía Líf Maríuerla Sigurjónsdóttir,Rósa Guðný Arnardóttir,Sigrún E. Unnsteinsdóttir Skoðun Sameign þjóðarinnar — eða stærsta tilfærsla auðlinda í sögu Íslands? Vilhelm Jónsson Skoðun Orkudrottningar Orkueyjunnar Ásta Olga Magnúsdóttir Skoðun Leið Sigmundar Davíðs og Trump eða fjölga valkostum fyrir Ísland? María Svanfríður Malmquist Skoðun Er þetta boðlegt fyrir fullvalda þjóð? Kristján Vigfússon Skoðun Vilja leiða þjóðina blinda til Brussel Tómas Þór Þórðarson Skoðun Hópurinn sem myndi hagnast mest Hjörtur J. Guðmundsson Skoðun Skoðun Skoðun Þjóðaröryggishætta Nýja Landspítalans Sigurður Sigurðsson skrifar Skoðun Lygin um að á Íslandi sé nauðgunarmenning Huginn Þór Grétarsson skrifar Skoðun Um lýðfullveldi Aðalsteinn Júlíus Magnússn skrifar Skoðun Ótvíræður ávinningur af innleiðingu farsældarlaganna Óskar Dýrmundur Ólafsson skrifar Skoðun Fjármagnið ásælist heilsugæsluna Steinunn Bragadóttir skrifar Skoðun Getur íslenska ríkið svipt börn frelsi vegna stöðu foreldra þeirra? Halldóra Lillý Jóhannsdóttir skrifar Skoðun Hálfsannleikur afneitunarsinnans Haukur Logi Jóhannsson skrifar Skoðun Borgarlína – og hvað svo? Þórir Garðarsson skrifar Skoðun Ísland er ekki til sölu Lilja Dögg Alfreðsdóttir skrifar Skoðun Orkudrottningar Orkueyjunnar Ásta Olga Magnúsdóttir skrifar Skoðun Ein besta fjárfesting heilbrigðiskerfisins? Gunnlaugur Már Briem skrifar Skoðun Lífsgæðaíbúðir fyrir eldra fólk – ábyrg uppbygging til framtíðar Margrét Vala Marteinsdóttir skrifar Skoðun Framtíð Hafnarfjarðar í höndum metnaðarfulls ungs fólks í Ungmennaráði Kristín Thoroddsen skrifar Skoðun Hvernig ætlar Ísland að marka spor sín í hinum gervigreinda heimi? Sara Sigurðardóttir skrifar Skoðun Lokað klukkan sex og þá byrjar kvöldið Steindór Þórarinsson skrifar Skoðun Hjúkrunarfræðingurinn sem skuldar meira, græðir helling og vill kíkja í pakka Haraldur Ólafsson skrifar Skoðun Trúnaðarmannatrygging og Eflingarvottun: Tæknikratalausn sem mun líklega ekki koma Guðröður Atli Jónsson skrifar Skoðun Betri borg fyrir börn - og alla aðra Kristinn Jón Ólafsson skrifar Skoðun Iran today Seyedeh Parinaz Mahdavi skrifar Skoðun Vilja leiða þjóðina blinda til Brussel Tómas Þór Þórðarson skrifar Skoðun Ummæli Sönnu kalla á svör - hver er „freki karlinn“? Bergljót Gunnlaugsdóttir,Birna Gunnlaugsdóttir,Geirdís H. Kristjánsdóttir,Hallfríður Þórarinsdóttir,Júnía Líf Maríuerla Sigurjónsdóttir,Rósa Guðný Arnardóttir,Sigrún E. Unnsteinsdóttir skrifar Skoðun „Við erum með lækna sem vilja vinna — en kerfið leyfir þeim það ekki“ Einar Sveinn Ólafsson skrifar Skoðun Spilafíkn er lýðheilsumál Oddur Sigurjónsson skrifar Skoðun „Má þetta til sanns vegar færa“ Hjörtur J. Guðmundsson skrifar Skoðun Leið Sigmundar Davíðs og Trump eða fjölga valkostum fyrir Ísland? María Svanfríður Malmquist skrifar Skoðun Er þetta boðlegt fyrir fullvalda þjóð? Kristján Vigfússon skrifar Skoðun Ópólitískur fróðleiksmoli um ESB Snorri Másson skrifar Skoðun Er íslenskan að verða „ísl-enska“? Birgir Liljar Soltani skrifar Skoðun Bjútíbox og gyllt dömubindi Berglind Guðmundsdóttir skrifar Skoðun Sterkt samfélag, öflugur skóli Jóhann Rúnar Pálsson skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Hjúkrunarfræðingurinn sem skuldar meira, græðir helling og vill kíkja í pakka Haraldur Ólafsson Skoðun
Ummæli Sönnu kalla á svör - hver er „freki karlinn“? Bergljót Gunnlaugsdóttir,Birna Gunnlaugsdóttir,Geirdís H. Kristjánsdóttir,Hallfríður Þórarinsdóttir,Júnía Líf Maríuerla Sigurjónsdóttir,Rósa Guðný Arnardóttir,Sigrún E. Unnsteinsdóttir Skoðun
Leið Sigmundar Davíðs og Trump eða fjölga valkostum fyrir Ísland? María Svanfríður Malmquist Skoðun
Skoðun Getur íslenska ríkið svipt börn frelsi vegna stöðu foreldra þeirra? Halldóra Lillý Jóhannsdóttir skrifar
Skoðun Lífsgæðaíbúðir fyrir eldra fólk – ábyrg uppbygging til framtíðar Margrét Vala Marteinsdóttir skrifar
Skoðun Framtíð Hafnarfjarðar í höndum metnaðarfulls ungs fólks í Ungmennaráði Kristín Thoroddsen skrifar
Skoðun Hvernig ætlar Ísland að marka spor sín í hinum gervigreinda heimi? Sara Sigurðardóttir skrifar
Skoðun Hjúkrunarfræðingurinn sem skuldar meira, græðir helling og vill kíkja í pakka Haraldur Ólafsson skrifar
Skoðun Trúnaðarmannatrygging og Eflingarvottun: Tæknikratalausn sem mun líklega ekki koma Guðröður Atli Jónsson skrifar
Skoðun Ummæli Sönnu kalla á svör - hver er „freki karlinn“? Bergljót Gunnlaugsdóttir,Birna Gunnlaugsdóttir,Geirdís H. Kristjánsdóttir,Hallfríður Þórarinsdóttir,Júnía Líf Maríuerla Sigurjónsdóttir,Rósa Guðný Arnardóttir,Sigrún E. Unnsteinsdóttir skrifar
Skoðun „Við erum með lækna sem vilja vinna — en kerfið leyfir þeim það ekki“ Einar Sveinn Ólafsson skrifar
Skoðun Leið Sigmundar Davíðs og Trump eða fjölga valkostum fyrir Ísland? María Svanfríður Malmquist skrifar
Hjúkrunarfræðingurinn sem skuldar meira, græðir helling og vill kíkja í pakka Haraldur Ólafsson Skoðun
Ummæli Sönnu kalla á svör - hver er „freki karlinn“? Bergljót Gunnlaugsdóttir,Birna Gunnlaugsdóttir,Geirdís H. Kristjánsdóttir,Hallfríður Þórarinsdóttir,Júnía Líf Maríuerla Sigurjónsdóttir,Rósa Guðný Arnardóttir,Sigrún E. Unnsteinsdóttir Skoðun
Leið Sigmundar Davíðs og Trump eða fjölga valkostum fyrir Ísland? María Svanfríður Malmquist Skoðun