Eneko Agirre: “Gure erronka nagusiena euskararen teknologiei bultzada handia ematea da”

Eneko Agirre: “Gure erronka nagusiena euskararen teknologiei bultzada handia ematea da”
2021/07/16 eta kitto!
Eneko Agirrek, HITZ Hizkuntzaren Teknologiako Euskal Zentroko zuzendariak eta Euskal Herriko Unibertsitateko Informatika Fakultateko irakasle-ikertzaileak, SCIE-BBVA 2021 Informatika Sari Nazionala jaso du, Aritmel modalitatean. Modalitate horrek irakaslearen ingeniaritza informatikoaren arloko ekarpen zientifiko bikainak saritzen ditu.

 

SCIE-BBVA Informatika Sari Nazionalaz gain, aurretik beste sari batzuk jaso izan dituzue (Google-ren eskutik, besteak beste). Nolako balioa ematen diezue sariei?

Oso sari garrantzitsuak dira eta urteetan egindako lanaren errekonozimendu bezala jasotzen ditugu. Googlek emandako sariak erakusten du hemen egiten dugun ikerkuntzak nazioarte-mailako garrantzia duela, ez dela hemengo gizarteari begira bakarrik egindako gauza bat. Informatika sari nazionala ere garrantzitsua da, erakusten duelako adimen artifizialean eta informatika mailan gure zentroa estatuko aurreratuenetako bat dela, ez hizkuntzaren prozesamenduan bakarrik. Askotan, ikerkuntzan egiten ditugun gauzek ikerkuntza-zirkuluetan bakarrik izaten dute oihartzuna eta ez dira gizarte-mailara pasatzen horrelako errekonozimenduak eduki arte.

 

Zertaz ari gara hizkuntzen prozesamenduaz berba egiten dugunean?

Informatikaren munduan, hizkuntzaren prozesamenduaren barruan biltzen ditugu testuarekin eta ahotsarekin lan egiten duten gailu guztiak. Tresna askoren multzoa da. Adibidez, interneten zerbait bilatzeko gure hizkuntzan gauzak tekleatzen ditugunean, bilatzaileek guk esandakoa interpretatzen dute eta dokumentuak bilatzen dituzte horri erantzuteko. Beste adibide batzuk: testu zuzentzaile bat erabiltzen dugunean gorriz azpimarratzen dituen berba guzti horiek ere gure arloko tresnak dira, baita autozuzentzaileak ere, edo mugikorrean zerbait tekleatzen dugunean berbak iradokitzen digun tresna; eta ahotsari dagokionez, edozein gailurekin ahotsaren bitartez telefono batera deitzen dugunean, edo mugikorrari berba egiten diogunean eta testura pasatzen duenean… Badaude ikusten ez diren beste gauza batzuk ere: sare sozialetan esaten dena arakatzen duten tresna batzuk daude eta hortik jakin dezakete sare sozial horietan produktu edo pertsona bati buruz ondo edo gaizki esaka ari diren. Hizkuntza bere zentzu zabalean makinek prozesatzeko gailu, tresna eta algoritmo guztiak biltzen ditu hizkuntzaren prozesamenduak. Horretarako, hizkuntza bakoitzari buruz jakin behar da, hizkuntza bakoitza berezia delako, baina ulermena eta sen ona ere gehitu egin behar dira.

 

Beraz, gutxi gorabehera, makinei hizkuntzak ulertzen erakusten diezue?

Hori da. Ondo esanda dago erakutsi egiten diegula. Izan ere, gaur egun funtzionatzeko dugun ereduari begiratzen badiogu, makinei adibideak ematen dizkiegu eta algoritmoak egiten ditugu, eta hortik ikasten dute.

 

Garapen teknologikoarekin posible ikusten duzue makinek euren kabuz ikastea?

Hori pixka bat fantasiosoa da. Makinek oso gauza konplikatuak egiten dituztela iruditu arren (eta egia da harrigarria dela egiten dituzten gauza batzuk), oso tontoak dira. Ikasten duten problema txiki bakoitza zehaztasun askorekin irakatsi behar zaie, esfortzu handiarekin. Daukaten adimen maila oso eskasa da eta erraz ikusi daiteke itzultzaileek egiten dituzten akatsetan. Makinak ez daki zertaz ari garen, ez du ulertzen gure mundua. Ikusi dituen itzulpenekin konparatzen du eta ondo itzultzen saiatzen da bakarrik. Sirirekin edo mugikorrarekin berba egiten dugunean berehala galtzen dira, ez dira gai elkarrizketa minimo bat edukitzeko.

 

Garatzen duzuen teknologiak nolako abantailak ekartzen dizkio gizarteari?

Teknologia hauekin informazioa eta ezagutza asko zabaltzea lortzen dugu. Gero eta denbora eta esfortzu gutxiago behar dugu gai baten inguruan informazioa biltzeko eta gauzak ikasteko. Kulturen artean ere zubi gehiago eraikitzen ditu. Orain, edozein atzerritarrek hartu dezake ‘…eta kitto!’ eta bere hizkuntzan irakurri. Ez perfektu, baina gutxienez jakin dezake Eibarren zein gauza gertatu diren azken egunetan, nahiz eta euskaraz ez jakin. Era berean, beste herrialde batera joatea interesatzen bazaigu, bertako informazioa hartu dezakegu eta euskarara itzuli. Bestetik, gizarte euskaldunari begira, hizkuntzaren prozesamendua euskaraz lantzen ez badugu, tresna asko gazteleraz, frantsesez edo ingelesez bakarrik geldituko dira eta horrek ekar dezake euskara atzean gelditzea gauza askotan.

 

Arlo horretan bereziki egiten duzue lan? Hizkuntzaren prozesamendua euskaraz lantzen?

Bai. Euskararekin egiten dugu lan, baina horrez gain, euskaraz sortzen ditugun tresna eta baliabide asko edozeinentzat erabilgarri jartzen ditugu. Google, Facebook, Microsoft eta horrelako erraldoiak hizkuntza askotara zabaltzen ari dira euren tresnak, arrazoi komertzialengatik motibatuta, eta guk jartzen ditugun baliabideek errazten dute beraiek hizkuntza horretan tresnak zabaltzea.

 

Erabiltzaileek badugu zeresana erraldoi horiek euskarazko tresnak eskuragarri jartzeko orduan?

Hori beste gai bat da, baina bai. Adibidez, multinazional batek jakin nahi badu zenbat lagunek duten Android euskaraz, ez dute kalean galdeketarik egingo, gailuek eta tresnek ematen dituzten datuetan oinarrituko dira. Orduan, Android gazteleraz badugu, ez da beste inoren errua, Android euskaraz edukitzea botoi bat sakatzea delako. Gauza bera Windows, Linux eta bestelakoak instalatzerakoan aukeratzen dugun hizkuntzarekin. Multinazionalak bultzatu behar dira euskara kontuan hartu dezaten.

 

Itzultzaile neuronalek nahiko ondo funtzionatzen dute. Antzeko tresna berriak etorriko dira? Daudenak garatuko dira?

Hobetzen doaz, baina azken hiru urteetan eman den aurrerakada sekulakoa izan da. Idatzizko itzultzaileak hobetzen joango dira, baina agian hobekuntzak ez dira hainbeste nabarituko. Laster ahotsetik ahotsera denbora errealean itzultzen duten tresnak etorriko direla uste dut. Hau da, aldibereko itzulpena.

 

Teknologia hauen inguruko aurrerapenak gero eta azkarrago datoz?

Saltoka doa. Itzulpen automatikoaren kontua trabatuta egon da hamarkadatan. 40. hamarkadatik aurrera proposatu zen itzulpen automatikoa nola egin eta aurrerapen batzuk egin ziren, baina gero trabatu egin zen. 80. hamarkadan berriz egon zen bultzada handia eta azkenengo bultzada azken hamar urteetan eman da. Teknologian egindako aurkikuntzek ematen dute horrelako jauzi kualitatiboak egiteko bidea, eta hori gertatu da hizkuntzaren prozesamenduan. Gero nork daki. Ikerlariak hortan gabiltza, ea modu berriak okurritzen zaizkigun hizkuntzaren ulertze horretan aurreratzeko.

 

Nolako erronkak dituzue HITZ ikerkuntza zentroan?

60 kide baino gehiagoko lan-taldea dugu eta, ikerketaz gain, irakaskuntza eta formazioa eskaintzen dugu. Gainera, enpresekin eta administrazioarekin aritzen gara, ikerkuntzen azken emaitzak lehenbailehen gure inguruko agenteei pasatzeko, mundu globalean konpetitu dezaten. Ikerkuntza-talde zabala da gurea eta zaila da esaten zeintzuk diren gure erronka guztiak, baina erronka nagusiena euskararen teknologiei bultzada handia ematea eta horretarako baliabideak lortzea da. Oraindik ere, nahiz eta bere tamainarako euskara ondo egon, aurrean erronka asko ditu eta horretarako baliabide gehiago sortu behar ditugu euskararako tresnak egon daitezen.