Ahotsen datu-basea osatzeko euskaldunon ahotsak behar dira, adimen artifizialak euskaraz egin dezan
GAITUtik diotenez, "makinek gure hizkuntza hitz egin eta ulertu dezaten, irakutsi egin behar diegu. Horretarako, milaka ahots behar ditugu, milaka grabazio ordu euskaraz. Zure ahotsa garrantzitsua da. Ahots asko eta askotarikoak behar ditugu: adin tarte, genero eta mota guztietakoak. Eta zurea ere bai. Guztion artean sortzen ari garen ahotsen datu-basea, gero enpresa guztiek erabili ahal izango dute euskarazko tresna eta aplikazio berriak sortzeko, euskaldun guztion onurarako".
Nola funtzionatzen du?
- Sartu ondorengo helbidean: https://gaitu.eus/
- Bi aukera dituzu: hitz egin edo entzun. Oso erraza da!
Common Voice proiekturako euskarazko ahots-corpusa sortzen laguntzeko asmoz, Hizkuntza Politikarako Sailburuordetzak (HPS) sortutako proiektua da GAITU. Horrela, "euskarak testuinguru digitalean dagokion presentzia izango du, teknologia arloan duen erabilgarritasuna finkatuko du eta erabilera-eremuak handituko ditu", diote ekimenaren arduradunek.
Common Voice
GAITU Proiektuaren bidez, Mozilla fundazioak martxan jarritako Common Voice ekimena elikatuko da. Common Voice publikoki eskuragarri dagoen ahotsen datu-sorta bat da, munduko txoko desberdinetako boluntarioek beraien ahotsekin egina. Ahotsa darabilten aplikazioak sortu nahi dituztenek datu-sorta hau erabil dezakete beraien ikasketa automatikoko ereduak trebatzeko.
Gaur egun, ahotsen datu-sorta gehienak enpresenak dira eta horrek berrikuntza itotzen du. Gainera ahotsen datu-sortetan beharko luketena baino gutxiago agertzen dira ondokoak: ingelesez mintzo ez direnak, zuriak ez direnak, dibertsitate funtzionala dutenak, emakumeak eta LGBTQIA+ pertsonak. "Honek esan nahi du hainbat hizkuntzatan ez dagoela ahots-teknologiarik eta, dagoenean ere, hainbat pertsonarekin ez dabiltzala ondo. Hori aldatu nahi dugu leku guztietako jendea bere ahotsa partekatzen jarriz", diote.