Artxiboa laburpen hitzeka: Matxin

Itzulpen automatikoa

Itziar Aduriz Agirre

1990 inguruan hasi nintzen entzuten itzulpen automatikoari buruzko berriak, lanean hasi bezain pronto. Artean, maiz entzuten zen ordenagailuek itzultzaileei lana kenduko zietela etorkizun laburrean eta adituentzako galdera gogokoa izaten zen hau. Gogoratuko zarete, seguru nago.

Tempus fugit. Azkar, gainera! Orain barre egiteko moduko baieztapena dela esango genuke, baina nik hori serio esaten eta galdetzen entzun dut, eta seguru idatzita ere topatzen ahal dela oso urrutira joan gabe.

Zer gertatu da tartean? Non dago harako uste hura? Non, itzultzaile automatikoen inguruko optimismo hura? 1930 inguruan hasi omen ziren lehen saioak, eta 1980ko hamarkadaren bukaeran EUROTRA proiektuaren porrota gertatu arte gorabehera asko izan ziren, baliabide automatikoen eskasiak eta, batez ere,  proiektu handinahiegiak tarteko. Urte horietako esperientziak erakutsi zuen hizkuntza asko batera helburu zuten proiektuek ez zutela atarramentu onik (EUROTRAren helburua Europako hizkuntza guztiak itzultzea zen) eta bestetik, urteak aurrera joan ahala ikusi zen baliabide automatikoen hobetze azkarra zetorrela eta horrek lagundu besterik ez zuela egingo helburuan.

Bizitzea tokatu zaigun errealismo garai honetan gauzak argitzen joan dira ezinbestean. Ereduak birplanteatzea beste aukerarik ez dute izan adituek aurrera egingo bazen. Eta hala izan da, zorionez.

Apirilaren bukaeran Gotzon Egia blogkidearen Bide barrijak artikuluan gai hau aipatzen zen, adibide ugariz hornitua, erakusteko, berak zioen moduan “hizkuntzalariak eta ingeniariak elkar hartuta” lortu dituzten aurrerabideak. Eta horrela jarraitzen zuen: “(…) tresna ugari dira sarean, hizkuntza batetik bestera esaldiak zehaztasun handi samarrez aldatzeko gai direnak”. Eskertu behar diot adibide horiek ekartzea, izan ere, batzuk ezagutu ere ez bainituen egiten.

Ondo samar ezagutzen ditudanak dira gaztelaniatik euskarara itzultzeko dauden tresnak, eta Gotzonek bere artikuluan aipatzen zuen Google Translatez gain, badira gure artean ongi sonatuak diren beste bi: IXA taldeak 2009an aurkeztu zuen Matxin izenekoa (eta honi buruzko artikulu interesgarria Senezen) eta Eusko Jaurlaritzak iaz aurkeztutakoa. Googlerena eredu estatistikoan oinarritutakoa, beste biak ordea, erregeletan, informazio gramatikalean, alegia.

Ikusi dudanarengatik eta inguruan ditudan adituek diotenez, Googleren itzultzaileak emaitza kaskarragoak ditu beste biak baino. Azken bien artean, berriz, hortxe-hortxe. Ikusi zer dioen IXA taldeko Kepa Sarasola adituak: «Hanka-sartze nabarmenak egiten dituzte biek, ez dute itzulpen perfektua egiten baina erabilgarri bihurtzen ari dira. Batez ere baldin badakizu bereizten noiz egin kasu eta noiz ez. Horixe ekarri du Googlek, jendeak ikasi du bereizten nola erabili itzultzaile automatikoak ematen duen itzulpena. Batzuetan erabilgarri, beste batzuetan ez, askotan moldatu egin behar da baina sarritan pista onak ematen ditu».

Izan ere, «itzulpen onak, gizakiok egiten dituzte, ez makinek», Gotzon Egiaren artikuluko hitzak berriro hona ekarriz.

Izango ez da ba! Bai gizakiarentzat bai ordenagailuarentzat atazarik konplexuenetakoa da bera, aurretik landu diren hizkuntza maila guztiak zuzentasunez ezagutzea eskatzen duena (lexikoa, morfologikoa, sintaktikoa, semantikoa, testuala, pragmatikoa). Horri, teknika ona gehituta, itzultzaile bikainaren aurrean izango gara. Oso zaila da, ordea, horiek denak txukun eta taxuz ebatziak izatea. Hala ere, denbora gure aldekoa da kasu honetan eta etengabeko hobekuntza gertatzen ari da maila horietan guztietan, ikerketa-lan handia dela medio. Hobekuntza partzial horiek bere isla izango dute itzultzaile automatikoen hobekuntzan, zalantzarik gabe.

Hizkuntzarenak ez diren kontsiderazioetan ez naiz sartuko, zer pentsatua ematen badute ere. Ni batez ere kezkatzen nauena bikoiztasunaren kontua da, gure herrian hamaikatxo aldiz ikusi dugun beste kasu askotan bezala. Alegia, erregela gramatikaletan oinarritutako bi itzultzaile behar al ziren? Ongi pentsatutako estrategiaren aurrean al gaude? Honek guztiak diru publikotan duen kostua ordaintzeko prest al gaude? Ez dakit ba.

Gaiari buruzko informazio gehiago nahi izanez gero IXA taldearen Hizkuntza-teknologiari buruzko bloga kontsulta dezakezue.

Bide batez, blog horretan bertan azaltzen den berria azpimarratu nahiko nuke eta taldeari zorionak eman European Association of Machine Translation elkartean hamaikagarren partaide instituzionala bihurtu delako.

Eta zorionekin bukatzeko, urte askotarako EHUko IXA taldeari. 25 urte lanean. Azkar esaten da! Zorionak lanagatik eta emaitzengatik.

Iruzkin bat utzi

Itziar Aduriz atalean