Itzulpen automatikoa zertan den

1950eko hamarkadan itzulpen automatikoranzko lehen urratsak egin zituztenean, pentsatzen zuten ordenagailuari gramatika-erregelak eta hiztegiak emanez lor zitezkeela itzulpenak, eta urtetan planteamendu horri jarraitu izan zaio. Gaur egun, ordea, itzulpen automatikoko sistema gehienak estatistikan oinarritzen dira hizkuntzen ezagutzan baino gehiago. 

Funtsean, sistema hainbat itzulpenez osaturiko corpus baten bidez entrenatzen da. prozesu horren emaitzak honako datu hauen tankerakoak izaten dira:

  1. Esaldi batean (a, b, c ...) hitzen segida dagoenean, %P-ko probabilitatea dago (d, e, f...) hitzen segida gertatzea itzulpenean. Bi multzoetako hitzen kopuruak ez du zertan bera izan.
  2. (a, b) xede-hizkuntzako bi hitzen segida baldin bada eta (a) hitzaren bukaera -X baldin bada, %P-ko probabilitatea dago (b) hitzaren bukaera -Y izan dadin.
 Era horretako datu multzo izugarri handiak baldin badauzka, sistemak itzul dezake esaldi bat, haren itzulpenak izan daitezkeen xede-hizkuntzako zenbait "esaldi" sortuz. Esaldi posible horiek hitzak ia zorizko ordenatan jarriz ekoizten ditu sistemak eta horien artetik estatistika aldetik probabilitate handiena duena hautatzen du.

Gezurra dirudi horrelako prozedura batek taxuzko itzulpenak eman ditzakeenik baina kontua da erregeletan oinarrituriko prozedurek baino emaitza hobeak ematen dituela. Jakina, makinak ematen duen kalitatea itzulpen-corpusaren kalitateak eta tamainak balditzatzen dute. Bestetik, itzulpen-corpusean zer motatako testuak dauden ere erabakigarria da. Corpusa teknologia-gaietako dokumentuz osatua bada ez espero medikuntzako dokumentuak ondo itzultzea.
Itzulpen automatikoko sistemek ondoena funtzionatzen dute gai jakinetarako entrenaturik daudenean eta gai horietako dokumentuak itzuli behar dituztenean.

Asko dira itzulpen automatikoak gainditu behar dituen zailtasunak. Estatistikak aurrerapen handiak ekarri dizkio baina horrek ere, beste gauza guztiek bezalaxe, bere mugak ditu.
Itzulpen automatikoak nekez lortuko du giza itzultzaile on batek lortzen duen kalitatea. Arrazoi askorengatik. Hona horietako batzuk:

- Giza itzultzaile elebidun batentzat ere ongi itzultzea gauza zaila da. Askotan bi hizkuntzak menderatzea ere ez da nahikoa. Bi hizkuntzaren arteko baliokidetza ez da inoiz erabatekoa. Itzultzailea askotan birsortzen aritzen da, ezinbestean. Lortu nahi duena da xede-hizkuntzako testuak jatorrizkoak eragiten duen inpresio bera eragitea. Horretarako, bi hizkuntzak menderatzea ez ezik bi kulturetan esperientzia izatea beharrezkoa da. Makinek, berriz, hori ez dute izaten.

- Itzulpena ona zer den erabakitzea ere ez da erraza. Testu bera eman itzultzeko hainbat itzultzaileri eta hainbat emaitza desberdin lortuko dituzu.

- Hitz baten adiera testuinguruaren arabera desberdina da eta hitz asko dira hainbat adiera izan ditzaketenak. Makinak brotxa lodiegia erabiltzen du miniaturak marrazteko.

- Hizkuntzak ideiak ondo adieraztea kasu askotan kontu larria da. Pentsa, esate baterako, medikuntzan diagnostiko baten emaitzak behar bezala adierazteak zer garrantzi duen.

Dena den, akatsak akats, itzulpen automatikoa oso lagungarria gertatzen da  egoera sinpleetan (turistent
istema hainbat itzulpenez osaturiko corpus baten bidez entrenatzen da. prozesu horren emaitzak honako datu hauen tankerakoak izaten dira:
  1. Esaldi batean (a, b, c ...) hitzen segida dagoenean, %X-ko probabilitatea dago (d, e, f...) hitzen segida gertatzea itzulpenean. Bi multzoetako hitzen kopuruak ez du zertan bera izan.
  2. (a, b) xede-hizkuntzako bi hitzen segida baldin bada eta (a) hitzaren bukaera -X baldin bada, %X-ko probabilitatea dago (b) hitzaren bukaera -Y izan dadin.
 Era horretako datu multzo izugarri handiak baldin badauzka, sistemak itzul dezake esaldi bat, haren itzulpenak izan daitezkeen xede-hizkuntzako zenbait "esaldi" sortuz. Esaldi posible horiek hitzak ia zorizko ordenatan jarriz ekoizten ditu sistemak eta horien artetik estatistika aldetik probabilitate handiena duena hautatzen du.

Gezurra dirudi horrelako prozedura batek taxuzko itzulpenak eman ditzakeenik baina kontua da erregeletan oinarrituriko prozedurek baino emaitza hobeak ematen dituela. Jakina, makinak ematen duen kalitatea itzulpen-corpusaren kalitateak eta tamainak balditzatzen dute.Bestetik, itzulpen-corpusean zer motatako testuak dauden ere erabakigarria da. Corpusa teknologia-gaietako dokumentuz osatua bada ez espero medikuntzako dokumentuak ondo itzultzea.
Itzulpen atomatikoko sistemek ondoena funtzionatzen dute gai jakinetarako entrenaturik daudenean eta gai horietako dokumentuak itzuli behar dituztenean.

Asko dira itzulpen automatikoak gainditu behar dituen zailtasunak. Estatistikak aurrerapen handiak ekarri dizkio baina horrek ere, beste gauza guztiek bezalaxe bere mugak ditu. Itzulpen automatikoak nekez lortuko du giza itzultzaile on batek lortzen duen kalitatea. Arrazoi askorengatik. Hona horietako batzuk:


- Giza itzultzaile elebidun batentzat ere ongi itzultzea gauza zaila da. Askotan bi hizkuntzak menderatzea ere ez da nahikoa. Bi hizkuntzaren arteko baliokidetza ez da inoiz erabatekoa. Itzultzailea askotan birsortzen aritzen da ezinbestean. Lortu nahi duena da xede-hizkuntzako testuak jatorrizkoak eragiten duen inpresio bera egitea. Horretarako, bi hizkuntzak menderatzea ez ezik bi kulturetan esperientzia izatea beharrezkoa da. Makinek, berriz, hori ez dute izaten.

- Itzulpena ona zer den erabakitzea ere ez da erraza. Testu bera eman itzultzeko hainbat itzultzaileri eta hainbat emaitza desberdin lortuko dituzu.

- Hitz baten adiera testuinguruaren arabera desberdina da eta hitz asko dira hainbat adiera izan ditzaketenak. Makinak brotxa lodiegia erabiltzen du miniaturak marrazteko.

- Hizkuntzak ideiak ondo adieraztea kasu askotan kontu larria da. Pentsa, esate baterako, medikuntzan diagnostiko baten emaitzak behar bezala adierazteak zer garrantzi duen.

Dena den, akatsak akats, itzulpen automatikoa oso lagungarria gertatzen da  egoera sinpleetan (turistentzat, adibidez) eta baita batere sinpleak ez diren batzuetan ere. Esate baterako, 2010eko urtarrilaren 12an Haitin lurrikara galgarria izan zenean itzulpen automatikoak sekulako laguntza eman zuen. Egoera larri hartan, telefonia mugikorreko dorreetatik %70-80k laster itzuli ziren funtzionamendu normalera eta hango jendea telefono bidez hizketan eta mezuak trukatzen hasi zen bertako kreoleraz. Alabaina, laguntzera joan ziren larrialdi-zerbitzuetako kide gehienek ez zekiten kreoleraz, ingelesez edo frantsesez baizik.

Laguntzera joan ziren agentzietako kide batzuek dohainikako telefono-zenbaki bat prestatu zuten, Haitiko jendeak mezuak hara bidal zitzan, datuak eta haien kokapen geografikoak emanez. Kreoleraz eta frantsesez zekiten 2.000 bat lagunek testuak itzultzen jardun zuten eta beste talde batzuek mezu multzo handi bat errepasatu zuten. Beste kide batek hiztegian oinarrituriko sistema bat prestatu zuen itzultzaileei laguntzeko. Egun gutxi barru Microsoftek eta Googlek itzulpen-sistema estatistiko bat prestatu zuten.

Migrazioek sortzen dituzten arazoetan ere lagungarri gertatzen da itzulpen automatikoa. Gaur egun inoiz baino migrazio-mugimendu handiagoak ari dira gertatzen. Ez bizitza hobearen bila mugitzen direnenak bakarrik, baita gerren eta desastreen ondorioz gertatzen direnenak ere.

Horrek arazo larriak sortzen dizkiete zerbitzu publikoei, besteak beste hainbat dokumentu hainbat hizkuntzatara itzuli beharra. Lan horrek oso kostu handia du. Zama hori arintzeko modu bat itzulpen automatikoa erabiltzea da.

Medikuntzan ere ari dira itzulpen automatikoa erabiltzen. Medikuntzan giltzarria da profesionalen eta pazienteen arteko komunikazioa. Medikuak pazienteari entzun egin behar dio, haren ikuspegia kontuan izan eta egiten dizkion galderei zintzoki erantzun. Horretarako,ordea, bada oztopo larri bat: askotan pazienteak eta medikuak ez dutela hizkuntza bera egiten.

Ospitale batzuetan erabiltzen dituzte itzulpen-zerbitzuak, baina hori garestia eta gogaikarria gertatzen da. Komunikazio hori ez da gainera nolanahikoa, konplexua, ñabarduraz betea eta etikoa baizik. Medikuak eta pazienteak hizkuntza bera egiten dutenean ere hainbat arazo sortzen dira hizkera zientifikoa eta hizkera arrunta aurrez aurre jartzen direnean.

Azkenaldian itzulpen automatikoa ari da sartzen osasun arloan, baina normalean itzulitako testua zuzendu egiten dute. Egin dira ikerlan batzuk zenbait itzulpen-sistema konparatzeko eta ikusteko zenbaterainoko kalitatea eman dezakeen bakoitzak osasun arloan. Horien artean hain ezaguna den Google Translate ere sartu izan dute. 

Ikerlan horietako batek euskara ere sartu du ebaluatu diren itzulpenetan. Ebaluazio automatikoa BiLingual Evaluation Understudy (BLEU) sistema erabiliz egin zuten. Ingelesetik hizkuntza erromanikoetarako itzulpenetan Google Translatek emaitza hobeak lortzen zituen beste talde batzuetako hizkuntzetarako itzulpenetan baino eta emaitzarik txarrenak ingelesetik euskararako itzulpenetan lortzen ziren. Besteak beste euskarak beste hizkuntzen aldean duen izaera eranskariagoaren ondorioa zen hori.

Giza ebaluatzaileak ere erabili zituzten ikerlan horretan; ingelesez ondo zekitenak, xede-hizkuntza ama-hizkuntza zutenak eta mediku itzultzaileak zirenak. Ebaluazio horretan ikusi zen medikuntza-gaietan itzulpen automatikoaren kalitatea os desberdina zela hizkuntza-bikotearen arabera. Ingelesetik hizkuntza erromanikoetarako edo germanikoetarako itzulpenetan oso emaitza onak lortzen ziren  (%80ko onargarritasuna). Ingelesetik errusierarakoetan eta euskararakoetan, aldiz, e ziren batere onak.
Euskararako itzulpenetan ugariak ziren kasu-atzizkien erabilera okerrak. 

Oraingoz itzulpen automatikoak osasun-arloan interpretazio eta diagnostiko okerrak eman ditzake eta ohiko prozedurak erabili behar dira.
zat, adibidez) eta baita batere sinpleak ez diren batzuetan ere. Esate baterako, 2010eko urtarrilaren 12an Haitin lurrikara galgarria izan zenean, itzulpen automatikoak sekulako laguntza eman zuen. Egoera larri hartan, telefonia mugikorreko dorreetatik %70-80k laster itzuli ziren funtzionamendu normalera eta hango jendea telefono bidez hizketan eta mezuak trukatzen hasi zen bertako kreoleraz. Alabaina, laguntzera joan ziren larrialdi-zerbitzuetako kide gehienek ez zekiten kreoleraz, baizik eta ingelesez edo frantsesez.

Laguntzera joan ziren agentzietako kide batzuek dohainikako telefono-zenbaki bat prestatu zuten, Haitiko jendeak mezuak hara bidal zitzan, datuak eta haien kokapen geografikoak emanez. Kreoleraz eta frantsesez zekiten 2.000 bat lagunek testuak itzultzen jardun zuten eta beste talde batzuek mezu multzo handi bat errepasatu zuten. Beste kide batek hiztegian oinarrituriko sistema bat prestatu zuen itzultzaileei laguntzeko. Egun gutxi barru Microsoftek eta Googlek itzulpen-sistema estatistiko bat prestatu zuten.

Migrazioek sortzen dituzten arazoetan ere lagungarri gertatzen da itzulpen automatikoa. Gaur egun inoiz baino migrazio-mugimendu handiagoak ari dira gertatzen. Ez bizitza hobearen bila mugitzen direnenak bakarrik, baita gerren eta desastreen ondorioz gertatzen direnenak ere.

Horrek arazo larriak sortzen dizkiete zerbitzu publikoei, besteak beste hainbat dokumentu hainbat hizkuntzatara itzuli beharra. Lan horrek oso kostu handia du. Zama hori arintzeko modu bat itzulpen automatikoa erabiltzea da.

Medikuntzan ere ari dira itzulpen automatikoa erabiltzen. Medikuntzan giltzarria da profesionalen eta pazienteen arteko komunikazioa. Medikuak pazienteari entzun egin behar dio, haren ikuspegia kontuan izan eta egiten dizkion galderei zintzoki erantzun. Horretarako,ordea, bada oztopo larri bat: askotan pazienteak eta medikuak ez dutela hizkuntza bera egiten.

Ospitale batzuetan erabiltzen dituzte itzulpen-zerbitzuak, baina hori garestia eta gogaikarria gertatzen da. Komunikazio hori ez da gainera nolanahikoa, konplexua, ñabarduraz betea eta etikoa baizik. Medikuak eta pazienteak hizkuntza bera egiten dutenean ere hainbat arazo sortzen dira hizkera zientifikoa eta hizkera arrunta aurrez aurre jartzen direnean.

Azkenaldian itzulpen automatikoa ari da sartzen osasun arloan, baina normalean itzulitako testua zuzendu egiten dute. Egin dira ikerlan batzuk zenbait itzulpen-sistema konparatzeko eta ikusteko zenbaterainoko kalitatea eman dezakeen bakoitzak osasun arloan. Horien artean hain ezaguna den Google Translate ere sartu izan dute. 

Ikerlan horietako batek euskara ere sartu du ebaluatu diren itzulpenetan. Ebaluazio automatikoa BiLingual Evaluation Understudy (BLEU) sistema erabiliz egin zuten. Ingelesetik hizkuntza erromanikoetarako itzulpenetan Google Translatek emaitza hobeak lortzen zituen beste talde batzuetako hizkuntzetarako itzulpenetan baino, eta emaitzarik txarrenak ingelesetik euskararako itzulpenetan lortzen ziren. Besteak beste, euskarak beste hizkuntzen aldean duen izaera eranskariagoaren ondorioa zen hori.

Giza ebaluatzaileak ere erabili zituzten ikerlan horretan; ingelesez ondo zekitenak, xede-hizkuntza ama-hizkuntza zutenak eta mediku itzultzaileak zirenak. Ebaluazio horretan ikusi zen medikuntza-gaietan itzulpen automatikoaren kalitatea oso desberdina zela hizkuntza-bikotearen arabera. Ingelesetik hizkuntza erromanikoetarako edo germanikoetarako itzulpenetan emaitza onak lortzen ziren  (%80ko onargarritasuna). Ingelesetik errusierarakoetan eta euskararakoetan, aldiz, ez ziren batere onak.
Euskararako itzulpenetan ugariak ziren kasu-atzizkien erabilera okerrak. 

Oraingoz itzulpen automatikoak osasun arloan interpretazio eta diagnostiko okerrak eman ditzake eta, beraz, ohiko prozedurak erabili behar dira.


Comments

Popular posts from this blog

QR kodeak erabiltzeko gida

Europar Batasunak eduki digitalei eta hizkuntzei buruzko ekimena jarri du abian

Zenbateraino da onuragarria papera birziklatzea?