Saturday, April 30, 2016

Nola lortu duen Watsonek elkarrizketazko hizketa ezagutzea

Iturria: venturebeat

IBMk aurrerapen handia lortu du bere Watson ordenagailuak elkarrizketazko hizketa ezagutzeko duen gaitasunean.  Iaz, Watson gai zen elkarrizketetan ingelesezko hizketa ezagutzeko, %8ko errore-tasarekin. Orain errore-tasa %6,9ra jaistea lortu dute. Lorpen horrek erakusten du adimen artifiziala gero eta ahaltsuagoa dela, eta
gero eta hurbilago dagoela ataza askotan robotek gizakiak ordezkatzea.

Azkenaldian hobekuntzaren oinarri sendoena sare neuronal sakonek ekarri dute
. Azken helburua da gizakiaren zehaztasunaren parekoa edo hobea lortzea, hau da, %4 inguruko errore-tasara iristea. 

Hobekuntzak egin dituzte bai modelizazio akustikoan eta baita hizkuntzarenean ere. Alderdi akustikoan bi sare neuronal sakon bateratu dituzte, testuinguruaren arabera sarrerako audioko fonoak aurreikusten dituztenak. Ereduak entrenatzeko,
Switchboard, Fisher eta CallHome corpusetako audio trabskribatuko 2.000 ordu erabili dituzte.

Wednesday, April 27, 2016

Hiztegi elebidunak erabiltzeak dituen arriskuak

Hiztegi elebidunak baliokidetza-hiztegi soilak izan ohi dira. Hizkuntza bateko hitz baten ondoan beste hizkuntza bateko "baliokidea(k)" erakusten dituzte. Asko horretan geratzen dira, beste batzuek kategoria gramatikalak zehazten dituzte eta onenean erabilera-adibideren bat ere ematen dute. 

Hiztegi elebakarrek, aldiz,  askoz informazio gehiago ematen dute: ebakera, kategoria gramatikala, erabilera-eremua, etimologia, definizioa, adibideak, beste hitz batzuekiko erreferentziak, erregistro-markak, etab.

Hiztegi elebidunen arazoetako bat izaten da baliokidetzaren mugak ez dituztela argi azaltzen, eta oker handiak egiteko arriskuan jaus gaitezkeela. Esate baterako, espainiera/euskara hiztegi batean espainierazko "repostero" hitzaren baliokide gisa "gozogile, gozogin" ikusten baduzu ez zaitez fida hori eta horrenbestez, bestela behin euskal erakunde bateko itzultzaile bati gertatu zitzaiona gerta dakizuke. Liburu bat itzultzen ari zen eta presa zuten argitaratzeko. Horregatik, azken ordura arte ezin izan zituen ikusi ahal izan testuarekin batera zihoazen irudiak. Irudien oinak bai baina irudiak berak ez. Oin horietako batek "Repostero del siglo..." zioen. Itzultzaileak, zalantza handirik egin gabe "[Halako mendeko] gozogilea" idatzi zuen. Hankasartzea ez zen nolanahikoa, zeren irudiak ez zuen gozogilerik erakusten, estandarte moduko bat baizik.

Real Academia Españolaren hiztegian begiratzen baduzu, ikusiko duzu "repostero" sarrerak bost adiera ematen dituela: gozogilea bai, baina baita buruzagi baten zerbitzaria den marinela, jauregi bateko zerbitzu baten arduraduna, sukaldeko arasa eta ikur heraldikoak dauzkan oihala edo tapiza ere.






Beste kontu bat da euskaraz nola esaten zaion horri jakitea. Txarrenean ere ez legoke hain gaizki "tapiz heraldikoa" esatea.

Hiztegi elebidunen beste gabezia bat testuingururik ez eskaintzea edo gutxiegi eskaintzea izaten da. Baliokide gisa agertzen den hitz bakoitza zer testuingurutan erabil daitekeen jakitea ez da erraza izaten. Espainiera/ingelesa hiztegi batean espainierazko "viga" hitzaren baliokide gisa "beam", "rafter" eta "girder" aurkitzen ditut baina inolako adibiderik edo azalpenik gabe. Berdin dio horietako edozein erabiltzea? Hiztegi elebidunak ez dit argitzen. Noan ingelesezko hiztegietara ea zer dioten. Wikipedian bertan badut argitasun aski. "Beam" egitura batean batez ere makurdura eragiten duten kargei eusteko pieza da. Izan daiteke eraikin batena baina makinetan, automobiletan, eta abar funtzio hori betetzen duten pieza txikiagoei er hala esaten zaie. "Girder", berriz, eraikin bateko habe nagusia da, beste habe txikiago batzuei eusten diena. "Rafter" zuraje batean gailurretik beherako habe inklinatuak dira, gapirioak alegia. Honek beste zerbait ere nabarmentzen digu, alegia, hiztegi elebidunek ez dutela ematen maila teknikoko xehetasunik. 

Beste arrisku bat izaten da eskainitako baliokidea hitz solte moduan hartzea, kontuan izan gabe itzulpenak esaldiak daukan ideia transmititzea duela helburu, eta ez esaldia osatzen duten hitzen baliokideen multzoa ematea. Adibidez, ingeles/euskara hiztegi batek esaten badigu ingelesezko "included"en baliokidea "barne" dela, eta hori bakarrik izaten badugu kontuan, ez dugu euskarazko "besteak beste" esapide jatorra erabiliko, kasu askotan egokiena dena.

Itzultzaile ona izateko, lehenik eta behin zalantzak izaten ikasi behar da, gero iturburuko hizkuntzako hitzen adiera eta erabilerak hizkuntza horretako hiztegietan argitu eta azkenik xede-hizkuntzako hitz egokia bilatu, hizkuntza horretako hiztegietan, hiztegi elebidunek ematen dituzten baliokideak iradokizun soiltzat hartuz.

Thursday, April 14, 2016

Farmazia-industria testu-meatzaritza erabiltzen ari da

Iturria: science business


Informazioa oso ugaria denean, ez du balio eskuz bilaketa arruntak egiteak. Makinak behar dira milaka dokumentutan, testu-meatzaritza bidez, ezkutaturik dagoen informazioa eta datuen arteko loturak aurkitzeko. Farmazia-industrian, esate baterako, ikerketarako ezinbesteko tresna bihurtu da testu-meatzaritza.

Bilaketak egiteko ez ezik laburpenak egiteko, lehiakideak zertan ari diren jakiteko, kongresuetan edo patenteetan zer berrikuntza ari diren agertzen jakiteko. Kongresu askotara joatea saihestea ere lortzen dute, informaziorik galdu gabe.
Teknika horiek erabiltzea ez dago, ordea, edonoren esku. Enpresa handiek bai, diru asko dutelako, baina erakunde publikoetako ikertzaileek zailtasunak dituzte, bai baliabide faltaz eta baita argitaratzaileek oztopoak jartzen dizkietelako meatzaritza erabiltzeko, kopia-eskubideak direla eta. Europan Erresuma Batuak bakarrik atera du testu-meatzaritza kopia-eskubideen legetik
. Hala ere, joan zen abenduan, Europako Batzordeak, kopia-eskubideen legeria eguneratzeko neurrien barruan, proposamen bat egin zuen arazo hori konpontzeko.

Testu-meatzaritzari etekina ateratzeko, testu-meatzari trebeak behar dira. Profesional horiek eskuz hasten dira lehen bilaketa egiten eta gero iteratiboki joaten dira bilaketa osatzen. Hasieran bilaketa zabal bat egiten dute eta gero pixkanaka fintzen joaten dira.

Thursday, April 7, 2016

Nola aztertu zituzten Panamako paperak

Iturria: wired.co.uk 

Datu guztiak Panaman egoitza duen Mossack Fonseca bulego juridikotik lortu zituzten. Inoiz ezkutuan atera den datu kopururik handienak adierazten du mundu mailako 70 agintarik baino gehiagok milaka milioi euroko zergak ordaintzeari ihes egin diotela, Panamako isilpeko kontuak baliatuz.

Panamako paperek erakusten dute Mossack Fonseca bulegoak munduko jende boteretsuarekin zerikusia zuten ehunka bezerori lagundu ziela dirua zuritzen, zergak ordaintzeari ihes egiten eta isunak saihesten. Paperak ezezagun batek iritsarazi zizkien 100dik gora albiste-organizaziori eta 400 kazetariri baino gehiagori, eta ikerketak ia urtebete iraun du.

Datu gordinak kazetariei eskuera jartzeko prozesuak digitalizatzea, ordenagailu eta algoritmo ahaltsuak erabiltzea behar izan du, milaka xehetasunen artean izen ezagunak aurkitzeko. Guztira 11,5 milioi dokumentu dira.

Multzo horretan badaude, besteak beste, emailak, kontratuak, transkripzioak eta eskaneaturiko dokumentuak. Guztira 4,8 milioi email, datu-baseetako 3 milioi erregistro, 2 milioi PDF, milioi bat irudi eta 320.000 testu-dokumentu dira eta 2,6 terabyte hartzen dute. Datu zaharrenak 1977koak dira eta berrienak 2015ekoak. 


Datuek nabarmen jartzen dute Mossack Fonsecak 14.000 banku, bulego juridiko, enpresa-sortzaile eta bitartekari baino gehiagorekin lan egin dutela,  enpresak, fundazioak eta ondasun-transmisioak prestatzeko

Lorturiko dokumentuez informazioa emateko, bermatu behar zen dokumentuak automatikoki tratatzeko eta haietan bilaketak egiteko modukoak izan behar zutela. Ez da erraza homogeneoak ez diren datuen arteko erlazioak bilatzea. Tauletan, irudietan eta irudi-formatua duten PDFetan nekez egin daitezke bilaketak. Süddeutsche Zeitung egunkariak eta International Consortium of Investigative Journalists (ICIJ) elkarteak Nuix sofware-enpresarekin lan egin zuten fitxategiak antolatzeko. Datuak, gainera, zerbitzari pribatuetan, hau da, kanporako konexiorik ez zutenetan, gorde behar ziren. Gero indexatu egin behar izan ziren, testu eta metadatu guztiak erauzteko, eta ondoren big datako teknikak erabili, aztertu ahal izateko.

Datuak prozesatzeko erronkarik handiena makinek testutzat har ez zitzaketen datuen kopuru erraldoia izan da. OCR bidez bihurtu ziren dokumentu horiek, bilaketak egin ahal izateko. Behin testua erauzi ondoren, edukiak indexatu ahal izan ziren, bilaketak egin eta datu-baseetan sartu. Entitateak erauzi ahal izan ziren: izenak, deiturak, enpresen izenak, helbideak, lekuak, etab.  Gero izen horiek dokumentuekin zituzten erlazioak bilatu behar ziren.

Behin informazioa indexatu ondoren, algoritmoak erabili dituzte, datu-base handi batean erlazioak bilatzeko. Azkenean, automatikoki landutako informazioa eskuz sorturiko datuekin konbinatu zuten, eta kazetariek politikari garrantzitsuen, nazioarteko gaizkileen, kirolari ospetsuen eta beste batzuen zerrendak prestatu zituzten, bilaketa zehatzak egiteko.

Thursday, March 24, 2016

Zer da BBC Micro Bit?

Iturria: BBC

Ordenagailu txikitxo programagarria da. Argi-keinuen bidez mezuak igortzen dituzten LEDak eta mugimendu-sentsoreak ditu, eta konekta daiteke beste gailu batzuetara kablez eta Wifiz. 

BBCk sortu du eta Erresuma Batuko eskoletan horren milioi bat ale banatu ditu, ikasleek programatzen ikas dezaten.

Txartel baten forma du, 50x40mm tamainakoa, bi botoi eta 25 LEDez osaturiko 5x5eko matrize bat dauzkana. Gainera azelerometro bat eta iparrorratz bat ere baditu, mugimendua eta norabidea detektatzeko.


Botoiez kontrola daitezke jokoak, telefono batean edo beste tresna batean entzuten den musika, kamera bat edo beste hainbat motatako tresnak, bai baitu Bluetootha ere.

Irudiaren behealdean ikusten diren bost eraztunen bidez, krokodiloak edo 4 mm-ko konektoreak erabiliz beste sentsore batzuk konekta dakizkioke, hala nola termometroak, hezetasun-sentsoreak, etab.

Micro Bitek seinaleak ere igor ditzake eraztunetara, motorrak, robotak eta beste gauza batzuk kontrolatzeko. Eraztunekin bat eginda dagoen ertz osoa konektore estandar bat da, beste ekipo batzuekin, esate baterako Arduino batekin, konektatzeko. USB pendrive gisa ere erabil daiteke, programak kargatzeko eta deskargatzeko.

Energia AAA motako bi pilak edo beste tresna batek ematen diote.

Hainbat programazio-lengoaia onartzen ditu, hala nola JavaScript, Blockly, Python eta C++. Micro Biten webgunean hiru kode-editore daude: CodeKingdoms, JavaScript erabiltzen duena, Microsoft Block Editor, gaztetxoentzat pentsatua eta Microsoft TouchDevelop plataforma, telefonoak, tabletak eta ordenagailuak erabiliz programatzea ahalbidetzen duena.

Sunday, February 14, 2016

Teknologia hezkuntzan. Egoera eta joerak


Teknologia asko hedatu da gure ikastetxeetan azken urteotan. Euskal Herriko Autonomia Erkidegoan, Eusko Jaurlaritzaren Hezkuntza Sailak Informazioaren eta Komunikazioaren Teknologiak Ikastetxeetan. 2014/15 Ikasturtea txostenean dioenez, 2,46 ikasleko ordenagailu bat dago, eta ikasleek erabiltzen dituzten ordenagailuen % 98,25 Internetera konektaturik daude. Hezkuntzan erabiltzen den teknologia ez da, ordea, ordenagailuetara mugatzen. Ondoko pasarteetan errepaso txiki bat egingo diegu makina horiez baliatuz hezkuntzan erabil daitezkeen teknikei.

Ikaskuntza pertsonalizatua

Tresna digitalek, softwareak eta ikaskuntza-plataformek hezkuntza ikasle bakoitzaren beharretara, ikasteko estiloetara, gainditu beharreko gabezietara, zaletasunetara egokitzeko aukera paregabea eskaintzen dute. 

Abagune horietaz baliatzeko kontuan izan beharreko irizpideek lau oinarri hauek dituzte:

  • Ikasle bakoitzak dituen trebetasunak, gabeziak, zaletasunak eta helburuak jasotzen dituen fitxa bat prestatu behar da.
     
  • Ikasle bakoitzak ikaskuntza-ibilbide pertsonalizatua jarraitu behar du, helburu akademikoak bere buruari jartzen eta kudeatzen lagunduko diona.
     
  • Ikasleek konpetentzietan oinarrituriko aurrerabide bat jarraitu behar dute, gai bat menderatzen dutela frogatzeko gaitasuna bilatzen duena eta ez ikastaroa gainditzea.
     
  •  Ikasleen ikasketa-inguruneak malguak eta bakoitzaren helburuak lortzen laguntzeko moduan egituratuak izan behar dute. 
Helburu horiek lortzen lagundu dezake teknologiak. Ikasleek ordenagailuak eskura baldin badituzte, nonahi eta noiznahi ikas dezakete. Ikasketa kudeatzeko sistemak, ikaslearen informazioa kudeatzeko sistemak eta beste software batzuk erabiltzen dira etxeko lanak banatzeko, hitzorduak eta komunikazioak kudeatzeko eta ikasleen aurrerapena jarraitzeko. Hezkuntzako softwarea eta aplikazioak, gero eta gehiago, gai dira, ikasleak dakiena neurtzeko ez ezik, baita ikaskuntza-prozesua nola doan erakusteko edo ikaslearen aldartearen berri izateko.

Horrek guztiak eskolei eta irakasleei beren lan egiteko era aldatzea eskatzen die. Malgutasuna eta programazioaren eskakizunak ezkondu behar dituzte, eta  irakasleek aspalditik errotuak dituzten ohiturak aldatu behar dituzte.

Eskola-sisteman ordenagailuak erabiltzea bultzatzen denean espero da ikasleei eduki pertsonalizatuagoak ematea, ikasleek beren kasa ikastea nork bere gaitasunen arabera, ikasleak teknologiaren erabileran trebatzea, lan konplexuagoak egiteko aukera eskaintzea, eskolen kudeaketa hobetzea eta eskola-komunitatearen barruko komunikazioa hobetzea. Hala ere, gauzak ez dira beti horren ondo joaten. Ordenagailuek eta instalazioek dirua eskatzen dute, Interneteko konexio ona  behar da, eta, oroz gain, oinarrizko planteamendu pedagogikoa askotan ez dago behar bezain landua. Azken finean errazena da erosketak egitea eta zailagoa teknologiari zukua ateratzea.


Ikaskuntza konbinatua
Partez zuzenekoa eta partez teknologia bidezkoa da ikaskuntza konbinatua. Hainbat eratan egin daiteke konbinazioa. Eskola barruan teknologia erabil daiteke ikasgelan bertan edo informatika gelan. Teknologia bidezko ikaskuntza izan daiteke ohikoa ala osagarria, ikasitakoa aberasteko eta indartzeko. Ikasle guztientzat software berbera egon daiteke ala ez. Joera nagusia da ikasgelan egiten den lana eta teknologia bidezkoa elkarrekin loturik egotea. Beste joera bat da ikasleak eskolatik kanpo Internet erabiltzera bultzatzea.

Material digitalen erabilera ikasgelan

 Eusko Jaurlaritzaren EIMA katalogoa kontsultatzea nahikoa da ikusteko azken urteotan hezkuntzarako ikasmaterial digital asko ekoiztu dela: jolas didaktikoak, ordenagailu-jokoak, liburu interaktiboak eta erreferentzia-softwareak.  Horri esker eskola askok erabiltzen dituzte baliabide digitalak. Hala ere, oraindik paperezko ikasmaterialak dira nagusi.

Sunday, January 24, 2016

Itzulpenaren eta terminologiaren garrantzia merkatu globalean

Iturria: termcoord.eu

Gaur egun enpresa askok nazioarteko mailan lan egin behar dute, eta eleaniztasunarekin egiten dute topo ezinbestean. Oso gogoan izateko kontua da hori, mundu mailan jarduten duen enpresarentzat. Komunikazio-estrategia egokia eskatzen du. Bestela, gaizki-ulertuak eta hauen ondorio txarrak izateko arriskua dago.

Nazioartean diharduen enpresak munduan sakabanaturik ditu bezeroak, askotariko kultura-, ekonomia-, politika- eta hizkuntza-ezaugarriak dituztenak. Atzerrian arrakasta izateko, komunikaio-estrategia egokiak erabili behar dira, bezerogaiek ondo ulertu behar dutenez esaten zaiena. Gero eta jende gehiagok egiten ditu erosketak Internet bidez, eurena ez den herrialde batean. Baina, erosi baino lehen, bilatzen ari diren produktua edo zerbitzua aurkitu behar dute. 

Horregatik, ororen buru, mezua igortzean ez hutsegiteko gauzarik garrantzitsuena da informazioa behar den bezala jasoko dela bermatzea, hartzaileak ohikoa duen terminologia erabiliz, kultura eta hizkuntza aldetik okerrik egin gabe eta gaizki-ulertu gogaikarriak saihestuz.


Kontuz ibili behar da, esate baterako, hizkuntza bera egiten duten herrialdeetan ere, termino baten adiera desberdinekin. Adibidez, Espainian "llanta" ibilgailu baten gurpilaren metalezko barruko pieza da, gainean pneumatikoa hartzen duena, eta Amerikako espainieran, aldiz, pneumatikoa. Kopuruak aipatzen direnean, berriz, AEBn "billion" 109 da, baina Erresuma Batuan 1012.


Gaizki-ulertuen beste adibide bat kirol-oinetakoak egiten dituen Nike enpresak sortu zuena da. 1990eko hamadaren azken aldean, lasterka egiteko "Nike Air" oinetakoen logoan, "Air" hitzaren irudian sugarrak erabili zituen. Ikur horrek arabieraz "Allah" hitza adierazteko grafiaren antz handia zuen, eta horrek musulmanen artean haserrea eragin zuen. Musulman askok sentitu zuten irainaz oharturik, Nikek milaka oinetako-pare merkatutik erretiratu behar izan zituen, eta lan handia egin behar izan zuen, urrundu ziren bezeroak ostera bereganatzeko.  


Askotan gertatzen da kontzeptu bat beste hizkuntza batera itzultzen denean ez asmatzea. Horregatik, garrantzitsua da itzultzaile eta terminologo profesionalek lan horietan parte hartzea baliokide egokiak bilatzeko eta okerrik ez egiteko.