NUPen garatutako metodo bati esker adimen artifizialak hobeki ulertzen du testu bateko hitzen ordena
Hala ñabardurak hobeki ulertzen ditu idazki baten tonua identifikatzeko edo mezuak “spam” modura sailkatzeko, Mikel Ferreroren tesiaren arabera.
Mikel Ferrero Jaurrieta (Iruñea, 1995) ingeniari informatikoak metodo berriak garatu ditu adimen artifizialak informazioa prozesatzeko duen modua hobetzeko. Helburua da adimen artifizialak hobeki ulertzea hitzen ordena eta, horrenbestez, testuen testuingurua eta ñabardurak. Horrek hobetu egiten du zenbait zereginetarako duen gaitasuna, hala nola idazki baten tonua positiboa edo negatiboa den identifikatzea, mezu bat “spam” den zehaztea eta modu automatikoan sailkatzea zenbait dokumentu tekniko, Nafarroako Unibertsitate Publikoan (NUP) defendatu duen doktoretza-tesian[1] jasotzen duenez.
Eraginkortasunez jarduteko, adimen artifizialak informazioa prozesatu behar du, eta horren oinarrizko zereginak konparatzea, ordenatzea eta fusionatzea dira. Zeregin horiek konplexuagoak dira datuek dimentsio edo faktore ugari dituztenean. Mikel Ferreroren tesiak prozedura berriak ezartzen ditu konplexutasun horrekin lan egiteko, eta konputagailuek modu eraginkorragoan ordenatu, konparatu eta fusionatzen ahal dute informazioa, kontuan hartzen baitute datuen zati diferenteek elkarri nola eragiten dioten.
Zehazki, ikertzaileak informazioa fusionatzeko metodo berriak aplikatzen ditu adimen artifizialaren esparru batean: sare neuronalak, hau da, giza burmuinaren funtzionamendua antzeratzen duten sistema informatikoak. Zehazki, testu-prozesamenduan desafio espezifiko bat dago: “hitzen eta esaldien ordenak duen garrantzia, haien artean denbora-mendekotasuna dagoenean batik bat”, Mikel Ferrerok esandakoaren arabera. Esaterako, testu batean, hitz batek beste esanahi bat izaten ahal du, aurretik edo ondoren zein hitz duen (hala, “ez da ona” esaldian, azken hitzak bere izaera positiboa galtzen du, aurretik dituen hitzengatik), eta hori “funtsezkoa da mezua behar bezala ulertzeko”.
Hitzen ordenak garrantzia du
“Desafio” horri heltzeko, Mikel Ferrerok informazioa fusionatzeko operadore berri ez-simetrikoak garatu ditu. Ohiko sare neuronaletan, operadore simetrikoak erabiltzen dira, eta zailtasunak dituzte hitzen arteko ordenaren garrantzia ulertzeko. Bestalde, testuaren parte diferenteetako informazioa konbinatzeko metodo ez-simetrikoen arabera, ordena garrantzitsua da, ez baitituzte hitz-konbinazio guztiak berdin tratatzen. Metodo horiei esker sare neuronalek testua aztertzen ahal dute kontuan hartuz hitzen ordenaren garrantzia eta elkarri nola eragiten dioten denboraren ikuspuntutik. Horrek hobetu egiten du konputagailuen gaitasuna zenbait zereginetarako, hala nola testu baten tonu emozionala identifikatzea, mezu bat “zabor-posta” den zehaztea, eta dokumentu mota desberdinak sailkatzea, esaterako patenteak edo galderak.
Carlos López Molina NUPeko Estatistika, Informatika eta Matematika Saileko irakasleak eta Zdenko Takác Bratislavako (Eslovakia) Eslovakiako Unibertsitate Teknologikoko irakasleak zuzendu dute Mikel Ferreroren doktoretza-tesia. Horrez gain, ikerketak honako erakunde hauen finantzaketa jaso du: Tracasa Instrumental enpresa publikoa, Estatuko Ikerketa Agentzia eta Eskualde Garapeneko Europako Funtsa (EGEF).
Curriculum laburra
Mikel Ferrero Informatika Ingeniaritzan graduatua da NUPen (2018), eta Modelizazio eta Ikerketa Matematikoko, Estatistikako eta Konputazioko Masterra du Nafarroako Unibertsitate Publikoan, Zaragozako Unibertsitatean eta Euskal Herriko Unibertsitatean (2020).
Bere ibilbide profesionalean, erakunde hauetan egin du lan: Tesicnor SL, Hiberus Tecnología, Elikagaien Teknologiako eta Segurtasuneko Zentroa (CNTA), NUP (Nafarroako Oroimen Historikoaren Dokumentu Funtsa) eta Tracasa Instrumental.
Bere doktoretza-tesia Adimen Artifiziala eta Arrazoinamendu Hurbildua ikerketa-taldean (GIARA) egin du, sei artikulu argitaratu ditu Konputazioren Zientzien eta Adimen Artifizialaren arloko aldizkari prestigiotsuetan, hala nola “Engineering Applications of Artificial Intelligence”, “IEEE Transactions on Fuzzy Systems” edo “Information Fusion”. Orobat bi sari jaso ditu nazioarteko biltzarretan. Nazio mailako eta nazioarteko kongresuetako hamabost lanen egilea da ere bada beste batzuekin batera.
Argazkia: Mikel Ferrero Jaurrieta, NUPeko doktore berria.