NUPeko ikertzaile batek tresna batzuk garatu ditu adimen artifizialeko sistemetan alborapen demografikoak zuzentzeko
Iris Dominguezen lanaren helburua da talde demografikoen eta emozioen arteko lotura desegokiak zuzentzean inpaktu negatiboak saihesteko
Iris Domínguez Catena (Iruñea, 1992) Nafarroako Unibertsitate Publikoaren Smart Cities Institutuko (SCI)[1] ikertzailea da, eta adimen artifizialeko sistemetan alborapen demografikoak detektatu eta zuzentzeko tresna eta metodologia berriak garatu ditu. Ikerketaren aurkikuntza nagusietako bat alborapen demografiko mota bat aurkitzea izan da. Hain zuzen, alborapen mota horri estereotipikoa deritzo, eta adimen artifizialeko (AA) problema batean talde demografikoen eta klase sozialen arteko lotura desegokia egiten denean gertatzen da. Adibidez, sistemak aurpegiko adierazpenak ezagutzeari dagokionez, emakumeak maizago agertzea zoriontasuna adieraziz, eta gizonak, berriz, haserrea. Ikertzaileak adierazi duenez, “alborapen horrek eragin handiagoa du adimen artifizialeko ereduen azken jokabidean”, zeren eta alborapenen eragina duten datuekin trebatzen baita adimen artifiziala. Ikertzaileak adimen artifizialeko sistema bidezkoagoak sortu nahi ditu, eta honako hau adierazi du bere lanaren inplikazioei buruz: “Ez da nahikoa talde demografiko guztiak modu orekatuan ordezkatuak egotea, eta ezinbestekoa da estereotipoei lotutako alborapenak aztertu eta zuzentzea”.
Emaitzak Iris Dominguezen doktoretza-tesian[2] azaltzen dira, non adimen artifizialeko alborapen demografikoak (edo justizia algoritmikoa) baitira ikergai nagusia. Adimen artifizialeko sistemetan talde demografiko batzuk –adibidez, emakumeak edo pertsona beltzak– gutxi edo gaizki ordezkatuak egoten direlako sortzen dira halako alborapenak. Horren ondorioz, baliteke adimen artifizialeko sistema horiek gaizki jokatzea, eta populazio talde jakin batzuk diskriminazioz tratatzea. Horren harira, ARIN (Artificial Intelligence and Machine Learning Research) taldeko ikertzaileak honako hau azaldu du: “Horren ondorioz, eta demografiaren inguruko zenbait aldagai kontuan hartuta (arraza, generoa eta adina, besteak beste), adimen artifizialak modu batean edo bestean tratatzen ditu erabiltzaileak, eta ez du zertan”.
Ikerketa-kasu gisa, aurpegiera ezagutzeko metodoak erabili zituen (FER, ingelesez). Bere hitzetan: “Arlo horrek pertsonek zer emozio adierazten duten aurreikusi nahi du aurpegien argazkietatik abiatuta, eta hainbat aplikazio ditu, hala nola multimedia-eduki interaktiboak, medikuntza, bide-segurtasuna edo laguntza-robotika”.
Estereotipoak indartzea
Tesiak adimen artifiziala trebatzeko erabiltzen diren datu multzoen alborapenen jatorria jartzen du ikusmiran. Hala, demografiari lotutako alborapenen bi mota nagusi identifikatu ditu: alborapen adierazgarria eta alborapen estereotipikoa (gorago azaldu dena). Ikertzailearen hitzetan: “Alborapen adierazgarria sortzen da talde demografiko jakin batzuek behar baino gutxiago daudenean ordezkatuak datuetan, adibidez, pertsona zuri gehiago dagoenean beste arraza batzuetakoak baino”.
Ikertzailearen ondorioen arabera, “alborapen estereotipikoa askoz gutxiago ikertu da adierazgarriaren aldean, baina eragin handiagoa dauka adimen artifizialen azken jokabidean”. Horren harira, honako hau adierazi du: “Hori oso garrantzitsua da; izan ere, Interneteko irudietatik abiatuta datu multzoak sortzeko joera dagoenez gaur egun, halako alborapenak sortzen dira. Datu multzo horiek, bestalde, askotarikoak izan ohi dira, baina dagoeneko existitzen diren estereotipoak indartzeko joera dute”.
Ikertzaileak ikusi du, halaber, “korrelazioa dagoela eragindako alborapen kopuruaren eta AAren ereduak egiten duen akatsaren artean”. “Faktore hori benetan garrantzitsua da; izan ere, eta duela gutxira arte, sistema baten alborapena ezabatzeak kostua zekarrela uste zen, errendimendua okertzea, alegia”. Hala ere, ikertzaileak egiaztatu du kontrakoa gertatzen dela. “Alborapenik gabeko sistemak zehatzagoak izaten ahal dira”, gaineratu du.
Tresna eta metodologia berriak
Sistemen alborapenak zuzentzeko, Iris Dominguezek DSAP (antzekotasun demografikoa profil osagarrietatik abiatuta) izeneko tresna bat garatu du, bai eta metodologia bat ere, zeinak aukera ematen baitu zenbait datu multzoren demografia konparatzeko, biztanleriari buruzko informazio espliziturik gabe ere. Horri dagokionez, hau azaldu du: “Hiru aplikazio nagusi ditu: datu multzoen arteko zuzeneko konparazioa, datu multzo errealak eta idealak konparatuz alborapena neurtzea eta jada hedatuta dauden sistemek lan egiten duten biztanlerian aldaketa demografikoak hautematea”.
Bigarren urrats batean, alborapen horiek adimen artifizialeko ereduetara nola transferitzen diren ikertu zuen Iris Dominguezek. Horretarako, metrika berriak garatu zituen alborapen mota bakoitza neurtzeko.
“Tresna eta metodologia horiek AAko sistemetan alborapen demografikoak detektatzeko eta aztertzeko erabiltzen dira, ikusmen artifizialaren testuinguruan bereziki, eta alborapen motak kontuan hartzea zeinen garrantzitsua den erakusten dute. Gainera, mekanismo praktikoak ematen dituzte alborapen horiek modu eraginkorragoan detektatzeko eta haien jarraipena egiteko, bai AAko sistemen garapenean, bai hedapenean”, ondorioztatu du tesiaren egileak. Tesia ISC Institutuko bi ikertzailek zuzendu dute: Mikel Galar Idoate katedraduna eta Daniel Paternain Dallo irakaslea.
Egilearen curriculum laburra
Iris Domínguez Catena NUPen doktoratu berri da, eta, hain zuzen, NUPen bertan egin zuen Ingeniaritza Informatikoko Gradua eta Unibertsitate Masterra. Ikerketa algoritmoen ekitatean jartzen du arreta (AI Fairness, ingelesez), hau da, ikusmen artifizialeko datu-base eta ereduetako alborapen sozialen detekzioan.
Duela gutxi, Ganteko Unibertsitatearekin (Belgika) egindako lankidetza baten ondorioz, hizkuntza naturalaren eta hizkuntza-ereduen (NLP/LLM, ingelesezko siglen arabera) prozesamenduan izaten diren alborapenak ikertzen hasi da lanean.
Argazkia: Iris Domínguez Catena ingeniari informatikoa, NUPeko doktore berria.
[1] https://www.unavarra.es/eu/sites/research-institutes/isc.html
[2] https://academica-e.unavarra.es/entities/publication/2d2cc1aa-b0fc-4260-b1c5-77f108fac0e8