Kako svjesni pristup AI-u smanjuje pristrane skupove podataka

Pristrani skupovi podataka i etička umjetna inteligencija

Rješenja s AI-om trebaju skupove podataka da bi bila učinkovita. A stvaranje tih skupova podataka ispunjeno je problemom implicitne pristranosti na sustavnoj razini. Svi ljudi pate od predrasuda (i svjesnih i nesvjesnih). Pristranosti mogu imati bilo koji broj oblika: geografski, jezični, društveno-ekonomski, seksistički i rasistički. A te su sustavne pristranosti uklopljene u podatke, što može rezultirati proizvodima umjetne inteligencije koji ovjekovječuju i povećavaju pristranost. Organizacijama je potreban pažljiv pristup za ublažavanje pristranosti koja se uvlači u skupove podataka.

Primjeri koji ilustriraju problem pristranosti

Jedan značajan primjer pristranosti ovog skupa podataka koji je u to vrijeme izazvao mnogo negativnog tiska bilo je rješenje za čitanje životopisa koje je favoriziralo muške kandidate u odnosu na žene. To je zato što su skupovi podataka alata za zapošljavanje razvijeni pomoću životopisa iz proteklog desetljeća kada su većina kandidata bili muškarci. Podaci su bili pristrani i rezultati su odražavali tu pristranost. 

Još jedan općeprijavljeni primjer: na godišnjoj Google I/O konferenciji za razvojne programere, Google je podijelio pregled alata za pomoć u dermatologiji s AI-om koji pomaže ljudima razumjeti što se događa s problemima koji se odnose na njihovu kožu, kosu i nokte. Asistent dermatologije naglašava kako se AI razvija kako bi pomogao u zdravstvenoj skrbi - ali je također istaknuo potencijal da se pristranost uvuče u AI nakon kritika da alat nije prikladan za obojene osobe.

Kada je Google najavio alat, tvrtka je primijetila:

Kako bismo bili sigurni da radimo za sve, naš model uzima u obzir čimbenike kao što su dob, spol, rasa i tipovi kože - od blijede kože koja ne preplanuli do smeđe kože koja rijetko izgara.

Google, pomoću umjetne inteligencije za pomoć u pronalaženju odgovora na uobičajena stanja kože

No, članak u Viceu kaže da Google nije uspio upotrijebiti inkluzivni skup podataka:

Kako bi izvršili zadatak, istraživači su koristili skup podataka za obuku od 64,837 slika 12,399 pacijenata smještenih u dvije države. Ali od tisuća prikazanih kožnih stanja, samo 3.5 posto dolazi od pacijenata s Fitzpatrick tipom kože V i VI - onima koji predstavljaju smeđu kožu i tamno smeđu ili crnu kožu, respektivno. Prema studiji, 90 posto baze podataka činili su ljudi svijetle puti, tamnije bijele puti ili svijetlosmeđe puti. Kao rezultat pristranog uzorkovanja, dermatolozi kažu da bi aplikacija mogla na kraju previše ili premalo dijagnosticirati ljude koji nisu bijelci.

Vice, Googleova nova aplikacija za dermatologiju nije dizajnirana za osobe s tamnijom kožom

Google je odgovorio rekavši da će poboljšati alat prije nego što ga službeno objavi:

Naš alat za pomoć u dermatologiji s AI-om kulminacija je više od tri godine istraživanja. Budući da je naš rad prikazan u Nature Medicine, nastavili smo razvijati i usavršavati našu tehnologiju ugradnjom dodatnih skupova podataka koji uključuju podatke koje su donirale tisuće ljudi i milijune više odabranih slika problema s kožom.

Google, pomoću umjetne inteligencije za pomoć u pronalaženju odgovora na uobičajena stanja kože

Koliko god se nadali da bi AI i programi strojnog učenja mogli ispraviti ove pristranosti, stvarnost ostaje: oni su samo kao pametan budući da su njihovi skupovi podataka čisti. U ažuriranju stare programske poslovice smeće u / smeće van, AI rješenja su jaka samo onoliko koliko je kvaliteta njihovih skupova podataka od samog početka. Bez ispravke od programera, ovi skupovi podataka nemaju pozadinsko iskustvo da se sami poprave – jer jednostavno nemaju drugi referentni okvir.

Odgovorna izgradnja skupova podataka je srž svega etička umjetna inteligencija. A ljudi su u srži rješenja. 

Pažljiva AI je etička AI

Pristranost se ne događa u vakuumu. Neetički ili pristrani skupovi podataka proizlaze iz pogrešnog pristupa tijekom faze razvoja. Način borbe protiv pogrešaka pristranosti je usvajanje odgovornog pristupa usmjerenog na čovjeka koji mnogi u industriji nazivaju Mindful AI. Mindful AI ima tri kritične komponente:

1. Pažljiva umjetna inteligencija usmjerena je na čovjeka

Od početka AI projekta, u fazama planiranja, potrebe ljudi moraju biti u središtu svake odluke. A to znači svi ljudi - ne samo podskup. Zato se programeri moraju osloniti na raznolik tim globalno utemeljenih ljudi kako bi obučili AI aplikacije da budu uključive i bez predrasuda.

Crowdsourcing skupova podataka iz globalnog, raznolikog tima osigurava rano identificiranje i filtriranje predrasuda. Osobe različitih etničkih grupa, dobnih skupina, spolova, razina obrazovanja, socio-ekonomskog porijekla i lokacija mogu lakše uočiti skupove podataka koji daju prednost jednom skupu vrijednosti u odnosu na drugi, čime se uklanjaju neželjene pristranosti.

Pogledajte glasovne aplikacije. Kada primjenjuju svjesni pristup umjetnoj inteligenciji i iskorištavaju snagu globalnog skupa talenata, programeri mogu uzeti u obzir jezične elemente kao što su različiti dijalekti i naglasci u skupovima podataka.

Uspostavljanje okvira dizajna usmjerenog na čovjeka od početka je ključno. To ide dug put prema osiguravanju da generirani, kurirani i označeni podaci ispunjavaju očekivanja krajnjih korisnika. No također je važno držati ljude u tijeku tijekom cijelog životnog ciklusa razvoja proizvoda. 

Ljudi u petlji također mogu pomoći strojevima stvoriti bolje iskustvo umjetne inteligencije za svaku specifičnu publiku. U Pactera EDGE, naši projektni timovi AI podataka, locirani na globalnoj razini, razumiju kako različite kulture i konteksti mogu utjecati na prikupljanje i čuvanje pouzdanih podataka o AI treningu. Imaju potrebne alate koji su im potrebni za označavanje problema, njihovo nadgledanje i popravljanje prije nego što rješenje temeljeno na umjetnoj inteligenciji postane aktivno.

Human-in-the-loop AI je projektna "sigurnosna mreža" koja kombinira snage ljudi - i njihovo raznoliko porijeklo s brzim računalnim snagama strojeva. Ova suradnja ljudi i umjetne inteligencije treba se uspostaviti od početka programa kako pristrani podaci ne bi bili temelj projekta. 

2. Pažljivi AI je odgovoran

Biti odgovoran znači osigurati da sustavi umjetne inteligencije budu bez predrasuda i da su utemeljeni na etici. Radi se o tome kako, zašto i gdje nastaju podaci, kako ih sintetiziraju AI sustavi i kako se koriste u donošenju odluka, odlukama koje mogu imati etičke implikacije. Jedan od načina na koji poduzeće to može učiniti je surađivati ​​s nedovoljno zastupljenim zajednicama kako bi bile inkluzivnije i manje pristrane. U području bilješki podataka, novo istraživanje naglašava kako model više zadataka s više anotatora koji tretira oznake svakog anotatora kao zasebni podzadatak može pomoći u ublažavanju potencijalnih problema svojstvenih tipičnim metodama temeljne istine gdje neslaganja među anotatorima mogu biti posljedica nedovoljne zastupljenosti i može se zanemariti u združivanju bilješki na jednu temeljnu istinu. 

3. Pouzdan

Pouzdanost dolazi iz transparentnosti poslovanja i objašnjenja načina na koji se AI model obučava, kako funkcionira i zašto preporučuju ishode. Poduzeću je potrebna stručnost s AI lokalizacijom kako bi svojim klijentima omogućila da svoje AI aplikacije učine inkluzivnijim i personaliziranijim, poštujući kritične nijanse u lokalnom jeziku i korisničko iskustvo koje mogu povećati ili narušiti vjerodostojnost rješenja AI iz jedne zemlje u drugu . Na primjer, tvrtka bi trebala dizajnirati svoje aplikacije za personalizirane i lokalizirane kontekste, uključujući jezike, dijalekte i naglaske u glasovnim aplikacijama. Na taj način aplikacija donosi istu razinu sofisticiranosti glasovnog iskustva na svakom jeziku, od engleskog do nedovoljno zastupljenih jezika.

Pravednost i raznolikost

U konačnici, svjesna umjetna inteligencija osigurava da su rješenja izgrađena na poštenim i raznolikim skupovima podataka u kojima se prate i ocjenjuju posljedice i utjecaj određenih ishoda prije nego što rješenje izađe na tržište. Budući da smo svjesni i da uključujemo ljude u svaki dio razvoja rješenja, pomažemo osigurati da AI modeli ostanu čisti, minimalno pristrani i što je moguće etičniji.

Što vi mislite?

Ova web stranica koristi Akismet za smanjenje neželjene pošte. Saznajte kako se podaci vašeg komentara obrađuju.