Facebook creează un set de date open-source pentru a diminua prejudecățile AI

Facebook creează un set de date open-source pentru a diminua prejudecățile AI

Facebook ar putea folosi un PR bun după ce ultimele știri care au dezvăluit că compania de socializare au permis să fie furate date de milioane de clienți. Pentru a îndrepta puțin nava, Facebook a creat un set de date open-source care, după părerea sa, va diminua tendința AI.

Facebook Scopul de a remedia prejudecata AI

O problemă existentă cu recunoașterea facială a fost prejudecata AI. În timp ce inteligența artificială încearcă să identifice oamenii prin trăsăturile lor unice ale feței, din punct de vedere istoric nu merge bine cu indivizii care nu sunt bărbați, care nu sunt albi.

Facebook și-a propus să remedieze prejudecățile AI cu setul său de date open-source se numește „Conversații ocazionale”. Include 45.186 de videoclipuri a peste 3.000 de persoane care au o conversație fără script. Participanții sunt de diferite sexe, grupe de vârstă și tonuri de piele.

Actorii au fost plătiți pentru a trimite videoclipuri care includeau propriile descrieri ale vârstei și sexului pentru a elimina cât mai multă bază AI. Echipa Facebook le-a etichetat apoi după tonul pielii pe baza scării Fitzpatrick care examinează șase tonuri ale pielii.

S-a observat și iluminarea pentru a arăta diferite tonuri ale pielii în situații de lumină slabă. AI audio și vizual pot fi testate cu setul de date Conversații casual. Scopul nu este de a dezvolta algoritmi, ci de a evalua performanța algoritmilor cu fețe diferite.

Două dintre seturile de date utilizate în prezent pentru recunoașterea facială – UB-A și Adience – erau compuse în mare parte din persoane cu pielea albă. UB-A a folosit 79,6% oameni albi, în timp ce Adience a folosit 86,2%.

Facebook Ai Bias Processing

În afară de tonul pielii, clasificatorii pentru IBM, Microsoft și Face ++ au avut rezultate mai bune cu fețele masculine decât vocile feminine într-un studiu MIT. Aproape nu au existat greșeli la fețele albe de bărbați, în timp ce fețele de femei mai întunecate au avut o rată de eroare de aproape 35%.

Conversațiile ocazionale își propune să ajute la evaluarea algoritmului utilizat în prezent. „Noul nostru set de date Casual Conversations ar trebui utilizat ca un instrument suplimentar pentru măsurarea corectitudinii viziunii computerizate și a modelelor audio, pe lângă testele de precizie, pentru comunitățile reprezentate în setul de date”, a declarat echipa Facebook care lucrează la proiect.

Evaluări de conversații ocazionale

Facebook a folosit Conversații ocazionale pentru a testa cei cinci algoritmi care au câștigat Deepfake Detection Challenge în 2020. Acest lucru a fost dezvoltat pentru a identifica mass-media care a fost postată.

Facebook Ai Bias Dataset

În ciuda algoritmilor respectați, s-au luptat cu tonuri de piele mai întunecate. Câștigătorul pe locul al treilea din provocare a fost de fapt cel mai bun cu Conversații ocazionale.

Facebook a lansat deja setul de date către comunitatea open-source. Făcând acest lucru, a observat că identifică sexele „masculin”, „feminin” și „alt”, explicând că nu le poate identifica pe cei care se identifică ca nebinare.

„În anul următor, cam așa, vom explora căi pentru a extinde acest set de date pentru a fi și mai incluziv, cu reprezentări care includ o gamă mai largă de identități de gen, vârste, locații geografice, activități și alte caracteristici”, a spus Facebook despre eforturile de eliminare a prejudecății AI.

Citiți mai departe pentru a afla despre eforturile Microsoft de a reglementa recunoașterea facială pentru a elimina baza.

Scroll to Top