Facebook creează un set de date open-source pentru a diminua prejudecățile AI

Facebook crea un set di dati open source per ridurre i pregiudizi dell’IA

Facebook potrebbe usare alcune buone PR dopo le ultime notizie che hanno rivelato che la società di social media ha permesso il furto di dati di milioni di clienti. Per raddrizzare un po ‘la nave, Facebook ha creato un set di dati open source che ritiene ridurrà il pregiudizio dell’IA.

Obiettivo di Facebook per correggere i pregiudizi dell’IA

Un problema esistente con il riconoscimento facciale è stato il pregiudizio dell’IA. Sebbene l’intelligenza artificiale cerchi di identificare le persone attraverso le loro caratteristiche facciali uniche, storicamente non funziona bene con individui non maschi e non bianchi.

Facebook ha deciso di correggere il bias dell’IA con il suo set di dati open source si chiama “Conversazioni casuali”. Include 45.186 video di oltre 3.000 persone che hanno una conversazione senza script. I partecipanti sono di diversi sessi, gruppi di età e tonalità della pelle.

Gli attori sono stati pagati per inviare video che includessero le loro descrizioni di età e sesso per rimuovere il più possibile la base di intelligenza artificiale. Il team di Facebook li ha quindi etichettati in base al tono della pelle in base alla scala Fitzpatrick che esamina sei tonalità della pelle.

Anche l’illuminazione è stata rilevata per mostrare i diversi toni della pelle in situazioni di scarsa illuminazione. L’intelligenza artificiale audio e visiva può essere testata con il set di dati Casual Conversations. Lo scopo non è sviluppare algoritmi ma valutare le prestazioni degli algoritmi con facce diverse.

Due dei set di dati attualmente utilizzati per il riconoscimento facciale – UB-A e Adience – erano composti principalmente da persone dalla pelle bianca. UB-A ha utilizzato il 79,6% di bianchi, mentre Adience ha utilizzato l’86,2%.

Elaborazione pregiudizi di Facebook Ai

Oltre al tono della pelle, i classificatori per IBM, Microsoft e Face ++ hanno ottenuto risultati migliori con i volti maschili rispetto alle voci femminili in uno studio del MIT. Non c’erano quasi errori con i volti maschili bianchi, mentre i volti femminili più scuri avevano un tasso di errore di quasi il 35%.

Casual Conversations ha lo scopo di aiutare a valutare l’algoritmo attualmente utilizzato. “Il nostro nuovo set di dati di Conversazioni casuali dovrebbe essere utilizzato come strumento supplementare per misurare l’equità della visione artificiale e dei modelli audio, oltre ai test di accuratezza, per le comunità rappresentate nel set di dati”, ha affermato il team di Facebook che lavora al progetto.

Valutazioni di conversazioni casuali

Facebook ha utilizzato Casual Conversations per testare i cinque algoritmi che avevano vinto la Deepfake Detection Challenge nel 2020. Questo è stato sviluppato per identificare i media falsificati che venivano pubblicati.

Set di dati Facebook Ai Bias

Nonostante fossero algoritmi rispettati, hanno lottato con tonalità della pelle più scure. Il vincitore del terzo posto nella sfida in realtà è stato il migliore con Casual Conversations.

Facebook ha già rilasciato il set di dati alla comunità open source. In tal modo, ha notato che identifica i sessi di “maschio”, “femmina” e “altro”, spiegando che non può identificare coloro che si identificano come non binari.

“Nel corso del prossimo anno esploreremo percorsi per espandere questo set di dati in modo che sia ancora più inclusivo, con rappresentazioni che includano una gamma più ampia di identità di genere, età, posizioni geografiche, attività e altre caratteristiche”, ha affermato Facebook del suo sforzi per eliminare il pregiudizio dell’IA.

Continua a leggere per conoscere gli sforzi di Microsoft per regolare il riconoscimento facciale per eliminare la base.

Torna su