Facebook creează un set de date open-source pentru a diminua prejudecățile AI

Facebook cria conjunto de dados de código aberto para diminuir o viés de IA

O Facebook poderia usar algumas boas relações públicas após as últimas notícias que revelaram que a empresa de mídia social permitiu que milhões de dados de clientes fossem roubados. Para acertar um pouco o navio, o Facebook criou um conjunto de dados de código aberto que acredita que diminuirá o viés da IA.

Objetivo do Facebook para corrigir viés de IA

Um problema existente com o reconhecimento facial é o viés da IA. Embora a inteligência artificial tente identificar as pessoas por meio de suas características faciais exclusivas, ela historicamente não se dá bem com indivíduos não-homens nem brancos.

O Facebook se propôs a consertar o viés da IA com seu conjunto de dados de código aberto, ele se chama “Conversas casuais”. Inclui 45.186 vídeos de mais de 3.000 pessoas tendo uma conversa sem script. Os participantes são de diferentes gêneros, faixas etárias e tons de pele.

Os atores foram pagos para enviar vídeos que incluíssem suas próprias descrições de idade e sexo para remover o máximo possível de base de IA. A equipe do Facebook então os rotulou por tom de pele com base na escala de Fitzpatrick que examina seis tons de pele.

A iluminação também foi observada para mostrar diferentes tons de pele em situações de pouca luz. A IA de áudio e visual pode ser testada com o conjunto de dados Casual Conversations. O objetivo não é desenvolver algoritmos, mas avaliar o desempenho dos algoritmos com diferentes faces.

Dois dos conjuntos de dados usados ​​atualmente para reconhecimento facial – UB-A e Adience – eram compostos principalmente de pessoas de pele branca. UB-A usou 79,6 por cento de pessoas brancas, enquanto Adience usou 86,2 por cento.

Processamento de Ai Bias do Facebook

Além do tom de pele, os classificadores para IBM, Microsoft e Face ++ tiveram melhor desempenho com rostos masculinos do que vozes femininas em um estudo do MIT. Quase não houve erros com rostos masculinos brancos, enquanto rostos femininos mais escuros tiveram uma taxa de erro de quase 35%.

Casual Conversations visa ajudar a avaliar o algoritmo usado atualmente. “Nosso novo conjunto de dados de Conversas Casuais deve ser usado como uma ferramenta complementar para medir a imparcialidade da visão computacional e dos modelos de áudio, além de testes de precisão, para as comunidades representadas no conjunto de dados”, disse a equipe do Facebook que trabalha no projeto.

Avaliações de conversas casuais

O Facebook usou o Casual Conversations para testar os cinco algoritmos que venceram o Deepfake Detection Challenge em 2020. Isso foi desenvolvido para identificar a mídia adulterada que estava sendo postada.

Conjunto de dados Ai Bias do Facebook

Apesar de serem algoritmos bem respeitados, eles lutaram com tons de pele mais escuros. O vencedor do terceiro lugar no desafio, na verdade, foi o melhor com Conversas Casuais.

O Facebook já lançou o conjunto de dados para a comunidade de código aberto. Ao fazer isso, ele observou que identifica os gêneros “masculino”, “feminino” e “outro”, explicando que não pode identificar aqueles que se identificam como não binários.

“Durante o próximo ano ou assim, vamos explorar caminhos para expandir este conjunto de dados para ser ainda mais inclusivo, com representações que incluem uma gama mais ampla de identidades de gênero, idades, localizações geográficas, atividades e outras características”, disse o Facebook sobre seu esforços para eliminar o viés de IA.

Continue lendo para aprender sobre os esforços da Microsoft para regulamentar o reconhecimento facial para eliminar a base.

Rolar para cima