Facebook, AI Önyargısını Azaltmak için Açık Kaynak Veri Kümesi Oluşturuyor

Facebook, AI Önyargısını Azaltmak için Açık Kaynak Veri Kümesi Oluşturuyor

⌛ Reading Time: 3 minutes

Facebook, sosyal medya şirketinin milyonlarca müşterinin verilerinin çalınmasına izin verdiğini ortaya çıkaran en son haberlerden sonra iyi bir PR kullanabilir. Gemiyi biraz düzeltmek için Facebook, AI önyargısını azaltacağına inandığı açık kaynaklı bir veri seti oluşturdu.

Facebook AI Önyargısını Düzeltmeyi Amaçlıyor

Yüz tanıma ile ilgili mevcut bir sorun, AI yanlılığı olmuştur. Yapay zeka, insanları benzersiz yüz özellikleriyle tanımlamaya çalışsa da, tarihsel olarak erkek olmayan, beyaz olmayan bireylerde pek başarılı olmuyor.

Facebook AI önyargısını düzeltmek için yola çıktı açık kaynaklı veri seti ile “Gündelik Konuşmalar” olarak adlandırıyor. 3.000’den fazla kişinin senaryosuz bir konuşma yaptığı 45.186 videoyu içerir. Katılımcılar farklı cinsiyet, yaş grupları ve cilt tonlarından oluşmaktadır.

Oyunculara, mümkün olduğu kadar çok AI temelini ortadan kaldırmak için kendi yaş ve cinsiyet açıklamalarını içeren videolar göndermeleri için ödeme yapıldı. Facebook ekibi daha sonra onları altı cilt tonunu inceleyen Fitzpatrick ölçeğine göre cilt tonuna göre etiketledi.

Düşük ışık koşullarında farklı cilt tonlarını göstermek için aydınlatma da not edildi. Sesli ve görsel yapay zeka, Gündelik Konuşmalar veri seti ile test edilebilir. Amaç algoritma geliştirmek değil, farklı yüzlere sahip algoritmaların performansını değerlendirmektir.

Yüz tanıma için şu anda kullanılan veri kümelerinden ikisi – UB-A ve Adience – çoğunlukla beyaz tenli insanlardan oluşuyordu. UB-A yüzde 79,6 beyaz, Adience ise yüzde 86,2 kullandı.

Facebook Yapay Zeka Önyargı İşleme

Cilt tonu dışında, IBM, Microsoft ve Face++ sınıflandırıcıları, bir MIT çalışmasında erkek yüzleriyle kadın seslerinden daha iyi performans gösterdi. Beyaz erkek yüzlerinde neredeyse hiç hata yoktu, daha koyu kadın yüzlerinde ise yaklaşık yüzde 35’lik bir hata oranı vardı.

Gündelik Konuşmalar, şu anda kullanılan algoritmanın değerlendirilmesine yardımcı olmayı amaçlar. Facebook’un proje üzerinde çalışan ekibi, “Yeni Casual Conversations veri setimiz, veri setinde temsil edilen topluluklar için doğruluk testlerine ek olarak bilgisayarlı görü ve ses modellerinin adilliğini ölçmek için ek bir araç olarak kullanılmalıdır” dedi.

Gündelik Konuşmalar Değerlendirmeleri

Facebook, 2020’de Deepfake Detection Challenge’ı kazanan beş algoritmayı test etmek için Casual Conversations’ı kullandı. Bu, yayınlanmakta olan üzerinde oynanmış medyayı belirlemek için geliştirildi.

Facebook Yapay Zeka Önyargı Veri Kümesi

Saygın algoritmalar olmalarına rağmen, daha koyu ten tonlarıyla mücadele ettiler. Meydan okumada üçüncü sırayı kazanan, aslında Gündelik Konuşmalar ile en iyisini yaptı.

Facebook, veri kümesini açık kaynak topluluğuna zaten yayınladı. Bunu yaparken, “erkek”, “kadın” ve “diğer” cinsiyetlerini tanımladığını ve ikili olmayan olarak tanımlayanları tanımlayamadığını açıkladı.

Facebook, “Önümüzdeki yıl boyunca, daha geniş bir cinsiyet kimlikleri, yaşlar, coğrafi konumlar, faaliyetler ve diğer özellikleri içeren temsillerle bu veri setini daha da kapsayıcı olacak şekilde genişletmenin yollarını keşfedeceğiz” dedi. AI önyargısını ortadan kaldırma çabaları.

Microsoft’un temeli ortadan kaldırmak için yüz tanımayı düzenlemeye yönelik çabaları hakkında bilgi edinmek için okumaya devam edin.

How useful was this post?

Click on a star to rate it!

Average rating 0 / 5. Vote count: 0

No votes so far! Be the first to rate this post.