Yüz tanıma sistemlerindeki "önyargı" ikilemleri nelerdir? Jeff Dean yardım edemedi ama bu genç adamın konuşmasını beğendi

AI Technology Review Press: Yapay zeka algoritması önyargısı (cinsiyet, ırk ...) artık yurtdışında yeni bir konu değil. Kısa bir süre önce Twitter'daki bir video, bu konuda geniş çaplı bir tartışmayı tetikledi. Genç bir Microsoft araştırmacısı, Jeff Dean de dahil olmak üzere büyük ineklerde yankı uyandıran bu konuyla ilgili kişisel Twitter'ında yüz tanıma sistemi modelinin önyargısı üzerine bir tartışma başlattı. Ne dedi?

Mesele, Sosyalist Parti'nin bir temsilcisi olan Alexandria Ocasio-Cortez'in, matematik tarafından yönlendirilen algoritmaların doğası gereği ırkçı olduğunu iddia ettiği Twitter'daki bir videoda ortaya çıktı. Bu gönderi, aralarında Anna S. Roth adlı bir araştırmacı da dahil olmak üzere halktan hızlı bir yanıt aldı.

Şu ana kadar iletilen orijinal gönderi sayısı 7,2 binden fazla yorum ile 2,8 bine ulaştı.

Tren aracılığıyla Twitter:

https://twitter.com/RealSaavedra/status/1087627739861897216

Kişisel ana sayfasına göre Anna S. Roth, Microsoftun Teknoloji ve Araştırma Departmanında bir araştırmacı ve Microsoftun Project Oxford projesinde tam zamanlı çalışıyor. Bu, geliştiricilerin Microsoft Research ve Bing'i kolayca kullanmasına olanak tanıyan API ve SDK'ların bir karışımıdır. Bilgisayarla görme, konuşma algılama ve dil anlama konularında en yeni çalışmaları yeniden yaratma projesi. Ayrıca, bir zamanlar Business Insider Dergisi'nin "30 Yaş Altı Teknolojide 30 Etkili Kadın" listesine dahil edildi.

Kişisel Twitter'ında yüz tanıma sistemi modelinin önyargısının nedenlerini ve ilgili çözümleri ve mevcut ikilemleri kısaca özetleyen 29'a kadar kısa yorum yayınladı. İçeriğin anlaşılması kolay olduğu ve kilit noktalara ulaştığı için, Google Beyin Lideri Jeff Dean yardım edemez, ancak Twitter'da tavsiye eder.

Anna S. Roth'un ne dediğine ayrı ayrı bakalım.

Veri sapması hakkında

Alexandria Ocasio-Cortez'in söylediği şey tamamen makul. Yüz tanımanın ticari gelişiminde çalışıyordum (o zamanki yön biraz önyargılıydı ve önyargılı modellerin geliştirilmesi), sanırım insanlar sonunda yapay zeka sistemlerinin nasıl önyargılı olduğunu anlamak için bazı somut ve güvenilir örnekler bulacaklar. Twitter'daki uzmanlar, yüz tanıma sisteminin önyargılı olmasının sebebinin verilerin önyargılı olması olduğunu açıkladı.

Bu yüzden sizinle konuşacağım:

(1) Bu (önyargılı) veriler nereden geliyor?

(2) Sapma ölçüm standardının seçimi de önemlidir.

(İşverenimin belirli bir örneğinden değil, sadece sektörde meydana gelen bazı şeylerden bahsettiğimin vurgulanması gerekir. Basitçe söylemek gerekirse bunlar benim kişisel görüşlerimdir ve işverenin konumunu temsil etmemektedir.)

En modern yüz tanıma sistemlerinin "çok büyük" veri kümeleri üzerinde eğitilmesi gerekir. En iyi eğitim efektini elde etmek için, aynı kişinin birden fazla fotoğrafını çekmeniz gerekir. Örneğin, şu anda en büyük sürüm veri setlerinden biri olan UW'den MF2, 672K personel bilgisine ve 4,7 milyon fotoğrafa sahiptir.

İlgili makalelere bağlantılar:

https://homes.cs.washington.edu/~kemelmi/ms.pdf

Bu veriler esas olarak İnternet'ten gelir. Örneğin, MF2 veri kümesinin verileri Flickr'dan gelir; başka bir veri kümesi MS-Celeb-1M'nin (https://www.msceleb.org) 10 milyon görüntüsü İnternet'ten "taranır" nın-nin. "Kamusal İnternette dolaşan fotoğrafların" "dünyadaki tüm insanları" tam olarak temsil etmediği vurgulanmalıdır.

Ancak, küresel İnternet erişimi eşit olarak dağıtılmamaktadır. Araştırmacılar bile aynı. Taradığınız şey, İngilizce'yi bir araç olarak kullanan web kaynakları / videolar olabilir (unutmayın, aynı kişinin birden fazla fotoğrafını almanız gerekir.) O zaman sormak isterim, Flickr'ı kullanan insanlar kimler? Microsoft'un ünlü veri seti MS Celeb'ın makalesinde, veri setindeki 1 milyon ünlüden 3 / 4'ünden fazlasının kadın olduğu belirtiliyor - bu nedenle çevrimiçi olarak hangi cinsiyetin daha ünlü olduğuna karar verirken Alexandria Ocasio'ya düşecek misiniz? Cortez'in sözde "otomatikleştirilmiş hipotez" tuzağı mı? Bu bağlamda, veri setini oluşturmaktan sorumlu kişi genellikle onu çeşitli yollarla ayarlayacaktır.

Çok "para yakan" bir seçenek, "gerçek dünyaya" adım atmak ve ödeme yoluyla veri toplamaktır. Ancak, bunu "doğru" yapmak (verilerin toplandığı yer gibi) ve bunu "etik" olarak (örneğin karşı tarafın rızasını alıp almamak, adil tazminat vb.) Yapmak kolay değildir. Ancak, bu ayrıntılar sonuçlarda "çok büyük" farklılıklara yol açabilir.

Elbette başka veri kaynaklarımız da olabilir. Örneğin, bazı insanlar şüphelilerin fotoğraflarını kullanmayı düşünür (Evet! Veri kümelerini ve ek açıklamaları etkileyen köklü sosyal önyargıların başka bir örneği). Bildiğim kadarıyla, ABD dışındaki bir gözetleme devletindeki yerli bir şirket bu büyük hükümet veri setlerine erişebilir. (Açıkçası bir FB iseniz, daha iyi dağıtımla verilere de erişebilirsiniz.)

Veri kümesi yalnızca verileri kaydettiğiniz + açıklama eklediğiniz bir yer değildir. Çoğu veri kümesi, insanlar tarafından, genellikle kitle kaynak kullanımı şeklinde daha fazla manuel açıklama gerektirir (yani, kitle kaynak personeline çevrimiçi platformlar aracılığıyla parça parça ödeme yapılır ve miktar genellikle küçüktür). Kitle kaynak kullanımı biçiminde çok fazla insan müdahalesi faktörü vardır. Örneğin, kitle kaynaklı personelin kültürel geçmişi? Gerçekten öznel olan sorular soruluyor mu? (Yaş, ruh hali vb.)

Veri sapması ölçümü hakkında

Bugün, önyargılı veri girişinin önyargılı modellere yol açacağı konusunda bir fikir birliğine vardık. Aslında, eğitim verilerinin dağıtım problemini çözmek için zaten birçok harika teknik yöntemimiz var.

Genel olarak, modelin sapmasını ve performansını değerlendirmek istiyorsanız, onu ölçmenin bir yolunu bulmanız gerekir. Aksi takdirde, modelin neden ve sapma derecesini bilemezsiniz. Örneğin, modelin işleyişini gruplar ve alt gruplar üzerinde test edebilmeniz için çeşitli özelliklere sahip kişileri içeren bir etiket veri kümesi oluşturmanız gerekebilir.

Sapma önlemleri, bu insanların bakış açılarını ve bakış açılarını, hangi konuların önemli olduğunu ve sosyal bilimler düzeyinde modelden etkilenebilecek kişileri entegre etmelidir. Örneğin, "gözlük takarsanız, model performansı yanlış olur" daha az zararlıdır "renkli bir insansanız, model performansının kötüleşmesine neden olur." Bunun bazı sosyal nedenleri vardır.

Hangi içeriğin ölçülmesi gerektiğine karar vermek, ölçüm veri kümeleri oluşturmak ve ilgili standartları yayınlamak, ilgili sistemleri kurarken "akıllıca" seçimlerinizdir. Bu nedenle, Alexandria Ocasio-Cortez "ırksal adaletsizlik model tarafından aktarıldı çünkü algoritma hala insanlar tarafından kontrol ediliyor" dediğinde, tamamen haklıydı.

Geçmişten günümüze, insanlar bunun neden olabileceği ciddi sonuçları defalarca kaydetmişlerdir. Ayrıntılar için bkz: Kendini bu sorunları çözmeye adamış farklı insan grupları için güçlü argümanlar sağlar. (Not: Bu aynı zamanda uluslararasılaşma ve çeşitlilik anlamına da gelir. Örneğin, bilgisayarla görme alanındaki çalışmaların çoğu Çin'de oluşturulmakta ve tüketilmektedir. Bu nedenle, bu konular uluslararası bir perspektife sahiptir.)

İlgili çözümler

Alexandria Ocasio-Cortez'in başlattığı tartışmaya geri dönelim. Bize verdiği ilhamlardan biri, AI etiğinin sadece "önyargıyı azaltmak için teknik yöntemler" veya "uygulamalı etik" olmadığıdır. Önyargının modele girmesi ya da modelin uygunsuz bir şekilde kullanılması ya da döngüsel geribildirim mekanizması önyargıyı güçlendirmesi, çünkü bu nedenler iç içe geçmiş olmasıdır.

Bu cümleyi, Alman kolluk kuvvetleri tarafından yapılan sığınma başvurularının soruşturulmasıyla ilgili The Atlantic dergisindeki bir raporda sık sık hatırlıyorum. Bu olasılıklı sistemleri nihayet benimseyen kullanıcılar, sistemin performansını insanlardan çok "tatmin" e bağladığında ne olacak?

Makale bağlantısı:

https://www.theatlantic.com/magazine/archive/2018/04/the-refugee-detectives/554090/

Bir personel saygıyla, "BAMF'nin yüz tanıma yazılımı ve onun tarafından çizilen devasa veritabanı artık" cennetten gönderiliyor "gibi görünüyor, dedi. "Bunun ters gittiğini hiç görmedim."

Herkesin bu videonun arka planını anlamasına yardımcı olmak için yüz tanıma yeteneklerinin ciddi sonuçlarını açıklamak için bazı pratik örnekler vermeye çalıştım. Ancak, bu fikirler aslında akademi ve halkın savunuculuğundan geliyor. "Şimdi" alanı "çok fazla" akademik araştırma üretiyor ve bunlar, bu içgörülü fikirlerin kaynakları. @TimnitGebru, @jovialjoy, @hannawallach, @mathbabedotorg, @jennwvaughan gibi uzmanlardan bir şeyler öğrenebildiğimiz için şanslıyız.

Ayrıca, önyargının yapay zeka üzerindeki etkisini nasıl kaydedecekleri, anlayacakları ve azaltacakları ve böylece yapay zekanın toplum üzerindeki olumsuz etkisini nasıl azaltacakları konusunda kendi fikirlerini ortaya koyan akademiden ve sosyal faaliyetlerden birçok lider var. Bu fikirleri şu yerlerden bulabiliriz (endüstri uygulamaları ve halkın farkındalığı üzerinde büyük bir etkisi vardır) ve burada https://fatconference.org/index.html

Bu görüşün sonucu olarak bu kelimeleri kullanacağım. Geçmişte sık sık yüz tanıma ile ilgili araştırmalara yatırım yapmış biri olarak, bu alandaki uzmanlara çok minnettarım, kredileri üzerinde çalıştığım sistemdeki ciddi problemlerin (ve yaratıcı onarım yöntemlerinin) keşfi de var.

Not 1: Tüm gönderiler işverenimin görüşlerini yansıtmamaktadır.

Not 2: @AOC ve @RonWyden'ın yanı sıra, uzun süredir ciddi şekilde ihmal edilen teknik politika sorunlarına karmaşık ama etkili çözümler sağlayabilecek daha fazla yasa koyucu olduğunu görmeyi umuyorum.

Not 3: Bu hafta, Inioluwa Deborah Raji ve Joy Buolamwini tarafından Gender Shades (cinsiyet ve ırk önyargısı için ticari yapay zeka modellerini test etmek için kullanılan bir algoritma) test sonuçları üzerine ortak yazılan yeni bir makale var. Burada iyi okumalar dilerim.

Kağıt bağlantısı:

Ek: Referans için "AI Now Report 2018" den AI hesap verebilirliği için 10 öneri çıkardık

  • Hükümetin, yapay zeka teknolojisini daha iyi denetlemek için belirli alanlardaki teknolojileri denetlemek, denetlemek ve izlemek için belirli departmanların gücünü artırması gerekiyor.

  • Halkın çıkarlarını korumak için yüz tanıma ve duygu tanıma kullanımını katı düzenlemelerle denetlemeliyiz.

  • Yapay zeka alanının acilen yeni yönetişim yöntemlerine ihtiyacı var Bu raporun da gösterdiği gibi, çoğu teknoloji şirketinin iç yönetim yapısı yapay zeka sistemlerinin sonuçlarını doğru bir şekilde açıklayamadı.

  • Yapay zeka şirketleri, kamu yararına hesap verebilirliği engelleyen ticari sırları ve yasal iddiaları terk etmelidir.

  • Teknoloji şirketleri, vicdani retçiler, çalışan örgütleri ve etik ihbarcılar için gerekli korumayı sağlamalıdır.

  • Tüketici hakları kurumları, yapay zeka ürün ve hizmetlerine "reklam gerçeği" yaklaşımını uygulamalıdır.

  • Yapay zeka şirketlerinin "boru hattı modeli" nin ötesine geçmesi gerekiyor ve kendilerini işyerinde kalabalıklaşma ve ayrımcılığa karşı koymaya kararlılar.

  • Yapay zeka alanında adalet, hesap verebilirlik ve şeffaflığın uygulanmasını sağlamak için yapay zeka sisteminin "tam yığın tedarik zincirini" detaylı bir şekilde düzenlememiz gerekiyor.

  • Bir yapay zeka hesap verebilirlik sisteminin inşasında dava, işçi örgütleri ve toplulukların daha fazla fona ve başka desteğe ihtiyaç duyduğunun farkına varmalıyız.

  • Üniversitelerdeki yapay zeka projeleri, araştırma ufkunu bilgisayar bilimi ve mühendislik disiplinlerinin ötesine genişletmelidir.

  • https://twitter.com/JeffDean/status/1089234088043569152 aracılığıyla

    AI Teknolojisi İnceleme Raporu

    Tıklamak Orijinali okuyun , Bkz. "AI Now Report 2018": Yapay zekanın şeytan olmasını önlemek için bir hesap verebilirlik sistemi çok yakında

    Hip-hop şarkıcılarının grup portresi: yıllarca yeraltı, bir gecede popüler oldu, bu bir rüya mı?
    önceki
    difüzyon! Lütfen bu iki kişiyi görür görmez polisi arayın, öldürdüklerinden şüphelenildikten sonra kaçarlar! Polis ödüllendirdi!
    Sonraki
    Kız kardeşimin bilgisayarı sık sık kapatılıyor, arızayı kolayca düzeltebilir
    Aynı zamanda "Materia Medica Fairy Cloud" adlı film oyunu da piyasaya sürüldü.Qiguang Pictures, "bitkisel kızı" denizaşırı ülkelere nasıl teşvik ediyor?
    PALACE Ultimo'nun sahadaki ikinci sokak çekimi dalgası geliyor! Aksesuarlar özellikle dikkat çekici görünüyor!
    Haberler AAAI 2019 Didi, yayınlanan kağıtları dahil etti
    Çevre koruma sadece bir slogan mı? Test sürüşü Audi Q7 e-tron
    Bu donanımı satın aldıktan sonra Xiaobai, bilgisayarı uzaktan da onarabilir.
    DeepMind'in süper insan seviyesindeki StarCraft AI `` AlphaStar '' ın çok resimli ayrıntılı açıklaması
    En büyük his, Changan Lingxuan 1.5T + 6AT'yi sorunsuz bir şekilde test etmektir.
    Roborock süpürme robotunu kullanmak o kadar uygun ki, deliriyorum
    Pan-eğlence dalgasında, kültür Tencent'in bir sonraki etiketi haline geliyor!
    Haberler Pengcheng Laboratuvarı Yapay Zeka Uluslararası Ar-Ge Merkezi resmi olarak kuruldu, Shen Xiangyang, Yang Qiang, Ramesh Jain ve üç büyük proje yerleşti
    Kırsal kesimde zengin olmanın altı yolu, pişman değilim!
    To Top