Yapay zeka, insanların göremediği özellikleri yakaladığı için "köpeği" "kedi" olarak tanır

Yakın zamanda, Massachusetts Teknoloji Enstitüsü'nden (MIT) bir ekip araştırma sonuçlarını yayınladı. Makale, Tartışmalı Örneklemin Görüntü Sınıflandırmasının başarısız olmasına neden olduğu olgusunun, sadece insanların bir tür "kendini beğenmişliği" olabileceğine dikkat çekti. Tanıma modelinin yakaladığı, aslında insan gözü tarafından algılanamayan "Sağlam Olmayan Özellik" dir. Yalnızca bu piksel düzeyi özelliklerine dayanıyorsa, modelin rakip örnekleri tanıması bir başarısızlık olarak değerlendirilemez.

Hemen hemen tüm görüntü tanıma algoritmalarının bir zayıflık-karşıt örnek problemi vardır. Rakip örnek, doğal bir resimdeki az sayıda pikselin değiştirilmesini ifade eder.Değişiklik insan gözü tarafından tespit edilmek için yeterli olmasa bile, tanıma algoritması, bir yavru köpeği devekuşu olarak tanımlamak gibi tamamen yanlış bir karar verir. Bu, kendi kendine giden bir arabayı şeritten saptırmak veya bir gözetleme sondasının suçluları tespit etmesini engellemek gibi ölümcül bir güvenlik ihlali haline gelebilir. (Link: T-shirt üzerine bir desen yazdırın, gözetim altında "gizlilik" sağlayabilir misiniz?)

Resim | Sol, "köpek yavrusu" olarak tanımlanan doğal bir resimdir. Sağda, "devekuşu" olarak tanımlanan, kasıtlı olarak değiştirilmiş rakip bir örnek var. (Kaynak: Christian Szegedy / Google Inc.)

Şu anda, birçok araştırma kurumu (Google, Massachusetts Institute of Technology ve Tencent Cohen Lab gibi), rakip örnekler sorununu çözmeye çalışıyor. Ana problemler üç yöndedir: Birincisi görsel dünyanın karmaşıklığıdır.Örneğin, bir resimde genellikle milyonlarca piksel vardır. İkinci olarak, görüntü tanıma için evrişimli sinir ağının (CNN) mekanizmasını tam olarak anlamıyoruz. Ayrıca bilim adamları, tanıma modelinin başarısızlığının sebebinin eğitim yönteminden mi yoksa yetersiz miktarda eğitim verisi mi olduğunu bilmiyorlar mı?

MIT araştırma ekibi, şu anda yaygın olarak kullanılan tanıma modellerinin, resimdeki insan gözünün algılayamayacağı ayrıntılara dikkat ederek aslında görüntü tanımayı gerçekleştirdiğini buldu. Sanki insanlar kulaklardaki farklılıkları karşılaştırarak kedi ve köpeklerin fotoğraflarını ayırt edebiliyor. Ancak AI modeli, piksel düzeyinde ayırt edilir.

Makalenin ilk yazarı ve Massachusetts Institute of Technology'de bir doktora öğrencisi olan Andrew Ilyas şunları söyledi: "Bu piksel seviyesindeki özellikler için en büyük özelliği insan gözüyle fark edilmemeleri."

Yapay zekanın görüntüleri tanımak için hangi özellikleri kullandığını anlamak kolay değil. Andrew Ilyas ve diğerleri önce bir dizi teorik çerçeve tanımladılar. Görüntüdeki özellikleri iki kategoriye ayırdılar: Piksel düzeyinde değişiklikler (kulaklar ve sakallar gibi) yapılsa bile tanıma sonuçlarını etkilemeyecek özellikleri ifade eden "Sağlam Özellikler" ve "sağlam olmayan özellikler" (Olmayan -güçlü Özellikler), yani piksel modifikasyonundan etkilenecek özellikler (genellikle insanlar tarafından tanınmaz).

İkinci olarak, modelleri eğitmek için "Standart Eğitim" ve "Sağlam Eğitim" olmak üzere iki yöntem tanımladılar. Sağlam eğitimin kayıp denklemi, ek olarak, rakip örneklerin varlığını da dikkate alır, böylece model, eğitim sırasında sağlam özelliklerin tanınmasını güçlendirebilir.

Şekil | Standart eğitim ve sağlam eğitim için kayıp denklemleri. Sağlam eğitimdeki altı çizili kısım, orijinal verilerin, onu bir yüzleşme örneği haline getirmek için değiştirildiğini gösterir. (Kaynak: Andrew Ilyas / MIT)

Sağlam ve sağlam olmayan özelliklerin aynı anda var olduğunu varsayarlar. Ve Generative Adversarial Network'e (GAN) benzer bir yöntem kullanılarak, orijinal eğitim veri setindeki (D) resimler iki yeni veri kümesi oluşturmak için yeniden işlenir: sağlam olmayan özellikler silinir ve yalnızca sağlam özelliklere sahip olanlar İnsanlarda yanlış etiketlenen ancak sağlam olmayan özellikleri etiketiyle eşleşen D_R ve D_NR.

Resim | Sol: Yalnızca güçlü özelliklere sahip orijinal eğitim verileri D, D_R ve özellik tutarlılığı kaybı olan D_NR. Sağ: Farklı eğitim yöntemleri altında üç veri setinin doğruluğu. (Kaynak: Andrew Ilyas / MIT)

Araştırmacılar, yalnızca sağlam özellikler nedeniyle D_R'nin orijinal D verilerinden daha az bilgi içerdiğine dikkat çekti. Deney, D_R'ye dayalı olarak, standart eğitim yöntemiyle elde edilen tanıma modelinin rakip örneklere de direnebileceğini buldu. Bu, piksel seviyesindeki (insan gözünün ayırt edemediği) modifikasyonun resimdeki sağlam özellikleri etkilemediğini kanıtlıyor.

Öte yandan, araştırmacılar eğitim verilerini (D) piksel düzeyinde değiştirir ve optimize etmeye devam eder, böylece standart model görüntüyü mümkün olduğunca başka bir tür olarak tanıyabilir. Örneğin, sağlam özellikler (insan gözü tarafından gözlemlenir) "köpekler" iken, sağlam olmayan özellikler ve ek açıklamalar (modelin düşündüğü gibi) "kediler" dir.

Araştırmacılar, değiştirilmiş resim setini D_NR olarak sayarlar ve test için eğitim verilerinin dışında doğal bir "kedi" resmi bulurlar. Tanıyıcı, bu yabancı resmi başarıyla bir "kedi" olarak tanıdı. Bu doğal "kedi" nin, model tarafından tanınabilen D_NR'deki "kedi" ile aynı özniteliklere sahip olduğunu ve bu özniteliğin göremediğimiz "sağlam olmayan özellik" olduğunu gösterir.

Şekil | Şeklin sağ tarafındaki "köpek" imgesi ile aşağıdaki "kedi" imgesi "kedi" olarak tanımlanmıştır, aynı sağlam olmayan özelliklere sahiptirler. (Kaynak: Andrew Ilyas / MIT)

Deneyler yoluyla Andrew Ilyas ve ekibi, resimde hem sağlam hem de sağlam olmayan özelliklerin bulunduğunu ve genel tanıma modellerinin görüntü tanıma için yalnızca sağlam olmayan özellikleri kullandığını ve sağlam olmayan özelliklerin insan gözü tarafından algılanamayacağını belirledi. Bu nedenle, karşıt örneklemin kendisi görüntü tanımada bir boşluk değil, bizim tarafımızdan görülemeyen başka bir özelliktir.

"Bu modelin kendisiyle ilgili bir sorun değil, sadece tanıma sonuçlarını gerçekten belirleyen şeylerin görülememesi." Makalenin ikinci yazarı ve MIT'de bir doktora öğrencisi olan Shibane Santurkar şunları ekledi: Karar, göremediğimiz bir şeye bağlıdır, öyleyse, verdiği kararın doğru olduğunu nasıl varsayabiliriz? Bir kişinin, gözetim videosundaki kişinin kendisi olmadığını mahkemede kanıtlaması gerekiyorsa, bu çok zahmetli olacaktır, çünkü biz yapmıyoruz İzleme ve teşhisin yanlış sonuçlarının nasıl ortaya çıktığını bilin.

Bilim adamları her zaman bir seçimle yüzleşmek zorundadır.Model "doğru" bir karar mı vermeli yoksa "insan" bir karar mı vermelidir? Model yalnızca sağlam özellikleri tanırsa, o kadar doğru olmayabilir. Bununla birlikte, karar verme mekanizması görülemeyen sağlam olmayan özelliklere karşı önyargılıysa, karşıt örnekler potansiyel boşluklar haline gelecektir. Günümüzde görüntü tanıma teknolojisi günlük hayatta yaygın olarak kullanılmaktadır, bu iki seçenek arasında belirli bir denge bulmamız gerekiyor.

Fransız Kültür Bakanı: Tüm bağışlar Notre Dame de Paris'in yeniden inşası için kullanılıyor
önceki
[Özellik] Monsanto: Bayer'in nakit ineği mi yoksa Waterloo mu?
Sonraki
"Aşırı Tailai Yok" pazarı geliyor mu? 2900 puanlık savaş, bir pazarlık avı düzeni mi yoksa mitinglerde bir azalma mı?
Gece ne kadar güzelse! Hangzhou'nun on büyük kentsel bölgesinin gece sahnesi planlaması yayınlandı, özel "Asya Oyunları Aydınlatma Özel"
1 Mayıs'ta Paris'teki yürüyüşçüler hastanenin yoğun bakım ünitesini çaldı! Şiddetli gösteriler sonsuz mu?
Anketler gösteriyor: Fransızların yarısından fazlası Notre Dame de Paris'in orijinal görünümüne döndürülmesini istiyor
"Kavun yiyen insanların" kendi kendini yetiştirmesi: Dedikodulara nasıl doğru bir şekilde başlanır?
"Konuştuğunu duyamıyorum" Hangzhou'daki en sessiz kahve dükkanı çok fazla nezaket aldı
Fransa'da bir ev satın almak size beş bin euro mu veriyor? Çinlilerin anlamadığı bir acı var: Nüfus çok az!
Gerçekten para yak! Hangzhou, Xiaoshan'daki bu özel ritüel anlam dolu ve komşular da etkilendi! Ama hepsi parayı incittiğini söylüyor ...
Paris'teki Seine nehrinin kıyısındaki "yeşil valizler" tescil edildi, ancak bunlar hala tarihte eski kitap tezgahları mı?
Arz ve talep tersine mi dönüyor? Pekin'in kira piyasası "düşmüş bir soğuk" ile karşılaştı: bazı bölgelerde kira kesintileri üçte birini aştı!
Alüminyum fabrikasının yanındaki köy: Toz o kadar fazladır ki, çam ağaçları bükülür ve çocuklar sıklıkla nezle olur ve vücutlarının her tarafında kızarıklıklar olur.
Altı yetişkin bedene uymadan spor ayakkabı alıyor.Nike Fit sorunu çözebilir mi?
To Top