Leifeng.com AI Teknolojisi Yorumu: Mevcut CNN tabanlı görüntü tanıma modeli gerçekten birçok görevde yüksek tanıma doğruluğu sağlayabilir ve birçok pratik uygulamada da kullanılmıştır, ancak CNN modelinin genelleştirilmesi ve sağlamlığı hala çok daha zayıftır. İnsan görüşü için - Biraz değiştirilmiş veya gürültülü görüntüler karşısında, insan görsel tanıma neredeyse hiç etkilenmezken, CNN'in tanıma doğruluğu büyük ölçüde dalgalanabilir; sahneler ve perspektifler de CNN performansını önemli ölçüde etkileyebilir. Çok az sayıda örnekten nesne tanımayı öğrenmekten bahsetmiyorum bile.
"Görsel zeka" nın en yüksek seviyesi, değişmez sinirsel temsil ve görüntünün karmaşık dönüşümden sonra tanınması ve işlenmesi için genelleme yeteneği ise, insan / biyolojik görsel sistemi açıkça görsel zekaya sahiptir ve modern CNN, Mevcut değil; biyolojik görsel sistemlerde görsel zekanın kaynağını incelemek ve bunu yapay olarak tasarlanmış görsel sistemlerde yeniden üretmeye çalışmak sinirbilim ve makine öğrenimi alanında son yıllarda sıcak bir araştırma konusu oldu.
Son zamanlarda, NeurIPS 2019 makalesi "Beyinlerden Öğrenme Makineleri Nasıl Düzenlenir?" (Beyinden makine düzenlemesi yapmayı öğrenmek) bu konuda ilginç bir girişimde bulundu. Daha önce, insan beyninin fMRI görüntüleme kod çözme işleminden elde edilen görüntüleri yeniden üreten Japon araştırmacıların sonuçlarını tanıttık. Ancak beynin sinirsel aktivitesinin yapay sinir ağı öğrenme ve temsil sürecini doğrudan etkilediğine göre, modelin sınıflandırma görevlerindeki performansını etkilediğinden, bu yöntem oldukça yeni ve ilginçtir. Lei Feng.com AI Technology Review, makalenin ana içeriğini aşağıdaki gibi tanıtıyor.
Bu yazıda, yazarlar görsel zekanın bir yönünü karşılaştırmaya odaklandılar: yüzleşme saldırılarına karşı sağlamlık ve gürültü müdahalesi. Çekişmeli saldırılar, CNN modelinin nesneyi yüksek derecede güven ile başka bir kategori olarak tanımasına izin vermek için belirli bir görüntüde küçük değişiklikler yapabilir.Gürültü genellikle CNN'nin tanıma doğruluğunu etkiler. Aynı müdahaleyle karşı karşıya kalan biyolojik görüş sisteminin performansı neredeyse hiç etkilenmez. Bu muhtemelen CNN'in biyolojik görüş sistemindeki gelişmiş sahne anlama yeteneklerinden yoksun olmadığını, aynı zamanda CNN tarafından nesneleri tanımak için kullanılan görsel özelliklerin de biyolojik görüş sisteminden tamamen farklı olabileceğini gösterir.
Ne yazık ki, biyolojik sinir ağlarının ve yapay sinir ağlarının çalışma mekanizmaları çok farklıdır.Biyolojik görsel sistemden farklı seviyelerde görsel özellikleri çözebilsek bile, bunları doğrudan yapay sinir ağına kopyalamak bizim için zordur. Bazı araştırmacılar biyolojik görsel sistemler üzerine doğrudan araştırma yaptılar.Örneğin, New York Üniversitesi profesörü Eero Simoncelli doku ve hiyerarşik algı perspektifinden araştırma ve deneyler yaptı (ICLR 2017 özel dersinde tanıttı), ancak o Doğrudan CNN'i iyileştirmenin bir yolu yoktur.
Bununla birlikte, biyolojik sinir ağlarının özelliklerini taklit etmek istersek, tamamen çaresiz kalmayabiliriz: sinir ağlarını eğitirken çeşitli örtük tümevarım önyargıları sunacağız ve ağın parametre alanını artırabilecek farklı düzenleme yöntemleri kullanacağız. Modelin özellikleri öğrenme ve kullanma şeklindeki kısıtlamalar ve yönlendirici değişiklikler, nihayetinde modelin sağlamlığını ve genellemesini etkileyecektir. Bu aşamada sinir ağı eğitiminde çeşitli seçim önyargılarının etkisini önceden açıklığa kavuşturmak bizim için zor olsa da ve model tarafından öğrenilen örüntüler genellikle eğitim verilerinin kapsamı dışında genelleştirilemez, bu en azından umut verici bir buluş.
Yandan yardımcı olan bir şey, son zamanlarda yapılan birçok çalışmanın, görevde eğitilen CNN ağının algısal temsilinin, primat beyninde ölçülen temsil sinyaline benzer olduğunu göstermesidir. Yazarlar, yapay sinir ağının temsili ve biyolojik görsel sistemin uyarılmış sinirsel aktivitesi tarafından yansıtılan temsilin daha benzer hale getirilebilmesi durumunda, CNN'nin performansı üzerinde olumlu bir etkiye sahip olabileceğini, örneğin biyolojik görsel sistemle aynı şekilde, cesurca varsaydılar. Ayrıca gürültülü ve değişen görüntüler karşısında daha istikrarlı bir performansa sahiptir.
Bu makalenin yazarları, model tarafından öğrenilen modelin biyolojik görme sistemi modeline daha benzer olması için ek önyargıları ortaya koyar ve modeli düzenler (kılavuzluk eder). Spesifik olarak, yazarlar, fareler çeşitli karmaşık doğal sahneler gördüklerinde beyindeki görsel korteksin nöral tepkisini doğrudan ölçtüler. Daha sonra, CNN'i eğitirken, yazarlar artık yalnızca çekirdek olarak tanınan geleneksel eğitim hedefini kullanmıyorlar.Bunun yerine, evrişimsel özelliklerin aktivasyon modelini biyolojik sinir sinyallerinin modeline daha yakın olması için teşvik ediyorlar, bu da CNN'i daha yakından öğreniyor. Biyolojik görsel sistemin karakterizasyonu.
Fareleri ölçme
Yazarlar, ana görsel korteksin taramalarını birkaç gün boyunca birden fazla fare üzerinde tekrarladılar. Deneyde, farenin kafası sabitlendi ve vücut pistte koşabiliyordu. Araştırmacılar, ImageNet veri setinden 5100 farklı görüntü çıkardı ve bunları 64x36'ya düşürülmüş çözünürlükle gri tonlamalı renklere dönüştürdü ve sonra bunları farelere gösterdi (farelerin görme yeteneği insanlar kadar güçlü değil ve renge duyarlı değiller); Bunların arasında, 5000 yaprak yalnızca bir kez görüntülenir (bir kez ölçülür) ve 100 yaprak 10 kez görüntülenir (10 kez ölçülür), böylece her fare için her deney turu için 6000 set ölçüm verisi olur.
Fareleri deney hayvanları olarak seçmenin temel nedeni, fareler için genetik modifikasyon yöntemlerinin daha olgun olması ve yazarların aynı anda 8.000 farklı nöral birimin sinyallerini ölçmesine izin vermesidir. Elbette, yeterince karmaşık ve insanlara yeterince yakın olan diğer primatların görsel sistemleri ideal araştırma nesneleridir, ancak sonuçta zordur ve görsel sistem fareler için hala önemli bir duyusal girdi yoludur ve hala ölçüm önemine sahiptir.
Yazarlar, ölçülen sinyallere göre sinyal-gürültü oranını hesapladılar, tekrarlanan deneylerde toplanan sinyallerin ortalamasını aldılar ve görüntü-ölçüm sinyal çiftine dayalı bir gürültü azaltma modeli tasarladılar ve son olarak orijinal ölçüm verilerinin gürültüsünü etkili bir şekilde azalttılar. Sonraki deneyler için güvenilir nöral sinyal özellikleri edinin. Daha sonra yazarlar, denoize edilmiş veriler üzerinde 5000x5000 benzerlik matrisi oluşturdu ve bunu düzenli hale getirilmiş CNN ağının hedefi olarak kullandı.
Benzerlik matrisi: Şekildeki noktalar, apsise karşılık gelen görüntüden ve ordinata karşılık gelen görüntüden fare tarafından üretilen sinir sinyallerinin ayrıntı düzeyini gösterir.Açık renkli noktalar, biyolojik görüş sistemi açısından daha yüksek bir benzerlik derecesini gösterir. İki tane daha benzer resim var; daha koyu noktalar daha az benzerliği gösterirCNN eğitimi
Yazarlar, fareyi taklit etmek için CNN modelinin omurgası olarak 18 katmanlı bir ResNet modeli seçtiler, böylece görüntü sınıflandırma görevini öğrenirken fare görsel sisteminin aktivasyon modunu taklit ettiler.
Tipik bir CNN sınıflandırma görev eğitiminde, çapraz entropi kaybı gibi optimize edilmesi gereken yalnızca bir görev kaybı vardır. CNN'nin fareleri taklit etmesi için yazarlar benzerlik kaybı ekledi. Spesifik çalışma modu:
Ağ, giriş olarak bir veya iki görüntü alabilir
Girdi tek bir görüntü ise, model kategori sınıflandırma sonucunu ek bir tam bağlantılı katman katmanı aracılığıyla çıkarır - çapraz entropi kaybını hesaplar
Giriş iki (bir grup) görüntü ise, model iki görüntünün etkinleştirilmesinin evrişim özelliklerini hesaplayacak ve ardından 1, 5, 9, 13 ve 17 katmanlardaki etkinleştirme özelliklerinin benzerliğini hesaplayacaktır. Yazarlar, düzenli ağırlıklı bir toplayıcı aracılığıyla nihai bir benzerlik sonucunu hesaplar ve daha sonra benzerlik kaybını hesaplamak için farede ölçülen sinyal benzerliği ile karşılaştırır, böylece ağı farenin sinirsel sinyal modelini öğrenmesi için yönlendirir.
Bu şekilde yazarlar, orijinal CNN modelinin biyolojik görsel sisteme daha benzer görsel temsilleri öğrenmesine izin vermek için düzenlileştirmeyi kullanır.
Sonuç karşılaştırma bölümünde, yazarlar ilk olarak "Biological Vision CNN" (ResNet18'e dayalı) ile birkaç normal eğitim modeliyle benzerlik kaybı eğitimini karşılaştırdılar ve bunları gri tonlamaya dönüştürülmüş CIFAR görüntüleri üzerinde test ettiler. Hiçbir ek düzenleme içermeyen ResNet18, ek gürültü olmadan görüntüler için en yüksek tanıma doğruluğunu elde etti, ancak gürültü eklenmesiyle doğruluk hızla düştü; testteki en yüksek gürültü altında, "Biological Vision CNN" doğruluğu hala yüksekti % 50, diğer modellere göre çok daha yüksek; yani modelin sağlamlığı önemli ölçüde iyileştirildi.
Bir kontrol deneyi olarak, yazarlar ayrıca, düzenlileştirme için rastgele bir benzerlik matrisi kullanmak ve düzenlileştirme için VGG19'un conv3-1 katman benzerlik matrisini kullanmak gibi farklı "biyolojik görme" düzeylerini de test ettiler.Performans hala "biyolojik görüş" kadar iyi değil. Görsel CNN ", ancak VGG19 kullanan katman en benzer olanıdır.
Başka bir kontrol deneyleri kümesinde, yazarlar, fare sinir sinyali ölçüm verilerini doğrudan düzene sokmak için gürültü azaltma olmadan kullandılar ve modelin sağlamlığının çok az arttığını buldular; yazarlar, orijinal sinir sinyalinin oldukça değişken / rastgele olduğuna inanıyorlar. Bu, gürültü azaltma adımlarının önemini göstermektedir.
Çeşitli saldırgan saldırı yöntemlerini içeren çekişmeli görüntü tanıma testinde, "Biyolojik Görüş CNN" performansı da diğer modellere göre çok daha iyidir.
Sık sık sinirbilimin makine öğrenimine ilham verebileceğini söylüyoruz, ancak nörofizyolojinin araştırma sonuçlarını doğrudan yapay sinir ağlarına dönüştürmenin bir yolunu her zaman bulamadık. Bu yazıda, yazarlar, sinir ağı modeline önyargı ekleyebilen ve model tarafından öğrenilen gösterimi ve fare beyninin (biyolojik görsel sistem) görsel temsilini daha iyi hale getirebilen sinirsel sinyal ölçüm verilerini kullanan bir düzenleme yöntemi göstermektedir. Benzer olmak için, akıl yürütme görevlerinde ağın sağlamlığını geliştirin. Yazarlar, yapay sinir ağlarının görsel temsili ile biyolojik görsel sistemde V1'in üzerindeki görsel korteks arasındaki benzerliğin gelecekte daha da iyileştirilebileceğine, modelin sağlamlığı ve genelleme performansının artmaya devam edebileceğine inanıyorlar. Biyolojik beyinlerin gerçek taklitinden öğrenilen bu temsiller, makine öğrenme algoritmalarının performansının insan görsel sisteminin performansına daha yakın olmasına yardımcı olabilir.
Yöntemle ilgili olarak, yazarlar tarafından kullanılan temsil benzerliği yöntemi daha genel bir yöntemdir ve orijinal sinyal denoising yöntemi de biyolojik görsel temsilin değerlendirilmesini iyileştirmeye yardımcı olur (görsel olarak ilgili sinyalleri ayırma ve bireyi ayırma Nöral sinyal, güvenilir, gürültüsü azaltılmış nöral sinyale dönüştürülür). CNN modelinin biyolojik sinirsel gösterimi taklit etmesini sağlamanın bir başka yolu, görevi yerine getiren CNN modelini eğitirken ağın orta katmanından birlikte doğrusal bir okuyucu eğitmek ve görüntü özelliklerinden biyolojik sinir tepkisini doğrudan tahmin etmesine izin vermektir. Bununla birlikte, yazarlar, CNN'deki çok sayıda profilleme dönüşümünün, CNN'den öğrenirken sinir tepkisini tahmin etmenin doğruluğunu artırabilecek doğrusal okuyucular tarafından telafi edilebileceğinden, seçtikleri yöntemin daha yüksek kısıtlamalara ve kılavuzluk gücüne sahip olduğuna inanıyorlar. Ortaya çıkan temsilin etkisi minimumdur.
Bu makalede, yazarlar esas olarak "biyolojik vizyon CNN" nin sağlamlığını ölçtüler, ancak açıkçası, bu yöndeki araştırmanın uzun vadeli amacı, alan göçünde, küçük örneklem öğrenmede vb. Biyolojik görüşü taklit eden görsel temsil kullanmaktır. Her yönden iyileştirmeler getirin. Yazarlar ayrıca görsel sistemin diğer tezahürlerinde daha fazla keşif yapacak ve gelecekte daha fazla benzerlik sınırlaması yapacaklar.
Buna ek olarak, yöntem tasarımı ve deneysel sonuçlar, biyolojik görsel özellikleri taklit etmenin iyileştirmeler getirebileceğini gösterse de, bu araştırmanın arkasındaki en derinlemesine araştırmaya en değer olan biyolojik görsel temsillerin hangi yönünü özellikle öğrenmek için araştırılması gereken bir problemdir. Spesifik etki ilkelerini netleştirebilirseniz, artık büyük ölçekli sinirsel sinyal edinme deneylerine güvenemezsiniz, bunun yerine bu ilkelere dayalı olarak doğrudan makine öğrenimi modelleri tasarlayıp eğitebilirsiniz - bu, bu araştırma rotasının en yüksek amacıdır.
Orijinal makaleyi okuyun: https://arxiv.org/abs/1911.05072
Leifeng.com AI Teknolojisi İnceleme Raporu
Leifeng.com Yıllık Seçimi 19 büyük sektörde en iyi yapay zeka iniş uygulamalarını arıyor
2017'de kurulan "En İyi AI Nuggets Vakalarının Yıllık Listesi", sektörün ilk AI iş vaka seçimi etkinliğidir. Ticari boyuttan başlayarak, Leifeng.com çeşitli sektörlerde en iyi yapay zeka uygulamalarını arıyor.
Üçüncü seçim resmi olarak başlatıldı. Kayda katılmak için WeChat genel hesabı "Leifeng.com" u izleyin ve "liste" anahtar kelimesini yanıtlayın. Ayrıntılar için lütfen WeChat ID ile iletişime geçin: xqxq_xq