g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

"İnsan beynine en çok hangi derin öğrenme modeli benziyor?" MIT gibi yapay sinir ağı puanlama sistemleriyle DenseNet şampiyonluğu kazandı!

Xinzhiyuan AI WORLD 2018 Dünya Yapay Zeka Zirvesi

Yapay Sinir Ağları (YSA) her zaman beyin ile karşılaştırılır.

YSA'nın gelişimi biyolojik beyni tam olarak simüle edememiş olsa da, teknoloji gelişmektedir. İşte soru geliyor:

Biyolojik beyin ile benzerlik üzerine, hangi yapay sinir ağı en güçlüdür?

İşlev açısından beyne en çok benzeyen sinir ağı, beyne en çok benzeyen mekanizmaları içerecektir. Bu nedenle, MIT, NYU, Stanford ve diğer birçok tanınmış üniversite ortaklaşa " Beyin puanı "(Beyin puanı).

Bu, çeşitli sinirsel ve davranışsal karşılaştırmaları birleştiren bir test yöntemidir.Beynin çekirdek nesne tanıma mekanizmasına ne kadar benzer olduklarına göre sinir ağlarını puanlayabilir ve bu yöntemi en gelişmiş derin sinir ağlarını değerlendirmek için kullanabilir.

Bu puanlama sistemi kullanılarak elde edilen sonuçlar aşağıdaki gibidir:

DenseNet-169, CORnet-S ve ResNet-101 en beyin benzeri YSA'lardır
Hiçbir yapay sinir ağı, sinirsel ve davranışsal tepkiler arasındaki değişkenliği tahmin edemez, bu da tüm ilgili mekanizmaları yakalayabilecek yapay sinir ağı modelinin olmadığını gösterir.
Önceki çalışmayı genişleterek, YSA ImageNet performansındaki iyileşmenin beyin skorunda iyileşmeye yol açtığını gördük. Bununla birlikte, korelasyon ImageNet performansının% 70'inde zayıfladı, bu da beyin mekanizmalarını yakalamada daha fazla ilerleme kaydetmek için sinirbilimden ek rehberliğe ihtiyaç duyulduğunu gösteriyor.
En iyi performans gösteren ImageNet modellerinden daha küçük (yani daha az karmaşık) YSA'lardan daha beyin benzeri bir yapıdadır, bu da basitleştirilmiş YSA'ların ventral akışı daha iyi anlama potansiyeline sahip olduğu anlamına gelir.

Beynin ölçütü

Aşağıda, ölçüm modeli için karşılaştırmalı değerlendirmeye genel bir bakış sunulmaktadır. Kıyaslamalar, belirli deneysel verilere, bu durumda sinirsel kayıtlara veya davranışsal ölçümlere uygulanan bir dizi göstergeden oluşur.

Sinirsel

Sinirsel metriğin amacı, kaynak sistemin iç temsilinin (örneğin, sinir ağı modeli) hedef sistemin (örneğin, primatlar) iç temsiliyle ne kadar yakından eşleştiğini belirlemektir. Tipik makine öğrenimi kıyaslamalarının aksine, bu ölçümler belirli modellere öncelik vermek için ilkeli bir yol sağlar (çıktıları aynı olsa bile). Burada, bir doğrusal regresyon biçimi olan ortak bir metrik-nöro-tahmin edilebilirliği özetliyoruz.

Sinirsel tahmin: görüntü düzeyinde sinir tutarlılığı

Nöroprediktivite, kaynak sistemdeki (örneğin derin YSA) belirli bir görüntünün tepkisinin hedef sistemdeki tepkiyi (örneğin, BT görsel alanındaki tek bir nöronun tepkisi) ne kadar iyi tahmin ettiğini değerlendirmek için kullanılır. Girdi olarak metrik, nöronların nöral kayıtlar veya model aktivasyonları olabileceği iki uyarıcı × nöron seti gerektirir.

İlk olarak, kaynak nöronu her bir hedef nörona eşlemek için doğrusal bir dönüşüm kullanılır Bu haritalama işlemi, çoklu uyaranın eğitim-test bölünmesi üzerinde gerçekleştirilir.

Her çalışmada, eğitim görüntüleri kaynak nörondan hedef nörona eşlenecek ağırlıkları uyarlamak için kullanılır ve daha sonra bu ağırlıklarla tahmin edilen yanıt uzatılmış görüntüyü elde etmek için kullanılır.

Her bir nöronun nöro-kestirilemezlik skorunu elde etmek için, tahmin edilen yanıt, Pearson korelasyon katsayısı hesaplanarak ölçülen nöron yanıtı ile karşılaştırılır.

Eğitim-test bölümünün tahmin puanını elde etmek için tüm tek nöronal tahminlerin (örneğin, hedef beyin alanında ölçülen tüm hedef konumlar) medyanını hesaplayın (yanıt genellikle anormal bir şekilde dağıldığından, medyan kullanılır) . Tüm eğitim-test bölümlerinin ortalaması, hedef beyin bölgesinin son sinirsel tahmin skorudur.

Sinirsel kayıt

Beyin skorunun mevcut versiyonunda yer alan iki nöral kıyaslama, 88 V4 nörona ve 168 BT nöronuna 2,560 doğal stimülasyon nöral tepkisi içeren nöral veri setlerini kullanır (Şekil 1):

Şekil 1 Beyin puanına genel bakış Sinir ağlarını karşılaştırmak için iki tür gösterge kullanılır: sinirsel göstergeler iç aktiviteyi makak ventral akış alanıyla karşılaştırır ve davranış göstergeleri çıktının benzerliğini karşılaştırır. Küçük, rastgele birleştirilmiş bir model için (gri noktalar), beyin puanı ImageNet'in performansıyla ilgilidir, ancak mevcut son teknoloji modelde (yeşil noktalar), performansı% 70'lik ilk seviyede çok zayıf hale gelir.

Görüntü seti, sekiz nesne kategorisine (hayvanlar, gemiler, arabalar, sandalyeler, yüzler, meyveler, uçaklar, masalar) bölünmüş 2560 gri ölçekli görüntüden oluşmaktadır. Her kategori 8 benzersiz nesne içerir (örneğin, "yüz" kategorisinin 8 benzersiz yüzü vardır). Görüntü koleksiyonu, bir 3B nesne modelinin doğal bir arka plana yapıştırılmasıyla oluşturulur. Her görüntüde, primatlar ve makineler için zorlu nesne tanıma görevleri oluşturmak için nesnenin konumu, duruşu ve boyutu rastgele seçilir. Her görüntü için dairesel bir maske kullanılır.

davranış

Davranış kıyaslamasının amacı, herhangi bir görevdeki kaynağın (örneğin bir YSA modeli) ve hedefin (örneğin, bir insan veya maymun) davranışsal tepkileri arasındaki benzerliği hesaplamaktır. Temel nesne tanıma görevi için, primatlar (insanlar ve maymunlar dahil) kesin referans etiketlerinden farklı davranış kalıpları gösterir. Bu nedenle, buradaki ana kriter, kapsamlı bir doğruluk ölçüsü değil, davranışsal tepki modellerinin bir ölçüsüdür. YSA, primatların başarı ve başarısızlık modellerini oluşturabilir ve tahmin edebilir, böylece daha yüksek puanlar elde edilebilir. Bunun bir sonucu,% 100 doğruluğa ulaşan bir YSA'nın mükemmel bir davranışsal benzerlik puanı elde etmemesidir.

I2n: Standartlaştırılmış görüntü düzeyinde davranış tutarlılığı

Toplam i miktarına sahip görüntü veri kaynağı (model özelliği) ilk olarak mevcut davranış verileri kullanılarak hedef kategori c ve görüntü ib matrisine dönüştürülür.

Primatların davranışsal verileri

Mevcut kıyaslama turunda kullanılan davranışsal veriler Rajalingham ve diğerlerinden ve 2015 ve 2018'deki araştırma makalelerinden elde edildi. Burada sadece insan davranış verilerine odaklanıyoruz, ancak insanların ve insan olmayan primatların davranış kalıpları çok benzer.

Bu veri toplamada kullanılan görüntü seti, V4 görüntü oluşturma yöntemine benzer ve 24 nesne kategorisi kullanılır. Veri seti toplam 2.400 görüntü içerir (her nesne için 100). Bu karşılaştırma testinde, en deneysel görüntüleri elde etmek için 240 görüntü (nesne başına 10 görüntü) kullandık. Amazon Türkiye robotunun sağladığı görüntülere 1.472 insan gözlemci kısa yanıt verdi. Her deneyde, 100 milisaniye boyunca bir görüntü sunuldu ve ardından biri görüntüde görünen hedef nesneye, diğeri kalan 23 nesneye karşılık gelen iki yanıt seçeneği vardı. Katılımcılar resimde sunulan nesneleri seçerek yanıt verdiler. Bu nedenle, her hedef-çeldirici çifti için, birden çok katılımcıdan 300.000'den fazla yanıt elde edildi.

Beyin puanı

Bir modelin genel performansını değerlendirmek için, beyin skorunu elde etmek için nöral V4 tahmin skorunu, nöral BT tahmin skorunu ve davranış I2n tahmin skorunu birleştirdik. Burada verilen beyin puanı, bu üç puanın ortalamasıdır. Bu yöntem farklı puan ölçekleri ile standartlaştırılamaz, bu nedenle düşük varyans puanlarını cezalandırabilir, ancak aynı zamanda sıralamalarda görünecek puanlardaki önemli farklılıklar hakkında herhangi bir varsayımda bulunmaz.

Deneysel sonuçlar

Ekip, ImageNet üzerinde eğitilmiş çok sayıda derin sinir ağını inceledi ve bunların dahili temsillerini V4, BT ve insan davranışı ölçümündeki insan dışı görsel korteks alanlarının sinir kayıtları ile karşılaştırdı.

En gelişmiş sıralama

Tablo 1, beyin karşılaştırma testi aralığındaki her modelin puanlarını özetlemektedir.

ImageNet performansına göre beyin puanı Şekil 1'de gösterilmektedir. Mevcut kıyaslama testinde, en güçlü model 549 beyin skoruna sahip DenseNet-169 ve bunu sırasıyla 544 ve 542 beyin skorlarına sahip CORnet-S ve ResNet-101 izliyor. Şu anda, makine öğrenimi topluluğundan ImageNet'teki en iyi modellerin tümü DenseNet ve ResNet serisi modellerden. DenseNet-169 ve ResNet-101, 0.604 BT puanı (DenseNet-169, katman conv5_block16_concat) ve ResNet-101 davranış puanı ile BT sinir tahmini ve davranışsal öngörülebilirlik için en yüksek puanlara sahip modellerden biridir.

Kişisel nörolojik ve davranışsal karşılaştırma puanları

Önceki çalışmalar, daha yüksek sınıflandırma performansına sahip modellerin sinir verilerini tahmin etmenin daha kolay olduğunu bulmuştur. Burada, performans odaklı bu yöntemin çok çeşitli ImageNet performans sistemlerinde çoklu derin sinir ağlarında değerlendirildiğini, ancak insan performansı seviyesine ulaştığında sonuç üretemediğini göstererek bu çalışmayı geniş anlamda genişlettik. Beynin mükemmel uyumlu ağı (bkz. Şekil 1).

Kişisel puanlar açısından, ImageNet'in performansı ile beyin puanları arasındaki ilişki oldukça farklıdır (Şekil 2). Örneğin, V4 tek site yanıtı en iyi yalnızca VGG-19 (ImageNet en iyi 1 performansı% 71,10) tarafından değil, aynı zamanda Xception (% 79,00 ilk-1) tarafından tahmin edilir. Benzer şekilde, BT tek site yanıtı en iyi DenseNet-169 (.606; 75.90% ilk-1) tarafından tahmin edilir, ancak BaseNets (.592; 47.64% ilk-1) ve MobileNets (.590; 69.80% ilk-1) -1) Aynı BT sinir tahmin puanına da çok yakındır.

Şekil 2 Tüm modellerin sinirsel ve davranışsal karşılaştırmalar üzerindeki öngörülebilirliği

Buna karşılık, ImageNet performansı ile davranışsal öngörülebilirlik arasındaki ilişki hala güçlüdür ve AlexNet (% 57.50 ilk 1) veya BaseNets en iyi modellerin çok altında performans gösterir. Bununla birlikte, davranışsal puanlarda en iyi performans gösteren model, ImageNet'teki en gelişmiş model değildir: ResNet-101, davranış puanında en yüksek sırada (.389), ancak ImageNet% 77,37 ile ilk 1'de yer alıyor. PNASNet daha yüksek ImageNet performansına ulaşır (ilk 1'in% 82,90'ı), ancak davranış puanı önemli ölçüde azalır (.351).

Aslında, ImageNet'in en iyi 1 performansı ve davranışsal puanları arasındaki korelasyon zayıflıyor gibi görünüyor.Model ImageNet üzerinde iyi performans gösteriyor ve davranışsal puanlarla neredeyse hiçbir ilişkisi yok.Bu, ImageNet'i geliştirmeye devam ederek daha iyi davranışsal verilere ulaşmanın mümkün olmayabileceğini gösteriyor Tutarlılık.

Nöropredik değerlendirme alanları V4 ve IT ve I2n davranışsal kayıt kullanıyoruz. Şu anda en iyi modeller: V4'te VGG-19, BT'de DenseNet-169 ve davranışta ResNet-101. DenseNet-169, CORnet-S ve ResNet-101'in her üç kıyaslama için de güçlü modeller olduğunu belirtmekte fayda var. V40,892, BT 0,817 ve davranış 0,497'dir.

Bu sistem, model kıyaslamasının uygunluğunu değerlendirmek ve izlemek için beyin verilerinin beyin skorunu düzenli olarak güncelleyerek geliştirilebilir. Bu nedenle ekip yayınlandı Brain-Score.org , Sinirsel ve davranışsal ölçütler taşıyan bir platform Bu platformda, görsel işleme için YSA'lar beyin puanlarını ve diğer modellere göre sıralamalarını almak için gönderilebilir ve yeni deneysel veriler doğal olarak dahil edilebilir.

Orijinal bağlantı:

https://www.biorxiv.org/content/early/2018/09/05/407007

Xinzhiyuan AI WORLD 2018 Geri Sayım 10 gün

Biletler satışta!

Xinzhiyuan, 20 Eylül'de Pekin'deki Ulusal Kongre Merkezi'nde AI WORLD 2018 Dünya Yapay Zeka Zirvesi'ne ev sahipliği yapacak ve makine öğrenimi vaftiz babası, CMU profesörü Tom Mitchell, Mikes Tekmark, Zhou Zhihua, Tao Dacheng, Chen Yiran ve diğer AI liderlerini davet edecek Makine zekasına ve insan kaderine dikkat edin.

Konferans resmi web sitesi: