Aşırı uyumu reddeden Google, DNN genellemesindeki farkı doğru bir şekilde tahmin eder ve ayrıca veri kümesini açık kaynak kodlu | ICLR

Aufei Tapınağı'ndan Balık ve Koyun

Qubit Raporu | Genel Hesap QbitAI

Derin sinir ağları (DNN'ler) artık her yerde. Go oynamaktan yıldızlararası oyunlara kadar DNN, görüntü tanıma, görüntü bölümleme ve makine çevirisi gibi çeşitli alanlara girdi ve her zaman inanılmaz bir performans sergiliyor.

Bununla birlikte, derin sinir ağlarının nasıl çalıştığı hala araştırmacıları şaşırtmaktadır.

Kara kutular her zaman eleştirilir.YZ'nin insanlara daha iyi hizmet vermesi için daha derin bir yapay zeka anlayışı gereklidir.

Google AI araştırmacıları bunun üzerinde çalışıyor ve ICLR 2019'daki bir makalede önerdiler. Derin sinir ağlarının genelleme boşluğunu tahmin etmek için marjinal dağılımı kullanın DNN'yi daha fazla ilke tasarlamak için.

Genelleştirilmiş tahmin

Genellemeyi anlamak için önemli bir kavramı anlamak gerekir Genelleme boşluğu Eğitim setindeki modelin doğruluğu ile test setindeki doğruluğu arasındaki fark nedir.

Google AI araştırmacıları, genelleme boşluğunu tahmin etmek için ağ katmanında normalleştirilmiş uç dağıtımların kullanılmasını önermektedir. Deneysel istatistikler yaptılar ve mesafenin uygun şekilde normalleştirilmesinden sonra, marjinal dağılımın bazı temel istatistiklerinin modelin genelleme boşluğunu doğru bir şekilde tahmin edebileceğini buldular.

Yukarıdaki üç resim, CIFAR-10 üzerinde eğitilmiş üç evrişimli sinir ağına karşılık gelir.Sınıflandırma doğruluğu sırasıyla% 55,% 71 ve% 85'dir.Soldan sağa, genelleme yeteneği gittikçe güçleniyor. .

Y ekseni, modelin 4 katmanlı ağındaki normalleştirilmiş marjinal dağılımın (x ekseni) olasılık yoğunluğunu temsil eder Açıktır ki, marjinal dağılım ve test doğruluğu güçlü bir korelasyona sahiptir.

Burada bir isim kabul ettiler Derin Model Genelleme (DEMOGEN) Bu veri seti, CIFAR-10 ve CIFAR-100 veri setlerinde bu modellerin eğitim ve test performansı dahil olmak üzere 756 eğitimli derin modelden oluşmaktadır. Veri kümesi şimdi Açık kaynak .

Deneysel sonuçlar

Marjinal dağılımın istatistiksel verileri gerçekten genelleme performansını öngörüyorsa, o zaman basit bir tahmin şeması karşılık gelen bir ilişki kurabilmelidir. Bu yüzden araştırmacılar doğrusal regresyon şemasını seçtiler.

Araştırmacılar, CIFAR-10 veri setinde 216 adet dokuz katmanlı evrişimli ağ eğitti Test setinin doğruluğu% 60 ile% 90.5 arasında ve genelleme boşluğu% 1 ile% 35 arasındadır.

Yazara göre, Bartlett'in 2017'de yayınlanan araştırması, bir temel yöntem olarak karşılaştırılan en iyi derin ağ genelleme sınırlarından birini sağlıyor. 20 boyutlu özellik uzayının logaritmik uzay regresyon modelinin tahmin etkisi önemli ölçüde iyileşti.

CIFAR-100 veri setinde, araştırmacılar 324 ResNet-32 ağı eğitti, test doğruluğu% 12 -% 73 arasında ve genelleme boşluğu% 1-% 75 arasında değişiyordu.

CIFAR-100 + ResNet-32'de tahmin edilen genelleme açığı, gerçek değerle zaten çok tutarlıdır. Genelleme açığı ile marjinal dağılımın logaritmik dönüşüm istatistikleri arasındaki ilişki neredeyse tamamen doğrusaldır.

Uzman değerlendirmesi

Bu araştırma ile ilgili olarak, inceleme uzmanları karışık incelemeler yaptı, ancak çoğu, marjinal dağıtımı derin bir öğrenme çerçevesine sokmanın ilginç bir fikir olduğunu kabul ediyor.

Bu araştırmaya hayran olan uzmanlar bunun iyi bir ampirik makale olduğunu düşünüyor ve sonuç cesaret verici:

Bu makale başka bir "boş" genelleme sınırı önermeye çalışmıyor, ancak insanların derin sinir ağlarının genelleştirmesini anlamalarına yardımcı olmak için çok yararlı olan uç istatistikler ile genelleme boşlukları arasındaki ilginç bağlantıyı ikna edici bir şekilde gösteriyor. faydalı.

Bununla birlikte, bazı uzmanlar, bu makalenin çok sayıda deneysel sonuç gösterdiğine, ancak daha fazla teorik doğrulama sağlamadığına dikkat çekti.

OMT

Tezin ilki, Berkeley'den lisans derecesi ile mezun olan Google AI programcısı Yiding Jiang.

Makalenin ortak yazarları arasında Turing Ödülü sahibi Yoshua Bengio ile birlikte "AI Kardeş" olarak bilinen Samy Bengio da var.

Yoshua Bengio, derin öğrenmenin genelleştirilmesi üzerine de bir araştırma yaptı.Ekibi bir derin öğrenme genelleme garanti şeması ("Derin Öğrenmede Genelleme") önerdi ve makaleleri de bu ICLR 2019 makalesinde yer aldı.

Portal

Google AI Blogu:

https://ai.googleblog.com/2019/07/predicting-generalization-gap-in-deep.html

Kağıt adresi:

https://openreview.net/forum?id=HJlQfnCqKX

DEMOGEN veri seti:

https://github.com/google-research/google-research/tree/master/demogen

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzündeki "işe alma" kelimesini yanıtlayın.

Qubit QbitAI · Toutiao İmzalama Yazarı

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri izleme

Gelişmiş CycleGAN! Jia Jiaya ve diğerleri, boyut duvarını aşarak bir çizgi film ve yüz dönüştürme modeli öne sürdüler
önceki
PDD, YM sahtecilik maçının ana organına açıkça bir "avukat mektubu uyarısı" verecek: insan değil
Sonraki
50 yaşındaki amca, AI'da doktora çalışması için Cambridge'e geri döndü ve AI ile marul hasat etmek için bir robot geliştirdi.
Yetkili: Pogba, maçın Manchester United oyuncusu seçildi
Tencent Advertising, hafife alınabilecek bir yapay zeka işi
China-Europe Express (Zhengzhou), 30'dan fazla ülkede 130 şehri kapsayan "One Belt One Road" ağına derinlemesine entegre edilmiştir.
"Pokemon" Gonzo: değiştirilmiş çelik sütun, Lilia yedi nesildir ayrılmamış
Kirin 810 fiziksel yonga piyasaya çıktı, Snapdragon 730'u kıyasladı, AI çalışma puanı Snapdragon 855'ten daha yüksek
Premier Lig Asya Kupası-Silva, Sterling ile gol attı, Manchester City finale girmek için West Ham 4-1 yendi
"Pokemon" Xiaozhi'nin en güçlü beş düşmanı, bunlardan biri izleyiciler tarafından çılgınca şikayet edildi.
Yaz aylarında yüksek sıcaklığın birçok gizli tehlikesi vardır, arabanızın "tehlikeli dönemi" güvenle geçmesine nasıl izin verebilirsiniz?
Dharma Akademisi'nin 90'lı yıllarında doğan bilim adamları tarafından geliştirilen Alibaba'nın açık kaynak insan-makine diyalog modeli ESIM bir dünya rekoru kırdı
"Koridor devrimi" burada! Gençler, sakinlere çöpleri ayırmayı öğretir
"Robotların insan gibi davranması yasaktır!" Bu ikinci cümle, Temmuz ayında Kaliforniya'da yürürlüğe giren yeni bir yasadır.
To Top