Google Brain evrensel bir kalıcı bellek modülü geliştirdi ve sinir ağı hayat boyu öğrenmeyi ilk kez gerçekleştirdi

Xinzhiyuan Derlemesi

Hafızalı gelişmiş sinir ağı, yeni bir araştırma etkin noktası. Birçok çalışma, standart tekrarlayan sinir ağlarında belleğin genelleştirilmesi için bir bellek bileşeni tasarlamıştır. Özyinelemeli bir ağda, zaman içinde bir noktadan diğerine geçen durum, mevcut örneğin ağ belleği temsili olarak yorumlanabilir. Belleğin sabit uzunlukta vektör gösteriminden daha büyük ve daha çeşitli formlara geçmek, bu çalışmalarda kullanılan temel yöntemdir. Santoro ve arkadaşları, 2016 yılında yapılan bir çalışmada bellek tabanlı modeller ile tek seferlik öğrenme arasında bir bağlantı kurduğundan beri, tek seferlik öğrenme üzerine birçok çalışma da ortaya çıktı.

Son gelişmelere rağmen, hafıza takviyeli derin sinir ağları, özellikle nadir olayları hatırlamada, yaşam boyu öğrenmede ve tek seferlik öğrenmede hala sınırlıdır. Bugün sizin için tanıttığımız makale, derin öğrenme sürecinde kullanılan büyük ölçekli bir ömür boyu bellek modülü önermektedir.Bu modül, verimliliği artırmak ve büyük bellek ölçeğini genişletmek için hızlı en yakın komşu algoritmalarını kullanır. En yakın komşu sorguları haricinde, modül tamamen farklılaştırılabilir ve ek denetim olmaksızın uçtan uca eğitilebilir. Ömür boyu, yani eğitim sırasında sıfırlamaya gerek yok.

Bu bellek modülü, denetlenen bir sinir ağının herhangi bir bölümüne kolayca eklenebilir. Araştırmacılar esnekliğini göstermek için, görüntü sınıflandırmasıyla test edilen basit evrişimli ağlardan derin, diziden diziye özyinelemeli evrişim modellerine kadar birçok ağa eklediler. Her durumda, güçlendirilmiş ağ, bir defalık yaşam boyu öğrenme becerisi kazanmıştır. Modül, geçmiş binlerce adımın eğitim örneklerini hatırlar ve bunlardan genelleme yapabilir. Araştırmacılar Omniglot veri setinde en gelişmiş tek seferlik öğrenmeyi gerçekleştirdiler ve ilk kez yaşam boyu öğrenmeyi ve büyük ölçekli makine çevirisi görevlerinde tekrarlayan sinir ağlarının tek seferlik öğrenimini gösterdiler.

Nadir olayların tez öğrenimi ile çözülecek problem

Bilgisayarla görmeden konuşma tanımaya ve makine çevirisine kadar, makine öğrenimi sistemleri birçok alanda başarılı olmuştur. Nöral makine çevirisi o kadar başarılı ki bazı dil "grupları" için ortalama insan çevirisi düzeyine yakın. Ancak ortalama kelime dağarcığı burada önemli bir faktördür. Zengin eğitim verilerinde bir cümle bir cümleye çok benziyorsa, çeviri çok doğru olacaktır. Ancak, Dostoyevski (Almanca'da Dostojewski) gibi nadir bir sözcükle karşılaşıldığında, birçok model işlenemeyecektir. Dostoyevski'nin doğru Almanca çevirisi, modelin eğitim verilerinde yeterince görünmez ve model çevirisini öğrenemez.

Belki de bu ünlü Rus yazarla ilgili örnek cümleler sonunda eğitim setine eklenecek, ancak başka birçok türden nadir kelime veya nadir olay var. Bu, mevcut derin öğrenme modellerine bir sorun getiriyor: eğitim verileri genişletilmeli ve bu nadir sözcükler veya olaylarla başa çıkmak için model yeniden eğitilmelidir. Aradaki fark, insanların bir örnekten öğrenmesi ve bunu ömür boyu asla unutmamasıdır.

Kağıt bir ömür boyu bellek modülünde önerilen yöntem

Bu makalenin yazarı, çeşitli sinir ağlarında tek seferlik öğrenmeyi gerçekleştirebilen yaşam boyu bir bellek modülü önermektedir. Bu modül, birden çok anahtar / değer çifti içerir. Anahtar, sinir ağının belirli bir katmanının aktivasyon bilgisidir ve değer, belirli bir örnek için kesin referans hedefidir. Bu sayede ağ eğitildikçe hafızası artarken daha kullanışlı hale gelecektir. Sonunda, çok benzer aktivasyon bilgisine sahip bilgiye dayalı tahminlerde bulunabilir. Yeni bir örnekle karşılaşıldığında, ağ, bu örnek yalnızca bir kez görünse bile, daha sonra kullanılmak üzere belleğe yazar.

Uzun süreli belleğe sahip olmanın birçok avantajı vardır. Tek seferlik öğrenme kendi başına çok değerlidir ve bazı görevlerde daha da vazgeçilmezdir. Çeviri gibi büyük eğitim setlerine sahip gerçek dünya görevleri bile uzun süreli bellekten yararlanabilir. Son olarak, hafıza eğitim örneklerine kadar geri izlenebildiği için modelin verdiği kararları açıklamak mümkündür, bu da modeli daha spesifik olarak geliştirebilir.

Ömür boyu bellek modüllerinin değerlendirilmesi

Tek seferlik bir hayat boyu öğrenme modelinin performansının nasıl değerlendirileceği çok net değildir, çünkü çoğu derin öğrenme değerlendirmesi ortalama performansa odaklanır ve tek seferlik bir öğrenme bileşeni yoktur. Makalenin yazarı, bellek modülünün gerçekten etkili olduğunu kanıtlamak için çeşitli yöntemler denedi:

1. Yazar, net bir tek seferlik öğrenme değerlendirmesine sahip tek veri seti olan, iyi bilinen tek seferlik öğrenme görevi Omniglot'u değerlendirir. Değerlendirme sonucu, bellek modülünü ekledikten sonra önceki en iyi sonucu geçtiğini gösteriyor;

Omniglot veri kümesiyle ilgili sonuçlar. Yalnızca basit bir evrişimli sinir ağı kullanılmasına rağmen, bellek modüllerinin eklenmesi, modelin performansını hala çok daha karmaşık bir modele yakın tek seferlik ve çoklu atış öğrenme görevlerinde yapar.

2. Yazar, tek seferlik yaşam boyu öğrenmeyi gerektiren bir görev tasarlamıştır. Bu görevde, standart model kötü performans gösterirken, yazarın modeli daha iyi performans gösterdi;

3. Son olarak, yazar tek seferlik bir hayat boyu öğrenme modülü ile İngilizce-Almanca çeviri modeli eğitti. Hala çok iyi bir ortalama performans sergiliyor ve tek seferlik öğrenme için kullanılabilir. Niteliksel olarak, model Dostoyevski gibi nadir kelimeleri çevirebilir. Nicelik olarak, model değerlendirmeden önce ilgili çeviriyi görebilirse, değerlendirme sırasında elde ettiği BLEU puanı önemli ölçüde artacaktır.

Makalenin yazarı, ömür boyu bellek modülünün farklı derin öğrenme modellerine eklenebileceğini ve ağa farklı katmanlar üzerinde tek seferlik öğrenme yeteneği verebileceğini belirtti. Bellek modülünün bazı parçaları daha ayrıntılı olarak ayarlanabilir ve incelenebilir. Doğru anahtarla sorgu ortalamasına ulaşmak için güncelleme kuralı parametreleştirilmelidir. Yalnızca tek bir komşu döndürmek yerine, ağın diğer katmanlarının işlenmesi için birden çok komşu döndürebiliriz. Makalenin yazarı bu soruları gelecekteki araştırmalar için bırakıyor.

Kağıt adresi: https://arxiv.org/pdf/1703.03129v1.pdf

27 Mart'ta Xinzhiyuan Açık Kaynak Ekolojik Yapay Zeka Teknolojisi Zirvesi ve Xinzhiyuan 2017 Girişimcilik Yarışması Ödül Töreni görkemli bir şekilde düzenlendi. "BAT" dahil olmak üzere Çin'in ana akım AI şirketleri ve 600'den fazla sektör eliti 2017 Çin'e ortak katkıda bulunmak için bir araya geldi Yapay zekanın gelişimi güçlü bir darbe aldı.

Orijinal metni okumak ve konferans kaydının metin versiyonunu görmek için tıklayın

Fed faiz oranlarını artırmaya devam ediyor, Wall Street şimdi geri çekilebilir, fon yöneticileri: ABD hisse senetleri üçte iki düşebilir
önceki
Guizhou'nun özel koleksiyonundaki 20 küçük antik kasaba, Jiangnan Su Kasabasından daha boğucu ve ben ilk bakışta yaşamak istiyorum!
Sonraki
Hu Haiquan: Eğlence yok, internet yok, internet yok eğlence yok, internet öğrencisi çağında pan-eğlence düşüncesine dair beyaz makalem Özel ilk sürüm
Trumpchi GS5 arenaya geri döndü! İyi görünüme ve pratikliğe sahip bu SUV'leri seçin
"Kuru mallar" Appleın yapay zeka lideri Russ Salakhutdinovun son konuşması: Derin üretim modellerinin nicel değerlendirmesi (56 PPT)
Petrol fiyatının 4 yıl önce uçurumdan düştüğü sahne tekerrür edebilir, yabancı medya: petrodolar erken düşebilir
SWAT Kış Eğitimi Kış eğitimi için tam donanımlı Xinyu Kamu Güvenliği ...
Bu sonbahar birini bekle, el ele seyahat etmek için
Kedi ve köpeğin tanınma doğruluğu Kaggle Top% 2 ile savaşır ve size Keras'ta nasıl derin bir CNN oluşturacağınızı öğretir
2.0 güç 1.6 yakıt tüketimi! T'li bu SUV'lar başlamaya değer
Rusya'nın Çin'e uçakla nakit göndermesinin ardından, Rus buğdayı ihracatı artırabilir ve Rus çiftçiler daha fazla RMB almayı bekliyor
İnternet ünlülerinin en çirkin sahnesi: vatan güzel ama bazı insanlar buna layık değil
Tanrı'nın geri dönüşü Polis memuru, soğuk gecede atlayan adamı kurtardı, ancak karaya çıktıktan sonra onu kelepçeledi ...
Yol polisle karşılaştığında kaçtı.
To Top