Etkisi SGD'den daha iyidir ve Google Brainin "Sinir Ağı Optimize Edici Araması" otomatik olarak daha iyi bir eğitim optimize ediciyi bulur.

Leifeng.com AI teknolojisi yorumu: Google Brain geçtiğimiz günlerde, sinir ağları için en iyisini (özellikle derin öğrenme) bulmak için pekiştirmeli öğrenmeyi kullanan "Takviye Öğrenmeli Sinir İyileştirici Arama" adlı bir makale yayınladı. En iyi optimizasyon algoritması / ağırlık güncelleme kuralı. Tez tekerleği yeniden üretmedi, ancak aynı zamanda iyi sonuçlar elde etti ve ayrıca belirli bir dikkat çekti. Leifeng.com AI Technology Review, makalenin içeriğini aşağıdaki gibi özetler.

Bir derin öğrenme modelini başarılı bir şekilde eğitmek için uygun bir optimizasyon yöntemi seçmek çok önemlidir. Stokastik Gradyan İniş (SGD) genellikle başlar başlamaz iyi sonuçlar verse de, Adam ve Adagrad gibi daha gelişmiş yöntemler, özellikle çok derin ağları eğitirken daha hızlı çalışabilir. Bununla birlikte, derin öğrenme için bir optimizasyon yöntemi tasarlamak çok zordur çünkü optimizasyon probleminin doğası dışbükey olmayan bir problemdir.

Bu makalede, Google Brain araştırmacıları, özellikle derin öğrenme mimarileri için optimizasyon yöntemlerinde ağırlık güncelleme kurallarını otomatik olarak tasarlayabilen bir şemayı tartıştılar. Bu çözümün odak noktası, optimize edici için ağırlık güncelleme denklemleri oluşturabilen bir RNN yapılı kontrolör kullanmaktır. Bu RNN yapısının denetleyicisi, pekiştirmeli öğrenme yoluyla eğitilir.Belirli bir ağ yapısı, aynı sayıda eğitim için ürettiği güncelleme kurallarını kullandıktan sonra, modelin doğruluğu maksimize edilebilir. Bu süreç aşağıda gösterilmiştir.

Sinir ağı optimize edici aramasının genel mimarisi

Sinir ağlarını eğitmek yavaş ve zordur.Çoğu insan daha önce çeşitli yöntemler geliştirmiştir. Yakın zamandaki optimizasyon yöntemleri, rastgele ve toplu yöntemlerin özelliklerini birleştirir.Örneğin, mini parti, SGD'ye benzer, ancak, Hessian içermeyen yönteme benzer olan ikinci dereceden köşegen bilgisini tahmin etmek için daha sezgisel yöntemler uygulanmıştır. ücretsiz) veya L-BFGS'ye benzer. İki yöntemin avantajlarını absorbe eden böyle bir çözüm, genellikle gerçek problemlerde daha hızlı bir yakınsama hızına sahiptir.Örneğin, Adam derin öğrenmede yaygın olarak kullanılan bir optimize edicidir ve gradyanın ortalama değerini ve değişim aralığını tahmin etmek için basit bir sezgisel yöntem uygular, böylece Egzersiz sırasında ağırlık daha stabil bir şekilde güncellenebilir.

Sinir ağlarındaki optimizasyon problemi dışbükey olmamasına rağmen, önceki birçok ağırlık güncelleme kuralı, dışbükey işlev analizinden fikir almıştır. Monoton olmayan öğrenme oranının sezgisel yöntemiyle elde edilen son deneysel sonuçlar, sinir ağlarının eğitimi hakkında hala çok az şey bildiğimizi ve eğitim sürecini iyileştirmek için kullanılabilecek birçok dışbükey olmayan optimizasyon yöntemi olduğunu göstermektedir.

Google Brain araştırmacılarının araştırma amacı, insanların zaten aşina olduğu alanlarda sinir ağı eğitimi için daha iyi güncellenmiş kurallar bulmaktır. Başka bir deyişle, kendi başlarına yeni bir dizi güncelleme kuralı oluşturmayı düşünmediler, ancak mevcut güncelleme kuralları arasında daha iyi olanları bulmak için makine öğrenimi algoritmalarını kullandılar. Son zamanlarda araştırmacılar, güncellenmiş değerler oluşturmak için model öğrenmeyi kullanarak benzer yöntemler önerdiler. Buradaki temel fark şudur: Google Brain tarafından yapılan bu araştırma, doğrudan sayısal değerler üretmek yerine ağırlık güncellemeleri için matematiksel formda denklemler üretmeyi amaçlamaktadır. Bir denklem oluşturmanın ana yararı, yeni optimizasyon problemleri için ek sinir ağlarını eğitmeye gerek kalmadan daha büyük görevlere kolayca taşınabilmesidir. Dahası, bu yöntemi tasarlama amaçları güncelleme kurallarının bellek kullanımını optimize etmek olmasa da Adam veya RMSProp'a eşdeğer güncelleme kurallarını alırken daha az bellek kullanabilirler.

Makaledeki yöntem, özellikle sinir ağı mimarisinin ayar metnini oluşturmak için bir RNN'nin kullanıldığı sinir ağı yapısının araştırılmasında, model keşfi için pekiştirmeli öğrenmenin kullanımı üzerine yapılan son araştırmalardan esinlenmiştir. Bu temel fikirlerin farklı uygulamalarda kullanılmasının yanı sıra, makaledeki yöntem, orijinal girdiyi çok daha esnek bir şekilde birleştirerek yeni tür optimize edicilerin aranmasını mümkün kılan yepyeni bir model de gösteriyor. .

Kontrolör RNN'nin genel yapısı. Kontrolör yinelemeli olarak uzunluk 5'in bir alt dizisini seçer. İlk olarak işlenenleri uygulamak için ilk iki işlenen ve iki tekli işlevi seçer ve ardından iki tekli işlevin çıktılarını birleştirmek için bir ikili işlev kullanır. Elde edilen sonuç b, bir sonraki tekerlek dizisi tarafından bir tahmin olarak seçilebilir veya bir güncelleme kuralı olabilir. Her tahmin bir softmax sınıflandırıcı tarafından gerçekleştirilir ve sonunda bir sonraki yinelemenin girdisi olur.

Makaledeki deneysel sonuçlara göre, küçük bir evrişimli ağı CIFAR-10 ile eğitirken, yöntemleri Adam, RMSProp, SGD'den Momentum ile veya Momentum olmadan çok daha iyi güncelleme kuralları buldu ve bunlar oluşturuldu. Güncellenen formüllerin çoğu kolayca yeni bir model mimarisine veya veri kümesine taşınabilir. Örneğin, küçük evrişimli ağların eğitiminde bulunan ağırlık güncelleme kuralları, Geniş ResNet eğitiminde Adam, RMSProp ve SGD'den Momentum ile veya Momentum olmadan daha iyi sonuçlar elde etti. ImageNet veri kümesi için, yeni bulunan güncelleme kuralları, en gelişmiş mobil cihaz seviyesi modellerinin ilk 1 ve ilk 5 doğruluğuna dayalı olarak% 0,4'e kadar iyileştirilmeye devam ediyor. Aynı güncelleme kuralları, Google'ın nöral makine çeviri sisteminde de iyi sonuçlar elde etti ve bu da WMT 2014 İngilizce'den Almanca'ya çeviri görevinde 0.7BLEU iyileştirme getirebilir.

Daha fazla ayrıntı için lütfen orijinal makaleye bakın: https://arxiv.org/abs/1709.07417. Lei Feng Network AI Teknolojisi İnceleme Derlemesi

2017 Audi A4L piyasada, Audi neden sık sık onu değiştiriyor?
önceki
[AET original] Onlar da katlanabilir ekranlı telefonlar, neden bu kadar farklılar?
Sonraki
Bir araba satın almanın en büyük yanlış anlaşılması, önce motora bakın?
Natalie Portman, 13 yaşında bir hayranın ilk mektubunun kendisine tecavüz ettiğini ortaya çıkardı.
"Liuzhou Juvenile 14 Gün Boyunca Yanlış Bir Şekilde Tutuklandı" Devam Ediyor: Karakol başkanı ve üç polis memuru uzaklaştırıldı
Baidu, 2018'de Çinli şirketlerin yapay zeka teknolojisi buluş patentleri arasında birinci sırada yer alıyor.
Tek bir makinede Mi 9'un üç lensi ne olacak?
Car Observer: Weilai EVE burada, sürücüsüzden ne kadar uzaktayız?
Donnie Yen, aksiyon komedi yaratmak için "Fat Dragon Crossing the River" ekibini Japonya'ya götürüyor
IROS 2017 burada! Leifeng.com ile en etkili robotik konferansını ziyaret edin | IROS 2017
Kaymazlığa dikkat edin! Yubei, Changshou, Bishan ve diğer birçok bölge ve ilçede yol buzlanma uyarı sinyali çalıyor
200.000 butik ortak girişim SUV modelini seçmek gerçekten zor
Çin'deki 2017 "İnternet + Lojistik" yeni iş formatını ortaya çıkarmak için şehirler arası nakliye, şehir içi lojistik ve anında teslimatı örnek alın
5 Serisi / A6L / Yeni E-Sınıfı / ATX-L Orta ve büyük lüks otomobiller için kriter kimdir
To Top