Leifeng.com'a göre, Berkeley Üniversitesi Yapay Zeka Laboratuvarı (BAIR) kısa süre önce Arxiv'de "Meta-Öğrenme Yoluyla Tek Atışlı Görsel Taklit Öğrenme" adlı bir makale yayınladı. Bu makale, mevcut AI araştırmasının iki darboğazını, yani meta öğrenmeyi birleştiriyor. Meta-Öğrenme ve Tek seferde öğrenmenin kombinasyonu CORL (Robot Öğrenme Konferansı, 2017) tarafından kabul edildi. CORL 2017, bu yıl Kasım ayında Mountain View, Kaliforniya, ABD'de yapılacak.
Hepimiz derin öğrenmenin büyük veri bağlamında popüler olduğunu biliyoruz.Geleneksel gradyan tabanlı derin sinir ağları öğrenmek için çok fazla veriye ihtiyaç duyar ve derin öğrenme içeriğinin çoğu büyük miktarda veri altında kapsamlı yinelemeli eğitime dayanmaz. Yeni bilgilerle karşılaşıldığında, model genellikle başarısız olur ve yeniden öğrenmeyi gerektirir. Robotik alanında, derin sinir ağları robotlar için karmaşık beceriler gösterebilir, ancak pratik uygulamalarda, ortam değiştiğinde, becerileri sıfırdan öğrenmek mümkün değildir. Bu nedenle, makinenin "bir kerede öğrenmesine", yani bir gösteriyi "izledikten" sonra, yeni ortamı önceden bilmek gerekli değildir.Farklı ortamlarda işi tekrarlayabilmek özellikle önemlidir.
Araştırmalar, Nöral Turing Makineleri (NTM'ler) gibi gelişmiş bellek yeteneklerine sahip mimarilerin yeni bilgileri hızla kodlayıp görüntüleyebildiğini ve böylece geleneksel modellerin eksikliklerini ortadan kaldırdığını buldu. Bu makalede yazar, robotların bir gösteriden sonra yeni beceriler öğrenebilmeleri için daha etkili bir şekilde nasıl öğreneceklerini öğrenmelerini sağlayan bir Meta-Taklit Öğrenme (MIL) algoritmasını tanıtmaktadır. Önceki tek öğrenme simülasyon yönteminden farklı olarak, bu yöntem orijinal piksel girdisine genişletilebilir ve yeni beceriler öğrenmek için gereken eğitim verileri önemli ölçüde azaltılır. Simülasyon platformu ve gerçek robot platformundaki deneyler de bunu göstermektedir.
Amaç: Robota, gösteriyi yalnızca bir kez "gördükten" sonra yeni nesnelerle etkileşimi öğrenme yeteneği kazandırmak.
uygulama:
Çok sayıda görevin demolarını toplayın;
Eğitim için meta-simülasyon öğrenimini kullanın;
Bilinmeyen yeni görevlerde test edin.
İnovasyon içeriği: İlk tamamen bağlantılı katmandaki sapma dönüşümü yoluyla gradyan performansını artırın.
Simülasyon test bağlantısında, bu bağlantı algoritma tarafından sağlanan sanal 3B nesneleri simüle etmek için kullanır.MİL, görevi Contexual ve LSTM'den daha iyi gerçekleştirir.
Gerçek sahne testinde ekip, öğeleri kapmak ve belirlenen kaplara koymak için bir görev tasarladı. Yukarıdaki şekilden, bu bağlantıdaki eğitim için kullanılan öğeler ile gerçekte test edilen öğeler arasında şekil, boyut ve doku açısından farklılıklar olduğunu görebiliriz.Mil algoritması da görevi iyi bir şekilde yerine getirir.
Leifeng.com, BAIR, Google Deepmind'e ek olarak (Leifeng.comun "Yalnızca nesneleri tanımlamak için yalnızca eğitim verileri, Google'ın yeni AI algoritması" tek öğrenme ") makalesine ek olarak, OpenAI'nin" tek seferlik öğrenme "üzerine de araştırma yaptığını tespit etti. . "Tek seferde öğrenme", genellikle bir veya yalnızca birkaç eğitim görüntüsünden nesne kategorileri hakkında bilgi edinmeyi amaçlayan ve bilgisayarla görü ve ilaç geliştirmeye başarıyla uygulanan bilgisayarla görmede nesne sınıflandırma problemi olarak kabul edilir. Yüksek boyutlu verilere sahip alanlar. Bu yılın Mayıs ayında, OpenAI, sanal bir ortamda tek seferlik öğrenme yoluyla küplerin istiflenmesi gibi görevleri tamamlayan benzer bir makale yayınladı.
Darwin, "İnsanlığın Kökeni" nde şöyle yazdı: "İnsanlar ve diğer yüksek hayvanlar arasındaki ruhsal fark çok büyük olsa da, bu fark kesinlikle sadece derece farkıdır, tür farkı değil." Öğrenme ve meta-öğrenme üzerine yapılan araştırmalar, gelecekteki dünyadaki mevcut yapay zeka ile süper yapay zeka arasındaki farkın, türdeki bir fark değil, yalnızca derece farkı olabileceğini de kanıtlıyor. Derin öğrenme geliştirme sürecinde, benzer optimizasyon sadece küçük bir adım gibi görünmektedir, ancak hızlandırılmış geliştirme eğilimi zaten açıktır: geleneksel bir dergide bir makale okurken, Arxiv'de yeni bir alternatif sürüm ortaya çıkmış olabilir. . Belki yakın gelecekte daha akıllı, uyarlanabilir ve pratik robotlar yaratmak zor olmayacak.
Kağıt adresi: https://arxiv.org/pdf/1709.04905.pdf
Video gösterimi ve daha ayrıntılı talimatlar: https://sites.google.com/view/one-shot-imitation