BAIR belgesi: Robotların yeni becerilerde hızla ustalaşmasını sağlamak için "meta-öğrenme" ve "tek seferlik öğrenme" algoritmalarını kullanma

Leifeng.com'a göre, Berkeley Üniversitesi Yapay Zeka Laboratuvarı (BAIR) kısa süre önce Arxiv'de "Meta-Öğrenme Yoluyla Tek Atışlı Görsel Taklit Öğrenme" adlı bir makale yayınladı. Bu makale, mevcut AI araştırmasının iki darboğazını, yani meta öğrenmeyi birleştiriyor. Meta-Öğrenme ve Tek seferde öğrenmenin kombinasyonu CORL (Robot Öğrenme Konferansı, 2017) tarafından kabul edildi. CORL 2017, bu yıl Kasım ayında Mountain View, Kaliforniya, ABD'de yapılacak.

Hepimiz derin öğrenmenin büyük veri bağlamında popüler olduğunu biliyoruz.Geleneksel gradyan tabanlı derin sinir ağları öğrenmek için çok fazla veriye ihtiyaç duyar ve derin öğrenme içeriğinin çoğu büyük miktarda veri altında kapsamlı yinelemeli eğitime dayanmaz. Yeni bilgilerle karşılaşıldığında, model genellikle başarısız olur ve yeniden öğrenmeyi gerektirir. Robotik alanında, derin sinir ağları robotlar için karmaşık beceriler gösterebilir, ancak pratik uygulamalarda, ortam değiştiğinde, becerileri sıfırdan öğrenmek mümkün değildir. Bu nedenle, makinenin "bir kerede öğrenmesine", yani bir gösteriyi "izledikten" sonra, yeni ortamı önceden bilmek gerekli değildir.Farklı ortamlarda işi tekrarlayabilmek özellikle önemlidir.

Araştırmalar, Nöral Turing Makineleri (NTM'ler) gibi gelişmiş bellek yeteneklerine sahip mimarilerin yeni bilgileri hızla kodlayıp görüntüleyebildiğini ve böylece geleneksel modellerin eksikliklerini ortadan kaldırdığını buldu. Bu makalede yazar, robotların bir gösteriden sonra yeni beceriler öğrenebilmeleri için daha etkili bir şekilde nasıl öğreneceklerini öğrenmelerini sağlayan bir Meta-Taklit Öğrenme (MIL) algoritmasını tanıtmaktadır. Önceki tek öğrenme simülasyon yönteminden farklı olarak, bu yöntem orijinal piksel girdisine genişletilebilir ve yeni beceriler öğrenmek için gereken eğitim verileri önemli ölçüde azaltılır. Simülasyon platformu ve gerçek robot platformundaki deneyler de bunu göstermektedir.

Amaç: Robota, gösteriyi yalnızca bir kez "gördükten" sonra yeni nesnelerle etkileşimi öğrenme yeteneği kazandırmak.

uygulama:

  • Çok sayıda görevin demolarını toplayın;

  • Eğitim için meta-simülasyon öğrenimini kullanın;

  • Bilinmeyen yeni görevlerde test edin.

İnovasyon içeriği: İlk tamamen bağlantılı katmandaki sapma dönüşümü yoluyla gradyan performansını artırın.

Simülasyon test bağlantısında, bu bağlantı algoritma tarafından sağlanan sanal 3B nesneleri simüle etmek için kullanır.MİL, görevi Contexual ve LSTM'den daha iyi gerçekleştirir.

Gerçek sahne testinde ekip, öğeleri kapmak ve belirlenen kaplara koymak için bir görev tasarladı. Yukarıdaki şekilden, bu bağlantıdaki eğitim için kullanılan öğeler ile gerçekte test edilen öğeler arasında şekil, boyut ve doku açısından farklılıklar olduğunu görebiliriz.Mil algoritması da görevi iyi bir şekilde yerine getirir.

Leifeng.com, BAIR, Google Deepmind'e ek olarak (Leifeng.comun "Yalnızca nesneleri tanımlamak için yalnızca eğitim verileri, Google'ın yeni AI algoritması" tek öğrenme ") makalesine ek olarak, OpenAI'nin" tek seferlik öğrenme "üzerine de araştırma yaptığını tespit etti. . "Tek seferde öğrenme", genellikle bir veya yalnızca birkaç eğitim görüntüsünden nesne kategorileri hakkında bilgi edinmeyi amaçlayan ve bilgisayarla görü ve ilaç geliştirmeye başarıyla uygulanan bilgisayarla görmede nesne sınıflandırma problemi olarak kabul edilir. Yüksek boyutlu verilere sahip alanlar. Bu yılın Mayıs ayında, OpenAI, sanal bir ortamda tek seferlik öğrenme yoluyla küplerin istiflenmesi gibi görevleri tamamlayan benzer bir makale yayınladı.

Darwin, "İnsanlığın Kökeni" nde şöyle yazdı: "İnsanlar ve diğer yüksek hayvanlar arasındaki ruhsal fark çok büyük olsa da, bu fark kesinlikle sadece derece farkıdır, tür farkı değil." Öğrenme ve meta-öğrenme üzerine yapılan araştırmalar, gelecekteki dünyadaki mevcut yapay zeka ile süper yapay zeka arasındaki farkın, türdeki bir fark değil, yalnızca derece farkı olabileceğini de kanıtlıyor. Derin öğrenme geliştirme sürecinde, benzer optimizasyon sadece küçük bir adım gibi görünmektedir, ancak hızlandırılmış geliştirme eğilimi zaten açıktır: geleneksel bir dergide bir makale okurken, Arxiv'de yeni bir alternatif sürüm ortaya çıkmış olabilir. . Belki yakın gelecekte daha akıllı, uyarlanabilir ve pratik robotlar yaratmak zor olmayacak.

Kağıt adresi: https://arxiv.org/pdf/1709.04905.pdf

Video gösterimi ve daha ayrıntılı talimatlar: https://sites.google.com/view/one-shot-imitation

dikkatli ol! Chongqing Trafik Devriye Polisi, potansiyel trafik güvenliği tehlikelerine sahip 227 yol bölümünü açıkladı
önceki
"The True Colors of Heroes 2018" nihai fragmanı yayınladı, Wang Kai kardeşleri tarafından geri çevrildi
Sonraki
Kim kürek çekiyor? PC "Monster Hunter World", takım arkadaşı DPS MOD'u başlattı
5G tren istasyonuna gidin ve 5G hayatının geleceğini yaşayın
Çok dürüst! Harvard Pazarlama Genişlemesi: Sınırlı bir süre için 1 milyar kırmızı zarf
"Dedektif Chinatown 2" özel ifşa edildi, Wang Baoqiang, Liu Haoran ve Xiao Yang, 10 doğaüstü dedektif işe aldı
Katlanır ekranlı cep telefonları sıkça piyasaya sürülüyor, OLED teknolojisi olgun bir aşamaya girdi, BOE bu trendden yararlanıyor
Wulingyuan Kamu Güvenliği: Kahramanlar için Qingming Anma Töreni, Sadakat Polisin Ruhunu Attı
CNN'deki garip evrişim yöntemlerinin büyük bir özeti
Mutlu Yıllar, yabancı öğrencilerin ana dillerinde Yeni Yılı kutlamalarını izleyin
"Moving Maze 3: The Panzote to Death" ağızdan ağza yasağı kaldırıldı ve "en iyi dizi" olarak övüldü
"Blog Sonrası Seçimi" PCB devre kartı bakır folyo hakkında temel bilgiler
150.000 yuan bütçeyle küçük bir SUV veya kompakt bir sedan mı satın alacaksınız?
Taksi çevrimiçi araç çağırma seyahati anketi: Kullanıcıların% 80'inden fazlası sürüş kolaylığı ve güvenliği konusunda endişeli
To Top