Takviye yeni yöntem öğreniyor, geriye takla döndürme vuruşunun robot için artık zor olmamasına izin verin | Berkeley kağıdı

İçbükey tapınaktan Xia Yi

Qubit Üretildi | Genel Hesap QbitAI

Boston Dynamics insansı robotunun ters takla becerisi ortaya çıktığında, küresel kalabalığı hayrete düşürdü.

Gerçek dünyadaki robotlardan bahsetmiyorum bile, bu tür karmaşık eylemlerin simülatörde bile öğrenilmesi çok zor.

Şimdi, yakın zamanda Kaliforniya Üniversitesi, Berkeley ve British Columbia Üniversitesi tarafından geliştirilen yeni bir yöntem, simülatörlerde yaşayan robotlara, insanları taklit ederek dövüş sanatları, parkur, akrobasi ve diğer karmaşık becerileri öğrenmeyi öğretebilir.

Ters takla vuruşu veya başka bir şey, onu elde etmek kolaydır ~

(Temelde simülatörlerde yaşayanlar olan "robotlardan" aşağıda birçok kez bahsedilecektir)

Robotların, animasyonların ve oyun karakterlerinin esnek ve sorunsuz hareket etmesine izin vermek, bilgisayar grafikleri, pekiştirmeli öğrenme, robotik vb. Alanlarda araştırmacılar tarafından takip edilen bir hedeftir.

Farklı yöntemlerin kendi güçlü yönleri vardır ve elbette her birinin kendi zayıf yönleri vardır.

Robotlara (simülatördeki aracı) öğretmek için pekiştirmeli öğrenme yöntemlerini kullanarak öğrenilebilecek birçok eylem vardır ve bunlar titiz bir ayrıntı ve cesaretle çalıştırılabilir.Ayrıca robot için net bir amaç belirleyebilirsiniz. Ancak, biraz utanç veya sürpriz oyun sahnelemek her zaman kaçınılmazdır.

Hareket yakalama teknolojisi, robotun herhangi bir itaatsizlik duygusu olmadan doğal ve sorunsuz bir şekilde gerçek insanlarla tamamen aynı olan hareketler yapmasını sağlar. Ancak öğrenmeyi ve kullanmayı beklemek imkansızdır, robotun her hareketinin ve her formunun ayrı ayrı eğitilmesi gerekir.

Berkeley'deki bilim adamları, DeepMimic adlı yeni bir yöntem oluşturmak için bu iki alandan yararlandı. Bu yöntem yalnızca derin öğrenme modellerinin çok yönlülüğüne sahip olmakla kalmaz, aynı zamanda daha fazla eylem türünü ve robot formunu kapsayabilir ve eylemlerin doğal düzgünlüğü de hareket yakalama ile karşılaştırılabilir.

Bu yeni yöntemle, Robotlar yeni eylemleri nasıl öğrenir?

Basitçe söylemek gerekirse, eylem kliplerini izleyerek öğrenmektir. İnsan hareket yakalama verileri iyi bir öğrenme materyalidir. Robota, aşağıdaki şekilde yan çevirme gibi bir eylem örneği gösterin Sağ taraf, robotun öğrenmesi için bir gösteri örneğidir.

Bu araştırmaya katılan bilim adamları, gösteri eylemini q ^ 0, q ^ 1, ..., q ^ T dizisine ayırdılar; burada q ^ T, t adımındaki robotun hedef eylemini temsil ediyor. Bu robotun öğrenmesinin amacı, t zamanındaki gerçek hareket qT ile hedef hareket q ^ T arasındaki boşluğu olabildiğince ortadan kaldırmaktır.

Robot, eylemleri artık utanmayana kadar özenle pratik yapmaya ve pratik yapmaya devam ediyor ve yukarıdaki resmin sol tarafında gösterildiği gibi esnekliği ve simülasyonu demo videosuyla karşılaştırılabilir.

Bu uygulama sürecine rehberlik eden kişi şudur: Ödül işlevi :

Bu şekilde öğretilen robotlar takla atmalarının yanı sıra Çin ve Batı danslarını, güney yumruğu ve kuzey bacaklarını, koşma ve dövüş hareketlerini ve hatta sazan dövüşlerini de öğrenebilir:

Mükemmel hareket yakalama örneğini tekrar kopyalamanın ne anlamı var? Elbette bu araştırma taklitin ötesine geçiyor. DeepMimic, robotun taklit yoluyla hareket etmeyi öğrenmesine ve ardından öğrendikçe kullan ayağa kalk.

Örneğin, bir robot bir top atmayı öğrendiğinde, demo örneğinde olmayan bir görevi gerçekleştirebilir. Simülatörde oy vermesi için bir hedef belirleyebiliriz:

Eğitimli robot ayrıca Demo örneğinden farklı görünüyor . Örneğin, önden ters takla örneğini kullanarak, Boston Dynamics Altas'ı simüle eden bir robotu eğitebilirsiniz:

İnsansı olmayan robotlar bile insansı örneklerle eğitilebilir. Örneğin, bu Tyrannosaurus rex insansı örneklerle yürümeyi öğreniyor. Gazetenin ana sayfasında aslanlar ve ejderhalar da dahil olmak üzere daha fazla örnek gösterdiler ~

DeepMimic hakkında daha fazla bilgi edinmek için lütfen şu makaleye bakın:

DeepMimic: Fizik Tabanlı Karakter Becerilerinin Örnek Kılavuzlu Derin Güçlendirmeli Öğrenimi

Yazar: Xue Bin Peng, Pieter Abbeel, Sergey Levine, Michiel van de Panne

Ana Sayfa: https://xbpeng.github.io/projects/DeepMimic/index.html

Blog tanıtımı:

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin.

Qubit QbitAI · Toutiao İmzalama Yazarı

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Haval H6 haziran ayında 80.000 adet sattı, zaten çok etkileyici olmasına rağmen önünde garip görünüyor!
önceki
Tek maçta Real Madrid ve Barcelona'yı iki kez kıran Japon oyuncu, yeni sezonda La Liga'ya katılacak.
Sonraki
Otomobillerin% 90'ı görünüşe göre saniyeler içinde öldürebilir, ancak tüketiciler kalıcı bir sorun nedeniyle ödeme yapmak istemiyor
"İki kral ve bir at" aşık olup birbirlerini öldürür ve "Kelong Çağı" başlar! Geçmiş doğrudan modelin envanterini çıkarın
World of Warcraft'ın en takdire şayan oyuncusu, sayısız oyuncu onu alkışlıyor! Blizzard bile ona Paskalya yumurtası yapar
İniş fiyatı, Audi A6 kadar büyük olan 200.000 yuan'dan az ve arabada oturarak ikna oldum!
Yaralanma bitti, top gitti mi? Ulusal masa tenisi oyuncuları neden "küçük yaralanmalar" ve "ciddi yaralanmalar" ile çizgiden çıkmak konusunda isteksiz?
World of Warcraft Dünya Çağında 5 harika şey! İlk etkinliğe katılan oyuncuların tamamı Blizzard tarafından yasaklandı
yorgun! Mancini, 16.000 kilometrelik ilk turda Rusya Süper Ligi'nde antrenörlük yapıyor ve hala jet lag'a ihtiyaç duyuyor
Çift egzozlu BMW X6'nın sadece bir yan egzozu var BMW'nin bile sahte bir çift olduğu doğru mu?
Zuckerberg'in 5 saatlik duruşması: Beş çekirdek, her yerde utanç verici, dürüst CEO güldü ve seyirciyi çevirdi
En güçlüsü en güçlüler arasından seçilir Ulusal masa tenisinin şu anki tek teknik kralı kimdir? -Ping Pong Dünyası
Pozitif oran% 90 kadar yüksek, bu oyun "Double Point Hospital" ile karşılaştırılabilir ve Steam özel teklifi 72 yuan!
Arabanın logosu Bentley'den daha büyük olan "B" harfi. BYD onu taklit etmek istedi ama utanç vericiydi!
To Top