ICRA 2018 Su altı stabilitesini simüle etmek için takviye öğrenme, dalış gövdesi kuralları 15 dakika içinde öğrenir

Lei Feng Net Not: Lei Feng'in altyazı grubu tarafından derlenen ve size robotik ve otomasyon alanındaki en son araştırma sonuçlarını gösterecek olan ICRA 2018 serisi.

Orijinal başlık: Mikro Dalış Ajanı ile Derinlik Stabilizasyonunun Güçlendirilmiş Öğrenimi

Çeviri | Zhang Gehua Düzenlendi | Fan Jiang

Pekiştirmeli öğrenme, robotların çevre ile etkileşim içinde kontrol problemlerini çözmeleri için bir yöntemdir. Bu yazıda, bazı robotlar ve optik gömülü sistemler için uygun olan model değer işlevlerine dayalı bir takviye öğrenme yöntemi öğreneceğiz.

Başlangıçta, su altı stabilitesini simüle etmek için takviye öğrenme kullanan bir dalış gövdesi tasarladık. Küçük bir dalış bedeninin göreve yönelik öğrenme yeteneğini göstermek için deneyler de yaptık.Bu dalış bedenini, derinliği ve hızı ile belirlenen durumuna getirdik.

Dalış gövdesi sabit kapasiteli bir depolama tankı ve değişken kapasiteli bir depolama tankı içerir, ikincisi gövdeyi sürmek için kullanılır.

Derinliğinin stabilitesi için amacımız, istenen derinliği korumak için değişken su depolama kapasitesini kontrol etmektir. Bu kontrol problemini çözmek için, sistem hakkında önceden bilgi sahibi olmadan veya sürücü gücü bilgisi olmadan pekiştirmeli öğrenme yöntemleri kullanılır. Bu yaklaşımın zorluğu, bilinmeyen sıvı etkileri ve yavaş, doğrusal olmayan bir şekilde değişen tahrik dinamiklerinde yatmaktadır. Hacim ayarının zaman sabiti sistemin gücü ile eşleşir Değişken kapasiteli depolama tankı da sabit kapasiteli depolama tankına kıyasla çok küçük olduğundan sistemin maksimum kontrol kuvveti ve maksimum bağlama kuvveti de çok küçüktür.

Durum uzayı dalış yapan cismin derinliğini ve hızını içerir. Bu çizelge durum uzayını gösterir.Hedef derinliğe yakın alan algoritmanın öğrendiği alanı belirler.Bu dağılım 101 durum içerir. Bu alanın dışındaki her nokta bir uç durum olarak kabul edilir.

Hareket alanı iki kısımdan oluşur: bir kısım değişken depolama tankının su hacmini azaltarak kaldırma kuvvetini sağlamak, diğer kısım değişken depolama tankının su hacmini arttırarak dalış gövdesi algoritmasının kayıp almasını sağlamaktır.Bu kayıp dalış bedenini cezalandıracak ve istenilen hale getirecektir. Derinlemesine hareket edin. Ek olarak, dalış gövdesi son duruma ulaşırsa, takviye öğrenme algoritmasını deneylerle doğrulamak için küçük bir dalış gövdesi tasarlanır ve üretilir. Çalışma süresi yaklaşık 90 dakikadır ve uçucu olmayan bellek 512 KB'dir.

Bir deneyde dalış yapan cismin kendi kararlılığı ile ilgili kuralları sıfırdan öğrenebileceğini kanıtladık. Sol alt köşedeki grafik, dalış vücudunun öğrenme alanındaki başarılı yörüngesini gösterir.

Video bağlantısı: https://www.youtube.com/watch?v=F7g3K0PXWX4t=5s

Lei Feng Ağı Lei Feng Ağı

Her Şeyin İnterneti! IoT akıllı donanımının geliştirme trendi
önceki
Zaobao: Xiaomi Yeni Yasak Şehir Ürünlerini Yeniden Yayınladı / JD Cep Telefonu Genişletmesi
Sonraki
Tavan penceresi korunmalı mı? Evet ve çok! ağırlık! istemek!
İşbirliği için yalvaran bir güneş gözlüğü markası var, ama yanlışlıkla bundan etkilendi mi? !
Katlanır ekran ve tam ekran çarpışmak üzere: 16 Ocak'ta ZTE ve Sharp rekabet edecek!
Glory, yedi konumlandırma ve sesli aramayı destekleyen yeni çocuk akıllı saati K2'yi piyasaya sürdü
"Aquaman" Çin galasının yaratıcısı "en güçlü koi" ye dönüştü, Wen Ziren süper İngiliz çılgınlığını yeniden başlattı
Samsung gerçekten cömert: Galaxy S8 standart olarak AKG kulaklıklarla gelecek
Yeni nesil CR-V denizaşırı 7 koltuklu versiyonu piyasaya sürdü veya Çin'e tanıtılacak
Alibaba'nın bölge müdürüydü ve bir iş kurmak için istifa ettiğinde yalancı olarak görülüyordu ve şimdi Time Magazine'de yer alıyor!
Kızlara özel tam el Air nihayet raflarda mı? Saniyeler içinde satılmanın ritmi!
Bin yuan, paranın karşılığını alabileceğiniz mallar da satın alabilir, bunları yıl sonunda makineyi değiştirdiğinizde seçebilirsiniz.
"Orta sınıf" ın ilk süiti! Xiaomi Real Estate geliyor
"Yenilmez Yıkım Kral 2", "Çılgın Şehir" in orijinal ekibi tarafından yaratılan, İnternet ile yenilikçi bir şekilde oynuyor
To Top