NVIDIA "Binlerce Kişi Sürtüşme Projesi": Binlerce temsilci birbiriyle oynuyor ve parkur öğrenmeyi kolaylaştırıyor

Sürtünme kestanesi üretilen içbükey tapınak kübitinden gönderilir | genel numara QbitAI

Birbirinize sürtünmenin hızlı öğrenmeye yardımcı olduğunu duydum.

Simülatörde tek bir pekiştirme öğrenme ajanı varsa çok rahat yaşayabilir.

Gökyüzü büyüktür ve sanal robot takla atar, yuvarlak tekmeler ve benzerlerini yapar, bu nadir beceriler değildir, ancak sıkı eğitim gerektirir.

Peki, izin verirsen Binlerce Simülatörde birlikte çalışan insansı ajanlar ne olacak?

Birbirlerine sürtünecekler ve sevgiyle güreşecekler, güzel ve ayrılmaz bir resim oluşturacaklar.

Konu bu değil. Önemli olan, aracının sürtüşme sürecinde olmasıdır. Öğrenme becerileri, yalnızken olduğundan çok daha hızlı olacak .

Nvidia, öğrenmeyi hızlandırmak için bu yöntemi kullanmak istedi, bu yüzden kendi fizik simülatörünü geliştirdi.

Burada ajan, insan koşu duruşunu 20 dakikadan daha kısa sürede çözebilir. Ve tek bir CPU çekirdeği olduğu sürece, yüzlerce veya binlerce değil.

Birbirinize sürtünmek en güzeli

Nvidia Geliştirdi GPU hızlandırma Simülatör, aynı dünyada mutlu bir şekilde etkileşime giren binlerce insansı ajanı destekler.

Ve sürece Bir Tesla V100 GPU , Artı Bir CPU çekirdeği ,yeter.

Temsilcinin insan becerilerini daha iyi öğrenmesi için ekip Dört beceri Kıstas, kolaydan zora doğru belirlenir:

Birincisi, sadece iki bacak kullanarak, ancak bir karınca gibi koşmaktır (iyi insan becerileri dememek):

İkincisi, hala iki bacak kullanıyor, ancak bir insan gibi koşuyor:

Üçüncüsü, engelin koşmasıdır. Topla karşılaşıldığında, dengesiz olacaktır. Denge bul , Düşme:

Dördüncüsü de engel koşmaktır, ancak arazi karmaşıktır ve dengesiz olduğunuzda yine de dengeyi korumaya çalışmanız gerekir:

Karmaşık arazide eğitilen temsilciler, Adapte Kabiliyet.

Hatta Hiç görmedim Ortamda, birden fazla kişinin yüksek olduğu bir platformdan atlamak, hızla sağlam bir şekilde durabilir ve koşmaya devam edebilir.

Bunu gerçeğe dönüştür, şöyle görünür:

En fazla bin?

Şimdi öncekilerle karşılaştıralım zaman ile donanım maliyet:

Bir CPU çekirdeği bin değerinde mi?

GPU kutsamasından sonra simülatör Saniyede 60.000 kare oluşturabilir , Çerçeve Süresi 0,02 milisaniyenin altına düşürülebilir. Başka bir deyişle, çerçeve gecikmesi o kadar küçüktür ki neredeyse yok denecek kadar azdır.

Yani ajan sayısı 5'ten 5.000'e çıksa bile baskı olmayacak.

Sonuç olarak, yalnızca bir CPU çekirdeği kullanılsa bile öğrenme verimliliği garanti edilebilir.

Bu araştırma, Nvidianın fizik motoruna dayanmaktadır Esnek İçeride yapılır.

Yakında ekip olacak CoRL 2018 Konferansta araştırma sonuçları tanıtıldı.

Bundan önce herkes gazetenin tadını çıkarabilir:

Dağıtılmış Pekiştirmeli Öğrenme için GPU Hızlandırılmış Robotik Simülasyon

https://arxiv.org/pdf/1810.05762.pdf

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin.

Qubit QbitAI · Toutiao İmzalayan Yazar

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Ma Long, Taipei'de "kara atı" taradı, Wang Chuqin, Kenta Songping'i az farkla yendi, "iç savaş"
önceki
Bir bakışta şok oldum: Canları için para ödemeyen utanç verici insanların resimlerinden oluşan bir koleksiyon (410)
Sonraki
King of Glory büyük bir dalga oynadı! Tüm kahramanları ve görünümleri, ayrıca nakit ve baskısız görünümleri gönderin!
Milan'ın sezonun gol kralı bugün 20. yaş günü
ArXiv akran değerlendirmesi web sitesi oluşturuldu, akran değerlendirmesini daha güvenilir hale getirebilir mi?
Dota2: Çin ekibi ortadan kayboldu! EG 2: 0, LGD'yi süpürdü! Netizen: 20 final oyu çıktı
Çin Futbol Federasyonu yine mağlup oldu! Japon lise ligi oyuncuları doğrudan AFC takımı tarafından atanır
DOTA2: Kazanıyor! LGD2: 0FNC ilerleyen tek Çinli ekip oldu! Oyuncu: Devlet tamam
Bekarlar "ilk gösteri" izni! Wang Manyu 4-1 Japon parçalayıcı ikinci turda Liang Xiayin ile oynayacak
Dota2: Çin takımı yine LGD'de kaldı! Ehome 2: 0 elendi! Oyuncu: Hala çok genç
Apple Watch aslında eski bir şirket "makinesidir"
Oyun dünyasındaki en kötü adam! Çocukluğunuzdan beri ölümcül bir hastalıktan muzdarip, sadece sevdiğiniz biriyle tanıştığınızda yedek lastik olabilir misiniz?
Bir dizüstü bilgisayarla somatosensoriyel oyunlar oynayabilirsiniz! TensorFlow.js somatosensory dövüş öğreticisini gerçekleştirir
Zafer Kralı yine HATA mı? Oyuncu bu sefer kızgın değil: Tianmei kan alma tazminatı!
To Top