Birbirinize sürtünmenin hızlı öğrenmeye yardımcı olduğunu duydum.
Simülatörde tek bir pekiştirme öğrenme ajanı varsa çok rahat yaşayabilir.
Gökyüzü büyüktür ve sanal robot takla atar, yuvarlak tekmeler ve benzerlerini yapar, bu nadir beceriler değildir, ancak sıkı eğitim gerektirir.
Peki, izin verirsen Binlerce Simülatörde birlikte çalışan insansı ajanlar ne olacak?
Birbirlerine sürtünecekler ve sevgiyle güreşecekler, güzel ve ayrılmaz bir resim oluşturacaklar.
Konu bu değil. Önemli olan, aracının sürtüşme sürecinde olmasıdır. Öğrenme becerileri, yalnızken olduğundan çok daha hızlı olacak .
Nvidia, öğrenmeyi hızlandırmak için bu yöntemi kullanmak istedi, bu yüzden kendi fizik simülatörünü geliştirdi.
Burada ajan, insan koşu duruşunu 20 dakikadan daha kısa sürede çözebilir. Ve tek bir CPU çekirdeği olduğu sürece, yüzlerce veya binlerce değil.
Nvidia Geliştirdi GPU hızlandırma Simülatör, aynı dünyada mutlu bir şekilde etkileşime giren binlerce insansı ajanı destekler.
Ve sürece Bir Tesla V100 GPU , Artı Bir CPU çekirdeği ,yeter.
Temsilcinin insan becerilerini daha iyi öğrenmesi için ekip Dört beceri Kıstas, kolaydan zora doğru belirlenir:
Birincisi, sadece iki bacak kullanarak, ancak bir karınca gibi koşmaktır (iyi insan becerileri dememek):
İkincisi, hala iki bacak kullanıyor, ancak bir insan gibi koşuyor:
Üçüncüsü, engelin koşmasıdır. Topla karşılaşıldığında, dengesiz olacaktır. Denge bul , Düşme:
Dördüncüsü de engel koşmaktır, ancak arazi karmaşıktır ve dengesiz olduğunuzda yine de dengeyi korumaya çalışmanız gerekir:
Karmaşık arazide eğitilen temsilciler, Adapte Kabiliyet.
Hatta Hiç görmedim Ortamda, birden fazla kişinin yüksek olduğu bir platformdan atlamak, hızla sağlam bir şekilde durabilir ve koşmaya devam edebilir.
Bunu gerçeğe dönüştür, şöyle görünür:
Şimdi öncekilerle karşılaştıralım zaman ile donanım maliyet:
Bir CPU çekirdeği bin değerinde mi?
GPU kutsamasından sonra simülatör Saniyede 60.000 kare oluşturabilir , Çerçeve Süresi 0,02 milisaniyenin altına düşürülebilir. Başka bir deyişle, çerçeve gecikmesi o kadar küçüktür ki neredeyse yok denecek kadar azdır.
Yani ajan sayısı 5'ten 5.000'e çıksa bile baskı olmayacak.
Sonuç olarak, yalnızca bir CPU çekirdeği kullanılsa bile öğrenme verimliliği garanti edilebilir.
Bu araştırma, Nvidianın fizik motoruna dayanmaktadır Esnek İçeride yapılır.
Yakında ekip olacak CoRL 2018 Konferansta araştırma sonuçları tanıtıldı.
Bundan önce herkes gazetenin tadını çıkarabilir:
Dağıtılmış Pekiştirmeli Öğrenme için GPU Hızlandırılmış Robotik Simülasyon
https://arxiv.org/pdf/1810.05762.pdf
- Bitiş -
Samimi işe alım
Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin.
Qubit QbitAI · Toutiao İmzalayan Yazar
' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin