g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

OpenAI, 50 saatte insan eliyle yüz yıllık eğitimi simüle edebilen bir robotik kol yarattı

Elon Musk tarafından kurulan kar amacı gütmeyen bir yapay zeka organizasyonu olan OpenAI, bugün bize yeni bir araştırma sonucu gösterdi: robotların insan eli gibi nesneleri kavramasına ve manipüle etmesine olanak tanıyor. Bu kadar çok simüle edilmiş avuç içi görmemize rağmen, mekanik yapının "parmakları" gerçek bir insan eli kadar esnek hale getirmesi basit bir mesele değildir.

Ancak aşağıdaki animasyonda da görebileceğiniz gibi, Dactyl adlı bu manipülatör sistemi, küpü talimatlara göre döndürme işlemini kolaylıkla tamamlayabilir ve çeşitli becerilerle bu tür parmak ucu işlemlerinin geçmişte bizimkinden açıkça daha iyi olduğu açıktır. Robotun yürümesi ve zıplaması çok daha karmaşıktır.

Dactyl'in böylesine verimli bir operasyon gerçekleştirme yeteneği, Open AI tarafından kullanılan takviye öğrenme algoritması ile ilgilidir. Tıpkı yeni doğmuş bir çocuk gibi, yapay zeka veya robotlar inşa edildikten hemen sonra hiçbir şeyi anlamaz. Karmaşık bir görevin akışını tam olarak anlamasını istiyorsanız, tekrarlanan eğitimlerden geçmelisiniz.

Özellikle gerçek fiziksel robotlar için, araştırmacılar genellikle onlara talimat vermek için çok fazla gerçek dünya zamanı harcarlar.

Ancak OpenAI'nin şu anki uygulaması, AI robotlarını tamamen sanal bir ortamda eğitmek ve ardından AI'yı fiziksel robotlara uygulamaktır. Ayrıca, eğitim süreci boyunca çok sayıda dinamik rastgele olay ekleyerek, AI'nın görevi tamamlamak için hileyi anlamasını sağlar.

Örnek olarak bu manipülatör avucunu ele alalım: Önce robotik kola talimatlara göre altı kenarlı küpte doğru rengi çevirmeyi öğretecekler; daha sonra çevredeki ışık ve gürültüyü, ayrıca küpün rengini, ağırlığını, dokusunu ve dokusunu değiştirmeye başlayacaklar. Sürtünme vb; eğitim sırasında yerçekimi ortam faktörlerini bile değiştirir.

Bu rastgele değişkenlerin eklenmesinin nedeni aynı zamanda yapay zekanın çeşitli beklenmedik durumlarla daha iyi başa çıkmasına izin vermektir: "Örneğin, farklı yerçekimi ortamlarında, Dactyl bunun küp manipülasyonunu nasıl etkilediğini anlayacaktır. Aksi takdirde, gerçek dünyada, kolun yüksekliğini değiştirdiğimizde ve yerçekimi ortamı değiştiğinde, küp elden kayabilir. "

Ek olarak, insan davranışını taklit etmeye gerek olmadığından, OpenAI'nin eğitim yöntemi, yapay zekanın insanların düşünmediği yolları tam olarak düşünmesine ve belki de beklenmedik sonuçlar elde etmesine izin verebilir.

Bu sanal ortam eğitim modunun bir başka avantajı da gerçek dünya saatini tüketmemesidir. Şu anda, Dactyl yaklaşık 100 yıllık eğitim deneyimi biriktirdi ve küpün dönüşünü kontrol etmek için sayısız yol denedi, ancak gerçekte bu süreç gerçek dünyamızda yalnızca 50 saate eşdeğerdir.

AI, sanal dünyadaki eğitimi tamamladıktan sonra, gerçek dünyadaki dinamik faktörleri analiz etmek için bu deneyimleri uygulayabilir ve görevi tamamlamak için davranışını ayarlayabilir. Artık Dactyl, 50 ardışık küp döndürme işlemini hatasız tamamlayabilir.

Bu süper verimli eğitim modunun yalnızca fiziksel robotlarda değil, diğer sanal AI modellerinde de kullanılabileceğini belirtmekte fayda var. Geçen yıl temmuz ayında OpenAI tarafından geliştirilen OpenAI Five, sanal dünyada da on binlerce saat öğrenme deneyimi yaşadı, aslında sadece birkaç gün sürdü ve ardından Dota2 oyununda profesyonel oyuncu Dendi'yi yendi.

5v5 değil, sadece tek başına bir düello olsa da, aynı zamanda DeepMind tarafından derin takviye öğrenimi kullanılarak eğitilmiş bir AI olan, tanınmış "Go killer" AlphaGo da dahil olmak üzere, e-sporun karmaşık alanında yapay zekanın etkinliğini görmemizi sağlıyor. model.

Pekiştirmeli öğrenmenin ilham kaynağının ilk olarak insanların doğadaki hayvanların öğrenme sürecini uzun süreli gözlemlemelerinden geldiği söyleniyor.Son yıllarda yeni denemeye başlamalarının nedeni de sinir ağı teknolojisindeki ilerlemeden ve OpenAI'nin ölçek avantajından kaynaklanıyor. Pekiştirmeli öğrenmenin kriterleri daha çeşitli ve karmaşık hale geldiğinde, doğal olarak çok fazla hesaplama maliyeti ödemeleri gerekecektir.

OpenAI tarafından verilen verilere göre, Dactyl'in eğitim ekipmanı yaklaşık 6144 CPU ve Nvidia'dan 8 V100 GPU kullanıyor, sadece birkaç araştırma kurumu bu ölçekte temel donanımı kullanabiliyor.

Genel olarak, OpenAI tarafından önerilen "simüle edilmiş ortamın sonuçlarının gerçek dünyaya uygulanması", genel amaçlı robotların geliştirilmesi için etkili çözümlerden biri olacaktır, ancak bazı robotik uzmanları bu seviyenin deneysel sonuçlarının yalnızca belirli bir görevle sınırlı olacağına inanmaktadır. Gerçek dünya sorunlarını gerçekten çözüp çözemeyeceği hala bilinmemektedir.

Başlık görselinin kaynağı: OpenAI

"Pokemon" daki en popüler beş birinci seviye tanrı en popüler olanı değil mi?

Yeni "Yeni Beyaz Yılan Efsanesi" afişi

: "Pokemon" Resimli Kitap 026: My Lei Qiu Mingming de çok tatlı! Pikachu nedir?

: Rockets'a arka arkaya 4 galibiyet, Hugh City 1 özellik dönüşümü en güçlü Warriors'a yaklaşırken yardımcı olmak için kilit 5 puanı güçlendirin

: Performans iyi. "Battlefield 1" PS4 sürümü ve XB 1 sürüm karşılaştırma demosu

: Red Dead Redemption 2'nin haritası harika! Yeni bir açık dünya oyun deneyimi

: Baidu ve Changlong, WeChat'in kapısında akıllı bir uygulama yaptı. Bu o kadar "basit" değil

: Bir fitness topuyla diz çökün ve yelek hattınızı canlandırmak için belinizi çevirin

: "Pokemon" kurbağaları da gezebilir! Pokémon'da kurbağa envanteri

: Riley takımını kurmak için 430 milyon yatırım yaptı Wade nihai bulmaca mı? 1 puan ya da Flash'ın 40 milyon almasına izin verin

: Sichuan: 2020'de yoksulluğu azaltmaya yardımcı olacak 30 milyar yeni mali fon

: "Xie Yun Chuan", savaş gösterisini ortaya koyuyor: grev kesin ve tutarlı, ancak yine de iyileştirilmesi gerekiyor

: Nobuo Uematsu bir röportajda şunları söyledi: "FF7: Yeniden Yapım" süresiz olabilir

: Belinizde kilo vermek için belinizi egzersiz topu üzerinde çevirin

g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

OpenAI, 50 saatte insan eliyle yüz yıllık eğitimi simüle edebilen bir robotik kol yarattı

İlgili bilgi

Paul'ün "tek çeyrek biyolojik saati" Rockets çift sigortası oldu, 77 dakika ve 2 oyuncu kaosun kralı oldu

Honor Note 10 piyasaya çıktı: 2799 yuan'dan başlayan "korkutma teknolojisi" ile donatılmış

Rockets 63 puan kazanmak için kurt sürüsünü taradı, Harden öldürmek için 7 puan, "Gül Katili" 1 puan çok yavaş

"Assassin's Creed: Odyssey" hata koleksiyonu, her türden garip böcek çok komik!

Qualcomm, 2 × 2'den ağ Wi-Fi ağına kadar, Wi-Fi'nin geleceğinin sadece daha hızlı olmadığını söylüyor

"Pokemon" Resimli Kitap 027: Pangolin ne dedi?

Paul tarihte dördüncü adam olarak rekor kırdı ve gizli bir katil, Kral Harden'den sonra ikinci sırada yer aldı.

"Date A Live" ın üçüncü sezonu Ocak 2019'da başlayacak, Çin ve Japonya senkronize olabilir

"Film mali yönetimi" günlük gelir? Arkasında P2P'den daha çılgın bir yatırım tuzağı var

Unutulmak üzere olan bu 11 eski cadde, ilkinde gözyaşları var ... Kaç yere gittiniz?