Elon Musk tarafından kurulan kar amacı gütmeyen bir yapay zeka organizasyonu olan OpenAI, bugün bize yeni bir araştırma sonucu gösterdi: robotların insan eli gibi nesneleri kavramasına ve manipüle etmesine olanak tanıdı. Bu tür simüle edilmiş birçok avuç içi görmemize rağmen, mekanik yapının "parmakları" gerçek bir insan eli kadar esnek hale getirmesi basit bir mesele değildir.
Ancak aşağıdaki animasyonda da görebileceğiniz gibi Dactyl adı verilen bu manipülatör sistemi, küpü talimatlara uygun olarak döndürme işlemini kolaylıkla tamamlayabilir ve bu türden çeşitli becerilerle yapılan bu tür parmak ucu işlemleri, açıkçası geçmişte bizimkinden daha iyidir. Robotun yürümesi ve zıplaması çok daha karmaşıktır.
Dactyl'in bu kadar verimli çalışmayı başarabilmesinin nedeni, Open AI tarafından kullanılan takviye öğrenme algoritması ile ilgilidir. Tıpkı yeni doğmuş bir çocuk gibi, yapay zeka veya robotlar inşa edildikten hemen sonra hiçbir şeyi anlamazlar. Karmaşık bir görevin akışını tam olarak anlamasını istiyorsanız, tekrarlanan eğitimlerden geçmelisiniz.
Ancak OpenAI'nin mevcut uygulaması, AI robotlarını tamamen sanal bir ortamda eğitmek ve ardından AI'yı fiziksel robotlara uygulamaktır. Ayrıca, eğitim sürecinde çok sayıda dinamik rastgele olay ekleyerek, yapay zekanın süreçteki görevi tamamlamak için hileyi anlamasını sağlar.
Örnek olarak bu manipülatör avucunu alın.Bir kontrol ağındaki manipülatörün en temel çevirme talimatlarını öğretecekler ve görsel ağdaki küpün konumunu ve yönünü tahmin etmek için kamerayı kullanacaklar; daha sonra çevredeki ortamın ışığını ve gürültüsünü değiştirmeye başlayacaklar. , Küpün rengi, ağırlığı, dokusu ve sürtünmesinin yanı sıra; eğitim sırasında yerçekimi ortam faktörlerini bile değiştiriyor.
Bu rastgele değişkenleri eklemenin nedeni, yapay zekanın çeşitli beklenmedik durumlarla daha iyi başa çıkmasına olanak tanımaktır: "Örneğin, farklı yerçekimi ortamlarında, Dactyl bunun küpün manipülasyonunu nasıl etkilediğini anlayacaktır. Aksi takdirde, gerçek dünyada, kolun yüksekliğini değiştirdiğimizde ve yerçekimi ortamı değiştiğinde, küp elden kayabilir. "
Bu sanal ortam eğitim modunun bir başka avantajı da gerçek dünya zamanını tüketmemesidir. Şu anda Dactyl, küpün dönüşünü kontrol etmek için sayısız yol deneyen yaklaşık 100 yıllık eğitim deneyimine sahiptir, ancak gerçekte bu süreç gerçek dünyamızda yalnızca 50 saate eşdeğerdir.
AI, sanal dünyadaki eğitimi tamamladıktan sonra, gerçek dünyadaki dinamik faktörleri analiz etmek için bu deneyimleri uygulayabilir ve görevi tamamlamak için davranışını ayarlayabilir. Artık Dactyl, 50 ardışık küp döndürme işlemini hatasız tamamlayabilir.
Pekiştirmeli öğrenmenin ilhamının ilk olarak insanların doğadaki hayvanların öğrenme sürecini uzun süreli gözlemlemesinden geldiği söyleniyor.Son yıllarda yeni denemeye başlamalarının nedeni de sinir ağı teknolojisindeki ilerlemeden ve OpenAI'nin ölçek avantajından yararlanıyor. Takviyeli öğrenmenin ölçütleri daha çeşitli ve karmaşık hale geldiğinde, doğal olarak çok fazla hesaplama maliyeti ödemeleri gerekir.
OpenAI tarafından sağlanan verilere göre, Dactyl'in eğitim ekipmanı yaklaşık 6144 CPU ve Nvidia'dan 8 V100 GPU kullanıyor ve sadece birkaç araştırma kurumu bu ölçekte temel donanımı kullanabiliyor.
Genel olarak, OpenAI tarafından önerilen "simüle edilmiş ortamın sonuçlarının gerçek dünyaya uygulanması", genel amaçlı robotların geliştirilmesi için etkili çözümlerden biri olacaktır, ancak bazı robotik uzmanları bu seviyenin deneysel sonuçlarının yalnızca belirli bir görevle sınırlı olacağına inanmaktadır. Gerçek dünyadaki sorunları gerçekten çözüp çözemeyeceği hala bilinmiyor.
Ai Faner'dan düzenlendi