Yeni DeepMind makalesi: Yapay zekaya insan kelimelerini 3 boyutlu bir ortamda öğrenmeyi öğretmek, aynı zamanda onlara komuta etmek için resmi dili kullanmak

Li Lin, Arxiv'den derlendi

Qubit Tarafından Üretilen Resmi Hesap | QbitAI

Son zamanlarda DeepMind, biri dil öğrenmek için yapay zeka öğretimi üzerine olmak üzere iki makale yayınladı. Simüle Edilmiş Bir 3D Dünyada Yerleşik Dil Öğrenimi , Diğeri ise yapay zeka ajanı eylemlerine komuta etmek için resmi dil kullanmakla ilgili Programlanabilir Ajanlar .

Önce AI öğrenme dillerinden bahsedelim.

Günlük hayatlarımızı düşünün. AI, hangi haberleri izleyeceğimizden hangi hisse senetlerini satın alacağımıza kadar giderek daha fazla karar vermemize yardımcı oluyor. Bazen bile, AI'nın doğrudan bizim için hareket etmesine izin verilir.

Bununla birlikte, bu aynı zamanda giderek artan acil bir ihtiyacı da beraberinde getirdi: Yapay zeka ile insan sözleriyle iletişim kurmak, onlara komut vermek ve onlara rehberlik etmek.

Başka bir deyişle, bırakın AI Gerçekten anlıyorum İnsan kelimeleri.

Gerçekten anlayışlı olan nedir? Basitçe söylemek gerekirse, aracının dili davranışıyla ve içinde yaşadığı dünyayla ilişkilendirmesine izin vermektir.

DeepMind, ajanın dili ne kadar öğrenmesini istediklerini açıklamak için makalenin özetinde iki kelime kullanır:

Temelli, yani dildeki kelimeleri, failin çevrede doğrudan karşılaştığı nesneler ve davranışlarla ilişkilendirebilen bir temele ve temele sahiptir;

Somutlaştırılmış yani somut olarak ifade edilebilir.

Ancak, yapay zekanın temel alınan dili öğrenmesi zordur.

DeepMind makalesi yeni bir yöntemi açıklar: aracıyı sanal bir 3B ortama koyun ve insan dilinde yazılmış talimatları başarıyla uyguladığında ödüllendirilecektir.

Bu, aracıları insan dilini anlamayı öğrenmek üzere eğitmek için pekiştirmeli öğrenmeyi ve denetimsiz öğrenmeyi nasıl kullanırlar.

Yukarıdaki resim DeepMind gazetesinden bir örnektir: İlk başta temsilci 1. pozisyondaydı ve "yeşil nesnenin yanındaki kırmızı nesneyi alma" talimatını aldı, bu nedenle iki "oda" arasında dolaştı ve odayı kontrol etmeye gitti Nesne ve göreceli konumu, alınacak nesneyi buldu.

Bu tür bir keşif ve seçme davranışı önceden programlanmamıştır, teşvik mekanizması yardımıyla tamamen öğrenilir.

Bu tür keşif eğitiminin yüz binlerce çeşidi vardır ve temsilci farklı oda düzenleri, farklı nesne yerleştirme konumları vb. İle karşılaşacaktır.

Eğitim sürecinde, temsilci neredeyse hiçbir ön bilgiye sahip değildir ve dili yalnızca dil sembollerini, çevresindeki fiziksel ortamda ortaya çıkan algısal temsiller ve davranış dizileri ile ilişkilendirerek öğrenir.

Aynı zamanda, failin dili anlamak için önceki deneyime güvenmemesidir.Araştırmacı, ajanı tamamen yabancı bir ortama koyarsa ve yeni talimatlar vermek için öğrendiği dili kullanırsa, ajan da aynısını yapabilir.

DeepMind araştırmacıları ayrıca semantik bilginin birikmesiyle aracıların yeni kelimeleri daha hızlı ve daha hızlı öğrendiğini buldu.

Anlamsal bilgiyi genelleme ve kendi kendini genişletme becerisinin, kullandıkları yöntemin, yapay zeka ajanlarının belirsiz doğal dil ile karmaşık fiziksel dünya arasındaki ilişkiyi anlamasına izin verme potansiyeline sahip olduğunu gösterdiğine inanıyorlar.

Spesifik eğitim süreci ve ilkeleriyle ilgili olarak, lütfen kağıda geçin:

Simüle Edilmiş Bir 3D Dünyada Yerleşik Dil Öğrenimi

https://arxiv.org/pdf/1706.06551.pdf

Yazar: Karl Moritz Hermann, Felix Hill, Simon Green, Fumin Wang, Ryan Faulkner, Hubert Soyer, David Szepesvari, Wojtek Czarnecki, Max Jaderberg, Denis Teplyashin, Marcus Wainwright, Chris Apps, Demis Hassabis, Phil Blunsom

Yukarıda bahsedilen eğitim yöntemi, aracının 3B sanal ortamda insan dilinde yazılmış talimatları yürütmesine izin vermektir.

Aynı gün başka bir grup DeepMind araştırmacısı tarafından Axriv'e gönderilen başka bir makalede, aracı basit bir resmi dilde yazılmış talimatları yürütür, ancak bu araştırma, temsilcinin daha önce hiç görmediği nesnelere esnek bir şekilde yanıt vermesini sağlar. .

Bu yazının başlığı: Programlanabilir Ajanlar. Tecrübe bize haber ya da gazete olsun, başlık ne kadar kısaysa sorunun o kadar büyük olduğunu söylüyor ... Elbette, yapay zeka araştırması alanında, son zamanlarda bu kuraldan giderek daha fazla şüphe ediliyor.

Öncelikle bu makalenin yapay zekanın ne yapmasını istediğine bir göz atalım.

Basitçe ifade etmek gerekirse, aracının resmi bir dilde ifade edilen tanımlayıcı bir programı çalıştırmasına izin verin.

Araştırmacı bu çalışmada, ortamı ortada 6 eklemli mekanik bir kol ve çevresinde belirli sayıda yapı taşı bulunan, rastgele konumlarda görünen büyük bir masa olarak belirlemiştir.

Yaptıkları şey, sanal ortamdaki "robotik kolu" belirli bir renk ve şekle sahip yapı taşlarına, yani hedef tuğla bloğun yanında uzanan tutamağa (mekanik kolun ön ucunun beyaz kısmı) ulaştırmaktı.

Yukarıda bahsedilen "resmi dil tanımlayıcı program" şu şekilde yürütülür: YAKIN (EL, VE (KIRMIZI, KÜP)) Bu, elini kırmızı küpün yanına uzatmak anlamına geliyor.

Biçimsel dilde belirtilen, hedefin rengi ve şeklidir. Belirli bir programda, masaüstünün boyutu ve hedeflerin sayısı da değişebilir.

Yukarıdaki resimde, "mavi küreye uzanan" en soldaki görüntü eğitim seansıdır ve diğer üç görüntü, hedefin doğasındaki değişiklik de dahil olmak üzere bu eğitimden sonra ajanın genelleme yeteneğini gösterir (soldan ikinci: kırmızı yapı bloğuna ulaşma ), ortamdaki nesnelerin sayısındaki değişiklikler (sağdan ikinci: yeşil küreye uzanmak, masada çok sayıda blok olduğuna dikkat edin) ve yeni hedef özelliklerin ortaya çıkması (ilki sağdan: yeni kırmızı bloklara uzanmak).

DeepMind araştırmacıları, eğittikleri temsilcilerin bu dilin talimatlarına göre çevrelerinde hedef bulmayı öğrendikten sonra testte bu beceriyi genelleştirebileceklerini, yeni programlar uygulayabileceklerini ve eğitimde hedefi bulabileceklerini söylediler. Hiç bahsedilmeyen bir hedef. Temsilcileri, çok çeşitli sıfır vuruş anlamsal görevlere genelleştirilebilir.

Spesifik eğitim süreci ve ilkeleri için lütfen kağıda geçin:

Programlanabilir Ajanlar

https://arxiv.org/pdf/1706.06383.pdf

Misha Denil, Sergio Gómez Colmenarejo, Serkan Cabi, David Saxton, Nando de Freitas

Bitiş

Bir uyarı

Qubit'ler, otonom sürüşle ilgili alanlarda çalışan öğrenciler veya ön saflardaki mühendisler için otonom bir sürüş teknolojisi grubu oluşturuyor. Li Kaifu, Wang Yonggang, Wang Naiyan Grupta büyük sığırları bekliyorlar. Herkese qubit WeChat (qbitbot) eklemeye hoş geldiniz, ha'ya katılmak için başvurmak için "otomatik sürüş" diyor ~

İşe Alım

Qubit, editörleri, muhabirleri, operasyonları, ürünleri ve diğer pozisyonları işe alıyor ve çalışma yeri Pekin, Zhongguancun'da bulunuyor. İlgili ayrıntılar için lütfen şu yanıtı verin: resmi hesabın diyalog arayüzünde "İşe Alım".

Eski teknik direktör Cheng Xiangfu? Yabancı medya: Çin Süper Ligi'ndeki iki takım Carlos ile ilgileniyor ve eşeği öldürmek mi istiyor?
önceki
Silah için en uygun yer olan PlayerUnknown's Battlegrounds'un yeni yağmur ormanı haritası, on kişiyi öldürmek istiyorsanız buraya gelin
Sonraki
Tarihin en zor üç sayılık yarışması şampiyon kim? Zhan Huang'ın küçümsediği küçük takipçisi!
Haberleri beklemekten korkmayın, Chongqing Dangdai Lifan adını Chongqing Sway olarak değiştirdi
Yangovich'in bir meşalesi var! 16. sıradaki tipik bir Dalian oyuncusu karakteri olan Dalian futbolu başarı için acele etmemeli
Sekizinci taç! Tsinghuanın üç süper bilgisayar yarışmasında bir şampiyonluk ödülü daha var
LOL Intercontinental: LPL'yi kazandıktan sonra DoinB, Koreli netizenler tarafından tehdit edildi: Yeteneğiniz varsa ülkenize geri dönmeyin!
Rockets mutlu! Kahuang geri döndü, %50 nişancı geri döndü ve 2 önemli takviye var!
Yangovich topu izlemeye odaklanmıyor mu? Yanlış olduğu ortaya çıktı! Süper Lig'deki en güçlü dış yardımın Dalian'da olduğuna inanıyor
Chengdu'da Dior Dior kulis makyajı büyük lansmanı
Ay Yeni Yılı'nda 5 NBA takımı Çin'in ev sahibi takımı olmak için her türlü kalp ısınma operasyonunda yarışıyor!
"Karma kuyulu" MG 6 plug-in hibrit versiyonu 28 Mart'ta BMW 3 Serisi'ne sürülecek
Bir taraf, iki hücum ve savunma çekirdeği Gaitan Xiaoniao Yiren'i kucaklıyor, yeni bir fotoğraf hayranların ilgisini çekiyor
Çin Chengdu Elektronik Bilim ve Teknoloji Üniversitesi'nin Shifang kampüsünün temel atma töreni yapıldı.
To Top