Li Lin, Arxiv'den derlendi
Qubit Tarafından Üretilen Resmi Hesap | QbitAI
Son zamanlarda DeepMind, biri dil öğrenmek için yapay zeka öğretimi üzerine olmak üzere iki makale yayınladı. Simüle Edilmiş Bir 3D Dünyada Yerleşik Dil Öğrenimi , Diğeri ise yapay zeka ajanı eylemlerine komuta etmek için resmi dil kullanmakla ilgili Programlanabilir Ajanlar .
Önce AI öğrenme dillerinden bahsedelim.
Günlük hayatlarımızı düşünün. AI, hangi haberleri izleyeceğimizden hangi hisse senetlerini satın alacağımıza kadar giderek daha fazla karar vermemize yardımcı oluyor. Bazen bile, AI'nın doğrudan bizim için hareket etmesine izin verilir.
Bununla birlikte, bu aynı zamanda giderek artan acil bir ihtiyacı da beraberinde getirdi: Yapay zeka ile insan sözleriyle iletişim kurmak, onlara komut vermek ve onlara rehberlik etmek.
Başka bir deyişle, bırakın AI Gerçekten anlıyorum İnsan kelimeleri.
Gerçekten anlayışlı olan nedir? Basitçe söylemek gerekirse, aracının dili davranışıyla ve içinde yaşadığı dünyayla ilişkilendirmesine izin vermektir.
DeepMind, ajanın dili ne kadar öğrenmesini istediklerini açıklamak için makalenin özetinde iki kelime kullanır:
Temelli, yani dildeki kelimeleri, failin çevrede doğrudan karşılaştığı nesneler ve davranışlarla ilişkilendirebilen bir temele ve temele sahiptir;
Somutlaştırılmış yani somut olarak ifade edilebilir.
Ancak, yapay zekanın temel alınan dili öğrenmesi zordur.
DeepMind makalesi yeni bir yöntemi açıklar: aracıyı sanal bir 3B ortama koyun ve insan dilinde yazılmış talimatları başarıyla uyguladığında ödüllendirilecektir.
Bu, aracıları insan dilini anlamayı öğrenmek üzere eğitmek için pekiştirmeli öğrenmeyi ve denetimsiz öğrenmeyi nasıl kullanırlar.
Yukarıdaki resim DeepMind gazetesinden bir örnektir: İlk başta temsilci 1. pozisyondaydı ve "yeşil nesnenin yanındaki kırmızı nesneyi alma" talimatını aldı, bu nedenle iki "oda" arasında dolaştı ve odayı kontrol etmeye gitti Nesne ve göreceli konumu, alınacak nesneyi buldu.
Bu tür bir keşif ve seçme davranışı önceden programlanmamıştır, teşvik mekanizması yardımıyla tamamen öğrenilir.
Bu tür keşif eğitiminin yüz binlerce çeşidi vardır ve temsilci farklı oda düzenleri, farklı nesne yerleştirme konumları vb. İle karşılaşacaktır.
Eğitim sürecinde, temsilci neredeyse hiçbir ön bilgiye sahip değildir ve dili yalnızca dil sembollerini, çevresindeki fiziksel ortamda ortaya çıkan algısal temsiller ve davranış dizileri ile ilişkilendirerek öğrenir.
Aynı zamanda, failin dili anlamak için önceki deneyime güvenmemesidir.Araştırmacı, ajanı tamamen yabancı bir ortama koyarsa ve yeni talimatlar vermek için öğrendiği dili kullanırsa, ajan da aynısını yapabilir.
DeepMind araştırmacıları ayrıca semantik bilginin birikmesiyle aracıların yeni kelimeleri daha hızlı ve daha hızlı öğrendiğini buldu.
Anlamsal bilgiyi genelleme ve kendi kendini genişletme becerisinin, kullandıkları yöntemin, yapay zeka ajanlarının belirsiz doğal dil ile karmaşık fiziksel dünya arasındaki ilişkiyi anlamasına izin verme potansiyeline sahip olduğunu gösterdiğine inanıyorlar.
Spesifik eğitim süreci ve ilkeleriyle ilgili olarak, lütfen kağıda geçin:
Simüle Edilmiş Bir 3D Dünyada Yerleşik Dil Öğrenimi
https://arxiv.org/pdf/1706.06551.pdf
Yazar: Karl Moritz Hermann, Felix Hill, Simon Green, Fumin Wang, Ryan Faulkner, Hubert Soyer, David Szepesvari, Wojtek Czarnecki, Max Jaderberg, Denis Teplyashin, Marcus Wainwright, Chris Apps, Demis Hassabis, Phil Blunsom
Yukarıda bahsedilen eğitim yöntemi, aracının 3B sanal ortamda insan dilinde yazılmış talimatları yürütmesine izin vermektir.
Aynı gün başka bir grup DeepMind araştırmacısı tarafından Axriv'e gönderilen başka bir makalede, aracı basit bir resmi dilde yazılmış talimatları yürütür, ancak bu araştırma, temsilcinin daha önce hiç görmediği nesnelere esnek bir şekilde yanıt vermesini sağlar. .
Bu yazının başlığı: Programlanabilir Ajanlar. Tecrübe bize haber ya da gazete olsun, başlık ne kadar kısaysa sorunun o kadar büyük olduğunu söylüyor ... Elbette, yapay zeka araştırması alanında, son zamanlarda bu kuraldan giderek daha fazla şüphe ediliyor.
Öncelikle bu makalenin yapay zekanın ne yapmasını istediğine bir göz atalım.
Basitçe ifade etmek gerekirse, aracının resmi bir dilde ifade edilen tanımlayıcı bir programı çalıştırmasına izin verin.
Araştırmacı bu çalışmada, ortamı ortada 6 eklemli mekanik bir kol ve çevresinde belirli sayıda yapı taşı bulunan, rastgele konumlarda görünen büyük bir masa olarak belirlemiştir.
Yaptıkları şey, sanal ortamdaki "robotik kolu" belirli bir renk ve şekle sahip yapı taşlarına, yani hedef tuğla bloğun yanında uzanan tutamağa (mekanik kolun ön ucunun beyaz kısmı) ulaştırmaktı.
Yukarıda bahsedilen "resmi dil tanımlayıcı program" şu şekilde yürütülür: YAKIN (EL, VE (KIRMIZI, KÜP)) Bu, elini kırmızı küpün yanına uzatmak anlamına geliyor.
Biçimsel dilde belirtilen, hedefin rengi ve şeklidir. Belirli bir programda, masaüstünün boyutu ve hedeflerin sayısı da değişebilir.
Yukarıdaki resimde, "mavi küreye uzanan" en soldaki görüntü eğitim seansıdır ve diğer üç görüntü, hedefin doğasındaki değişiklik de dahil olmak üzere bu eğitimden sonra ajanın genelleme yeteneğini gösterir (soldan ikinci: kırmızı yapı bloğuna ulaşma ), ortamdaki nesnelerin sayısındaki değişiklikler (sağdan ikinci: yeşil küreye uzanmak, masada çok sayıda blok olduğuna dikkat edin) ve yeni hedef özelliklerin ortaya çıkması (ilki sağdan: yeni kırmızı bloklara uzanmak).
DeepMind araştırmacıları, eğittikleri temsilcilerin bu dilin talimatlarına göre çevrelerinde hedef bulmayı öğrendikten sonra testte bu beceriyi genelleştirebileceklerini, yeni programlar uygulayabileceklerini ve eğitimde hedefi bulabileceklerini söylediler. Hiç bahsedilmeyen bir hedef. Temsilcileri, çok çeşitli sıfır vuruş anlamsal görevlere genelleştirilebilir.
Spesifik eğitim süreci ve ilkeleri için lütfen kağıda geçin:
Programlanabilir Ajanlar
https://arxiv.org/pdf/1706.06383.pdf
Misha Denil, Sergio Gómez Colmenarejo, Serkan Cabi, David Saxton, Nando de Freitas
Bitiş
Bir uyarı
Qubit'ler, otonom sürüşle ilgili alanlarda çalışan öğrenciler veya ön saflardaki mühendisler için otonom bir sürüş teknolojisi grubu oluşturuyor. Li Kaifu, Wang Yonggang, Wang Naiyan Grupta büyük sığırları bekliyorlar. Herkese qubit WeChat (qbitbot) eklemeye hoş geldiniz, ha'ya katılmak için başvurmak için "otomatik sürüş" diyor ~
İşe Alım
Qubit, editörleri, muhabirleri, operasyonları, ürünleri ve diğer pozisyonları işe alıyor ve çalışma yeri Pekin, Zhongguancun'da bulunuyor. İlgili ayrıntılar için lütfen şu yanıtı verin: resmi hesabın diyalog arayüzünde "İşe Alım".