"Alpha Dog" yükseltildi, yeni "robot" hafızaya sahip

Titanium Media TMTPost.com

TMT İnovasyon Girişimcilik

Bu farklı WeChat hesabına dikkat edin: Titanium Media (ID: taimeiti)

"Alpha Dog'un babası" olan DeepMind, bir "sinir ağı" bilgi işlem sistemini geleneksel bilgisayar belleğiyle birleştiren bir öğrenme makinesi yarattı. Stanford Üniversitesi Zihin, Beyin ve Bilgisayar Merkezi direktörü, sonucu "yapay zeka araştırmalarında çok ilginç ve önemli bir kilometre taşı" olarak övdü.

Titanyum Ortam Notu: DeepMind AlphaGo'yu ("Alpha Dog") yarattıktan sonra, yapay zeka alanında yeni atılımlar yaptı. Geliştirdikleri "Diferensiyellenebilir Sinir Bilgisayarı" (DNC) bağımsız öğrenme yeteneğine sahiptir. Bu model, okunabilir ve yazılabilir bir harici depolama yapısı ile birlikte biyolojik bir sinir ağını taklit eder, bir sinir ağı gibi belleği çağırabilir ve eğitim ve deneme yanılma yoluyla öğrenme yoluyla sıradan bir bilgisayar gibi karmaşık verileri işleyebilir.

DeepMind, "Nature" dergisinin son sayısında araştırma sonuçlarını gösteren bir makale yayınladı. Makale, DNC'nin mevcut bilgi olmadan en iyi Londra Metro hatlarını planlama veya sembolik dilde açıklanan hedeflere dayanarak bulmaca problemini çözme becerisine sahip olduğunu belirtti. Aşağıda, DeepMind tarafından yayınlanan orijinal blog yazısı ve Titanium Media muhabiri Sophie Tang tarafından derlenen "Nature" dergisinin ilgili içeriği yer almaktadır.

Yakın zamanda, Nature dergisinde, "diferansiyellenebilir sinir bilgisayarı" (DNC) adı verilen derin takviye öğrenen sinir ağını tanıtan bir çalışma yayınladık. Araştırmamızda, DNC'nin yapay olarak oluşturulmuş hikayeler, şecere ve hatta Londra Yeraltı haritası gibi karmaşık yapılandırılmış verilerle ilgili soruları yanıtlamak için belleğini nasıl kullanmayı öğrendiğini gösterdik. Ek olarak, DNC, pekiştirmeli öğrenme yoluyla blok oyun problemlerini de çözebilir.

Plato, bir keresinde hafızayı balmumu bir tahtaya benzetti, üzerine kazındığında sonsuza kadar korunabilir. Platon, "esnekliği" açıklamak için bir metafor kullanır, yani insanlar kendi fikirlerini şekillendirebilir veya yeniden şekillendirebilir. Ancak hafızamız, içerik depolamanın yanı sıra bağlantılar da oluşturabilir ve birbirleriyle bağlantı kurabilir.

İngiliz filozof John Locke, anılar bitişik zaman dilimlerinde ve mekanlarda oluşursa, bunların birbirine bağlanabileceğine inanıyordu. Balmumu plakalarına ek olarak, en ünlü benzetme Marcel Proustun Madeleine pastasıdır (bir yetişkinin gençken yediği tatlıdan sadece bir ısırığına ihtiyacı vardır ve çocukluk anıları bir sel gibi fışkırır). Artık parçalanmış belleğin (veya olay belleğinin) hipokampusa dayandığını biliyoruz.

Bugün, insan hafıza benzetmesi daha rafine hale geldi. Bizim için bellek artık mum bir tahta değil, plastik bir süreçtir. Bu süreçte, belirli bölümler deneyiminizi oluşturur ve bu bellek bölümleri yeniden düzenlenebilir.

Ek olarak, davranış ve bellek arasındaki ilişki değişkendir, "uyaran-tepki" kadar basit değildir. Nasıl değiştiği, olayın arka planı ve olayı işlemenin önceliği ile ilgilidir.

Örneğin, Londra Metrosu haritasını hatırlıyorsanız, şu iki soruyu aynı yanıtla yanıtlayabilirsiniz: "Piccadilly Circus'tan Moorgate'e nasıl giderim?" Ve "Kuzey Hattına bitişik bir hat seçip kuzeye giderseniz Git Moorgate istasyonuna nasıl gidebilirim? Hafıza içeriğinin hafıza kullanımından ayrılabildiği görülebiliyor.

Başka bir görüş ise Hafıza sıralandıktan sonra hesaplamalar için kullanılabilir. Daha çok bir Lego oyuncağı gibidir ve insanlar anılarını problemlere göre yeniden düzenleyebilirler.

Sinir ağları grafiksel kavrayışta iyi performans gösterir, hızlı yanıt verir ve zamanında kararlar verir.Yavaş düşünebilen, bilgiyi kasıtlı veya rasyonel olarak kullanabilen sinir ağları oluşturmaya yeni başlıyoruz. Örneğin, ulaşım ağı gibi bilgileri depolamasına izin verin ve ardından parçalanmış bilgiyi mantıklı ve makul bir şekilde düşünün ve soruları yanıtlayın.

Yakın zamanda yayınlanan bir makalede, bilgiyi hızlı bir şekilde depolayabilen ve esnek bir şekilde yorumlayabilen bu tür bir öğrenme makinesi oluşturmak için sinir ağları ve bellek sistemlerinin nasıl birleştirileceğini açıkladık. DNC (farklılaştırılabilir sinir bilgisayarları) haline geldiğimiz bu makineler, sinir ağları gibi öğrenebilir ve ayrıca bilgisayarlar gibi karmaşık verileri depolayabilirler.

Sıradan bir bilgisayarın işlemcisi, RAM aracılığıyla bilgi okuyabilir ve yazabilir. RAM, işlemciye hesaplama sürecinde bilgileri organize etmesi için daha fazla alan sağlar. Geçici bilgilerin saklandığı alana değişken adı verilir ve hafıza kartında saklanır. Bir bilgisayar için, sayıları saklamak için bir değişken ayarlamak kolaydır ve değişkenler arasında korelasyonlar olduğu için bir veri yapısı oluşturmak zor değildir.

En basit veri yapılarından biri, değişkenlerin sırayla düzenlendiği bir listedir. Daha karmaşık bir veri yapısı, çocukları takip ederek ebeveynleri ve onlarla ataları arasındaki bağlantıyı bulabileceğiniz bir aile ağacı gibi bir ağaç yapısıdır. En karmaşık ve kapsamlı veri yapısı, Londra Metrosu gibi grafiktir.

DNC'yi tasarlamadaki asıl amacımız, makinelerin karmaşık veri yapıları oluşturmayı ve ilgili sorunları çözmeyi öğrenmesine izin vermekti. DNC'nin çekirdeği, bir bilgisayar işlemcisine benzer şekilde çalışan "denetleyici" adı verilen bir sinir ağıdır. Denetleyici, giriş yapmaktan, yorumlamaktan, belleğe yazmaktan ve ilgili soruları yanıtlamaktan sorumludur. "Bellek", geçici bilgilerin depolanması için bir dizi alandan oluşur.

Denetleyici birkaç bellek işlemi gerçekleştirebilir. Denetleyici her zaman belleğe yazıp yazmayacağına karar verir. Yazmayı seçerseniz, bilgiler yepyeni bir yerde veya bir denetleyicinin bulduğu yerde saklanır. Bu şekilde kontrolör, depolama alanının içeriğini her zaman ve her yerde güncelleyebilir. Tüm bellek alanı doluysa, tıpkı bir bilgisayarın işe yaramaz verileri başka bir yere koyması gibi, kontrolör de onu temizlemeyi seçebilir.

Denetleyici, bir vektör birimi bilgisini seçilen bellek alanına göndermek için belleğe yazar. Bilgi yazıldıktan sonra, farklı hafıza alanlarında bağlantılar olacaktır.Bu bağlantı, bilginin saklandığı sıradır.

Bilgi yazmaya ek olarak, kontrolör farklı bölümlerde saklanan anıları da yorumlayabilir ve arama yoluyla, yazılı bilgileri sırayla veya ters sırada geri çağırmak için mevcut bağlantıları kullanabilir. Yorumlanan bilgiler bir soruyu doğrudan yanıtlayabilir veya bir soruya yanıt verebilir ve harekete geçebilir. Genel olarak, bu işlemler DNC'nin bellek alanı tahsis etmesini, bellek bilgilerini depolamasını ve belleği hızlı bir şekilde aramasını sağlar.

Sinir ağı denetleyicisi harici bilgileri kabul eder. DNC, "zaten ilişkilendirilmiş" depolar, "zaten ilişkilendirilmiş", denetleyicinin belleği aramasına yardımcı olabilir

Profesyonel olmayan okuyucuların bakış açısından, "kontrolör yapabilir ..." ve "DNC yapmaya karar verir ..." ifadelerini tekrar etmemiz gariptir, ancak bunun nedeni DNC'nin hafızayı kullanmayı öğrenmesi ve soruları sıfırdan yanıtlamasıdır. DNC'nin cevabını doğru cevapla karşılaştırıyoruz, böylece kontrolör kendini optimize etmeye devam ediyor ve doğru cevaba daha yakın ve daha yakın cevaplar veriyor. Süreçte, kontrolör kendi belleğini nasıl kullanacağını da öğrendi.

Yeteneklerini test etmek için DNC ve veri yapısı hakkında sorular sormak istiyoruz. Grafik verileri iyi bir test yöntemidir, çünkü genellikle keyfi olarak bağlanabilen bazı veriler içerir ve yollar ve döngüler oluşturur. Makalemiz, DNC'nin bir grafiği yorumlayabildiğini ve bağımsız öğrenme yoluyla ilgili soruları cevaplayabileceğini göstermektedir.

Londra Metrosu haritasını DNC'ye anlattıktan sonra, "Central Line'a girin, Bond Street istasyonundan başlayın, bir durak atın, Circle Line'a geçin ve dört durak sonra iki durak için Jubilee Hattı'nı kullanın ve sonunda Nereye çıkmalı? "Ayrıca DNC'den bir rota planlamasını ve ona" Moorgate istasyonundan Piccadilly Circus istasyonuna nasıl gidilir? "

DNC, eğitim sırasında rastgele oluşturulmuş grafikler kullanır (solda). Eğitimden sonra, DNC'nin Londra Metrosu haritasında (sağda) uygun bir rota bulup bulamayacağını test edeceğiz. Metro haritasını tanımlamak için üç kelimelik birden fazla set kullanıyoruz ve iki görevi örnek olarak kullanıyoruz: "yatay gidiş-dönüş hareketi", yani DNC istasyondan başlar ve belirli bir sırayla yürür; "en kısa rota", yani DNC iki tane bulmalıdır İstasyonlar arasındaki en kısa hat.

Bir soy ağacı kullanarak, DNC'nin karmaşık hesaplamalar gerektiren soruları yanıtlayabileceğini gösterdik. Örneğin, sadece ebeveynler, çocuklar ve kardeşler arasında bilgi versek bile, DNC'ye "Freya'nın annesinin amcası kimdir?" Diye sorabiliriz. Artık denetleyicinin hangi hafıza aralığını okuduğunu görebiliriz. DNC'nin hafızasını nasıl kullandığını analiz etmek için. DNC ile karşılaştırıldığında, önceki geleneksel sinir ağı ya bilgiyi depolayamıyordu ya da benzetme yoluyla verileri yorumlamayı öğrenemiyordu.

DNC şecere ile ilgili soruları yanıtlıyor

DNC'yi pekiştirmeli öğrenme yoluyla da eğitebiliriz. DNC'nin bir soruya cevap vermesine izin veriyoruz, ancak ona doğru cevabı söylemeyeceğiz. Yanıtı tatmin edici olduğunda, ona yüksek bir puan vereceğiz. Veya DNC'nin birkaç renkli tuğla yığınına bakmasına ve ona talimat vermesine izin verin: "Açık mavi ızgarayı yeşil ızgaranın altına yerleştirin; turuncu ızgarayı kırmızı ızgaranın sağına getirin; mor ızgarayı turuncunun altına yerleştirin; açık mavi ızgarayı koyu maviye yerleştirin Sağda; yeşil ızgara kırmızı ızgaranın altına, mor ızgara yeşil ızgaranın soluna yerleştirilmiştir. "

DNC, küp oyunlarının taşınması sorununu çözer.

Ulaşılabilir birçok hedef oluşturabilir ve ardından sinir ağının görevleri yerine getirmesine ve hedeflere ulaşmasına izin verebiliriz. Bu durumda, tıpkı bir bilgisayar gibi, DNC birkaç ipucu hatırlayabilir.Farklı ipuçları belirli bir hedefle ilişkilidir ve DNC bu görevleri gerçekleştirebilir.

İnsan hafızasının nasıl çalıştığı eski bir sorudur ve onu kavrayışımız henüz tamamlanmamıştır. DNC'nin bilgisayar bilimi için yeni araçların yanı sıra bilişsel bilim ve sinirbilim için yeni bir model sağlayabileceğini umuyoruz: Bu bir öğrenme makinesidir, önceden programlamaya gerek yoktur, ayrıca bilgileri düzenleyebilir, bilgileri gerçeklerle ilişkilendirebilir ve bu bilgileri soruları yanıtlamak için kullanabilirsiniz.

DNC hakkında daha fazla bilgi edinmek için lütfen Nature'da yayınlanan makaleye ve Herbert Jaeger'in derin nöral analiz yetenekleri hakkındaki yorumuna bakın. (Bu makale ilk olarak Titanium Media muhabiri Sophie Tang tarafından derlenen Titanium Media'da yayınlandı)

Titanium Medianın T-EDGE Yıllık Konferansı'na daha inanılmaz ürünler, son teknoloji ünlüler gelecek. Biletleri hızlı bir şekilde almak için "Orijinal metni oku" yu tıklayın ...

Yıl sonunda bilim ve teknoloji çemberindeki en büyük uluslararası fırtına vurdu, detaylar ve bilet kapma için tıklayın Orijinali okuyun

Güzel bir efsane var, nefis buz heykelleri şarkı söyleyebilir
önceki
Kimura Mitsuhiro nihayet yüksek profilli bir güzellik yaptı. O şeklinde bacakları olmayan bir etek giydi ve saç şeklini çok gelişmiş olacak şekilde değiştirdi.
Sonraki
Ülke çapında canlı yayın, canlı yayın endüstrisinde yeni bir büyük şok olan "İmparator Bölümü Beşinci Beş Açık" etkinliğinin en büyük galibi olabilir.
İkisi de süper model, Liu Wen neden daha gelişmiş görünüyor?
Yeni iPhone'un National Bank versiyonu çift kart işlevini destekleyecek; OPPO 5G sinyalizasyonunu açtığını duyurdu
190207 Meng Meiqi, New York Moda Haftası şovunda sert ve yumuşak, tatlı ve havalı göründü.
Ulusal Canlı Yayın Festivali Finalleri sona eriyor ve ödül şovunun dört önemli özelliği önceden açıklanacak!
Meizu 16. ayna mavisi yeni renk eşleştirme gerçek makine ortaya çıktı; Snapdragon 855, Lenovo'nun ilk lansmanı olabilir mi?
İspanya Kraliçesi de yanlış bir şey giyiyor! En az 10 yaşında, zarif, düşük at kuyruğu olan retro saten desenli bir elbise giyin
190207 Di Ali Reba spot muhabirini mi çaldı? Resmi yanıt "Böyle bir hırsızlık hoş karşılanır"
Cui Xueli, yağlı kafasını taradı ve otoriter bir başkan oldu. Kısa bir etek ve bir takım elbise giymişti ve bacakları ve yemek çubukları iyi biliniyordu.
Geçen yıl para bağışlayan ve bu yıl hediyeler gönderen Yang Yang, her doğum gününde büyük şeyler yapmak zorunda!
CPU dışında Meizu 16x ve 16 temelde aynıdır; Hasselblad plus DJI Mavic 2 drone'yu yayınladı
Wang Sulong'un Mai'yi haykırmak için ulusal canlı yayına gittiğini duydum!
To Top