Başlık partisi çok mu korkutucu? Bu makale size DeepMind ilişkisel muhakeme ağının gerçek yüzünü anlatacak

Leifeng.com AI Teknolojisi Yorumu: DeepMind yeni bir makale yayınladığında, medya raporu fanatik bir şekilde takip edecek ve birçok yanıltıcı ifade kullanacaktır. Örneğin, ilişkisel muhakeme ağına ilişkin rapor:

DeepMind, etrafındaki nesneleri algılayabilen bir sinir ağı geliştirdi.

Aslında, bu rapor sadece yanıltıcı değil, aynı zamanda gerçeği bilmeyen birçok insanı paniğe sürüklüyor: YZ gerçekten bu kadar güçlü mü? Bu makalede, DeepMind makalesini tanıtacağım: İlişkisel akıl yürütme için basit bir sinir ağı modülü, bu en son mimariyi en basit şekilde tanıtmaya çalışın.

İlişkisel Akıl Yürütme nedir?

En basit bakış açısından, ilişkisel akıl yürütme, farklı nesneler arasındaki ilişkileri (düşünceleri) anlamayı öğrenmektir. Bu yetenek, zekanın temel bir özelliği olarak kabul edilir. Yazar, ilişkisel muhakemenin ne olduğunu açıklamak için bir şema kullanır:

Şekil 1. Modelin farklı şekil, boyut ve renkteki bir nesneye odaklanması gerekir ve birden çok nesne arasındaki ilişki hakkındaki soruları yanıtlayabilir

Muhakeme ağı

Yazar, özü ilişkileri yakalamak olan bir sinir ağı önermektedir (tıpkı evrişimli sinir ağlarının görüntü özelliklerini yakalaması gibi). Aşağıdaki gibi tanımlanan bir mimari önerdiler:

Denklem 1: Çıkarım ağının tanımı

Açıklama:

O için ilişkisel ağ f fonksiyonudur, burada O, ilişkiyi öğrenmek isteyen bir grup nesnedir.

g iki nesne hakkında bir denklemdir: oi, oj. Çıktı, önemsediğimiz "ilişki" dir.

olası tüm nesne çiftlerini hesaplamak, ilişkilerini hesaplamak ve bunları eklemek anlamına gelir.

Sinir Ağları ve İşlevleri

Sinir ağlarını, geri yayılımı vb. Öğrenirken bunu unutmak kolaydır, ancak aslında sinir ağları sadece matematiksel bir işlevdir! Bu nedenle, yukarıdaki Denklem 1 bir sinir ağını veya daha doğru bir şekilde iki sinir ağını tanımlar:

1. g, bir çift nesne arasındaki ilişkiyi hesapladı

2. f, tüm g'nin toplamını hesapladı ve tüm modelin son çıktısını hesapladı

En basit durumda, g ve f'nın her ikisi de çok katmanlı algılayıcılardır.

İlişkisel sinir ağı esnekliği

Yazar, bir bileşen olarak ilişkisel bir sinir ağını önermektedir. Kodlanmış nesneleri girdi olarak kabul edebilir ve onlardan ilişkiler öğrenebilirler.Daha da önemlisi, evrişimli sinir ağlarına ve uzun kısa süreli bellek ağlarına (LSTM) kolayca eklenebilirler.

Evrişimli ağlar, nesneleri görüntülerden öğrenebilir. Bu, pratik uygulamalar için çok yararlıdır, çünkü görüntülerden mantık yürütmek, kullanıcı tanımlı nesne dizilerinden çok daha pratiktir.

Sorunun anlamını anlamak için LSTM ve kelime gömme nasıl kullanılır. Bu da daha pratiktir Mevcut model, bir kod dizisi yerine İngilizce cümleleri girdi olarak kabul edebilir.

Yazar, nesneler arasındaki ilişkileri öğrenmek için uçtan uca bir sinir ağı oluşturmak için ilişkisel ağları, evrişimli ağları ve LSTM ağlarını birleştirmek için bir yöntem önermektedir.

Şekil 2: Uçtan uca ilişkisel muhakeme sinir ağı

Şekil 2'nin açıklaması

Görüntü standart bir evrişimli sinir ağından (CNN) geçecektir.Bu süreçte evrişimli sinir ağı k filtreleri aracılığıyla görüntü özelliklerini çıkaracaktır. Muhakeme ağındaki "nesne", grafikteki ızgaranın her noktasının özellik vektörüdür. Örneğin, yoldaki sarı vektör bir "nesneyi" temsil eder.

Problem, problemin karakteristik vektörünü oluşturacak bir LSTM ağından geçecektir. Bu sorunun "anlamını" kabaca ifade edebilir.

Denklem 1 için, ekstra bir terim ekleyen ufak bir düzeltme:

Ek terim q, LSTM'nin son durumunu temsil eder.

Bundan sonra, CNN ağından elde edilen "nesneler" ve LSTM ağından elde edilen vektörler ilişkisel ağı eğitmek için kullanılır. Her bir nesne çifti ve LSTM'den gelen soru vektörü, g'ya (bir sinir ağı) girdi olarak kullanılır.

Gnin çıktısını fye (başka bir sinir ağı) girdi olarak toplayın. Ardından soruyu yanıtlamak için f'yi optimize edin.

Kıyaslamalar

Yazar, modelin çeşitli veri setleri üzerindeki etkinliğini gösterdi. Burada yalnızca en önemli veri kümelerinden biri olan CLEVR veri kümesinin sonucunu tanıtır.

CLEVR veri seti, farklı şekil, boyut ve renkteki nesnelerin görüntülerini içerir. Modele aşağıdaki sorular sorulacak:

Bu küpün malzemesi bu silindirin malzemesi ile aynı mı?

Şekil 3: Nesne türü (üst), konum kombinasyonu (orta alt)

Yazar, diğer sistemlerin doğruluk açısından modellerinin çok gerisinde olduğunu belirtti. Bunun nedeni, ilişkiler ağının ilişkileri yakalamak için tasarlanmış olmasıdır. Onların modeli, yığılmış dikkat modelini kullanan sadece% 75'e kıyasla, benzeri görülmemiş bir% 96 + doğruluk elde etti.

Şekil 3.1 CLEVR veri kümesinde farklı yöntemlerin karşılaştırılması

sonuç olarak

İlişkisel ağ makineleri, öğrenme ilişkileri için uygundur. Bu yöntem, verileri verimli bir şekilde kullanabilir. Aynı zamanda yöntem, CNN ve LSTM ile hibrit bir çözüm olarak kullanılabilecek kadar esnektir.

Bu makale aynı zamanda birçok büyük medyanın "AI her şeyi devralacak" propagandasını doğru yorumlama yoluyla kırmak istiyor, böylece herkes en iyi yöntemin ne ölçüde başarabileceğini doğru bir şekilde anlayabilir.

Bu makale Leifeng tarafından derlenmiştir. Daha fazla anlayış için lütfen orijinal metni okuyun.

Orijinal adres: https://hackernoon.com/deepmind-relational-networks-demystified-b593e408b643

Kağıt adresi: https://arxiv.org/pdf/1706.01427.pdf, Leifeng.com tarafından derlenmiştir

"The Thing to Be Passed on: A Lullaby for the Dead" in Çince versiyonunun çıkış tarihi onaylandı
önceki
Leshan, 2019'da gerçekleştirilecek olan "Emei on the Cloud" sitcom'u "Only Mount Emei" nin oluşturulmasına büyük yatırım yaptı.
Sonraki
BMW X7 henüz gelmiyor mu? Aynı isim ve soyadına sahip bu yerli X7'ler çok popüler!
Haftalık yapay zeka etkinlikleri: kalıcı bir yapay zeka sentez çapasının doğuşu, Intel'in bir Hint çip başlangıcını satın alması
Jilin'de iki kayıp yedi yaşındaki kızın cesetleri bulundu. Ebeveynler arandıktan sonra kapatıldı.
Bir bilgisayarı onarmak geçmişte kaldı ve pornografik fotoğraflar yine de böyle fışkırabilir Röportaj Değişen Teknoloji CC
"Temiz" güç sağlamak için ultra düşük gürültülü LDO kullanın
SUV, Şangay Otomobil Fuarı'na hakim olmaya devam ediyor Hızlı büyüme ne kadar sürebilir?
Microsoft Hololens 2'yi 3.500 $, 3 büyük yükseltme ve yeni atılımlar karşılığında piyasaya sürdü
Teknoloji tanıtımı ve yenilik, yerli X86 CPU ve Intel'in ne kadar farkı var?
Her zaman genç bir zihniyete sahip olun, MG yüksek bir profille canlanma yoluna başlar
Hedefi iki saat içinde tamamlamak için "Horizon Zero Dawn" masa oyunu kitle fonlaması
AdaBoost-PSO-ELM algoritmasına dayalı heyelan yer değiştirme tahmini üzerine araştırma
"Marvel's Spider-Man" yeni CG promosyonu: yetenek ne kadar büyükse, sorumluluk da o kadar büyük
To Top