Yeni DeepMind Araştırması: Görüntü Programlarını Sentezlemek için Güçlendirilmiş Tartışmalı Öğrenmeyi Kullanma

Leifeng.com AI Teknolojisi Yorum Basını: Son zamanlarda, DeepMind tarafından yayınlanan bir blog, sayıların, karakterlerin ve portrelerin inşasını çıkarabilen yeni bir yapay zeka gövdesinden bahsetti. Daha da önemlisi, manuel olarak etiketlenmiş veri kümelerine güvenmek yerine bunu kendi başlarına yapmayı öğrenirler.

Gerçek dünya sadece gözümüze yansıyan görüntü değildir. Örneğin, bir binaya baktığımızda ve tasarımının karmaşıklığını anladığımızda, onun gerektirdiği işçiliği de takdir ediyoruz. Bu düşünce tarzı, dünyayı daha zengin bir anlayışa sahip olmamızı sağlayabilir ve aynı zamanda insan bilgeliğinin önemli tezahürlerinden biridir.

DeepMind'daki araştırmacılar, sistemlerinin aynı zengin dünya ifadesini yaratabileceğini umuyor. Örneğin, bir resmin görüntüsünü gözlemlerken, sistemin sadece ekranda temsil edilen pikselleri değil, tabloyu oluşturmak için kullanılan darbeleri anlayabileceği umulur.

Bu çalışmada araştırmacılar, yapay aracıları (aracıları) insanların görüntü oluşturmak için kullandıkları araçlarla donattılar ve figürlerin, karakterlerin ve portrelerin nasıl inşa edildiğini çıkarabileceklerini kanıtladılar. Daha da önemlisi, yapay olarak etiketlenmiş veri kümeleri yerine bunun nasıl yapılacağını kendilerine öğretiyorlar. Bu, insan deneyiminden öğrenmeye dayanan "Eskiz Çizimlerinin Sinirsel Temsili" adlı yeni bir çalışmanın tam tersidir. İnsan deneyimine dayanan öğrenme genellikle zaman alıcıdır.

Araştırmacı, bir bilgisayarla boyama programı ile etkileşime girebilen bir derin takviye öğrenme aracı tasarladı. Fırça darbeleri dijital tuval üzerine yerleştirildi ve fırça boyutu, basıncı ve rengi değiştirildi. . Bunun üstesinden gelmek için araştırmacıların, aracıları anlamlı fotoğraflar oluşturmaya teşvik eden bir ödül yöntemi oluşturmaları gerekir.

Bu amaçla araştırmacılar, ayırıcı adı verilen ikinci bir sinir ağını eğitti. Tek amacı, belirli bir görüntünün aracılar tarafından mı üretildiğini yoksa gerçek fotoğraflardan oluşan bir veri setinden mi örneklendiğini tahmin etmektir. Temsilciler, ayrımcıyı resimlerinin gerçek olduğunu düşünerek "kandırarak" ödüllendirilir. Başka bir deyişle, ajanların ödül sinyalleri kendileri öğrenilir. Bu, Generative Adversarial Networks (GAN) 'de kullanılan yönteme benzer olsa da aynı değildir. Çünkü GAN ağ ayarındaki jeneratör, genellikle doğrudan piksel çıkışı yapan bir sinir ağıdır. Buradaki aracılar, çizim ortamıyla etkileşim kurmak için grafik programları yazarak görüntüler oluşturur.

İlk deney setinde, temsilciler MNIST sayılarına benzer görüntüler oluşturmak için eğitildi: sayıların neye benzediğini gösterdi, ancak nasıl çizildiklerini göstermedi. Ajanlar, ayırıcıyı aldatan görüntüler oluşturmaya çalışarak, fırçayı kontrol etmeyi ve farklı sayıların tarzına uyum sağlamak için onu manipüle etmeyi öğrenirler.Bu, görsel prosedürel sentez adı verilen bir tekniktir.

Araştırmacılar ayrıca belirli görüntüleri yeniden üretmesi için eğitiyorlar. Burada, ayırıcının amacı, çoğaltılan görüntünün hedef görüntünün bir kopyası olup olmadığını veya aracılar tarafından üretilip üretilmediğini belirlemektir. Ayrımcıyı ayırt etmek ne kadar zor olursa, temsilciler o kadar çok ödül alır.

En önemlisi, bu çerçeve aynı zamanda yorumlanabilir çünkü analog fırçayı kontrol eden bir dizi eylem üretir. Bu, modelin simülasyon çizim programında öğrendiği bilgiyi sahte veya gerçek robotik kollar gibi diğer benzer ortamlarda karakter rekonstrüksiyonuna uygulayabileceği anlamına gelir.

Bu çerçeveyi gerçek veri setlerine genişletmek de mümkündür. Temsilciler ünlülerin yüz ifadelerini çizmek üzere eğitilirler ve tıpkı sokak sanatçılarının portreleri boyamak için sınırlı sayıda fırça kullanması gibi, yüzün şekil, ton ve saç modeli gibi temel özelliklerini yakalayabilirler:

Bilginin yapılandırılmış temsillerini ilkel duygulardan çıkarmak, insanların kolayca sahip olduğu ve sıklıkla kullandığı bir yetenektir. Bu çalışmada araştırmacılar, ajanın dünyayı yeniden üretmek için insanlarla aynı araçları elde etmesine izin vererek ajanın benzer temsiller üretmesi için yönlendirilebileceğini gösterdi. Bunu yaparken, nedenselliği kısaca ifade etmek için görsel programlar yapmayı öğrenirler, bu da gözlem güçlerini geliştirir. Bu çalışma şu anda esnek program sentezine doğru sadece küçük bir adımı temsil etse de, genelleme ve iletişim yetenekleri dahil olmak üzere ajanların insan benzeri bilişe sahip olmalarını sağlamak için benzer teknolojilere ihtiyaç duyulması beklenmektedir.

İlgili belgeler : Güçlendirilmiş Tartışmalı Öğrenmeyi Kullanan Görüntüler İçin Programları Sentezleme

Lei Feng net derlemesi

DeepMind aracılığıyla

Leifeng.com orijinal

Bu hafta "Onurlu Kitap Fotoğraf Yarışması" olarak yeniden adlandırılabilir.
önceki
"Wandering Earth" Liu Cixin ile 4 milyar derinlemesine diyaloğu kırdı: Takip nasıl bir şey?
Sonraki
Yırtıcı hayvan ve uzaylı "birbirini sever ve öldürür" ve 14 yıl boyunca el ele gider.
Film renginin güzelliğini yaşayın, Fuji X-A3 büyüleyici
Elektrikli araç şarj cihazlarının PFC aşaması, en yüksek verimliliği gerektirir - SiC kas kodu, gereksinimleri karşılayabilir
Pozlama istasyonu araştırması | Şaşırdım! Araba yıkama 25 yuan'den 60 yuan'e yükseldi Tatillerde kaç toplu fiyat artışıyla karşılaştınız?
2045'e kadar beklemeyin, şimdi bir Oasis inşa edebilirsiniz |
Jihai Yılında Bahar Şenliği Gözlemi
Ma Yili'nin aynı sahnedeki ikiz kahramanları Yao Chen, "Find You" Ulusal Gün dosyasına giriyor.
Sony'nin yeni 8K amiral gemisi piyasaya sürülen CES2019, ev sineması için nihai VIP seçimini getiriyor
UIV OLED aydınlatma kaynağının özelliklerinin kısa açıklaması, farklı ışığı anlayın
Neden alternatif yatırımlar galip gelebilir?
"Super-Large Beauty" 8.28'de "Fancy Boast" olarak ayarlanmıştır! Paket eğitim paketi toplantısı!
8K Çağında Büyük Ekran Stratejisi CES2019 Sony Yönetici Röportajı
To Top