Derinlik | Yapay zekanın düşünmeyi öğrenmesine izin verin, belki önce çizmeyi öğretin

Bu yılın Nisan ayında Google, AI'nın insanların çizim yapmasına yardımcı olan AutoDraw çizim işlevini başlattı ve yalnızca birkaç vuruş, sanatçı düzeyinde çizimler oluşturabilir. Bu ilginç AI uygulaması, sektörü heyecanlandırıyor. Mevcut sonuçlara göre, AI vuruşları hala biraz olgunlaşmamış, ancak bu Google'ın, bazı popüler bilim odaklı Makalelerin yayınlanması gibi, arkasındaki AI sistemini kamuoyuna yüksek profilli bilim popülerleştirmesini engellemiyor. Arkasındaki AI sistemine, Google'ın sanat için kullanılıp kullanılamayacağını test etmek için Google'ın yeni Magenta projesinin bir parçası olan SketchRNN adı verildi.

Teatlantik Atlantik dergisi, bu projeyi ve arkasındaki hikayeyi daha iyi anlamak için Magenta projesinin lideri Doug Eck ile röportaj yaptı. Leifeng.com röportaj içeriğini derledi.

Eck, Montreal Üniversitesi'nde bir profesördür (yapay zekanın yuvası olarak kabul edilir) ve ayrıca Google'da çalışmaktadır. Önceden Google Müzik'ten sorumluydu ve şimdi Google Brian'da çalışmak üzere transfer edildi. 2000 yılında Indiana Üniversitesi'nden bilgisayar bilimi alanında lisans derecesi aldıktan sonra Eck, müzik ve makine öğrenimi alanında kapsamlı deneyime sahiptir.

AI sistemi SketchRNN ile ilgili olarak, onu daha canlı bir şekilde anlamak istiyorsanız, aşağıdaki üç resme bakabilirsiniz:

İnsanlardan bir domuz ve bir kamyon çizmeleri istendiğinde, şöyle olabilir:

Bununla birlikte, bir "domuz arabası" çizmeniz istendiğinde, ikisinin göze çarpan özelliklerini sezgisel olarak karıştırabilir ve bu şekilde çizebilirsiniz

Fırça hala çok olgunlaşmamış görünse de, karışık ürün aslında yapay zeka sistemi SketchRNN'nin çıktısına biraz benziyor. Eck ve Google'dan iş arkadaşı David Ha'nın tanıttığı gibi, SketchRNN'nin çalışma prensibi "soyut kavramları insanlara benzer bir şekilde özetlemek" olarak anlaşılabilir.

Önceki makaledeki örnekler, Google'ın "domuz" çekmek için bir makine yaratmak istemediğini, ancak ondan oluşturulan makinenin "domuz" kavramını veya özelliklerini tanıyıp ana hatlarını çizebildiğini göstermektedir. Özetle, insanlar bir nesneyi çizdiklerinde, nesnenin kavramını ve göze çarpan özelliklerini beyinlerinde saklarlar ve "nasıl çizilir" ile "mağaza özellikleri" arasında bir bağlantı kurarlar. SketchRNN'nin önemi, makinelerin insanların bu "kapsamlı yeteneğini" öğrenmesine izin vermektir.

Bu amaçla Google, "Quick, Draw!" Adlı bir oyun geliştirdi. İnsanların oynadığı oyun gibi, Google da oyun için çok sayıda yapay grafik veritabanı oluşturdu. Eğitim verileri baykuşlar, sivrisinekler, bahçeler veya balta gibi 75 tür nesne içerir.Her veri en az 70.000 ayrı örnek içerir. Google, "Quick, Draw!" İle elde edilen çizim verilerine dayanarak, SketchRNN'nin AI sistemini geliştirdi.

İnsanlar eskiz yaparken, renkli ve gürültülü dünya yalnızca birkaç satır kurşun kalemle sıkıştırılabilir. Bu basit vuruşlar, SketchRNN'nin veri kümesidir. Kediler, yoga pozları, yağmur vb. Gibi her nesne boyama türü, belirli bir sinir ağı türünü eğitmek için Google'ın TensorFlow açık kaynak platform yazılım kitaplığını kullanabilir. Makine Van Gogh veya orijinal DeepDream tarzında bir fotoğraf sunduğunda, insanlar her zaman biraz tuhaf hissederler, çünkü makinenin konsepti veya nesnenin göze çarpan özellikleri bu kadar esnek veya izsiz bir şekilde entegre edilemez.

Bu projeler insanları gizemli ve öznel bir şekilde hissedebilir, ancak ilginç olan gerçek dünya algılarının benzer olması, ancak insanlarla tam olarak aynı olmamasıdır.

Ancak SketchRNN'nin çıktısı garip değil. Eck şunları söyledi:

"Yaklaşımının" çok insan "olduğunu söylemek istemiyorum, ancak algısı, pikseller tarafından oluşturulan resimlerin neye benzediğinden çok daha fazlası."

Bu aynı zamanda Eck'in liderliğindeki Magenta ekibinin de temel içgörüsüdür. Eck ve Ha makalelerinde, "İnsanlar dünyayı piksellerden farklı bir şekilde anlarlar, ancak bunun yerine gördüklerimizin yerine soyut kavramlar geliştirirler", "Çocukluğumuzdan beri resim yoluyla geliştik. Gördüklerimizi başkalarına iletme yeteneği. "

Dolayısıyla, insanlar bunu yapabiliyorsa, Google makinelerin de aynısını yapabileceğine inanıyor. Google CEO'su Sundar Pichai geçen yıl "AI First" ün gelecekteki geliştirme stratejisini duyurdu. Şirket için AI, "dünyanın bilgisini organize etme ve onu evrensel ve kullanışlı hale getirme" misyonunun doğal bir uzantısıdır. Bu nedenle, Google, insanların bu bilgilere erişip kullanabilmesi için bilgileri organize etmek için AI kullanmaya çalışıyor. Magenta projesi, Google'ın bu vizyon altındaki girişimidir.

Makine öğrenimi, Google tarafından son yıllarda yaygın olarak kullanılan bir yöntemdir. Bunların arasında, makine öğreniminin belirli bir yöntemi, kabaca insan beyni bağlantı sisteminin modellenmesine dayanan sinir ağlarını kullanmaktır. Çok seviyeli sinir ağları, özellikle çeviri ve görüntü tanımada zor problemleri çözmede özellikle etkilidir. Google, bu yeni mimariler üzerinde birçok temel hizmeti yeniden inşa etti.

Örnek olarak Google Translate'i ele alalım. 10 yılı aşkın süredir oluşturulmuş karmaşık bir sistem olmasına rağmen, Google sonunda derin öğrenme yoluyla sistemin yeniden inşasını 9 ayda tamamladı. Yani bu durumda, sinir ağlarının kullanımı ve türleri son yıllarda patlayıcı bir büyüme kaydetti.

Sinir ağlarının temeline dayanan SketchRNN, üretken bir tekrarlayan sinir ağı kullanır. Google'ın makaledeki girişine göre, bu tür bir sinir ağı basit nesnelerin çizimlerini oluşturabilir.Amaç, soyut kavramları çizebilen ve özetleyebilen bir makine yetiştirmektir ve düşünme modu insanlarınkine benzer.

Eğitimi tanımlamanın en kolay yolu, onu bir kodlama yöntemi olarak kullanmaktır. Verileri girdikten (taslak) sonra, sinir ağı işlenen verilerdeki bazı genel kuralları özetlemeye çalışır. Bu genel kurallar, ağdaki nöronların özelliklerini tanımlayan matematikte saklanacak olan veri modelidir.

Bu işleme gizli boşluk veya "Z" (zed) denir. Eğitim süreci boyunca öğrenilen şeyleri, örneğin bir domuzun, bir kamyonun veya bir yoga duruşu gibi özellikleri içine alabilir ve içinde saklanacak ve ardından "Z" bunları örnekleyecektir.

Peki SketchRNN ne öğrenebilir? Aşağıda, bir itfaiye aracı tarafından eğitilen bir sinir ağı tarafından üretilen yeni bir itfaiye aracı örneği verilmiştir. Bu modelde, bir "sıcaklık" değişkeni vardır ve araştırmacılar çıktının rasgeleliğini yukarı veya aşağı ayarlayabilir. Aşağıdaki resimlerde, mavimsi olanlar daha düşük "sıcaklığı" ve kırmızımsı olanlar daha yüksek "sıcaklığı" gösterir.

Ya da baykuşu görmeyi tercih edersiniz:

Veya en iyi örnek yoga pozları:

Yukarıdaki durumlardan, SketchRNN'nin çıktısı insan tarzına çok benziyor, ancak kendileri insanlar tarafından çizilmiyor. Başka bir deyişle, insanların bir şeyi resmetme şeklini yeniden inşa ediyorlar. Elbette bazıları çok iyi yeniden inşa edildi, bazıları değil.

Aynı zamanda SketchRNN, yapay görüntüler biçiminde girdileri de kabul edebilir. İnsanlar içeri bir miktar içerik gönderdiğinde, SketchRNN bunu anlamaya çalışacaktır. Aşağıdakiler, kedi verileri üzerine eğitilen bir modeldir. Bu üç gözlü kedi resminde ne gibi değişiklikler bulacaksınız?

Yukarıdaki şekilden de görülebileceği gibi üçüncü göz soldan sağa çeşitli çıkışlardan çıkarılmıştır. Çünkü model kedinin üçgen kulakları, sakalı, yuvarlak yüzü ve sadece iki gözü olduğunu bilir.

Elbette model kulakların ne olduğunu veya yüzün neye benzediğini bilmiyor. Bu çizimlerde gösterilen dünya hakkında hiçbir şey bilmiyor. Ancak insanların kedileri, domuzları veya yelkenlileri nasıl tasvir ettiğini biliyor.

Eck, "Yelkenli diyagramı oluşturulduğunda, model yüzlerce farklı yelkenli türü girecektir. Bu yelkenli tekneler bu diyagramdan gelebilir. Bu bizim için mantıklıdır çünkü model zaten tüm bu eğitim verilerinden öğrenmiştir. İdeal yelkenli yaratıldı. "

Yağmur damlaları çizebilen bir ağ eğitin ve ardından bir bulut taslağını girin, bunu yapacak:

Girdi modelinde yağmur damlaları buluttan düşecek. Bunun nedeni, birçok insan yağmur damlaları çizdiğinde önce bulutları sonra da düşen yağmuru çizmesidir. Yani sinir ağı bir bulut görürse, şeklin altına yağmur yağacak. (İlginçtir, önce yağmur çekerseniz, model bulut oluşturmaz.)

Bu ilginç bir iş ama insan zihninin tersine mühendisliğinde böyle bir projenin amacı nedir?

Eck açıklamalarla ilgilenir çünkü bunlar anlam bakımından zengin ancak çok az bilgi içerir. Gülümseyen bir yüz veya hatta bir piksel koleksiyonu çizmek için yalnızca birkaç vuruş vardır, ancak 3 yaşın üzerindeki herkes onu bir yüz olarak tanıyabilir ve hatta mutlu ve üzgün yüzleri ayırt edebilir. Eck, bunun bir tür sıkıştırma, SketchRNN'nin kodunu çözebileceği ve hatta yeniden kodlayabileceği bir kodlama olduğuna inanıyor.

OpenAI araştırmacısı Andrej Karpathy, SketchRNN'nin çalışmalarıyla da ilgileniyor. OpenAI aynı zamanda bir yapay zeka araştırma merkezidir. Ancak, bu projenin birçok ön koşulu karşılaması gerektiğine de işaret etti, bu da işletmelerin yapay zeka geliştirmede çok yardımcı olmayacağı anlamına geliyor.

"Geliştirdiğimiz üretken modelin genellikle veri kümesinin ayrıntılarıyla mümkün olduğunca hiçbir ilgisi yoktur. Girdiğiniz veriler ne olursa olsun, görüntüler, sesler, metinler veya başka herhangi bir şey dahil olmak üzere kullanılabilir olmalıdır. Görüntüler dışında hiçbir şey darbelerden oluşmaz. . "

Eck ve Ha'nın geliştirmekte olduğu şey, herhangi bir oyunu oynayabilen bir yapay zeka yerine satranç oynayabilen bir yapay zekaya daha yakın. Bu yüzden Karpathy için, mevcut çalışmalarının kapsamı sınırlı görünüyor.

Ancak çizgi çizimlerin insan düşüncesinin temeli olduğuna inanmak için bazı nedenler var. Eskizlerin gücünden etkilenen tek araştırmacı Google çalışanları değil. 2012'nin başlarında, Georgia Teknoloji Enstitüsü'nden James Hays, Mathias Eitz ve Münih Teknik Üniversitesi'nden Marc Alexa, bir eskiz veri kümesi ve bunları tanımlamak için bir makine öğrenimi sistemi oluşturmak için işbirliği yaptı.

Onlar için eskizler, standart bilişsel işlevlere sahip tüm insanların yapabileceği bir "evrensel iletişim" biçimidir. Tarih öncesi çağlardan beri, insanların dünyayı taslak petroglifler veya mağara resimleri şeklinde tanımladıklarına inanıyorlar.Bu tür piktograflar, dilin ortaya çıkışından yüzbinlerce yıl öncesine dayanıyor ve eskiz çizme ve tanıma becerisinin artık temel olduğuna inanıyorlar.

Toronto Üniversitesi'nde sinirbilimci olan Dirk Walther, basit ve soyut çizimlerin gerçek uyaranlara benzer şekilde beynimizi harekete geçireceğine işaret etti. Walther'in hipotezi, çizgi çiziminin doğal dünyamızın özünü temsil ettiğidir, çünkü pikseller temelinde bazı kedilerin çizgileri bir kedi gibi görünmeyecektir.

Eskizler, "öz" dediğimiz depolama nesnelerinin kavramsal hiyerarşisini kavramamıza yardımcı olmanın bir yolu olabilir. Başka bir deyişle, atalarımız geçtiğimiz 100.000 yılda kademeli olarak modernleştiğinde insanların nasıl düşünmeye başladığını bize anlatabilirler. Eskizler ve mağara resimleri, günlük deneyimlerden soyutlamaya nasıl geçtiğimizi tasvir edebilir.

Çoğu modern yaşam bu dönüşüme sahiptir: dil, para, matematik ve hesaplamanın kendisi. Bu nedenle eskizin önemli yapay zeka yaratmada önemli bir rol oynayacağına karar verilirse mantıklıdır.

Elbette insanlar için eskizler gerçek şeylerin tasviridir. Soyut çizgilerle gerçek şeyler arasındaki ilişkiyi kolayca anlayabiliriz. Bu konsept bizim için çok şey ifade ediyor.

SketchRNN için, çizim bir dizi konturdur ve şekil zaman içinde oluşturulur. Makinenin görevi, çizimlerde tasvir edilen şeylerin özünü çıkarmak ve onları dünyayı anlamak için kullanmaya çalışmaktır.

SketchRNN ekibi birçok yönden keşfediyor. İnsan geribildirimiyle daha iyi sonuçlar almaya çalışmak için bir sistem kurabilirler. Modeli eğitmek için birden çok çizim kullanabilirler. Belki de modellerinin gerçekçi görüntülere genellenip genellenemeyeceğini görmenin bir yolunu bulacaklar. Ancak kendileri SketchRNN'nin ilk adım olduğunu ve öğrenecek çok şey olduğunu kabul ediyorlar.

İnsan sanatının tarihi, teknolojik çağla karşılaştırılamaz.

Eck'e göre, insanların nasıl düşündüğünün temelini anlamak istiyorlar ve ona göre sanatın temel bir parçası, temel insan doğasını temsil etmesidir. Derin öğrenmeyi anlamak için, insan yaşamının temel mekanizmalarını, yani dünyayı nasıl gördüğümüzü, nasıl konuşacağımızı, yüzleri nasıl tanıyacağımızı, sözcüklerle nasıl hikaye oluşturacağımızı ve müziğin nasıl düzenleneceğini de anlamamız gerekir. Herhangi bir insanla ilgili görünmüyor, ancak soyut bir insanı temsil ediyor.

Son olarak, SketchRNN'nin AI sistemini daha iyi anlamak istiyorsanız, Leifeng.com küçük bir avantaj sunar _ Google'ın resmi Makalesini almak için bu bağlantıya tıklayabilirsiniz.

Theatlanic aracılığıyla, Leifeng.com tarafından derlenmiştir.

Önümüzdeki ay SLI Chongqing Major finalleri yapılacak, 16 takım bir milyon dolar için yarışacak
önceki
"The Shame of Iron Fist" Çin 2D filmleri için gişe rekorunu kırdı ve kamera arkası özelini ortaya koyuyor
Sonraki
Steam Madness Çarşamba: "Great God" ve "Dragon Ball Fighter Z" tarihi yeni düşük fiyatlar
Jack Su dedi, yenilgiyi kabul etmedi
Gece Okuması Kolejlerde ağaca tırmanmak 15 yıldır evli olan ve boşanmak isteyen bir kadın evlilik cüzdanında kocasının erkek kardeşini bulur
Nie Yuanchao, havaalanında dolaşırken kızını evcilleştirir.
Bana yorum yapıyorsun - OpenAI ve DeepMind'in yeni pekiştirmeli öğrenme yöntemi, insan geri bildirimlerine dayalı verimli öğrenme
Wu Yusen'in yeni filmi "The Hunt": Bu iki adamı dövüştürmek kesinlikle iyi bir dizi!
"Boncukları Geri Getirmek" Qing'er Lafayette cariyesine rahat kıyafetlerle fotoğraf çekmesini emretti.
"Çok Büyük Gelen Aramalar" 1208 olarak ayarlandı
Zhao Liying için üretimi azaltmak mı? Feng Shaofeng: Yeni aşamayla tanışmak için daha kaliteli işler
"Pokemon" yeni sürüm konferans grafiği canlı yayın özeti
Huawei'nin ilk kazma ekranlı telefonu bir kez daha arkadaşlarıyla çarpıştı! Bu sefer Samsung
2017 Bilim Kurgu Filmlerinin Tam El Kitabı
To Top