Yapay zeka açık! Grafitilerinde insan düşüncesinin izleri var

Bir kaya üzerinde ilk kez bir görüntü çizerken, insanlık büyük bir bilişsel sıçrama gerçekleştirdi. Günümüzde bilgisayarlar da bu süreci takip etmektedir.

Bir domuz ve bir kamyon çizecek olsaydınız, şu şekilde çizebilirsiniz:

basit. Ancak, bir insan olarak sizden bir "domuz kamyonu" çizmeniz istenirse, doğal olarak iki şeyin göze çarpan özelliklerini karıştırmak istediğinizi bilirsiniz. Bunu şöyle çizebilirsiniz:

Resimdeki kıvrılmış domuz kuyruğuna dikkat edin; kabinin penceresi biraz yuvarlak, bir göz gibi; tekerlek bir domuz paçası gibi, ya da tam tersi domuz paçası bir tekerlek gibi oluyor. Bunu bu şekilde çizerseniz, o zaman ben de bir insan olan öznel bir değerlendirme yapacağım: bu, "domuz kamyonu" hızlı kelimesinin yaratıcı bir yorumudur.

Uzun bir süredir, sadece insanlar konseptte bu kadar keskin bir dönüş yaptı. Ama şimdi farklı. Yukarıdaki resim aslında Google Magenta projesinin bir parçası olan heyecan verici bir yapay zeka (AI) sistemi olan Google SketchRNN'den alınmıştır. Proje, Doug Eck liderliğindeki yapay zekanın sanatsal yaratımla ilgilenip ilgilenemeyeceğini araştırmayı amaçlıyor.

Geçen hafta, Mountain View'deki Google Brain ekip ofisinde Eck'i ziyaret ettim (Magenta proje ekibi de burada). Eke akıllı, uyumlu ve alçakgönüllüdür. 2000 yılında Indiana Üniversitesi'nden bilgisayar bilimi alanında doktora derecesi aldı ve daha sonra kendini müzik ve makine öğrenimine adadı, bir zamanlar Montreal Üniversitesi'nde (yapay zekanın kuluçka merkezlerinden biri) çalıştı, ardından Google'a katıldı ve kendini Google Music'in geliştirilmesine adadı. Eflatun proje.

Eke, sanatsal bir yaratıcı yapay zeka oluşturmayı nasıl düşünüyordu? Aslında fikir gündelik bir sohbetten kaynaklandı, "ama birkaç tur düşündükten sonra" dedi, "herkes" Elbette yapılacak, bu çok önemli "diye düşünmeye başladı."

O ve Google'daki iş arkadaşı David Ha (ses) şunları yazdı: SketchRNN'nin anlamı sadece çizmeyi öğrenmek değil, aynı zamanda "soyut kavramları insanlara benzer bir şekilde özetlemektir." Oluşturmak istedikleri şey, domuzları çizebilen bir makine değil, beslenen anahtar kelimeler domuzlar olmasa bile, yukarıdaki kamyon gibi "domuz benzeri özellikleri" tanıyabilen ve verebilen bir makinedir.

Temel mantık şudur: Resim, dünyanın bir soyutlamasıdır. Çizdiğiniz şey genel bir "domuz", bir kavram, domuz değil. Başka bir deyişle, beynin saklama şekli "" domuzları çizme şeklimizle alakasız değildir. Domuzları çizmeyi öğrenme sürecinde, insanların "domuzlar gibi özellikleri" nasıl genelleştirdiğini anlayabiliriz.

Bu yazılım şu şekilde çalışır: Google, oyuncuların büyük bir veritabanı oluşturmak için domuzlar, yağmur, itfaiye kamyonları, yoga pozları, bahçeler ve baykuşlar gibi çeşitli şeyler çizmesine olanak tanıyan "Quick, Draw!" Adlı bir oyun geliştirdi.

Resim yaparak, renkli ve gürültülü dünyayı birkaç darbeye sıkıştırıyoruz. Bu basit vuruşlar, SketchRNN'nin temel veri setini oluşturur. Google'ın TensorFlow açık kaynak yazılım kitaplığının yardımıyla, kedi, yoga, yağmur gibi her boyama kategorisi, belirli bir sinir ağını eğitmek için kullanılabilir. Buna karşılık, Van Gogh stilinde makine yapımı fotoğraflar veya orijinal DeepDream gibi fotoğraflara dayalı AI çalışmaları, son zamanlarda medyada sıkça görülüyor veya ayrıntıları rastgele şekillerde doldurarak insanların onlara bakmasını sağlıyor. Sadece bunun bir kedi olduğunu anlayın ve benzeri.

İnsanın öznel duygularına bakılırsa, bu işler inanılmaz hissettiriyor. İlginç olan, insanoğlunun gerçek dünya algısına benzer olmalarıdır, ancak özünde ikisi eşitlenemez.

Buna karşılık, SketchRNN'nin çıktısı hakkında inanılmaz bir şey yok. Ama "doğru geliyor," dedi Eke. "Boyanmış insanlar gibi 'demeye cesaret etmeyin, onlar doğru hissediyorlar, piksel piksel oluşturulan görüntülerden farklı."

Bu, Magenta ekibinin temel içgörüsüdür. Eke ve David Hacheng, araştırmayı anlatan makalede, "İnsanların gözündeki dünya tek bir piksel ızgarası değildir. Aslında, insanlar soyut kavramlar oluşturur ve bu kavramları gerçekte gördüklerini temsil etmek için kullanırlar." "Çok gençken, gördüklerimizi ifade etmek için kağıt üzerine çizmek için kalem veya boya kalemi kullanırdık."

Google, insanların yapabileceği her şeyi başarmak için makineler kullanmak istiyor. Google CEO'su Sundar Pichai (Sundar Pichai) geçen yıl "önce yapay zeka" konseptini duyurdu. Google'ın asıl misyonu "dünyanın bilgilerini düzenlemek ve dünya için kullanılabilir ve yararlı hale getirmekti" ve yapay zeka, bu misyonun doğal bir uzantısı haline geldi. Sadece şu anda, bu görev biraz değiştirilerek "bilgiyi yapay zeka tarafından kullanılmak üzere organize etmek ve daha sonra yapay zeka yoluyla insanlığa yararlı bilgiler sağlamak" olarak değiştirildi. Google'ın belirli insan alanlarını düzenleme ve anlama çabaları arasında, Magenta oldukça vahşi bir alan olarak görülebilir.

Google tarafından kullanılan çeşitli araçlar "makine öğrenimi" terimiyle özetlenebilir. Makine öğrenimi, bilgisayarı programlamak ve makinenin çeşitli görevleri kendi başına öğrenmesini sağlamak için eğitim materyalleri olarak etiketli verileri beslemektir. Makine öğreniminin yaygın olarak kullanılan bir yöntemi, insan beyninin sinir sisteminin sinir ağını kabaca taklit ederek öğrenmektir. Çeşitli düğümler (yapay nöronlar) birbirine farklı ağırlıklarla bağlanır ve çeşitli girdilere seçici yanıtlar verir.

Son yıllarda, çok katmanlı sinir ağları, özellikle çeviri ve görüntü tanıma / işleme alanlarında bazı zor sorunları çözme yeteneklerini göstermiştir. Google, bu yepyeni mimarileri temel hizmetlerinin çoğunu yeniden inşa etmek için kullandı. Bu ağlar, bilinen insan beyni işlemlerini taklit eder, ara bağlantı seviyelerine sahiptir ve farklı girdi türlerini (görüntüler gibi) tanıyabilir. Düşük seviyeli ağda, nöronlar yalnızca piksel seviyesindeki aydınlık ve karanlık modellere yanıt verebilir. Daha yüksek seviyeli ağlar, köpek yüzleri, arabalar veya kelebekler gibi şeylere yanıt verebilir.

Bir ağ oluşturmak için bu tür bir mimari ve mekanizma kullanmanın etkisi şaşırtıcı. Bir zamanlar aşırı derecede zor olan hesaplama problemi artık eğitim modelini ayarlayarak ve grafik işlem biriminin bir süre çalışmasına izin vererek çözülebilir. Gideon Lewis-Kraus'un (Gideon Lewis-Kraus) New York Times'da yazdığı gibi, Google Translate 10 yılda oluşturulmuş karmaşık bir sistemdir, ancak Google derin bir öğrenme sistemi kullanır. Sadece dokuz ayda tamamen değişti. Lewis Klaus, "AI sisteminin bir gecede iyileştirilmesi, eski sistemin doğumundan bu yana yapılan tüm iyileştirmelerin toplamına eşdeğerdir" diye yazdı.

İşte tam da bu nedenle sinir ağlarının kullanımı ve türleri patladı. Örneğin, SketchRNN tekrarlayan bir sinir ağı kullanır - bu tür bir ağ, girdi dizileriyle başa çıkmak için tasarlanmıştır ve eğitim materyali, insanlar farklı şeyler çizdiğinde yapılan vuruş dizisidir.

Basitçe söylemek gerekirse, bu tür bir eğitim kodlamaya eşdeğerdir: verileri ağa besleyin (yani eskiz) ve ağ içeriği işleyecek ve kuralları genelleştirecektir. Bu, tüm verilerin bir modelini oluşturur, ağdaki her bir nöronun eğilimini tanımlar ve bunu matematiksel biçimde depolar.

Bu konfigürasyona canlı bir şekilde gizli alan adı verilir ve ayrıca domuzlar, kamyonlar veya yoga gibi şeylerin özelliklerini saklayan Z (Zed) olarak da bilinir. Yapay zeka araştırmacılarının dediği gibi, SketchRNN sisteminin eğittiği şeyi çizmesine izin verin ve bir domuz, bir kamyon veya bir yoga pozu çıkaracak. Ne çizersen onu öğrenirsin.

Peki SketchRNN ne öğrenebilir? Araştırmacılar, yeni itfaiye araçları üretmek için ağı eğitmek için insanlar tarafından çizilen itfaiye araçlarını kullandılar ve sonuçlar aşağıdaki gibidir. Modelde rastgeleliği artırmak veya azaltmak için kullanılabilecek "sıcaklık" adlı bir değişken bulunmaktadır. Aşağıdaki resimde, mavimsi renk tonunun rastgeleliği düşüktür ve kırmızı renk tonunun rastgeleliği yüksektir.

Bir baykuşa dönüşmek:

En iyi örnek yoga asanadır:

İnsan el yazısına çok benziyorlar, ancak kesinlikle insan eliyle yapılmıyorlar, insan eskizlerine göre yeniden yapılandırılıyorlar. Bu resimlerin seviyesi iyi veya kötü, ancak AI ile "Resimli" oyunu oynarsanız, aynı şeyi tahmin edebilmelisiniz.

SketchRNN'nin diğer bir işlevi, insan eskizleri biçiminde girdi almaktır. Bir şeyi beslersin ve o onu anlamaya çalışır. Örneğin, bir modeli eğitmek için kedi verilerini kullanın ve ardından bunu üç gözlü bir kedinin çizimine atın. Ne olacak?

bak? Sağdaki her çıktı (sıcaklık değişkenleri hala geçerlidir) üçüncü gözü kaldırmıştır! neden? Çünkü öğrenme yoluyla, model bir kedinin üçgen kulakları, yuvarlak bir yüzü, her iki yanında bir bıyığı ve sadece iki gözü olduğunu zaten biliyor.

Elbette, model bir kulağın ne olduğunu ya da bir kedinin bıyığının hareket edip etmeyeceğini ya da yüzün ne olduğunu bile anlamıyor, gözlerin görüntüleri beyne iletebilmesi bir yana, çünkü fotonlar retinanın özel hücrelerindeki rodopsin proteinini değiştirebilir. şekil. Resimde belirtilen gerçek dünyayı anlamıyor.

Ancak insanların kedilere, domuzlara, yoga ya da yelken açmaya nasıl davrandıklarını bilir.

Google'dan Eke, "Yelkenli çizimleri oluşturmaya başladığımızda, model yüzlerce başka yelkenli modeliyle doldurulacak." Dedi. "Temelde anlayabiliriz, çünkü model tüm eğitim verilerinden platonik bir yelkencilik 'kavramı' çıkardı, yani" ilkel "yelkenciliği bana vurmanız gerekebilir. Bu belirli bir gemi değil. Yelkenli tekne, ancak bir yelkenli tekne özelliğine sahiptir. "

Kelimeleri söyler söylemez, yüksek sesle konuşacağı için biraz pişman görünüyordu. "Filozoflar beni ayıramaz" dedi. "Bununla birlikte, çok soyut olmasına rağmen, yine de anlaşılabilir." (Atlantic Monthly dergisinde yerleşik filozof Ian Bogst, "Felsefede, bu saf içsel materyalizmdir" dedi.)

Yapay zeka hareketinin bir parçası olmak ve tarihteki en heyecan verici teknoloji projesine katılmak, en azından içeriden öğrenenler ve diğerleri için bir tutku. Bununla birlikte, Doug Eck gibi insanlar bile hazırlıksız yakalanır.

Demek istediğim, örneğin, bir ağı eğitmek için "Yağmur Çizimi" kullanın ve ardından bir bulut girin, sonuç şu şekilde olacaktır:

Modele bir bulut beslersiniz ve bulut "yağmur yağar". Bunun nedeni, birçok insanın önce bulutları sonra yağmur damlalarını boyayarak yağmuru boyamasıdır. Bu nedenle, sinir ağı bulutu gördükten sonra aşağıya yağmur damlaları ekleyecektir (İlginçtir, eğitim verileri bir dizi sıralı vuruştur, bu nedenle önce yağmur damlalarını çizerseniz, model tekrar bulut kalıpları oluşturmayacaktır.)

İlginçtir, ama insan zihninin uzun vadeli tersine mühendislik projesinde, bu sadece bir yan proje mi yoksa gizemi çözmenin anahtarlarından biri mi?

Eke'yi ilgilendiren şey, eskizlerin bu kadar sınırlı bilgilerle bu kadar zengin bir anlam içerebilmesidir. "Gülümseyen bir yüz için sadece birkaç vuruş var," dedi piksel doğruluğu olan bir yüz fotoğrafından çok uzak. Ancak üç yaşındaki bir çocuk bile bunun bir yüz olduğunu anlayabilir ve mutlu mu yoksa üzgün mü olduğuna karar verebilir. Eke, bunun bir tür sıkıştırma, bir tür kodlama olduğuna, SketchRNN'nin önce kodunu çözdüğüne ve ardından keyfi olarak yeniden kodlayabileceğine inanıyor.

Bu, Scott McCloud'un çizgi romanların gücüne ilişkin yorumuna biraz benziyor.

"SketchRNN'nin çalışmasını çok destekliyorum, çok iyi." OpenAI araştırmacısı Andrej Karpathy (Andrej Karpathy), kurumun AI araştırması için merkezi bir iletişim düğümü haline geldiğini söyledi. Ancak Karpis, modellerinin vuruşların önemi konusunda güçlü varsayımlar yaptığına da dikkat çekti.Bunun sonucunda, yapay zeka geliştirme işinin tamamında görece küçük bir role sahip olduğu ortaya çıktı.

"Genellikle, genel bir model geliştirdiğimizde, modeli veri setinin ayrıntılarından cahil yapmaya çalışırız. Hangi verileri beslerseniz besleyin: görüntüler, ses, metin veya diğerleri, işe yarayabilmelidir." Dedi. "Resimler dışında, başka hiçbir şey darbelerden yapılmaz."

"İnsanların büyük varsayımlar yapmaları, modeller derlemeleri ve kendi özel alanlarında olağanüstü sonuçlar elde etmeleri umrumda değil," diye ekledi.

Eke ve David Ha'nın sistemi, herhangi bir oyunda kural bulabilen ve kazanabilen bir yapay zeka yerine satranç oynayabilen bir yapay zekaya daha çok benziyor. Karpis'e göre sistemin kapsamı dar görünüyor.

Ancak çizgi çizmenin insan düşüncesinin temelini içerdiğine inanmak için nedenlerimiz var. Resimlerin gücünden etkilenenler yalnızca Google araştırmacıları değil. 2012 yılında, Georgia Teknoloji Enstitüsü'nden James Hays, Mathias Eitz ve Berlin Teknik Üniversitesi'nden Marc Alexa birlikte bir çubuk figür veri kümesi oluşturdu. Ve onları tanımlamak için kullanılan makine öğrenimi sistemi.

Çubuk figürlerin tüm insanlık için evrensel bir iletişim biçimi olduğuna inanıyorlar. Normal bilişsel işlevlere sahip kişiler bu şekilde iletişim kurabilir ve hepsi bu tür bir iletişimi gerçekleştirmiştir. "Tarih öncesi çağlardan beri, insanlar büyük bir dünyayı tasvir etmek için çubuk figürlere benzer petroglifleri veya mağara resimlerini kullandılar" diye yazdılar. "Bu tür bir kaya resmi, dilden on binlerce yıl önce ortaya çıktı. Bugün, herkes resimdeki nesneleri boyama ve tanıma yeteneğine sahip."

Toronto Üniversitesi'nde sinirbilimci olan Dirk Walther'in yazdığı Proceedings of the National Academy of Sciences'daki bir makaleye atıfta bulundular. Makale, "basit, soyut eskizin, fiziksel bir nesnenin beyin üzerindeki uyarıcı etkisine benzer şekilde beyin üzerinde uyarıcı bir etkiye sahip olduğunu" gösteriyor. Yazarlar, piksel düzeyinde kedi çizgi filmleri olmasına rağmen, çizgi çiziminin "doğal dünyanın özünü yakaladığına" inanıyor. Kedi fotoğraflarından tamamen farklı.

İnsan beyin nöronları da, sinir ağının kabaca taklit ettiği gibi hiyerarşik olarak çalışıyorsa, o zaman bu resimleri takip edebilir ve basitleştirilmiş bir nesne kavramı bulabiliriz - Walther'in sözleriyle, "öz "-Saklandığı yer. Başka bir deyişle, bu resimler bize atalarımızın yaklaşık 100.000 yıl önce nasıl modern insanlara dönüştüğünü ve bu yeni düşünce tarzının nasıl başladığını anlatabilir. İster mağaranın duvarında ister bir kağıt havlunun arkasında, resmin tasvir ettiği şey, attan "atın özelliği" ne, günlük deneyimden sembolik soyut düşünceye bir sıçrama olabilir, modern insanlar bu süreç içindedir. Doğdu.

Dil, para, matematikten hesaplamanın kendisine kadar çağdaş yaşamın çoğu bu geçişten kaynaklanıyor. Dolayısıyla eskiz yapmak önemli yapay zekanın yaratılmasında önemli bir rol oynayabilirse bu da mantıklıdır.

Lascaux Mağara Resimleri

Elbette insanlar için eskiz, nesnelerin bir tasviridir. Dört çizgiden oluşan soyut temsil ile nesnenin kendisi arasındaki ilişkiyi rahatlıkla anlayabiliriz. Kavram anlamlıdır. SketchRNN için çizim, kademeli olarak şekil alan bir dizi konturdur. Makinenin görevi, dünyanın orijinal görünümünü anlamaya çalışmak, resimde çizilen şeylerin özünü okumaktır.

SketchRNN ekibi, çeşitli yönlerde keşif yapıyor. İnsan geri bildirimi yoluyla çizim becerilerini geliştirmek için bir sistem oluşturabilirler; ayrıca tek bir modeli eğitmek için birden fazla şeyin eskizlerini kullanabilirler. Ya da belki domuzların özelliklerini tanımasına izin vermek gibi özel bir model eğitecekler ve ardından fotoğraf düzeyinde görüntüler üretip üretemeyeceğini görmek için onu genelleştirmeye çalışacaklar. Bu şekilde, kedi portresini renklendirmek için Berkeley'deki California Üniversitesi tarafından oluşturulan sinir ağını kullanabilirler.

Not: Bu, yazar tarafından yukarıdaki işlemle çizilen kedidir.

Ancak kendileri SketchRNN'nin yalnızca "ilk adım" olduğunu ve birçok şeyin hala öğrenilmesi gerektiğini kabul ediyorlar. Eskizleri çözen bu makineler, insanlık tarihinin bir bölümünü temsil ediyor ve bu yay çok uzun. İnsan sanatı tarihinin ortaya çıkışı ve gelişimi, neredeyse teknoloji tarihinin tersine dönmesidir.

Judith Thurman, Avrupa'da New Yorker dergisi için mağara resimleri yazarken, Paleolitik sanatın "temelde 2500 yıldır değişmeden kaldığını, çok az yenilik veya isyanla" kaldığını yazdı. "Evet," dedi. Kelimelerle test edilebilen tarihin uzunluğu, uzunluğunun yalnızca dörtte biri kadardır. "

Bir bilim adamı Thurman'a, bu tür bir sanatın derin bir tatmin getirmesi gerektiğini ve içinde bulunduğu genel kültürel çevrenin de çok istikrarlı olması gerektiğini söyledi.

Bilgisayarlar, özellikle de en son yapay zeka teknolojileri, "insanların nelerde iyi olduğu" konusunda uzun süredir devam eden nosyonu sarsıyor. 1990'larda insanlar damadaki makinelere ve ardından satrançta kaybettiler. Son zamanlarda Go.

Bununla birlikte, AI alanında son zamanlarda yapılan önemli araştırmalar birbiri ardına ortaya çıktı, çünkü bu, keşfedilmemiş bölgeyi çok hızlı bir şekilde geçmesi değil (gerçekten hızlı olmasına rağmen). Eke için bu daha çok insan düşüncesinin temel taşlarını keşfetmeleri ve daha da ileri gitmeleri, "biz kimiz" sorusu. Eck bana "Sanatın gerçek özü, insanlar arasındaki iletişim olan temel insan doğasıdır" dedi.

Derin öğrenme girişimine baktığımızda, pek çok insan insan yaşamının arkasındaki mekanizmaları araştırıyor - şeyleri nasıl görüyoruz, nasıl hareket ediyoruz, nasıl konuşuyoruz, yüzleri nasıl tanıyabiliriz, bölümlere nasıl aktarılır, müzik nasıl çalınır? Herhangi bir belirli kişi, ancak insanların ortak bir özelliği.

Şu anda, gerçek düşünceyi yalnızca çizgi roman veya çöp adam gibi düşük çözünürlüklü biçimde ifade edebiliyor. Ancak taslaktan, zekanın yakınsama sürecini görmek zor değil.

Çeviri: Kaz

Kaynak: The Atlantic

En iyi lama kim? Geldan, Kumazhi ve Kral Gurudeva'nın pislik olduğunu söyledi!
önceki
Açık büfe yerken, 3 çeşit yemek yemeyi bitiremezseniz "dolaşabilirsiniz", garson sizi durduramaz
Sonraki
Hem ortak hem de yerli olmak üzere 150.000'e satın alınabilen 4 "Patron Arabası"
Ming cephaneleri Moğolları savurabilir! Mançu Sekiz Sancak Ordusu önünde neden başarısız oldu?
Uzmanlar pirinç alırken bu 4 çeşit pirinci gördüklerinde başlarını çevirdiler: Pirinç dükkanının sahibi: Biz kendimiz yemiyoruz!
Qing Hanedanlığı'nda Çin ateşli silahları neden azaldı? Kokmuş satranç sepetine her zaman geride kalmadan satranç oynamak için eşlik edebilir misin?
Dünyanın ilk yeni nesil Buick Excelle testi: kapsamlı güç, konforun iyileştirilmesi gerekiyor
Avrupa Orta Çağındaki en başarılı karşı saldırı! Norman Fatihi Robert Giscal Efsanesi
Güneylilerin yemeyi sevdiği 5 yemek, kuzeylilerin en çok "tiksindiği" yiyecekler.
Ming ordusu neden Salhu Savaşı'na güvenle ortak bir saldırıya girişmeye cesaret etti?
En ucuz 2 ABD SUV 100.000'e otomatik şanzıman satın alabilir!
Lu Xun'un sözleri bazen güvenilmez oluyor! Çin'in havai fişek için sadece barut kullandığını kim söyledi?
Bu 7 çeşit baharatlı erişteyi yemiş olanlar için çocuklukta büyük bir baharatlı erişte envanteri, çocuklar soya sosu yapabilir!
69.800'den başlayarak, tüm fiyat noktaları için panoramik sunrooflu SUV'ler önerilir ve sonuncusu "Mobil Villa" olarak adlandırılır.
To Top