Yapay zekayı yalnızca büyük ölçekli bilgi işlem gücü kurtarabilir mi? Takviye Öğrenmenin Babası Oxford Profesörü'ne Karşı Bir Uzay Tartışması Başladı

üretilen içbükey tapınak kübitinden Qian Ming Anni | genel sayı QbitAI

70 yıldır insanlar Arka arkaya aynı hataları yap ".

Bu, "Takviyeli Öğrenmenin Babası" Richard S. Sutton (Richard S. Sutton), akranları için bir uyandırma çağrısı yaptı.

Blogdaki son makaleyi yayınladı " Acı ders "(The Acı Ders), AI geliştirme tarihindeki garip çemberi özetliyor:

İnsanlar, yapay zekaya insan düşüncesi ile satranç oynamayı öğretmek, yapay zekanın görüntüleri insan düşüncesine göre tanımasına izin vermek gibi yapay zekaya sürekli olarak kendi bilgilerini ve düşünme yollarını yerleştirmeye çalışıyorlar. Bu uygulamalar geçici performans iyileştirmeleri sağlayabilir, ancak uzun vadede araştırmanın devam eden ilerlemesini engelleyecektir.

Gerçek buluşlar her zaman tamamen zıt yönlerden gelir. Belirli alanlarda insan bilgisinden vazgeçmek ve büyük ölçekli bilgi işlem gücünü kullanmak her zaman nihai zaferi kazanacaktır.

Go becerilerini geliştirmek için kendi kendine oynamaya dayanan AlphaGo, konuşma ve görüntüleri tanımak için istatistiksel yöntemlere ve derin öğrenme algoritmalarına dayanıyor, insan bilgisini ve hatta insanların kendilerini yoğunlaştıran önceki AI'yı yeniyor.

Arama yapmak, öğrenmek ve büyük ölçekli bilgi işlem gücünden tam olarak yararlanmak kraldır. Yapay zeka ajanlarının yeteneklerini geliştirmek için belirli bir alanda insan bilgisini kullanmak bir dolambaçtır.

Sutton, "Yapay zekayı kendi düşünme tarzımıza ilişkin algımız üzerine inşa etmek mümkün değil" dedi.

OpenAI'nin baş bilim adamı Ilya Sutskever, Sutton'ın temel görüşlerini parlak bir şekilde özetledi: Hash gücü her zaman kazanır.

Makale yayınlanır yayınlanmaz hararetli bir tartışma başlattı: OpenAI CTO'su Greg Brockman, Tesla AI Direktörü Andrej Karpathy ve diğerleri makaleyi iletiyor ve destekliyorlardı.

DeepMind makine öğrenimi ekibinin yöneticisi, Oxford Üniversitesi profesörü Nando de Freitas, hatta "hafta sonları okunması gereken bir kitap" olarak nitelendirdi.

Ancak muhalefet sesleri de var.

Profesör Shimon Whiteson, Bilgisayar Bilimleri Bölümü, Oxford Üniversitesi Suttonın bakış açısını çürütmek için arka arkaya 13 Twitter yayını göndererek "kesinlikle katılmıyorum" ifadesini kullanın , Ayrıca çok destek aldı.

Whiteson, yapay zeka oluşturmanın kesinlikle insan bilgisini içermesi gerektiğine inanıyor. Asıl soru yalnızca ne zaman, nasıl ve hangi bilginin dahil edilmesi gerektiğidir.

YZ'nin tarihi, insan bilgisini bütünleştirmenin bir zaferidir. Bilim adamları, başarısız olan% 99'u atıp yararlı% 1'i bırakarak kapsamlı bir şekilde denediler. Ve bu% 1, modern yapay zeka algoritmalarının başarısı için Sutton'ın önerdiği büyük miktardaki hesaplama kaynaklarından daha az önemli değildir.

Bir hava tartışması , Böylece başladı.

Sutton'ın "bu hafta sonu okumalı" yazısını okumayı bitirelim ve Fang'in bakış açısına bir göz atalım.

Acı ders

Aşağıdakiler, kübitlerle çevrilmiş Sutton blogunun tam metnidir:

70 yıllık yapay zeka araştırmasına geri dönersek, bundan elde edilen en büyük deneyim, genel bilgi işlem gücünü kullanma yönteminin her zaman sonunda en etkili olduğu ve çok ileride olduğudur.

Bunun nihai nedeni, Moore Yasasıdır veya daha genel olarak, birim hesaplama gücünün maliyetindeki sürekli üstel düşüştür.

Yapay zeka araştırmalarının çoğu, aracının mevcut hesaplama gücünün sabit olduğu varsayımıyla yürütülmektedir.Bu durumda, insan bilgisini kullanmak performansı iyileştirmenin tek yolu olabilir. Bununla birlikte, tipik bir araştırma projesinden daha uzun bir süreye bakarsanız, daha fazla bilgi işlem gücünün mevcut olması gerektiğini göreceksiniz.

Araştırmacılar, kısa vadeli gözle görülür gelişme arayışında olmak için, bu alandaki insan bilgisini kullanacaklar, ancak uzun vadede, hesaplama gücünün kullanılması tek önemli şeydir.

İkisinin birbirine karşı çıkması gereksiz görünse de, aslında çoğu zaman karşı çıkıyorlar.

Bir yönde harcanan zaman diğer yönde harcanmamalıdır. Belirli bir yönteme yatırım, psikolojik bir bağlılık da getirecektir.

Aynı zamanda, yapay zekayı iyileştirmek için insan bilgisinin kullanılması yöntemi karmaşıklaştırma eğilimindedir ve bu da hesaplama gücünü kullanan genel hesaplama yöntemini daha az uygulanabilir hale getirir.

Birçok AI araştırmacısı daha sonra bu "acı dersi" anladı. En önemlilerinden bazılarını gözden geçirmek öğreticidir.

Satranç alanında 1997'de satranç şampiyonu Kasparov'u mağlup eden Deep Blue, geniş çaplı derin araştırmaya dayanıyordu.

O zamanlar, çoğu bilgisayar satrancı araştırmacısı bunu hayal kırıklığına uğrattı ve satrancın özel yapısının insan anlayışıyla kazanmaya çalıştılar.

Özel donanım ve yazılım kutsamalarına sahip daha basit bir arama temelli yöntemin daha etkili olduğu kanıtlandığında, insan bilgisine dayalı satranç oynayan bu araştırmacılar tüm "ahlaksızlıkları" kaybettiler. Bunu söylediler " Kaba kuvvet "Arayış bu sefer kazanılabilir, ama sonuçta bu genel bir strateji değil ve zaten insanların satranç oynama şekli de değil.

İnsan girdisi yöntemine dayanarak kazanmayı umuyorlar, ancak geri tepiyor, sadece hayal kırıklığı.

Bilgisayar Go alanında, araştırma ilerlemesi de satrançtan sadece 20 yıl sonra aynı modeli takip ediyor. Bu alandaki ilk çabaların çoğu, arama yapmaktan kaçınmak için insan bilgisini veya oyunların özel özelliklerini kullanmaktı.Ancak, arama geniş ölçekte ve verimli bir şekilde uygulandığında, bu çabalar önemsiz hale geldi veya daha da kötüleşti.

Bir değer işlevini öğrenmek için kendi kendine oyunun kullanılması da eşit derecede önemlidir (1997'deki Deep Blue projesinde büyük bir rol oynamamasına rağmen diğer birçok oyunda, hatta satrançta). Kendi kendine oyun yoluyla öğrenme ve kendini öğrenme, aslında arama ile aynıdır ve büyük ölçekli bilgi işlemin yararlı olmasına izin verir.

Yapay zeka araştırmalarında büyük ölçekli bilgi işlem gücünü uygulamak için en önemli iki teknoloji arama ve öğrenme.

Bilgisayarda Go and Chess projelerinde, araştırmacıların ilk çabaları insan anlayışını kullanmaktı (böylece çok fazla aramaya gerek kalmadı) Uzun zaman sonra arama ve öğrenmeyi kucaklayarak daha büyük başarı elde ettiler.

Konuşma tanıma alanında, uzun zaman önce DARPA'nın sponsorluğunda 1970 yılında bir yarışma vardı.

Bu yarışmada, bazı yarışmacılar insan bilgisi gerektiren özel yöntemler (kelime bilgisi, fonem bilgisi, insan ses yolu bilgisi vb.) Kullanır. Gizli Markov modellerine (HMM) göre oyunu tamamlayanlar da var. Bu yeni yöntem, doğası gereği daha istatistikseldir ve daha fazla hesaplama gerektirir.

Şaşırtıcı olmayan bir şekilde, istatistiksel yöntemler sonunda insan bilgisine dayalı yöntemleri yendi.

Bu oyun, tüm doğal dil işleme görevlerine büyük değişiklikler getirdi.Son birkaç on yılda, istatistikler ve hesaplama gücü giderek baskın hale geldi.

Konuşma tanımadaki yükselişten kısa bir süre sonra derin öğrenme de bu yöndeki en son adımdır. Derin öğrenme yöntemleri, insan bilgisine daha az dayanır ve daha fazla bilgi işlem gücü kullanır. Büyük bir eğitim setinde öğrenerek daha iyi bir konuşma tanıma sistemi elde edilebilir.

Tıpkı bir tahta oyununda olduğu gibi, araştırmacılar her zaman sistemi kendi insan düşünce modlarına göre çalıştırmaya çalışırlar ve bu bilgiyi bilgisayar sistemine yerleştirmeye çalışırlar. Ancak sonunda, Moore Yasası büyük ölçekli bilgi işlem gücü getirdiğinde ve diğerleri bundan en iyi şekilde yararlanmanın bir yolunu bulduğunda, orijinal yaklaşımın ters etki yaptığını ve araştırmacıların büyük bir zaman kaybı olduğunu görecekler.

Bilgisayar görüşü alanında da benzer modeller var. İlk yöntemler vizyonu; kenarları, genelleştirilmiş silindirleri veya SIFT algoritması tarafından yakalanan özellikleri aramak olarak hayal ediyordu. Ama şimdi tüm bu yöntemler terk edildi. Modern derin öğrenme sinir ağları yalnızca evrişim ve belirli değişmezlik kavramlarını kullanır ve etkisi çok daha iyidir.

Bu dersler bize (AI) alanını hala tam olarak anlamadığımızı ve aynı hataları yapmaya devam ettiğimizi söylüyor.

Durumu tanımak ve hataları etkili bir şekilde önlemek için, bu hataların çekiciliğini anlamalıyız.

Bu "acı dersten" öğrenmeliyiz: Uzun vadede, YZ'yi kendi düşünme tarzımıza dair kendi algımız üzerine inşa etmek mümkün değildir.

  • "Acı ders" şu tarihsel gözlemlerden kaynaklanıyor:
  • Yapay zeka araştırmacıları genellikle bilgiyi ajanlarına "yerleştirmeye" çalışırlar.
  • Bu genellikle kısa vadede yararlıdır ve araştırmacıların kendilerini tatmin hissetmelerini sağlar.
  • Ancak uzun vadede bu, araştırmanın daha da geliştirilmesini yavaşlatacak veya hatta engelleyecektir.

Atılım, sonunda tamamen zıt yöntemden gelecektir: arama ve öğrenmeye dayalı ölçek hesaplaması.

Nihai başarı her zaman biraz kızgınlık getirir ve genellikle tam olarak anlaşılmaz çünkü mevcut popüler, insan merkezli yaklaşımın ötesine geçer.

Tarih derslerinden iki şey öğrenebiliriz.

Birincisi, evrensel yöntem güçlüdür. Mevcut bilgi işlem gücü çok büyük olsa bile, bu yöntemler yine de artan bilgi işlem gücünü kullanmak için genişletilebilir. Görünüşe göre bu şekilde gelişigüzel genişlemenin iki yolu var: aramak ile Öğrenin .

İkincisi, düşüncenin gerçek içeriği o kadar karmaşıktır ki, ürkütücü ve umutsuzdur. Uzay, nesneler, çoklu-aracılar veya simetri hakkında düşünmenin basit yolları gibi içeriği hakkında düşünmenin basit yollarını artık bulmaya çalışmamalıyız.

Bunların hepsi rastgele ve doğası gereği çok karmaşık bir dış dünyanın parçasıdır. Herhangi bir AI aracısının içine yerleştirilmemelidirler çünkü o kadar karmaşıklar ki sonsuzdurlar. Bunun yerine, yalnızca bu keyfi karmaşıklığı keşfedip yakalayabilen meta yöntemler oluşturmalıyız.

Bu yöntemin özü, yaklaşık değeri çok iyi bulabilmektir. Ancak iş arama kendimize değil yöntemlerimize verilmelidir.

İhtiyacımız olan şey, bizim gibi keşfedebilen bir AI aracıdır, daha önce keşfettiklerimizi içeren bir AI değil.

Keşifimiz temelinde yapay zeka oluşturmak, yalnızca keşif sürecinin nasıl yürütüldüğünü görmeyi zorlaştıracaktır.

Orijinal bağlantı:

"Tatlı bir ders"

Sutton'ın görüşlerine kesinlikle katılmayan Bay Whiteson, yapay zeka oluşturmanın elbette insan bilgisini içermesi gerektiğine inanıyor.Tek soru, ne zaman, nasıl ve hangi bilginin dahil edilmesi gerektiğidir. AI tarihinde "Tatlı Ders" var. Doğru ön bilgiyi bulmaya çalışma sürecinde AI'nın ilerlemesini destekledik.

Sutton'ın görüşünü şu şekilde özetledi: "Yapay zekanın tarihi bize hesaplama gücünün kullanımının her zaman insan bilgisinin zaferi olduğunu söylüyor."

Aşağıdaki, Whiteson'ın Twitter içeriğinin bir çevirisidir:

Bunun tarihin özel bir yorumu olduğunu düşünüyorum. Aslında, insan bilgisini yapay zekaya entegre etme çabalarının çoğu terk edildi ve diğer kaynaklar (yalnızca hesaplama gücü değil, aynı zamanda depolama, enerji ve veri) zenginleştikçe daha fazlası terk edilecek.

Ancak ortaya çıkan yöntemin başarısı, yalnızca bu bol kaynaklara atfedilemez ve terk edilmeyen insan bilgisi de vazgeçilmezdir.

Evrişim, LSTM, ReLU, toplu normalleştirme (toplu form) vb. Olmadan derin öğrenme yapmak istiyorsanız, iyi şanslar. "Git statik, sıfır toplamlı ve tamamen gözlemlenebilirdir" şeklindeki ön bilgileri bir kenara bırakırsanız, bu oyunu bitirmek gibi ve iyi şanslar.

Bu nedenle, AI'nın tarihsel hikayesi, insan bilgisini entegre etmekte her zaman başarısız olmaz. Aksine, bu, insan bilgisini bütünleştirmenin bir zaferidir ve başarma yolu, tam olarak olağan uygulamaya tamamen uygun bir araştırma stratejisidir: birçok yöntemi deneyin ve başarısızlıkların% 99'unu atın.

Kalan% 1, modern yapay zekanın başarısı için kritik öneme sahiptir ve yapay zekanın geldiği devasa bilgi işlem kaynakları kadar kritiktir.

Sutton, dünyanın doğasında var olan karmaşıklığın, önceki bilgileri sisteme dahil etmememiz gerektiğini gösterdiğini söyledi. Ama benim görüşüm tam tersi: hayranlık duyduğu arama ve öğrenme yöntemlerini son derece karmaşık ve anlaşılmasını zorlaştıran bu karmaşıklıktır.

Bu karmaşıklığı ancak doğru ön bilgi ve doğru tümevarımsal önyargılarla kavrayabiliriz.

"Modern derin öğrenme sinir ağları sadece evrişimi ve belirli değişmezlik kavramlarını kullanır ve etkisi çok daha iyidir." "Sadece" kelimesi bu iddianın keyfiliğini vurgular.

Bu kıvrımlar ve değişmezlikler olmadan, derin öğrenme başarılı olmazdı, ancak kabul edilebilecek kadar küçük ve genel kabul edilirler.

İşte bu, "acı ders" ana sorudan kaçınıyor. Asıl mesele insan bilgisini sunup sunmamak değil (çünkü cevap açık bir şekilde evet), bilginin gerçek olup olmadığını sormaktır. ne , Olmalı ne zaman , o nasıl onu kullanın.

Sutton, "İhtiyacımız olan şey bizim gibi keşfedebilen bir yapay zeka ajanı, keşfettiklerimizi içeren bir yapay zeka değil." Dedi. Ancak tam olarak keşfetmekte iyiyiz çünkü doğru tümevarımsal önyargılarla doğuyoruz.

AI tarihindeki "tatlı ders" şudur: Doğru tümevarımsal önyargıyı bulmak zor olsa da, arama süreci başlangıçta zor olan soruna muazzam bir ilerleme sağlamıştır.

Orijinal bağlantı:

https://twitter.com/shimon8282/status/1106534185693532160

Tartışmanın her iki tarafı

Bu hava tartışmasının iki tarafı, "Takviye Öğrenmenin Babası" Sutton ve Oxford Üniversitesi Bilgisayar Profesörü Shimon Whiteson'dur. Hepsi pekiştirmeli öğrenme alanında bilim adamlarıdır, ancak fikirleri tamamen zıttır.

Takviye Öğrenmenin Babası: Sutton

Modern hesaplamalı pekiştirmeli öğrenmenin kurucularından biri olarak kabul edilen Sutton, takviyeli öğrenmeye "zamansal fark öğrenme" ve "politika gradyan yöntemleri" gibi pek çok katkı yapmıştır.

1978'de Sutton, bilgisayar bilimine geçmeden ve Massachusetts Amster Üniversitesi'nden doktora derecesi almadan önce Stanford Üniversitesi'nden psikoloji alanında lisans derecesi aldı.

Akıl hocası Andrew Barto ile birlikte yazdığı "Güçlendirmeli Öğrenmeye Giriş" kitabı, pekiştirmeli öğrenme araştırması alanında temel bir okuma haline geldi.

Şu anda, Sutton Alberta Üniversitesi'nde ders vermektedir ve Bilgisayar Bilimi Bölümü'nde bir profesör ve iCORE Başkanıdır ve Güçlendirmeli Öğrenme ve Yapay Zeka Laboratuvarı'na liderlik etmektedir.

Haziran 2017'de Sutton, Alberta Üniversitesi'nde profesörlüğünü sürdürürken Kanada, Edmonton'daki ofisine eş başkanlık etmek için Deepmind'a katıldı.

Sutton, 2001'den beri AAAI Üyesidir. 2003'te International Neural Network Society'den Başkanlık Ödülü'nü ve 2013'te Massachusetts Amherst Üniversitesi'nden Üstün Başarı Ödülü'nü kazandı.

Oxford Üniversitesi Rakip: Whiteson

Shimon Whiteson, Oxford Üniversitesi Bilgisayar Bilimleri Bölümü'nde yapay zeka ve makine öğrenimine odaklanan bir profesördür. Pekiştirmeli öğrenme ve temsilcilerin gösterilerle öğrenmesine izin verme, araştırdığı konulardır.

Bilgisayar bilimi alanında doktora derecesini 2007 yılında Austin'deki Texas Üniversitesi'nden aldı ve ardından doktora sonrası araştırmacı olarak kaldı ve ardından Danimarka'daki Amsterdam Üniversitesi'nde ders verdi.

Whiteson, 2015'te Oxford Üniversitesi'nde doçent ve 2018'de profesör oldu.

Kimi destekliyorsun?

Whiteson'a ek olarak, Sutton'ın görüşlerine tam olarak katılamayan birçok insan da var.

Örneğin, Nando de Freitas, Sutton'ın blog gönderisinin son paragrafının çok doğru ve düşündürücü olduğuna inanıyor:

İhtiyacımız olan şey, bizim gibi keşfedebilen bir AI aracıdır, keşfettiklerimizi içeren bir AI değil. Keşifimiz temelinde yapay zeka oluşturmak, yalnızca keşif sürecinin nasıl yürütüldüğünü görmeyi zorlaştıracaktır.

Ancak Whiteson'un bakış açısına dayanan kendi fikirlerinden bazılarından da bahsetti:

  • Bilişim gücü, özellikle takviye öğrenme aracıları için çok önemlidir. Ancak, ölçekli araştırma sürecinde evrişim ve LSTM kavramları icat edilmemiştir.
  • Diğer canlılar, biz insanlarla aynı güçlü bilgi işlem gücüne sahipler ve aynı veri ve ortamda yaşıyorlar, ancak Mars'a uçma planları yok.

Imperial College'da bir profesör ve DeepMind'da kıdemli bir araştırmacı olan Murray Shanahan, belirli alanlardaki önceki bilgilerin elle yazılamayacağını desteklese de, "AI'nın bu sağduyu kategorilerini öğrenmeye elverişli bir mimari önceliği bulması gerektiğine" inanıyor.

Austin'deki Texas Üniversitesi'nde yardımcı doçent olan Scott Niekum, Sutton'ın bakış açısını genel olarak kabul ettiğini, ancak aynı zamanda sorgulanabilir bazı noktalar olduğunu söyledi. Örneğin, bilim hiçbir zaman düz bir çizgi değildir. En önemli keşiflerin çoğu yerleşik özel kullanımdan gelebilir Yeterince evrensel olmayan modellerin sürecini incelemek için alan bilgisi.

Bu soru hakkında ne düşünüyorsunuz?

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzünde "işe alım" kelimesini yanıtlayın.

Qubit QbitAI · Toutiao İmzalayan Yazar

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri izleme

Manken yıldızı maçtan sonra fazla mesai yapmak için spor salonuna gidiyor.Serie A sadece an meselesi.
önceki
Kilo vermek için acıkmayın! Bunun gibi üç öğün ye, ne kadar çok yersen o kadar zayıflarsın!
Sonraki
Klavye sınıflandırmasına bakın, LOL'un dört gerçek tasvirine bakın! Oyuncu: Büyük tanrı her zaman avucuyla crtl'yi sıkıştırır!
Dün Osaka genç futbol takımı Barcelona genç takımına yenildi, ancak Japonya'nın gençlik akademisi güçlü.
Wang Sicong otomatik satrançta ne kadar oynuyor? Söylentilere göre kız arkadaşı onu görmezden geldi ve becerilerini geliştirmek için geç saatlere kadar kaldı!
Asya Oyunları Erkekler Futbol Yarışması'ndaki üç Çin takımının son sıralaması açıklandı ve 12 yıldaki en iyi sonucu belirledi
Neymar'ın yeni takım arkadaşı Asya Oyunları kadın futbol maçında üç gol attı ve Çinli kadın futbol takımının 20 yıl sonra tekrar altın kazanması bekleniyor.
En utanmaz oyun şirketi mi? Oyuncu tarafından övündükten sonra 275 medya skoruna odaklandı
CBA takım sezon özet akşam yemeğini tecrübe etti, neden Xiaofu'nun huzur içinde olduğu derin medya tarafından suçlanıyor büyülü bölüm
Ali, taciz karşıtı çağrı AI teknolojisini yayınladı! Robotların robotlarla ilgilenmesine izin verin
Asya Oyunları futbol altın madalyası hala kadın futboluna bağlı, rakiplere karşı 5 gol iki Çinli kadın futbol takımı yarı finali
Dokunaklı! Çocuk tavuk oyununu oynadı ve ebeveynler, oyun haksız olduğu için geliştiriciye şikayet etti!
Çalkantılı mevsimde, büyülü Shenzhen hala ortadan kalkabilir ve iki yaşlı adam veda edemez.
4 milyar taciz edici arama yapıldı, 600 milyon kullanıcının gizliliği sızdırıldı, CCTV 315, yapay zekanın karanlık yüzünü ortaya çıkardı
To Top