Wang Xiaochuan: AlphaGo dördüncü oyunda neden Li Shiyao'ya kaybetti?

Üçüncü İnternet konferansı ikinci güne girerken, Sogou CEO'su Wang Xiaochuan da bir konuşma yaptı ve derin öğrenmenin temsil ettiği yapay zeka anlayışını paylaştı.

Tüm konuşma AlphaGo ve Li Shiyao arasındaki çatışmadan ilham aldı. Wang Xiaochuan, bu yüzleşmenin yapay zekanın patlamasının başlangıcı olduğunu söyledi; ancak bir ürün yöneticisi olarak Wang Xiaochuan, yapay zekanın üç ürün yönü olduğuna inanıyordu:

  • Tanıma. Ses tanıma, görüntü tanıma ve görsel tanıma dahil;
  • oluşturmak. Örneğin, bir resme dayanarak, metin açıklamasını oluşturabilir ve hatta müzik oluşturabilir;
  • yargı. Karar vermektir; bu yön en önemlisidir ve büyük ticari önemi vardır.

Sonra konuşmanın konusu AlphaGo'nun kendisine döndü; Wang Xiaochuan şunları söyledi:

Önceki 30 milyon insan-makine savaş oyunu olmasaydı, AlphaGo insanları yalnızca pekiştirmeli öğrenme yoluyla kazanamazdı. Hedef makineye verilmişse ve makine kendi kendine öğrenebilir ve yeni atılımlar yapabilirse, yeni yapay zeka çağının gelişine daha yakınız.

Wang Xiaochuan ayrıca AlphaGo'nun dördüncü oyundaki başarısızlığından bahsetti. DeepMind mühendislerinin, başarısızlığın nedeninin programdaki hatalardan veya derin öğrenmenin kendisindeki darboğazdan kaynaklanmadığını söylediklerini aktardı. Bu yılın Haziran ayına kadar bu sorun çözülmedi ve AlphaGo dördüncü oyunu oynasa bile yeni sorunlar olabilir.

Buna göre Wang Xiaochuan, derin öğrenmede darboğazlar olduğunu söyledi.

AlphaGo'nun yanı sıra yapay zeka geliştirmenin pek çok alanında da büyük sorunlar var. Örneğin, sessiz bir ortamda konuşma tanımanın doğruluğu% 95'in üzerine çıkabilir, ancak gürültü paraziti olduğunda konuşma tanımanın etkisi hemen azalacaktır. Aslında, Google'ın anlambilimsel analizi ve doğal dil işleme gibi teknolojilerde bile sorunlar var.

Ayrıca Wang Xiaochuan, insansız sürüşten de bahsetti. o düşünüyor:

Görülmüş sahneler için, kapalı sahneler için sürücüsüz arabalar gerçekten kullanılabilir, ancak gerçekten açık bir ortam için, sadece yüksek hızlarda veya Beşinci Çevre Yolunda, mevcut insan teknolojisiyle çalışan arabalar için güvenli değildir. nın-nin.

Aşağıda Wang Xiaochuanın Dünya İnternet Konferansı'ndaki konuşmasının metni yer almaktadır:

Bay Zhang Yiming'in şu anda söylediklerini gerçekten çok beğeniyorum.Uzun süredir iş yapmayan bir şirket olarak, bugün hem teknoloji hem de duygularla böyle bir başarıya imza attı. Paylaşmak için 12 seans dinledim ve sonuncusu yapay zeka anlayışım.

İlk 12 oyunda teknolojiler ve ürünler var, umarım sizlerle paylaşacağım içerik biraz farklı olabilir ve kendi bakış açıma sahip olabilir.

Bugünün başında herkes AlphaGo'dan bahsetti ... Bugün yapay zekanın patlamasının başlangıcı olarak, derin öğrenme ortadaki en önemli sorumluluğu üstlendi. Bugünü hayal etmeye başladığınızda, yapay zekanın gelecekte gerçekten insanların yerini alacağını düşünebilirsiniz. Umarım bugünkü paylaşım, yapay zekanın bugün neler yapıp yapamayacağı ve gelecekte nihai idealin ne olduğu hakkında daha fazla bilgi edinmenize yardımcı olur. AlphaGo'dan sonra, konuşma ve görüntülerde en önemli atılımları gördük, ancak aslında metin alanındaki ilerleme yavaş. Bugün, makine çevirisinde bazı atılımlar olacak, ancak daha fazla soru ve cevap veya diğer konuşmalar Anlamak yeterli değil.

Bu nedenle, AlphaGo dışındaki Turing testine geri dönüyoruz. 1950'lerde Turing, soru cevaplama makineleri ve diyalog sistemleri konseptini önerdi. Başlangıçta, bugün konuşma ve imgelerin ilerlemesinin hızlı, ancak doğal dilin işlenmesinin yavaş olduğuna dair sezgisel bir his var.

Teknolojinin yanı sıra bir ürün yöneticisi olarak yapay zekanın üç ürün yönü olduğundan bahsedeceğim bugünkü toplantıda hepimiz tanıma, konuşma tanıma, görüntü tanıma ve görsel tanıma denilen birinden bahsettik. Herkesin bahsettiği bir başka şey de yaratımdır: Bir resme dayanarak onun metin tanımını oluşturuyoruz, müzik üretiyoruz, imajlar oluşturuyoruz ve bunların hepsini. Başka bir şey de, karar vermekten bahsettiğimiz yargıdır. Bu üç şey arasında yatırımcılardan bazılarıyla konuştum ve aralarındaki en önemli ve en önemli iş anlamının muhakeme olduğunu söyledim, bugün bunları paylaştığınızda benzer kavramlardan bahsetmişlerdi.

Herkes yapay zeka konusunda birkaç aşamalı ilerlemeden bahsetti, başka bir dilde anlatmak istiyorum yani mühendisler günümüzün yapay zeka çağında giderek daha önemli bir konuma gelecekler. Geleneksel yöntemin kuralları makineye devretmek olduğundan bahsetmeye başladık.Derin öğrenmeyi de içeren istatistiksel sistemlerin gelişmesiyle birlikte cevapları makineye daha kolay teslim etmeye başladık. Tang Daosheng'in şu anda bahsettiği denetimli öğrenme böyle bir yoldur, bu nedenle yeterli veri birikimi ile makineyi daha akıllı hale getirebiliriz.

Buradaki en modern yöntem, hedefi makineye vermektir. AlphaGo bu tür birkaç algoritmayı bütünleştirir. Ancak mühendisleriyle iletişim kurduğumda, makineye böyle bir hedefin pekiştirilerek öğrenilmesi henüz olgunlaşmadı. Başka bir deyişle, önceki 30 milyon insan-makine savaş oyunu olmasaydı, böyle bir AlphaGo makinesi insanları yalnızca pekiştirmeli öğrenme yoluyla kazanamazdı. Bunun teknik düzeyde ayrıştırılması gereken önemli bir nokta olduğunu düşünüyorum. Makineye kendi kendine öğrenmede yeni atılımlar yapma hedefi veriliyorsa, yeni yapay zeka çağının gelişine daha yakınız.

Bu yılın Haziran ayında Londra, İngiltere'ye gittim ve DeepMind mühendisleriyle de görüştüm. Özellikle merak ettiğim şey, makinenin dördüncü satranç oyununda kaybettiğiydi. Karşılaştığım ilk soru dördüncü oyunda ne olduğuydu? Bana programın hataları olduğunu ya da derin öğrenmenin kendisinin darboğazları olduğunu söylediler. Go oyunu Mart'ta, Haziran'da Londra'ya gittim 3 ay oldu. 3 ay süre. Üzgünüz, bu sorun hala çözülmedi. Ama iyi olan şey, ben ayrıldıktan sonraki ilk hafta, programları önceki dördüncü oyunla doğru bir şekilde yüzleşebildi, ancak ona hatanın giderilip giderilmediğini sordu. Mühendis bana hayır dedi. Bu sadece dördüncü oyundaki belirli sorunun makine tarafından çözülebileceği anlamına geliyor. Ancak, böyle bir AlphaGo'nun hangi koşullar altında hata yapmaya devam edeceğini hala bilmiyoruz, bu nedenle derin öğrenme gibi bir sistemin hala bir darboğazı olduğunu biliyoruz. . Bu yüzden bugün sizlerle, üründe güvenilir olmayan derin öğrenmenin temsil ettiği yapay zeka teknolojisi hakkında daha fazla konuşmak istiyorum.

İlk soru, konuşma tanıma güvenilir mi? Şu anda Baidu ve Tencent konuşma tanıma yeteneğinden bahsetti. Bugün sunumumda konuşma tanımadan da bahsetmiştim.Bu Sogou'nun kendi teknolojisi. Sessiz bir ortamda, tanıma doğruluğumuz% 95 veya% 97'dir, ancak gürültüde hızlı bir düşüş olduğunda, bu gürültü sadece araba motoru gürültüsü, rüzgar gürültüsü olabilir, gürültüyü ham veri olarak kullanır ve denetimli öğrenme sistemine gireriz. Bu sesi makinelerin görebileceği sorunlardan birine dönüştürün. Peki ya iki kişi aynı anda konuşuyorsa? Size söyleyebilirim ki bugünün akademisinde hala çözüm yok, iki kişi aynı anda konuşuyor, hiç bu kadar gürültü görmedik ve ileri eğitim veremiyorum.

Bu yılın Haziran ayında, akademideki insanlara konuşma tanımada insanlar ve makineler arasındaki farkın nasıl çözüleceğini de sordum. Makinemiz yön tanıma yapmak için stereoyu kullanabilir.Birinin üç boyutlu konuştuğunu bilmek için bir mikrofon matrisi yapabilir ve diğer kişinin söylediklerini kaldırabiliriz. O kişi bunu yapıyor mu? Kulaklarımdan biri tıkanırsa, konuşmacıyı iki kişiden ayırabilir miyim veya iki kişinin sesini tek sesli bir kasete kaydedebilir miyim, insanlar yine de tanıyabilir mi? Siz ne düşünüyorsunuz? İnsanlar iyidir, bu yüzden yöntemleri makinelerle aynı değildir. Bu nedenle bazı doktorlarla konuşuyordum, insanlar onları nasıl tanıyor? Bunun nedeni, iki kişinin farklı tınılara sahip olması mı yoksa birinin yüksek sesle diğerinin küçük bir sesi olması mı yoksa farklı dilleri konuştukları için mi? Doktor güldü, iki kişi aynı anda konuşurken, bir fark bulabildikleri sürece, kişinin seslerden birini tanıyabildiğini, bu nedenle insanlarla makineler arasındaki süreçte çok büyük bir fark olduğunu söyledi. Buradan başlamayacağım. Konuşma tanımanın, insanlardan oldukça farklı olan makine zekasındaki en olgun alan olduğuna inanıyoruz.

Diğeri anlamsal olarak güvenilir mi? Dil anlayışıdır. Google, sorunu çözmek için bilgi grafiği yöntemini kullandı ve şimdi bir darboğazla karşılaştı. Bu yılın Haziran ayında, onların en gelişmiş insan-makine diyalog sistemini bir laboratuvarda gördüm Bu sistem yemek ve otel sipariş etmenize yardımcı olabilir. Diyalog sırasında makinenin performansı çok şaşırtıcı, deneyelim, ortada bir bağlantı var, lütfen dikkat edin.Makine size sormaya başlıyor, park yerine ihtiyacınız var mı yok mu? Şu anda evet ya da hayır cevabını verirsek sorun yok. Diyelim ki arabam yok. Makinenin neye benzediğini biliyor musun? Arabam yoksa park yerine ihtiyacım olmadığı anlamına geldiği anlaşılmıyor çünkü bugünün makineleri doğal dil kavramlarını anlamada yeterli olmaktan uzak. Bu nedenle, doğal dil işleme yapılabilir, ancak konuşmayı anlama hala güvenilmez bir aşamadadır.

Bu yıl, Google ayrıca doğal dil için konu, tahmin ve nesne önerebilen bir dizi cümle analizi motoru yayınladı, ancak doğruluk% 90 olabilir, bu yüzden bundan bahsedilemez. Ne? Çünkü şu anda istatistikler ve gramer tek başına yeterli destek sağlamıyor. Tıpkı insanlar için bir buzdolabına yol koymanın imkansız olduğunu bildiğimiz gibi, belirsizliği ortadan kaldırmak için cümledeki belirli kavramları anlamamız gerekiyor. Bu çok basit bir şey, ancak bilgisayara meydan okuma çok büyük, bu yüzden derin öğrenmenin temsil ettiği yapay zekanın yeterli olmadığı yer burası.

Çok hassas soru, insansız sürüş güvenilir midir? Bugün Baidu, sürücüsüz arabaların yerinde serbest bırakılmasını da önerdi, ancak benim anlayışıma göre, günümüzün insan teknolojisi kullanılırsa, kapalı sahnelerde sürücüsüz arabalar ve görülen sahneler gerçekten de kullanılabilir, ancak Gerçekten açık bir ortam için, sadece yüksek hızlarda veya Beşinci Çevre Yolunda çalışan arabalar için değil. Üzgünüz, mevcut insan teknolojisi ile güvenli değil. Bu sahneyi görmediği sürece, tıpkı AlphaGo'nun satranç oynaması gibi, ciddi hatalar yapabilir, aniden çılgına dönecek, bu yüzden uygulanabilir olması için yardımlı sürüş diyebiliriz. Yeni teknolojik gelişmelerden önce insansız sürüş, Henüz yapılabileceğini sanmıyorum.

Bu nedenle, derin öğrenmenin zayıf yönlerinden günümüzde çokça bahsedilmektedir, şeffaf değildir, bu nedenle güvenilirliği sınırlıdır, muhakeme yeteneği eksikliği ve özellikle sembollerin anlaşılmaması. Sembolleri anlayamazsanız, doğal dili anlamak bir darboğaz haline gelir. Öyle olsa bile, satranç oyuncuları, doktorlar ve sürücüler gibi bazı endüstrilerin yerini alabileceğinden de bahsettik.Makineler bunda çok yardımcı olabilir, ancak bazı yaratıcı şeyler, planlama ve daha önce hiç görmediğiniz bilimsel araştırmalar için. Aslında zor. Bugün medyada gördüğümüz makineler otomatik olarak makale yazabiliyor ve otomatik olarak resim çizebiliyor, bunun bazı örneklerini bilimsel araştırma düzeyinde göstermenin daha çok olduğunu düşünüyorum ama insanların gerçek kullanımının yerini alma aşamasına gelmiyor.

Yani burada önce herkesin yapay zeka beklentilerini azaltıyorum ve bazı insanlar üçüncü bir gelgit olup olmayacağını mı soruyor? Yapay zekanın ilk iki seferde geldiğini düşündük ama bu sefer öncekinden daha iyi olabilir. Önceki iki yapay zeka gelgitinden önce bir öğretmene sorduk, yapay zeka üzerinde çalışıyor musunuz? Yapay zeka güvenilir olmadığı için bu ona bir lanet. Bu gerçekten ilk kez kullanıma giriyor ve aslında dil işleme, ses işleme, görüntü işleme ve bazı yüksek boyutlu veri alanlarında insanlardan daha iyisini yapabilir. Dolayısıyla bu sefer fark, yapay zekaya büyük miktarda fon ve sermaye yatırılmış olmasıdır.Ayrıca mezun olduktan sonra yapay zeka çalışması yapan çok sayıda araştırmacı var.Bu önceki çalışmalardan farklı olduğu için bir yandan da kullanmaya başladılar. Sürekli yeni atılımları dört gözle beklemeye başladık.

Şahsen ben bu sefer iyimserim ama çok da gergin olacağım, belki de yaptığımız arama motoru yıkımın bir parçası.

Burada, önümdeki yolun nerede olduğunu hayal etmeye başlamak istiyorum. Kendi tanımıma göre, araştırmanın geleceği yapay zeka çağının tacıdır. Neden öyle diyorsun? Aramanın geleceği nedir? Yapay zekanın geleceği nedir? Taç neden? Basitçe söylemek gerekirse, aramanın geleceğinin bir soru-cevap robotu olduğunu düşünüyorum, çünkü bir şeye alışkınız, arama yaptığımızda, önce anahtar kelimeleri giriyoruz ve sonra size 10 sonuç veya 10 bağlantı veriyoruz, ancak bu doğru En iyi yol bu mu? Kesinlikle yeterli değil. Arama sonuçlarını daha doğru hale getirmek için kişiselleştirilmiş yöntemler kullanıp kullanamayacağımızı da belirteceğiz, ancak aslında kişiselleştirmenin sağlayabileceği bilgiler çok sınırlıdır. Bu sistemi kullanışlı hale getirmenin gerçek yolu soruları kullanmaktır. Daha önce soru sormanıza gerek kalmamasının bir nedeni, makinenin söylediklerinizi anlamamasıdır. Soruya gerçekten ulaşıldıktan sonra, size 10 bağlantı vermekten size bir cevap vermeye dönüşebilir ve bu çok daha iyi olacaktır.

Makineye dört kelime, "Wuzhen Konferansı" sorarsanız, bu bilginin size istediğiniz içeriği veremeyeceğini hayal edebiliriz. En fazla, size yalnızca haberleri, Wuzhen'in ansiklopedisini veya resmi web sitesini tanıtabilirsiniz, ancak Wuzhen hakkında soru sorarsanız Konferans ne zaman yapılıyor? Şu anda, makinenin size daha iyi cevaplar verme fırsatı var. Dolayısıyla teknoloji ilerledikçe arama motorlarının da doğal olarak bir soru cevap motoruna dönüşeceğine inanıyorum.

Bu yolda Apple, Microsoft, Amazon ve Google dahil birçok şirket bunu yapıyor. Burada diyalog sistemini ilk başlatan kişinin Appleın Siri'si olduğu biliniyor. Bu sistem başarılı değil. Çin'de çok az kişi kullanıyor. Mevcut İngilizce kullanımına ne olacağını biliyor musunuz? Neden başarılı olmuyorsunuz? Bunun basit nedeni, mevcut teknolojinin henüz gelmemiş olması ve doğal dili işleme ve doğal dili anlama yeteneğimizin hala çok sınırlı olması ... Düşünüyordum da, Apple gibi bir şirket bu sistemi neden yayınlasın? Bir olasılık, Apple'ın teknoloji hakkında yeterince bilgi sahibi olmamasıdır. Diğer olasılık ise Steve Jobs'un dileğidir. İPhone piyasaya çıktığında, basın toplantısını izlemek için hastane yatağında yattığını biliyoruz. Basın toplantısı tamamlandıktan sonra, o Yakında öldü. Bu, iPhone 4'lerde piyasaya sürülen prematüre bir bebek gibi, bu yüzden böyle bir sistemin Jobs'un nihai insan-bilgisayar etkileşimi vizyonunu temsil ettiğini düşünüyorum.

Aslında, birçok edebi eserimiz, filmimiz ve bilim kurgu, ister "Yıldız Savaşları", "Büyük Kahraman 6" veya "Yıldızlararası" olsun, soru-cevap makinelerinden bahsedecek. En büyük bilim kurgu yazarlarından biri olan Asimov'un "Son Soru" adlı romanında da bir kısa filmi var, anlattığı şey, insanlığın tüm dünyanın ve tüm evrenin enerjisini kullanmak için bir makine yaptığıdır. Bu makine, evrenin nasıl doğduğu konusundaki nihai soruyu yanıtlayamaz, ancak diğer soruları yanıtlayabilir. Yani edebi eserler aslında soru-cevap makineleri hakkındaki düşüncemizi temsil ediyor.

Arama motorlarında Soru-Cevap'a ek olarak, Sogounun giriş yönteminin Çin'de 300 milyon kullanıcısı olduğunu biliyoruz. Giriş yönteminin geleceği nedir? Otomatik soru cevap ile ilgisi olduğunu da belirteceğim.

Giriş yöntemini daha önce tartıştığımızda, birçok arkadaş bana sesin en önemli şey olduğunu söyledi.Sogou'nun eksiksiz konuşma tanıma teknolojisi ve konuşma sentezi teknolojisi var, ancak kalbimde bu, giriş yönteminin en uç noktası değil, gerçek uç noktası Düşünmenize yardımcı olacak bilgi aramaya başlayabilir. Şu anda herkesin gösterdiği şey bir paylaşım yeteneğidir ve gerçek cevaplama yeteneği daha sonra sizin için yeni bir gösteri olabilir.

Soru cevap teknolojisini tartıştığımızda ve insan-bilgisayar diyaloğunu tartıştığımızda, girdi yöntemi en iyi giriş senaryosu olabilir. Baidunun DuMi'sinin veya Google'ın Asistanının bağımsız bir motor olduğundan daha önce bahsetmiştik, ancak giriş yöntemi insanların bir avatarıdır. Yu Chengdong tarafından şu anda bahsedilen kavram, insan düşüncesi ve girdi yöntemleri oluşturmanıza yardımcı olabilir. Aynı zamanda bir pinyin aracından diyalog ve soru cevaplama sistemine geçecek.

Sogou'nun biri girdi yöntemi, diğeri arama olmak üzere iki temel ürünü vardır: Bilgiyi ifade etme ve bilgi edinme, anlatım yapma ve edinmeyi kolaylaştırmaktan bahsetmiştir. Yapay zeka teknolojisinin gelişmesiyle, insanların düşüncelerini daha iyi özgürleştirebiliriz. Yani bir konseptimiz olacak, iki şey var, biri doğal etkileşim, sadece ses değil, dil. Ek olarak, bilginin hesaplanması, makinenin yavaş yavaş akıl yürütme yeteneğini geliştirmesine izin verir. Sogou giriş yöntemi en büyük dil verisi birikimine sahiptir ve bu alanda bir atılım yapmak için en iyi şansa sahibiz.

Bu yüzden teşekkür ederim, bu Sogou'nun herkesle paylaşması.

Deng Ziqi, masaya vurmak yerine gerçek ve yanlış ses arasında geçiş yapmak için "Sekizinci Nota Sosu" na meydan okudu
önceki
Beşinci Kişilik: Su Şemsiyesinin Ruhu Zhongyuan Festivali'nde lanse edilecek mi? Parçaları toplamaya başlayabilirsiniz
Sonraki
CBA olay yerindeScola yere düştü ve topu kurtarmak için çok çalıştı ve Liu Wei Ruoding'e otoriterliğini göstermesini emretti.
Wu Lei, yerel topçu için arka arkaya üç maç attı, ulusal futbolun Kore'ye karşı en büyük silahı oldu.
Harvard iyi bir arazi aracıdır! Üretimi asla durdurmadığı biliniyor
"Nai Shui Han OL" daki son dolandırıcılık, başkalarını kandırmak için ekipman girişini değiştirmek için birkaç dolar harcadı
Güney Kore takımını kiralamayı reddeden ve yaralanan Çin takımıydı, kamuoyunun baskısı sadece desteklenemeyen milli futbolu ezecek.
PlayerUnknown's Battlegrounds: Blue Hole, en güçlü anti-plug-in silahını piyasaya sürmek üzere ve oyuncular yumurtaların hiçbir faydası olmadığını söylüyor!
Yabancı ülkelerde iki büyük "elle kesme sezonunu" kaçıran AirPod'lar Noel'de görünebilir
"Kılıç ve Peri Efsanesi" Zhao Linger'in elleri kopyalandı: çirkin izlemeye dayanamaz
Shihudang Kasabasındaki ilk kapsamlı eski servis merkezi bugün açılan "Snail Slow Time" ın tadını çıkarın
LOL'un ölüm yıldızı böceğinin ardındaki dokunaklı hikaye, yumruk bu sefer gerçekten daha ucuz
Pacheco, Süper Lig'in ilk şeytanı olan Jiangsu'yu yutmak için kadrosunu feda ediyor.
BangADC'nin mucizesi OMG'nin ev mahkemesinde tekrar sahneleniyor! Yüksek risk ve yüksek getiri, tarihteki en güzel ADC!
To Top