"2017'nin En İyi Makine Öğrenimi Kağıdı" AlphaGo Zero, göze en çok hoş gelen şey

Xinzhiyuan Sütunu

Yazar: Tang Kan

Xin Zhiyuan Rehberi 2017'de okuduğunuz en ilginç ve değerli makine öğrenimi / yapay zeka makalesi neydi ve neden? CMU Bilgisayar ve Robotik Araştırma Enstitüsü'nden Ph.D. Deng Kan, 2017'de Xinzhiyuan'da bir köşe açtı ve birçok makaleyi parçalarına ayırdı. Cevaplarını en sevindirici, pratik değer ve en potansiyel yönlerden verdi.

Birkaç gün önce, Öğretmen Yang Jing ve Öğretmen Liu Jiang ile, Yapay zekanın 2017'deki ilerlemesini tartışın O zamanlar 2017'de en çok okunmaya değer gazeteleri söyleyecek vaktim olmadı.

"En kıymetli kağıt nedir", bu konu, iyiliksever, iyiliksever, hikmetli ise bilgeliği görür.

Şimdi, şahsen bu yılın en büyük hasadı olduğunu düşündüğüm kağıtlardan bahsedelim:

  • Göze en hoş gelen şey: İnsan Bilgisi Olmadan Go Oyununda Ustalaşmak

  • En pratik değer: Tek İhtiyacınız Olan Dikkat ve Hepsini Öğrenmek İçin Bir Model

  • Çoğu araştırma potansiyeli: Teke tek sınırsız poker için Superhuman AI: Libratus, en iyi profesyonelleri geride bırakır

En hoş kağıt

İnsan Bilgisi Olmadan Go Oyununda Ustalaşmak Nature dergisinde yayınlanan AlphaGo Zero hakkında DeepMind ekibi tarafından hazırlanan bir makaledir.

Bu makaleyi okurken, DeepMind'ın AlphaGo hakkında daha önce açıkladığı başka bir makalenin aksine okumalısınız. O yazının başlığı, Derin Sinir Ağları ve Ağaç Arama ile Go Oyununda Ustalaşma .

İki makaleyi karşılaştırdığımızda, AlphaGo Zero, AlphaGo algoritmasının önceki sürümünden daha rafine, ancak daha güçlü. Ve AlphaGo Zero'nun kağıdı daha heyecan verici. Özellikle, AlphaGo Zero'nun Go stilini keşfetmek için kaç saat kendi kendine oynamaya güvendiğini söyler. AlphaGo Zero'nun Fan Xu ve Li Shijiao'yu art arda yenmesi daha uzun sürdü.

En pratik makaleler (iki bildiri)

Tek İhtiyacınız Olan Dikkat ve Hepsini Öğrenmek İçin Bir Model Bu iki belge, Google Brain ekibinin eseridir ve her ikisi de kullanımı çok uygun olan açık kaynak koduna sahiptir.

Hepsini Öğrenmek İçin Bir Model Kağıt Resim

Derin öğrenmenin, özellikle CNN'in değerinin, geçmişte olduğu gibi manuel çıkarıma dayanmak yerine, ham verilerden otomatik olarak öznitelikler çıkarmak için evrişim algoritmalarının kullanılmasında yattığını söylersek. O halde Dikkatin değeri evrişim üzerine düşünmektir. Evrişim, özellikleri iyileştirmenin tek yolu değildir ve mutlaka en iyi yol değildir. Google Brain ekibi, çoğu senaryoda Dikkatin evrişimden daha etkili olabileceğine inanmaktadır.

Şimdiye kadar, Attention'ın algoritmaları çoğunlukla doğrusal benzerliği ölçmeye dayanıyor. Önümüzdeki yıldan başlayarak, daha fazla odaklanma yöntemi bulmak için Dikkat algoritmasını dönüştürmeye, doğrusal olmayan benzerliği denemeye ve hatta benzerliğin ötesine geçmeye odaklanan daha fazla araştırma yapılacağına inanıyorum.

En umut verici araştırma yönü

Teke tek sınırsız poker için Superhuman AI: Libratus en iyi profesyonelleri yener, CMU ekibinin Science dergisinde yayınlanan bir yapay zeka poker sistemi olan Libratus hakkındaki makalesidir.

Depu iki zor sorunla karşı karşıyadır: gizli bilgi ve dolandırıcılıkla mücadele, Go'dan çok gerçek dünya oyununa daha yakındır.

AlphaGo, Go sorununu mükemmel bir şekilde çözmek için derin pekiştirmeli öğrenmeyi kullanır. Bir sonraki belirsizlik, derin takviye öğreniminin gizli bilgi ve dolandırıcılıkla mücadele gibi iki sorunu çözüp çözemeyeceğidir. İlginç bir şekilde, Libratus derin pekiştirmeli öğrenmeyi kullanmaz, ancak bu iki sorunu oldukça güzel bir şekilde çözer. Önümüzdeki yıl belirsizlik, DeepMind meslektaşlarının Libratus'u geçmek için derin pekiştirmeli öğrenmeyi kullanıp kullanamayacağıdır?

Kelimeleri düzenle

2017'de okuduğunuz en iyi makaleler hangileri? Bir mesaj bırakıp birlikte tartışmaya hoş geldiniz ~

Sütun Genişletilmiş Okuma: Büyük Kahve Kağıt Serisini Anlamak İçin Bir Makale

  • [AlphaGo Zero algoritmasını anlamak için bir makale] Geleneksel Monte Carlo ağaç araması ve ResNet

  • [AlphaGo'dan sonra ne olacak] Yapay zeka poker oynamayı anlamak için makaleyi okuyun

  • [Bengio araştırma grubunun en son makalesini anlamak için bir makale] Graph Attention Network GAT, derin öğrenme için girdi olarak grafiği kullanın

  • Bengio'nun notlarının yorumu: insan düşüncesini yeniden yapılandırmak ve yeniden yapılandırmak için derin öğrenme modellerini kullanın

  • DeepMind makine anlama metni NLP teknolojisi yeniden üretimi ve analizi

  • Derin takviyeli öğrenmenin "derinliği" nerede?

  • Onu giymek trafik polisinden korktuğum için değil, eve gidemeyeceğimden korktuğum için ...
    önceki
    Ubud Bali'de gizli yeşil vahşi peri
    Sonraki
    Bu baba, çok utanıyorsun!
    OKR'nin ne olduğunu bir makalede anlayın
    Laos'tan yeni döndüm, sana gerçek bir Laos söyle!
    Polis silahın bağlantısını keser ve adama bıçakla üniforma uygularsa, bu operasyon dalgası ulusal tanıtıma layıktır!
    2019'da en büyük etnik gruba küçük kasaba gençliği deniyor
    Ali CEO Zhang Yong: Ma Yun 6 yıl önce bana şu ana kadar kullandığım 8 kelimeyi verdi
    9 gurmenin "aile midesi" hemen eve gitmek için bir bilet almak istememe neden oldu!
    WeChat uygulaması yeni perakendeyi artırmak için kapıyı nasıl açacak?
    Ertelemenin kendi kendini kurtarması: günde 3 dakikadan başlayarak
    İnsanların% 99'u Hokkaido yüzünden özlüyor! Japonya'nın yenilmez kar sahnesinde oturmak, tek bir görünümle sayısız insanı şaşırtıyor
    Guangxi polisi kaçak bir Vietnamlı kadın uyuşturucu satıcısını tutukladı
    `` WeChat kimlik kartından sonra yüz tarama çağı '', fotoğrafların neden yüz sistemini kıramadığını ortaya koyuyor
    To Top