Yeni AlphaGo çok güçlü! Li Shidong versiyonunu cüruf haline getirmek için 0'dan 36 saat içinde usta olmak için kendi kendine eğitim, 100: 0

İçbükey tapınaktan Li Lin Qianping

Qubit Üretildi | Genel Hesap QbitAI

"Sonunda tüm beklentilerimizi aştı."

DeepMind ekibi yine şok edici bir haber yayınladı.

Basitçe söylemek gerekirse, AlphaGo yine önemli bir ilerleme kaydetti. DeepMind, Go AI AlphaGo Zero'nun bu yeni sürümünü çağırıyor. Bu ismin nedeni, bu AI'nın sıfırdan başlaması, Go'yu tamamen insan bilgisinden kendi başına öğrenmesidir.

AlphaGo'nun önceki sürümleri insan bilgisi ile eğitildi ve ustalar tarafından onlara nasıl satranç oynanacağı anlatıldı. Yeni çıkan AlphaGo Zero, 0'dan başlayarak rastgele hareketler kullanarak ve 40 gün sonra Go dünyasında eşsiz bir usta haline gelen daha fazla ilke ve algoritma kullanıyor. Gerçekten kendi kendini yetiştirmiş.

Yeni AlphaGo Zero, sıfır tabanlı bir sinir ağından başlayarak, arama algoritmalarıyla birleşen, sürekli gelişen, ayarlanan ve yinelemeli olarak yükselten yepyeni bir pekiştirmeli öğrenme yöntemi kullanır. AlphaGo Zero'nun farkı:

  • Siyah ve beyaz satranç taşları dışında, başka hiçbir insan AlphaGo Zero'ya satranç oynamayı öğretmedi. Önceki AlphaGo az sayıda yapay olarak tasarlanmış özellik içerir.

  • AlphaGo Zero, iki yerine yalnızca bir sinir ağı kullanır. Geçmişte AlphaGo, nasıl hareket edileceğini birlikte belirlemek için "strateji ağı" ve "değer ağı" nı kullanıyordu.

  • AlphaGo Zero, sunumlar yerine hareketin konumunu değerlendirmek için bir sinir ağına güveniyor - bu, diğer Go programları tarafından hangi tarafın kazanacağını tahmin etmek için kullanılan hızlı, rastgele bir oyundur.

AI Engineering Institute of Innovation Workshop'un dekan yardımcısı Wang Yonggang, AlphaGo Zero'nun yeni versiyonunu değerlendirmek için "Jane'e Uzakta" dört kelimesini kullandı.

Yukarıdakilerin tümü AlphaGo Zero'yu son derece güçlü kılar.

AlphaGo takım lideri Dave Silver, "İnsanlar genellikle makine öğreniminin büyük veri ve büyük hesaplamalarla ilgili olduğunu düşünüyor, ancak DeepMind AlphaGo Zero vakasında algoritmaların hesaplamalardan veya veri kullanılabilirliğinden daha önemli olduğunu keşfetti" dedi. Hesaplandığında, önceki AlphaGo'dan daha küçük bir mertebedir.

Yukarıdaki şekilde gösterildiği gibi, AlphaGo Zero ayrıca yalnızca 4 TPU kullanır.

AlphaGo Zero ne kadar güçlü? Resmi metne bakın:

  • Üç saat sonra AlphaGo Zero, Go'yu başarıyla başlattı.

  • Yalnızca 36 saat sonra, AlphaGo Zero, Go'nun tüm temel ve önemli bilgilerini araştırdı ve 100: 0 rekoruyla, o yıl Li Shidong'u yenen AlphaGo v18 sürümünü ezdi.

  • 21 gün sonra AlphaGo Zero, Master seviyesine ulaştı. Bu, Go dünyasını yılın başında 60 ardışık zaferle kasıp kavuran versiyondur. Usta daha sonra Ke Jie'yi yendi.

  • 40 gün sonra AlphaGo Zero, Usta'ya karşı% 90 kazanma oranına sahipti. Başka bir deyişle, AlphaGo Zero, yalnız ve yenilmez Go AI haline geldi.

DeepMind'ın ana yazarlarından biri olan Dr. Huang Shijie şu sonuca vardı: AlphaGo Zero tamamen sıfırdan başladı ve hatta ilk aşamada intihar etti. AlphaGo Zero'nun soygun, toplama, satranç şekli, köşedeki ilk yerleşim vb. Gibi kendi kendine öğretilen Go bilgisi, insan Go kavramlarıyla tutarlıdır.

Huang Shijie, "Binlerce yıldır Go'nun çalışmasına dayanan insanoğlunun değerini dolaylı olarak yansıtıyor" diye yazdı.

Zafer Kralı en karşı saldırı kahramanıdır! Kanalizasyonda 4 ay kaldı, şimdi Tianmei tarafından sunağa gönderildi.
önceki
Geely Linjie: En büyük yelken en hızlı değil, eşleştirme ilkesi daha iyi çalışıyor
Sonraki
Erickson'ın sınıfı için üç tesadüfi faktör
Lippi turşunun tadı kaz kızartması gibi yapabilir mi? Birçok koç "Asya Üzüntüsü"! İran'a karşı savaş devam edebilir mi?
Tarihin en genç e-spor oyuncusu! 4 yaşında profesyonelce oynamak, binlerce bonus ve sponsorlarla!
İngiltere'deki forvet garip bir hastalığa yakalandı: yabancı savaş uzmanı, iç savaş yabancı
Emgrand Ailesinin 2 milyon otomobil sahibi doğdu ve Geely ekibinin bel kemeri şampiyonluğu başarıyla kazandı
Antrenman takımı perişan bir şekilde 1-6 kaybetti ve koçluk ekibinde 30'dan fazla kişi var! Shen Xiangfu, Feng Boyuan ile çatıştı, Xu Liang gitmeye ikna etti
DOTA2: TI8'in ilk cezası belirir! VGJ.S faul nedeniyle cezalandırıldı "BP süresi 70 saniye azaltıldı"!
Google Pixel 2 siyah kamera teknolojisi: arka plan bulanıklığını elde etmek için tek kamera + içeride gizlenmiş gizemli çip
Süper Lig'den ayrıldıktan sonra hala parlayan yabancı oyuncular
"Annei" endişesiz, "yabancılar kırılıyor" Highlander Roewe RX8 Neden?
Schuster, Çin Süper Ligi'nden emekli oldu ve hayatını eğlendirmek için 4S mağazalarını ziyaret etti. Real Madrid'in Jardim'i seçmesi konusunda iyimser değil
Gerçekçi Gundam! ABD-Japonya dev robot savaşının sonuçları yakında ortaya çıkacak
To Top