StarCraft 2 insanları AI 1: 10'a yenildi! DeepMind "AlphaStar" hızla gelişiyor

Az önce, AI ve insan PK'sında başka bir büyük ilerlemeye tanık olduk! DeepMind, 25 Ocak günü saat 02: 00'de "StarCraft 2" de iki profesyonel oyuncuya karşı kaydedilmiş AI oyununu duyurdu: AlphaStar, profesyonel TLO'yu 5: 0, 5: 0, 2018 WSC'yi mağlup etti. Austin İstasyonu'nda ikinci MaNa. İki insan rakiple yapılan maçtan yaklaşık iki hafta sonra, AI kendi kendine öğretildi.TLO'ya karşı savaşta çaylak seviyesinden mükemmel operasyona geçiş sürecini deneyimledi.Özellikle MaNa'ya karşı verilen savaş, başlangıçta insanların sınırlarını aşabileceğini gösterdi. kabiliyet.

Bu demo aynı zamanda DeepMind'ın StarCraft 2 AI AlphaStar'ının ilk halka açık görünümüdür. AlphaStar, önceki oyunun video görüntüsünün yanı sıra MaNa ile de bir oyun oynadı ancak bu oyunda AlphaStar insan oyuncu MaNa'ya kaybetti.

Resim | MaNa rekabete odaklanıyor (Resim kaynağı: Youtube)

DeepMind, iki taraf arasındaki oyunun 4.6.2 oyun versiyonu kullanılarak Catalyst LE haritasında sabitlendiği ve sadece Protoss iç savaşının oynanabileceği demoda tanıtılan iki taraf 5 oyun oynayacak. Daveti ilk kabul eden, şu anda dünyada 68. sırada yer alan Team Liquid'in Zerg oyuncusu TLO'sudur.

Şekil | TLO (Kaynak: Youtube)

İlk oyunda TLO saat 10'da ve AlphaStar çapraz olarak saat 4'te belirdi. TLO'nun açılışı çok gelenekseldi, yolu kapatmak için iki kışlası kullanıyordu, ancak AlphaStar yolu kapatmadı. Bu sorun TLO'nun çiftçileri tarafından tespit edildi. Elçilerin fotoğrafını kararlı bir şekilde fotoğrafladı ve çiftçileri öldürme ortak taciz stratejisini benimsedi.

AlphaStar yolu kapatmasa ve doğrudan TLOnun havarilerini yerleştirmesine rağmen, AlphaStarın çift kışlası ayrıca havari savunmalarını da yaratarak TLOnun ilk tacizinin yalnızca iki çiftçiyi öldürmesine neden oldu ve geri kalan havariler de geri dönmedi. .

Sonra her iki taraf da avı telafi etmeye başladı ve TLO peygamberleri taciz etmeye başladı. İki taraf bir dizi küçük çaplı savaşa katıldı ve birkaç değişim dalgası neredeyse bağlanmıştı. AlphaStar daha fazla çiftçiyi kaybetti ve TLO birçok havariyi kaybetti. Savaş sırasında, AlphaStar'ın güçleri iletmek için prizmalar kullanırken geri çekilirken, TLO avına karşı saldırırken insan benzeri mikro manipülasyonlar gerçekleştirdiğini gördük.

Şekil | AlphaStar'ın vizyonu, tüm haritada savaş sisi dışında neler olup bittiğini görebilir ve ardından küresel kaynak planlamasına ulaşmak için kararlar alabilir (Kaynak: Youtube)

Ancak, ikinci TLO madeni şu anda inşa edildi.AlphaStar'ın daha fazla ekonomiyi birliğe dönüştüren tek bir mayını var.Bu nedenle, AlphaStar daha fazla av patlatıyor ve doğrudan ikinci madene saldırmayı seçiyor. TLO'nun avı sayıca üstün. Ana kuvvet yok edildikten sonra GG oynandı.

İlk oyun DeepMindın zaferinin sonucuydu. AlphaStar'ın birbirini taciz etmeyi seçmemek, doğrudan birliklerle savunmak gibi alışılmadık bazı uygulamaları gördük ve sonra TLO'nun ikinci mayını aldıktan sonra belli bir miktar kullandığını gördük. Avlanma baskılanmaya devam ediyor.

Zaman kısıtlamaları nedeniyle, demoda tüm oyunlar oynanmadı, bunun yerine, başka bir oyun videosu gösterildikten sonra, TLO'nun beş oyun rekoru yenildi. Ancak, tüm videolar indirilmek üzere DeepMind'ın resmi web sitesinde yayınlanacaktır.

TLO demoda hala kazanabileceğini düşündüğünü söyledi.Eğer daha fazla eğitim süresi varsa ve AlphaStar hakkında daha fazla şey biliyorsa, kesinlikle AlphaStar'ın zayıflıklarını bulabilir ve kazanabilir.

Ardından Liquid takımı MaNa geldi ve 19. sırada yer alan Protoss oyuncusu olarak TLO'dan daha güçlü. AlphaStar onu yenebilirse, bu AlphaStar'ın gerçekten en iyi insan oyuncuların gücüne sahip olduğunu gösterecektir.

Şekil | AlphaStar ile insan oyuncuların APM'si arasında pek bir fark yok (Kaynak: Youtube)

MaNa ile ilk maçta her iki taraf da "düzenli" başladı, MaNa yolu kapattı ve AlphaStar yolu kapatmadı. Ancak AlphaStar, kristali MaNa üssünün yakınına düşürmeyi seçip, iki kışlanın fotoğrafını çekerek ve saldırı için kışla mesafesinin avantajını kullanmaya hazırlanarak farklı bir strateji benimsedi. MaNa, insan düşüncesine uygun olarak çiftçileri taciz etmek için hala havarileri kullanıyor.

AlphaStar kışlası neredeyse tamamlandığında, MaNa savunma önlemleri aldığını keşfetti ve Gaopo'da yol kapanışlarından ve Gaopo'nun yaklaşmakta olan av ordusunu savunmak için yararlanmaya hazır iki şarj istasyonu kurduğunu keşfetti. MaNa'nın fikrine göre, "Normal insan oyuncular bu yüksek yokuşa çıkmayacaklar".

Ancak AlphaStar bir insan değil. İki kez tereddüt ettikten sonra, doğrudan yüksek zemine saldırmayı seçti. Avların sayısı MaNa'yı ezdiğinden, saha kampı hala sürekli avlar veriyor, bu nedenle şarj istasyonunun neredeyse hiçbir etkisi yok. Birkaç atıştan sonra, MaNa's Fazla avlanma alanı kalmadı ve sonunda tüm çiftçiler yenilgiyi kurtaramadı ve yenilgi ilan etti.

Aşağıdaki iki video tekrarında, AlphaStarın güçlü mikro manipülasyon ve taktik fikirlerini gördük. İnsanların yol kapatma taktiklerini öğrenip deneyecek ve tacizin etkisini hafifletmek için ek çiftçiler üretecek. Bir oyunda, AlphaStar'ın yalnızca MaNa'nın avlanma, ölümsüz ve çatal kombinasyon ordusuna karşı güçlü mikro manipülasyonlara dayanan saf av taktikleri kullandığını gördük.

Şekil | Gerçek zamanlı savaş (Kaynak: Youtube)

AlphaStar 30'dan fazla avı 2-3 gruba ayırır, MaNa'nın saldırı güçlerini 3 yönden ikiye katlar ve ardından yanıp sönerek 9 ölümsüz saldırıdan kaçar. Bu insan dışı operasyon, ne olursa olsun MaNa'nın operasyon alanını tamamen yok etti. Kaç tane ölümsüz inşa etti, av ordusuna direnmenin yolu yok. MaNa konuşmasında çaresizce "Bu durum asla aynı seviyedeki bir insan oyununda olmayacak," dedi.

Sonunda MaNa da 0-5 yenildi.İnsanlar ve AlphaStar arasında oynanan 10 maçın sonuçları tamamen yenilgiydi.

Ancak canlı demoda, DeepMind biraz şişkin görünüyordu ve MaNa ile canlı bir gösteri maçı yapmayı seçti.İkincisi, Liquid ekibinin adını haklı çıkaracağını ve ekibin ve insanlığın onurunu savunacağını belirtti.

İlk aşamalarda iki taraf rutin olarak büyük çaplı bir savaş olmadan başladı. Ancak MaNa açıkça hazırlıklı geldi, havarileri ve peygamberleri taciz etmek için kullanmadı, ancak tespit ve teknolojiye odaklandı. AlphaStar'ın hala çok fazla av ürettiğini keşfettikten sonra MaNa, prizma taşıma ölümsüzlüğünün taciz taktiklerini benimsedi ve aynı zamanda ölümsüzlük, çatal ve arkon gibi karışık birlikler oluşturdu. Bu, tüm oyunun sihirli dokunuşu olarak tanımlanabilir.

Şekil | Üç peygamber prizmanın etrafındaki heyecanı izliyor (Kaynak: Youtube)

Ölümsüz hava saldırısı çiftçileri taciz ettiğinde, AlphaStar Phoenix Strike Prism'i oluşturmayı seçmedi, ancak hava birimlerine saldıramayan peygamber izleme prizmasını kullandı, ön cepheye ve eve düzinelerce avla desteklendi. Görünüşe göre avlanmanın havada saldırabileceğini düşünüyor, bu yüzden Phoenix'i oluşturmasına gerek yok ve görünüşe göre tüm avlar bir grupta ve toplu işlerde ayrı saldırı ve savunma görevleri yok.

Bu yüzden, insan oyuncuların yapay zekaya karşı tipik yöntemini gördük: ikincisini belirli görevleri yerine getirme döngüsüne girmeye zorlamak, onların büyük miktarda zaman ve kaynak israf etmelerine ve etkili durum yargıları oluşturamamalarına neden olmak.

Bu şekilde MaNa, kendi oluşturmak için kendi gücünü tüketti ve ardından bir bastırma dalgası, AlphaStar'ın saf takip birliklerini doğrudan parçaladı. İkincisi de MaNa'yı engellemek için çift takım taktiklerini kullanmaya çalıştı, ancak bu sefer MaNa'nın yeterli birliği vardı ve Immortal'ın avlanma konusundaki kısıtlaması çok açıktı.AlphaStar'a operasyon şansı bırakmadı, rakibi tamamen yok etti ve değerli bir zafer kazandı.

Resim | MaNa gösteri maçını kazandı ve büyüleyici bir gülümseme gösterdi (Kaynak: Youtube)

TLO ve MaNa'nın videosu, DeepMind AlphaStar'ın gücünün zaten farklı olduğunu ilan ederek tam bir yenilgiyle sonuçlansa da, bu gösteri oyunu AlphaStar'ın mevcut eksikliklerini tamamen ortaya çıkardı.

Sinir ağının uzun süredir optimize edilme eğiliminde olmasına rağmen, yine de bir dereceye kadar yerel optimumda düşüyor gibi göründüğünü görmek zor değil.İnsanlar tarafından sabit bir şekilde keşfediliyor, bir tuzağa düşüyor ve 5 küçük jingle zilinden saf avlanmaya kadar. Birlik, oyun kollarını anlamasının henüz yerinde olmadığını gösterdi.Son turda bir insan gibi doğrudan bir Phoenix savunma prizması gönderebilirse, belki de bir süper mikro manipülasyon dalgasıyla MaNa'yı düzleştirmeye devam edecektir.

Oyun tekrarı sırasında sunucu, DeepMind bilim adamlarına AlphaStar'ı nasıl eğiteceklerini sordu.DeepMind bilim adamları Oriol Vinyals ve David Silver, ilkinin taklit öğrenme olduğunu söyledi. Ekip, birçok oyuncudan çok sayıda oyun tekrar verisi elde etti ve bir tanesini gözlemlemek için yapay zeka edinmeye çalıştı Bir kişinin yaşadığı ortam, StarCraft'ın temel bilgilerini anlamak için mümkün olduğunca belirli bir eylemi taklit eder. Burada kullanılan antrenman materyalleri sadece profesyonel oyuncuları değil aynı zamanda amatör oyuncuları da içerir. Bu, AlphaStar şekillendirmenin ilk adımıdır.

Şekil | DeepMind bilim adamı Oriol Vinyals (Kaynak: Youtube)

Şekil | DeepMind bilim adamı David Silver (Kaynak: Youtube)

Bundan sonra takım "Alpha League" adlı bir yöntem kullanacak. Bu yöntemde, Alpha League'in ilk rakibi, insan verilerinden eğitilmiş bir sinir ağıdır ve ardından "Alpha League" 'i büyütmek için yeni ajanlar ve dallar oluşturmak için tekrar tekrar yineler.

Şekil | Alpha League'in şematik diyagramı (Kaynak: Youtube)

Daha sonra bu temsilciler, tüm bu farklı stratejileri olabildiğince etkili bir şekilde yenmek için bir takviye öğrenme süreciyle "Alfa Ligi" ndeki diğer rakiplerle rekabet eder.Ayrıca, kişisel öğrenme hedeflerini ayarlayarak rakipleri ilerlemeye teşvik edebilirler. Örneğin belirli bir ödül elde etmek için belirli bir şekilde gelişin.

Sonunda takım, "Alfa Ligi" nde en kolay sömürülen menajeri seçti ve buna "Ligin çılgını" adını verdi. Bunlar TLO'nun oynadığı 5 ajan.

Qingyang kızlarına zorbalık: kadın öğretmenler ve ebeveynler Rashomon'a düştüklerini söyledi
önceki
"Kalp Koruyucu Koşan Adam" ın Life Ekspresi
Sonraki
Shenzhen kızları ülke içinde tacize uğradıktan sonra
Soğuk ve ılık! Binzhou CPPCC tarafından bu yıl yapılan işe bakın.
Express Ulusal Bilim ve Teknoloji Ödülleri Konferansı, Elektronik Bilim ve Teknoloji Üniversitesi 3 Projesi için ödül alacak
31 yıllık çalıntı
Sert! Üç genç kadın bir bakkalı soydu, bir erkek katip dövüldü
Bilim adamları, petri kaplarında ilk kez mükemmel insan kan damarları geliştirdiler
Chijiao Video ve Hainan Airlines Xilehang, 80 milyon kişi için karnaval hayat estetiği yolculuğuna başlamak için stratejik bir işbirliğine ulaştı
Dans salonunda hala yaşlı dansçılar
Flash! Jinan sokaklarında bir grup insan "My Motherland and Me" şarkısını söyledi
Çok güzel görünmüyorsun
Hubei "İki Seans" başarıyla sonuçlandı ve temsilciler güvenle mekandan çıktı
Dingxi'deki yaşlı adam: güneşten yemek yemek, yeraltı dünyasının kalbini lanetlemek
To Top