StarCraft 2 oyuncuları, yakında DeepMind'in merdivendeki makalesine katkıda bulunacaksınız

Avrupa'ya gitmeyi unutma

AI Technology Review Press : Dün gece Blizzard ve DeepMind, DeepMind tarafından geliştirilen StarCraft 2 AI "AlphaStar" ın yakında StarCraft 2 Avrupa sunucusundaki 1v1 merdiven oyununda yer alacağına dair bir haber yayınladı. İnsan oyuncular sadece onlarla eşleştirme ve onlarla standart bir oyuna başlama fırsatına sahip olmayacak, oyunun sonucu da normal oyunlarda olduğu gibi merdiven puanlarını etkileyecektir.

StarCraft 2 üzerinde bilimsel deneyler yapın

Tıpkı tanınmış Go AI AlphaGo gibi, DeepMindın en sevdiği pekiştirmeli öğrenme AI araştırma süreci, teknolojiyi belirli bir oyun (oyun) ortamında keşfetmektir ve yeni teknolojilerin yardımıyla, aracı geçmiş verilerden ve kendi kendine oyundan öğrenebilir. Ortada öğrenin ve ardından yapay zeka düzeyini değerlendirmek için insan ustalarla rekabet edin. Fan Hui, Li Shishi ve Ke Jie'nin hepsi "yapay zeka testinin kıdemli mühendisleri" oldular.

StarCraft 2 AI "AlphaStar" ın araştırma sürecinde DeepMind bu fikri kullanmaya devam ediyor, ancak bu sefer biraz daha cesurlar. Farklı seviyelerden çok sayıda sıradan oyuncunun AI performansının değerlendirilmesine katılmasına izin verin Yarışmanın nihai sonucu, StarCraft 2 AI bilimsel araştırma projesinin tartışıldığı bildiriye yazılacak ve dergiye gönderilecektir. Blizzard ve DeepMind'ın merdiven oyununa yapay zeka göndermek için bir araya gelmesinin en önemli nedeni budur.

StarCraft 2 oyununa girdikten sonra, 1v1 oyunda DeepMind'e (DeepMind katılımı) erişime izin verdikten sonra, 1v1 merdiven oyununa katılan oyuncular AlphaStar ile karşılaşabilir. Tüm maçları normal insan 1v1 sıralama maçlarına olabildiğince yakın olacak şekilde kontrol etmek ve farklı maçlar arasındaki farkı azaltmak için AlphaStar oyuncuların merdiven maçlarının bir bölümünü rastgele eşleştirecek ve AI oyunda, eşleşen oyuncularda ve oyunda isimsiz kalacaktır. StarCraft 2'nin AlphaStar'ın hangi oyunlara katıldığını bilmesinin bir yolu yoktur. Bununla birlikte, AI'ya izin verilen erişimi ayarladıktan sonra, oyuncuların hemen AI rakipleriyle eşleşmeyi beklemeye başlayacaklarına ve oyunun başladıktan kısa bir süre sonra rakiplerinin bazı alışılmadık özelliklere sahip olduğunu bulabileceklerine inanıyorum.

Ocak oyununda, AlphaStar hızla bir kaynak avantajı elde etmek için çok sayıda işçi oluşturacak (16 veya 18 insan profesyonel oyuncunun üst sınırını aşarak)

Ocak maçında, AlphaStar tarafından kontrol edilen iki takipçi, aşırı siyah kandan kaçtı.

Bu yılın Ocak ayında AlphaStar, insan profesyonel oyuncularla yarıştı ve tam bir zafer elde etti. Mevcut versiyonla karşılaştırıldığında, daha büyük ölçekte test edilen AlphaStar versiyonu, bazıları insanlar için açıkça faydalı olan bazı değişiklikler yaptı:

  • Ocak versiyonu, haritadaki tüm görünür içeriği doğrudan okuyabilir.İşlemle görüş açısını değiştirmenize gerek yoktur.Bu sefer görüş açısını kendiniz kontrol etmeniz gerekir.Aynı insanlar gibi, sadece görüş alanı içindeki birimleri gözlemleyebilir ve hareket ettirebilirsiniz;

  • Ocak versiyonu sadece Protoss kullanıyor Bu sefer AlphaStar üç ırkın hepsini kullanacak: Human, Zerg ve Protoss;

  • Ocak sürümünün çalışma açısından net bir performans sınırı yoktur.Bu kez, insan profesyonel oyuncularla görüştükten sonra, saniye başına ortalama işlem sayısı, dakika başına ortalama işlem sayısı (APM) ve AlphaStar'ın en yüksek anlık APM'si İnsanlara kıyasla operasyonel avantajları azaltmak için daha katı kısıtlamalar getirildi.

Teste katılan AlphaStar'ın hepsi insan tekrarından ve kendi kendine rekabetten öğrendi. İnsanlara karşı oyundan bir şey öğrenmedi ve AlphaStar'ın performansı, eğitim ve öğrenim olmadan test süresi boyunca aynı kalacak Bu şekilde elde edilen test sonuçları, DeepMind'ın mevcut teknik seviyesinin seviyesini doğrudan yansıtabilir. Öte yandan, AlphaStar teknik çözümünün bir özelliği olarak, Teste katılan AlphaStar aynı zamanda AlphaStar liginden (AlphaStar ligi, aşağıya bakınız) bir dizi farklı birey olacaktır. Eşleşen farklı AlphaStar bireyleri farklı oyun performanslarına sahip olabilir.

AlphaStar teknik özellikleri

Bu yılın Ocak ayında, DeepMind AlphaStar oyununun sonuçlarını profesyonel insan oyunculara karşı ilk kez yayınladığında, AI Technology Review, AlphaStar'ın teknik özelliklerini bildirmek için DeepMind'in resmi blogu ile birleştirildi. Burada AlphaStar'ın teknik özelliklerini şu şekilde özetliyoruz:

Model yapısı-AlphaStar, uzun sıralı bir modelleme modeli kullanır.Modelin oyun arayüzünden aldığı veriler, birimlerin ve bu birimlerin niteliklerinin bir listesidir.Nöral ağ hesaplamalarından sonra, oyunda yürütülecek komutları çıkarırlar. Bu sinir ağının temeli, Transformer ağıdır ve derin bir LSTM ağ çekirdeğini, bir işaretçi ağıyla otomatik bir gerileme stratejisi başlığını ve merkezi bir puanlama karşılaştırmasını birleştirir.

AlphaStar ligindeki bireyler net bir stratejik dağılım oluşturdu

Eğitim stratejisi-AlphaStar önce üst düzey insan yarışmalarına dayalı denetimli öğrenme eğitimi (taklit öğrenme) yürütür ve ardından kendi kendine oyun oynar. Kendi kendine oynama sürecinde kullanılır Grup pekiştirmeli öğrenme Fikir: AlphaStarın kendi kendine oynama süreci, AlphaStar ligi adlı bir grubu koruyarak, ağın birden çok farklı sürümünü her zaman kaydeder ve günceller; AlphaStar ligindeki farklı ağların farklı savaş stratejileri, öğrenme hedefleri vb. Vardır. Oyunun çeşitliliği, tüm grubun oyun öğrenimi sürekli ve istikrarlı bir performans artışı sağlar ve çok yeni sürüm, ilk sürümü nasıl yeneceğini "unutmayacaktır".

Eğitim sonucu çıktısı - Nihai eğitim sonucu olarak bir ağ oluşturmak gerektiğinde, AlphaStar ligindeki Nash dağılımı ile örnekleme, keşfedilen birden fazla stratejinin kapsamlı optimal çözümünü elde edebilir.

Hesaplama gücü gereksinimleri - AlphaStar temsilcilerinin çok sayıda farklı sürümünün savaşını ve güncellemesini desteklemek için DeepMind, en yeni Google TPUv3'ü kullanan büyük ölçekli ve ölçeklenebilir bir dağıtılmış eğitim ortamı oluşturdu. AlphaStar liginin kendi kendine maç eğitim süreci 14 gün sürdü. Her AlphaStar temsilcisi, her temsilci için 200 yıllık oyun süresine eşdeğer olan 16 TPU kullandı. Eğitimden sonra, model tek bir tüketici GPU'sunda çalıştırılabilir.

Operasyonel İstatistikler - Bu yılın Ocak sürümünde, AlphaStar'ın ortalama APM'si 280'dir, en yüksek APM 1000'den fazladır ve ortalama hesaplama gecikmesi 350 milisaniyedir; anahtar Dikkat Bölge hızı dakikada yaklaşık 30 vuruştur.

Bu sefer AlphaStar'da test edilen geniş eylem alanı altındaki uzun sıralı modelleme ve grup pekiştirmeli öğrenmenin eğitim stratejisi, hem takviye öğrenme algoritmalarının performans üst sınırını geliştirmek hem de karmaşık ortamlarda uzun vadeli görevlerle başa çıkmak için aktif teknik keşiflerdir. Bu makaleyi DeepMind tarafından mümkün olan en kısa sürede görmeyi ve pekiştirmeli öğrenmeye dayalı karar verme sistemlerinin tüm alanının yakında daha olgunlaştığını görmeyi dört gözle bekliyoruz. Elbette, StarCraft 2'yi seven okuyucular bu DeepMind makalesini hazırlayabilir ve katkıda bulunabilir!

AI Teknolojisi İnceleme Raporu

2019 Küresel Yapay Zeka ve Robotik Zirvesi

12-14 Temmuz 2019 , Lei Feng.com ve Hong Kong Çin Üniversitesi (Shenzhen) tarafından ortaklaşa düzenlenen ve Shenzhen Yapay Zeka ve Robotik Enstitüsü tarafından ortaklaşa düzenlenen Çin Bilgisayar Federasyonu (CCF) sponsorluğunda 2019 Küresel Yapay Zeka ve Robotik Zirvesi (CCF-GAIR 2019 olarak kısaltılmıştır) Shenzhen'de resmen açılacak.

O sırada Nobel Ödülü sahibi James J. Heckman, Çinli ve yabancı akademisyenler, Dünya Zirvesi Başkanı, tanınmış Fellow ve çok sayıda ağır konuk savaşta yer alacak. Yapay zeka ve robotik bilim, üretim ve yatırım alanlarında karmaşık hayatta kalma durumunu tartışmak.

Özel canlı yayın devam ediyor | Yapay zeka alanındaki en iyi yetenekler ne dedi? Küresel Yapay Zeka ve Robot Zirvesi size anlatıyor
önceki
Boks şampiyonu Zou Shiming 18.000 metrekarelik bir alanı kaplayan bir spor salonu açtı ve tanrıça Xie Na bunun iyi olduğunu söyledi.
Sonraki
"Red Velvet" "Paylaş" 190614 hayranlarının arkeolojik yıldız takibi! İdolle pirinçten kum heykeli
"Kral-erkek + kadın = kraliçe" nin arkasındaki kelime benzetme ilkesi nedir? | ACL 2019
Robotların görüntüleri temel alarak görevleri tamamlamaları için en etkili RL yöntemi: geleceği tahmin etmeye veya kesin varsayımlara gerek yok
Slash Youth: "Borderless" daha mı heyecanlı? Güçlü destek
Çin, açık kaynaklı çipler alanında bir atılımı nasıl buluyor? RISC-V harika bir fırsat olacak
Geliştirme | Y = X'ten eksiksiz bir yapay sinir ağı oluşturmaya
Sohbet etmek için birden fazla sohbet botunu bir araya getirin, sonuç ne olacak? Bu oyunun bir cevabı olabilir
Günlük seyahati basit ve şık hale getirin
İş önerisi alanı çevrimiçi! | Cömert bonuslar ve rahat bir atmosferle Shanghai Krypton Technology işe alıyor
"City Image" profesyonel fotoğrafçısının dijital ekranı var mı?
Bakış Açısı | Hong Xiaowen'in Piramit Felsefesi
190614 Wang Yuan'ın taze portakalı ve birçok el yazısıyla yazılmış metinleri, uzaktaki manzarayı görmeniz için size eşlik edecek
To Top