"Gerçek Savaş" DeepMind Yıldız Yıldızları Geliştirilmiş Öğrenme Algoritması

Xinzhiyuan tarafından önerilir

Github Link: https://github.com/xhujoy/pysc2-agents

PYSC2 ortamı hakkında zaten birçok makale var. Burada artık ayrıntılı olarak tanıtmayacağız. Size bir portal verin: GM Yapay Zekaya Doğru: Starcraft 2 Yapay Zeka Araştırma Ortamı SC2LE Tam Giriş Kılavuzu (https://zhuanlan.zhihu.com/p/28434323), herkesin Pysc2 API'si için bir API'ya sahip olabileceğine inanıyorum. .

SC2 Güçlendirme Öğrenme Algoritması

PYSC2 ortamının duyurulmasıyla DeepMind, makalelerinde Atari-Net Ajanı, TamConv Ajanı ve TamConv LSTM ajanı olmak üzere üç farklı gelişmiş öğrenme zekası tanıttı. Bu üç zeka benzer öğrenme algoritmalarına ve parametrelere sahip olduğundan, sadece özellikleri çıkarmak için farklı mimarilere sahip sinir ağları kullanırlar. Böylece bir sonraki içerik, örnek olarak FullConv Aracında tanıtılır.

Orijinal makalelerde, yazar klasik A3C algoritmasını kullanıyor, asenkron aktör-kritik algoritma. Bu algoritmada, bir strateji işlevi olarak aktör yürütülecek eylemi üretir. Eleştirmen, strateji işlevinin kalitesini bir değer olarak değerlendirmekten sorumludur. işlev. SC2 Geliştirilmiş Öğrenme Algoritmasında yazar, stratejik işlevi ve değer işlevini düzeltmek için bir sinir ağı kullanır. Belirli ağ mimarisi:

SC2 Güçlendirme Öğrenme Algoritmasını Yeniden Görüntüle

Makale tarafından verilen detaylara göre algoritmayı makaledeki kısaca çoğalttık ve karşılaştırmanın yaklaşık%80'ine ulaştık. Süreç ve kullanım yöntemi ayrıntılı olarak tanıtılacaktır.

Algoritma girişi ve çıkışı

Tüm ekran özellikleri diyagramlarını ve minimap özellik haritalarının yanı sıra algoritmalar olarak alan olmayan özelliklerin girişi olarak yürütülebilir eylemi kullanıyoruz; çıktı, tüm boşluk olmayan hareketlerin ve mekansal hareketlerin olasılığıdır. Yazar, çıktı için büyük hareket alanı nedeniyle, bunun aynı zamanda Star 2'nin zorluğu olduğunu buldu.

Test kodunu doğrudan çalıştırın

Her şeyden önce, GitHub'dan kaynak kodunu kopyalayın ve önceden eğitilmiş modelleri buradan indirin ve Test Kodunu çalıştırmak için bağımlı kütüphane PYSC2 ve TensorFlow'u yükleyin:

git klonu https://github.com/xhujoy/pysc2-agents cd pysc2-agents python -m harita = moveToBeacon-trawing = falsee

Aşağıda benzer bir render alacaksınız. Aşağıdaki sunumlar Windows'un sonucudur:

Çalışan Eğitim Kodu

Python -m haritası = moveTobeacon

Eğitim kodu makinenin performansı için yüksek gereksinimlere sahiptir. Yazar NVIDIA K40 üzerinde eğitilmiştir ve eğitim büyük bir rastgele vardır. Orijinal makalede, her derin model için en iyi modelin en iyi seçimi modeli vardır. seçildi.

Özetlemek

Bu makale esas olarak SC2'nin gelişmiş öğrenme algoritmasını tanıtır ve temel olarak makaledeki yöntemleri yeniden üretir. Yazarın yeniden ortaya çıkışı süreci, Interstellar 2'nin büyük ödüllerinin çok seyrek olduğunu buldu. Özet, öğrenme yıldızlararası 2 akıllı gövdesine dayanmak gerçekten zor.

Kod açık kaynak, birlikte tartışmaya ve öğrenmeye hoş geldiniz.

(Bu makalenin yazarın Zhihu sütunundan yeniden yazdırılması için yetkilendirildi, bu yüzden teşekkür etmek istiyorum)

Orijinal metni okumak için tıklayın, konumun ayrıntılarını görüntüleyebilir ve katılmanızı dört gözle bekleyebilirsiniz ~

Çoğu araç sahibi, açılır tavanın faydalarını bilmiyor
önceki
Hulk'un sapkın bir dünya dalgası var, dakikalar içinde hayattan şüphe etmek için Seul kalecisini yendi
Sonraki
Bu kıdemli hırsız aslında bir yıl sonu özeti yazdı!
Mercedes-Benz G'yi BJ80 ile yenilemek, 19 kadını kandırarak 4 bebek doğurabilir!
Fed neden Almanya'nın altın incelemesini resmen reddetti? Almanya büyük bir şeyin olacağına dair bir önseziye sahip olabilir
Jingdezhen 30 yıl önce, eski günler akıp gidiyor!
Güney yarım küredeki kanguru ülkesi doğru zamanda seyahat ediyor, güzelliği son derece güzel! Baştan çıkarılmıyor musun?
Bir Mercedes-Benz sökülebilir ve altı tane satın alınabilir! Yedek parçaların fiyatı ne zaman şişer?
İtalya resmi olarak altını geri göndereceğini duyurdu ve 10 ülke altın sevkiyatını açıkladı ve Fed'in durma hakkı yok
Gümüş dünyada, karda neşe! Jingbo Gölü'nün beyaz kar dünyası yumruk atmanızı bekliyor
Gençler için ilk tercih! Bu 4 araba şık ve yakıt tasarrufludur ve Lavida listede!
"AI Society" Take a Tooth for a Tooth "" OpenAI, yeni bir çok aracılı derin güçlendirme öğrenme algoritması olan LOLA'yı yayınladı
Havacılık ülkeye hizmet ediyor, rüzgar ve kar var bana!
Yani merhaba! Guangzhou Nansha, tüm güzel yemekleriyle kış tatili için yeni bir pozun kilidini açtı!
To Top