Xinzhiyuan tarafından önerilir
Github Link: https://github.com/xhujoy/pysc2-agents
PYSC2 ortamı hakkında zaten birçok makale var. Burada artık ayrıntılı olarak tanıtmayacağız. Size bir portal verin: GM Yapay Zekaya Doğru: Starcraft 2 Yapay Zeka Araştırma Ortamı SC2LE Tam Giriş Kılavuzu (https://zhuanlan.zhihu.com/p/28434323), herkesin Pysc2 API'si için bir API'ya sahip olabileceğine inanıyorum. .
PYSC2 ortamının duyurulmasıyla DeepMind, makalelerinde Atari-Net Ajanı, TamConv Ajanı ve TamConv LSTM ajanı olmak üzere üç farklı gelişmiş öğrenme zekası tanıttı. Bu üç zeka benzer öğrenme algoritmalarına ve parametrelere sahip olduğundan, sadece özellikleri çıkarmak için farklı mimarilere sahip sinir ağları kullanırlar. Böylece bir sonraki içerik, örnek olarak FullConv Aracında tanıtılır.
Orijinal makalelerde, yazar klasik A3C algoritmasını kullanıyor, asenkron aktör-kritik algoritma. Bu algoritmada, bir strateji işlevi olarak aktör yürütülecek eylemi üretir. Eleştirmen, strateji işlevinin kalitesini bir değer olarak değerlendirmekten sorumludur. işlev. SC2 Geliştirilmiş Öğrenme Algoritmasında yazar, stratejik işlevi ve değer işlevini düzeltmek için bir sinir ağı kullanır. Belirli ağ mimarisi:
Makale tarafından verilen detaylara göre algoritmayı makaledeki kısaca çoğalttık ve karşılaştırmanın yaklaşık%80'ine ulaştık. Süreç ve kullanım yöntemi ayrıntılı olarak tanıtılacaktır.
Algoritma girişi ve çıkışı
Tüm ekran özellikleri diyagramlarını ve minimap özellik haritalarının yanı sıra algoritmalar olarak alan olmayan özelliklerin girişi olarak yürütülebilir eylemi kullanıyoruz; çıktı, tüm boşluk olmayan hareketlerin ve mekansal hareketlerin olasılığıdır. Yazar, çıktı için büyük hareket alanı nedeniyle, bunun aynı zamanda Star 2'nin zorluğu olduğunu buldu.
Test kodunu doğrudan çalıştırın
Her şeyden önce, GitHub'dan kaynak kodunu kopyalayın ve önceden eğitilmiş modelleri buradan indirin ve Test Kodunu çalıştırmak için bağımlı kütüphane PYSC2 ve TensorFlow'u yükleyin:
git klonu https://github.com/xhujoy/pysc2-agents cd pysc2-agents python -m harita = moveToBeacon-trawing = falseeAşağıda benzer bir render alacaksınız. Aşağıdaki sunumlar Windows'un sonucudur:
Çalışan Eğitim Kodu
Python -m haritası = moveTobeaconEğitim kodu makinenin performansı için yüksek gereksinimlere sahiptir. Yazar NVIDIA K40 üzerinde eğitilmiştir ve eğitim büyük bir rastgele vardır. Orijinal makalede, her derin model için en iyi modelin en iyi seçimi modeli vardır. seçildi.
Bu makale esas olarak SC2'nin gelişmiş öğrenme algoritmasını tanıtır ve temel olarak makaledeki yöntemleri yeniden üretir. Yazarın yeniden ortaya çıkışı süreci, Interstellar 2'nin büyük ödüllerinin çok seyrek olduğunu buldu. Özet, öğrenme yıldızlararası 2 akıllı gövdesine dayanmak gerçekten zor.
Kod açık kaynak, birlikte tartışmaya ve öğrenmeye hoş geldiniz.
(Bu makalenin yazarın Zhihu sütunundan yeniden yazdırılması için yetkilendirildi, bu yüzden teşekkür etmek istiyorum)
Orijinal metni okumak için tıklayın, konumun ayrıntılarını görüntüleyebilir ve katılmanızı dört gözle bekleyebilirsiniz ~