g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

"Gerçek Savaş" DeepMind Yıldız Yıldızları Geliştirilmiş Öğrenme Algoritması

Xinzhiyuan tarafından önerilir

Github Link: https://github.com/xhujoy/pysc2-agents

PYSC2 ortamı hakkında zaten birçok makale var. Burada artık ayrıntılı olarak tanıtmayacağız. Size bir portal verin: GM Yapay Zekaya Doğru: Starcraft 2 Yapay Zeka Araştırma Ortamı SC2LE Tam Giriş Kılavuzu (https://zhuanlan.zhihu.com/p/28434323), herkesin Pysc2 API'si için bir API'ya sahip olabileceğine inanıyorum. .

SC2 Güçlendirme Öğrenme Algoritması

PYSC2 ortamının duyurulmasıyla DeepMind, makalelerinde Atari-Net Ajanı, TamConv Ajanı ve TamConv LSTM ajanı olmak üzere üç farklı gelişmiş öğrenme zekası tanıttı. Bu üç zeka benzer öğrenme algoritmalarına ve parametrelere sahip olduğundan, sadece özellikleri çıkarmak için farklı mimarilere sahip sinir ağları kullanırlar. Böylece bir sonraki içerik, örnek olarak FullConv Aracında tanıtılır.

Orijinal makalelerde, yazar klasik A3C algoritmasını kullanıyor, asenkron aktör-kritik algoritma. Bu algoritmada, bir strateji işlevi olarak aktör yürütülecek eylemi üretir. Eleştirmen, strateji işlevinin kalitesini bir değer olarak değerlendirmekten sorumludur. işlev. SC2 Geliştirilmiş Öğrenme Algoritmasında yazar, stratejik işlevi ve değer işlevini düzeltmek için bir sinir ağı kullanır. Belirli ağ mimarisi:

SC2 Güçlendirme Öğrenme Algoritmasını Yeniden Görüntüle

Makale tarafından verilen detaylara göre algoritmayı makaledeki kısaca çoğalttık ve karşılaştırmanın yaklaşık%80'ine ulaştık. Süreç ve kullanım yöntemi ayrıntılı olarak tanıtılacaktır.

Algoritma girişi ve çıkışı

Tüm ekran özellikleri diyagramlarını ve minimap özellik haritalarının yanı sıra algoritmalar olarak alan olmayan özelliklerin girişi olarak yürütülebilir eylemi kullanıyoruz; çıktı, tüm boşluk olmayan hareketlerin ve mekansal hareketlerin olasılığıdır. Yazar, çıktı için büyük hareket alanı nedeniyle, bunun aynı zamanda Star 2'nin zorluğu olduğunu buldu.

Test kodunu doğrudan çalıştırın

Her şeyden önce, GitHub'dan kaynak kodunu kopyalayın ve önceden eğitilmiş modelleri buradan indirin ve Test Kodunu çalıştırmak için bağımlı kütüphane PYSC2 ve TensorFlow'u yükleyin:

git klonu https://github.com/xhujoy/pysc2-agents cd pysc2-agents python -m harita = moveToBeacon-trawing = falsee

Aşağıda benzer bir render alacaksınız. Aşağıdaki sunumlar Windows'un sonucudur:

Çalışan Eğitim Kodu

Python -m haritası = moveTobeacon

Eğitim kodu makinenin performansı için yüksek gereksinimlere sahiptir. Yazar NVIDIA K40 üzerinde eğitilmiştir ve eğitim büyük bir rastgele vardır. Orijinal makalede, her derin model için en iyi modelin en iyi seçimi modeli vardır. seçildi.

Özetlemek

Bu makale esas olarak SC2'nin gelişmiş öğrenme algoritmasını tanıtır ve temel olarak makaledeki yöntemleri yeniden üretir. Yazarın yeniden ortaya çıkışı süreci, Interstellar 2'nin büyük ödüllerinin çok seyrek olduğunu buldu. Özet, öğrenme yıldızlararası 2 akıllı gövdesine dayanmak gerçekten zor.

Kod açık kaynak, birlikte tartışmaya ve öğrenmeye hoş geldiniz.

(Bu makalenin yazarın Zhihu sütunundan yeniden yazdırılması için yetkilendirildi, bu yüzden teşekkür etmek istiyorum)

Orijinal metni okumak için tıklayın, konumun ayrıntılarını görüntüleyebilir ve katılmanızı dört gözle bekleyebilirsiniz ~

Çoğu araç sahibi, açılır tavanın faydalarını bilmiyor

Hulk'un sapkın bir dünya dalgası var, dakikalar içinde hayattan şüphe etmek için Seul kalecisini yendi

: Bu kıdemli hırsız aslında bir yıl sonu özeti yazdı!

: Mercedes-Benz G'yi BJ80 ile yenilemek, 19 kadını kandırarak 4 bebek doğurabilir!

: Fed neden Almanya'nın altın incelemesini resmen reddetti? Almanya büyük bir şeyin olacağına dair bir önseziye sahip olabilir

: Jingdezhen 30 yıl önce, eski günler akıp gidiyor!

: Güney yarım küredeki kanguru ülkesi doğru zamanda seyahat ediyor, güzelliği son derece güzel! Baştan çıkarılmıyor musun?

: Bir Mercedes-Benz sökülebilir ve altı tane satın alınabilir! Yedek parçaların fiyatı ne zaman şişer?

: İtalya resmi olarak altını geri göndereceğini duyurdu ve 10 ülke altın sevkiyatını açıkladı ve Fed'in durma hakkı yok

: Gümüş dünyada, karda neşe! Jingbo Gölü'nün beyaz kar dünyası yumruk atmanızı bekliyor

: Gençler için ilk tercih! Bu 4 araba şık ve yakıt tasarrufludur ve Lavida listede!

: "AI Society" Take a Tooth for a Tooth "" OpenAI, yeni bir çok aracılı derin güçlendirme öğrenme algoritması olan LOLA'yı yayınladı

: Havacılık ülkeye hizmet ediyor, rüzgar ve kar var bana!

: Yani merhaba! Guangzhou Nansha, tüm güzel yemekleriyle kış tatili için yeni bir pozun kilidini açtı!

g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

"Gerçek Savaş" DeepMind Yıldız Yıldızları Geliştirilmiş Öğrenme Algoritması

SC2 Güçlendirme Öğrenme Algoritması

SC2 Güçlendirme Öğrenme Algoritmasını Yeniden Görüntüle

Özetlemek

İlgili bilgi

Rusya, Çinli alıcılara arazi sağlamaya istekli olduktan sonra işler ilerledi.Uluslararası çöküş mü yoksa geri dönüş mü ve bir servet mi kazanmak?

2018'deki en mutlu ilçe düzeyindeki şehirler yayınlandı! Listedeki tek kuzey kasabası

Hahahahaha! Kuzeydoğu'da kışın balık satmak bir marangozun işidir

Trump kozunu kullanabilir, küresel ham petrol oligarkları çatladı, petrodolar erken bitebilir

Ching Ming Festivali'nde en yoğun zamanlarda seyahat ederken otoyolları akıllıca seçme ve trafik sıkışıklığı riskini azaltma!

Yapay zeka uzmanları yarışmasının son turu olan "Li Hang bugünün manşetlerine katılacağını doğruladı" Microsoft Huawei BAT

Chengdu'nun kenarındaki bu güzel kasabada nihayet yüksek hızlı tren var! Daocheng'e karşı yarışın, Jiangnan'a kaybetmeyin

11 Ocak saat 01: 11'de ilk gönderi!

Almanyanın Fedin altınına ilişkin değerlendirmesi reddedildi, yabancı medya: Fedin ülkelerin geri gönderim yapmasını engelleme hakkı yok

New York seyahat rehberi! Bakmak için nereye gideceğimi bilmiyorum, böyle oynamanızı tavsiye ederim!