g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

DeepMind hile mi yapıyor? StarCraft 2'deki en iyi oyuncuların el hızına güvendiğinden şüpheleniliyor

Qian Ming Tong Ling Derleyin ve organize edin

Qubit Üretildi | Genel Hesap QbitAI

Birkaç gün önce DeepMind tarafından geliştirilen AlphaStar, StarCraft 2 profesyonel ustalarını 10-1 rekorla mağlup ederek büyük ilgi gördü.

DeepMind, kazanma yeteneğinin tamamen stratejiye bağlı olduğunu söyledi.

Ancak bu ifade çok sorgulandı.Reddit ve Twitter'da veya Zhihu ve Weibo'da olsun, çoğu insan şu görüşlere sahip:

AlphaStar kazanabilir, hepsi el hızına bağlıdır.

Oyunun bazı dönemlerinde, AlphaStar'ın APM'si 1000'den fazla kişiye ulaşabilirken, en iyi insan oyuncular sadece 500'den fazla. Dahası, AlphaStar'ın etkili çalışması neredeyse patlıyor.

Bu durum uzun sürmese de, el hızı ve doğruluğu StarCraft 2 için çok önemli.

Bu şüpheler arasında bir makale birçok kişinin dikkatini çekti, Medium'daki alkış 1.3K'yı aştı ve Reddit'teki Oy sayısı 700'e yaklaştı.

Bu makalenin yazarı, Finlandiya'dan Aleksi Pietikäinen adında küçük bir erkek kardeş, şu anda Finlandiya'nın en büyük finans şirketi olan OP Financial Group'ta çalışıyor, StarCraft 2 hayranı olduğunu iddia ediyor ve yapay zekanın geliştirilmesi üzerine araştırmalar yaptı.

Makalede yeterli argümanla, AlphaStar'ın oyunda, oyunu büyük ölçüde etkileyen işletim hızı ve doğruluğu açısından insanları geride bıraktığına dikkat çekti. DeepMind, yapay zekanın insan yeteneklerinin ötesinde eylemler gerçekleştirmesini kısıtladığını iddia ediyor, ancak bunu başaramadı.

AlphaStar'ın insanüstü el hızı

Normal koşullar altında, APM, oyuncuların seviyesini yansıtan önemli bir standarttır.

Şu anda, StarCraft 2'de tanınan en iyi insan ustası Finlandiya'nın profesyonel oyuncusu Serral. 2018 WCS'de 9 önemli maçın 7'sini kazandı ve bir çırpıda şampiyonluğu kazanarak tarihi bir rekor kırdı.

Elleri hızlı. Pek çok insan onun dünyanın en hızlısı olması gerektiğini düşünüyor. Ne kadar hızlı Aşağıdaki animasyona bakın:

Ancak öyle olsa bile, Serral APM'yi uzun süre 500'ün üzerinde tutamaz. 800'den fazla salgın olmasına rağmen, yalnızca bir saniyenin kısa bir bölümünde sürdü ve muhtemelen bir çöp operasyonuydu.

Ya AlphaStar? Salgından sonra APM 1500+ değerine ulaşabilir ve bazen APM 1000+ ulaştığında 5 saniye korunabilir ve bunların çoğu etkili operasyonlardır.

Dakikada 1500 işlem, saniyede 25 işleme eşdeğerdir. Bu insanlar için imkansızdır.

Üstelik StarCraft 2'de 5 saniye çok uzun bir süredir. Özellikle önemli sahnelerde, 5 saniyelik verimli ve hızlı çalışma, daha sonra kazanmak için temel bir temel oluşturacaktır.

Aşağıdaki animasyonlu resim, üçüncü oyunda AlphaStar ve Mana arasındaki bir savaş sahnesini göstermektedir: AlphaStar'ın APM'si 1000+ ulaştı ve 5 saniye sürdü.

Dördüncü oyunda, APM 1500+ ulaştı:

Bazı insanlar AlphaStar'ın ortalama APM'sinin sadece 277 olduğunu söylese de, yine de kabul edilebilir. Ancak her durumda, sürekli salgına insanlar tarafından ulaşılamayacak kadar uzaktır.

AlphaStar'ın süpermen doğruluğu

Etkili operasyonlar ve çöp operasyonları hesaba katılırsa, AlphaStar daha da kötüdür.

İnsan oyuncuların APM'lerinin çoğu geçersiz işlemlerdir ve bu işlemlerin oyun üzerinde etkili bir etkisi olmayacaktır.

Bu faktörleri göz önünde bulundurduktan sonra, oyuncunun el hızını ve doğruluğunu ölçerken yeni bir gösterge var: EPM.

Geçersiz işlemleri ortadan kaldırdıktan sonra Serral'in EPM'si saniyede 5-6 geçerli işlemle 344'e ulaşabilir. Bu neredeyse hiç duyulmamış bir şey, o kadar ki birçok insan bunun doğru olduğuna inanamıyor.

AlphaStar gereksiz işlemler olmadan oyun oynayabilirse, bu, en yüksek APM'sinin EPM'sine eşit olduğu anlamına gelir. Hız, en iyi insan oyuncuların 4 katına ulaşabilir!

AlphaStar ekibi, bu APM'lerin hepsinin etkili operasyonlar olmadığını söylemesine rağmen. Ancak her durumda, insanlar AlphaStar'ın bu işlemlerini kopyalayamaz.

AlphaStar'a kaybettikten sonra MaNa, oyunun hissiyatından bahsetti. Yapay zekanın en iyi yönünün birim kontrolü olduğunu söyledi, durumumuz benzer olduğunda AlphaStar kolayca kazanabilir.

Ama en kötüsü aynıdır.YZ, birim kontrolü yoluyla kazanabileceğine o kadar inanmıştır ki, başka bir şey yapmaz ve son yenilgiye götürür.Oyunda çok fazla kritik an yoktur, mekanizma ile kazanabilir.

DeepMind'ın görmek istediği bu değil.

AlphaStar ekibi ayrıca, insan operasyonlarının yeteneklerini aşmayan akıllı aracıların geliştirilmesine kendini adamıştır. Eş lider David Silver, AlphaStar'ın insan oyuncuların performansını aşmayacağını defalarca belirtti.

Baş tasarımcı ayrıca, sistemin "insan gibi" eğitilmesinin arzu edildiğini söyledi.Eğer oyun yüksek bir APM ile sınıra itilirse, kulağa havalı gelebilir, ancak ajanın gerçekliğini değerlendirmek için kullanılamaz. kabiliyet.

"İnsanlara haksızlık"

Yukarıda bahsedildiği gibi AlphaStar Ar-Ge ekibi, AI sisteminin APM'sini kısıtladı. Aleksi Pietikäinen,

Aşağıdakiler kısıtlanabilir:

1. Oyunun tamamındaki ortalama APM .

2. Kısa sürede APM salgını . APM'yi saniyede 4-6 kez sınırlamak makul bir değerdir. Serral, saniyede 6 kereden daha az etkili bir şekilde çalışır.

Ancak Mana'ya karşı oynayan AlphaStar, insan oyuncular için en hızlı durumdan daha yüksek olan saniyede 25 defaya kadar işlem yapıyor, bu nedenle Aleksi Pietikäinen bu durumun mantıksız olduğuna inanıyor.

3. Tıklama aralığı . Yapay zekanın tıklama hızı sınırlı olsa bile, insanların karşılaştığı fare tıklama aralığını göz önünde bulundurmak zorunda kalmadan eylemi anında tamamlayabilir.

Üç ilke belirlendikten sonra, sonraki adım modeli eğitmektir. DeepMind'ın yöntemi, oyun oynayan ileri düzey insan oyuncuların on binlerce videosunu indirmek ve taklit öğrenmeye başlamaktır.

Bu aşamada AI, geçersiz işlemler dahil olmak üzere insanların oyunda yaptığı her şeyi taklit etmeye çalışacaktır. Çünkü modele video girişinde, insanlar gerçekten de birçok geçersiz işlem gerçekleştirdi ve AI da öğrenecek.

AlphaStar'ın en büyük salgını olan APM, başlangıçta insanlarla aynı başlangıç çizgisindeydi. Yukarıda bahsedildiği gibi AlphaStar tarafından şu anda gerçekleştirilen işlemlerin çoğu geçersiz olduğu için oyunda etkili bir APM desteği bulunmuyor ve dominant değil.

Ancak, çok fazla geçersiz işlem her zaman eğitim ilerlemesini yavaşlatacaktır.Geliştirmeyi hızlandırmak için, DeepMind ekibi APM üzerindeki kısıtlamaları değiştirdi ve bunların görünmesine izin verdi. Yüksek patlama Oriol Vinyals, Reddit'in AMA'sında da bundan bahsetti:

Maksimum APM, 5 saniyelik sürede 600, 15 saniyede 400, 30 saniyede 320 ve 60 saniyede 300'dür. AI bu süre içinde daha fazla işlem gerçekleştirirse, sistem işlemi silmeyi / yok saymayı seçecektir.

İlk bakışta, DeepMindın StarCraft 2nin yapay zekası için ayarları makul, ancak daha önce tartışılan insan patlama hızı, işlem doğruluğu ve tıklama aralığı hakkında düşünürseniz, durum böyle değil.

İnsan geçersiz işlemlerinin en tipik örneğini ele alalım: Bir birime hareket etmesini veya saldırmasını emretmek istiyorsanız, farenizle haritadaki belirli bir yere tıklamanız gerekir. Şu anda, insanlar olabildiğince hızlı tıklayacaktır ve bu tıklamaların çoğu geçersizdir. nın-nin.

AI ayrıca bu geçersiz işlemleri öğrenecektir.

İnsanların tıklama hızı sınırlıdır, bu nedenle AI'nın başlangıçta öğrendiği işletim hızı da benzer şekilde sınırlı olacaktır. İnsan hızıyla karşılaştırıldığında, daha sonra gösterdiği insanüstü el hızı çok fazla "bedava" APM idi. Yapay zeka, bu ücretsiz APM'leri dilediğiniz gibi deneyebilir.

AI, dövüşürken bu ücretsiz APM'leri denemek, daha iyi sonuçlar alabilecek yeni davranış kalıplarını öğrenmek ve orijinal geçersiz işlemleri atmak için kullanacaktır.

Bu insanlara çok haksızlık gibi görünüyor.

Yapay zeka daha etkili çalışmayı öğrendiğine göre, DeepMind SC2LE ortamını başlattığında neden katı 180 APM sınırını yeniden etkinleştirmedi?

Bunun nedeni, yapay zekanın zaman zaman geçersiz operasyonlara sahip olması ve bu da açıkça APM kaynaklarını tüketmesi ve savaş sırasında performansına zarar vermesi olabilir.

DeepMind tarafından verilen resmi bilgilerde hala bazı şüpheler var.

Mananın APM ortalamasının daha yüksek olmasına rağmen, AlphaStarın "uzun kuyruğu" nun insanlardan çok daha yüksek olduğu APM istatistiklerinden görülebilir. Bu durumlarda, AI herhangi bir operasyonu insanların karşılayamayacağı bir hassasiyetle tamamlayabilir.

TLO'nun APM'sinin 2000'e bile ulaştığı görülebiliyor. Bu değer biraz gülünç derecede yüksek görünüyor.Bu durum klavyenin hızlandırılmasıyla sağlanabilir ki bu da geçersiz işlemleri beraberinde getirecektir.

Ancak DeepMind, TLO'nun APM'sinin nasıl geldiğini açıklamadı, ancak bu, insanları yanlışlıkla AlphaStar'ın operasyonunun makul olduğuna inandıracak.

Unutulmaması gereken son nokta, bu makalenin sadece Aleksi Pietikäinen'in görüşü olmasıdır.

AlphaStar'ın APM salgını insan kategorisine girse bile, getirdiği çığır açan ilerlemenin ve arkasındaki önemin şüphesiz olduğuna inanan bazı insanlar da var.

Ne düşünüyorsun? Mesaj alanında bizimle iletişime geçmeye hoş geldiniz.

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzünde "işe alım" kelimesini yanıtlayın.

Qubit QbitAI · Toutiao İmzalayan Yazar

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Annem oyuncu grubunda gözyaşlarına boğuldu! Arkadaş grubunu kınadı: Gün boyu internet oğlumu öldürüyor!

Dünya Kupası'nın en mutlu güzellik hayranları, finale yükselmek için kırmızı beyaz ekose giydiler