AI oyun teorisi: DeepMind, ajanların asimetrik oyunlarda Nash dengesini bulmasına izin verir

Kök Lin Lin Resmi DeepMind blogundan derlendi

Qubit Üretildi | Genel Hesap QbitAI

Yapay zeka sistemleri gerçek dünyada giderek daha önemli bir rol oynadığından, farklı sistemlerin nasıl etkileşimde bulunduğunu anlamak çok önemlidir.

DeepMind, Simetric Decomposition of Asymmetric Games adlı bir makale yayınladı. Bu makalede, DeepMind araştırmacıları bu soruyu denemek için oyun teorisinin bir dalını kullandılar.

Araştırmacılar, Texas Hold'em ve masa oyunu Scottish SWAT gibi asimetrik oyunlarda iki ajanın davranışını ve performansını gözlemlemeye odaklandı.

Bu yeni yöntemle akıllı vücut, karmaşık asimetrik oyunlarda Nash dengesini basit ve hızlı bir şekilde bulabilir.

Oyun ve Nash Dengesi

Oyun teorisi bir matematik dalına aittir ve rekabetçi bir ortamda karar vericilerin stratejilerini analiz etmek için kullanılır.

Bu teori, birden fazla AI olduğunda insanlar, hayvanlar ve birden fazla AI ortamına uygulanabilir. Örneğin, birden fazla robot odayı aynı anda temizler.

Asimetrik bilgi oyunu, alıcıların ve satıcıların müzayedede farklı zihniyetlere ve motivasyonlara sahip olması gibi, gerçek dünya senaryolarını simüle eder. Elde ettiğimiz sonuçlar bize benzersiz bilgiler verdi ve bunları son derece kısa bir şekilde analiz etti.

Asimetrik oyunların özelliği, her oyuncunun farklı stratejileri, hedefleri ve ödülleri olmasıdır. Örneğin, oyun teorisi araştırmalarında en yaygın koordinasyon oyunu cinsiyetler savaşıdır.

Genel olarak konuşursak, çoklu AI sistemlerinin evrimsel dinamikleri, her iki oyuncunun da aynı işlemi yapabileceği klasik mahkum ikilemi gibi basit simetrik oyunlarla analiz edilir. Bu oyunlar birden fazla AI sistemi için etkili içgörüler sağlayıp en iyi sonuçları elde etmek için tüm oyuncuları nasıl çalıştıracağımızı söyleseler bile (bu Nash dengesidir), tüm durumları simüle edemezler.

DeepMind'in yeni yöntemi, karmaşık asimetrik oyunlarda Nash dengesini kolayca ve hızlı bir şekilde bulabilir.

Bu teori dizisinin şu andaki odak noktası hala çoklu AI sistemlerinin etkileşimine nasıl uygulanacağı olsa da, araştırmacılar bu sonucun ekonomi, evrimsel biyoloji ve ampirik oyun teorisinde de kullanılabileceğine inanıyor.

Opera mı film mi?

Örnek vermek.

İki oyuncunun gece opera mı yoksa film mi izleyeceğine karar vermesi gerekiyor, maalesef biri operayı, diğeri filmi tercih ediyor. Bu asimetrik bir oyundur.İki oyuncu keyfi olarak seçebilse de, her oyuncu kendi tercihine göre farklı ödüller alır.

Bununla birlikte, arkadaşlıklarını veya bir tür denge dediğimiz şeyi sürdürmek için her iki tarafın da aynı etkinlikleri seçmesi gerekir, bu nedenle tek başına hareket etmenin getirisi sıfırdır.

Bu oyunda üç denge vardır: (i) her iki taraf da operaya gider, (ii) her iki taraf da filme gider, (iii) karma bir seçenek vardır, her oyuncu zamanın beşte üçünde sevdiği seçeneği seçer.

Bu "kararsız" için son seçenek, asimetrik oyunu basitleştirme veya simetrik benzerlerine ayırma yöntemini kullanmaktır.

Bu oyunun özünü, her oyuncu için ödül puan tablosunun bağımsız, simetrik iki oyunculu bir oyun olması ve denge noktasının orijinal asimetrik oyunla tutarlı olması olarak hayal edebiliriz.

Aşağıdaki resimde Nash dengesi, asimetrik oyunda en uygun stratejiyi (a) hızlı bir şekilde belirlememize yardımcı olan iki eş aracılığıyla elde edilir. Tersine, asimetrik oyun, simetrik eşlerin dengesini belirlemek için kullanılır.

Kırmızı nokta Nash dengesini temsil eder. Asimetrik oyun (a) için, Nash dengesi iki simetrik diyagramdan (b) ve (c) kolayca elde edilebilir.

İyi haber şu ki, bu yöntem Leduc Poker gibi diğer oyunlar için de geçerli. Bu yöntemler, asimetrik oyunları hızlı ve doğrudan analiz etmek için basit bir matematiksel prensip uygular. Çok aracılı ortamlar da dahil olmak üzere çeşitli dinamik sistemleri anlamamıza yardımcı olabileceğini umuyoruz.

Son olarak, kağıt adresini ekleyin:

https://www.nature.com/articles/s41598-018-19194-4

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzünde "işe alım" kelimesini yanıtlayın.

Qubit QbitAI · Toutiao İmzalama Yazarı

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Eski sürücünün "kör buluşma stratejisi", yeni Arrizo 5'i süren kişi bir ömür boyu emanet olmaya değer
önceki
Çevrimiçi olduktan sadece 3 gün sonra 3,3 milyon kopya satan Örümcek Adam, yine çamur kayması oyuncuları tarafından kırıldı!
Sonraki
Mutlu yıllar Hao Junmin! AFC + Shandong Luneng Kulübü, milli futbol takımını kutsadı
Kulüpler Dünya Kupası'nda Real Madrid gollerini kıran adam ikinci takıma katıldı ancak maça çıkmadı.
Coshanın listelemesi 101 şehri birbirine bağlıyor, ancak 96.800den başlayan fiyat neden önemli?
20 kişi hızlı bir şekilde tavuk yiyor! Maç başına 10 dakika! Bu MOBA tavuk yeme oyunu 26 Eylül'de Steam'e gelecek
Hamsik bir tur daha oynadı ve şeytanın coşkusunu evinde hissetti! Carrasco Kıbrıs'a geldi
70'lerden 90'lara! Ramos, ilk beş ligde en çok gol atan beş savunma oyuncusuna liderlik ediyor
400 işten çıkarmadan 25 kişiye kadar birçok oyun şaheseri geliştirdi! Şimdi iflasla karşı karşıya!
Wang Baoshan "dikkat etmiyor"! Jianye Tianhai kalesine 6 derece girdi, Thunderbird Yang Xu, Shen Xiangfu'yu gizledi.
Yeni bir enerji arabası satın alın, şarj yığını kurun, bu üç noktayı anlamazsanız çok şey kaybedersiniz
Haftalık Glory: Sonbahar Ortası Festivali için ücretsiz kalıcı kahramanlar, Zhao Yunun yeni görünümü alay etme işleviyle mi geliyor?
Vieira, Villa ve Pirlo'yu Beyzbol Şehri'nde bir futbol fırtınası yaratmaya yönlendiriyor
Bir U20'li genç golü kırdı! Forvetler + kalecilerin oynayabileceği ek olarak, Lao Cui bir sonraki Sun Jihai'yi inşa edebilir mi?
To Top