g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

AI oyun teorisi: DeepMind, ajanların asimetrik oyunlarda Nash dengesini bulmasına izin verir

Kök Lin Lin Resmi DeepMind blogundan derlendi

Qubit Üretildi | Genel Hesap QbitAI

Yapay zeka sistemleri gerçek dünyada giderek daha önemli bir rol oynadığından, farklı sistemlerin nasıl etkileşimde bulunduğunu anlamak çok önemlidir.

DeepMind, Simetric Decomposition of Asymmetric Games adlı bir makale yayınladı. Bu makalede, DeepMind araştırmacıları bu soruyu denemek için oyun teorisinin bir dalını kullandılar.

Araştırmacılar, Texas Hold'em ve masa oyunu Scottish SWAT gibi asimetrik oyunlarda iki ajanın davranışını ve performansını gözlemlemeye odaklandı.

Bu yeni yöntemle akıllı vücut, karmaşık asimetrik oyunlarda Nash dengesini basit ve hızlı bir şekilde bulabilir.

Oyun ve Nash Dengesi

Oyun teorisi bir matematik dalına aittir ve rekabetçi bir ortamda karar vericilerin stratejilerini analiz etmek için kullanılır.

Bu teori, birden fazla AI olduğunda insanlar, hayvanlar ve birden fazla AI ortamına uygulanabilir. Örneğin, birden fazla robot odayı aynı anda temizler.

Asimetrik bilgi oyunu, alıcıların ve satıcıların müzayedede farklı zihniyetlere ve motivasyonlara sahip olması gibi, gerçek dünya senaryolarını simüle eder. Elde ettiğimiz sonuçlar bize benzersiz bilgiler verdi ve bunları son derece kısa bir şekilde analiz etti.

Asimetrik oyunların özelliği, her oyuncunun farklı stratejileri, hedefleri ve ödülleri olmasıdır. Örneğin, oyun teorisi araştırmalarında en yaygın koordinasyon oyunu cinsiyetler savaşıdır.

Genel olarak konuşursak, çoklu AI sistemlerinin evrimsel dinamikleri, her iki oyuncunun da aynı işlemi yapabileceği klasik mahkum ikilemi gibi basit simetrik oyunlarla analiz edilir. Bu oyunlar birden fazla AI sistemi için etkili içgörüler sağlayıp en iyi sonuçları elde etmek için tüm oyuncuları nasıl çalıştıracağımızı söyleseler bile (bu Nash dengesidir), tüm durumları simüle edemezler.

DeepMind'in yeni yöntemi, karmaşık asimetrik oyunlarda Nash dengesini kolayca ve hızlı bir şekilde bulabilir.

Bu teori dizisinin şu andaki odak noktası hala çoklu AI sistemlerinin etkileşimine nasıl uygulanacağı olsa da, araştırmacılar bu sonucun ekonomi, evrimsel biyoloji ve ampirik oyun teorisinde de kullanılabileceğine inanıyor.

Opera mı film mi?

Örnek vermek.

İki oyuncunun gece opera mı yoksa film mi izleyeceğine karar vermesi gerekiyor, maalesef biri operayı, diğeri filmi tercih ediyor. Bu asimetrik bir oyundur.İki oyuncu keyfi olarak seçebilse de, her oyuncu kendi tercihine göre farklı ödüller alır.

Bununla birlikte, arkadaşlıklarını veya bir tür denge dediğimiz şeyi sürdürmek için her iki tarafın da aynı etkinlikleri seçmesi gerekir, bu nedenle tek başına hareket etmenin getirisi sıfırdır.

Bu oyunda üç denge vardır: (i) her iki taraf da operaya gider, (ii) her iki taraf da filme gider, (iii) karma bir seçenek vardır, her oyuncu zamanın beşte üçünde sevdiği seçeneği seçer.

Bu "kararsız" için son seçenek, asimetrik oyunu basitleştirme veya simetrik benzerlerine ayırma yöntemini kullanmaktır.

Bu oyunun özünü, her oyuncu için ödül puan tablosunun bağımsız, simetrik iki oyunculu bir oyun olması ve denge noktasının orijinal asimetrik oyunla tutarlı olması olarak hayal edebiliriz.

Aşağıdaki resimde Nash dengesi, asimetrik oyunda en uygun stratejiyi (a) hızlı bir şekilde belirlememize yardımcı olan iki eş aracılığıyla elde edilir. Tersine, asimetrik oyun, simetrik eşlerin dengesini belirlemek için kullanılır.

Kırmızı nokta Nash dengesini temsil eder. Asimetrik oyun (a) için, Nash dengesi iki simetrik diyagramdan (b) ve (c) kolayca elde edilebilir.

İyi haber şu ki, bu yöntem Leduc Poker gibi diğer oyunlar için de geçerli. Bu yöntemler, asimetrik oyunları hızlı ve doğrudan analiz etmek için basit bir matematiksel prensip uygular. Çok aracılı ortamlar da dahil olmak üzere çeşitli dinamik sistemleri anlamamıza yardımcı olabileceğini umuyoruz.

Son olarak, kağıt adresini ekleyin:

https://www.nature.com/articles/s41598-018-19194-4

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzünde "işe alım" kelimesini yanıtlayın.

Qubit QbitAI · Toutiao İmzalama Yazarı

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Eski sürücünün "kör buluşma stratejisi", yeni Arrizo 5'i süren kişi bir ömür boyu emanet olmaya değer

Çevrimiçi olduktan sadece 3 gün sonra 3,3 milyon kopya satan Örümcek Adam, yine çamur kayması oyuncuları tarafından kırıldı!

: Mutlu yıllar Hao Junmin! AFC + Shandong Luneng Kulübü, milli futbol takımını kutsadı

: Kulüpler Dünya Kupası'nda Real Madrid gollerini kıran adam ikinci takıma katıldı ancak maça çıkmadı.

: Coshanın listelemesi 101 şehri birbirine bağlıyor, ancak 96.800den başlayan fiyat neden önemli?

: 20 kişi hızlı bir şekilde tavuk yiyor! Maç başına 10 dakika! Bu MOBA tavuk yeme oyunu 26 Eylül'de Steam'e gelecek

: Hamsik bir tur daha oynadı ve şeytanın coşkusunu evinde hissetti! Carrasco Kıbrıs'a geldi

: 70'lerden 90'lara! Ramos, ilk beş ligde en çok gol atan beş savunma oyuncusuna liderlik ediyor

: 400 işten çıkarmadan 25 kişiye kadar birçok oyun şaheseri geliştirdi! Şimdi iflasla karşı karşıya!

: Wang Baoshan "dikkat etmiyor"! Jianye Tianhai kalesine 6 derece girdi, Thunderbird Yang Xu, Shen Xiangfu'yu gizledi.

: Yeni bir enerji arabası satın alın, şarj yığını kurun, bu üç noktayı anlamazsanız çok şey kaybedersiniz

: Haftalık Glory: Sonbahar Ortası Festivali için ücretsiz kalıcı kahramanlar, Zhao Yunun yeni görünümü alay etme işleviyle mi geliyor?

: Vieira, Villa ve Pirlo'yu Beyzbol Şehri'nde bir futbol fırtınası yaratmaya yönlendiriyor

: Bir U20'li genç golü kırdı! Forvetler + kalecilerin oynayabileceği ek olarak, Lao Cui bir sonraki Sun Jihai'yi inşa edebilir mi?

g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

AI oyun teorisi: DeepMind, ajanların asimetrik oyunlarda Nash dengesini bulmasına izin verir

Oyun ve Nash Dengesi

Opera mı film mi?

İlgili bilgi

22 yıldır popüler olan bir klasik, IGN9.0 tarafından atılan 3A şaheseri, aslında bir fotoğraf oyununda oynandı mı?

Yeni yıl ve yeni hava, büyük kahve Liu Jihao, Bofan Shuoche yeni medya kümesine katıldı

Zhang Yuning'in zili kapıyı 8-0 kilitlemek için patlattı, saç stilini çözdü, iki oyunda 2 atış ve 3 geçiş sağlam bir şekilde geliştirildi!

NetEase CEO'su Ding Lei yine bir spor otomobili verdi! Hearthstone şampiyonu doğrudan lüks arabaları ödüllendiriyor ve oyuncular sakin değil!

Otomobil ticareti yolunda bir adım daha atan "Bofan Arabalar Hakkında Konuşuyor" harika bir iş çıkardı

Google yakınlaştır! Yeni yayınlanan Cloud AutoML'ye dayanarak kod yazmadan tam otomatik eğitim AI

Pinduoduo tekrar kötü niyetle iftira edildiğini iddia ediyor, e-ticaret "birini seçin" yükseltmeye devam ediyor

Ön satış fiyatı 160.000'den başlıyor ve akıllı siyah teknolojisine sahip yeni nesil 508L'nin maliyeti nedir?

Oyun dünyasının en güçlü 7 silahı olan Frostmourne of Warcraft, dördüncü sırada, herkesin bildiği ilk silah!

Milli futbol gol atabilir mi? Transfer uzmanı: Cannavaro'nun Çin Kupası'ndaki ilk maçı bir aptal gibi