Kök Lin Lin Resmi DeepMind blogundan derlendi
Qubit Üretildi | Genel Hesap QbitAI
Yapay zeka sistemleri gerçek dünyada giderek daha önemli bir rol oynadığından, farklı sistemlerin nasıl etkileşimde bulunduğunu anlamak çok önemlidir.
DeepMind, Simetric Decomposition of Asymmetric Games adlı bir makale yayınladı. Bu makalede, DeepMind araştırmacıları bu soruyu denemek için oyun teorisinin bir dalını kullandılar.
Araştırmacılar, Texas Hold'em ve masa oyunu Scottish SWAT gibi asimetrik oyunlarda iki ajanın davranışını ve performansını gözlemlemeye odaklandı.
Bu yeni yöntemle akıllı vücut, karmaşık asimetrik oyunlarda Nash dengesini basit ve hızlı bir şekilde bulabilir.
Oyun teorisi bir matematik dalına aittir ve rekabetçi bir ortamda karar vericilerin stratejilerini analiz etmek için kullanılır.
Bu teori, birden fazla AI olduğunda insanlar, hayvanlar ve birden fazla AI ortamına uygulanabilir. Örneğin, birden fazla robot odayı aynı anda temizler.
Asimetrik bilgi oyunu, alıcıların ve satıcıların müzayedede farklı zihniyetlere ve motivasyonlara sahip olması gibi, gerçek dünya senaryolarını simüle eder. Elde ettiğimiz sonuçlar bize benzersiz bilgiler verdi ve bunları son derece kısa bir şekilde analiz etti.
Asimetrik oyunların özelliği, her oyuncunun farklı stratejileri, hedefleri ve ödülleri olmasıdır. Örneğin, oyun teorisi araştırmalarında en yaygın koordinasyon oyunu cinsiyetler savaşıdır.
Genel olarak konuşursak, çoklu AI sistemlerinin evrimsel dinamikleri, her iki oyuncunun da aynı işlemi yapabileceği klasik mahkum ikilemi gibi basit simetrik oyunlarla analiz edilir. Bu oyunlar birden fazla AI sistemi için etkili içgörüler sağlayıp en iyi sonuçları elde etmek için tüm oyuncuları nasıl çalıştıracağımızı söyleseler bile (bu Nash dengesidir), tüm durumları simüle edemezler.
DeepMind'in yeni yöntemi, karmaşık asimetrik oyunlarda Nash dengesini kolayca ve hızlı bir şekilde bulabilir.
Bu teori dizisinin şu andaki odak noktası hala çoklu AI sistemlerinin etkileşimine nasıl uygulanacağı olsa da, araştırmacılar bu sonucun ekonomi, evrimsel biyoloji ve ampirik oyun teorisinde de kullanılabileceğine inanıyor.
Örnek vermek.
İki oyuncunun gece opera mı yoksa film mi izleyeceğine karar vermesi gerekiyor, maalesef biri operayı, diğeri filmi tercih ediyor. Bu asimetrik bir oyundur.İki oyuncu keyfi olarak seçebilse de, her oyuncu kendi tercihine göre farklı ödüller alır.
Bununla birlikte, arkadaşlıklarını veya bir tür denge dediğimiz şeyi sürdürmek için her iki tarafın da aynı etkinlikleri seçmesi gerekir, bu nedenle tek başına hareket etmenin getirisi sıfırdır.
Bu oyunda üç denge vardır: (i) her iki taraf da operaya gider, (ii) her iki taraf da filme gider, (iii) karma bir seçenek vardır, her oyuncu zamanın beşte üçünde sevdiği seçeneği seçer.
Bu "kararsız" için son seçenek, asimetrik oyunu basitleştirme veya simetrik benzerlerine ayırma yöntemini kullanmaktır.
Bu oyunun özünü, her oyuncu için ödül puan tablosunun bağımsız, simetrik iki oyunculu bir oyun olması ve denge noktasının orijinal asimetrik oyunla tutarlı olması olarak hayal edebiliriz.
Aşağıdaki resimde Nash dengesi, asimetrik oyunda en uygun stratejiyi (a) hızlı bir şekilde belirlememize yardımcı olan iki eş aracılığıyla elde edilir. Tersine, asimetrik oyun, simetrik eşlerin dengesini belirlemek için kullanılır.
Kırmızı nokta Nash dengesini temsil eder. Asimetrik oyun (a) için, Nash dengesi iki simetrik diyagramdan (b) ve (c) kolayca elde edilebilir.
İyi haber şu ki, bu yöntem Leduc Poker gibi diğer oyunlar için de geçerli. Bu yöntemler, asimetrik oyunları hızlı ve doğrudan analiz etmek için basit bir matematiksel prensip uygular. Çok aracılı ortamlar da dahil olmak üzere çeşitli dinamik sistemleri anlamamıza yardımcı olabileceğini umuyoruz.
Son olarak, kağıt adresini ekleyin:
https://www.nature.com/articles/s41598-018-19194-4
- Bitiş -
Samimi işe alım
Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! İlgili ayrıntılar için lütfen QbitAI diyalog arayüzünde "işe alım" kelimesini yanıtlayın.
Qubit QbitAI · Toutiao İmzalama Yazarı
' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin