Xin Zhiyuan Rehberi BYU bilgisayar bilimi profesörleri Jacob Crandall ve Michael Goodrich ile MIT ve diğer üniversitelerdeki meslektaşları, çeşitli çift tekrarlı rastgele oyunlarda insan işbirliğini sağlamak için insanlarla ve diğer algoritmalarla birleştirilebilen yeni bir algoritma yarattı. Seviye.
Bilgisayarlar satrançta kolayca kazanabilir ve diğer sıfır toplamlı oyunlarda hızla insanların rakibi haline gelebilir. Çünkü onlara rekabet etmeyi öğretmek kolaydır, ancak onlara işbirliği yapmayı ve uzlaşmayı öğretmek zorunlu değildir.
BYU bilgisayar bilimi profesörleri Jacob Crandall ve Michael Goodrich ve MIT'deki ve diğer üniversitelerdeki meslektaşları, makinelerin uzlaşmasını ve işbirliğini yalnızca mümkün değil, bazen insanlardan bile daha etkili kılan yeni bir algoritma yarattı.
Araştırmacılar, makineleri programlamak için S # algoritmasını kullanıyor ve belirli ilişkilerdeki işbirliği derecelerini anlamak için çeşitli iki oyunculu oyunlarda çalıştırıyorlar. Ekip, makineler arasındaki, insanlar ve makineler arasındaki ve insanlar arasındaki etkileşimleri test etti. Çoğu durumda, S # ile programlanan makineler, her iki tarafın da yararına olacak bir uzlaşma bulma konusunda insanlardan daha iyi performans gösterir.
Crandall, "Nihai amaç, insanlarla çalışmanın ardındaki matematiği ve sosyal beceriler geliştirmek için yapay zekanın neye ihtiyacı olduğunu anlamaktır." Araştırması, bize yanıt vermesi ve ne yaptığını netleştirmesi gereken yapay zekaya odaklanıyor. Diğer insanlarla etkileşime girebilmeli.
Bu araştırma yakın zamanda Nature Communications'da yayınlandı.Aşağıda, araştırmanın ana noktalarına bir giriş yer alıyor.
Araştırmaya genel bakış: İnsanlarla işbirliği yapabilen makine öğrenimi algoritmalarının geliştirilmesi
Turing yapay zeka önerdiğinden beri, teknolojik ilerleme genellikle makinelerin insanları sıfır toplamlı oyunlarda (örneğin, satranç, poker veya Go) yenme yeteneği ile ölçülmüştür. İnsanların ve makinelerin çıkarlarının ve tercihlerinin ne tamamen tutarlı ne de tamamen çelişkili olmadığı senaryolar gibi insan-makine işbirliğinin olumlu ve önemli senaryosuna çok az insan dikkat eder. İşbirliği yapmak için ihtiyaç duyulan şey saf bilgi işlem gücü değil, sezgi, kültürel gelenekler, duygular, sinyaller vb.
Burada, en gelişmiş takviye öğrenme algoritmasını bir sinyal aktarım mekanizmasıyla birleştiren bir algoritma geliştirdik. Bu algoritmanın insanlarla ve diğer algoritmalarla çeşitli tekrarlanan rastgele oyunlarda insan işbirliği seviyesine ulaşabileceğini kanıtlıyoruz. Bu sonuçlar, önemli ancak çok basit bir algoritma mekanizmasının kullanılmasıyla genel insan-makine işbirliğinin sağlanabileceğini göstermektedir.
Algoritmalar ve insanlar arasındaki işbirliğinde üç zorluk: çok yönlülük, esneklik ve kısa vadeli öğrenme
İnsanlarla ve diğer makinelerle uzun süre işbirliği yapabilen algoritmalar geliştirmek çok önemli ama aynı zamanda çok da zor. Başarılı bir algoritma aşağıdaki özniteliklere ihtiyaç duyar.
Her şeyden önce, yalnızca belirli bir alana odaklanamaz, bu algoritma Çeşitli durumlarda üstün performansa (çok yönlülüğe) sahiptir.
İkinci olarak, bu algoritma insan davranışını önceden bilgi sahibi olmadan anlamayı öğrenmelidir. İnsanlar ve makinelerle etkili ilişkiler (esneklik) kurmayı öğrenin. Bunu yapmak için, ortakları tarafından olası istismarı önleyebilmeli ve avantajlı olduğunda işbirliği yapmaya isteksiz olabilecek (ve güvenmeyebilecek) ortaklardan nasıl işbirliği arayacağına karar verebilmelidir.
Üçüncüsü, insanlarla etkileşim halindeyken algoritma Etkili davranışı çok kısa sürede öğrenmeli, Otonom sürüş senaryosunu düşünebilirsiniz. Bu aynı zamanda, ortakların da öğrendiği durumlarla başa çıkma ihtiyacı ve tekrarlanan oyunların doğasında bulunan geniş stratejik alanda sonsuz sayıda olası denge çözümü hakkında hızlı bir şekilde akıl yürütme gibi birçok teknik zorluğu beraberinde getiriyor.
Bu zorlukların birleşimi, yapay zeka algoritmalarının insanlarla veya diğer makinelerle işbirliği yapamamasına neden olur, ancak hepimiz işbirliğinin algoritmanın uzun vadeli faydalarına fayda sağlayacağını biliyoruz.
İnsanlar birlikte çalışırken genellikle "konuşmaya" güvendikleri için, araştırmacılar bu perspektiften başlamayı düşünmüşlerdir, böylece makineler oyun oynarken insanlarla iletişim kurabilir.
Önceden bir dizi cümle (konuşma eylemi) belirleyerek, makinenin bu veritabanından uygun cümleleri seçmesine ve bunları oyunun farklı aşamalarında insan rakiplere göndermesine ve rakiplerle ilişkiler kurarak rakibin davranışını etkilemesine izin verdiler.
Makine öğrenimi algoritmaları S ++, algoritmanın dinamik stratejisinin içinde üst düzey bir temsiline sahiptir ve dinamik stratejisi, temeldeki uzmanların dinamikleri tarafından tanımlanabilir. Her uzman yüksek seviyeli bir kavramı kodlayabildiğinden, S ++ amacını açıklayan bir sinyal üretebilir (yani, oyunda küçük sohbet). S ++ ayrıca ortakların konuşma davranışlarını içindeki uzmanların kavramlarıyla karşılaştıracak ve böylece uzmanlar için seçim mekanizmasını geliştirecektir. Bu şekilde, araştırmacılar S ++ iletişim çerçevesini geliştirerek sistemin oyun sırasında küçük sohbetler oluşturmasına ve rakiplerin küçük sohbetlerine yanıt vermesine izin verdi.
Yeni oluşturulan algoritma S # mimari diyagramı aşağıda gösterilmiştir:
S # 'nin insanlarla ortaklık kurma yeteneğini belirlemek için, araştırmacılar bir dizi kullanıcı araştırması yaptı, 220 katılımcıya anket yaptı ve toplam 472 tekrarlanan oyun oynadı.
Görünüşe göre S # gerçekten insanlarla işbirliği yapabilir.
Bu özet, değerlendirdiğimiz her oyun uzunluğu için altı performans ölçütünün her birine her algoritmanın göreceli seviyesini verir. Daha düşük bir not, daha yüksek performansı gösterir. Her bir ölçüm için algoritma 100 tur, 1.000 tur ve 50.000 tur olarak sıralanır. Örneğin, üçlü 3, 2, 1, algoritmanın sırasıyla 100, 1000 ve 50.000 oyun turunda üçüncü, ikinci ve birinci sırada olduğunu gösterir.
Önem
Bu çalışmaya üç ana katkı var. İlk olarak, mevcut tekrarlanan oyun algoritmalarının derinlemesine bir karşılaştırması yapılır. İkinci olarak, en gelişmiş makine öğrenimi algoritmalarını belirli mekanizmalarla birleştiren bir öğrenme algoritması geliştirdi ve analiz etti. Bu mekanizmalar, algoritmanın belirli aşamalarda yanıtlar üretmesini sağlar ve bu yanıtlar, geliştirmeye yardımcı olmak için insanlar tarafından yorumlanabilir. İnsanların işbirliği yapma istekleri vardır.
Son olarak, çok sayıda simülasyon ve kullanıcı anketi aracılığıyla araştırmacılar, bu öğrenme algoritmasının çeşitli RSG'lerde insanlar ve diğer makinelerle etkili ilişkiler kurup sürdürebileceğini buldular. Bu ilişkiler, insan işbirliği düzeyine eşdeğerdir. Algoritmanın başaramayacağı şey.
Kağıt adresi:
https://www.nature.com/articles/s41467-017-02597-8
Xinzhiyuan AI teknolojisi + endüstri topluluğunun işe alımında, AI teknolojisi + endüstri inişiyle ilgilenen öğrenciler, küçük bir yardımcı WeChat hesabı ekleyebilirler: aiera2015_1 Gruba katılın; incelemeyi geçtikten sonra sizi gruba katılmaya davet edeceğiz. Topluluğa katıldıktan sonra, grup açıklamalarını değiştirmeniz gerekir (isim-şirket-pozisyon; profesyonel grup incelemesi katıdır, lütfen anlayın).