g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

İçgörüler | Yapay zekaya kapılsa bile, insanların Texas Hold'em'deki konumlarını kaybettiği söylenemez.

Leifeng.com 6 Nisan'da, Asya'nın ilk Texas poker insan-makine savaşı - "Cold Fight Master VS Chinese Dragon Team" zirve karşılaşmasının Hainan Ekolojik Yazılım Parkı Efsanevi İstihbarat Spor Salonu'nda başladığını ve kazananın 2 milyon yuan ödül alacağını bildirdi. . İlk günün ilk yarısında, Çin Ejderha Takımı programına göre 3.600 eli başarıyla tamamladı.Lengpu Ustası, Çin Ejderha Takımı'na 14145 çip ile geçici olarak liderlik etti. Sıfırlamadan sonra her bir bireyin tek elinde 20.000 fiş olduğundan, boşluk çok küçüktür.

Soğuk bahis ustası ve Çin Ejderhası Takımının tanıtımı için lütfen Leifeng.com'un raporuna bakın: Asya'nın ilk Texas Hold'em insan-makine savaşı başlamak üzere! | Li Kaifu'nun konuşmasının ekli tam metni

Müsabaka zamanı: 6 Nisan - 10 Nisan, sabah 8:00 - 13:00; öğleden sonra 16:00 - 21:00. Sahne 2 saat gecikecek.

Canlı portal: Tencent PC canlı yayını

Tencent uygulaması canlı yayın

Yukarıdaki girişi okuduktan sonra, sözde "Soğuk Savaş Ustası" nın aslında, bu yıl 30 Ocak'ta Pittsburgh'da en iyi 4 insan oyuncuyu mağlup eden Libratus olduğunu biliyoruz. Peki aynı insan-makine savaşında bu sefer öne çıkan nokta nerede?

Görünüş

1. Oyuncu

Dünkü basın toplantısında, organizatörün Dragon Team'in yayınladığı bilgilerden, birçok oyuncunun derin bilgisayar profesyonelliği geçmişi var. Örneğin: Du Yue, Xu Chaojun ve Zhang Huai, Tsinghua Üniversitesi Bilgisayar Bilimleri Bölümü'nde okudu. Li Kaifu'nun sözleriyle:

Pittsburgh Savaşı'nda mağlup olan profesyonel satranç oyuncuları gerçekten de en iyi profesyonel poker oyuncularıydı, ancak bilgisayar ilkelerini anlamadılar.Bu sefer, Dragon Takımının hepsi akademik oyunculardı ve hepsi bilgisayar alanında deneyime sahipti. Oyun hala belirsizliğini koruyor.

2. Ünlüler ve ünlülerin yorumları

6 Nisan'dan 10 Nisan'a kadar, sergi turnuvasının yayın yoluyla bir dizi poker sever ünlüleri davet edeceği ve büyük canlı yayın platformlarında bir dizi harika yorum başlatacağı bildirildi.Haiquan Fonu'nun kurucusu Hu Haiquan, ünlü köşe yazarı Wang Xiaoshan, 360 labour Akıllı Araştırma Enstitüsü Dekanı Yan Shuicheng, LeTV Cloud CEO'su Wu Yazhou, Dreamcatcher Fund'ın kurucusu Zhu Bo ve Inno Fund'ın kurucusu Li Zhu uzman yorumcular olarak görev yapacak.

Organizatöre göre aynı zamanda yarışmanın son günü 10 Nisan akşamı Kai-Fu Lee'nin de aralarında bulunduğu teknoloji, yatırım ve medya çevrelerinden 36 ünlü, soğuğun ustalarına meydan okumak için altı takım oluşturacak.

rekabet kuralları

Oyunun başlamasıyla birlikte dün Leifeng.com tarafından bildirilen kurallara ek olarak daha detaylı kurallar da gün yüzüne çıktı:

1. Grup

Dragon Team üyeleri Lengpu ustaları ile iki odada 1V1 maçları oynadı.

ODA 1 (Takım A): Du Yue, Zhu Yaxi, Tong Zhou;

ODA 2 (Takım B): Xu Chaojun, Zhang Huai, Wang Tianjian.

Texas Hold'em'de bir masada en az 2 oyuncu ve en fazla 22 oyuncu vardır.Genelde 2-10 oyuncu katılır. Şu anda, Lengpu ustaları çok oyunculu oyunlara katılamıyor, bu da insanları daha az heyecanlı ve canlı hissettiriyor.

2. Lisanslama

Her bir insan oyuncu aynı anda iki eli oynar ve oyun ikili anlaşmayı benimser, yani A takımının eli B takımının elidir ve A takımının eli B takımının eli olur. Ve bire bir yazışmalara değil, belirli bir oyuncuya rastgele atanır.

Leifeng.com'a göre, Master Lengpu tamamen matematiksel modeller ve algoritmalar kullanıyor ve arka plandaki bilgisayar grubu hesaplama açısından çok yoğun, bu nedenle insanların aynı anda iki eli oynaması için çok geç.

3. Pazarlık fişleri

Her bir elin başında oyuncular ve yapay zekanın 20.000 fişi vardır, küçük kör bahis 100 ve büyük kör bahis 200'dür. Bir el oynandıktan sonra, sonuca bakılmaksızın, bir sonraki elde her iki tarafın fişleri 20000'e sıfırlanmalıdır.

Şu anda, soğuk yumruk ustaları, her iki tarafta da farklı çiplere sahip insanlarla rekabet edemez, çünkü bu, modellerin oluşturulmasında daha karmaşıktır ve bu, şüphesiz, insan-bilgisayar çatışmasında AI'nın zorluğunu azaltır.

Texas Hold'em AI Libratus ve Go AI AlphaGo arasındaki fark nedir?

Mart 2016'da AlphaGo, profesyonel dokuz dan Li Shiduan'ı 4: 1 skorla mağlup ettiğinden beri Go AI'nın gücü halk tarafından iyi biliniyor. İster profesyonel akademik dergilerde ister sosyal ağlarda, insanlar derinlemesine ve kapsamlı tartışmalar başlattı. Ancak, halk Texas Hold'em AI hakkında hala çok az şey biliyor. Peki Texas Hold'em AI ve Go AI arasındaki fark nedir?

AlphaGo eğitim için çok sayıda satranç kaydı ve kendi kendine oynanan oyunlar kullanırken, Libratus rastgele oluşturulmuş kart oyunlarını (rastgele oluşturulmuş ortak kartlar, pot çipleri, oyuncu olasılığı) ve geçici eylemlerin sonuçlarını (rastgele oluşturma Giriş durumu altında oyuncunun takibinin simülasyonunun sonucu) eğitim verisi olarak kullanılır.

"Bire bir limitsiz Texas Hold'em", iki kişi tarafından oynanan bir kumar oyunudur. Her oyuncuya önceden 2 kapalı kart verileceği için, rakibin "kapalı kart bilgilerini" bilmiyorsunuz. Bilgisayar için işlem yapıyor "Eksik bilgi oyunu". AlphaGo, Go oynarken, her iki oyuncunun bilgileri eksiksiz ve simetriktir ve gizli bilgi yoktur.

Facebook Yapay Zeka Araştırma Enstitüsü'nde bir araştırmacı olan Tian Yuandong, daha önce şunları analiz etti:

Eksik bilgi oyunu daha zordur, bu da aşağıdakilere yansır:

Bir yandan, aynı nesnel durum için, her oyuncu farklı bilgiler görür, bu da her oyuncu için durum alanlarının sayısını ve karar vermenin zorluğunu artırır;
Öte yandan, aynı durumda bile, asimetrik bilgi oyununu çözmek için gereken bellek, simetrik bilgiden çok daha fazladır.Bu, mevcut durumu hatırladığınız ve bir karşılaştırma bulmak için çıkardığınız sürece esas olarak simetrik bilgi oyunu içindir. İyi bir strateji yeterli ama asimetrik bilgi oyunları için mevcut (eksik) durumu hatırlamak yeterli değil, tahtadaki durum aynı olsa bile rakibin önceki hamleleri aslında farklı bir duruma yol açacaktır. Ortaya çıkardığınız başa çıkma stratejilerinin başkaları tarafından kullanılmamasını sağlamak için hepsini analiz için listeleyin.
Aynı zamanda asimetrik bilgi oyunlarının pratik değeri daha büyüktür. Ulusal stratejilerden günlük işlere kadar her gün karşılaştığımız tüm kararları kapsayan asimetrik bilgi oyunlarının uygulama yelpazesi çok geniş olduğu için hepsi aynı şekilde modellenebilir.

Bu yüzden Libratus, Texas Hold'em AI'da büyük önem taşıyan ilerleme kaydetmiştir.

Tian Yuandongun AI Technology Review hakkındaki son paylaşımına göre, CMUnun mevcut Lengpu ustası olan Libratus üç özelliğe sahiptir:

Biri derin öğrenmeyi kullanmak değil, oyun sonu çözücüyü kullanmaktır. Poker turu nispeten kısa olduğundan ve birkaç tur bittiğinden, oyun ağacı aşağıdan yukarıya doğru inşa edilebilir. Bunun avantajı, alt düğümdeki oyun ağacının durumunun hesaplanmasının daha kolay olması ve bunu sırasıyla yukarıdaki oyun ağacının tasarımına rehberlik etmek için kullanmasıdır.
İkincisi, Monte Carlo yönteminin AlphaGo gibi kullanılmasıdır.Standart CFR (Counterfactual Regret Minimization) her yinelemede tüm oyun ağacını aramalıdır.Bu biraz daha karmaşık bir oyun için kabul edilemez. . Üstel karmaşıklık nedeniyle, Monte Carlo yöntemi, stratejiyi güncellemek için her seferinde bazı düğümleri seçmek için kullanılır.
Üçüncüsü, genel olarak, oyun oynarken, sık sık birbirimizin zayıflıklarından nasıl yararlanacağımızı düşünürüz, ancak durum böyle değil. Daha iyi bir yol, başkalarının zayıflığımı keşfetmesine izin vermeye çalışmam ve sonra onu geliştirip daha güçlü hale gelebilirim. Terminolojide, rakibin en iyi cevabını (En iyi cevap) hesaplamak, rakibin zayıf yönlerinizi kullanmasına izin vermek ve ardından bunu kendi seviyenizi geliştirmek için kullanmaktır.

Texas Hold'em AI Libratus'ta zayıflıklar var mı?

AlphaGo ve Libratus, Go ve Dep alanlarında en iyi insan oyuncuları defalarca ezdikten sonra, belki de pek çok insan insan zaferi için beklentileri bildirmekte başarısız olmuştur. Maç öncesi basın toplantısında, Dragon Team kaptanı Du Yue medyaya, bu sefer sadece% 10 kazanma umutları olduğunu söyledi.

Aslında, bu kadar karamsar olması gerekmeyebilir. Libratus, iki ay önce Pittsburgh insan-makine çatışmasında sorunsuz bir şekilde kazanamadı ve hatta insan oyuncular tarafından kusurlar buldu. Belki de, Libratus'un kurucu üyesi Dr. Brown ile ünlü bir poker dergisi olan Card Player'ın yaptığı son röportajdan bir şeyler görebiliriz. Daha önce Leifeng.com röportajı tercüme etmişti.Ayrıntılar için lütfen tıklayın: Texas Hold'em algoritmasının geliştiricisi Dr. CMU ile röportaj: Yapay zeka en iyi insan oyuncuları nasıl yeniyor?

Usta Lengpu'nun yaratıcılarından biri: Brown olay yerinde (ayakta)

Kart Oyuncusu:

İnsan oyuncular skorun peşinde koşarken ve savaş kızışmaya başladığında, rakibinizin Libratus'un zayıflığını bulmuş olabileceğini mi düşünüyorsunuz yoksa hala kendinize güveniyor musunuz?

Kahverengi:

Maçın ilk haftasının sonunda iki taraf adeta berabere kaldı. İnsan oyuncular, ilk hafta, Libratus'un oyun tarzını nasıl ayarlayacağı ve güçlü yönlerinin nerede olduğu konusunda bir dizi spekülasyon yaptı. Benimle savaşın nasıl gelişeceğini düşündükleri hakkında konuşmadılar, ama duyduğuma göre, Libratus'un rutinlerini verilerden arıyor ve zayıflıklarını ve avantajlarını analiz ediyor olmalılar. Genel olarak konuşursak, fazla endişelenmiyorum. Yapay zekanın bazı yönlerden kusurlu olduğunu düşünüyorlar ama aslında öyle değil.

Örneğin, bir günlük oyunda,% 80'i üç bahis yapıyordu çünkü verilerden, yapay zekanın belirli bir üç bahis boyutunda çok iyi olmadığına inanıyorlardı. Ama bunun bir kusur olduğunu düşünmüyorum, sadece verilerinde gürültü var. Oyun boyunca elde ettikleri veriler onları bu sonuca götürdü.

Ama içinde bazı sorunlar gördüler. Örneğin, Libratus, belirli bir açılış bahsinin boyutuna tam olarak karşılık gelmez. Maçtan önce bunun büyük bir sorun olmadığını düşünüyorduk ama gerçekler bu zayıflığın korkunç olduğunu kanıtladı. Neyse ki, AI'nın hala bir eli var - rakip o gece uyurken, AI, rakibin bu kusuru gelecekte tekrar kullanmasını önlemek için kendi yetersizliğini telafi etmeye devam edecek. Görüyorsunuz, durum ikinci haftadan itibaren değişmeye başladı.

Brown, başlangıçta Libratus'un röportajda hiçbir zaafı olmadığını yanıtlasa da, daha sonra sözlerini değiştirdi ve Libratus'un, korkunç bir zayıflık olan belirli bir açılış bahsinin boyutuna iyi yanıt vermediğini söyledi. Daha önce de belirtildiği gibi, Dragon Team'in üyelerinin çoğu bu kez bilgisayar bilimlerinde geçmişe sahip akademik ustalardır.Umarım "Lengpu Ustası" nın zayıflıklarını bir an önce bulup onu iyi bir şekilde kullanabilirler. Bu bize biraz katkı sağlayacaktır. İnsan zaferi umudu.

sonuç olarak

Oyun kurallarının formülasyonundan, ister 1V1 ister tek bir elden sonra çip sıfırlama olsun, insan oyuncuların çok sayıda yapay zekayı "barındırması" gerektiği görülebilir. Yani bu insan-makine yarışmasını "soğuk bahisçi" kazansa bile, Texas Hold'em'de yapay zekanın insanları tamamen mağlup ettiği söylenemez. Ancak yapay zeka araştırma konusu olan "eksik bilgi oyunu" için Lengpu Master'ın zaferi büyük önem taşıyacak. Tabii yarışma yeni başladı ve ödülü kimin kazanacağı hala bilinmiyor, bekleyip görelim.

Yang Hua'nın işleriyle ilgili ilk rapor toplantısı yapıldı. Yang Hua'nın karısı, dinlemek için vardiyalarını değiştirdi ve bitirmeden önce aceleyle işe geri döndü.

Yeni Zelanda'da silah yasağının ardından bazı insanlar hoşnutsuz. "Klavyeciler" savaş uçakları ve nükleer bombaları "teslim ediyor"