Yapay zeka, satrancı bir satranç oyunu oynamadan, sadece insanların oyunu açıklamasını dinleyerek öğrenmiştir.

İçbükey tapınaktan kestane

Qubit Üretildi | Genel Hesap QbitAI

Bir yapay zeka satranç öğrenmeli, satranç oynamış olması gerekir mi?

Şart değil.

University College London'daki arkadaşlarım, sadece oyundaki insan yorumlarına bakarak satranç oynamayı öğrenebilen yeni bir satranç yapay zekası geliştirdiler.

AI'nın adı SentiMATE Yorumcunun konuşmasındaki duyguya göre bir oyunun iyi mi kötü mü olduğuna karar vermektir.

Ekip, yapay zekanın yalnızca bu duygulara güvenerek satrancın temel kurallarını ve bazı temel stratejileri öğrendiğini ve önceki DeepChess algoritmasını yendiğini keşfetti.

Önemli olan, çok fazla eğitim verisi gerektirmemesidir.

Peki, bu yapay zeka tam olarak ne deneyimledi?

Farklı öğrenme yöntemleri

Hikaye, çoğu satranç yapay zekasının nasıl çalıştığı ile başlar.

Mevcut satranç algoritmasının temelde iki temel bölümü vardır:

Biri Arama algoritması , Tüm olası sonraki adımları aramak, birçok düğümü olan bir ağaç oluşturmak için kullanılır. iki Değerlendirme algoritması , Ağaç üzerinde belirli bir düğüme gitmenin avantajlarını analiz etmek için kullanılır.

Örneğin, bu bir ağaç

Ve SentiMATE, ikinci kısım , Yapmanın bir yolunu değiştirdi:

Oyun yorumundaki cümlenin duyarlılığını analiz edin, her hareketin kalitesini değerlendirin ve yeni bir değerlendirme işlevi eğitin.

Duygu değerlendirmesi

Yorumun metni bir satranç forumundan seçildi.

Ekip, yorumcuların duygularını analiz etmek için iki sınıflandırıcı kullandı.

İlk sınıflandırıcı , Yorum metninden, bir satranç elinin kalitesini tanımlayan yorumları ayırmalı ve kaliteyle ilgisi olmayanları atmalıyız.

Araştırmacılar, bu ikili sınıflandırıcıyı 2.700 manuel açıklama eklenmiş yorumla ve ayrıca test seti olarak başka 300 yorumla eğitti.

Bu şekilde, yararlı değerlendirmeler orijinal veri setinden filtrelenebilir.

İkinci sınıflandırıcı Seçilen cümlelerden duyguları analiz etmek gerekir.

Bu kısım kritik ve karmaşıktır. Bazı cümleler nedeniyle duygunun olumlu mu yoksa olumsuz mu olduğuna karar vermek zordur:

Örneğin, "Bir Parçayı Korumak" olumsuz sonuçlardan kaçınmak için bir hareket olarak kabul edilebilir ve mevcut durumun daha tehlikeli olduğunu da gösterebilir. Başka bir örnek olarak, "Saldırı" kelimesi sıradan duygu analizi yapay zekasını aşağılayıcıdır ve kolaylıkla olumsuz duygular olarak sınıflandırılabilir. Ancak "Kraliçeye Saldırı" genellikle olumlu bir harekettir. Bu şekilde, duyguların bağlamsal olarak anlaşılması çok önemlidir. Veri setindeki örnekler çoğunlukla kısa metinlerdir ve atıfta bulunulacak çok fazla bağlam yoktur.

Ekip, Flair tarafından kullanılan mimariyi seçti. Flair, Zalando Research tarafından geliştirilmiş bir NLP kütüphanesidir.

Araştırmacılar, metin kısa olduğunda, LSTM (Uzun süreli ve kısa süreli hafıza) Uygun kelime gömme yöntemleriyle birleştirildiğinde, satranç bağlamında kelime kullanım kurallarının öğrenilmesine yardımcı olacaktır.

Yani, word2vec kelime yerleştirme temelinde, biraz daha Bağlamsal dize gömme (Bağlamsal Dize Gömme), sınıflandırmanın doğruluğunu artırmak için kullanılır.

Bu şekilde bir Küçük eğitim seti (Ekip sadece olumlu ve olumsuz olarak ayrılan 2090 değerlendirme duygularını işaretledi) Moody Metin sınıflandırılır.

Duygu sınıflandırması yapıldıktan sonra en önemli adıma ulaşılır:

Her hareketin kalite değerlendirmesi

Ekip tarafından kullanılan değerlendirme yöntemi önceki yapay zekadan çok farklı.

Öncekiler tarafından kullanılan verilerin çoğu, statik bir kartın durumudur ve her hareket hakkında bilgi yoktur. Eğitim süreci nispeten verimsizdir ve iyi bir şekilde genelleştirmek için çok büyük miktarda veri gerektirir.

Ve burada, hareketten önceki ve sonraki pano (aşağıdaki resimde solda), henüz analiz edilen duygularla birlikte (aşağıdaki resimde sağda) sinir ağına girilir. Böylelikle daha önce unutulmuş veriler doldurulur ve eğitim daha verimli hale gelir.

Orta kısım kalite değerlendirme ağıdır

(Kalite değerlendirme ağının yapısı, Sabatelli ve diğerleri tarafından 2017 yılında önerilen yönteme dayanmaktadır.)

Ekip, Go oynayan AlphaZero gibi, kendi kendine oyunun bir milyon / on milyon yinelemesinden (Yinelemeleri) geçmesi ve bir usta olabilmesi için binlerce GPU kullanması gerektiğini söyledi;

Akademik dünya genellikle bu tür koşullara sahip değildir, bu nedenle değerlendirme algoritmasının verimliliğini artırmak çok önemlidir.

Peki sonuç nedir?

DeepChess kazandı

İlk olarak, iki sınıflandırıcının etkilerine bakın.

İlk sınıflandırıcı, bul Bir hareketin kalitesini tanımlayabilir yorumu:

Ekip üç tür ağ denedi ve Çift yönlü LSTM En iyi performans, faydalı yorumları tanımlamanın doğruluğu % 93.4 , Sıradan LSTM ve sıradan RNN'nin ötesinde.

Ardından, en iyi performans gösteren iki yönlü LSTM'nin yanı sıra, farklı kelime gömme yöntemleri denendi:

BERT ve GloVe yerleştirme kombinasyonunun en iyi performans olduğu ve faydalı yorumları tanımlamanın doğruluğuna ulaşıldığı görülmüştür. % 97.2 .

İlk adım oldukça etkilidir.İşte olumlu ve olumsuz duyguları değerlendiren ikinci sınıflandırıcı:

Bu, 2090 inceleme ile eğitilmiş ve 233 inceleme ile test edilmiş bir LSTM sınıflandırıcısıdır.

Sonuç olarak, olumlu duyguları tanımlamanın doğruluğu % 91,42 , Denge doğruluk oranı (Dengeli Doğruluk)% 90,83'tür.

CNN-RNN mimarisinin ötesinde, iki yönlü LSTM'nin ötesinde.

Bu arada, bu sınıflandırıcıdaki en iyi kelime gömme yöntemi BERT'den geliyor.

Bu noktada ikinci adım da etkili oldu.

Peki, SentiMATE sonunda satranç oynamayı öğrendi mi? Yine de gerçek kılıç ve silahlarla eşleşmek zorundasın:

İlk olarak, kazanma oranı olan rastgele yapay zekaya karşı 100 oyun oynayın % 81 .

Ardından, 2017'de doğan DeepChess'e (uygulaması) karşı oynayın.

Hesaplama kısıtlamaları (Hesaplamalı Kısıtlamalar) nedeniyle, SentiMATE bir hareketin kalitesini değerlendirmek için pek çok adım bekleyemez (İleriye Bakın), bu nedenle kendinizin ve rakibinizin arama derinliğini 1 olarak ayarlayın, bu sadece bir adım ileriye bakmanız anlamına gelir.

Bu koşul altında, SentiMATE Siyah tut ile Beyaz tut İkisi de rakiplerini yendi.

MIT Technology Review, AI'nın Forking ve Castling gibi birçok temel stratejide ustalaştığını bildirdi.

Araştırmacılar ayrıca bu yapay zekanın Wang Bing başlar (Kral Piyonu açılıyor), bu durumu hızla açabilen çok radikal ve saldırgan bir operasyon.

Büyük satranç ustası Bobby Fischer de şunları söyledi: Pratik, bunun başlamanın en iyi yolu olduğunu kanıtladı.

SentiMATE şu anda yalnızca bir adım ileriyi hesaplayabilse de, Ancak yine de NLP'nin etkili bir değerlendirme işlevi geliştirebileceğini ve az sayıda örnekle başarılabileceğini kanıtlıyor.

Bu şekilde, büyük önem taşıyan gelecekteki satranç AI eğitimi için taze ve düşük karbonlu bir fikir sağlar.

Tez Portalı:

https://arxiv.org/abs/1907.08321

Referans raporu:

https://www.technologyreview.com/s/614043/instead-of-practicing-this-ai-mastered-chess-by-reading-about-it/

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin.

Qubit QbitAI · Toutiao İmzalama Yazarı

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Baidu'nun sürücüsüz kiralama hizmeti Changsha'da açılıyor: Apollo teknolojisi, FAW Hongqi filosu, Çin'in ilk
önceki
Güzellik ve pratikliğin birleşimi, Bull Rubik's Cube ailesinin gücü
Sonraki
1 Ağustos Ordu Günü'nde, bu güçlü öğretmenlere saygı gösterin
Python'a Markdown tarzı sürüm ekleyin, Run Online Jobyter Stand olarak kullanılabilir -Google Beyin
Tsinghua Yao 2019 birinci sınıf öğrencileri burada: üniversiteye giriş sınavı şampiyonu, Olimpiyat altın madalyası, yapay zekadan ilham alan post-00'lar
Nubia Z20 resmi olarak tanıtıldı: cep telefonlarında sözde SLR, 3499 yuan'dan başlayan fiyatlarla
Model yarı yarıya sıkıştırılmıştır ve doğruluk neredeyse kayıpsızdır. TensorFlow yarı hassas kayan nokta araç seti geliyor
Renkli TV'lerin 8K yükseltmesine liderlik eden Samsung QLED 8K TV'ler, endüstriyi "5G + 8K" çağına itiyor
Jiang Yong'un Zhang FuqingChen Yulin versiyonu: Partinin sadık ve güvenilir bir "iletişim askeri" olun
Resmi duyuru: Hong Kong'da konuşlanmış askerlerin kısa videoları internette popüler oldu ve netizenler çok fazla seslendi
Alevlenme! Kısa videoda konuşlanmış Hong Kong birliklerinin resmi duyurusu.
GitHub Hot List'de 1 Numara: Miss Sister bir selfie çekiyor ve ikinci elementte sevimli bir kız oluyor, etkisi CycleGAN'dan çok daha iyi.
Sci-Hub'ın kuşatılması ve bastırılması yükseltildi! Elsevier: Web sitesinden bahsetmeyin, aksi takdirde bir avukat mektubu gönderirsiniz
Samsung Galaxy Note 10 serisi iki ürün erken benimsiyor, hangisi daha güzel kokulu?
To Top