g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Yapay zeka, satrancı bir satranç oyunu oynamadan, sadece insanların oyunu açıklamasını dinleyerek öğrenmiştir.

İçbükey tapınaktan kestane

Qubit Üretildi | Genel Hesap QbitAI

Bir yapay zeka satranç öğrenmeli, satranç oynamış olması gerekir mi?

Şart değil.

University College London'daki arkadaşlarım, sadece oyundaki insan yorumlarına bakarak satranç oynamayı öğrenebilen yeni bir satranç yapay zekası geliştirdiler.

AI'nın adı SentiMATE Yorumcunun konuşmasındaki duyguya göre bir oyunun iyi mi kötü mü olduğuna karar vermektir.

Ekip, yapay zekanın yalnızca bu duygulara güvenerek satrancın temel kurallarını ve bazı temel stratejileri öğrendiğini ve önceki DeepChess algoritmasını yendiğini keşfetti.

Önemli olan, çok fazla eğitim verisi gerektirmemesidir.

Peki, bu yapay zeka tam olarak ne deneyimledi?

Farklı öğrenme yöntemleri

Hikaye, çoğu satranç yapay zekasının nasıl çalıştığı ile başlar.

Mevcut satranç algoritmasının temelde iki temel bölümü vardır:

Biri Arama algoritması , Tüm olası sonraki adımları aramak, birçok düğümü olan bir ağaç oluşturmak için kullanılır. iki Değerlendirme algoritması , Ağaç üzerinde belirli bir düğüme gitmenin avantajlarını analiz etmek için kullanılır.

Örneğin, bu bir ağaç

Ve SentiMATE, ikinci kısım , Yapmanın bir yolunu değiştirdi:

Oyun yorumundaki cümlenin duyarlılığını analiz edin, her hareketin kalitesini değerlendirin ve yeni bir değerlendirme işlevi eğitin.

Duygu değerlendirmesi

Yorumun metni bir satranç forumundan seçildi.

Ekip, yorumcuların duygularını analiz etmek için iki sınıflandırıcı kullandı.

İlk sınıflandırıcı , Yorum metninden, bir satranç elinin kalitesini tanımlayan yorumları ayırmalı ve kaliteyle ilgisi olmayanları atmalıyız.

Araştırmacılar, bu ikili sınıflandırıcıyı 2.700 manuel açıklama eklenmiş yorumla ve ayrıca test seti olarak başka 300 yorumla eğitti.

Bu şekilde, yararlı değerlendirmeler orijinal veri setinden filtrelenebilir.

İkinci sınıflandırıcı Seçilen cümlelerden duyguları analiz etmek gerekir.

Bu kısım kritik ve karmaşıktır. Bazı cümleler nedeniyle duygunun olumlu mu yoksa olumsuz mu olduğuna karar vermek zordur:

Örneğin, "Bir Parçayı Korumak" olumsuz sonuçlardan kaçınmak için bir hareket olarak kabul edilebilir ve mevcut durumun daha tehlikeli olduğunu da gösterebilir. Başka bir örnek olarak, "Saldırı" kelimesi sıradan duygu analizi yapay zekasını aşağılayıcıdır ve kolaylıkla olumsuz duygular olarak sınıflandırılabilir. Ancak "Kraliçeye Saldırı" genellikle olumlu bir harekettir. Bu şekilde, duyguların bağlamsal olarak anlaşılması çok önemlidir. Veri setindeki örnekler çoğunlukla kısa metinlerdir ve atıfta bulunulacak çok fazla bağlam yoktur.

Ekip, Flair tarafından kullanılan mimariyi seçti. Flair, Zalando Research tarafından geliştirilmiş bir NLP kütüphanesidir.

Araştırmacılar, metin kısa olduğunda, LSTM (Uzun süreli ve kısa süreli hafıza) Uygun kelime gömme yöntemleriyle birleştirildiğinde, satranç bağlamında kelime kullanım kurallarının öğrenilmesine yardımcı olacaktır.

Yani, word2vec kelime yerleştirme temelinde, biraz daha Bağlamsal dize gömme (Bağlamsal Dize Gömme), sınıflandırmanın doğruluğunu artırmak için kullanılır.

Bu şekilde bir Küçük eğitim seti (Ekip sadece olumlu ve olumsuz olarak ayrılan 2090 değerlendirme duygularını işaretledi) Moody Metin sınıflandırılır.

Duygu sınıflandırması yapıldıktan sonra en önemli adıma ulaşılır:

Her hareketin kalite değerlendirmesi

Ekip tarafından kullanılan değerlendirme yöntemi önceki yapay zekadan çok farklı.

Öncekiler tarafından kullanılan verilerin çoğu, statik bir kartın durumudur ve her hareket hakkında bilgi yoktur. Eğitim süreci nispeten verimsizdir ve iyi bir şekilde genelleştirmek için çok büyük miktarda veri gerektirir.

Ve burada, hareketten önceki ve sonraki pano (aşağıdaki resimde solda), henüz analiz edilen duygularla birlikte (aşağıdaki resimde sağda) sinir ağına girilir. Böylelikle daha önce unutulmuş veriler doldurulur ve eğitim daha verimli hale gelir.

Orta kısım kalite değerlendirme ağıdır

(Kalite değerlendirme ağının yapısı, Sabatelli ve diğerleri tarafından 2017 yılında önerilen yönteme dayanmaktadır.)

Ekip, Go oynayan AlphaZero gibi, kendi kendine oyunun bir milyon / on milyon yinelemesinden (Yinelemeleri) geçmesi ve bir usta olabilmesi için binlerce GPU kullanması gerektiğini söyledi;

Akademik dünya genellikle bu tür koşullara sahip değildir, bu nedenle değerlendirme algoritmasının verimliliğini artırmak çok önemlidir.

Peki sonuç nedir?

DeepChess kazandı

İlk olarak, iki sınıflandırıcının etkilerine bakın.

İlk sınıflandırıcı, bul Bir hareketin kalitesini tanımlayabilir yorumu:

Ekip üç tür ağ denedi ve Çift yönlü LSTM En iyi performans, faydalı yorumları tanımlamanın doğruluğu % 93.4 , Sıradan LSTM ve sıradan RNN'nin ötesinde.

Ardından, en iyi performans gösteren iki yönlü LSTM'nin yanı sıra, farklı kelime gömme yöntemleri denendi:

BERT ve GloVe yerleştirme kombinasyonunun en iyi performans olduğu ve faydalı yorumları tanımlamanın doğruluğuna ulaşıldığı görülmüştür. % 97.2 .

İlk adım oldukça etkilidir.İşte olumlu ve olumsuz duyguları değerlendiren ikinci sınıflandırıcı:

Bu, 2090 inceleme ile eğitilmiş ve 233 inceleme ile test edilmiş bir LSTM sınıflandırıcısıdır.

Sonuç olarak, olumlu duyguları tanımlamanın doğruluğu % 91,42 , Denge doğruluk oranı (Dengeli Doğruluk)% 90,83'tür.

CNN-RNN mimarisinin ötesinde, iki yönlü LSTM'nin ötesinde.

Bu arada, bu sınıflandırıcıdaki en iyi kelime gömme yöntemi BERT'den geliyor.

Bu noktada ikinci adım da etkili oldu.

Peki, SentiMATE sonunda satranç oynamayı öğrendi mi? Yine de gerçek kılıç ve silahlarla eşleşmek zorundasın:

İlk olarak, kazanma oranı olan rastgele yapay zekaya karşı 100 oyun oynayın % 81 .

Ardından, 2017'de doğan DeepChess'e (uygulaması) karşı oynayın.

Hesaplama kısıtlamaları (Hesaplamalı Kısıtlamalar) nedeniyle, SentiMATE bir hareketin kalitesini değerlendirmek için pek çok adım bekleyemez (İleriye Bakın), bu nedenle kendinizin ve rakibinizin arama derinliğini 1 olarak ayarlayın, bu sadece bir adım ileriye bakmanız anlamına gelir.

Bu koşul altında, SentiMATE Siyah tut ile Beyaz tut İkisi de rakiplerini yendi.

MIT Technology Review, AI'nın Forking ve Castling gibi birçok temel stratejide ustalaştığını bildirdi.

Araştırmacılar ayrıca bu yapay zekanın Wang Bing başlar (Kral Piyonu açılıyor), bu durumu hızla açabilen çok radikal ve saldırgan bir operasyon.

Büyük satranç ustası Bobby Fischer de şunları söyledi: Pratik, bunun başlamanın en iyi yolu olduğunu kanıtladı.

SentiMATE şu anda yalnızca bir adım ileriyi hesaplayabilse de, Ancak yine de NLP'nin etkili bir değerlendirme işlevi geliştirebileceğini ve az sayıda örnekle başarılabileceğini kanıtlıyor.

Bu şekilde, büyük önem taşıyan gelecekteki satranç AI eğitimi için taze ve düşük karbonlu bir fikir sağlar.

Tez Portalı:

https://arxiv.org/abs/1907.08321

Referans raporu:

https://www.technologyreview.com/s/614043/instead-of-practicing-this-ai-mastered-chess-by-reading-about-it/

- Bitiş -

Samimi işe alım

Qubit, editörleri / muhabirleri işe alıyor ve merkezi Pekin, Zhongguancun'da bulunuyor. Yetenekli ve hevesli öğrencilerin bize katılmasını dört gözle bekliyoruz! Ayrıntılar için, lütfen QbitAI diyalog arayüzünde "işe alım" kelimesiyle yanıt verin.

Qubit QbitAI · Toutiao İmzalama Yazarı

' ' Yapay zeka teknolojisi ve ürünlerindeki yeni eğilimleri takip edin

Baidu'nun sürücüsüz kiralama hizmeti Changsha'da açılıyor: Apollo teknolojisi, FAW Hongqi filosu, Çin'in ilk

Güzellik ve pratikliğin birleşimi, Bull Rubik's Cube ailesinin gücü

: 1 Ağustos Ordu Günü'nde, bu güçlü öğretmenlere saygı gösterin

: Python'a Markdown tarzı sürüm ekleyin, Run Online Jobyter Stand olarak kullanılabilir -Google Beyin

: Tsinghua Yao 2019 birinci sınıf öğrencileri burada: üniversiteye giriş sınavı şampiyonu, Olimpiyat altın madalyası, yapay zekadan ilham alan post-00'lar

: Nubia Z20 resmi olarak tanıtıldı: cep telefonlarında sözde SLR, 3499 yuan'dan başlayan fiyatlarla

: Model yarı yarıya sıkıştırılmıştır ve doğruluk neredeyse kayıpsızdır. TensorFlow yarı hassas kayan nokta araç seti geliyor

: Renkli TV'lerin 8K yükseltmesine liderlik eden Samsung QLED 8K TV'ler, endüstriyi "5G + 8K" çağına itiyor

: Jiang Yong'un Zhang FuqingChen Yulin versiyonu: Partinin sadık ve güvenilir bir "iletişim askeri" olun

: Resmi duyuru: Hong Kong'da konuşlanmış askerlerin kısa videoları internette popüler oldu ve netizenler çok fazla seslendi

: Alevlenme! Kısa videoda konuşlanmış Hong Kong birliklerinin resmi duyurusu.

: GitHub Hot List'de 1 Numara: Miss Sister bir selfie çekiyor ve ikinci elementte sevimli bir kız oluyor, etkisi CycleGAN'dan çok daha iyi.

: Sci-Hub'ın kuşatılması ve bastırılması yükseltildi! Elsevier: Web sitesinden bahsetmeyin, aksi takdirde bir avukat mektubu gönderirsiniz

: Samsung Galaxy Note 10 serisi iki ürün erken benimsiyor, hangisi daha güzel kokulu?

g u t x .com.tr İpek yolu - Çin'i anlamaya götürürüm

Yapay zeka, satrancı bir satranç oyunu oynamadan, sadece insanların oyunu açıklamasını dinleyerek öğrenmiştir.

Farklı öğrenme yöntemleri

DeepChess kazandı

İlgili bilgi

Samsung Galaxy Note 10 serisini anlamanıza yardımcı olacak altı anahtar kelime

Gerçekten utanç verici! ABD ordusunun en "yanan" uçak gemisi silahı güverteye taşınamadı ve asansör ayaklarını sürükledi.

GitHub Wanxing: Süper ince çizgi roman boyama AI, karınızın stili sizin seçiminiz ve trend listesinde

2020 Olimpiyatları için geri sayım, birçok siyah teknoloji şovu Tokyo'ya dönüyor

Google, Drosophila beyin sinir haritasının tamamını otomatik olarak yeniden yapılandırdı: çevrimiçi etkileşimde bulunabilen 40 trilyon piksel

Çin Lejyonu KDD'ye hükmediyor: Çinli doktorlar en iyi tezi kazandı, Tsinghua Üniversitesi, Peking Üniversitesi ve Huawei listede

PyTorch'ta Keras'ı kullanın, kutudan çıkar çıkmaz eğitim dağıtın, sonsuz Hata Ayıklama'ya veda edin

Kasıtlı olarak aldatmaca! "Lolita Teyze Oluyor" Gerçek ortaya çıkıyor, canlı yayın platformu gece geç saatlerde

Lingling: fırtınalı yollar, kalpten taşan sıcak güneş

Jingzhou: İlçe sıvılaştırılmış gaz endüstrisi için yangın güvenliği eğitimini başlatın