Makine öğrenimi Dünya Kupası'nı öngörüyor: Brezilya kazandı

Xin Zhiyuan bugün

Xinzhiyuan Raporu

Kaynak: Orta, Github, KDnuggets vb.

Yazar: Li Jingyi, Craig

Xin Zhiyuan Rehberi 2018 Dünya Kupası başlamak üzere. Final şampiyonasını kim kazanacak? Makine öğrenimi Brezilya'yı öngörürken, istatistiksel yöntemler Almanya'nın kazanacağına inanıyor.

Üç gün sonra Rusya'da 2018 Dünya Kupası başladı.İlk maç, 14 Haziran'da başlayacak olan ev sahibi Rusya ile Suudi Arabistan'dı.

Her Dünya Kupası'nda en çok izlenen etkinlik finaldir. Brezilya'daki son 2014 Dünya Kupası'nda ev sahibi Brezilya beklenmedik bir şekilde üzüldü ve sadece dördüncü oldu ve finali kaçırdı. Bu yılki Dünya Kupası'nda birçok kurum / araştırmacı tahminlerde bulundu: Almanya şampiyonluk için Brezilya ile rekabet edecek ve Brezilya'nın şampiyonluğu kazanma olasılığı daha yüksek.

Çeşitli öngörüleri ve kamuoyu yoklamalarını birleştiren şampiyona Brezilya, Almanya ve Arjantin arasında neredeyse kesin olarak başlayacak.Güçlü bir mücadele memnuniyetle karşılansa da, birkaç sürpriz var gibi görünüyor.

Makine öğrenimi ve büyük veri yöntemleri, yalnızca Dünya Kupası için değil, aynı zamanda sonuçlar için de maç sonuçlarını tahmin etmek için giderek daha fazla kullanılıyor.Takım kompozisyonu, taktiksel seçim ve oyuncu eğitimi, makine öğrenimini görmeye başladı. Hayranlar ve izleyiciler için yapay zeka, spor etkinliklerine katılma / izleme konusunda yepyeni bir deneyim başlatacak.

Makine öğrenimi tahmin sonuçları: Brezilya şampiyonluğu kazandı

Kenyalı yatırım bankası Genghis Capital Investment Bank'ta yatırım bankası analisti olan Gerald Muriuki, geçtiğimiz günlerde Medium'da FIFA 2018'in sonuçlarını tahmin etmek için makine öğrenimini kullandığını duyurdu Brezilya şampiyonayı kazanacak .

Bu sonuç, bir Microsoft AI ve veri bilimi uzmanı olan Sorin Peste'nin tahminiyle tutarlıdır.

Aslında, Dünya Kupası kazananını tahmin etmek tipik bir makine öğrenimi problemidir. Önce her oyunun galibini tahmin edersiniz ve ardından grup aşamasının, yarı finallerin ve finallerin kazananlarını tahmin edersiniz. Bu süreçte veri entegrasyonu, özellik modelleme ve sonuç tahmini yapmanız gerekir. Bu nedenle, birçok makine öğrenimi veya veri bilimcisi benzer projeler yaptı.

Hem Muriuki hem de Peste, futbol maçlarının geçmiş verilerine dayanarak makine öğrenimi modelleri oluşturuyor, maçları simüle ediyor ve bu maçların sonuçlarını tahmin ediyor. Aşağıda ayrı ayrı bir göz atalım.

Tahmin yapmak için lojistik regresyon kullanın

Muriuki, 1872'den 2017'ye kadar uluslararası futbol maçlarının sonuçlarını içeren Kaggle'dan iki veri seti kullandı. Önce iki veri setini analiz etti, bazı özellik mühendisliği yaptı, tahmin etmek için 2018 Dünya Kupası için en alakalı özellikleri seçti ve ardından bazı veri geliştirmelerini kontrol etti.

Model seçiminde Muriuki kullandı Lojistik regresyon , Bir sınıflandırıcı algoritması. Lojistik regresyon, olasılığı tahmin etmek için bir lojistik fonksiyon kullanır, böylece kategorik bağımlı değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişkiyi ölçer. Basitçe ifade etmek gerekirse, bir dizi ilgili veri verildiğinde, lojistik regresyon sonucu tahmin edebilir (Dünya Kupası durumunda, kazanıp kazanmayacağını tahmin etmektir).

Bu, ilk birkaç maçı tahmin eden modelinin sonucudur: Rusya - Suudi Arabistan, Rusya kazanır; Uruguay - Mısır, Uruguay kazanır; İran - Fas berabere. 4 gün sonra sonucun doğru mu yanlış mı olduğunu doğrulayabilirsiniz.

İlk 16'nın sonucu şudur:

Çeyrek finaller Portekiz-Brezilya ve Almanya-Arjantin arasında oynanacak.

Sonunda Brezilya - Almanya, Brezilya kazandı.

Tahmin için rastgele orman kullan

Öte yandan, Microsoftun yapay zeka ve veri bilimi uzmanı Sorin Pestenin tahmin süreci daha eksiksiz. Verilerin seçiminde Peste, Dünya Kupası'nın yıllar içinde elde ettiği sonuçlara ek olarak, Avrupa Kupası ve Olimpiyat Oyunları gibi büyük ölçekli yarışmalardan ve bu oyunlardaki galibiyet oranlarının dağılımından elde edilen verileri de kullandı.

Ayrıca Peste, oyunun adresini, yani kendi evinde, deplasmanında ya da her iki tarafla ilgisi olmayan tarafsız bir konumda olup olmadığını ve oyunun "dostluk" olup olmadığını da dikkate aldı. Oyuncular ve stratejiler.

Model seçiminde Peste kullanılmıştır Rastgele orman (derinlik 500) , Kendisine sunulan özelliklere dayalı olarak çok sayıda karar ağacı oluşturan bir algoritma ve her bir ağaç, her yeni giriş vektörünün sonucunu "oylar". Rastgele orman hızlıdır, oldukça doğrudur ve genelleme hatalarının tarafsız tahminlerini yapabilir, bu nedenle çapraz doğrulama gerekmez.

Aşağıdaki şekil 1000 yinelemeden sonraki sonucu göstermektedir: Brezilya kazandı ve Arjantin ikinci oldu.

İstatistiksel yöntem: Alman tankları Brezilya'yı az farkla yendi

Tabii ki, makine öğrenmesine ek olarak, büyük veri yöntemlerini kullanan daha fazla tahmin var. KDnuggets'ın hevesli bir hayranı, Alman takımının şampiyonluğu kazanacağını tahmin etmek için istatistiksel yöntemler kullandı. Adımları şu şekildedir:

bilgi toplamak:

FIFA Dünya Sıralaması: Bu, 211 milli futbol takımının tümünün sıralama sistemidir. Puan sistemi kullanılarak puanlar, FIFA onaylı tüm uluslararası müsabakaların sonuçlarına göre belirlenir. Ancak bu en iyi sistem değildir ve birçok dezavantajı vardır.

Elo derecelendirmesi: Sistem ilk olarak, satranç oyuncularını puanlamak amacıyla Uluslararası Satranç Federasyonu FIDE için geliştirilmiştir. Karmaşık matrisi, oyunun türüne göre puanlar atar ve iki taraf arasındaki gol farkındaki farkı hesaba katar. Onunla FIFA arasındaki temel fark, hazırlık maçlarının sayısını da hesaba katmasıdır.

TransferMarkt takım değeri: Almanya merkezli bu web sitesi, tanınmış her bir oyuncunun tahmini piyasa değeri dahil olmak üzere futbolun tüm yönleri hakkında bilgi sağlar. Katılan ülkelerin ve takım değerlerinin bir listesini çıkardılar.

Bahis oranları: Her ülkenin en cömert oranlarını kullanarak bahis karşılaştırma sitesi OddsChecker'ı kullanın.

TransferMarkt'ın sayısı Euro cinsindendir, FIFA ve Elo'nun kendi derecelendirme sistemleri vardır ve bahis oranları puandır. Yazar, karşılaştırılabilir hale getirmek için her sistemi standartlaştırdı. İstatistiklerde standart puanlar (z-puanları / değerleri, normal puanlar veya standartlaştırılmış değerler olarak da adlandırılır) ortalama değerden farklı olan standart sapmaların sayısıdır.

2018 Dünya Kupası için dört popüler tahmin kaynağı

KDnuggets z-skorunu tahmin etti

KDnuggets'ın tahmini doğruysa, Dünya Kupası grup aşamasının sonucu aşağıdaki gibi olacaktır:

Araştırma sonuçları bazı ilginç sonuçlara yol açar:

  • Almanya birinci sırada, ancak Brezilya'dan yalnızca biraz daha yüksek. Onu İspanya ve Fransa izliyor.
  • Elo sıralama sistemi ve bahis oranları en çok benzer görünüyor, her ikisi de aynı ilk beşi listeliyor (yukarıda belirtilen dört takım ve Arjantin).
  • Tüm sistemde bazı keskin zıtlıklar var En çarpıcı olanı Peru'nun hem FIFA hem de Elo sıralamasında 10. sırada yer alırken, TrasferMarkt'ta takım değer sıralaması 30. sırada. Bit.

Anket: Almanya, Brezilya, Arjantin en popülerler

KDnuggets hakkındaki tahminlere ek olarak, Dünya Kupası'ndan önce birçok başka tahmin var:

"Daily Telegraph" her takımın kapsamlı bir analizini yaptı ve sonunda okuyucuların şampiyonayı tahmin etmesine izin vermek için bir oylama yaptı. Oylamanın sonuçları aşağıdaki gibidir:

Ayrıca Chinanews.com'a göre Rusya'daki Perm Ulusal Araştırma Üniversitesi öğrencisi Victor Zakopalo, 2018 Dünya Kupası şampiyonlarını tahmin edebilen bir sinir ağı kurdu.Sinir ağı çeşitli parametreleri analiz edip hesaplayarak bir sonuç çıkarıyor. Dünya Kupası'nda ilk üçün olacağını söyledi Almanya, Brezilya ve Arjantin .

Brezilya dört yıl önce evinde 1: 7 Alman takımına yenildi ve 1920'de Uruguay 0: 6'ya kaybettiğinden beri en büyük Dünya Kupası mağlubiyet rekorunu kırarak tüm ülke halkını şok etti. Sonunda, Alman takımı o yıl Dünya Kupası'nı kazandı.

Rusya'da bu yıl yapılacak Dünya Kupası için birçok organizasyon Brezilya ve Almanya'nın şampiyonluk savaşı düzenleyeceğini tahmin ediyor. Brezilya utanabilir mi ve Almanya şampiyonluğu başarıyla savunabilir mi? Bekleyip göreceğiz.

kaynak:

1. Muriuki lojistik regresyon tahmini: https://medium.com/@itsmuriuki/predicting-fifa-world-cup-2018-using-machine-learning-dc07ad8dd576

2. Peste rastgele orman tahmini (ekli kod): https://notebooks.azure.com/sorinpeste/libraries/footballpred/html/worldcup.ipynb

3. İstatistiksel tahmin sonuçları: https://www.kdnuggets.com/2018/06/football-world-cup-predictions.html

4. Elo'ya dayalı Dünya Kupası tahmin modeli: https://arxiv.org/pdf/1806.01930.pdf

Topluluğa katıl

Xinzhiyuan AI teknolojisi + endüstri topluluğunun işe alımında, AI teknolojisi + endüstrisiyle ilgilenen öğrenciler küçük bir WeChat asistanı hesabı ekleyebilirler: aiera2015_3 Gruba katılın; incelemeyi geçtikten sonra sizi gruba katılmaya davet edeceğiz. Topluluğa katıldıktan sonra, grup açıklamalarını değiştirmelisiniz (isim-şirket-pozisyon; profesyonel grup incelemesi katıdır, lütfen anlayın).

New York Times: "Gezici Dünya" Çin sinemasında yeni bir çağın gelişini işaret ediyor
önceki
Bu küçük şehir, yüksek hızlı trenle doğrudan bağlantılı ve Yunnan'ın güzelliğinin üçte birini kaplıyor, ancak adını duymamış olabilirsiniz!
Sonraki
ACL 2018'in en iyi makalesi açıklandı! Hesaplamalı dilbilimdeki en modern araştırma burada
Rolls-Royce SUV üretmek üzere, Ferrari Chrysler'in acelesi yok
IJCAI 2018 Uluslararası Reklam Algoritması Yarışması Göç Öğrenimi Şampiyonayı Kazandı, Çin Birinci, İkinci ve Üçüncü Oldu
Jeep Rehberi: Kenarları ve köşeleri düzelttikten sonra, rekabet gücüne bakın
Ağır! Hanchuan'ın iki kasabasına ilçe düzeyinde idari yetki verildi!
Qichen T90 "Ucuz Nissan" şapkasını çıkarabilir mi?
Wu Dajing bir faulden hüküm giydi ve oyun dışındaydı. Maçtan sonra ceza inanılmazdı. Kore'de böyle olmasını beklemiyordum
Bugünlerde sana bir araba ödünç verebilecek arkadaşlar, aşkı ve adaleti önemseyen gerçek erkeklerdir.
Çin'de öl! Tarihin en eksiksiz yemek haritası, kaç tane yedin?
Turing Ödülü sahibi olma ihtimali, Moore Yasasını ne kurtarabilir?
Kalibrasyon mühendisinin gözünde Jeep Freeman nasıl bir araba?
Musk ile birlikte gizemli bir organizasyon oluşturmak için insanlığın ve yapay zekanın geleceğini yeniden yazıyor
To Top