"Kuzey Malezya Koşusu" KDD 2017: Spor Analizinde Veri Madenciliği ve Makine Öğrenimi

Kağıt PPT:

Uzun zaman önce spor temalı bir film "Penalty Kick" izledim, İngilizce adı MoneyBall. Film, Blatt Pitt'in oynadığı takım genel menajerinin ve Yale Üniversitesi Ekonomi Bölümü'nden mezun olan bir veri analistinin hikayesini anlatıyor.Beybol maçı verilerinin madenciliği ve analizi sayesinde, Taobao Ligi'ndeki oyuncular uygun maliyetli ve başarıya ulaşmak için güçlü bir takıma sahip. Şanlı işler. Film, ekibi geliştirmek için verilerin kullanılmasının değerini ve önemini tam olarak ortaya koydu ki bu çok etkileyici. Her zaman kullanılan teknik yöntemler hakkında bilgi edinmek istemişimdir ve KDD 2017'deki "Athlytics: Data Mining and Machine Learning for Sports Analytics" konusu gerçekten uygun.

Bu ders KonstantinosPelechrinis (Pittsburgh Üniversitesi), EvangelosPapalexakis (California Üniversitesi, Riverside) ve Benjamin Alamar (ESPN) tarafından ortaklaşa yürütülmektedir. Akademi + endüstri modeli pratikliği garanti eder. Konunun tamamı hala araştırma odaklı ve birçok matematiksel formül var, ancak çözülecek problemler ve yöntemler hala nispeten sığ. Bunun iki nedeni olabilir: 1. Bu alandaki insanlar daha önce yeterince dikkat etmemişlerdi ve çoğu profesyonel izcilerin deneyimine güveniyorlar; 2. Bu alan çok değerli (yetkili kuruluşlar, spor veri analizi pazarının 2021 yılına kadar 4,7 milyar olacağını tahmin ediyor ABD doları) Daha profesyonel ve daha değerli yöntemler açıklanmamaktadır. Belirli yöntemler tek tek tekrarlanmayacaktır. Paylaşmak için ilginç üç tane seçin. Daha fazlası için lütfen ppt bağlantısına bakın.

(1) Oyuncu gücünün değerlendirilmesi: revize edilmiş artı-eksi endeksi Artı eksi

Pozitif veya negatif değer, oyuncunun gücünü değerlendirmek için ana göstergedir. Gösterge ne kadar yüksekse, oyuncunun yeteneği o kadar güçlüdür. Örnek olarak Anthony-5'i alalım, Anthony sahadayken takım 5 puan kaybetti. Bununla birlikte, bu gösterge sadece, açıkça mantıksız olan, oyuncuların skorları ve sahadaki puanları arasındaki farkı dikkate alır. Mesela sahaya liderlik ederken, bu başarılı işbirliğine herkesin olumlu katkı yaptığı anlamına gelmez, geri adım atmak, herkesin olumlu bir katkısı olsa bile, düşük katkısı ve düşük yeteneği olanları bu tür verilerle ayırt etmek zordur. .

Her oyuncunun zafere katkısının nasıl ayırt edileceği önemli bir konudur. Araştırmacılar her tur regresyonunu modellemek için doğrusal modeller kullanır. Bağımlı değişken (DV) her turun puanıdır ve bağımsız değişken (IV) tüm oyunculardır. Regresyonun sonucu, her oyuncunun bir ağırlığa sahip olacağıdır ve bu ağırlık, oyuncunun zafere katkısını temsil eder. Buradaki bağımsız değişkenin tasarımı çok zekice.Her tur için sahadaki oyuncularımız 1 ile, rakibin oyuncuları -1 ile temsil edilir ve diğer oyuncular 0 ile temsil edilir. Bunun bir etkisi bu turun skoru ve bizim varlığımızdır. Oyuncular arasında pozitif korelasyon var, sahadaki rakiplerle negatif korelasyon var ve saha dışı oyuncularla hiçbir ilgisi yok. Birden fazla model öğrenme turundan sonra, her oyuncunun kendi ağırlığı vardır. Oyuncu ne kadar büyükse, oyuncunun zafere katkısı o kadar artar. Aynı zamanda, her tur sahadaki oyuncuları ve diğer oyuncuları dikkate aldığından Oyuncuların etkisi otomatik olarak dikkate alınır.

Yukarıdaki resim NBA 07-08 sezonunun en iyi 5 oyuncusunu gösteriyor.Çok güvenilir görünüyorlar ve çoğu taraftarın algısı ile oldukça tutarlılar.

(2) Oyunun sonucunu tahmin edin: Sportsnetrank PageRank'e göre

Basitçe söylemek gerekirse, Sportsnetrank, pagerank fikrine dayanır, takımlar arasındaki oyunu bir grafiğe dönüştürür, düğüm takımdır ve takımlar arasında rekor (puanlama ve kaybetme) taraftır. Ardından, her takımın güç değerlendirme puanını almak için grafikte pagerank çalıştırın. Pr değeri ne kadar büyükse, takım gücü o kadar güçlü ve kazanma oranı o kadar yüksek olur. Aşağıdaki resim NFL ligine dayanmaktadır. Düğüm ne kadar büyükse, takım o kadar güçlüdür. Taraflar ne kadar kalınsa, takımlar arasındaki boşluk o kadar büyük olur.

Oyunun sonucunu tahmin ederken, önceki maç kayıtlarına dayalı bir harita oluşturabilir ve ardından her takımın mevcut gücünü hesaplayabilirsiniz. İki takım birbirine karşı oynadığında, daha güçlü olan takımın kazanacağı tahmin edilir. İyi sonuçlar alabilecek kadar basit bir stratejidir.Yazarın orijinal sözlerine göre son teknoloji düzeyine ulaşmıştır.

Yukarıdaki resim, NFL liginin tahmin edilen sonuçları ile gerçek sonuçları arasında bir karşılaştırmadır ve gerçekten basit olmadığı görülebilmektedir.

(3) Taktik etkinlik: pick-and-roll tanımlama ve değerlendirme

Pick-and-roll (savunma) NBA'deki en yaygın taktik ve en etkili skorlama yöntemidir. Bazı araştırmacılar, yaygın pick-and-roll savunma rutinlerini otomatik olarak tanıyan bir sistem kurdu ve üzerinde deneyler yaptı. SportVU oyuncu izleme verilerini ve denetimli makine öğrenimi yöntemlerini kullanarak, dört savunma amaçlı pick-and-roll yöntemlerini ayırt etmek için bir dizi öğrenme sınıflandırıcı oluşturuldu: "over", "under" ve "double" tuzak) ," geçiş ". Özel anlam aşağıdaki gibidir:

  • Sıkıştırma: Topun olduğu savunma oyuncusu, top tutucusu ile perdeleyici arasındadır, yani perdeden geçer;

  • Baypas: Topa sahip savunma oyuncusu, top sahibi ile perdeleyici arasında değil, yani ekranın altından baypas yapıyor;

  • Savunmayı değiştir: topla savunan ve perdede savunan, savunma nesnelerini değiştirir;

  • Çift takım: Ekranda top olan savunma oyuncusu ve savunma oyuncusu tutucuyu sıkıştırır.

Daha sonra yazar, dört türün birkaç örneğini manuel olarak etiketledi ve daha fazla pick-and-roll bulmak için bir sınıflandırıcıyı daha fazla eğitip oluşturdu. Nihai tanıma sonuçları şu şekildedir: 270.823 pick-and-roll, 146.314 "sıkılmış", 69.721 "bypass edilmiş", 37.336 "re-defans" ve 17.451 "double-team". Bunların daha fazla analizi bazı ilginç sonuçlara yol açabilir:

  • Her sezonda dört tip pick-and-roll dağılımı temelde aynıdır, ancak "çift takım" oranının biraz arttığı fark edilebilir.Bu, bireyin puanlama yeteneği güçlendikçe, giderek daha fazla çift takım olacak mı?

  • b. Hangi kombinasyonlar çağırmaz?

    Aşağıdaki tablo, farklı savunma kombinasyonlarının pick-and-roll ile her turda kaybedilen puanları ve tüm oyuncularla ilgili ortakları için tur başına kaybedilen ortalama puanları karşılaştırmaktadır. Chris Paul ve Blake Griffin ortalama 1,2 puan kaybederek en kötü sıkma etkilerinden birine sahipti. Ek olarak, Ibaka ve Reggie Jackson kombinasyonu zayıf savunmalara sahip, ancak pick-and-roll savunma verimlilikleri çok yakın. [Ara söz, bu iki kombinasyon çifti artık ayrıldı, yönetici bu araştırmayı gördü mü?

    Sonuç: Spor endüstrisinde yapay zeka uygulaması yeni başladı ve hala gelişmekte olan veya gelişmek üzere olan birçok harika uygulama var. İlgilenen öğrenciler, çalışma ve araştırma için ilgili materyalleri arayabilirler. Slayt adresi:

    İş ayrıntılarını görüntülemek için orijinal metni okumak için tıklayın ve katılmanızı dört gözle bekleyin ~

    İşte Chiang Mai Yemek Haritasının yeni bir sürümü, lütfen bunun için imzalayın
    önceki
    Dolandırıcılığı okumak | Cannibal emlak ajansı: İmzaladığınızda, ev ve para artık size ait değil!
    Sonraki
    Hayatımın geri kalanında birini beklemek ve dünyanın en güzel karını izlemek istiyorum
    Bu sıradan insanların hikayeleri bize şunu anlatıyor: Hayat ne kadar çok çalışırsan, o kadar şanslısın!
    Gürültü insanları rahatsız ediyor ve güvenliği tehlikeye atıyor, netizenler: yerli yarış partisini kontrol etme zamanı
    `` Cracking DeepMind's Game Artificial Intelligence '' AI artık sadece 2 dakikalık videoda oyunlar oluşturabilir
    Hindistan, İran ham petrolüne ne kadar bağımlı? Para kıtlığının ardından Hindistan "petrol kıtlığına" düşebilir
    Beş vaka size "meşru savunmanın" tanımını söylüyor
    169.800'den! Şık ve yakıt açısından verimli olan bu ortak girişim SUV'ları kişilik dolu!
    22 Aralık akşamı, Paris'in Kokulu Sokağında güzellik her yerde
    Bir patlama duyan adam, bir ilk yardım çantasıyla dışarı fırladı ve 7 kişiyi kurtardı!
    1 milyar dolar karşılığında kullandığı metodoloji, lütfen kendinizinkini alın
    Toyota'nın 10 araba logosu var ve eski sürücüler en fazla 5 tane biliyor. Kaç tane biliyorsunuz?
    Kamu Güvenliği Bakanlığından Derece Aranıyor Emri
    To Top