Kağıt PPT:
Uzun zaman önce spor temalı bir film "Penalty Kick" izledim, İngilizce adı MoneyBall. Film, Blatt Pitt'in oynadığı takım genel menajerinin ve Yale Üniversitesi Ekonomi Bölümü'nden mezun olan bir veri analistinin hikayesini anlatıyor.Beybol maçı verilerinin madenciliği ve analizi sayesinde, Taobao Ligi'ndeki oyuncular uygun maliyetli ve başarıya ulaşmak için güçlü bir takıma sahip. Şanlı işler. Film, ekibi geliştirmek için verilerin kullanılmasının değerini ve önemini tam olarak ortaya koydu ki bu çok etkileyici. Her zaman kullanılan teknik yöntemler hakkında bilgi edinmek istemişimdir ve KDD 2017'deki "Athlytics: Data Mining and Machine Learning for Sports Analytics" konusu gerçekten uygun.
Bu ders KonstantinosPelechrinis (Pittsburgh Üniversitesi), EvangelosPapalexakis (California Üniversitesi, Riverside) ve Benjamin Alamar (ESPN) tarafından ortaklaşa yürütülmektedir. Akademi + endüstri modeli pratikliği garanti eder. Konunun tamamı hala araştırma odaklı ve birçok matematiksel formül var, ancak çözülecek problemler ve yöntemler hala nispeten sığ. Bunun iki nedeni olabilir: 1. Bu alandaki insanlar daha önce yeterince dikkat etmemişlerdi ve çoğu profesyonel izcilerin deneyimine güveniyorlar; 2. Bu alan çok değerli (yetkili kuruluşlar, spor veri analizi pazarının 2021 yılına kadar 4,7 milyar olacağını tahmin ediyor ABD doları) Daha profesyonel ve daha değerli yöntemler açıklanmamaktadır. Belirli yöntemler tek tek tekrarlanmayacaktır. Paylaşmak için ilginç üç tane seçin. Daha fazlası için lütfen ppt bağlantısına bakın.
(1) Oyuncu gücünün değerlendirilmesi: revize edilmiş artı-eksi endeksi Artı eksi
Pozitif veya negatif değer, oyuncunun gücünü değerlendirmek için ana göstergedir. Gösterge ne kadar yüksekse, oyuncunun yeteneği o kadar güçlüdür. Örnek olarak Anthony-5'i alalım, Anthony sahadayken takım 5 puan kaybetti. Bununla birlikte, bu gösterge sadece, açıkça mantıksız olan, oyuncuların skorları ve sahadaki puanları arasındaki farkı dikkate alır. Mesela sahaya liderlik ederken, bu başarılı işbirliğine herkesin olumlu katkı yaptığı anlamına gelmez, geri adım atmak, herkesin olumlu bir katkısı olsa bile, düşük katkısı ve düşük yeteneği olanları bu tür verilerle ayırt etmek zordur. .
Her oyuncunun zafere katkısının nasıl ayırt edileceği önemli bir konudur. Araştırmacılar her tur regresyonunu modellemek için doğrusal modeller kullanır. Bağımlı değişken (DV) her turun puanıdır ve bağımsız değişken (IV) tüm oyunculardır. Regresyonun sonucu, her oyuncunun bir ağırlığa sahip olacağıdır ve bu ağırlık, oyuncunun zafere katkısını temsil eder. Buradaki bağımsız değişkenin tasarımı çok zekice.Her tur için sahadaki oyuncularımız 1 ile, rakibin oyuncuları -1 ile temsil edilir ve diğer oyuncular 0 ile temsil edilir. Bunun bir etkisi bu turun skoru ve bizim varlığımızdır. Oyuncular arasında pozitif korelasyon var, sahadaki rakiplerle negatif korelasyon var ve saha dışı oyuncularla hiçbir ilgisi yok. Birden fazla model öğrenme turundan sonra, her oyuncunun kendi ağırlığı vardır. Oyuncu ne kadar büyükse, oyuncunun zafere katkısı o kadar artar. Aynı zamanda, her tur sahadaki oyuncuları ve diğer oyuncuları dikkate aldığından Oyuncuların etkisi otomatik olarak dikkate alınır.
Yukarıdaki resim NBA 07-08 sezonunun en iyi 5 oyuncusunu gösteriyor.Çok güvenilir görünüyorlar ve çoğu taraftarın algısı ile oldukça tutarlılar.
(2) Oyunun sonucunu tahmin edin: Sportsnetrank PageRank'e göre
Basitçe söylemek gerekirse, Sportsnetrank, pagerank fikrine dayanır, takımlar arasındaki oyunu bir grafiğe dönüştürür, düğüm takımdır ve takımlar arasında rekor (puanlama ve kaybetme) taraftır. Ardından, her takımın güç değerlendirme puanını almak için grafikte pagerank çalıştırın. Pr değeri ne kadar büyükse, takım gücü o kadar güçlü ve kazanma oranı o kadar yüksek olur. Aşağıdaki resim NFL ligine dayanmaktadır. Düğüm ne kadar büyükse, takım o kadar güçlüdür. Taraflar ne kadar kalınsa, takımlar arasındaki boşluk o kadar büyük olur.
Oyunun sonucunu tahmin ederken, önceki maç kayıtlarına dayalı bir harita oluşturabilir ve ardından her takımın mevcut gücünü hesaplayabilirsiniz. İki takım birbirine karşı oynadığında, daha güçlü olan takımın kazanacağı tahmin edilir. İyi sonuçlar alabilecek kadar basit bir stratejidir.Yazarın orijinal sözlerine göre son teknoloji düzeyine ulaşmıştır.
Yukarıdaki resim, NFL liginin tahmin edilen sonuçları ile gerçek sonuçları arasında bir karşılaştırmadır ve gerçekten basit olmadığı görülebilmektedir.
(3) Taktik etkinlik: pick-and-roll tanımlama ve değerlendirme
Pick-and-roll (savunma) NBA'deki en yaygın taktik ve en etkili skorlama yöntemidir. Bazı araştırmacılar, yaygın pick-and-roll savunma rutinlerini otomatik olarak tanıyan bir sistem kurdu ve üzerinde deneyler yaptı. SportVU oyuncu izleme verilerini ve denetimli makine öğrenimi yöntemlerini kullanarak, dört savunma amaçlı pick-and-roll yöntemlerini ayırt etmek için bir dizi öğrenme sınıflandırıcı oluşturuldu: "over", "under" ve "double" tuzak) ," geçiş ". Özel anlam aşağıdaki gibidir:
Sıkıştırma: Topun olduğu savunma oyuncusu, top tutucusu ile perdeleyici arasındadır, yani perdeden geçer;
Baypas: Topa sahip savunma oyuncusu, top sahibi ile perdeleyici arasında değil, yani ekranın altından baypas yapıyor;
Savunmayı değiştir: topla savunan ve perdede savunan, savunma nesnelerini değiştirir;
Çift takım: Ekranda top olan savunma oyuncusu ve savunma oyuncusu tutucuyu sıkıştırır.
Daha sonra yazar, dört türün birkaç örneğini manuel olarak etiketledi ve daha fazla pick-and-roll bulmak için bir sınıflandırıcıyı daha fazla eğitip oluşturdu. Nihai tanıma sonuçları şu şekildedir: 270.823 pick-and-roll, 146.314 "sıkılmış", 69.721 "bypass edilmiş", 37.336 "re-defans" ve 17.451 "double-team". Bunların daha fazla analizi bazı ilginç sonuçlara yol açabilir:
Her sezonda dört tip pick-and-roll dağılımı temelde aynıdır, ancak "çift takım" oranının biraz arttığı fark edilebilir.Bu, bireyin puanlama yeteneği güçlendikçe, giderek daha fazla çift takım olacak mı?
b. Hangi kombinasyonlar çağırmaz?
Aşağıdaki tablo, farklı savunma kombinasyonlarının pick-and-roll ile her turda kaybedilen puanları ve tüm oyuncularla ilgili ortakları için tur başına kaybedilen ortalama puanları karşılaştırmaktadır. Chris Paul ve Blake Griffin ortalama 1,2 puan kaybederek en kötü sıkma etkilerinden birine sahipti. Ek olarak, Ibaka ve Reggie Jackson kombinasyonu zayıf savunmalara sahip, ancak pick-and-roll savunma verimlilikleri çok yakın. [Ara söz, bu iki kombinasyon çifti artık ayrıldı, yönetici bu araştırmayı gördü mü?
Sonuç: Spor endüstrisinde yapay zeka uygulaması yeni başladı ve hala gelişmekte olan veya gelişmek üzere olan birçok harika uygulama var. İlgilenen öğrenciler, çalışma ve araştırma için ilgili materyalleri arayabilirler. Slayt adresi:
İş ayrıntılarını görüntülemek için orijinal metni okumak için tıklayın ve katılmanızı dört gözle bekleyin ~