Kuru ürünler New York Üniversitesi'nden Chen Xi: AlphaGo Zero teknoloji evriminin kaçınılmazlığı (PPT ile)

Bu ders, New York Üniversitesi'nden Yardımcı Doçent Doktor tarafından seçilmiştir. Chen Xi Geçenlerde 2018'de 2. Shanshu Technology AI Masters Roundtable'da yaptığım konu şu: "AlphaGo Zero Teknoloji Evriminin Kaçınılmazlığı - Makine Öğrenimi ve Karar Vermenin Organik Kombinasyonu" Konuşma.

Sahne arkası özel mesaj PPT konuşmasının tam sürümünü almak için "0822" anahtar kelimesini yanıtla ~

Chen Xi: Bugün sizlerle neden birçok pratik sorunu etkili bir şekilde çözmek için makine öğrenimi ve operasyon araştırmasının iki disiplininin birleştirilmesi gerektiğini paylaşmak istiyorum.

Bir, makine öğrenimi

Makine öğrenimi nedir? İlk olarak, bir sürü veriye ihtiyaç duyulur ve daha sonra, algoritmanın desteği olarak makine öğrenme algoritmaları, verilerin istatistiksel modellemesi, olasılık modellemesi ve veri varsayımları vardır. Makine öğreniminin yaygın olarak kullanılan uygulaması, verileri tahmin etmektir. Örneğin, yarın hisse senetlerinin fiyatını tahmin etmek Bunlar bazı temel tahminlerdir ve daha da önemlisi, makine öğrenimi yoluyla verilerdeki bazı kalıpları öğrenmek.

Makine öğrenimi, geniş bir perspektiften iki kategoriye ayrılmıştır: denetimli öğrenme ve denetimsiz öğrenme (Denetimli Öğrenme ve Denetimsiz Öğrenme). Örneğin, yüzleri tanımak için odadaki fotoğrafları kullanıyoruz ve yüzlerin nerede olduğunu belirlemek için belirli ek açıklamalar yapmak için belirli yöntemler kullanıyoruz. Şu anda buna denetimli öğrenme diyoruz. Denetimli öğrenmenin çerçevesi yukarıdaki şekilde gösterilmektedir Tahmin edilen işleve göre, makine öğreniminin özellikleri değer aralığı ile eşleştirilmiştir.

Denetimsiz öğrenme daha geniş bir alandır. Örneğin, görüntüleri sınıflandırmamız gerekir. Bu, insanların ihtiyaç ve duygularına ve makine öğrenimi yöntemlerine dayanır.

Derin öğrenme, özellikleri otomatik olarak ayıklamak için etkili bir araçtır.Örneğin, görüntülerin yapısı derin öğrenmenin yeterli özellikleri çıkarmasına izin verir. Bununla birlikte, her veri alanı derin öğrenme yoluyla etkili özellikleri çıkarmak için kullanılamaz.Örneğin, birçok finansal alanda derin öğrenme, derin olmayan öğrenme yöntemleriyle etkili bir şekilde karşılaştırılmalıdır.

2. Öğrenmeden karar vermeye

Geleneksel makine öğrenimi genellikle statik verilerle ilgilenir, ancak bu pek çok iş gereksinimini karşılamaz. Sonuçta birçok iş uygulamasının yapılması gerekir karar verme .

Yukarıdaki resim, tüm veri analizini beş aşamaya ayırır:

  • İlk aşama: Açıklayıcı ( Tanımlayıcı ), verilerin temel bir açıklaması;
  • İkinci aşama: Teşhis ( Tanı ), veriler üzerinde temel teşhis gerçekleştirin;
  • Üçüncü aşama: Keşif ( Bul ), verilerin iç modelinin araştırılması;
  • Dördüncü aşama: Tahmine dayalı ( Tahmin edilebilirlik ), olası durumları tahmin etmek için bir analiz;
  • Beşinci aşama: Kuralcı ( Özgüllük ), veriye dayalı karar verme süreci.

Gerçek dünyada, karar verme envanteri, tesis konumu, rota planlama, emtia fiyatları gibi birçok karar verme sorunuyla karşılaşacağız.

AlphaGo Zero, Go'nun büyük bir gelişimi olarak, sadece rakibi tahmin etmekle kalmaz, aynı zamanda hamleler hakkında kararlar alır. Google tasarladı derin pekiştirmeli öğrenme , Karar verme unsuruna sahiptir. Monte Carlo ağaç araması (Monte Carlo ağaç araması) , Bırakın makine ve makine öğrenmek için birbirlerine karşı oynasın. İster öğreniyor ister kararlar veriyor olsun, Simülasyon tekniği AlphaGo Zero'da da çok önemlidir.

Ticari uygulamalar için hala çok basit, bu neden? Bir Go programında, arama alanı büyük olmasına rağmen, bilgi tamamlanmıştır ve ardından amaç işlevi basit ve açıktır (kazanma veya kaybetme), işle ilgili karar verme sürecinde ise, amaç işlevi çok karmaşık olabilir.

Bu araştırma çalışması, temelde bir öneri sistemi olan Assortment optimizasyonu olarak adlandırılır.Örneğin, bir uçuş ararken, benim için en uygun maliyetli uçuşları otomatik olarak seçecektir.

Asorti optimizasyonu mu? Her şeyden önce, müşterinin satın alma davranışını anlamalıyız ve ardından seçim yapmak için seçim modelini (seçim modeli) kullanmalıyız.

MNL, Logit modelinin temel şeklidir.Bir ürün seçme olasılığı, bu ürünün verimliliğinin (kullanıcının ne kadar sevdiği), önerilen tüm ürünlerin toplam verimliliğine bölünmesiyle elde edilen 1'e (S: önerilen ürün, a: seçilen ürün, 1 : Kullanıcılar hiçbir ürünü beğenmez).

Gerçek hayatta birçok karmaşık durum vardır ve MNL her zaman geçerli bir model olamaz.

İç içe geçmiş logit modelleri önce büyük bir kategori seçer, ardından büyük kategorideki ürünleri seçer.Yukarıdaki şekilde görüldüğü gibi olasılık iki kısma ayrılır, biri süveter seçme olasılığı, diğeri ise belirli bir süveter stili seçme olasılığıdır. Çok katmanlı bir seçim süreci oluşturulmuştur.

Bir seçim modeli verildiğinde, müşterilere önerilecek en iyi ürün nasıl seçilir? Matematiksel beklenen değerini en üst düzeye çıkarmak için portföy optimizasyonu için bir S (önerilen ürün) seçiyoruz. Ancak, gerçek hayatta daha karmaşık olan sorun, kullanıcıların bir ürünü seçme olasılığını bilmemenizdir.

Ruelala ve Vipshop, hızlı tüketim malları için satış platformlarıdır.Satış süresi çok kısadır ve kullanıcıların ürünleri nasıl sevdiklerini öğrenmek için yeterli tarihsel veri yoktur. Facebook online reklamcılık yaparken milyonlarca ürün seçeneği varsa, kullanıcının her ürün için tercihini tahmin etmek imkansızdır. Bu nedenle, makine öğrenimi ile akıllı karar vermeyi birleştiren dinamik bir öneri sistemine ihtiyacımız var.

Yukarıdaki resim basit dinamik bir prototiptir.Her an kullanıcıya bir ürün önereceğimizi varsayıyoruz.Kullanıcının satın alma durumu sayesinde tüm satış aralığı bitene kadar öğrenmeye ve karar vermeye devam edeceğiz. Kullanıcının seçim olasılığını biliyorsanız statik bir optimizasyon problemi, bilmiyorsanız dinamik bir optimizasyon problemi haline getirebilirsiniz.

Algoritmanın kalitesi nasıl değerlendirilir? Akademik çevrede, Pişmanlık analizi adı verilen bir yöntem vardır: En iyi sınıflandırma ile seçilen sınıflandırmanın beklenen getirisi arasındaki ortalama farkı en aza indirin. Amacımız, bir makine öğrenimi ve karar verme algoritması oluşturmaktır, böylece zaman yeterince uzun olduğunda, getiri farkı çok küçük olur ve getiri farkının nasıl azaltılacağı.

Bu modeller çok kullanışlı olsa da, yeterince karmaşık değildir. Makine öğreniminin özü, özelliklerin çıkarılmasında yatmaktadır. Örneğin, dinamik bir Seçim Modeli yapmak için kullanıcıların ve ürünlerin özelliklerini çıkarmak için bağlamsal bilgileri kullanmak, daha iyi hizmet verebilir gerçeklik.

Wal-Mart, kullanıcıların alışveriş sepetine koyduğu ürünlere göre son ödeme işlemi sırasında ürünler önererek benzer bir çalışma yaptı.

Üç, özet

Birçok iş problemi son derece karmaşıktır. Sorunun temel yapısını derinlemesine anlamalıyız ve makine öğrenimi organik olarak karar verme ile birleştirilmelidir. Yalnızca makine öğrenimi sürecini, rastgele modellemeyi ve optimizasyonu yumuşatarak büyük verileri daha iyi anlayabilir ve işleyebiliriz.

İçerik bitirme: Chen Long

Sahne arkası özel mesaj PPT konuşmasının tam sürümünü edinmek için "0822" anahtar kelimesine yanıt verin ~

Lütfen yeniden yazdırmak için THU verilerini belirtin

Operatör: Ran Xiaoshan

Filipin asistanının bu hamlesini fark eden Çin Ulusal Olimpiyatları tarafından dördüncü gol atıldığında: Gerçekten çaresizdim.
önceki
Günde 600 milyondan fazla görüntülemeye sahip "Yanxi Sarayı Stratejisi" aracılığıyla video sitesi düzenini izleyin (kod eklidir)
Sonraki
GIF-Çin Ulusal Olimpiyatları çılgınlık! 9 dakikada 3 gol, Filipinler bir anda havaya uçtu
Envanter 2018'de küresel yapay zeka alanında çığır açan ilk 10 teknoloji (raporla birlikte)
Disney ile tanışın! İki eski Çin Süper Ligi dış yardımları Tianjin'den Almanya'ya dostluk getirdi!
Tarihin kesişme noktasında bulunan "Evrenin Kralı" Goldman Sachs, tamamen makine otomasyonuna doğru ilerlemek zorundaydı
Sıfırdan bire | Yapay zekaya giriş için 14 temel kitap (PDF bağlantısı ile)
Wu Lei'ye geçebilen tek Çinli de 32 yaşında Milli futbol takımının son orta saha oyuncusu mu?
1 yılda 100.000 satıldı! "Yeniden doldurulabilir valiz" Dışarıda B Serisi finansman olarak 20 milyon ABD Doları alıyor
Yangın Propagandası Ayı vatandaşları sadece 19 saniyede "yangın kaçışını" yerinde yaşıyor
Özel | Makine öğrenimi teknolojisi altında sentetik verilerin performansı hakkında bir makale
Korkunç fiziksel uygunluk! Yarışın 90 dakikasından sonra, Sun Xingyun dışarıda tek durakta sollama da yapabilir!
Yapay zekanın son sözü ne?
Tayland teknik direktörü Çin Kupası'ndan sonra ayrılacak mı? Milli futbol takımının sertifikasız bir antrenöre yenildiği ortaya çıktı!
To Top