[Titanbai] Li Jian, Tsinghua Üniversitesi: Uzay-Zamansal Büyük Veri Analizinde Derin Öğrenme Uygulaması

"Titanbai" çevrimiçi sınıfının 32. sayısında, yalnızca profesyonel kullanıcılar ve ödeme yapan Titanium Media Pro kullanıcıları için, üç Titanium misafirini makine öğrenimi hakkındaki düşüncelerini paylaşmaya davet ettik. Bu sayının titanyum konuklarından Li Jian, yardımcı doçent, doktora süpervizörü ve Tsinghua Üniversitesi Shanshu Bilim ve Teknoloji Enstitüsü bilim insanı , Ana akım uluslararası konferans ve dergilerde 60'tan fazla profesyonel makale yayınladı ve VLDB 2009 ve ESA 2010 En İyi Bildiri Ödüllerini kazandı. Tsinghua 211 Temel Araştırma Genç Yetenek Destek Programı ve Eğitim Bakanlığı'nın Yeni Yüzyıl Yetenek Destek Programı'na seçildi. Araştırma yönleri temel olarak algoritma tasarımı ve analizi, makine öğrenimi ve derin öğrenme, rastgele optimizasyon ve kombinatoryal optimizasyondur.

Bu makale Profesör Li Jian'ın paylaşımına dayanmaktadır. Tam metnin görüntülenmesi için profesyonel bir Titanium Media kullanıcısı olması gerekir . İletişim kurmak ve daha profesyonel veri ve bilgileri görüntülemek için dokuz profesyonel Titanium grubuna girmek için, Titanium Media profesyonel kullanıcısı olarak kaydolmak için bağlantısını tıklayın.

Aşağıdakiler, Li Jianın Titanium ile ilgili paylaşımına dayanmaktadır:

Herkese merhaba, ben Li Jian. Şu anda Tsinghua Üniversitesi Disiplinlerarası Bilgi Araştırmaları Enstitüsü'nde yardımcı doçent ve doktora süpervizörüyüm ve Shanshu Technology'nin bir bilim adamıyım. Herkesle tanışmak ve burada paylaşmak güzel.

Önce kısa bir kişisel giriş yapmama izin verin. Tsinghua Üniversitesi Disiplinlerarası Bilgi Enstitüsünden geliyorum, çünkü enstitümüz 2011 yılında kuruldu ve zaman nispeten kısa ve bazı arkadaşlar bunu iyi bilmiyor olabilir. Enstitümüz, Çin'deki Turing Ödülü'nü tek kazanan Akademisyen Yao Qizhi tarafından kurulmuş olup, Turing Ödülü bilgisayar bilimindeki en yüksek ödüldür. 2005 yılında Princeton Üniversitesi'nden istifa etti ve Tsinghua Üniversitesi Bilgisayar Bilimleri Deney Sınıfı olarak da bilinen Çatal Akademimizin lisans sınıfı olan Tsinghua Üniversitesi'nde Yao Sınıfını kurmak için tam zamanlı olarak Çin'e döndü. Gelecekte, Chayuan ve Yao Sınıfından sınıf arkadaşlarınız ve öğretmenlerle sık sık karşılaşabilirsiniz.Umarım onlara iyi bakabilirsiniz.

İşbirliği yaptığım Shanshu Teknolojisi, Stanford Üniversitesi profesörü Ye Yinyu ve birkaç Stanford Üniversitesi Doktora Doktoru Luo Xiaoqu, Ge Dongdong ve Wang Zizhuo tarafından ortaklaşa kuruldu. Profesör Ye, Von Neumann Ödülü'nü, Von Neumann Ödülü, yöneylem araştırması ve yönetimi alanındaki en yüksek ödüldür. Shanshu Technology, işletmelere optimizasyon ve makine öğrenimi algoritma motorları, tedarik zinciri optimizasyonu, risk yönetimi gibi finansal yönler, gelir yönetimi ve fiyatlandırma sorunları dahil olmak üzere temel olarak büyük veri çözümleri sağlar. Algoritma motorunda Shanshu, şirketlerin makine öğrenimi çözümleri geliştirmelerine yardımcı olabilir.Geliştirdikleri makine öğrenimi motoru optimizasyon algoritması, şu anda bağımsız sürümde piyasada bulunan açık kaynaklı yazılımdan onlarca kat daha hızlıdır.

Benim kişisel araştırma yönüm teorik bilgisayar bilimi, özellikle algoritma tasarımı. Son yıllarda bazı makine öğrenimi ve derin öğrenme çalışmaları da yaptım. Bir süre sonra, mekansal-zamansal büyük veri analizinde derin öğrenmenin uygulanmasına yönelik araştırma çalışmalarımızdan bazılarını ve bazı kişisel düşüncelerimi ve deneyimlerimi sizlerle paylaşacağım.

Mekansal-zamansal büyük veri nedir?

Herkesin derin öğrenme ile ezildiğine inanıyorum, görüntü tanıma, konuşma tanıma, Go, poker gibi birçok alanda büyük başarılara imza attı ve birçok alanda devrim niteliğinde değişikliklere neden oldu. Bugün hakkında konuşacağım şey yukarıdaki listeden farklıdır ve mekansal-zamansal büyük veri analizine odaklanacağım.

Mekansal-zamansal büyük veri nedir? Lütfen aşağıdaki resme bakın. Çevrimiçi araç-selamlama-Didi, Uber sipariş verileri, sosyal ağ verileri ve nüfus yoğunluğu ve nüfus gibi daha fazla makro ulusal ekonomik veri gibi GPS konumlandırma verileri gibi birçok mekansal-zamansal büyük veri türü vardır. Göç verileri. Bu verilerin ortak özelliği Hem zaman hem de mekan özelliklerine sahiptir .

Her zaman serisinin farklı bir uzay tarafından oluşturulduğu çoklu zaman serilerini düşünebiliriz. Her zaman serisinin kendi zamana bağlı korelasyonu vardır ve bu zaman serilerinin de bazı uzamsal korelasyonları vardır. Uzamsal-zamansal büyük verinin uzamsal ilişkisi, görüntünün uzamsal ilişkisine biraz benzer, ancak pek çok farklılık vardır. İkinci ilişki çok tekdüze veya dönüşümsel değişmezliktir. Örneğin, bir köpeğin görüntüsü buraya yerleştirilir. Bu bir köpeğin görüntüsü. Onun veya o köpeğin görüntüsünü kaydırın. Uzamsal-zamansal büyük veri için bu farklıdır: Örneğin, Pekin'deki bir yol ve Tianjin'deki bir yol, hatta ikinci çevre yolundaki bir yol ve üçüncü çevre yolundaki bir yol tamamen farklı performans gösterebilir.Bunun içinde başka birçok faktör vardır. Etki altında. Örneğin trafik. Hava durumu, PM2.5, tatiller ve diğer özel olaylar trafiği etkiler ... Bunlar tahminlerimizi etkileyebilir. Birden çok etkileyen faktör birçok veri kaynağına yol açabilir ve bu veri kaynaklarının nasıl entegre edileceği de büyük bir zorluktur. Diğer bir fark, uzay-zamansal büyük verilerin çok gürültülü olabilmesidir.

Etkileyen birçok farklı faktör olduğu için, bazı problemler hakkında insanların bile yargıya varması zordur.Bu gördüğümüz görüntü sınıflandırma ve makine çevirisinden çok farklı çünkü en azından bu problemler için daha iyi hale getirebiliriz. , İnsanların uzay-zamansal büyük verinin tahmin problemini yargılaması zordur, ancak makine öğrenimi daha iyisini yapabilir.

Uzay-zamansal büyük veri madenciliği için derin öğrenmenin uygulanmasındaki ilk zorluk, zaman ve uzay arasındaki ilişkinin nasıl anlaşılacağıdır. Dahil olan birkaç soru var: Birincisi, ne tür bir öğrenme çerçevesi kullanıyorsunuz, denetimli öğrenme veya denetimsiz öğrenme, çok görevli öğrenme, çevrimiçi öğrenme, gelişmiş öğrenme ... Birçok yöntem var, hangi çerçeveyi kullanıyorsunuz. Burada, görüntüler için CNN kullanmak gibi çok olgun bir yaklaşım yok; ikincisi, derin öğrenmeyi kullanmak istiyorsanız ne tür bir ağ yapısı daha iyidir; üçüncüsü, çok fazla veri kaynağı olduğunu ve farklı veri kaynaklarının olacağını söyledim. Farklı faktörler üretin, bu farklı nitel faktörleri entegre edebilen bir ağı nasıl kurarız ve bu ağın kolayca genişletilebileceğini ve kolay uygulanabileceğini umarız; dördüncü olarak, bazı sesler veya eksik verilerle uğraşmak zorunda kalabiliriz sorun.

Uzay-zamansal büyük veride derin öğrenmenin dört klasik uygulaması

  • Çevrimiçi araç selamlamasının arz ve talebinin tahmini

Görev: Bir bölgedeki kaç çevrimiçi araç çağırma siparişi gelecekte karşılanmayacak?

İşimiz aslında bir süre önce Didi'nin büyük veri yarışmasına dayanıyor. Didi, belirli bir şehirdeki tüm siparişlerin yanı sıra hava durumu, PM2.5 ve yol koşulları gibi diğer bilgileri de verdi. Spesifik görev, önümüzdeki 15 dakika içinde, kendisi tarafından verilen alanların her birinde, yani talep eksi arzda kaç siparişin karşılanmayacağını tahmin etmektir.

Bu soru Didi için çok önemlidir, çünkü bir yerde karşılanmayan çok sayıda sipariş varsa, arz ve talebi dengelemek için önceden bazı taksiler gönderebilir. Bunların fiyatlandırılmasında da önemli bir rol oynar. Böyle bir problem, tipik bir uzay-zamansal büyük veri tahmin problemidir. Bu düzen hem zaman hem de uzay niteliklerine ve diğer birçok faktöre sahiptir. Bu problem basit değil.Çok veri kaynağı var ve bazı veri kaynaklarında ciddi eksik veriler var.

Pek çok zorluğun olduğunu bulduk, örneğin aşağıdaki şekilde bu iki farklı lokasyonun talep modelleri çok farklı. Üstelik ani talep artışı gibi beklenmedik olaylar da var, bu ani artışı kavramak da zor.

Daha yaygın olarak kullanılan geleneksel yöntemler doğrusal regresyon, lojistik regresyon, destek vektör seviyesi, gradyan artırma, rastgele orman vb .'dir. Pratik uygulamalarda daha iyi sonuçlar elde etmek için çok önemli bir görev, birçok özelliği yapmaktır. Mühendislik birçok öngörücü özelliği, hatta bazen çok garip özellikleri ortaya çıkarmaktır.Bu özellikler, tahmin için yardımcı olabilecek faktörlerdir. Oldukça rekabetçi bir etki elde etmek için, genellikle bu farklı faktörlerin çoğunu yapmanız gerekir ve bazı faktörler aslında mantıksız görünür veya gerçeği bilmiyor, ancak bazen belirli etkileri vardır. Genel olarak, bu tür bir makine öğrenimi yarışmasına katılan çoğu takım, gradyan artırma yöntemlerini kullanır.Birçok takım birçok yapay faktör, hatta bazıları yüzlerce faktör oluşturmuştur. Derin öğrenmeyi kullanma konusundaki asıl amacımız, kendi özellikleri çıkarma yeteneğine sahip olmasıdır. Özellik mühendisliğinin manuel iş yükünü azaltmayı umuyoruz. Çok rekabetçi bir tahmin doğruluğu elde etmek için yalnızca bazı temel özellik mühendisliğinin yapılabileceğini umuyoruz. derece.

Aynı zamanda, sipariş verileri, tarih verileri, konum verileri, hava durumu ve diğer veriler gibi tümü farklı kalitede ve bazıları sayısal olan farklı veri türlerini kolayca entegre edebilmemiz için nispeten kullanımı kolay bir çerçeve oluşturmayı da umuyoruz. Evet, bazıları türler, bilgilerini çok kolay entegre etmenin bir yolu olmalı. Ek olarak, her veri kaynağındaki farklı verilerin farklı tahmin yetenekleri vardır ve içindeki tüm bilgileri çıkarmanız gerekir. Üstelik bu modüller de daha esnek olmayı ümit eder.Ona modüller ekleyebilir, yani veri kaynakları ekleyebilirsiniz.Bazen bazı bilgiler gereksiz bilgi olabilir ve yeni öngörü kabiliyetleri sağlamaz. Bu modül eklense bile olmayacaktır. Doğruluğunuzu artıracak, ancak aynı zamanda doğruluğunuzu etkilemeyeceğini umuyorsunuz.

Aşağıdaki resim, daha sonra yapacağımız derin öğrenme için geniş bir ağ çerçevesinin şematik bir diyagramıdır. Gördüğünüz gibi, birkaç büyük modülümüz var ve her modül farklı veri türlerini işliyor. Sipariş bölümü sipariş verilerini işliyor, Çevre bölümü yol koşulları, hava durumu vb. Gibi çevresel bilgileri işliyor ve Tanımlama bölümü işlem süresidir ve konum kimliği tahmin etmek istediğimiz zaman ve konumdur. Sonunda uçtan uca bir model elde ettik, bu da bu ham verilerin doğrudan basit işlemesini ve istatistiklerini yapabileceğimiz ve daha sonra bu ağa girebileceğimiz ve ardından bu ağın farklı veri kaynaklarından verileri alacağı anlamına geliyor. Tahmin yeteneği hakkında bilgi ve son olarak daha doğru bir tahmin verilir.

Burada küçük bir hile kullandık, bu, farklı modüller arasında artık bir bağlantı kullanmak, yani artığın bağlantısı. Bu bağlantı, derin artık ağın çalışmasından ilham alıyor. Derin artık ağ, dün Titanium'da yayınlandı. Paylaşım sırasında Dr. Tao Qin, Microsoft Research Asia tarafından yapılan iyi bilinen bir çalışma olan (ilgili makale: de bahsetti. Bu artık bağlantıyı eğitim için kullanabilirler. Yüzlerce hatta binlerce derin öğrenme ağı. Artık bağlantımız onların çalışmalarından ilham alıyor, ancak amacımız farklı. Birincisi, onlarınki ile aynı olan optimizasyonu kolaylaştırmak. Ancak başka bir nokta, bu modülleri eklemeyi ve silmeyi kolaylaştırmayı umuyoruz. Örneğin, şimdi bir modül eklerseniz, onu doğrudan eklersiniz. Örneğin, tahmin bilgisi olmayan bir modül vardır.Aslında, sıfır ağırlıklı bir katmana eşdeğerdir, bu da doğrudan bu modülden atlanan bilgiyle eşdeğerdir. Öngörü yeteneğinizi etkiler.

Her modül için farklı tasarım yöntemlerimiz mevcuttur Aşağıdaki resim sipariş verilerimizin kaba bir yapısıdır. Bu verileri işlemek için birkaç tipik farklı veri türü için daha yaygın ve kullanımı kolay birkaç ağ yapısı tasarlamayı umuyoruz.

Ek olarak, gerçek durumlarda Pazartesi günü, Salı günü siparişler ve Pazar günü siparişler tamamen farklı olabilir. Bunun bir yolu, bir modeli eğitmek için Pazartesi günkü verileri almak ve bir modeli eğitmek için Salı gününden itibaren verileri almaktır. Yaklaşımımız, hepsini eğitim için bir araya getirmek, ancak onlara her gün farklı bir ağırlık vermektir. Bu ağ Bu ağırlıkları otomatik olarak öğrenecek.

Aşağıdaki resim sinir ağımızın tahmin etkisidir.Diğer geleneksel yöntemlerle karşılaştırıldığında aynı özellikleri kullanıyoruz. Ağımızın önceki bir versiyonu Didi tahmin yarışmasına katıldı. 1.600'den fazla ekip katıldı ve biz ikinciliği kazandık. Ve bildiğimiz kadarıyla, ilk on takımdan sadece birimiz derin öğrenme yöntemlerini kullanıyor. Dolayısıyla, mekansal-zamansal büyük veri tahmini açısından, derin öğrenme hala büyük bir potansiyele sahiptir. Rekabetten sonra, bu ağın modülerliğini, kullanım kolaylığını ve doğruluğunu daha da geliştirdik.

Aşağıdaki resim arz eksi talep eğrisini göstermektedir.Gördüğünüz gibi, ani bir taksi yolculuğunun zirvesini gösteren birçok ani zirve var.Örneğin, beklenmedik bir olay geliyor ve aniden bu yerde çok sayıda taksi yolculuğu oluyor. Millet, sonuç vurulmaz, zirve olur. Noktalı çizgi gerçek değerdir, mavi çizgi bizim tahminimizdir ve kırmızı çizgi herkes tarafından yaygın olarak kullanılan gradyan artırma yöntemiyle tahmin edilen değerdir. Gördüğünüz gibi, sinir ağlarının bu zirveyi yakalama yeteneği nispeten güçlü.

Aynı zamanda bu teknolojinin arz ve talep ve trafik tahmini gibi diğer konulara da uygulanabileceğine inanıyoruz. Shanshu Technology şu anda tedarik zinciri problemini çözmek için büyük bir yerel lojistik şirketine yardım ediyor.Akış tahmini de bunun çok önemli bir parçası. Shanshu'nun bir bilim insanı olarak, böyle bir problemi birlikte çözmeye de yardımcı oluyorum. Derin öğrenme, bu sorunu çözeceğine inandığımız çok iyi bir çözüm.

  • Seyahat süresi tahmini

Görev: Belirli bir rota ve hareket saati için hedefe ulaşmak için geçen süreyi tahmin edin

Bu görev özellikle, başlangıç noktası olarak bir nokta, bitiş noktası olarak başka bir nokta ve başladığınız zamanı vermenizdir.Bu yolu izlemenizin ne kadar süreceğini tahmin etmeliyiz. Aslında, Baidu Maps ve Didi gibi uygulamaların şu anda bu tür işlevleri vardır. Mevcut seyahat süresi tahmini o andaki yol koşullarına dayanmaktadır, ancak Tsinghua'dan Chaoyang'a seyahat edersek ve rota görece uzunsa, yolun belirli bir bölümü o sırada nispeten sıkışık olabilir, ancak oraya gittiğimizde artık engellenmiş değildi. Gerçek seyahat süremiz o zamanki tahmin edilenden daha kısaydı. Bu nedenle, tahminlerde bulunmak için yalnızca mevcut yol koşullarını kullanmak yerine tahminlerde bulunmak için makine öğrenimi yöntemlerini kullanmayı düşünüyoruz.

Bir süre önce veri kalesi büyük veri tahmin yarışması vardı. Bu oyunda, verilerin önceki arz ve talep tahminleriyle pek çok benzerliği vardır, ancak önemli bir fark vardır, o da yörünge verilerini dikkate almaktır. Yani, eğitim verileri birçok geçmiş sürüş yörüngesini içerir, bu yörüngeler GPS noktalarıdır ve bu noktaların zaman ve uzay nitelikleri vardır.

Aşağıdaki resim yaklaşık ağ yapımızdır. Bu yapı öncekine biraz benziyor ve aynı zamanda modüler, yani her bir farklı veri türünü işlemek için bir modülümüz var. Buradaki önemli bir fark, yörünge verilerini işlemek için yeni bir modül olması (şeklin sağ üst köşesinde), iki katmanlı bir LSTM yapısı ve az önce bahsedilen artık ağ bağlantısı gibi diğer bazı teknikleri kullanmamızdır. Modülleri bağlamak için bu tür hileler.

Aşağıdaki resim derin sinir ağımızın tahmin etkisidir.Sonunda bu yarışmada üçüncülüğü kazandık. İlk olmasa da beklenen sonuçların elde edildiğine inanıyoruz. Öncelikle diğer takımlardan çok farklı olan özellik mühendisliği için çok fazla enerji harcamadık. Ek olarak, modüler tasarımımızın daha çok yönlü olduğunu düşünüyorum. Ek olarak, doğruluk oranımız da oldukça rekabetçi ve ilk birkaçının doğruluk oranları çok çok yakın.

  • Mağaza konumu

Görev: bir mağazanın nerede açılacağını tahmin etmek daha iyidir

Bu proje için derin öğrenmeyi kullanmadık, ancak bu mekansal-zamansal büyük veriyi uygulamanın güzel bir örneğidir. Bu, Baidu'nun Büyük Veri Araştırma Enstitüsü ile işbirliği yaptığımız bir projedir. Baidu mobil terminalinden gelen verileri ve Baidu Nuomi ve Baidu Haritalar'dan bazı verileri kullanır. Ana amacımız mağazayı bulmaktır. Örneğin bir kahve dükkanı açmak istiyorsanız, dükkanı nerede açacağınızı seçmenize yardımcı olacağız.

Temel aldığımız fikir, kabaca ilk önce bu farklı konumların arz ve talebini tahmin etmektir.

(Aşağıdaki tam metin yalnızca Titanium Media'nın profesyonel kullanıcılarına açıktır, Titanium Media Professional Edition'ı kaydetmek için bağlantısını tıklayın)

...

Bu projeyi bitirdikten sonra biraz saha araştırması yaptık. Aşağıdaki resimde bir konumun Haidilao'yu açmak için uygun olduğunu tahmin ediyoruz. Aslında, bu işi yapmadan iki ay önce bir Haidilao mağazası açtık, bu da bizim tahmin ettiğimiz yere çok yakın:

Aşağıdaki resim bir Starbucks örneğidir. Yeni açılan asıl nokta, tahmin ettiğimiz yerden sadece 200 metre uzaklıkta:

  • Tahmin ziyareti

Görev: Bir lokasyonda, hangi mağazaya gireceksiniz

Kullanıcının mobil terminalinde çok sayıda GPS verisine sahibiz, mağazada Wifi'da oturum açmayla ilgili bazı verilerimiz ve Baidu Nuomi ile ilgili diğer verilerimiz var. Amacımız ona mevcut konumunu vermek ve gerçekte nereye gittiğini tahmin etmek istiyoruz. Dükkan.

Bunun oldukça basit olduğunu düşünebilirsiniz, konumu zaten biliyorsunuz ve hangi mağazaya gittiğinizi bilmiyorsunuz ama aslında o kadar basit değil mesela Joy City'ye giderseniz içeride çok sayıda mağaza var. Sadece kaba bir GPS adresi biliyorsunuz, bunu nasıl tahmin edebilirsiniz? Tahminimizin temeli aslında bu kullanıcının geçmiş bilgileridir. Bu kullanıcı geçmişte bazı mağazalara gitmiş olabilir ve gelecekte benzer mağazalara da gidebilir. Bazı kullanıcıların ve bazı kullanıcıların yörüngesi gibi bazı ilişkiler de vardır. Benzer ve alakalı, bu tür bilgiler de tahminlerde bulunmamıza yardımcı olacaktır.

Bu tahmin için derin bir sinir ağı da kullandık.Yörünge bilgisini öncekine benzer şekilde işleyen bir modül uyguladık ve sonunda daha iyi sonuçlar elde ettik. Aşağıdaki resim, yöntemimizin tahmininin doğruluğunu gösterir ve üçü, üçünü ne kadar doğru tahmin ettiğimizi temsil eder. Birini tahmin etmek temelde yaklaşık% 50'lik bir doğruluk sağlayabilir ve beşi tahmin ederse,% 80'lik bir doğruluk elde edebilir.

Uzay-zamansal büyük verinin diğer bazı araştırma yönleri

Diğer ilgili konulardan ve derin öğrenmeden sonra ne yapmayı planladığımızdan kısaca bahsedeyim. Bunlardan biri çevrimiçi öğrenme ve gelişmiş öğrenmedir. Az önce söylediğim şey, analiz ve tahmin için uzamsal-zamansal büyük veriyi kullanmaktır.Gerçek dünya uygulamalarında, tahmin sadece karar vermemize yardımcı olur. Şimdi genel yöntem tahmin ve karar vermeyi ayırmaktır. Önce tahminlerde bulunur, sonra kararlar veririz. Karar verme genellikle bir optimizasyon problemidir.

fakat Şimdi, öngörü ve karar verme şeklindeki iki şeyi birleştirmek için çevrimiçi öğrenmenin ve gelişmiş öğrenmenin güçlü araçlarını kullanmak istiyoruz. . Ayrıca, çevrimiçi öğrenme, bu tahmin ve karar verme arasındaki ilişkiyi alabilir. Genel olarak konuşursak, elbette, tahminimiz ne kadar doğru olursa o kadar iyidir. Ama aslında, bazen ne kadar doğru olduğunu tahmin etmenize gerek kalmaz ya da her şeyden çok sorunun belirli bir yönü için iyi tahminlere sahip olursanız, zaten iyi kararlar verebilirsiniz.

Çevrimiçi öğrenmede çok meşhur bir soru var: Uzman sorusu Yani bir oyunun T turu ve N farklı uzmanı olduğunu varsayalım.Her uzman bize her turda farklı önerilerde bulunacak.Her turda hangi uzmanı dinleyeceğimize karar vermeliyiz. Ancak uzman önerilerde bulunduğunda, önerisinin iyi mi kötü mü olduğunu bilmiyorduk. Sadece bu uzmanın daha önce yaptığı önerilerin iyi mi kötü mü olduğunu biliyoruz. Çevrimiçi öğrenim, bize her turda hangi uzmanın dinleneceğini söyleyecektir. Sonunda, nasıl bir etki elde etmek istiyoruz? Bunu tüm T turunda başarabiliriz, performansımız en iyi uzmana benzer olabilir.

Aşağıdaki resim olan uzman sorusunun bir çeşidi vardır. Bu resimdeki kişi çok ünlü bir bilgi teorisyeni, adı birkaç yıl önce vefat eden Thomas Cover. "Evrensel Portfolyolar" adlı çok ünlü bir makalesi var. Evrensel portföy . Bununla ilgili sorun nedir? Aslında uzman sorusu ile çok alakalı, aslında herkesin ilgilendiği bir sorunun hisse senedi portföyü olduğunu düşünüyor, yani şimdi N hisse senedi olduğunu varsayıyorum, bu hisse senedine nasıl yatırım yapabilirim? Yatırımım. Amaç, nihai sonucumu en iyi hisse senedinden daha kötü yapmak değil.

Thomas Cover, çok akıllı bir çarpma ve ağırlık ayarlama yöntemi kullanıyor ve ardından farklı hisse senedi verileri arasında bir yatırım portföyü oluşturuyor. Aslında farklı hisse senedi verileri de bir tür mekansal-zamansal büyük veri olarak değerlendirilebilir, yani stoklarımızın her biri bir zaman serisidir ve aynı zamanda farklı hisse senetleri arasında mekansal bir korelasyon vardır.Örneğin, aynı sektördeki hisse senetlerinin performansının belli benzerlikleri vardır. , Farklı sektörlerin bağımsızlığı nispeten güçlüdür, bu uzamsal korelasyondur. Thomas Cover, çevrimiçi öğrenme tahmin ve karar verme yöntemimiz için iyi bir temel sağlar. O sırada Thomas Cover bu algoritma konusunda çok heyecanlıydı, bu yüzden algoritmasına dayalı bir hedge fonu açtı ve etkisi iyi görünüyordu.

Ayrıca çevrimiçi öğrenmenin iyi bilinen bir sorunu var: Çok kollu slot makinesi sorunu . N farklı slot makinemiz olduğunu ve her slot makinesinin aslında ödüllerin olasılık dağılımına sahip olduğunu varsayalım. Bunu rastgele bir değişken olarak düşünebilirsiniz, bir slot makinesini her çekişinizde, bu rastgele değişkenden bir örnek almakla eşdeğerdir. En iyi slot makinesini, yani en yüksek ortalama ödülü olan slot makinesini bulmak istiyorsunuz.Bu aslında öğrenme ve karar vermeyi birleştirme sürecidir. Bu slot makinelerinin olasılık dağılımını önceden bilmiyoruz, öğrenmemiz gerekiyor, ancak sonunda en iyi slot makinelerini bulmak için kararlar almamız gerekiyor.

Çok kollu slot makinesi probleminin algoritması, aslında tüm slot makinelerini çok iyi öğrenmemize gerek olmadığı anlamına geliyor. Tüm slot makineleri için yüksek doğruluk tahminlerine ihtiyacımız yok. Sadece daha iyi slot makinelerinin doğruluğunu karşılaştırmamız gerekiyor. Daha yüksekseniz, iyi kararlar verebilirsiniz ve daha kötü olanların ne kadar iyi olduğunu öğrenmemize gerek yoktur. Öyleyse bu çok kollu slot makinesi problemi aynı zamanda bir kontrol optimizasyonudur.Çevrimiçi öğrenmede klasik bir problemdir ve birçok uygulaması vardır.Bence uzay-zamansal veri öğrenimi ve karar vermemiz için çok iyi bir çerçeve olduğunu düşünüyorum.

Daha anlamlı olduğunu düşündüğüm uzay-zamansal büyük verinin bir başka araştırma yönü de üretken modeller. . Örneğin, sipariş verilerini sanal olarak nasıl oluştururuz veya trafik akışını veya sanal piyasa işlem verilerini sanal olarak nasıl üretiriz. O zaman bu üretici model ile bu modeli tam olarak anladığımızı söyleyebiliriz. Bir yandan, üretken bir model anlamamıza yardımcı olabilir, öte yandan üretken bir modelimiz varsa onu yeni bir ortamı simüle etmek için kullanabiliriz. Ek olarak, onu eğitim için yeni veriler oluşturmak üzere kullanabilmek, eğitim verilerimizi artırmakla eşdeğerdir ve yeni senaryoları test etmek için de kullanılabilir. Zaman serisi modelleri gibi birçok geleneksel zaman serisi ve uzamsal ekonometrik model vardır. Uzamsal nokta süreç modelleri gibi bazı rastgele süreçler gibi doğrusal ARMA modellerini ve GARCH modellerini biliyor olabilirsiniz, ancak bu modellerin hepsi Nispeten basit, birçok doğrusal olmayan özellik ve ayrıntı dahil olmak üzere birçok faktör tarafından belirlenen gerçek bir karmaşık süreci kavramak zor olabilir. Bu karmaşık süreci yakalamak için derin öğrenme üretken modellerini kullanmamız gerekebilir. Örneğin, Authencoder'ı, güncellenmiş yüzleşme oluşturma ağı gibi bazı nesil modelleri gibi derin öğrenmede kullanın.

(Bu makale yalnızca Titanium Media'da yayınlanmıştır ve Tsinghua Üniversitesi Titanyum Üzerine Disiplinlerarası Bilgi Araştırma Enstitüsü Shanshu Bilim ve Teknoloji Enstitüsü'nden yardımcı doçent, doktora danışmanı ve bilim adamı Li Jian'ın paylaşımına ve harmanlamasına dayanmaktadır)

Titan White, AI'nın 32. sayısı makine öğrenimi 1'e geldi ve üç gecelik paylaşım sona erdi

Kuru ürünler birbiri ardına piyasaya sürülecek:

Titan White'ın 33. sayı önizlemesi: Yapay zeka, makine öğrenimi 2'ye geldi

Nereden Baidu, Dördüncü Paradigma, Ufuk Robotu Titanic, "makine öğrenimi" konusunda harika paylaşımlar getirmeye devam ediyor ~

Zaman: 20, 21, 22 Mart

Konum: Titan White | Yapay Zeka (WeChat Group)

Dersler ve değişimler için kaydolun:

Titan White şu anda sağlık hizmetleri, yapay zeka, eğlence ve sosyal ağ, VR / AR, blok zinciri, ödeme yeniliği, spor, bulut bilişim ve SaaS dahil olmak üzere dokuz profesyonel gruba sahiptir.

1. Titanium Media Pro Professional Edition kullanıcıları bağlantısına tıklayabilir, hesaplarında oturum açabilir, çevrimiçi ücretsiz, girmek istedikleri grubu seçebilir ve istemlere göre işlem yapabilir;

2. Titanium olmayan Media Pro Professional kullanıcıları WeChat taitanbai0 hesabını ekleyebilir Bir arkadaşını geçtikten sonra Xiaotai'ye 99 yuan kırmızı bir zarf göndererek girmek, dersleri dinlemek ve uzun süre iletişim kurmak için dokuz gruptan birini seçme hakkına sahip olacaksınız. Lütfen Xiaotai'ye hangi gruba girmek istediğinizi söyleyin ve Xiaotai'nin sizi gruba çekmesini bekleyin ~

Tavsiye, sponsorluk, işbirliği:

Lütfen Titan White'dan sorumlu kişi olan Jiayinge ile jiayinge@tmtpost.com adresinden iletişime geçin.

Daha heyecan verici içerik için Titanium Media WeChat ID'yi (ID: taimeiti) takip edin veya Titanium Media Uygulamasını indirin

Huang Xuan, Dou Xiao, Zhou Yiwei, 360 derece yakışıklı ne tür bir yakışıklıdır
önceki
190214 Gerçek bir Fu Buxiu! Mor lahanadan daha canlı bir resim sizi takdir etmeye davet ediyor
Sonraki
Çin futbolunun tarihi bir anı var! Luneng Evergrande'den daha iyi ve vatandaşlığa alınmış oyuncuların maaşı sınırlı mı?
Ji Lingchen, Kan Qingzi ile evlenmek için Paris'e gidiyor, bu yüzden evlenmek için para biriktirmen gerekiyor.
Kuyruk TuruDaha geniş bir "ufuk" ile tanışın, ASUS MX34VQ kavisli ekranDijital kuyruk
1 milyar ABD Doları ile 6,5 milyar ABD Doları arasında değişen piyasa değeriyle Momonun ürünleri nasıl değişti?
Eski uluslararası hakeme "Kör müsünüz?" Çeşitli nadir peri golleri, Süper Lig'deki başka bir klasik oyun
Çevrenizdeki yılın sonu burada ve küçük çiçeklerin akışından daha popüler olan bu vahşi rapçiler grubudur.
İnsanlar öldüklerinde neden yüzlerinde kumaş var? Uzmanlar bunun batıl inanç olmadığını, bilimsel olduğunu söylüyor
Yeni Yıl Ekipmanı this Bu Bahar Şenliği'ne bir ekran kartı getirin
Karısını şımartan yetenekler çok kıskanılacak! Jay Chou böyle bir şey söylemesi için karısını şımarttı? !
Plastik kız kardeşi Hua AB tarafından atılan Wen Yongshan, devrilmek üzere mi? Bakalım önce yüzünü değiştirecek mi
"WANNA ONE" "News" 190214 Yong Seong-woo Japonya'ya resimli çekimde, Sevgililer Günü denizaşırı seyahatte
Lin Gengxin, Zhou Huajian'ı mı lekeledi? Luo Zhixiang kolay Qianxi Xi'yi mi kırdı? Stefanie Sun özür mü diliyor?
To Top