% 90 tahmini doğruluk oranı, siparişlerin% 30'unu kapsar Didi Chuxing'in "Guess You Are Going" destinasyon tahmin sistemi nasıl çalışır?

Yazar Zhang Lingyu

Düzenle Xiaozhi

"Sanırım gitmek istiyorsun", Didi Chuxing'in büyük veri akıllı tahmin sisteminin ana işlevlerinden biridir. Bu işlev sayesinde Didi, bazı büyük ölçekli alışveriş merkezleri, tren istasyonları ve diğer kalabalık yerler için seyahat çözümleri önerileri sağlayabilir. Şu anda, "Gitmek İstediğinizi Tahmin Et" işlevi, Didi platformundaki siparişlerin% 30'unu kapsıyor ve tahmin doğruluk oranı% 90'a ulaştı. "Gitmek istediğini tahmin et" fonksiyonu ile ilgili patent de kabul için sunuldu.

1 Önüne yaz

Didinin "Guess Where You Go" hedef tahmin sistemi, arkasında güçlü algoritmalar ve teknik destek ile çok havalı bir sistemimiz.

Kullanıcı Didi Travel uygulamasını açtığında, sistemimiz kullanıcının nereye gittiğini tahmin edebilirse, "Gidiyorsun tahmin et" kutusunu doldurur. Çoğu kullanıcı bu özellik hakkında yorum yaptığında tahminimizin doğru ve havalı olduğunu söyleyeceklerdir.

Bu işlevin kullanımı nedir? Bu işlevi tasarlarken, birkaç başlangıç noktamız var: biri kullanıcılar için uygun olmak ve kullanıcılar sipariş verdiğinde girdi maliyetini düşürmek; diğeri ise kullanıcıları şaşırtmak ve Didi'nin yapay zeka teknolojisini% 90'dan fazla doğrulukla vurgulamak. Üçüncüsü, trafik kapasitesini daha iyi planlamak için kalabalığın seyahat yönünü tahmin etmektir.

Aşağıda, problem tanımımız, model soyutlama, modeli veri istatistikleri ile çözme ve veri paylaşımı gibi çeşitli yönlerden tanıtacağız.

2 Tanım problemi: iş senaryosundan model soyutlamaya

Ar-Ge mühendislerinin her gün karşılaştığı bir senaryo, ürün yöneticilerinin talepleri artırmasıdır. O zaman, talebi bir sorun olarak tanımladık: kullanıcının seyahat geçmişi aracılığıyla, kullanıcının şu anki saat ve konumda seyahat hedefini tahmin edin.

Problem tanımını yaptıktan sonra, sonraki adım problemi tahmine dayalı bir modele soyutlamaktır. T şu anki saat, S geçerli konum ve X tahmin edilen hedef. Şu anki saatte ve şu anki konumda yola çıktım. Bu koşulda, kullanıcının gideceği hedefin koşullu olasılığı başka yerlere gitme olasılığından çok daha büyük olmalıdır. . Örneğin, bu akşam saat dokuzda otelde Didi Travel uygulamasını açtım. Hongqiao Havaalanına gitme olasılığımın Bund olasılığından çok daha fazla olduğu tespit edilirse, sistem Hongqiao Havaalanına gittiğimi tahmin edecek. Bu bir koşullu olasılık sorunudur.

3 Hızlıca 0'dan 1'e bir model oluşturun: Ortak bilgilere göre ana özellikleri seçin

Model ile, sistemi 0'dan 1'e basitten karmaşığa hızlı bir şekilde kuruyoruz. Hedef, tahmin edilecek değişkendir ve zaman değişkeni, tarih ve saati içeren bileşik bir değişkendir.Örneğin, tarih 23 Ağustos 2016 ve saat 18:10. Adres değişkenleri aynı zamanda adres adları ve enlem ve boylam gibi bileşik değişkenlerdir. Bu değişkenler farklı türler içerir.Örneğin, adres adı ayrı bir rasgele değişkendir. Boylam ve enlem sürekli değişkenlerdir ve zaman periyodik bir değişkendir. Boylam ve enlem kombinasyonu iki boyutlu bir ortak değişkendir. . Tüm bu değişkenleri kullanmak ve her değişkenin işlevini tam anlamıyla yerine getirmesine izin vermek, üzerinde çalışmak istediğimiz uzun vadeli bir konudur. Bu aşamada hedefimiz hızlı bir şekilde bir sistem kurmak ve hızlı bir şekilde çevrimiçi olmaktır.

Şu anda, bu kadar çok özellikle karşı karşıya kaldığımızda, öncelikle yapmamız gereken şey bir ana özelliği seçmektir. Özellik seçiminin ilkesi, tahmin edilen değişkenle en alakalı özelliği seçmektir. Genellikle değişkenler arasındaki korelasyonu ölçen göstergeler, Pearson katsayısı ve karşılıklı bilgidir. Pearson katsayısı genellikle iki sürekli rastgele değişken arasındaki korelasyonu ölçmek için kullanılır ve hesaplanan sonuç doğrusal korelasyondur. Az önce, aday özelliklerimizin hem sürekli hem de kesikli, ayrıca periyodik ve bileşik olduğundan bahsetmiştik.Bu yüzden burada değişkenler arasındaki korelasyonu ölçmek için karşılıklı bilgiyi seçiyoruz. Hedefimiz varış noktası olduğu için öncelikle seçilecek özellikler kalkış yeri, hareket saati ve hareket periyodu olmak üzere üç değişkeni tanımlar.

Şekilde görüldüğü gibi, en soldaki varış ve kalkış yeri, ortadaki varış ve kalkış zamanı, en sağdaki varış ve kalkış saati ve en yüksek değer, varış ve hareket zamanının iki değişkeni arasındaki karşılıklı bilgi değeridir. Bu da bizim algımıza uygun: Normal şartlar altında Didi'yi sabah açtığımda, seyahatin varış noktası genellikle şirket, gece açılırsa gidilecek yer benim evim olabilir. Dolayısıyla, ulaştığımız sonuç, hareket anındaki özelliğin varış noktasını tahmin etmek için en iyi tek özellik olduğu.

Daha sonra, bu özellik altındaki her varış yerinin koşullu olasılığını, hareket anında böyle bir olasılık modeli hesaplamak için problem daha da basitleştirilir. Bu Bayesçi tahminin olasılık problemidir Bayesçi formül ve toplam olasılık formülüne göre çözülmesi gereken anahtar değişken, varış noktasının koşulu altında hareket anındaki olasılık dağılımıdır.

4 Temel sorunları çözme: verilerden yasaları keşfetmek

Aşağıda temel sorunların nasıl çözüleceği açıklanmaktadır. Önce bir kullanıcının verilerine bakalım.Aşağıdaki tablonun en soldaki sütunu kullanıcının hareket saati, sağdaki ise ilgili varış noktasıdır.

Bu tür veriler, kalıbı görmek kolay olmayabilir. Az önce istatistiksel zaman özelliklerinden bahsetmiştim, bu yüzden tarihi kaldırdım, hedef solda ve yayınlanma saati sağda. Modeli görmek yine de zor olabilir.

Aşağıda, A hedefinin seyahat frekansı histogramım var. Bir bakışta çok açık. Bu dağılım, Gauss dağılımı olarak da adlandırılan klasik istatistikteki normal dağılıma çok benzer. Birçok vakayı analiz ettikten sonra, hepsinin buna benzer olduğunu, yani aynı kullanıcı ve aynı varış noktasının normal dağılıma uygun olduğunu gördük.

Bir sonraki soru, bu normal dağılımı nasıl tahmin edeceğimizdir. Normal dağılımın iki anahtar parametresi olduğunu biliyoruz, biri beklenti ve diğeri varyans, bir sonraki adım, ortalama ve varyansı nasıl tahmin ettiğimizdir.

Önce iki örneğe bakalım. İlk örnekte, saat sırasıyla saat 8, saat 9 ve saat 10, yani ortalama değer saat 9 pozisyonudur. Sonraki anlar saat 23, saat 0, saat 1 ve ortalama değer saat 0'dır. Kendinize bir hesaplama sorusu bırakın. 3, 22 ve 23'ün ortalaması nedir? 3 puan, 15 puan ve 21 puanın ortalaması nedir?

Burada iki yöntemi tanıtıyorum, ilk yöntem vektör yöntemidir.

Aşağıdaki şekil, iki koordinat ekseni, x ekseni ve y ekseni olan yuvarlak bir kadrandır. Her moment bir vektörle temsil edilir ve ardından vektör toplanır. Şu anda sorudaki 3, 22 ve 23 numaralı noktaların toplam vektörü 0, yani ortalama 0.

Tüm algoritmanın akışı şu şekildedir, önce her ana karşılık gelen vektör gösterimini hesaplayın, yani her anı bir vektör açısına dönüştürün. X ekseni ve y ekseni koordinatlarını temsil etmek için sinüs ve kosinüs değerlerini hesaplayın. İkinci adım, n kez karşılık gelen toplam vektörünü hesaplar. Üçüncü adım, yay kosinüs formülünü kullanarak toplam vektörü ile x ekseni arasındaki açıyı hesaplamaktır. Dördüncü adım, iç açıyı, hesaplamak istediğimiz ortalama değer olan karşılık gelen ana dönüştürmektir. Son olarak ilgili varyansı hesaplayın.

Ancak bu vektör yönteminin iki küçük sorunu vardır:

Bu iki örneğe bakın. İlk örnekte, üç an saat 0, saat 0 ve saat 3 ise, vektör yöntemiyle hesaplanan ortalama değer saat 0 saat 58 dakika 33 saniyedir, ancak gerçekte ortalama değeri saat 1 olmalıdır. Başka bir örnek de, 0 ve 12 momentleri birbirinin tersi olan vektörlere dönüştürülürse, toplamın sıfır vektör olduğu ve sıfır vektörünün yönü olmadığı, yani çözümü olmadığıdır. Yani sorun şu ki, vektör yöntemi sadece yaklaşık bir çözüm bulabilir ve sınır durumunda çözüm yoktur, ne yapmalıyız?

Tanıttığım ikinci yöntem, bu sorunu çözebilecek Lagrangian yöntemidir. İlk önce aritmetik ortalamanın kavramını ve özelliklerini gözden geçirelim.Aritmetik ortalama önemli bir özelliği karşılar: tüm gözlem örneklerinden alınan mesafelerin karesi toplamı en küçüktür. Nasıl çözeceksin? Lagrangian yöntemidir.

İlk önce denklemi türetin, türevin 0'a eşit olmasına izin verin ve yeni bir kırmızı formül elde edin.Bu formül, iyi bilinen aritmetik ortalama hesaplama formülüdür.

Benzetme yoluyla, ortalama zaman da bu şekilde ifade edilebilir ve ortalama süre, tüm zamanların en küçük karesi mesafelerin toplamına sahip zaman olarak kabul edilebilir. Burada, iki moment arasındaki mesafe olan yeni bir kavram tanıtılmaktadır. İki an arasındaki mesafe nasıl hesaplanır? Önce iki moment arasındaki mesafenin sağlaması gereken iki özelliğe bakayım: Birincisi, iki moment arasındaki mesafe negatif olamaz ve 0'dan büyük veya 0'a eşit olmalıdır; diğeri, iki moment arasındaki mesafenin 12'yi, yani saat 23 ve saat 0'ı geçemeyeceğidir. Mesafeleri 23 yerine 1. Bu ikisiyle aşağıdaki parçalı işlevi kullanabilirsiniz.

Bunu çözmek için bu parçalı işlevi yukarıdaki soruna ikame etmek kolay değildir. Önemli değil. Mutlak değerin doğasını, onu birleşik bir ifade elde etmek için dönüştürmek için kullanabilirsiniz. Şu anda, iki parçalı işlev birleşiktir.

Son olarak, onu yukarıdaki optimizasyon probleminin içine koyarak ve sonra bu optimizasyon problemini çözerek, zaman ve varyansı elde edebilirim Bu her zaman bir çözümdür ve çözüm doğru bir çözümdür. Bu modelin çözümüne zamandan dolayı başlamayacağım.

Özetlemek gerekirse, vektör yöntemi özlüdür ve anlaşılması kolaydır, ancak yaklaşık bir çözüm arar ve sınır koşulları altında bir çözüm yoktur. Lagrangian yöntemi doğru bir çözüm elde eder, ancak sezgisel olarak anlaşılmamıştır Çözüm algoritması biraz daha karmaşıktır ve zaman karmaşıklığı O (nlogn) 'dur.

Son olarak bir soru daha var: Yukarıda, aynı kullanıcı ve aynı varış noktası altındaki hareket saatinin normal bir dağılıma uygun olduğunu varsaydım. Burada küçük bir problem var: Normal dağılımın bağımsız değişkenlerinin dağılımı, negatif sonsuzdan pozitif sonsuza kadar tüm sayı eksenidir. Ancak başlama zamanının dağılımı 0 ile 24 arasındadır ve bir dönemsellik vardır. İleri matematiksel istatistikte, bu dağılıma, von Mises dağılımı olarak da adlandırılan döngüsel normal dağılım denir.

Aşağıdaki, tüm algoritmamızın akışıdır.İlk olarak, kullanıcının geçmiş sıralarına göre, sırayla her hedefe karşılık gelen sipariş süresinin beklentisini ve varyansını hesaplayın; ardından her bir varış noktasının olasılığının ara verilerini mevcut saate göre hesaplayın; üçüncü adım ise kabuklu deniz ürünlerini kullanmaktır. Yess çerçevesi, her hedefin olasılığını hesaplar; sonunda eşik belirlenir ve eşiği karşılayan, istediğimiz hesaplama sonucudur.

Daha sonra görüntü noktalarına bir örnek vereceğim. Bu tablo, bir kullanıcının her bir varış noktasına hareket saatinin dağılımıdır ve en sağda onun dağıtım endeksidir.

Her saati bir ondalık sayıya çeviriyorum. Örneğin, hedef A için, ortalamanın 10.5, yani 10:30, varyansın iki saat ve sıklığın 0.47 olduğunu görüyoruz. Geçerli saatin 09:00 olduğunu varsayarsak, aşağıdakiler ortadaki bazı hesaplama sonuçlarıdır.

Son olarak, dönüştürmek için Bayes formülünü kullanın ve bu kullanıcının o gün saat 9'da A'ya gitme olasılığının 0,98 olduğunu alın. Eşik 0,9 olarak ayarlanmışsa, o zaman A hedefi "gittiğinizi tahmin edin" in sonucudur.

5 Geliştirmeye devam edin: modelin daha fazla ayarlanması ve optimizasyonu

Basit bir modelden sonra, bir sonraki adım daha iyi sonuçlar elde etmek, yani bu modeli adım adım daha karmaşık hale getirmektir. Öncelikle, başka bir özelliğe bakalım. Bu sefer hareket saatini değil, hareket yerinin enlem ve boylamını seçiyoruz. Aşağıda, bir kullanıcının kalkış hedefinin kalkış enlemi ve boylamının bir toplamı verilmiştir. Bu özellik aynı zamanda normal bir dağılım niteliğindedir. Bir merkez noktası vardır. Merkez uzaklaştıkça ve uzaklaştıkça, karşılık gelen frekans azalacaktır.

Üç boyutlu bir resim çizmek şuna benzer, bu yüzden aynı kullanıcının aynı varış noktası altındaki hareket yerinin enlem ve boylamının iki boyutlu normal dağılıma uygun olduğuna dair başka bir varsayımdan bahsetmeme izin verin Spesifik yoğunluk fonksiyonu aşağıdaki formüldür.

Her bir parametreyi açıklamayacağım ve anahtar türetme sürecini zorlamayacağım Aslında, yukarıda bahsettiğim başlangıç anıyla aynıdır.Olasılık hesaplanır ve Bayes formülü nihayet ayarlanır.

Doğrudan sonuca baktığımda seçtiğim kullanıcı bu, hareket yerinin enlem ve boylamı ile modelleme yaptıktan sonra, eğer kullanıcı en sağdaki enlem ve boylamdan başlıyorsa, birkaç noktaya gitme olasılığı. A hedefine gitme olasılığı en yüksek olan 0.81. Eşik 0.9 ise, bir hedefe sahip olmama olasılığı 0.9'dan yüksek olduğundan, bu durumda, kullanıcı uygulamayı açmasına rağmen, "Gidiyorsun tahmin et" olmayacak, yani dolu değiliz Nereye gittiğini tahmin edin.

Yukarıdaki araştırma ve tartışmadan sonra şu iki sonuca varabiliriz: Birincisi, aynı kullanıcının aynı varış noktası altındaki hareket saatinin tek boyutlu bir normal dağılımla tutarlı olması; diğeri ise aynı kullanıcıya ve aynı varış noktasına karşılık gelen kalkış boylamı ve enleminin tutarlı olmasıdır. Normal olarak dağıtılmış iki boyutlu. Bu nedenle, aynı kullanıcının aynı varış noktasında hareket saati ile hareket enlem ve boylamının üç boyutlu normal dağılıma uygun olduğu sonucuna varılabilir.

Bir parametre elde etmek için bu üç değişkenin beklenen vektörünü, kovaryans matrisini ve ters matrisi hesapladım ve sonra Bayes formülünü uyguladım. A hedefinin olasılığının en yüksek olduğunu bulduk, şu anda 0,81 idi ve şimdi 0,97. Yani, bir değişken ekledikten sonra, sistem tarafından tahmin edilen yaklaşan hedefin sonucunun belirsizliği azaltılır.

Daha önce, işi modellemek için temel olarak Bayes çerçevesi + normal dağılımın geleneksel matematiksel istatistik bilgisini kullandım. Üçlü normal dağılım kullanıldığında, başa çıkmak daha karmaşıktır.Genel olarak, geleneksel matematiksel istatistik yöntemleri için, düzinelerce özelliğe sahipseniz, bu bir felakettir.

Ardından, normalden başlamaya, Bayesian çerçevesini uygulamaya, klasik bir makine öğrenimi modeli LR modeli türetmeye ve makine öğrenimi çağına girmek için onu sistemimize yerleştirmeye çalışıyorum.

D'yi belirli bir hedefi temsil etmek için ve Y'yi hedef değeri olarak kullanarak böyle bir değişken ayar yaptım.

Yukarıdaki iki denklemin anlamı, bir kullanıcının bir D hedefine gittiği ve bir D hedefine gitmediği normal bir dağılım olarak görselleştirilebilir. Tahmin edilmesi gereken, kullanıcının X özelliği altında D'nin hedefine gitmesi, onu dönüştürmek için Bayes formülünü uygulaması ve aşağıdaki formülü alması olasılığıdır.

Aslında bu parça doğrusal cebirdeki bazı hesaplamalardan başka bir şey değildir. Parantez içindeki şeyleri genişletin ve birleştirin ve sonra bazı dönüşümler yapın ve son formül nispeten basittir, bu lojistik regresyon denklemidir.

Burada dikkat edilmesi gereken birkaç nokta var: Standart lojistik regresyon ile karşılaştırıldığında, normal dağılım + Bayesci çerçeveden türetdiğim lojistik regresyonun ikinci dereceden terimleri ve çapraz terimleri vardır. Bir diğeri, ilk varsayım, iki normal dağılıma uyduğudur, ancak aslında normal dağılıma uyması gerekmez ve buna uygun bir dağılım bulmak bile zordur.

Özellikleri işlemezsem ve lojistik regresyon makine öğrenme yöntemini doğrudan uygulamazsam, sonuçlar geleneksel matematiksel yöntemlerden daha iyi olmayabilir, bu nedenle özellik mühendisliği olan bazı mühendislik işlemleri gerekir.

Ardından, makine öğrenimi özellik mühendisliğimizin işleme yöntemini kısaca tanıtalım. Özellik mühendisliği büyük bir derstir ve derinlemesine iletişim kurmanın bir yolu yok, bunu nasıl yaptığımızı kısaca anlatıyorum.

Öncelikle, bazı özellik taramaları yapmalıyız. Burada, tahmin edilen değişkenimiz varış noktası olduğu için, varış zamanı, kalkış yeri ve kullanıcı bilgileri gibi göreceli olarak oldukça alakalı olan varış noktasıyla son derece alakalı özellikleri seçmeliyiz. özelliği. İlk özelliği seçtikten sonra, bir sonraki adım bu özelliği bölmektir.Genel yöntem, seçilen özelliği zamanı anlara bölme gibi daha ayrıntılı alt özelliklere bölmek için iş sağduyusunu kullanmaktır. . Diğer bazı özellikler için, derinlemesine madencilik yapmamız gerekebilir.Örneğin, kullanıcı özellikleri aslında kullanıcı davranışının arkasına gizlenmiş birçok gizli özelliktir. Şu anda, kullanıcı özellikleri üzerinde kullanıcı portreleri veya kullanıcı davranış analizi yapmak için özel bir veri madenciliği ekibimiz var. .

Bu kadar çok özelliği böldükten sonra, bu özellikler birbirinden bağımsız olmayabilir ve özelliklerin daha fazla çıkarılması ve dönüştürülmesi gerekir. Özellikler seçildikten sonra, lojistik regresyon kullanılacaksa, verilerin de ayrıklaştırılması ve 0 veya 1 değişken olarak ayrıklaştırılması gerekebilir. Discretization temel olarak özelliklerin büyümesini çözmek içindir. Her özelliğin büyümesi nihai sonuca doğrusal olarak katkıda bulunmayabilir. Aynı zamanda, çevrimdışı eğitimin ağırlıkları, 0 ve 1 değişkenlerine ayrıştırıldıktan sonra, çevrimiçi sistem tarafından yüklendikten sonra doğrudan kullanılabilir; Çarpma, doğrudan toplamaya dönüştürülür ve bu da sistemin performansını büyük ölçüde artırabilir.

6 Verinin güzelliği: birkaç ilginç vakanın veri dağılımını paylaşın

Yukarıdakiler esas olarak teknolojiye bir giriş niteliğindedir.Ardından, birkaç daha ilginç vakaya bir göz atalım ve Didi Verilerimizin cazibesini hissedelim.

İlk kullanıcı için verileri, hangi varış noktasına gideceğini ayırt etmek için yalnızca hareket saati özelliğini kullanır. A hedefine ortalama hareket süresi 10,5 ve B hedefine ortalama hareket saati 19:00. Çizdiğim resimde mavi, A hedefine hareket zamanının dağılımı ve kırmızı B hedefine İki dağılımın başlangıç zamanı dağılımında neredeyse hiç kesişme yoktur.

Varış ve kalkış saatleri arasındaki karşılıklı bilgi çok yüksek, 1.36. Varış yeri, hareket saati ve hareket yerinin ortak değişkeninin ortak bilgisi 1.47'dir. Bu kullanıcı için hedef özelliği eklense bile bilgi kazancının fazla artmadığını görebiliyoruz.

İkinci kullanıcı, hareket saatine kadar hangi hedefe gittiğini ayırt edemez. A hedefine ortalama hareket süresi 12,4 ve B noktasına giden ortalama süre 11,6. Bu iki zaman görece yakın. Saat 12 civarında, A ve B noktasına gitme olasılığının nispeten yüksek olduğunu ve aralarında ayrım yapmanın kolay olmadığını gördük.Olasılık dağılım eğrilerinin büyük bir kesişim noktası var.

Aşağıda, varış yerinin hedef A ve varış B'ye karşılık gelen enlem ve boylam dağılımı verilmiştir. Yatay eksen enlem ve dikey eksen de boylamdır. Mavi nokta, kullanıcının hedef A'ya olan enlem ve boylamıdır ve bir alanda yoğunlaşmıştır; kırmızı nokta, kullanıcının başka bir alanda yoğunlaşan B hedefine enlem ve boylamıdır. A veya B hedefine mi gideceğini ayırt etmek için hareket yerinin enlem ve boylamını kullanabileceğimizi gördük.

Bu kullanıcı için varış noktası ile karşılık gelen hareket yeri, hareket saati ve hareket saati ortak değişkenleri arasındaki karşılıklı bilgileri hesapladık. Varış ve hareket saatleri arasındaki karşılıklı bilgi en yüksek olanıdır.

Yukarıdakiler kullanıcının seyahat geçmişidir.Kullanıcı B'den ayrılırsa, çoğu durumda A'ya gider. Eğer kullanıcı A'dan ayrılırsa, çoğu durumda B'ye gider. Bu kişinin öğle vakti işten ayrıldığını tahmin ediyoruz. Akşam yemeği için A noktasından B noktasına bir taksiye binmek için APP'mizi kullanın ve daha sonra APP'mizi kullanarak B noktasından A noktasına taksiye binecek ve hızlı bir şekilde yer. Bu çok ilginç bir durum.

Son durumda, hareket saati ile hareket yerinin tek karakteristiğini ayırt etmek kolay değildir, karşılıklı bilgilerine bakabiliriz. Varış noktası ve hareket yeri arasındaki karşılıklı bilgi yüksek değildir ve varış noktası ile hareket saati arasındaki karşılıklı bilgi yüksek değildir, ancak varış noktası, hareket yeri ve hareket saatinin iki ortak değişkenine ilişkin karşılıklı bilgi nispeten yüksektir. Bu kullanıcı için, kalkış yeri ve hareket saati olmak üzere iki değişkeni birleştirerek nereye gittiğini bilebilir. Bu listeye doğrudan bir göz atalım, eğer bu kullanıcı 18:00 civarı ise ve A'dan başlıyorsa yüksek olasılıkla B'ye gidecektir.

Bu makalede paylaşılan ana başlık, temelde Didi'nin "Guess You Are Going" hedef tahmin sistemi sırasına göre sıfırdan tanıtıldı. Diğer bir gizli çizgi ise matematiksel istatistikten makine öğrenmesine kadar. İlk yarıda geleneksel matematiksel istatistiklerle nasıl modelleme yapılacağını anlattım. İkinci yarıda, mevcut yapay zeka trendini kullanıyoruz ve burada modellemek için makine öğrenimini kullanıyoruz. Umut Bugünkü paylaşım, size çalışma ve çalışma konusunda biraz ilham veriyor. hepinize teşekkür ederim.

yazar hakkında

Zhang Lingyu, Baidu'ya 2012 yılında bir arama stratejisi algoritması araştırma ve geliştirme mühendisi olarak katıldı; 2013 yılında Didi'ye katıldı, kıdemli algoritma mühendisi, taksi stratejisi algoritması yönünün teknik lideri, strateji modeli departmanında kıdemli teknik uzman, makine öğrenimi ve büyük veri teknolojisi tarafından tasarlanmış ve yönetiliyor. Kombinasyon optimizasyonuna dayalı bir sipariş dağıtım sistemi, yoğunluk kümelemesine ve küresel optimizasyona dayalı bir kapasite planlama motoru, trafik rehberliği ve kişiselleştirilmiş tavsiyeye ve "nereye gittiğinizi tahmin et" için kişiselleştirilmiş bir varış noktası öneri sistemi gibi şirket düzeyinde birden çok akıllı sistem motoru uygulandı Bekle. Şirketin araştırma ve geliştirme çalışmalarına ve ondan fazla teknolojik inovasyon patentinin uygulanmasına katıldı. Matematiksel modelleme, iş modeli soyutlama ve makine öğrenimi kullanarak pratik iş problemlerini çözmede iyidir.

Akıllı operasyon ve bakım, Sunucusuz, DevOps, AIOps ... CNUTCon Küresel İşletme ve Bakım Teknolojisi Konferansı 10-11 Eylül tarihlerinde Shanghai Everbright Kongre ve Sergi Merkezi Oteli'nde düzenlenecek olan etkinlik, Google, Uber, eBay, IBM, Ali, Baidu, Tencent ve Ctrip dahil olmak üzere akıllı çağdaki yeni operasyon ve bakımı ortaya çıkarmak için 12 büyük inek tarafından ortaklaşa üretilecek. , Jingdong, Huawei ve diğer tanınmış İnternet şirketleri birinci sınıf teknoloji uzmanları, en son işletim ve bakım teknolojisinin uygulanmasındaki çukurlarını ve deneyimlerini paylaşıyor ve öğrenmeyi tavsiye ediyor! Daha fazla bilgi edinmek için "Orijinali okuyun" u tıklayın! Mümkün olan en kısa sürede satın almak istiyorsanız, bir hafta boyunca kayıt geri sayımında% 20 indirim!

Bugünün Tavsiyesi

Okumak için aşağıdaki resme tıklayın

Nginx günlüklerinde gizli altın madeni nasıl çıkarılır?

Face ID ile karşılaştırılabilir mi? MediaTek dürbün yapılı hafif yüz tanıma çözümünü piyasaya sürdü
önceki
"Overwatch" yeni kahraman "Dark Shadow" resmi olarak duyuruldu
Sonraki
2018'in en yüksek skorlu 3 Amerikan drama listesi, hepsi netizenler tarafından ilahi dramalar olarak adlandırılıyor
Noriko Sakai taraftarlara kulübe katılmaları için "yalvardı", netizenler onu ikna etti: kötü sanatçılar geri dönmez
"Justin" "Haberler" 190324 Tayland Dünya Turu başarıyla sona erdi Justin'in otoriter sahnesi açıldı
Sun Honglei'de rol alan iki küçük erkek kardeş şimdi bir dünyayla diğerini karıştırıyor. Netizenler: Aynı dizinin farklı yaşamları var
Mate 20'de piyasaya sürülecek olan Kirin 980 işlemci, bu yükseltme noktalarına sahip.
Yılın en iyi Amerikan draması geri döndü! "Westworld" den daha iyi demek çok değil
"TFBOYS" "Haberler" 190323 En güçlü adam Wang Yuan, cesurca irili ufaklı yaralar alıyor
2799 yuan'dan başlayan Nubia Z18 resmi olarak piyasaya sürüldü
Yang Mi doğasını özgürleştirdi, direk dansı yaptı ve aşk armağanı söyledi, hayranlar: ciddiye almayın
"Cennetin Krallığı'nın Gelinliği" nin sevilen aktrisini canlandıran ilişkisi düzgün değil, 37 yaşında at kuyruğu yüksek bir kıza benziyor.
"Medeniyet 6" değerlendirmesi: yaratıcılıktan fazlası, yeterli derinlik yok
Amerikan dizisi "Black Mirror" film versiyonu Noel özel 300 dakika! Son size kalmış!
To Top