Makine ne düşündüğünüzü nasıl tahmin ediyor? Alibaba'nın Xiaomi tahmin platformu açıklandı

Alimei Kılavuzu: Ali Xiaomi, Ali tarafından 2015 yılında piyasaya sürülen akıllı bir müşteri hizmetleri robotudur. 2017'de Double 11 sırasında, Ali Xiaomi'nin hizmet hacmi 6,43 milyona ulaştı ve bunun akıllı çözüm oranı% 95'e ulaştı ve genel hizmet hacminin% 95'ini oluşturdu. Son yıllardaki gelişmelerin ardından, akıllı müşteri hizmetleri robotlarının baskısını daha da çözüp çözemeyeceğimizi düşündüğümüz bir sorun haline geldi. Bugün, Xiaomi Robot Lab'den Ichimaru, herkesi birlikte düşünmeye yönlendiriyor.

1. Arka plan tanıtımı

Gerçek hizmet bağlantısında, Alibaba'nın Xiaomi akıllı müşteri hizmetleri serisi, manuel müşteri hizmetlerinin baskısını büyük ölçüde azalttı, ancak akıllı müşteri hizmetleri robotlarının baskısının daha da çözülüp çözülemeyeceği, düşündüğümüz bir sorun haline geldi. Bu nedenle, kullanıcı robotla etkileşime girmeden önce kullanıcının niyetini tahmin etmek için yapay zeka teknolojisini kullanan ve kullanıcıların aktif veya pasif bir hizmette mevcut sorunları çözmelerine yardımcı olan tahmin platformu projesini başlattık.

Şu anda, tahmin platformunun çekirdeği iki kapasite geliştirme, sipariş tahmini problem tahmini etrafında dönüyor.

Sipariş tahmini : Kullanıcının sorunla karşılaştığı sırayı tahmin edin

  • Alibaba Xiaomi'nin servis danışmanlığının yaklaşık% 70'i siparişlerle ilgilidir.
  • İster çevrimiçi hizmetin sipariş seçici isterse kullanıcıların sipariş numarasını manuel olarak girmesine izin veren yardım hattı hizmeti olsun, deneyim sorunu, deneyim çok kolay değildir.
  • Kullanıcının hangi sırayla sorun yaşadığını bilmiyorum, kullanıcının hangi sorunlarla karşılaşacağını tahmin etmek bir yana.

Problem tahmini : Kullanıcıların ne tür sorunları olduğunu tahmin edin

  • Tahmin platformu hizmet tahmininin nihai amacı.

Ayrıca senaryo tahmini (kullanıcının hesap, lojistik, haklar vb. Gibi ne tür sorunlar olduğunu tahmin etme), ön bilgi tahmini (olumlu ve olumsuz kalıplar ve sıralama), kullanıcı tahmini (gelen çağrıları tahmin etme) Hangi Taobao kimliği sayıdır) vb.

2. Ürün tanıtımı

Tahmin platformunun yarım yıldan fazla bir süredir geliştirilmesinden sonra, CCO'nun Alibaba Xiaomi, Xiaomi, Hotline Xiaomi, XSpace, Vientiane vb. Gibi çeşitli hizmet son ürünlerini ele aldık. Aşağıdaki ürün formlarına ve ürünlerine bir göz atalım. Etki.

Ali Xiaomi:

Yukarıdaki resim sipariş tahmini, soru tahmin tahmin formu ve soru tahmin bot formu olan Alibaba ve Xiaomi'nin iniş sahnesi.

  • Sipariş tahmini esas olarak her sipariş seçicinin girişinde bulunur, örneğin giriş kutusunun yanındaki "+" düğmesi, problem tahmini veya NLU, kullanıcının niyetini tanır ve bazı senaryolar, kullanıcının önce siparişi vermesini ve algoritmanın kullanıcı sipariş listesini yeniden planlamasını gerektirir. Şu anda, kasıtsız sahnelerin ve kasıtlı sahnelerin tıklama oranı, canlı yayına geçmeden önce yaklaşık% 16 -% 20, memnuniyet tıklama oranı ise% 3,2 arttı.
  • Soru tahmini, sormak istediğiniz formu tahmin edin.Kullanıcılar çeşitli kanallar aracılığıyla Ali Xiaomi'ye girdikten sonra görünecektir. Şu anda, bazı senaryolar tam kapsam stratejisine, bazı senaryolar ise yüksek doğruluk stratejisine öncelik vermektedir. Birincisinin tıklama oranı, lansmandan yaklaşık 2-3 kat daha yüksektir. İkincisinin tıklama oranı, lansman öncesine göre neredeyse 10 kat daha yüksek.
  • Problem bot formunu tahmin ediyor Modelimiz çok yüksek doğruluğu değerlendiriyor Yukarıdaki şeklin üçüncü formu, kullanıcıya XX sırasının XX problemi olup olmadığını söyleyerek kullanıcıya sunuluyor. Şu anda, bu parçanın efektif oranı Alibaba Xiaomi'nin genel efektif oranından yüzde 35 puan daha yüksek ve memnuniyet oranı da 3 puan daha yüksek, ancak kapsama oranı nispeten düşük, sadece% 3.

Ali Xiaomi'ye ek olarak aşağıdaki senaryoları da ele aldık:

  • Hotline Xiaomi (telefon hattı akıllı müşteri hizmetleri robotu): Kullanıcı önce kullanıcının bir "XXX sorunu" ile karşılaşıp karşılaşmadığını soracak, varsa çözüm yayınlanacak, yoksa yardım hattı süreci kullanılacak; diyalog niyetine göre değerlendirildiğinde kullanıcıya kullanıcının "XXX" olup olmadığı sorulacaktır. Sipariş bir sorunla karşılaştı ", evet ise, SOP mantığını izleyin, aksi takdirde lütfen sipariş numarasını belirtin. Şu anda tüm senaryolarda sipariş tahmini başlatıldı, kullanıcı geri bildirimlerinin% 90'ı doğru ve memnuniyet oranı% 7 arttı. "Sorun tahmini" şu anda geliştirme aşamasındadır ve bu yıl Double Eleven kullanıcıları için sürprizler bekliyoruz.
  • Shop Xiaomi (akıllı müşteri hizmetleri robotu mağazası): Ürün formu, Ali Xiaomi'nin sormak istediğiniz tahminine benzer. Son zamanlarda, bankanın satış sonrası bilgi tahmini yeni başlatıldı. Satış sonrası bölümün tıklama oranı% 4 ve çözüm oranı% 4 arttı.
  • Xspace yardım hattı çalışma tezgahı (yardım hattı kılavuzu). Geçmişteki yardım hattı manuel hizmetlerinde, çoğu genç, kullanıcılardan sipariş numarasını cep telefonuna manuel olarak girmelerini isterdi ve deneyim biraz kötüydü. Şu anda, sipariş tahmini ile kullanıcılar tarafından manuel girdiden kaçınılmakta, pazarın katılımı% 6 + azaltılır ve kapsanan kısmın ATT'si% 10 + azaltılır.Servis ekibi her gün binlerce çağrı alarak yıl boyunca milyonlarca dolar tasarruf sağlayabilir.
  • Vientiane (iş danışmanlığı için akıllı müşteri hizmetleri robotu). Ürün formu, ne sormak istediğinizi tahmin etmeye benzer. Tüketiciyi koruma ve işlem senaryolarını kapsayan tıklama oranı% 4, çözümleme oranı% 4 arttı.
Üç, algoritma teknolojisi tanıtımı

Mevcut algoritmanın temel yetenekleri aşağıdaki şekilde gösterilmektedir: Yardım hattı sipariş tahmini (kullanıcı tanımlama + sipariş konumlandırma), çevrimiçi Xiaomi problem tahmini (amaç saptırma + sipariş konumlandırma + geri çağırma tahmini gibi farklı iş senaryoları için farklı algoritma yetenekleri bir araya getireceğiz) + Hedef tahmin), her bir alt modül burada çok fazla açıklanmayacaktır.Bu bölüm esas olarak buradaki algoritma mantığını tanıtmaktadır. Spesifik uygulama yöntemleri için Bölüm 4'e bakınız.

Tahmin / tavsiye, olağan algoritma teknolojisi esas olarak sınıflandırma problemleri veya sıralama problemleri ile çözülür. Daha önce, nispeten temel özellik mühendisliği + RF metodu ve WD modelini de denedik.Ayrıca, yukarıdaki şekildeki farklı yetenek modüllerinde de denedik Label-lda / xgboost ve diğer algoritmalar, tüm tahmin platformu algoritma teknolojisi modülü nispeten daha fazla bölündüğü için, bugün paylaşımımız esas olarak problem tahminine dayanmaktadır, bu bölümde, son aylarda problem tahmininde bazı ilerlemelere odaklanıyoruz, spesifik akım Çevrimiçi problem tahmin modeli aşağıdaki tabloya başvurabilir (MV-DSSM karşılaştırılmaktadır).

3.1 Temel problem tahmini modeli

Son aylarda, işimizi desteklemek için deep-ctr'ye odaklandık.Özellikle, farklı işletmelerde DeepFM, PNN (IPNN) ve DCN'nin üç modelini karşılaştırdık veya piyasaya sürdük. DCN'yi bir örnek olarak ele alırsak, Geniş ve Derin'in bir uzantısı olarak, DCN modeli büyük ölçekli seyrek ve yoğun özellikleri etkili bir şekilde öğrenebilir ve düşük hesaplama ek yüküne sahip (daha az parametre) özellikler arasındaki çapraz ilişkiyi etkili bir şekilde kavrayabilir. Aşağıdaki şekil, literatürdeki ağ yapısını göstermektedir:

Resim kaynağı "Reklam Tıklaması Tahminleri için Derin ve Çapraz Ağ" Ruoxi Wang, 2017. Çapraz ağ yapısı formunda, her katman xl + 1 xl kalıntısına uyacak şekilde bir çapraz harita f: d d özelliğini öğrenir. Bir yandan, her bir katman tarafından öğrenilen eşleme f, çapraz özelliklerin doğrusal olmayan bir eşlemesidir ve daha sonra kalıntıları yerleştirerek, ağırlıkların hassasiyeti geliştirilir, bu da seyrek giriş için daha uygundur ve diğer yandan, genel ağ için uygundur. Geri yayılma, ağ eğitiminin verimliliğini artırır. Sağda, orijinal giriş özelliklerinin doğrusal olmayan bir eşlemesi olan genel tam bağlı katman ve son bağlanan katman softmax'tır.

Ek olarak, DeepCTR algoritmalar serisinde bazı iyileştirmeler yaptık. DeepCTR modelini daha çok yönlü hale getirmek için Kaggle yarışmasına atıfta bulunuyoruz: Mercari Price Suggesion'un özellikle şunları içeren 4. çözümü:

  • Giriş katmanı ayrıca Tekli + Çok etkin özelliklerini de destekler;
  • Kelime vektörlerini bağımsız olarak eğitmek için 2vect algoritmasını kullanın;
  • Metin gömme katmanı ekleyin;

ChenglongChen / tensorflow-XNN'den resim, https://github.com/ChenglongChen/tensorflow-XNN

3.2 Pekiştirmeli öğrenme

Son zamanlarda, derin ctr temel modeline (özellik alanı daha büyüktür, ancak eğitim süresi daha uzundur, güncelleme daha yavaştır) dayalı olarak bilgi işlem platformu ekibiyle birlikte çalışıyoruz ve yeniden kayıt için drl (ctr-skoruna ve bazı geri bildirim verilerine göre gerçek zamanlı çevrimiçi olarak) , Tıklama oranını / çözüm oranını / memnuniyet oranını ve diğer hedefleri güçlendirmek için bölüm modellemesi için sıralı bir sıralama yöntemi oluşturarak.

3.3 Akış hesaplama

Artık problemleri tahmin etme yeteneğimiz olduğuna göre, tahmin etmeden önce neden kullanıcıların hizmet kanallarımıza girmesini beklediğimizi düşünmek kolay mı? Kullanıcılar Taobao'yu kullanırken, kullanıcı sorunlarını aktif olarak tahmin ederken ve kullanıcılara mümkün olan en kısa sürede ulaşmak için mesajlar gönderirken, kullanıcılara Alibaba Xiaomi'ye gelmelerini hatırlattıklarında kullanıcı günlüklerini neden gerçek zamanlı olarak izlemiyoruz ve sorunlarının çözülmesine yardımcı olabiliriz. Bu, akış hesaplama özelliklerinin kullanılmasını gerektirir.

Model şu anda geri çağrılan kullanıcılar için% 86,42'lik bir doğruluk oranına sahiptir;% 0,1 kapsama oranıyla tüm kullanıcılar için aktif hizmet senaryolarının gerçek zamanlı hesaplamasını simüle eder. TextCNN yöntemi ilk olarak Kim Yoon tarafından "Cümle Sınıflandırması için Evrişimli Sinir Ağları" nda metin duyarlılığı sınıflandırması sorununu çözmek için önerildi. Mühendislik alanında, genellikle LSTM gibi karmaşık serileştirme modellerine bir alternatif olarak kabul edilir.

Önerilen touch2vect kodlamamıza göre ve sınıflandırma için geliştirilmiş TextCNN sekans verileriyle birleştirildi. Birincisi, çok sayıda kullanıcının sayfaya göz atma yoluna ve daha sonra karşılaşılan sorunlara bağlı olarak, arkasındaki "anlamsal bilgi" denetimsizdir ve bir kodlama modeli olarak kaydedilir. Gömme temsili aşamasında, sistem günlüklere erişim (manuel Tao, Tmall) ve kullanıcının serileştirilmiş sayfa tarama yolu (sayfa 1) aracılığıyla gerçek zamanlı olarak göz atar. > Sayfa 2 > > Sayfa N) girdi olarak iki boyutlu bir vektör olarak kodlanır, serileştirilmiş gizli mod CNN aracılığıyla çıkarılır ve son olarak model tarafından etkinleştirilen en üst "problem / bilgi" tahmin sonucu olarak kullanılır.

Bu alt proje şu anda devam etmektedir ve çevrimdışı değerlendirme etkisinin% 1,5 geri çağırma olduğu varsayımıyla doğruluk oranı% 86,3'tür. Rnn tabanlı model kullanılmamaktadır, birincisi rnn performansının görece zayıf olması ve yüksek log QPS öncülüğünde daha zahmetli olmasıdır; diğeri ise modelin mevcut ilk versiyonunun, modelin araştırma sonuçlarını etkilemeyecek kadar karmaşık olmasını önlemek için nispeten basit bir keşfe odaklanmasıdır. Elbette bazı serileştirilmiş modelleri deneme planları var.

4. Platform çözümüne giriş

Erken ve hızlı iş desteği iniş sonuçlarıyla, aşağıdaki darboğazlar aşamalı olarak keşfedildi:

  • Kod tekrarlayan yapı, Ali Xiaomi, Xiaomi ve yardım hattı Xiaomi kod geliştirmeyi tekrarladı Mantık dağınık ve işletme hızlı yanıt veremiyor.
  • Model değerlendirme mantığı dağınıktır ve her algoritma mühendisi bunu ayrı ayrı sürdürür, tekrarlanan geliştirme ve değerlendirme verimliliği düşüktür.
  • Algoritma hizmet yönetimi dağınıktır ve her algoritma mühendisi bağımsız olarak bakım yapar ve tüm algoritma hizmetlerini birleşik bir şekilde yönetmek ve sürdürmek imkansızdır.
  • Model güncellendikten sonra algoritma hizmeti otomatik olarak güncellenemez ve model yineleme verimliliği yüksek olmaz.

Bu nedenle, bu yıl tüm platformlaşma sürecini başlattık. Genel işlevler arasında çeşitli tahmin hizmetleri için entegre bir platform sağlayan algoritma akış motoru, getirme, özellik mühendisliği, model eğitimi, algoritma gri tonlama, çevrimiçi değerlendirme, otomatik indirgeme ve otomatik başlatma vb. Yer alır. Şu anki aşamadaki temel çalışma, temel olarak algoritma yeteneklerinin modülerleştirilmesi (seri ve programlanabilir algoritma akış motoru, algoritma yeteneklerinin yeniden kullanılması, işe hızlı yanıt verme ve algoritma efektlerinin hızlı doğrulanması yoluyla), birleşik veri kaynakları ve özellik mühendisliği (algoritmalara izin verme) üzerinedir. Öğrenciler algoritma uygulamasına ve algoritma etkilerini doğrulamaya odaklanır), birleşik algoritma hizmeti yönetimi ve model değerlendirmesi (algoritma değerlendirme kodunun tekrar tekrar geliştirilmesini önlemek için), algoritma hizmetlerinin otomatik olarak güncellenmesi (model sürümünün verimliliğini artırın ve modelin zamanında olmasını sağlayın), çevrimiçi öneri tıklama verilerinin otomatik geri dönüşü (Model etkisini iyileştirmek için çevrimiçi veriler aracılığıyla modeli yeniden beslemek).

Spesifik plan yukarıdaki şekilde gösterilmektedir ve çekirdek aşağıdaki dört bölüme ayrılmıştır:

1. Yürütme motoru, tahmin yetenekleri sağlamak için tahmin sürecini birbirine bağlar Öngörme sürecinin bileşenli dönüşümü sayesinde, sistem daha iyi ölçeklenebilirliğe sahiptir.İş senaryosu kapsamı, önceki kod geliştirmeden yapılandırma desteğine dönüştürülür.

2. Çevrimdışı hesaplama bölümü, veri kaynağı esas olarak üç bölümden gelir, odps offline + TT log + TC ve diğer çevrimiçi arayüzler, bir bölüm kural bölümünün hesaplanması için kullanılır ve diğer bölüm, çevrimdışı eğitim ve gerçek zamanlı algoritmalar için girdi verileri olarak odps'a çıktı olarak verilir.

3. Gerçek zamanlı hesaplama kısmında, veri kaynağı esas olarak kullanıcının çevrim içi gerçek zamanlı log verilerinden gelir.Gerçek zamanlı hesaplama Blink ve EAS servisleri ile yapılır ve tahmin sonuçları çıkarılır. Entegrasyon.

4. Tahmin platformu yönetimi arka planı, temel olarak tahmin hizmetlerinin işletimi ve bakımı için kullanılır, algoritma hizmet yönetimi sağlar, akış yönetimi tahmin eder, çevrimiçi otomatik algoritmayı destekler, gri seviye kontrolü ve algoritma hizmeti bozulmasını destekler.

Algoritma akış motoru şeması yukarıda gösterildiği gibidir

  • Bileşen: (ayarlama algoritması, erişim, özel işleme) bileşeni. Geliştiricilerin en çok kod yazdığı yer.
  • Modül: Modül, bir Bileşen grubunun isteğe bağlı uygulamalarının sıralı bir kombinasyonu (seri).
  • Anahtar: Yukarı ve aşağı modülleri bağlamak için kullanılan anahtar, koşul, sıra, eşzamanlılık, tekrarlama, sonlandırma ve diğer mantıksal yargılar ve işlem operasyonları yöneticileri ve zamanlayıcıları. Geliştiriciler, N-yollu anahtarları (n giriş, m çıkış) desteklemek için burada somut bir şekilde uygulamalıdır.
  • Akış: İş akışı, eksiksiz tahmin işlevlerini uygulayan Modül ve Anahtarın bir dizi DAG kombinasyonu. Bir Modül birden çok akışla paylaşılabilir (bir istek yalnızca bir kez yürütülür).
  • biz: Business, birden fazla yapılandırılabilir iş akışından oluşan ve bir problem tahmin işletmesi için bir problem tahmin istemcisinin çağrılmasını destekleyen Business. Müşteri arayan sadece biz-id ile ilgilenir.
Beş, özet

Alibaba Xiaomi ailesini desteklemek için platform tabanlı bir proje olarak, birçok CCO dokunma hizmeti halihazırda uygulandı ve hala çok çalışıyorlar.Herkesin birlikte yakın bir şekilde çalıştığını ve herkesin katkısını gerçekten hissediyorum.

Son olarak, işe alım reklamı hazırlanır. Ali Xiaomi ekibi NLP'yi işe alır ve ilgili algoritma öğrencilerini önerir / tahmin eder. İlgileniyorsanız, lütfen şu adrese e-posta gönderin: shiwan.ch@alibaba-inc.com

Tencent Entertainment Tanıtım Belgesi 2018'de yayınlandı: Bebeğin kendi kendine pozlaması güzel olacak Cai Xukun, beklentileri karşılamayı vaat ediyor
önceki
Tottenham ustası 3 usta Bundesliga patronunu mağlup etti, Real Madrid Manchester United insanları kapmak için tasfiye edilen hasarları kırdı!
Sonraki
Baharatlı ve heyecan verici bir deneyim! 2019 Audi RS3 Sportback için test sürüşü
32 puanlık mağlubiyet, James: Utanç verici olduğumuzu biliyorum! Paul'ün oyundan sonraki sözleri seviyeli!
Ford Yeni Transit yarışını izledikten sonra büyük ödüller kazanmanın yanı sıra bu araba deneyiminin de çok önemli olduğunu fark ettim!
Manchester United'ın Şampiyonlar Ligi'ndeki paralel ithalatı eleştirmenleri fethetti, Mourinho defalarca övdü! Hala takımın ölü noktasını yansıtan bir sorun var
Ekibin Ar-Ge verimliliği nasıl artırılır? Ali mühendisleri yapar
Zaten Süper Lig'e adapte oldunuz mu? Brezilya'nın ilk dış yardım macerası sorgulandı, cevabı Li Xiaopeng verdi
Jiang Wutang: Tang Hanedanlığı tarihinin bu bölümü "Jian Wang 3" deki kızları seçmenize yardımcı olabilir.
Usta arı yakalayıcı! Sun Xingmin kariyerinde 9 gol attı ve Asya Kupası'ndan sonra arka arkaya 4 maç kaydetti!
60.000-500.000 yuan ile endişesiz SUV seçimi, gözleriniz kapalıyken sorun değil!
okuyamıyorum! Ne saldırı ne de savunma, peki ya liderlik? Küçük Thomas üzülerek gülümsedi!
Hangi seri üretilen arabalar New York rekorunu kırdı? Sadece hızlı koşmak değil!
E-ticaret arama algoritması teknolojisinin evrimi
To Top