Alimei Kılavuzu: Ali Xiaomi, Ali tarafından 2015 yılında piyasaya sürülen akıllı bir müşteri hizmetleri robotudur. 2017'de Double 11 sırasında, Ali Xiaomi'nin hizmet hacmi 6,43 milyona ulaştı ve bunun akıllı çözüm oranı% 95'e ulaştı ve genel hizmet hacminin% 95'ini oluşturdu. Son yıllardaki gelişmelerin ardından, akıllı müşteri hizmetleri robotlarının baskısını daha da çözüp çözemeyeceğimizi düşündüğümüz bir sorun haline geldi. Bugün, Xiaomi Robot Lab'den Ichimaru, herkesi birlikte düşünmeye yönlendiriyor.
1. Arka plan tanıtımıGerçek hizmet bağlantısında, Alibaba'nın Xiaomi akıllı müşteri hizmetleri serisi, manuel müşteri hizmetlerinin baskısını büyük ölçüde azalttı, ancak akıllı müşteri hizmetleri robotlarının baskısının daha da çözülüp çözülemeyeceği, düşündüğümüz bir sorun haline geldi. Bu nedenle, kullanıcı robotla etkileşime girmeden önce kullanıcının niyetini tahmin etmek için yapay zeka teknolojisini kullanan ve kullanıcıların aktif veya pasif bir hizmette mevcut sorunları çözmelerine yardımcı olan tahmin platformu projesini başlattık.
Şu anda, tahmin platformunun çekirdeği iki kapasite geliştirme, sipariş tahmini problem tahmini etrafında dönüyor.
Sipariş tahmini : Kullanıcının sorunla karşılaştığı sırayı tahmin edin
Problem tahmini : Kullanıcıların ne tür sorunları olduğunu tahmin edin
Ayrıca senaryo tahmini (kullanıcının hesap, lojistik, haklar vb. Gibi ne tür sorunlar olduğunu tahmin etme), ön bilgi tahmini (olumlu ve olumsuz kalıplar ve sıralama), kullanıcı tahmini (gelen çağrıları tahmin etme) Hangi Taobao kimliği sayıdır) vb.
2. Ürün tanıtımıTahmin platformunun yarım yıldan fazla bir süredir geliştirilmesinden sonra, CCO'nun Alibaba Xiaomi, Xiaomi, Hotline Xiaomi, XSpace, Vientiane vb. Gibi çeşitli hizmet son ürünlerini ele aldık. Aşağıdaki ürün formlarına ve ürünlerine bir göz atalım. Etki.
Ali Xiaomi:
Yukarıdaki resim sipariş tahmini, soru tahmin tahmin formu ve soru tahmin bot formu olan Alibaba ve Xiaomi'nin iniş sahnesi.
Ali Xiaomi'ye ek olarak aşağıdaki senaryoları da ele aldık:
Mevcut algoritmanın temel yetenekleri aşağıdaki şekilde gösterilmektedir: Yardım hattı sipariş tahmini (kullanıcı tanımlama + sipariş konumlandırma), çevrimiçi Xiaomi problem tahmini (amaç saptırma + sipariş konumlandırma + geri çağırma tahmini gibi farklı iş senaryoları için farklı algoritma yetenekleri bir araya getireceğiz) + Hedef tahmin), her bir alt modül burada çok fazla açıklanmayacaktır.Bu bölüm esas olarak buradaki algoritma mantığını tanıtmaktadır. Spesifik uygulama yöntemleri için Bölüm 4'e bakınız.
Tahmin / tavsiye, olağan algoritma teknolojisi esas olarak sınıflandırma problemleri veya sıralama problemleri ile çözülür. Daha önce, nispeten temel özellik mühendisliği + RF metodu ve WD modelini de denedik.Ayrıca, yukarıdaki şekildeki farklı yetenek modüllerinde de denedik Label-lda / xgboost ve diğer algoritmalar, tüm tahmin platformu algoritma teknolojisi modülü nispeten daha fazla bölündüğü için, bugün paylaşımımız esas olarak problem tahminine dayanmaktadır, bu bölümde, son aylarda problem tahmininde bazı ilerlemelere odaklanıyoruz, spesifik akım Çevrimiçi problem tahmin modeli aşağıdaki tabloya başvurabilir (MV-DSSM karşılaştırılmaktadır).
3.1 Temel problem tahmini modeli
Son aylarda, işimizi desteklemek için deep-ctr'ye odaklandık.Özellikle, farklı işletmelerde DeepFM, PNN (IPNN) ve DCN'nin üç modelini karşılaştırdık veya piyasaya sürdük. DCN'yi bir örnek olarak ele alırsak, Geniş ve Derin'in bir uzantısı olarak, DCN modeli büyük ölçekli seyrek ve yoğun özellikleri etkili bir şekilde öğrenebilir ve düşük hesaplama ek yüküne sahip (daha az parametre) özellikler arasındaki çapraz ilişkiyi etkili bir şekilde kavrayabilir. Aşağıdaki şekil, literatürdeki ağ yapısını göstermektedir:
Resim kaynağı "Reklam Tıklaması Tahminleri için Derin ve Çapraz Ağ" Ruoxi Wang, 2017. Çapraz ağ yapısı formunda, her katman xl + 1 xl kalıntısına uyacak şekilde bir çapraz harita f: d d özelliğini öğrenir. Bir yandan, her bir katman tarafından öğrenilen eşleme f, çapraz özelliklerin doğrusal olmayan bir eşlemesidir ve daha sonra kalıntıları yerleştirerek, ağırlıkların hassasiyeti geliştirilir, bu da seyrek giriş için daha uygundur ve diğer yandan, genel ağ için uygundur. Geri yayılma, ağ eğitiminin verimliliğini artırır. Sağda, orijinal giriş özelliklerinin doğrusal olmayan bir eşlemesi olan genel tam bağlı katman ve son bağlanan katman softmax'tır.Ek olarak, DeepCTR algoritmalar serisinde bazı iyileştirmeler yaptık. DeepCTR modelini daha çok yönlü hale getirmek için Kaggle yarışmasına atıfta bulunuyoruz: Mercari Price Suggesion'un özellikle şunları içeren 4. çözümü:
3.2 Pekiştirmeli öğrenme
Son zamanlarda, derin ctr temel modeline (özellik alanı daha büyüktür, ancak eğitim süresi daha uzundur, güncelleme daha yavaştır) dayalı olarak bilgi işlem platformu ekibiyle birlikte çalışıyoruz ve yeniden kayıt için drl (ctr-skoruna ve bazı geri bildirim verilerine göre gerçek zamanlı çevrimiçi olarak) , Tıklama oranını / çözüm oranını / memnuniyet oranını ve diğer hedefleri güçlendirmek için bölüm modellemesi için sıralı bir sıralama yöntemi oluşturarak.
3.3 Akış hesaplama
Artık problemleri tahmin etme yeteneğimiz olduğuna göre, tahmin etmeden önce neden kullanıcıların hizmet kanallarımıza girmesini beklediğimizi düşünmek kolay mı? Kullanıcılar Taobao'yu kullanırken, kullanıcı sorunlarını aktif olarak tahmin ederken ve kullanıcılara mümkün olan en kısa sürede ulaşmak için mesajlar gönderirken, kullanıcılara Alibaba Xiaomi'ye gelmelerini hatırlattıklarında kullanıcı günlüklerini neden gerçek zamanlı olarak izlemiyoruz ve sorunlarının çözülmesine yardımcı olabiliriz. Bu, akış hesaplama özelliklerinin kullanılmasını gerektirir.
Model şu anda geri çağrılan kullanıcılar için% 86,42'lik bir doğruluk oranına sahiptir;% 0,1 kapsama oranıyla tüm kullanıcılar için aktif hizmet senaryolarının gerçek zamanlı hesaplamasını simüle eder. TextCNN yöntemi ilk olarak Kim Yoon tarafından "Cümle Sınıflandırması için Evrişimli Sinir Ağları" nda metin duyarlılığı sınıflandırması sorununu çözmek için önerildi. Mühendislik alanında, genellikle LSTM gibi karmaşık serileştirme modellerine bir alternatif olarak kabul edilir.Önerilen touch2vect kodlamamıza göre ve sınıflandırma için geliştirilmiş TextCNN sekans verileriyle birleştirildi. Birincisi, çok sayıda kullanıcının sayfaya göz atma yoluna ve daha sonra karşılaşılan sorunlara bağlı olarak, arkasındaki "anlamsal bilgi" denetimsizdir ve bir kodlama modeli olarak kaydedilir. Gömme temsili aşamasında, sistem günlüklere erişim (manuel Tao, Tmall) ve kullanıcının serileştirilmiş sayfa tarama yolu (sayfa 1) aracılığıyla gerçek zamanlı olarak göz atar. > Sayfa 2 > > Sayfa N) girdi olarak iki boyutlu bir vektör olarak kodlanır, serileştirilmiş gizli mod CNN aracılığıyla çıkarılır ve son olarak model tarafından etkinleştirilen en üst "problem / bilgi" tahmin sonucu olarak kullanılır.
Bu alt proje şu anda devam etmektedir ve çevrimdışı değerlendirme etkisinin% 1,5 geri çağırma olduğu varsayımıyla doğruluk oranı% 86,3'tür. Rnn tabanlı model kullanılmamaktadır, birincisi rnn performansının görece zayıf olması ve yüksek log QPS öncülüğünde daha zahmetli olmasıdır; diğeri ise modelin mevcut ilk versiyonunun, modelin araştırma sonuçlarını etkilemeyecek kadar karmaşık olmasını önlemek için nispeten basit bir keşfe odaklanmasıdır. Elbette bazı serileştirilmiş modelleri deneme planları var.
4. Platform çözümüne girişErken ve hızlı iş desteği iniş sonuçlarıyla, aşağıdaki darboğazlar aşamalı olarak keşfedildi:
Bu nedenle, bu yıl tüm platformlaşma sürecini başlattık. Genel işlevler arasında çeşitli tahmin hizmetleri için entegre bir platform sağlayan algoritma akış motoru, getirme, özellik mühendisliği, model eğitimi, algoritma gri tonlama, çevrimiçi değerlendirme, otomatik indirgeme ve otomatik başlatma vb. Yer alır. Şu anki aşamadaki temel çalışma, temel olarak algoritma yeteneklerinin modülerleştirilmesi (seri ve programlanabilir algoritma akış motoru, algoritma yeteneklerinin yeniden kullanılması, işe hızlı yanıt verme ve algoritma efektlerinin hızlı doğrulanması yoluyla), birleşik veri kaynakları ve özellik mühendisliği (algoritmalara izin verme) üzerinedir. Öğrenciler algoritma uygulamasına ve algoritma etkilerini doğrulamaya odaklanır), birleşik algoritma hizmeti yönetimi ve model değerlendirmesi (algoritma değerlendirme kodunun tekrar tekrar geliştirilmesini önlemek için), algoritma hizmetlerinin otomatik olarak güncellenmesi (model sürümünün verimliliğini artırın ve modelin zamanında olmasını sağlayın), çevrimiçi öneri tıklama verilerinin otomatik geri dönüşü (Model etkisini iyileştirmek için çevrimiçi veriler aracılığıyla modeli yeniden beslemek).
Spesifik plan yukarıdaki şekilde gösterilmektedir ve çekirdek aşağıdaki dört bölüme ayrılmıştır:
1. Yürütme motoru, tahmin yetenekleri sağlamak için tahmin sürecini birbirine bağlar Öngörme sürecinin bileşenli dönüşümü sayesinde, sistem daha iyi ölçeklenebilirliğe sahiptir.İş senaryosu kapsamı, önceki kod geliştirmeden yapılandırma desteğine dönüştürülür.
2. Çevrimdışı hesaplama bölümü, veri kaynağı esas olarak üç bölümden gelir, odps offline + TT log + TC ve diğer çevrimiçi arayüzler, bir bölüm kural bölümünün hesaplanması için kullanılır ve diğer bölüm, çevrimdışı eğitim ve gerçek zamanlı algoritmalar için girdi verileri olarak odps'a çıktı olarak verilir.
3. Gerçek zamanlı hesaplama kısmında, veri kaynağı esas olarak kullanıcının çevrim içi gerçek zamanlı log verilerinden gelir.Gerçek zamanlı hesaplama Blink ve EAS servisleri ile yapılır ve tahmin sonuçları çıkarılır. Entegrasyon.
4. Tahmin platformu yönetimi arka planı, temel olarak tahmin hizmetlerinin işletimi ve bakımı için kullanılır, algoritma hizmet yönetimi sağlar, akış yönetimi tahmin eder, çevrimiçi otomatik algoritmayı destekler, gri seviye kontrolü ve algoritma hizmeti bozulmasını destekler.
Algoritma akış motoru şeması yukarıda gösterildiği gibidir
Alibaba Xiaomi ailesini desteklemek için platform tabanlı bir proje olarak, birçok CCO dokunma hizmeti halihazırda uygulandı ve hala çok çalışıyorlar.Herkesin birlikte yakın bir şekilde çalıştığını ve herkesin katkısını gerçekten hissediyorum.
Son olarak, işe alım reklamı hazırlanır. Ali Xiaomi ekibi NLP'yi işe alır ve ilgili algoritma öğrencilerini önerir / tahmin eder. İlgileniyorsanız, lütfen şu adrese e-posta gönderin: shiwan.ch@alibaba-inc.com