Alibaba Xiaomi bu yıl hangi teknolojik değişiklikleri yaşadı?

Kapak fotoğrafı: Ali Photography School

Alibaba'nın kılavuzu: 2017'de Alibaba Xiaomi, Alibaba'dan sektöre taşındı ve Çin'den dünyaya, İngilizce, Portekizce, İspanyolca, Endonezyaca, Tayca'yı kapsayan ve AE ve Lazada denizaşırı işlerini güçlendirerek; PC ve kablosuz, PC, kablosuz ve yardım hattına doğru hareket ederek, birçok uçta güç sağlar; Ali Xiaomi, akıllı insan-bilgisayar etkileşiminden akıllı insan-bilgisayar işbirliğine tamamen geçiş yaptı.

Bugün, Xiaomi Robot X Lab'ın kıdemli algoritma uzmanı Hai Qing'i, Xiaomi'nin teknolojik gelişiminin bir yılını paylaşmaya davet ettik.

1. Ekolojik alanda düşünme ve Ali'nin Xiaomi platformu

1. Ekolojik alanda düşünmek

Küresel alanda yapay zekanın sürekli yükselişiyle birlikte, akıllı asistanlar, akıllı hizmetler, IoT, vb. Alanlarda büyük küresel şirketlerden girişimlere kadar zorlu bir rekabete giren dallardan biri olarak chatbot insan-bilgisayar etkileşimi savaş alanına katıldı ve bazı benzersiz Dikey alan yoğun bir şekilde gelişmeye başladı. Son iki yılda insan-bilgisayar etkileşimi alanının geliştirilmesinde, bir yandan To C ucu çeşitli giriş alanlarında (örneğin: IOT alanındaki akıllı hoparlörler) daha şiddetli rekabetle karşı karşıya ve dikey alan sahneleri daha alt bölümlere ayrılmış ve zengin. Öte yandan To C pazarındaki rekabet To B pazarına yönelmeye başladı.Google, Microsoft, Facebook, Amazon, Baidu, NetEase ve birçok startup To B alanında IaaS, PaaS veya SaaS yetenekleriyle konuşlanmaya başladı ve temelde etrafında dönmeye başladı. Aşağıdaki iki sistemde çıktı:

  • IM ekosistemi etrafında çıktıyı bağlama. Örneğin: Facebook'un messager platformundaki wit.ai robot platformu çıktısı, Tencent ayrıca WeChat gövdesi tarafında kendi robot platformunu da kademeli olarak geliştiriyor.

  • İşletmeler veya geliştiriciler için bağımsız üç partili platform çıktısı. Örneğin: Amazon'un Lex platformu, Microsoft'un AI Çözümü, Google'ın AI SDK ve Api.ai, Netease Seven Fish vb.

2. Çevre odaklı Ali Xiaomi platformu

İnsan-bilgisayar etkileşimi endüstrisinin ekolojik alanının gelişimi bağlamında, akıllı hizmetler alanı için Ali Xiaomi de son iki yılda sürekli olarak iyileştiriliyor ve değişiyor:

  • To C tarafında, hibrit istihbarat + insan modelini kademeli olarak yükseltmeye ve geleneksel hizmetleri daha geniş servis alanlarına genişletmeye devam ediyoruz. Geleneksel hizmetlerin zekasına ek olarak, akıllı alışveriş rehberi hizmetlerini, akıllı asistan hizmetlerini ve sohbeti de genişletiyoruz. Servis vb. Platforma ve servise dayalı birden fazla alana yükseltme

  • To B tarafında, Alibaba Xiaomi, Taobao'dan Alibaba'nın endüstri ekolojisine, ikinci halka iş ekolojisine ve üçüncü halka kurumsal platformuna kademeli olarak genişledi.

Son olarak, Alibaba ekosistemine, tüccar ekosistemine ve kurumsal ekosisteme bakan tüm Alibaba Xiaomi platformunun tüm sisteminin büyük bir resmi oluşturulur:

  • Tüketicilerle yüzleşmek: Super Xiaomi, Taobao ekosisteminde kademeli olarak derinlemesine araştırmalar yaptı: hizmet odaklı, alışveriş rehberi, asistan ve küçük sohbet

  • Ali endüstri ekosistemiyle yüzleşmek: Ali Group ekolojisini AE, ICBU, 1688, Cainiao, Flying Pig, Xianyu, Taopiao, Ali içeride ve dışarıda dahil olmak üzere platform yetenekleriyle 30'dan fazla BU ile güçlendirin.

  • Satıcı ekosistemiyle yüzleşmek: Qianniu platform ekibiyle işbirliği yapın, IM mesaj sistemine dayalı bir mağaza Xiaomi sistemi oluşturun ve tüccarlara otomatik + yarı otomatik manuel yardım ve akıllı diyalog yetenekleri sağlayın

  • Kurumsal ekosistemle yüzleşmek: DingTalk kurumsal iletişim ekosisteminin anlık mesajlaşma sistemine ve Alibaba Cloud'daki tüm kurumsal açık ekosisteme güvenen kurumsal Xiaomi ve Yunxiaomi, kurumsal güçlendirme yoluna da girdiler.

Geçtiğimiz 2017'de Ali Xiaomi, Ali'den sektöre geçerek tüccarları ve işletmeleri Çin'den dünyaya, İngilizce, Portekizce, İspanyolca, Endonezce, Tayca'yı kapsayan ve AE ve Lazada'nın denizaşırı işlerini güçlendirerek; PC'den, Kablosuz, PC, kablosuz ve yardım hattına taşındı ve birçok uçta güçlendi; Ali Xiaomi, akıllı insan-bilgisayar etkileşiminden akıllı insan-bilgisayar işbirliğine tamamen geçti.

  • Geçtiğimiz 2017'de Ali Xiaomi, yıl boyunca 340 milyon Taobao tüketicisine hizmet verdi; bunun 9.04 milyonu Double 11'de alındı, akıllı hizmetler% 95'ti ve akıllı hizmet çözüm oranları% 93.1'e ulaştı.

  • Geçtiğimiz 2017'de, Xiaomi tarafından tüccarları güçlendirmek için yetkilendirilen mağaza sayısı 30w'ye ulaştı ve bunun Double 11'deki robot görüşme sayısı 100 milyonu aştı.

  • Geçtiğimiz 2017'de, DingTalk'u güçlendiren şirketlerin sayısı 10.000'i aştı; Ekim 2017'de Yunqi Konferansı resmi olarak bulut Xiaomi'yi açtı.Şimdiye kadar Lazada'nın Güneydoğu Asya hizmet işini güçlendirdi ve kademeli olarak birden fazla sektördeki birçok büyük şirketle işbirliği yaptı. Orta ölçekli işletmeler bulut hizmet sistemini teşvik ediyor

Xiaomi teknolojisi bu yıl

Teknik açıdan bakıldığında, geçtiğimiz yıl tüm Alibaba Xiaomi platformu, platformlaştırma ve etki alanı oluşturma etrafında sürekli olarak iyileştirildi ve geliştirildi:

Mimari sistem tarafı: SaaS ve PaaS sistemleri etrafında, ön uç ve arka uç sistemleri kademeli olarak modüler hale getirin ve tüm platform sistemini kademeli olarak iyileştirin ve oluşturun

Algoritmik taraf: Gerçek iş senaryolarıyla birlikte tek bir alanda kademeli olarak derinlemesine keşifler yapın ve yenilik yapmaya devam edin

1. Ön uç ve arka uç mimari sistemi

Ön uç mimari sistem

İşe hızlı bir şekilde yanıt vermek ve diğer iş senaryolarına hızla erişmek için Alibaba Xiaomi platformu, ön uç mimarisinde WebApp teknoloji seçimini kullanıyor. WebApp, deneyim ve işlevler açısından Yerel Uygulamadan biraz daha düşük olsa da, iş ihtiyaçlarına hızlı yanıt verme ve diğer uygulamalara hızlı erişim açısından Native'e göre bariz avantajlara sahiptir. 3 ana sürümün sürekli yükseltilmesi ve dönüştürülmesinden sonra, aşağıdaki şekilde gösterildiği gibi, modüllere bölünmüş 7 katmanlı bir ön uç mimari sistemi oluşturulmuştur:

  • Sektör özelleştirme katmanı: Farklı sektörleri Ali Xiaomi platformuna bağlayan ve kullanıcı arayüzünü, hizmetleri ve eklentileri yerleşik açık spesifikasyonlar altında özelleştiren modüller

  • Bağlam katmanı: koa.js / express.js tasarımına benzer, bu nesneye view / util / request / pipeline / channel gibi core modülleri ve bu bağlamda mesaj bileşenleri, iş modülleri vb. Çalıştırılır. Xiaomi platformundaki farklı işletmelerin özel özelleştirme ihtiyaçlarını karşılamak için bunu kolayca genişletebiliriz

  • Kanal katmanı: Kullanıcı girdisi, farklı senaryolarda farklı işleme nesnelerine gönderilecektir.İşleme nesnelerine "kanallar" diyoruz. Mevcut kanallarda sadece robotlar ve insan müşteri hizmetleri olmasına rağmen, mimaride herhangi bir sayıda kanalı destekleyebiliriz. Konuşma kanallarını kolayca değiştirin

  • Mesaj katmanı: "Konuşma" sürecindeki belirli işlevler, belirli mesaj türlerine sahip bileşenlere soyutlanmıştır. Bu bileşenler, farklı kanallarda yeniden kullanılabilir. Ali Xiaomi platformunun işlev uzantılarının% 90'ı, mesaj katmanı aracılığıyla kolayca uygulanabilir.

  • İş bileşeni katmanı: "konuşma dışı katman" işini bu katmana soyutlayarak seri yükleme, genişletme ve diğer işlevleri sağlar

  • Görünüm katmanı: Tipik WebIM işlevleriyle, girdi, çıktı, addPlugin vb. API'ler sağlar.

  • İstemci özelleştirme katmanı: farklı APP taraflarındaki farklı endüstri hizmetlerinin özelleştirme katmanına uyum sağlayın

Arka uç mimari sistemi

  • Ali ekosistemi, iş ekosistemi ve kurumsal ekosistem için PaaS ve SaaS çıktılarını destekleyen tüm Alibaba Xiaomi platformunun platformlaşmasıyla karşı karşıya

  • Tüm diyalog yönetimini ve süreç modülerizasyonunu modüler hale getirin ve takılabilir algoritmalar ve iş modülleriyle paralel bir mimari sistemi oluşturun

2. Algoritma sistemi

Algoritma sistemi, tüm algoritma sistem modelini farklı senaryolar için optimize etmeye ve yükseltmeye devam ediyor. 2017 yılında Ali Xiaomi platformunun algoritma sistemi de alan ve platform sistemine uygun olarak güncellenmeye ve geliştirmeye devam etti.Tüm insan-bilgisayar etkileşim mimarisi aşağıdaki gibidir:

  • Niyet tanıma: Dilin gerçek niyetini anlayın, niyeti sınıflandırın ve niyet niteliğini çıkarın. Niyet, sonraki alan tanıma sürecini belirler. Bu nedenle, niyet katmanı, niyetin tamamlanması, amaç sınıflandırması ve niyet aktarımını tamamlama amacını sürekli olarak açıklığa kavuşturmak ve bu amaçla ilgili gerekçelendirmek için bağlam veri modeli ile alan veri modelini birleştiren bir süreçtir. Tüm niyet tanıma, modele ve ayrı bir algoritma seçimine göre birleştirilebilir

  • Diyalog yönetim sisteminin kontrolü sayesinde, farklı alan senaryoları için farklı alan teknolojileri benimsenir:

  • QA Bot: Bilgi grafiği, geleneksel IR ve DeepMatch yöntemleri aracılığıyla eksiksiz bilgi sorusu ve yanıt eşleştirmesi

  • Görev Botu: Çok alanlı teknolojiler için eksiksiz görev tabanlı diyalog oluşturma ve Soru-Cevap

  • Sohbet Botu: Sohbet botunun Soru-Cevap bölümünü tamamlayın

  • Rec Bot: Önerilen robot için soru cevap sisteminin yapımını tamamladı

  • MC Bot: Belgenin yapılandırılamadığı senaryolarda (Taobao veya iş etkinliği senaryoları gibi), soru ve cevabı tamamlamak için Makine Okumasını kullanın

İşte genişletmek için birkaç ilginç görev.

Transfer öğrenme altında DeepQA keşfi

Alibaba'nın Xiaomi platformunun sürekli genişlemesi ile, kullanıcıların yalnızca C odaklı mobil alışverişte hizmet danışmanlığı sorunlarını çözmelerine yardımcı olmak değil, aynı zamanda yeni alanlarda ve uluslararasılaştırmada görevler üstlenmelerine de yardımcı olmak gerekiyor ve bu alanlarda yetersiz etiketleme verisi var. Veya elde edilmesi zor sorunlar (örneğin, AliExpress'teki İspanyol sahnesi). Buna dayanarak, küçük veri alanında QA eşleştirme efektini optimize etmek için mevcut ek açıklama verilerini kullanmayı umuyoruz ve aktarım öğrenimi bu konuda önemli bir rol oynayabilir. Temel fikri, yeni bir ortamda öğrenme görevlerine yardımcı olmak için bir ortamdan öğrenilen bilgileri kullanmaktır. Bu nedenle, bu senaryoda, QA eşleştirme problemini modellemek için bir DRSS-Adv aktarım öğrenme modeli öneriyoruz.

Genel olarak iki tür TL modeli vardır, biri denetimsiz, diğeri denetimli. İlki, hedef alanda hiç etiketlenmiş veri olmadığını varsayar ve ikincisi, hedef alanda yalnızca az miktarda etiketlenmiş veri olduğunu varsayar. Ayrıntılar için literatür taramasına bakabilirsiniz. İşimizde, esas olarak derin sinir ağı (DNN) ile birlikte denetimli transfer öğrenme teknolojisine odaklanıyoruz. Bu ayar altında iki ana çerçeve vardır, biri Tamamen paylaşılan (FS) ve diğeri Özel-paylaşılan (SS). Çerçeve diyagramı aşağıdaki gibidir:

Takviye öğrenmeye dayalı akıllı alışveriş rehberi

Akıllı alışveriş rehberi temel olarak, kullanıcıların niyetlerini sürekli olarak anlamak ve netleştirmek için kullanıcılarla birden fazla etkileşim turunu destekler. Ve bu temelde, alışveriş rehberlerinin etkileşimli sürecini sürekli olarak optimize etmek için derin pekiştirmeli öğrenme kullanılır. Aşağıdaki şekil akıllı alışveriş rehberinin teknik mimarisini göstermektedir:

Burada iki temel sorun var:

a: Birden çok etkileşim turunda kullanıcının niyetini anlayın.

b: Kullanıcının niyetine göre sıralama sonucunu ve etkileşim sürecini optimize edin. Aşağıdakiler temel olarak alışveriş rehberi niyetlerinin anlaşılmasını ve derinlemesine pekiştirmeli öğrenme için etkileşimli stratejilerin optimizasyonunu tanıtmaktadır.

Akıllı alışveriş rehberinin niyet anlama ve niyet yönetimi

Akıllı alışveriş rehberi kapsamındaki amaç anlayışı, esas olarak kullanıcıların satın almak istediği ürünleri ve ürünlerin bunlara karşılık gelen özelliklerini belirlemektir. Geleneksel niyet anlayışıyla karşılaştırıldığında, birkaç yeni zorluk da beraberinde getirir:

1. Kullanıcı kısa cümleleri tercih eder. Bu nedenle, kullanıcının niyetini belirlemek için, kullanıcının birden fazla konuşma turunu ve niyetin sınırını birleştirmek gerekir.

2. Birden fazla etkileşim turunda, kullanıcılar niyetin alt amaçlarını eklemeye veya değiştirmeye devam edecek ve halihazırda tanınan bir dizi amacı muhafaza etmeleri gerekecektir.

3 Meta niyetleri birbirini dışlayan, benzer ve ikincildir. Farklı ilişkiler, farklı niyet yönetimine karşılık gelir.

4. Öznitelik amacının sınıflandırma ve karşılıklı dışlama sorunu vardır.

İfade ifadesi için, kategori yönetimi ve öznitelik yönetimi yoluyla, ifade ifadesini, amaç sınırlarını ve belirli amaç değiştirme ve değiştirme mantığını daha iyi çözen bir amaç yığını sürdürüyoruz. Aynı zamanda, daha büyük bir ürün kitaplığı sorununa yanıt olarak, ürün tanımlamayı çok verimli hale getirmek için anlamsal indeksleme ile birleştirilmiş bir bilgi grafiği kullanıyoruz. Aşağıda sırasıyla kategori yönetimi ve özellik yönetimini tanıtıyoruz.

Bilgi grafiği ve anlamsal indekse dayalı kategori yönetimi

Akıllı alışveriş rehberi senaryosunda kategori yönetimi, kategori tanımlama ve kategori ilişki hesaplaması olarak ikiye ayrılır. Aşağıdaki şekil, kategori ilişkisinin mimari diyagramıdır:

Kategori tanıma

Bilgi grafiğine dayalı bir tanıma şeması ve anlamsal indeks ve dssm'ye dayalı bir ayırt edici model benimsenmiştir.

a: Ürün bilgi grafiğine dayalı tanıma şeması: Bilgi grafiğinin karmaşık yapı yeteneğine bağlı olarak, ürün kategorisi tanıma yapılır. Ürün tanımlamamızın temelidir.

b: Anlamsal indeksleme ve dssm ürün tanıma modeline dayalı bir şema: Bilgi grafiği tanıma şemasının avantajı, yüksek doğruluğu, ancak tüm durumları kapsayamaz. Bu nedenle, anlamsal indeksleme ve dssm kombinasyonuna dayalı bir ürün tanımlama şeması öneriyoruz.

Anlamsal dizin oluşturma

Genel olarak, anlamsal indeksin oluşturulması ontoloji tabanlı bir yaklaşıma ve LSI tabanlı bir yaklaşıma sahiptir. Arama tıklama verilerini ve kelime vektörlerini birleştirerek oluşturulan anlamsal bir indeks kullanıyoruz. Esas olarak aşağıdaki adımları içerir:

1. Kategoriye kelime segmentasyonu için adayları ayıklamak için arama tıklama davranışını kullanın.

2. Kelime vektörüne bağlı olarak, kelime segmentasyonu ve aday kategori arasındaki benzerliği hesaplayın ve indeksi yeniden sıralayın.

DSSM'ye dayalı emtia tanıma

dssm, Microsoft tarafından önerilen, kelime boşluğu sorununu daha iyi çözebilen ve cümlelerin içsel anlamlarını yakalayabilen, sorgu ve belge eşleştirmesi için denetimli bir derin anlamsal eşleştirme ağıdır. Dssm'ye dayalı olarak, bu makale sorgu ve aday kategorileri için bir benzerlik hesaplama modeli oluşturur. İyi sonuçlar elde edilmiştir Modelin hız testi setinde yaklaşık% 92'dir.

Örnek yapı: Pozitif eğitim örneği, sorgu aranarak ve arama günlüğündeki kategorilere tıklanarak oluşturulur. Negatif örnekler, bazı benzer kategorileri almak için tohumlar olarak sorgu ve tıklama kategorilerini kullanır ve pozitif örnekte olmayan kategorileri negatif örnekler olarak kullanır. Pozitif ve negatif örneklerin oranı 1: 1'dir.

Kategori ilişkisi hesaplama

Kategori ilişkilerinin hesaplanması esas olarak akıllı alışveriş rehberlerinin niyet yönetiminde kullanılır Burada ele alınan ana ilişki türleri şunlardır: alt ve benzer ilişkiler. Örneğin, kullanıcının ilk niyeti kıyafet satın almaktır.İkinci niyet bir su bardağı satın almak dediğinde, önceki giysilerin nitelikleri su bardağına miras bırakılmamalıdır. Aksine, kullanıcı şu anda pantolon istediğini söylüyorsa, pantolonlar bir alt giyim kelimesi olduğundan, kıyafetlerin üzerindeki özellikler miras alınmalıdır.

Üst ve alt ilişkilerin hesaplanması için iki şema:

1. Bilgi grafiklerine dayalı ilişkisel işlemleri kullanın.

2. Kullanıcının arama sorgusu aracılığıyla çıkarma.

İki benzerlik hesaplama şeması:

1. Aynı hypernym'e göre. Örneğin, Xiaomi ve Huawei'nin süper kelimeleri cep telefonlarıdır, ancak benzerler.

2. Hızlı metin kategorisi kelimelerine göre yerleştirmenin anlamsal benzerliği.

Bilgi grafiği ve benzerlik hesaplamasına dayalı öznitelik yönetimi

Aşağıdaki şekil, öznitelik yönetiminin mimari diyagramıdır:

Genel olarak öznitelik yönetimi iki temel modül içerir: öznitelik tanıma ve öznitelik ilişkisi hesaplama Düşünme ve kategori yönetimi benzerdir. Burada ayrıntılara girmeyeceğim.

Derin Pekiştirmeli Öğrenmenin Keşfi ve Girişimi

Takviye öğrenme, ajanın çevreden davranışa haritalama öğrenmesidir.Amaç, ödül sinyalinin (takviye sinyali) değerini en üst düzeye çıkarmaktır ve çevre, eylemin kalitesini değerlendirmek için takviye sinyali sağlar. Temsilci, sıralı karar problemleri için uygun olan dış ortamı sürekli araştırarak optimal bir karar stratejisi elde eder. Aşağıdaki şekil, pekiştirmeli öğrenme modeli ile çevre arasındaki etkileşimin bir göstergesidir:

Derin pekiştirmeli öğrenme, esas olarak derin öğrenmenin güçlü doğrusal olmayan ifade yeteneğini temsilcinin karşı karşıya olduğu durumla ilgili durumu ve karar mantığını ifade etmek için kullanan derin öğrenme pekiştirmeli öğrenmenin bir kombinasyonudur. Şu anda, DRL'yi esas olarak etkileşim stratejimizi optimize etmek için kullanıyoruz. Bu nedenle, bizim ayarımız, kullanıcının pekiştirmeli öğrenmede ortam olduğu ve makinenin model olduğu şeklindedir. Eylem, bu turda etkileşimli bir sorgulama olup olmadığı veya arama sonucunun doğrudan görüntülenip görüntülenmediğidir. Durum tasarımı: Buradaki durum tasarımı, esas olarak kullanıcının çoklu niyet turlarını, kullanıcının grup bölümünü ve her etkileşim turunun ürün bilgilerini mevcut makine tarafından algılanan durum olarak ele alır. durum = (intent1, query1, price1, isclick, queryitemsim,, power, userinter, age) burada intent1 kullanıcının mevcut amacını ve query1 kullanıcının orijinal sorgusunu belirtir. price1 şu anda kullanıcıya görüntülenen ürünün ortalama fiyatını, isclick, bu etkileşim turunda bir tıklamanın olup olmadığını ve queryitemsim, sorgu ile öğe arasındaki benzerliği temsil eder. Güç, kullanıcının satın alma gücünü, userinter, kullanıcının ilgisini ve yaş, kullanıcının yaşını temsil eder.

Ödül tasarımı: Çünkü son ölçüm, kullanıcının işlemi ve tıklama oranı ile konuşma sayısıdır. Bu nedenle, ödül tasarımı temel olarak aşağıdaki 3 yönü içerir:

a: Kullanıcının tıklamasının ödülü 1 olarak ayarlanmıştır

b: İşlem olarak ayarlanmıştır

c: 0.1DRL'ye ayarlanmış geri kalan şemaların seçimi: Buradaki spesifik şemalar esas olarak üç şema benimser: DQN, politika eğimi ve A3C.

Yapılandırılabilir Bot Framework sistemi üzerine kurulmuştur

Ali Xiaomi platformunda ayrıca sistem verilerini dinamik olarak elde etmesi gereken bir senaryo vardır ve tüm süreç nispeten kişiselleştirilmiştir.Bu senaryo çok az sistem verisine sahiptir veya hiç yoktur ve ilgili ERP ve diğer sistemlerle bağlanması gerekir, bu yüzden Kişiselleştirilmiş görev sistemini tamamlamak için ilgili kurumsal operasyon veya geliştirme öğrencilerinin özelleştirilmesini karşılamak için bir dizi Bot Çerçeve sistemi.

BFW1.0 sisteminin tamamı şunları destekler:

1. Birden fazla diyalog sürecini özelleştirin

2. Özel amaç, varlık ve varlık değeri

3. Çok yönlü etkileşimli platformlarda üçüncü taraf arayüzlerin erişimini destekleyin

Bununla birlikte, BFW1.0'ın tamamı karmaşık hizmetler ve geliştiriciler için yeterince esnek değil. Bu nedenle, 2018'de, chatflow sistemine uygun olarak BFW1.0'ı BFW2.0'a yükselttik.

Alma modeli ve derin öğrenme modelinin kombinasyonuna dayalı sohbet uygulaması

Akıllı sohbetin özellikleri: hedefe yönelik olmayan, belirsiz anlamsal amaç, genellikle beklenen anlamsal alaka ve kademeli, nispeten düşük doğruluk gereksinimleri. Açık alan odaklı sohbet robotları şu anda hem akademi hem de endüstride büyük bir sorundur.Genellikle bu aşamada diyalog tasarımı yapmanın iki yolu vardır: Biri, akademide çok popüler olan derin öğrenme üretken model yöntemidir. Aşağıdaki şekilde gösterildiği gibi, LSTM aracılığıyla Diziye Sıra oluşturmak için Kodlayıcı-Kod Çözücü modelini kullanın:

Nesil Modeli: Avantajlar: Cevaplar derin anlambilim yoluyla üretilir ve cevaplar derlemin boyutu ile sınırlı değildir.Dezavantajlar: Model çok yorumlanabilir değildir ve tutarlılık ve makul cevaplar sağlamak zordur

Başka bir yol da Yuchao'nun soru-cevap eşleşmesini geleneksel geri çağırma modeliyle oluşturmaktır. Erişim Modeli: Avantajlar: Cevaplar önceden belirlenmiş derlemede, kontrol edilebilir, eşleştirme modeli nispeten basit ve yorumlanabilirlik güçlü.Dezavantajlar: Bir dereceye kadar, bazı anlambilimden yoksun ve sabit bir külliyatın sınırlamaları var

Bu nedenle, Alibaba Xiaomi'nin sohbet motorunda, ikisinin avantajlarını birleştirdik ve Alibaba Xiaomi sohbet motorunun çekirdeğini oluşturmak için iki modeli birleştirdik. Aday küme verileri ilk olarak geleneksel alma modeli aracılığıyla alınır ve ardından aday küme Seq2Seq Modeli aracılığıyla Yeniden Sıralanır. Yeniden sıralama belirtilen eşiği aştıktan sonra çıktı çıkarılır. Eşik eşikten düşükse, yanıt Seq2Seq Modeli aracılığıyla üretilir.

Makine Okuma Anlama Teknolojisinin Keşfi ve Uygulaması

Alibaba'nın Xiaomi platformunun iş sisteminde, Taobao Double Eleven promosyon faaliyetleri, vergi yasaları vb. Gibi önceden bilgi ile yapılandırılamayan veya yapılandırılmış verimlilik son derece düşük olan çok sayıda bilgi verisi vardır. Bu nedenle makine okuma ve anlama kullanımıyla manuel bilgi noktalarının ayrılmasını azaltabilir, makinenin kuralları doğrudan okumasına izin verebilir ve kullanıcılara en doğal etkileşim yolu olan kural yorumlama hizmetleri sağlayabiliriz. Bu nedenle, 2017 yılında Alibaba iDST ekibi ve Alibaba Xiaomi ekibimiz makine okuma alanında derinlemesine keşif ve uygulama gerçekleştirdi.

Örneğin, aşağıdaki şekil 2017'de Taobao Double Eleven "Grup Takımı" için bir etkinliğin kurallarını göstermektedir:

Öğrencileri, bilgi tabanına ekibin etkinlik kuralı metnini girmeleri için yönlendirin ve Ali Xiaomi, metin içeriğinin okunmasına dayalı olarak doğrudan Soru-Cevap hizmetleri sağlayabilir.

Makine okuduğunu anlama teknolojisi Makine okuduğunu anlama modeli, akademide önemli atılımlar yapmıştır, ancak akademi ve endüstri arasındaki belirli senaryolardaki büyük farklılıklar nedeniyle, makine okuma anlama teknolojisini gerçek iş senaryolarına uygulamak için hala önemli sorunlar bulunmaktadır. meydan okuma.

  • Hedeflenen bir iş modeli tasarlayın Yukarıdaki örnekten, iş senaryosundaki faaliyet kurallarının ve düzenleyici belgelerin benzersiz olduğunu ve genellikle başlığın boyutu ve belgenin hiyerarşik yapısı gibi çok sayıda belge yapısı içerdiğini görebiliriz. Ek olarak, yalnızca makaleler genellikle daha uzun olmakla kalmaz, aynı zamanda yanıtlar da daha uzundur ve genellikle birden çok cümleden oluşur. Bu, bazı kamusal modeller tarafından okunan wiki ansiklopedi verilerinin özelliklerinden oldukça farklıdır. Model yapısının sahnenin özelliklerine göre tasarlanması gerekir.

  • Modelin performansı dikkate alınır.Akademik başarılardaki modeller genellikle daha karmaşıktır.Ancak, endüstriyel sahnedeki performans gereksinimleri nedeniyle bu modeller doğrudan çevrimiçi kullanılamaz.Model efektini kontrol edilebilir hale getirmek için bazı hedefli basitleştirmelere ihtiyaç vardır. Çevrimiçi tahmin performansını olabildiğince iyileştirmek için.

  • Model alanının taşınması Mevcut makine okuma modeli alanla ilgilidir ve bu, alanın hızlı bir şekilde genişlemesini büyük bir zorluk haline getirir. Ali Xiaominin faaliyet kurallarının yorumlanması, desteklediğimiz ilk senaryodur. Şu anda, vergi kanunları ve yönetmeliklerinin yorumunu genişlettik. Gelecekte finans ve telekomünikasyon alanlarında da gelişeceğimiz için geçmişte öğrendiğimiz bilgileri yeni alanlara açıldığında değerlendirmemiz gerekiyor.

Makine okuduğunu anlama modeline dayalı çevrimiçi soru cevap süreci aşağıdaki şekilde gösterilmektedir.Kullanıcı sorularını analiz etmekten cevaplar çıkarmaya kadar olan süreçte, işlemeye toplam 4 modül katılıyor:

1. Makale parçası konumlandırma modülü Ürün parçası konumlandırma modülü, kullanıcı sorularına yanıtlar üretmek için makine okuması için aday belge paragraflarının bir koleksiyonunu geri çağırır. Bu modülün yardımıyla, makine okuduğunu anlama modelinin hesaplama miktarının azaltılmasına yardımcı olurken, doğruluğu bir dereceye kadar artırabilir. Örneğin, kullanıcı "Tmall Creation Festival etkinlikleri ne zaman başlayacak?" Diye sorduğunda, modülün "Tmall Creation Festival" ile ilgili tüm belge paragraflarını döndürmesi gerekiyor. Konum, metin sınıflandırması, metin alma veya soru şablonu müdahalesi yoluyla yapılabilir. Metin sınıflandırması önceden açıklamalı veri eğitimi modeli gerektirir. Şu anda, sürecimiz esas olarak denetimsiz metin alma veya manuel olarak tutulan soru şablonu konumlandırmaya odaklanmaktadır.

2. Ön işleme modülü Ön işleme modülü 4 adımdan oluşur.İlk olarak, kullanıcı sorularını ve okunacak makaleleri bölümlere ayırmanız gerekir.Makaleleri okumaya genellikle çok seviyeli paragraflar ve özel etiketler gibi yapı bilgileri eşlik ettiğinden, biçimlendirme gereklidir.

3. Çevrimiçi hizmet modülü DNN çevrimiçi hizmet modülü, bu makalenin ilk yarısında açıklanan ve 2. adımda işlenen derinlemesine makine okuduğunu anlama modelini kullanır. < soru, doktor > Vektörden sonra, cevap olarak çıktı makalesindeki kelime veya cümlenin olasılığını hesaplayın.

4. İşlem sonrası modül İşlem sonrası modül, belirli cevapların oluşturulmasından sorumludur.Çevrimiçi hizmet modülünün cevap olasılık çıktısına göre, belirli bir stratejiye göre en olası cevabı hesaplar

Model yapısı aşağıdaki gibidir:

Kısa bir süre önce makine okuma modelimiz SQuAD listesinde ilk 1'de yer aldı ve ExactMatch göstergesi ilk kez insan performansını geçti.

3. Gelecekteki beklentiler ve zorluklar

  • Etkileşimli zeka yavaş yavaş yeni bir alan girişi haline geldi.Gelecekte, senaryo verilerine dayanarak, çeşitli alan ve senaryoları keşfetmek ve biriktirmek için teknoloji ve ürünleri birleştirmeye devam etmek; alan verilerini ve bilgi sistemlerini biriktirmeye devam etmek gerekiyor. Teknik alanda; üretken modeller, gelişmiş öğrenme, aktarım öğrenme, makine okuma, duygusallaştırma vb. Konularda derinleşmeye devam edeceğiz.

  • Gelecekte, Alibaba Xiaomi platformu, platformlaşma ve dikey alanlar yönünde derinleşmeye devam edecek ve endüstriler, işletmeler, işletmeler ve tüm sohbet robotu ekosistemi etrafında akıllı hizmetler için bir Alibaba Xiaomi akıllı hizmet platformu oluşturacak.

Referanslar

  • Feng-Lin Li, Minghui Qiu, Haiqing Chen, Xiongwei Wang, Xing Gao, Jun Huang, Juwei Ren, Zhongzhou Zhao, Weipeng Zhao, Lei Wang, Guwei Jin, Wei Chu: AliMe Assist: Yenilikçi bir E- Oluşturmak için Akıllı Bir Asistan ticaret Deneyimi. CIKM 2017: 2495-2498

  • Jianfei Yu, Minghui Qiu, Jing Jiang, Shuangyong Song, Jun Huang, Wei Chu ve Haiqing Chen, ve diğerleri. E-ticarette Erişim Tabanlı Soru Cevaplama Sistemlerinde Transfer Öğrenimi için Alan İlişkilerini Modelleme // WSDM 2018.

  • Yin W, Schütze H, Xiang B ve diğerleri.ABCNN: Cümle Çiftlerini Modellemek için Dikkat Temelli Evrişimli Sinir Ağı. Bilgisayar Bilimi, 2015.

  • Hu B, Lu Z, Li H, et al. Doğal dil cümlelerini eşleştirmek için evrişimli sinir ağı mimarileri. 2015, 3: 2042-2050.

  • Pang L, Lan Y, Guo J, et al. Text Matching as Image Recognition.2016.

  • Sukhbaatar S, Szlam A, Weston J, ve diğerleri. Uçtan Uca Bellek Ağları. Bilgisayar Bilimi, 2015.

  • Wu Y, Wu W, Xing C, et al.Sıralı Eşleştirme Ağı: Erişim Tabanlı Sohbet Robotlarında Çok Turlu Yanıt Seçimi İçin Yeni Bir Mimari // Hesaplamalı Dilbilim Derneği Toplantısı.2017: 496-505.

  • Huang P S, He X, Gao J, vd. Tıklama verilerini kullanarak web araması için derin yapılandırılmış anlamsal modeller öğrenme // ACM Uluslararası Bilgi ve Bilgi Yönetimi Konferansı. ACM, 2013: 2333-2338.

  • Pengfei Liu, Xipeng Qiu ve Xuanjing Huang. 2017. Metin Sınıflandırması için Tartışmalı Çok Görevli Öğrenme. ACL'de.

27 puan karşılığında on bin dolar, D'Antoni çok mutluydu, Green'in sözleri kalbinin derinliklerini deldi!
önceki
VAR gösteriş yapıyor! Japon takımının hentbol golü havaya uçtu ve 2004'te Çin şampiyonasını çalma sahnesi tekrarlanmadı.
Sonraki
Yeni tüketimin gücünü hedefliyoruz! Nissan'ın Teana'nın yeni Kuzey Amerika versiyonu için test sürüşü
Dünya Kupası garip bir sahnede yeniden beliriyor: 19 yaşındaki şeytan yıldız, bir dokunuşla abartılı bir şekilde yere düştü ve rakip oyuncu şaşkına döndü
Otoparka park etmenin en güvenli yolu nedir? Basit görünüyor ama birçok insan yanlış yapıyor
Geri döndükten hemen sonra çok sevindim! Maçtan sonra Thomas'ın söyledikleri James'i çok utandırdı!
Mütevazı olayın yeni gelişimi! Almanlar Çin'in buna gücünün yetmeyeceğini düşünerek uzlaşma istemeye geldi
Helan Dağı altında "Ejderha ve Phoenix Oyunu"
Ulusal Günü gezileri için araba kullanmayla ilgili ipuçları, onları toplayın ve gidelim!
Dünya Kupası Altın Küre Ödüllerinin en büyük favorisi: Mbappé, Zidanein halefinden utanmıyor
Unreal 4 remake of Castlevania deneme indirmeye açık, klasikleri geri yükleyin
19 dakika 17 dakikada Thomas maçtan sonra çok mutluydu ama James'in ifadesi çirkindi!
Ali mühendisleri görme engellilere "görmek" için ne gibi çalışmalar yaptı?
AFC klasik düzenleme! Katar hakemleri Çin-Irak savaşı çağrısı yapıyor, Çin 2 hakem Kahan düellounu icra ediyor
To Top