Analiz Alibaba Intelligent Artificial Interaction'ın temel teknolojisi

Özet: Geçtiğimiz 20 yıl içinde internet ve mobil internet insanlığı yepyeni bir çağa taşıdı.Bu çağı tek bir kelime ile özetlemek ve özetlemek için kullanırsak, "bağlantı" kelimesi daha uygun olamaz. Bu çağda dört tür bağlantı kurulmuştur: birincisi, insanlar ve mallar arasındaki bağlantı; ikincisi, insanlar ve insanlar arasındaki bağlantı; üçüncüsü, insanlar ve bilgi arasındaki bağlantı; ve dördüncüsü, insanlar ve ekipman arasındaki bağlantı.

"Bağlantı" kendi başına bir amaç değildir, sadece "etkileşim" için bir kanal oluşturur. İnsan-Bilgisayar Etkileşiminde (İnsan-Bilgisayar Etkileşimi), insanlar makineye ilgili sinyalleri girmek için giriş cihazlarını kullanırlar.Bu sinyaller bir veya daha fazla ses, metin, görüntü, dokunma, vb. Modunu içerir. Makine çıkışları veya Görüntüleme cihazı, insanlara ilgili geri bildirim sinyalleri sağlar. "Bağlanmak", "etkileşimin" iki tarafını birbirine bağlar.

"Etkileşim" in evrim yönü daha doğal, verimli, arkadaş canlısı ve zekidir. İnsanlar için, akıllı diyalog için makinelerle etkileşimde doğal dili kullanmak en doğal etkileşim yollarından biridir, ancak bu yol çeşitli zorluklarla doludur. Makinelerin, insanların karmaşık doğal dilini anlamasını nasıl sağlayabilirim? Bir grup aday yerine kullanıcı sorularına nasıl doğru cevaplar verilir? Beklenmedik soruları yanıtlamak yerine kullanıcılarla nasıl daha samimi sohbet edilir? Karmaşık çok yönlü diyalog durumu ve diyalog bağlamı nasıl yönetilir? Alibaba'da, 2014'ün başından beri akıllı diyalog etkileşimindeki yenilikleri araştırıyor ve uyguluyoruz ve araştırma ve geliştirme sonuçlarımız, büyük ölçekte akıllı müşteri hizmetlerine kademeli olarak uygulandı (Alibaba'nın dahili işletmeleri, Alibaba Xiaomi, Alibaba'nın perakende platformundaki on milyonlarca işletme için) Ali dışındaki şirketler ve hükümetler için Xiaomi'nin yanı sıra bulut Xiaomi'yi ve çeşitli cihazları (YunOS cep telefonu, Tmallın kutusu, İnternet arabası vb.) Depolayın.

1 Akıllı diyalog etkileşim çerçevesi

Tipik bir akıllı diyalog etkileşim çerçevesi Şekil 1'de gösterilmektedir. Bunların arasında, konuşma tanıma modülü ve metinden sese modülü isteğe bağlı modüllerdir Örneğin, bazı senaryolarda kullanıcı metin girişi kullanır ve sistem ayrıca yanıtlamak için metin kullanır. Doğal dil anlama ve diyalog yönetimi temel modüllerdir.Genelleştirilmiş doğal dil anlama modülü, görev, soru-cevap ve küçük sohbet kullanıcı girdisinin anlaşılmasını içerir.Ancak, derin öğrenmenin yükselişinden sonra, çok sayıda uçtan uca (Uçtan Uca) ) Yöntemler ortaya çıkmıştır ve birçok Soru-Cevap ve sohbet modeli eğitilmiş ve uçtan-uca konuşlandırılmıştır, bu nedenle bu makaledeki doğal dil anlayışı, görevin kullanıcı girdisinin anlamsal anlayışına dar bir şekilde atıfta bulunmaktadır. Şekil 2'de gösterilen akıllı diyalog etkileşiminin temel işlevsel modüllerinde, doğal dil anlayışı ve diyalog yönetimine ek olarak, soru ve cevap görevlerini tamamlamak için akıllı soru ve cevap kullanılır ve küçük sohbet görevlerini tamamlamak için akıllı sohbet kullanılır. Harici çıktı katmanında üç yöntem sunuyoruz: SaaS platformu, PaaS platformu ve BotFramework Bot Framework, kullanıcılara akıllı asistanları özelleştirmek için bir platform sağlar.

2 Akıllı diyalog etkileşiminin temel teknolojisi

Akıllı diyalog etkileşimindeki temel işlevsel modüller Şekil 2'de gösterilmektedir. Bu bölüm, çıktı katmanı, doğal dil anlayışı, akıllı soru ve cevap, akıllı sohbet ve diyalog yönetimine ek olarak akıllı diyalog etkileşiminin dört temel modülünü ayrıntılı olarak açıklamaktadır.

(Not: Bu resim daha özlüdür, ayrıntılı akış şemasını daha sonraki bir makalede paylaşacağım)

2.1 Doğal dil anlayışı

Doğal dil anlama, yapay zekanın AI-Zor problemidir ve aynı zamanda mevcut akıllı diyalog etkileşiminin temel problemidir. Makinelerin doğal dili anlamaları için, esas olarak aşağıdaki beş zorlukla karşı karşıyalar.

(1) Dil çeşitliliği

(2) Dilin belirsizliği

(3) Yanlış dil ifadesi

(4) Dilin bilgi bağımlılığı

(5) Dil bağlamı Tablo 1 Bağlam örneği

Not: U, kullanıcıyı ve A, aracıyı ifade eder. Aşağıda aynı.

Tüm doğal dil anlayışı, yukarıdaki zor problemlerin nasıl çözüleceği etrafında döner.

2.1.1 Doğal dil anlama anlamsal temsil

Doğal dil anlayışının anlamsal temsilinin üç ana yolu vardır.

(1) Dağıtım anlambilim

(2) Çerçeve semantiği

(3) Model-teorik anlambilim

Akıllı diyalog etkileşiminde, doğal dil anlayışı genel olarak çerçeve anlamının bir çeşidini benimser; yani, Şekil 3'te gösterildiği gibi anlamsal sonuçları temsil etmek için alanlar, amaçlar ve aralıklar kullanılır.

Yukarıdaki alan ontoloji yapısını tanımladıktan sonra, tüm algoritma akışı Şekil 4'te gösterilmektedir.

2.1.2 Amaç sınıflandırması

Amaç sınıflandırması, esas olarak kural tabanlı yöntemler, geleneksel makine öğrenimi tabanlı yöntemler ve CNN, LSTM, RCNN, C-LSTM ve FastText gibi derin öğrenmeye dayalı yöntemlere bölünmüş bir tür metin sınıflandırmasıdır. CNN, LSTM, RCNN ve C-LSTM'nin dört tipik model çerçevesi için, 14 alandaki veri kümeleri üzerinde eğitim alıyoruz, yaklaşık 40.000'lik bir test setinde test ediyoruz ve ölçüm olarak Micro F1'i kullanıyoruz (Not: Buradaki eğitim ve testte, sinir ağının girdisi yalnızca füzyon sembolü gösterimi olmadan kelime gömme içerir), sonuçlar Şekil 5'te gösterilmektedir ve Yoon Kim tarafından 2014 yılında önerilen CNN tabanlı sınıflandırma algoritması en iyi sonucu verir.

Yalnızca kelime vektörünü girdi olarak kullanan CNN'in sınıflandırma etkisi, bazı alanlarda karmaşık özellik mühendisliğinin SVM sınıflandırıcısını geçemez. Derin öğrenmenin etkisinin nasıl daha da iyileştirilebileceği, keşif yönlerinden biri, dağıtılmış gösterimi ve sembolik gösterimi entegre etmeye çalışmaktır. Örneğin, "Andy Lau'nun Unutkanlığı" ifadesi için, bilgi tabanı aracılığıyla Andyward'ın Şarkıcısı ve Unutkanlığını şarkı olarak işaretleyebilirsiniz.Sarkıcı ve şarkı gibi sembollerin ağa entegre edilebileceği umulmaktadır. Spesifik füzyon yöntemi, sembol etiketini gömmek ve daha sonra gömme vektörünü sınıflandırma için kelime vektörüne eklemek veya bunu doğrudan kelime vektörünün arkasına çok sıcak bir şekilde eklemek olabilir. Dağıtık temsil ve sembolik temsilin birleşmesinden sonraki CNN yapısı Şekil 6'da gösterilmektedir.

Füzyondan sonra, 14 alanda (Şekil 7'de gösterildiği gibi) füzyon öncesi ve sonrası F1 değerlerini yaklaşık 40.000 test veri setinde karşılaştırın.Restoran, otel ve müzik gibi birçok adlandırılmış varlık olduğu ve isimlendirme formlarının ücretsiz olduğu görülebilir. Sahada etkisi çok açık.

Giriş birimleri olarak kelimelerin kullanıldığı CNN'de, OOV (Kelime Dışı) problemleriyle sık sık karşılaşılır.Genel olarak, hepsini temsil etmek için özel bir vektör (sabit bir rastgele vektör veya bilinen bir kelime vektörünün ortalama değeri gibi) kullanılır. OOV, bunun etkisi kesinlikle yeterince iyi değil. Uygulamamızda, kelime vektörünü eğitmek için FastText ve eldiven tanıtılmıştır.OOV için, OOV problemini etkin bir şekilde çözerek, alt kelime vektörü ile hesaplanabilir.

Etki optimizasyonu açısından, bu makalede açıklanan kelime vektörünün dinamik eğitimine ve bırakılmasına ek olarak, eğitim verilerinin veri artırımı yoluyla etki büyük ölçüde iyileştirilecektir.

2.1.3 Öznitelik çıkarma

Öznitelik çıkarma problemi, kelime birimlerinde dizi etiketleme veya sözcük birimlerinde dizi etiketleme olabilen bir dizi etiketleme problemi olarak soyutlanabilir Şekil 8, kelime birimleri cinsinden bir dizi etiketleme örneğini gösterir. Bu örnekte, etiketlenecek üç etiket departman, varış yeri ve zamanı içerir; B, etiketlenecek bir etiketin başlangıç kelimesini; I, etiketlenecek etiketin başlangıç olmayan bir kelimesini ve O, etiketlenmeyecek bir etiket kelimesini temsil eder.

Öznitelik çıkarma yöntemleri, kurala dayalı yöntemleri, geleneksel istatistiksel modellere dayalı yöntemleri, CRF gibi klasik yöntemleri ve derin öğrenme modellerine dayalı yöntemleri içerir. 2014'te ARTIS veri setinde, RNN modelinin etkisi CRF'nin etkisini aştı. O zamandan beri, R-CRF, LSTM, Bi-RNN, Bi-LSTM-CRF gibi çeşitli modeller birbiri ardına ortaya çıktı.

Öznitelik çıkarma görevinde, aşağıdaki avantajlara sahip olan Şekil 9'da gösterilen ağ yapısını kullanıyoruz.

(1) Giriş katmanı

Giriş katmanında, üç parça iş yaptık: Dağıtılmış bağlam öğrenme yeteneklerini ve sembolik soyut bilgi temsil yeteneklerini etkili bir şekilde kullanarak dağıtılmış temsil (kelime vektörü) ve sembol temsilinin (simge vektörü) füzyon yöntemini benimsemek; Penceredeki kelimelerin temsillerini doğrusal olmayan bir haritalama katmanına eklemek için yerel bir bağlam penceresi kullanılır.Doğrusal olmayan haritalama, özellik öğrenme ve özellik boyutlarını azaltma işlevine sahiptir; FastText, kelime gömme için kullanılır Öğrenme, OOV (Kelime Dışı) problemini etkili bir şekilde çözebilir.

(2) Bi-LSTM katmanı

Ortadaki gizli katmanda Bi-LSTM, hem yukarıdaki özellikleri hem de aşağıdaki özellikleri yakalayabilen özellik öğrenimi için kullanılır.

(3) Çıktı katmanı

Çıktı katmanında Bi-LSTM + Softmax, Bi-LSTM + CRF, vb. Gibi birkaç tipik uygulama vardır. Bi-LSTM + Softmax, çıktı katmanındaki öznitelik çıkarımını bir sınıflandırma sorunu olarak görür ve ortaya çıkan etiketleme sonuçları yerel olarak optimaldir Bi-LSTM + CRF, global en iyi sonucu elde etmek için çıktı katmanındaki cümle düzeyinde bilgileri sentezleyecektir.

2.1.4 Niyet sıralaması

Tablo 1'de bir örnek gösteriyoruz. Bağlama bakmazsanız, "yarından sonraki gün ne olacak" ın amacını belirleyemezsiniz. Bu problemi çözmek için sistemde bir niyet sipariş modülü tasarladık ve akışı Şekil 10'da gösterilmektedir. Kullanıcı tarafından yapılan ifade girdisi için, bir yandan niyeti belirlemek ve çıkarmak için sınıflandırma çıkarma modeli kullanılır; diğer yandan, doğrudan yukarıdaki amacı miras alır ve daha sonra bu niyete göre öznitelik çıkarımı gerçekleştirir. Bu iki sonuç, mevcut ifadenin yukarıdaki niyeti miras alması veya sınıflandırıcının sınıflandırma amacını takip etmesi gerekip gerekmediğini belirlemek için özellik çıkarıldıktan sonra birlikte bir LR sınıflandırıcısına gönderilir. Yukarıdaki niyeti miras alacaksa, niyet ve öznitelik çıkarma sonucu nihai sonuç olarak çıkarılabilir; sınıflandırıcının sınıflandırmasının izlenmesinin sonucuysa, sonuçlar sınıflandırıcının sınıflandırma güvenirliğine göre sıralanabilir ve çıktı alınabilir.

2.2 Akıllı Soru-Cevap

Belirli iş senaryolarında üç tipik soru-cevap görevi vardır. Birincisi, kullanıcıların QA-Pairs'e bir soru ve bir cevap vermesidir; diğeri, yapılandırılmış bir bilgi grafiği oluşturmak ve bilgi grafiğine dayalı soru ve cevap yürütmektir; üçüncüsü yapılandırılmamış metin içindir , Okuduğunu anlamaya dayalı soru ve cevaplar yürütün. Bu makale, Taobao etkinlik kurallarının sorusunu ve cevabını çözmek için okuduğunu anlamayı kullanmak gibi okuduğunu anlama konusundaki çalışmalarımıza odaklanmaktadır.

Okuduğunu anlama yöntemleri açısından, şu anda Stanford Üniversitesi'nin SquAD veri kümesi için match-LSTM, BiDAF, DCN, FastQA, vb. Gibi çok sayıda mükemmel yöntem bulunmaktadır. Literatür, Şekil 11'de gösterildiği gibi, esas olarak 4 katmana bölünmüş olan mevcut genel çerçeveyi verir:

Word Embedder, kelimeleri sorulara ve belgelere gömme;

Genellikle RNN / LSTM / BiLSTM kullanarak soruları ve belgeleri kodlamak için kodlayıcı;

Soru ve belge arasında kelime kelime etkileşen Etkileşim Katmanı (etkileşim katmanı) Bu, mevcut araştırma etkin noktasıdır. Ana yöntem, dikkat mekanizmasını kullanmaktır;

Yanıt Katmanı (yanıt katmanı), yanıtın başlangıç konumunu ve bitiş konumunu tahmin edin.

Spesifik uygulamamızda, BiDAF ağ yapısına atıfta bulunuyoruz ve bu temelde birçok optimizasyon yapıyoruz.

(1) Modelin iş optimizasyonu

Modelin yapısal tasarımının, modelin e-ticaret belge formatlarının girişini destekleyebilmesi için iyileştirilmesi gerekmektedir. E-ticaret kural belgeleri genellikle boyut, başlık ve belge hiyerarşik yapısı gibi çok sayıda belge yapısı içerir.Bu belirli bölüm yapısı bilgilerinin kodlanması ve ağa girilmesi, eğitimin etkisini büyük ölçüde artıracaktır.

(2) Modelin basitleştirilmesi

Akademik literatürdeki modeller genellikle daha karmaşıktır ve endüstriyel sahnedeki performans gereksinimleri nedeniyle bu modeller doğrudan çevrimiçi olarak kullanılamaz.Model etkisinin düşüşünü kontrol edilebilir kılmak için bazı hedefli basitleştirmelere ihtiyaç vardır. Modeldeki çeşitli bi-lstm yapılarını basitleştirmek gibi çevrimiçi tahmin performansını iyileştirin.

(3) Birden fazla modelin entegrasyonu

Şu anda, bu modeller tamamen uçtan uca modellerdir ve tahminleri daha az kontrol edilebilir ve yorumlanabilir.İş senaryolarına uygulanacaklarsa, derin öğrenme modellerini zeka elde etmek için geleneksel modellerle entegre etmeyi düşünmek gerekir. En iyi kontrol edilebilirlik dengesi.

2.3 Akıllı sohbet

Açık alan odaklı sohbetler şu anda hem akademi hem de endüstride büyük bir sorundur. Şu anda iki tipik yöntem vardır: biri belgeler gibi alma modellerine dayanmaktadır. Temel fikir, alaka düzeyini hesaplamak için arama motorlarını kullanmaktır Cevabı vermek gerekirse; ikincisi, Seq2Seq'in üretken modeline dayanmaktadır, literatür gibi tipik yöntemler, ağ yapısı Şekil 12'de gösterilmiştir.

Geri çağırma modelinin avantajı, yanıtın önceden belirlenmiş derlemede kontrol edilebilir olması, eşleştirme modelinin nispeten basit olması ve yorumlanabilirliğin güçlü olmasıdır; dezavantajı, belirli bir anlambilimsel anlayıştan yoksun olması ve sabit bir külliyatın sınırlamalarına sahip olması ve uzun kuyruk problemlerini kapsamasıdır. Oran düşük. Üretken modelin avantajı, cevabın derin anlambilim yoluyla üretilmesi ve cevabın külliyatın boyutu ile sınırlı olmamasıdır; dezavantajı, modelin yorumlanabilirliğinin güçlü olmaması ve cevabın tutarlılığını ve rasyonalitesini sağlamanın zor olmasıdır.

Geri alma modeli ile üretici modelin ilgili avantajlarını birleştiren sohbet motorumuzda, yeni bir model AliMe Chat önerilmiştir.Temel süreç Şekil 13'te gösterilmiştir. Öncelikle, QA bilgi tabanından aday cevap setini bulmak için geri alma modeli kullanılır; daha sonra aday cevapları sıralamak için dikkatle Seq2Seq modeli kullanılır.İlk adayın puanı belirli bir eşiği aşarsa, nihai cevap olarak çıktı olur, aksi takdirde üretici model kullanılır Cevaplar üretin. Dikkatli Seq2Seq modelinin yapısı Şekil 14'te gösterilmektedir. Eğitimden sonra, ana testler şu şekildedir: Şekil 15'te gösterildiği gibi, 600 sorudan oluşan test seti, geri getirme (IR), oluşturma (Üretim), geri alma + yeniden sıralama (Rerank) ve alma + yeniden sıralama + oluşturmayı test etmek için kullanılır. (IR + Rerank + Generation) Dört yöntemin etkisi, IR + Rerank + Generation yönteminin eşik 0.19 olduğunda en iyi şekilde çalıştığı görülebilir.

Bu model Ali Xiaomi'de piyasaya sürüldükten sonra, Şekil 16'da bir örnek gösterilmektedir. Ali Xiaomi'de, önceki IR modeline ve AliMe Chat modeline dayalı olarak, çevrimiçi trafik kullanılarak bir A / B testi yapıldı.Sonuçlar Şekil 17'de gösterilmektedir. Kullanıcı günlüğünden rastgele 2136 parça veri seçin, bunlardan 1089'u IR modeli kullanılarak yanıtlandı ve 1047'si AliMe Chat kullanılarak yanıtlandı AliMe Chat Top1'in yanıtının doğruluğu% 60.36 idi, bu IR'nin 40.86'sından çok daha iyi. %.

2.4 Diyalog yönetimi

Diyalog yönetimi, dil anlayışı ve bağlamının yapılandırılmış semantik temsil sonuçlarına göre tüm diyaloğun durumunu yönetir ve bundan sonra hangi eylemin yapılacağına karar verir.

Basit bir diyalog örneğine bakalım.

U: Hangzhou'ya gidiyorum, benim için bir tren bileti ayırtın

A: Ne zaman ayrılıyorsunuz?

U: yarın sabah

C: Sizin için aşağıdaki tren biletlerini buldum:

U: ikinciyi istiyorum

A: İkincisi ..., satın almak ister misin?

U: satın almak istiyorum

Diyalog etkileşimi iki aşamaya ayrılmıştır. İlk aşamada, çoklu diyalog etkileşimi turları yoluyla, kullanıcının ihtiyaçları toplanır ve yapılandırılmış bilgiler (kalkış, varış noktası, zaman vb.) Elde edilir; ikinci aşama, hizmet talep etmektir ve ardından Seçim, onay, ödeme ve satın alma gibi sonraki adımlar dizisine gidin.

Piyasadaki ortak insan-makine diyalogları dahil olmak üzere geleneksel insan-makine diyalogları, genellikle diyaloğun sadece ilk aşamasındadır ve ikinci aşamada fazla değildir. Bu bağlamda, Şekil 18'de gösterildiği gibi bir dizi diyalog yönetim sistemi tasarladık. Bu diyalog yönetim sisteminin üç özelliği vardır.

İlk olarak, Görev Akışı için bir dizi diyalog tanımlama dili tasarlanmıştır. Açıklama dili, program tasarımının akış şemasına benzer şekilde tüm iletişim görev akışını tam olarak ifade edebilir. Diyalog tanımlama dilinin avantajı, diyalog motorunu ve iş mantığını ayırabilmesidir.Ayrıldıktan sonra, iş tarafı arkasındaki motoru değiştirmeden bir komut dosyası dili geliştirebilir.

İkincisi, Görev Akışı mekanizması nedeniyle, diyalog motoru tarafında getirdiğimiz faydalar, diyalog kesintisi ve geri dönüş mekanizmasını gerçekleştirme yeteneğidir. İnsan-makine diyalogunda iki tür kesinti vardır: Birincisi, kullanıcının aktif olarak başka bir niyet seçmesidir ve dahası, makinenin kullanıcının sözlerinin anlamını anlamaması ve bu da bu niyetin atlamasına neden olmasıdır. Diyaloğun tam görev akışını sürdürdüğümüz için, diyaloğun hangi durumda olduğunu, ara durumda olup olmadığını veya başarılı bir şekilde sona erdiğini biliyoruz.Orta durumdaysa, geri gelmesine izin verme fırsatımız var. Az önce söylediklerimizin baştan başlamasına gerek yok. Sohbete devam edebilirsiniz.

Üçüncüsü, OpenDialog adlı geliştirici odaklı bir diyalog programı tasarlandı ve arkasında bir dil anlama motoru ve bir diyalog motoru vardı. Geliştiriciler için dil anlama motoru, soğuk başlangıç problemini daha iyi çözebilen kural tabanlı bir yaklaşımdır.Geliştiricilerin sadece dili anlamak için Dilbilgisi yazmaları, diyalog tanımlama diline dayalı bir diyalog süreci geliştirmeleri ve ayrıca verileri işlemeleri gerekir. Bu şekilde temel bir insan-makine diyaloğu tamamlanabilir.

3. Alibaba Akıllı Diyalog Etkileşimli Ürünler

3.1 Akıllı Hizmet-Xiaomi Ailesi

Temmuz 2015'te Alibaba, e-ticaret alanında hizmetlere, alışveriş rehberlerine ve görev asistanlarına odaklanan akıllı bir interaktif diyalog ürünü olan kendi akıllı hizmet asistanı Ali Xiaomi'yi piyasaya sürdü. E-ticaret alanı ile akıllı diyalog ve etkileşim alanının birleşimi sayesinde, geleneksel hizmet endüstrisi modeli dönüştürülür ve deneyim geliştirilir. 2016'daki Çifte "Onbirinci" döneminde, Ali Xiaomi'nin genel akıllı hizmet hacmi 6,43 milyona ulaştı, bunun akıllı çözüm oranı% 95'e ulaştı ve akıllı hizmet tüm hizmet hacmindeydi (toplam hizmet hacmi = akıllı hizmet hacmi + çevrimiçi manuel hizmet hacmi + Telefon hizmetleri)% 95'ti ve Double Eleven sırasında hizmetlerin mutlak ana gücü haline geldi. Alibaba Xiaomi, esas olarak Alibaba'nın yerel işlerine ve Alibaba'nın uluslararası işlerine hizmet vermektedir.Taobao, Tmall, Fliggy, Health, Xianyu, Cainiao vb. Gibi yerel işletmeler ve Lazada, PayTM, AE vb. Gibi uluslararası işletmeler.

Ali Xiaomi'nin başarısıyla, Ali ekosistemi dışındaki işletmeleri ve devlet dairelerini akıllı hizmet yetenekleriyle güçlendirmek için kaçınılmaz bir yol haline geldi. Shop Xiaomi, Ali ekosistemindeki işletmeleri güçlendirirken Yunxiaomi, Ali dışındaki büyük ve orta ölçekli işletmeleri ve hükümetleri hedefliyor. Tüm Xiaomi ailesi Şekil 19'da gösterilmektedir.

3.2 Akıllı cihazlar

Geçtiğimiz 3-4 yıl içinde internete bağlı cihazların büyük değişimler geçirdiğini görebiliyoruz.Cihazlar, bilgisayarlardan ve akıllı telefonlardan akıllı hoparlörler, akıllı TV'ler, robotlar, akıllı arabalar ve diğer cihazlar gibi daha geniş bir akıllı cihaz yelpazesine yayıldı. Akıllı cihazların hızlı gelişimi, insanların cihazlarla etkileşim şeklini değiştiriyor.

Geliştirdiğimiz akıllı diyalog etkileşim platformu, çeşitli cihazlar için diyalog ve etkileşim yetenekleri sağlar.Şu anda YunOS cep telefonlarında, Tmall's Box, internet arabalarında ve diğer cihazlarda yaygın olarak kullanılmaktadır. Örneğin, Tmallın Sihirli Kutusunda, kullanıcılar diyalog etkileşimleri, sohbet ve alışveriş yoluyla video arayabilir, müziği kontrol edebilir, hava durumunu sorabilir vb.

4 Özet ve yansıma

Geçtiğimiz birkaç yıl içinde, Alibaba'nın e-ticaret, müşteri hizmetleri ve akıllı cihazlardaki katı gereksinimleri ve senaryoları ile birleştiğinde, akıllı diyalog etkileşiminde çok sayıda keşif ve deney yaptık ve nispeten eksiksiz bir veri seti, algoritma ve çevrimiçi hizmetler oluşturduk. Çevrimdışı veri kapalı döngü teknoloji sistemi ve akıllı servislerde ve akıllı cihazlarda yaygın olarak kullanılan ve kısaca aşağıda özetlenen.

(1) Doğal dil anlayışı açısından, kurallar ve derin öğrenme modelleri, CNN / Bi-LSTM-CRF gibi derin öğrenme modelleri, dağıtılmış temsil ve sembolik temsilin birleşimi, çok taneli kelime birleştirme ve bağlama dayalı niyet sıralaması gibi yöntemlerle oluşturulur. Organik olarak entegre edilmiş doğal dil anlama sistemi.

(2) Akıllı soru cevap açısından, makine okuma anlayışı Xiaomi ürünlerine başarıyla uygulandı.

(3) Akıllı sohbet açısından, arama modeli ile üretken modelin avantajlarını birleştiren ve küçük sohbetin doğruluğunu büyük ölçüde artıran AliMe Sohbet modeli önerilmiştir.

(4) Diyalog yönetimi açısından, iş mantığını ve diyalog motorunu ayıran ve görev kesinti dönüşü ve öznitelik aktarımı gibi karmaşık işlevleri gerçekleştirebilen Görev Akışına dayalı bir diyalog tanımlama dili tasarlanmıştır.

Akıllı interaktif teknolojinin uygulanması sürecinde, sürekli olarak akıllı interaktif teknoloji ve kullanıcı deneyiminin seviyesini nasıl daha da iyileştirebileceğimizi düşünüyoruz.

Öncelikle kullanıcı deneyiminde ısrar edin. Öncelikle kullanıcı deneyimine bağlı kalmak, ürünün kullanıcılara temel değerleri sağlaması gerektiğidir.

İkinci olarak, dil anlamanın sağlamlığını ve etki alanı ölçeklenebilirliğini geliştirin.

Üçüncüsü, makine okuduğunu anlama yeteneklerini güçlü bir şekilde geliştirin.

Dördüncüsü, makinelerin öğrenmeye devam etmesini sağlama yeteneğini geliştirin.

Beşinci olarak, bir veri kapalı döngüsü oluşturun ve efektlerin sürekli iyileştirilmesini sağlamak için verileri kullanın.

Mevcut yapay zeka alanı hala zayıf yapay zeka aşamasındadır, özellikle algıdan bilişe doğru iyileştirme alanı hala çok büyüktür. Tescilli alanlarda akıllı diyalog etkileşimi halihazırda gerçek senaryolarla yakından entegre edilebilir ve özellikle akıllı müşteri hizmetleri alanında (Alibaba'nın Xiaomi'si gibi) büyük değer yaratabilir. Yapay zeka teknolojisinin sürekli gelişmesiyle birlikte, akıllı diyalog etkileşimi alanının gelişimi gelecekte de iyileşmeye devam edecek. Kaynak: Chatbot geliştirme savaşı
sınıra meydan okuyun! Çinliler dünyanın en çok
önceki
İç Moğolistan'dan çok uzakta olan Nanjing, her yerde sığır ve koyunların yaşadığı, pastoral pastoral bir özgür "Bashang Çayırına" sahiptir.
Sonraki
Trafik ihlallerine karşı gece gündüz mücadele eden Jingdezhen'deki trafik polisi günün her saati meşgul!
5G yeni parkur, hangi iletişim ekipmanı şirketleri Bilim ve Teknoloji İnovasyon Kurulu'na girebilir? | 37 iletişim ekipmanı ve çip şirketinin envanteri
Kunming'deki bu büyük mavi rüya çiçeklerinin paraya hiç ihtiyacı yok
Real Madrid'in 21. yüzyılın en iyi takımında 11 oyuncu var.
Şangay, Bund'daki Disney'e ek olarak, görülmeye değer bu son derece ilgi çekici ve ücretsiz niş cazibe merkezlerine de sahiptir.
"Fantezi yolculuğunu" yaşadıktan sonra, uykusunda kelepçelendi ...
Wang Junkai ve Wang Yuan baharatlı yiyeceklerle savaştı, Yi Yang Qianxi kazandı
Sadece yazın mükemmel hafif yiyiciler için dost canlısı
5 milyon tonun üzerinde! Jiangxi eyaletteki en büyük florit yatağını buldu
Asayiş A Sınıfı emir istedi: 5 cinayetten aranan şüpheliye 200.000 ödül
Yeryüzünde kalan tek güzel masmavi rüya gibi Cennet Bahçesi, Mauritius'ta ücretsiz seyahat rehberi
"Çifte yenilik ve çift onarım" Pozlama Platformu | Jingdezhen'deki araba camlarının bu medeniyetsiz davranışları ortaya çıkıyor, kim olduğunu görün!
To Top