Shen Xiangyang, sohbet robotlarının geçmişini ve bugününü özetleyen bir makale yayınladı, yeni bir diyalog sistemleri çağı geliyor

Kısa bir süre önce, Microsoft Küresel İcra Başkan Yardımcısı Shen Xiangyang, Microsoft Araştırma Baş Araştırmacısı He Xiaodong ve Microsoft (Asya) İnternet Mühendisliği Enstitüsü Başkan Yardımcısı Li Di (XiaoIce Projesi Başkanı), ön baskı web sitesi arXiv'de "Eliza'dan XiaoIce'e:" adlı bir makale yayınladı. Sosyal Sohbet Robotları ile Karşılaşılan Zorluklar ve Fırsatlar.

Makale sadece chatbotların tarihsel gelişimini açıkça göstermekle kalmıyor, aynı zamanda yazarın mevcut durumu ve gelecekteki gelişimi hakkındaki önemli görüşlerini ortaya koyuyor. Aşağıdakiler, tasnif edildikten sonra DT'nin makalesinin ana içeriğidir:

Chatbot kategorileri

1. Sohbet robotu sistemi

Geçtiğimiz on yıllarda, konuşma sistemlerinin araştırılması ve geliştirilmesi uzun bir yol kat etti. Bununla birlikte, Turing'in deneyinden esinlenerek, ilk sohbet robotlarının görevi sadece insanlarla sohbet etmekti. Konuşma sırasında insan davranışını taklit ederek Turing Testini geçmek için metin veya ses kullanan bilgisayar programlarıdır.

Bilinen en eski chatbot, 1966'da MIT'de doğan Eliza'ydı. Eliza, sohbetin içeriğini anlamıyor, sadece uygun bir yanıt bulmak ve ardından onu birleştirmek için kalıp eşleştirmeyi kullanıyor. Çok sınırlı bilgiye sahiptir, bu nedenle yalnızca belirli bir alandaki insanlarla "konuşabilir".

Konuşmacının duygularını taklit edebilen Parry ya da Loebner Ödülü'nü (en insana benzeyen sistem ödülü) üç kez kazanan Alice olsun, aynı türden daha sonraki chatbot'lar, bu chatbot'lar iyi sonuçlar elde etti. Ancak yine de esasen elle yazılmış kurallara dayanırlar, bu nedenle yalnızca belirli kısıtlamalara sahip ortamlarda iyi çalışabilirler.

2. Göreve dayalı diyalog sistemi

Chatbot sisteminin tam aksine, Görev odaklı diyalog sistemi, belirli görevleri gerçekleştirmek için tasarlanmıştır. Bu sistemler genellikle çok özel alanlarda uygulanmaktadır. Örneğin, uçak bileti rezervasyonu yapmak için kullanılan ATIS, uçuş bilgilerine bakma ve yanıt verme gibi doğal dilde ifade edilen istekleri anlayabilir.

Göreve dayalı diyalog sistemleri genellikle bir otomatik konuşma tanıyıcı (ASR), bir konuşma dili anlama (SLU) modülü, bir diyalog yöneticisi (DM), bir doğal dil oluşturucu (NLG) ve bir metin-konuşma dönüştürücü (TTS) içerir. Şu anda, bu alandaki araştırmalar daha çok tüm sistemin uçtan uca nasıl optimize edileceğine odaklanmıştır.

3. Akıllı kişisel asistan

Apple, 2011'de Siri'yi piyasaya sürdüğünden beri, çeşitli şirketler kendi IPA'larını - Microsoft'un Cortana'sını, Google'ın Google Asistanını, Facebook'un M'sini, Amazon'un Alexa'sını ve benzerlerini başlatmaya başladı. IPA'lar konum, zaman, hareket ve hareketleri içeren bilgileri farklı sensörlerden alır. Aynı zamanda müzik, filmler, takvimler, e-postalar vb. Gibi çeşitli büyük veri kaynaklarına da erişebilir. Bu nedenle, IPA'lar birden çok alanda geniş bir hizmet yelpazesi sağlayabilir ve hatta İnternet'e dönebilir. Kullanıcı sorularını pasif olarak yanıtlamakla kalmaz, aynı zamanda aktif olarak hatırlatır ve önerir.

Şekil | Restoran önerisi ve trafik bilgisi hatırlatıcısı

4. Sosyal robotlar

Akıllı telefonların popülaritesi ve kablosuz teknolojinin hızlı gelişimi, bunu sosyal medya çağı haline getirdi. Sosyal sohbet robotları ortaya çıktı. Yalnızca küçük sohbetler için kullanılan erken sohbet robotlarından farklı olarak, Sosyal sohbet robotlarının, kullanıcıların iletişim, sevgi ve sosyal aidiyet için duygusal ihtiyaçlarını karşılaması gerekir. Microsoft'tan Xiaobing, yepyeni bir alan açtı. Varlıkları, tüm kullanıcıların sorularını yanıtlamak değil, kullanıcıyla duygusal bir bağ kurmak ve sanal bir arkadaş olmaktır.

Yeni bir sohbet robotları dünyası

Bir sosyal chatbotun çekiciliği, sadece kullanıcılardan gelen farklı isteklere cevap verebilmesi değil, aynı zamanda kullanıcılarla duygusal bir bağ kurabilmesidir. Mayıs 2014'teki lansmanından bu yana, Microsoft Xiaoice en çok kullanılan sosyal sohbet botu haline geldi. Kullanıcının duygusal ihtiyaçlarını anlayabilir ve muhatabı cesaretlendirmek için diyalogda uygun yanıtlar verebilir. Bu diyaloglar, kullanıcıları olumlu ve iyimser bir yönde yönlendirebilir ve onlara duygusal destek sağlayabilir. Eşzamanlı, Böyle bir diyalog aynı zamanda kullanıcı ve robot arasında bir güven duygusu oluşturarak Xiaoice'un kullanıcıyı daha iyi anlamasına ve gelecekte daha iyi hizmetler sunmasına yardımcı olabilir.

Şekil | Microsoft Xiaoice kullanıcıları teşvik ediyor

1. Etkinliği ölçmenin farklı yolları

Küçük sohbet robotlarının aksine, Turing testini geçip geçemeyecekleri sosyal robotların kalitesini ölçmek için bir kriter olamaz. Kullanıcıların sorularını doğru ve hızlı bir şekilde yanıtlaması gereken IPA'ların aksine, verimlilik sosyal robotların bir ölçüsü olamaz. bu nedenle Yeni bir ölçüm standardı CPS (oturum başına ortalama konuşma sayısı) önerildi . Sosyal robotların amacı, kullanıcıları meşgul tutmaktır. CPS değeri ne kadar yüksekse, etki o kadar iyidir. Aslında bu parametrenin kullanılması farklı boyama sistemlerini sınıflandırabilir.

Şekil | Farklı diyalog sistemlerinin CPS değerleri

2. IQ ve EQ'ya sahip bir sohbet robotu

Sevilen duygular ve sosyal aidiyet duygusu, temel insan ihtiyaçlarından biridir. Bu nedenle, sohbet robotlarının bu tür ihtiyaçları karşılamasına izin vermek toplumumuz için çok değerlidir. Bu tür ihtiyaçları karşılamak için sosyal robotların şefkat, sosyal beceriler, kişilik ve belirli bir EQ ve IQ'ya sahip olması gerekir.

Merhamet, kullanıcıları anlamalarını sağlar. Kullanıcının duygusal ihtiyaçlarını anlamak için kullanıcının duygularını diyalogdan belirlemeleri ve bu duygunun zaman içinde gelişimine dikkat etmeleri gerekir. Makul modelleme uygulaması ve bağlam bilgisinin sağduyulu depolanması çok önemlidir.

Bir sosyal robotun, kullanıcıların güvenini kazanabilmesi ve kullanıcıların konuşmalar için makul beklentileri önceden belirlemesine olanak tanıması için nispeten istikrarlı bir kişilik göstermesi de gerekir. Burada bahsedilen kişilik; yaş, cinsiyet, dil, konuşma stili, tutum, bilgi seviyesi, meslek alanı ve uygun bir sesi içerir. Benzer şekilde, bunların da sürekli olarak diyalog yoluyla öğrenmesi ve gelişmesi gerekir.

Sosyal robotların belirli görevleri tamamlamak için çok çeşitli becerilere sahip olması gerekir. Kullanıcı isteklerini analiz etmeleri ve soruları yanıtlamaları veya başka eylemleri gerçekleştirmeleri için yanıtlar oluşturmaları gerekir. IQ, bilgi ve depolama modellerini içerir. IQ sadece çeşitli becerilerin temeli değil, aynı zamanda yüksek EQ'nun da temelidir. Elde edilen sonuçların anlaşılması kolay bir diyalog biçiminde ifade edilmesi gerekir. Ayrıca yeni konular açabilmeleri de gerekiyor. Kullanıcılarla daha etkili bir şekilde iletişim kurmak için, Microsoft Xiaoice yalnızca metin kullanmakla kalmaz, aynı zamanda resim, ses vb. Gönderebilir.

Şekil | Diyalog sonuçları oluşturmak için IQ ve EQ kombinasyonu

3. Genel yapı

İlk olarak, sistem, kullanıcı giriş metnini, resmi veya sesi kabul etmek için çok modelli bir arayüze sahiptir. Ardından, sohbet yöneticisi girdiyi anlamak ve çıktıyı oluşturmak için girdiyi farklı modüllere gönderir. Son olarak, sohbet yöneticisi, nihai çıktıyı oluşturmak için oluşturulan sonuçları entegre edecektir.

Şekil | Genel mimari diyagramı

Core-chat, metin girişini kabul eden ve metin çıktısı üreten sosyal robotların temel modülüdür. Sistem için iletişim yetenekleri sağlar. Konuşmanın içeriğini anlamak için bağlamsal bilgiyi kullanır ve aynı zamanda içindeki duygusal bilgiyi tespit eder ve kullanıcının duygusal durumuna etki eder. Kullanıcının özelliklerini ve duygusal durumunu daha iyi anlamak için, her müşteri için bir genel bakış kaydedecek ve kullanıcının temel bilgilerini kaydedecektir. Sağduyu bilgisine sahip olmak için Freebase ve Microsoft Concept Graph kullanabilir.

Çıktı oluşturmanın iki ana yolu vardır: Erişim tabanlı ve oluşturulmuş tabanlı. İlki, önce insan konuşmalarındaki mesaj cevap çiftlerini depolayan bir veritabanından bir dizin oluşturacaktır. İkincisi, derin sinir ağlarının kullanılması nedeniyle son zamanlarda büyük ilerleme kaydetti. Nöral kodlama ve kod çözme ağı üzerinden LSTM ağı yardımıyla sonucu üretir.

Sosyal robotların da resimleri anlamaları gerekir, çünkü bunlar genellikle sosyal durumlarda kullanılır. Nesneleri tanımaya ve resimlerin içeriğini tanımlamaya ek olarak, sosyal robotların yorumlarının kişisel ruh hallerini, duyguları ve tutumları da yansıtabilmesi gerekir. Visual Sense ayrıca alma ve oluşturmaya dayalı iki yönteme sahiptir. İlki, evrişimli bir sinir ağı kullanıyor ve ikincisi bunu bir görüntüden dile oluşturma sorununa dönüştürüyor.

Şekil | Kişiselleştirilmiş bir yorum oluşturmak için görselin içeriğini tanımlayın ve açıklayın

Microsoft Xiaoice'un geleceği

Xiaobing sizinle Çin'deki WeChat ve Weibo'da tanıştığından beri internette bir ün kazandı. Haber editörü, sunucu TV ve radyo programları her şeye kadirdir. Microsoft XiaoIce, 2015 yılında Japonya'ya indi, 2016 yılında sizinle Amerika Birleşik Devletleri'nde buluştu ve 2017'de Hindistan ve Endonezya'ya geldi. Son üç yılda, Xiaoice teknolojisini yükseltiyor ve Çin'deki CPS'si yıldan yıla artıyor. Microsoft Xiaoice, belirli bir resme göre şiir yazmak gibi daha karmaşık ifadeler de oluşturabilir. 15 Mayıs 2017'de tarihteki ilk AI şiir koleksiyonunu yayınladı ve birçok ciddi şiir yayınında 70'den fazla şiir yayınladı ve yeteneği tamamen onaylandı.

Şekil | Çin'deki Microsoft Xiaoice'un giderek artan CPS değeri

Microsoft Xiaoice tarafından temsil edilen sosyal robot zaten güçlü olsa da, Ancak, insan diyaloğunda sıklıkla tezahür eden düzey gibi, insan düzeyinde zeka da ulaşılamaz. Makinelerin insan dilini anlamasını sağlamak, yapay zeka alanında hala temel bir zorluktur. Bu, birçok alanda, özellikle yapay zeka farkındalığı ve bilişinde büyük atılımlar gerektiriyor.

"Topu en iyi bilen şişman adam" Masa Tenisi Derneği başkanlığına seçildi.
önceki
Tianxingzhou Köprüsü sabah erken saatlerde engellendi, 67 alarm çağrısının hepsi bu yüzden yapıldı Günaydın Wuhan
Sonraki
2299 yuan! Xiaomi Mi 8'in popülaritesi fiyat indiriminin ardından yükseldi ve dünyanın en iyi üç fotoğrafı iyi biliniyor
İçerik pazarlaması + kesin içgörüler, Mengniu dijital pazarlama kapsamlı bir düzen başlatır
Gezegen Değerlendirmesi ColdLar Touch, Kushen'den yeni bir kart donanımı cüzdanı: "kasa" dan "banka kartı" na
Pfizer, Alzheimer ilaçlarının araştırma ve geliştirilmesinden vazgeçer ve zamana karşı savaşır.İnsanlar ne kadar emin?
Bullet SMS, China Mobile ve Fetion ile resmen işbirliği yaptı mı? Resmi tebrikler
Kültür ve eğlence sektöründeki sermaye yatırımı azaldı ve canlı yayın endüstrisi sorunlarla dolu ancak yine de en çok parayı çekiyor - 2017'nin ilk yarısında kültür ve eğlence sektörüne yapılan yatır
25 Huawei modelinin tümü EMUI9.0'a yükseltildi! Gelecekte LT teknolojisi desteği olacak
VC tahmini: kripto para birimindeki patlama vuruşu, Bitcoin ve Ethereum'un toplam piyasa değeri 2020'de 4,5 trilyon ABD dolarına ulaşacak
Glory YOYO'nun büyümesinin 30 günlük yıldönümünden itibaren Glory, YOYO'yu bir AI ekosistemi oluşturmak için çekirdek olarak kullanıyor
Lenovo Z5S, Honor V20'yi kışkırtır, Changcheng: Snapdragon 710, Kirin 980'den daha kötü değil!
Nokia yeni bir üç kameralı arka kamera çıkaracak! Yükselmek üzere mi? Netizen: Bir ömür boyu imkansız
Bir sonraki Huawei veya Hon Hai? On yıldır bir kılıcı bileme ve yıkıcı araştırma ve geliştirme çalışmaları, şimdi tam zamanı
To Top