İnsan-Bilgisayar Etkileşimi İnsan Hayatını Nasıl Değiştirir | Milyonlarca İnsan Yapay Zekayı Öğreniyor

Yazar | Weng Jiaqi

Derleme | Shanshan

Üretildi | Yapay Zeka Başlıkları (Genel Hesap Kimliği: AI_Thinker)

[Kılavuz] İnsan-bilgisayar etkileşimi sürecinde, insanlar bilgisayar sistemleri ile bilgi alışverişinde bulunur Bilgi ses, metin, görüntü ve diğer yöntemler veya çoklu yöntemler olabilir. İnsanlar için, akıllı diyalog için makinelerle etkileşimde doğal dilin kullanılması en doğal etkileşim yollarından biridir, ancak bu yol zorluklarla doludur Robotlar insan dilini nasıl daha iyi anlayabilir ve böylece insan niyetlerini daha açık bir şekilde tanımlayabilir? Kullanıcılara nasıl daha doğru ve iğrenç olmayan yanıtlar verilir? İnsan-bilgisayar etkileşimi diyalog sürecindeki en endişe verici konulardır. NLP'nin önemli bir araştırma alanı olan diyalog sistemi, her geçen gün daha fazla ilgi görmekte ve birçok alanda uygulanmakta ve bu da büyük değer taşımaktadır.

Ana kampın bu açık sınıfında, Takema Intelligence CTO'su Bay Jiaqi Weng'i davet ettik. Bu konuyu anlaşılması kolay teknik yöntemler ve demo gösterilerinin bir kombinasyonu yoluyla açıklayacak. Bu konu temel olarak birkaç içerik:

1. Bağlamın anlaşılması, teknolojinin tamamlanması ve referans çözümlemesi

2. Bağlamı anlama teknolojisi-diyalog konu türü tamamlama

3. NLU'nun modül mimarisi ve NLU'nun temel bilgilerinin nasıl kullanılacağı

4. Canlı Demo Demosu

5. İnsan-bilgisayar etkileşiminin vaka paylaşımı ve araştırma geliştirme eğilimleri

6. S ve A

Açık sınıfın metin versiyonunun içeriği aşağıdadır

Önsöz

1982'den beri bilgisayar başında oturuyorum ve bu güne kadar devam ettim. Yapay zeka en son 27 yıl önceydi, 1991 civarı. O zamanlar yapay zeka yapan insanlar çok acınacaklardı çünkü onlardan hiçbir şey çıkaramıyorlardı. Herhangi bir makine öğrenimi eğitimi veya sinir ağı eğitimi 20 gün sürdü. Bir parametreyi ayarlamak ve yeniden eğitmek çok çok yavaş bir 20 gün daha sürer. Bilgisayar satrancı için Go dışında her şeyi yaptım Hayatımda Go altında bir kazanan görmedim ama iki yıl önce gördüm. Daha sonra konuşma tanıma yaptım, konuşma tanıma çağı da bir oyuncaktı, bu yüzden o dönemde yapay zeka yapan insanlar nihayet parçalandı, hayatta kalamadıkları için arama motorlarına girdiler, finansla karşılaştılar ve başka sektörlere girdiler. .

Yapay zeka bu kez geri döndü ve gerçekten insan hayatına girmeye başladı, çevremizde bize yardımcı oldu. Bugün bu insan-bilgisayar etkileşim teknolojilerindeki değişiklikleri paylaşacağım.

Önce "bir bileziğin hikayesinden" bahsedelim. Bu gerçek bir hikaye. Bunu iki yıl önce Nisan ayında yapmak istedik. Diyelim ki bir kullanıcı bileklik takıyor ve "Bir kız arkadaşla çıkmak neredeyse hafta sonu, Bana bir öneride bulun. " Arkamdaki robot benimle ilgili bazı şeyleri hatırlıyor ve geçmişteki flört alışkanlığımın evde film izlemek, yürüyüşe çıkmak veya oyun oynamak ve video izlemek olduğunu biliyor. Dışarı çıkacaksanız hafta sonu hava nasıl, şiddetli yağmur yağarsa uygun olmayabilir.

Ve hangi filmleri izlemekten hoşlandığımı, hangi filmleri sevmediğimi, kız arkadaşımın neleri izlemekten hoşlandığını ve neleri sevmediğimi biliyor. Hangi kız arkadaşımla çıktığımı, ne yemeyi sevdiğimi, neleri sevmediğimi, restoranda ne olduğunu bile biliyor Fiyat yemek başına 2.000 yuan, yemek başına 200 yuan veya öğün başına 30 yuan. Kız arkadaşınızı ne zamandır tanıyorsunuz? Yeni tanışmışsanız, daha üst bir yere gidebilirsiniz. 6 yıl birbirinizi tanıdıktan sonra, rahat bir yemek yiyeceksiniz. Ve flört alışkanlıkları.

Bunları aldıktan sonra robot, alıştığımız XX sinemasında "Lost World 2" olduğunu söyleyerek cevap verdi.Filmi izledikten sonra yakındaki bir restoranın fiyatı ve lezzeti ihtiyaçlarımızı karşılıyor. . "Tamam, sorun değil" dedim ve robot benim için bu komutu yerine getirdi, benim için sinema bileti satın aldı, benim için restoran rezervasyonu yaptı, hafta sonları benim için taksi yaptı ve hatta kız arkadaşım yeni tanıştı ve restoranda bir demet çiçek aldı. Masanın üstünde.

Bunu yapmayı hayal ettik. Buna hangi teknolojiler dahil? Birincisi, hafıza var, bana söylediklerini hatırlayabiliyorum. Aynı zamanda insan-bilgisayar etkileşimini de içeriyor. Bugün söyledim, "Hafta sonu kız arkadaşımın doğum günü. Daha iyisini sipariş edeyim." Bir restoranı değiştirmeme ve ne demek istediğimi anlamama yardımcı olabilir.

Bilezik bunu yapabiliyorsa bileziğin yeterince akıllı olması gerektiğini düşüneceksiniz ve bu robot size yardımcınız olarak eşlik edecek kadar akıllı. Sonunda biz başaramadık, bir kısmını yaptık, bir kısmı da olmadı.

Şirketimizin patronu Kenny, daha önce Microsoft Asya İnternet Mühendisliği Enstitüsü'nün Xiaobing ve Cortana'dan sorumlu dekan yardımcısıydı. Patron bir arama motoru. 11 yıldır arama motoruydum. Sol alt köşedeki Cao Chuan, Microsoft'ta bir arama motoru olarak çalışıyor. Sağ üst köşe Microsoft'ta bir arama motorudur. Sağ alt köşe, bir arama motoru olarak Google'dır. Mevcut yapay zekaların çoğu arama motorlarından geliyor, çünkü arama motorları aynı zamanda anlamsal anlama, metin analizi yapıyor ve yapay zeka metin analizi ile belirli bir korelasyona sahip.

İnsan-bilgisayar etkileşiminin gelişimi

Başlangıçta bazı anahtar kelimeler ve şablonlar vardı. Verdiğim en yaygın örnek, masamda çok ünlü bir şirket tarafından yapılan bir hoparlörün olmasıydı. Bugün bu konuşmacıya "Dana erişte sevmem" dedim. "Sığır şehriye" anahtar kelimesini yakalayacağım, bana "Tamam, sana yakın restoranları tavsiye et" dedi, bana ilk tavsiye sığır etli erişte olabilir. "Az önce çok yedim ve çok yedim" dersem, anahtar kelime "yemek" olur ve sonra "Tamam, yakındaki restoranları tavsiye et" dedi, yani anahtar kelimeleri kullanmak imkansız değil. Anlamsal niyet anlamanın doğruluğu yaklaşık% 70,% 75 veya% 80 olabilir, ancak bu cümle ile ne demek istediğinizi gerçekten anlamadığı için anlayamadığı bazı şeyler vardır. Dolayısıyla, iyi yapmak istiyorsanız, doğal dil anlayışı, derin öğrenme, pekiştirmeli öğrenme ve şablonlar kullanmalısınız. Ne yapmak istediğinizi daha iyi anlamak için bu teknolojileri karıştırın ve eşleştirin.

Bu Chatbot'un evrimini detaylandırmayacağız, ancak bugün onu ifade etmek istiyorum. Bunu insan-bilgisayar etkileşimi veya anlamsal anlayış açısından üç seviyeye ayırıyoruz.

Doğal dil anlayışı Örneğin "açım" ve "yemek istiyorum" gibi iki cümlenin söz dizimi ve cümle kalıplarının aynı olmadığını, dolayısıyla analizin sonuçları da farklı olduğunu söylemek istiyorum, bu en alt düzeydir.

İkinci katmana "kasıtlı anlayış" denir Bu iki cümle farklı olsa da niyetleri aynı. "Açım" ve "yemek istiyorum", yakınlarda hangi restoranların olduğunu bilmek veya bana bir paket yemek sipariş etmek istediğim anlamına gelebilir. Zemin. Herkesin yaptığı şey birinci ve ikinci katmanlar.

Aslında, üçüncü bir katman var ve üçüncü katman, bu cümlenin arkasında gerçekten ne anlama geliyor? Mesela saat 8'de halka açık bu dersimiz olduğunda herkesin önünde birden "açım" ve "yemek istiyorum" diyorum, nasıl hissediyorsun? Zihinsel olarak sabırsız olduğumu veya konuşmak istemediğimi mi hissediyorsun? Duyguların olumsuz olmalı. Bugün bir kıza "açım" dersem kızlar ne düşünür? Acaba onu yemeğe mi davet etmek istiyorum yoksa ona karşı kötü niyetim var mı? Şu anda, herkes üçüncü katmandan çok uzakta. Zihnimizde gerçekten istediğimiz AI, atmamız gereken adımdır.Kaçınılmaz olarak duygular, duygu tanıma, durum tanıma, sahne tanıma ve bağlam tanıma olacaktır.

Duygusal bir robot olan şirketimizin adı "EMOTIBOT". Başladığımızda duygu ve duyguları tanımaya çalıştık. Duyguları ve duyguları tanıyoruz. Açık metin 22 tür duygu yarattı. Bu çok anormal. Çoğu şirket üç tür "olumlu, olumsuz ve orta" yapar.Ancak olumsuz duygulara baktığınızda tiksinti, öfke, üzüntü, üzüntü vardır. Korku, hoşlanmama ve mutsuzluk hepsi olumsuz duygulardır, ama aynı değiller.Maalesef üzgünüm ve kızgınım Robotun geri bildirim yöntemleri farklı olmalı.

9 çeşit yüz ifadesi ve 4 çeşit dil duygusu yaptık. Ve en çok yaptığımız şey, bu duyguları çok modlu duygular yaratmak için bir araya getirmek. Örneğin, üniversiteye giriş sınavının sonu gibi, bugün bir metin okudum: "Üniversiteye giriş sınavında 500 puan aldım." Bu metni okudunuz ve beni tebrik etmeli veya teselli etmeli mi bilmiyorsunuz. Şu anda konuşmanın tonuna göre değişiyor ... Eğer tonum "Ah, üniversiteye giriş sınavında 500 puan aldım." Dediğini duyunca üzgün olduğumu biliyorsun, bu yüzden beni rahatlatacaksın. Bu nedenle genellikle konuşma duygusu, metin duygusundan daha doğrudandır.

Sonra yüz ifadeleri eklenir ve üçü de eklenir ki bu daha da zahmetlidir. Hadi bir video izleyelim, masaüstü paylaşımını kullanıyorum. (Video oynatma) "Hayalet neler yaşadığımı biliyor", metin eşleşiyor - ölüyorum, ölmek daha iyi, metnim kızgın, ancak ses duygularım ve yüz ifadelerim mutlu, bu yüzden Genel ruh hali hala mutlu. Bu, yüz ifadeleri, ses duyguları ve metin duygularını karıştırarak yapılan çok yönlü bir duygudur.

Bağlam anlama teknolojisi

Sonra, daha teknik kısma girin. Konuşurken ve sohbet ederken, görev tabanlı robotlar bağlamı anlama teknolojisini içermelidir.

Bağlam anlama teknolojisi nedir?

Bu bir e-ticaret sitesi. Önceki cümlede "T-shirt almak istiyorum" dedim ve bana 3 tişört verdi. "Siyah tişört istiyorum" dedim yani siyah tişört istiyorum. , Ama ne demek istediğimi hiç anlamıyor, çünkü bağlam yok. Yani aslında bana siyahın temel tanımının ne olduğunu açıklıyor, çünkü o renge dönmüyor, bu yüzden ışığı göremiyorsunuz, bu yüzden siyah. Bu hiç istediğim şey değil, bu yüzden bağlam olmadığında tepkisi genellikle karışık oluyor.

Bunun bağlam içinde nasıl yapılacağına bir göz atalım.Bağlam içinde yapmanın birkaç yolu vardır. Birincisi, tamamlama ve referans çözümü, "yarın Şanghay'da yağmur yağacak mı", "yarın Şanghay'da hafif yağmur", "yarından sonraki gün" yanıtları ve konu, öngörü ve diğer şeyler eksik. Bunu tamamlayın ve "Yarından sonraki gün ne olacak" seçeneğini "Yarından sonraki gün Şangay'da yağmur yağacak mı" olarak değiştirin, ardından robot bunu kaldırabilir.

Referans çözümü aynı zamanda "Da Zhangwei'yi seviyorum", ardından robot "Ben de ondan hoşlanıyorum" diye cevapladı, "o" kim? Bu zamir, "o" nun Da Zhang Wei olduğunu biliyorum, bu yüzden anlayabilmek için "Ondan hoşlanıyorum" u "Da Zhang Wei'yi de seviyorum" olarak değiştirdim. Sonra o kişi, "En çok" Beier Shuang "şarkısını söylemesini seviyorum" dedi, o zaman o kim? En çok Zhang Wei'nin söylediği "Beier Shuang" olarak değiştirilmelidir. Bu ikisi temel şeylerdir, temelde her şirket bunu yapabilir.

Sonra daha zor şeylere bakarız, Konu tarzı tamamlama diyaloğu yapabilir misin ? Başlangıçta, içinde bir bağlam var, "Da Zhang Wei'yi seviyorum", mevcut diyaloğun ilk cümlesi Da Zhang Wei ve ardından "Evet, onu da seviyorum", "Da Zhang'ı da seviyorum" olarak değiştirildi. Wei ", sorun değil.

İkinci cümle "Boğaz ağrısıyla ne yapmalıyım?" İki olasılık vardır, çünkü şu anki konuşma konumum Da Zhangwei, yani "Boğaz ağrısıyla ne yapmalıyım" veya "Boğaz ağrısıyla ne yapmalıyım?" ", Ben şimdi ne yapmalıyım? Hangisini seçmeliyim? İlk "boğaz ağrısıyla ne yapmalı" diye bir dene, cevabı bulabilirsin. İyi bir cevap bulabileceğimi biliyorum, bu yüzden "Boğaz ağrın varsa daha fazla su iç" dedim. Şu anki konuşmanın konusu da boğaz ağrısına dönüştü.

Üçüncüsü "Hangi şarkıyı söyledi?" Kim o? İki konuşma konusu var, biri boğaz ağrısı, diğeri Da Zhang Wei ve "boğaz ağrısı için hangi şarkıyı söyledi" veya "Da Zhangwei hangi şarkıyı söyledi" olabilir. Öncelik nedeniyle, en son konuşmanın konusu boğaz ağrısı, bu yüzden ilkine bakıyorum, ancak cevabı bulamadığım anda ikinci "Da Zhang Wei hangi şarkıyı söyledi" e gideceğim, sonra Da Zhang Wei'yi tanıyorum Bir şarkı söyle, "Beier Shuang" ı söyledi, cevap verebilirim, bu bir diyalog teması tamamlayıcıdır.

Ek olarak, bağlamsal diyalog kontrolü için temalar kullanın. Şu anda Dünya Kupası'nda olduğu gibi, size "Premier Lig'de hangi takımı seviyorsunuz?" Diye soruyorum. Benim temam "Futbol" altındaki "Spor" altındaki "Beş Büyük Lig". "Premier Lig", "Barselona'yı seviyorum" diye cevap verebilirim, bana Premier Lig'i sorun, La Liga'ya cevap veriyorum, bunda yanlış bir şey yok, alt diyalog teması farklı olsa da ön taraf aynı. Ya da bana futbol hakkında sorarsanız, basketbola cevap verebilir miyim, "NBA'i izlemeyi tercih ederim" ki bu iyi olmayabilir ama tamamen imkansız da değil. "Yumurtalı kızarmış pilav yemeyi severim" dediysem, bu kesinlikle yanlış, çünkü bana spor ve spor hakkında sorular sormuştunuz ve ben de gurme yemekleri yanıtlamıştım.

Bu konuşma konusu için, cevabın hangi konu olması gerektiğini oluşturmak için bağlam konusunu kullanabilir miyim? Bir sonraki cümlenizde hangi anahtar kelimelerin olması gerektiğini bağlama göre tahmin edebilirim. Bir sonraki cümlenizin, olumlu bir cümle mi yoksa olumlu ve olumsuz bir soru mu, bağlama göre ne tür bir cümle olacağını tahmin edebilirim. Anahtar kelimelerim, cümle kalıplarım ve konularım var. Cümleler oluşturabilir ve bir cevap verebilirim. Bu aynı zamanda bir tür bağlamsal çözümdür. Ya da hiçbir şey umurumda değil ve size doğrudan bağlama dayalı olarak üretken bir şekilde yanıt vereceğim. Bu şu anda araştırılmakta ve geliştirilmektedir ve mevcut doğruluk çok yüksek değildir, ancak bu gelecekteki bir geliştirme yönüdür.

NLU'nun önemi

NLU için 12 modül yaptık, elbette en temel olan kelime bölütleme, ardından konu veya fiil, sıfat, ikinci şahıs, üçüncü şahıs ve sonra isimlendirilmiş varlık olsun, konuşma etiketlemenin bir parçası , Pekin ve Şanghay'da eğlenceli olan şey, biri Pekin, biri Şangay, ikisi aynı değil. Sonra "Elmaları sever misin?" "McDonald's'a daha sonra gider miyiz?" Diye sorarsam, bu bir sorudur ve kişisel fikrini soruyorum, bu yüzden cevabın olumlu olabilir, belki Negatif bir kişi, "yemek için biraz bekleyin" diyen bir soru da sorabilir. Her halükarda, cevabınız bana "günaydın" veya "iyi geceler" demeyecektir çünkü "bizi bekleyin" McDonald's'a gidin, tamam mı? Anlamsal rol etiketleme gibi bazı garip şeyler de yaptık, bazı örnekleri daha sonra görebilirsiniz.

Bu cümleyi örnek alırsak, "Yarın Şanghay'a uçacağım, iki gün yaşayacağım ve evim gibi olacağım" cümlesinin tümünün sözdizimsel yapısı çıkarıldı. Çekirdek fiiller "uçmak, yaşamak, istemek" ve onları "uçuyorum" ve "uçuyorum" olarak ayırıyor. Bu temel fiillerle, niyetimin uçak bileti rezervasyonu yapmak olmadığını biliyorum. Keşke "Yarın Şangay'a uçacağım" ise, niyetim uçak bileti rezervasyonu yapmak olabilir, ancak aşağıdaki nedenlerden dolayı "İki gün yaşamak" ve "Evde olmak istiyorum", bu yüzden niyetimin bir otel rezervasyonu yapmak olduğuna karar verdim ve bunlara göre hesapladım: yarın giriş yapın, 3 gün sonra çıkış yapın, şehir Şangay ve otelin adı Home Inn. Her şey ayrıştırılabilir.

Bu çözüm ile derin öğrenme kara kutusu arasındaki en büyük fark, bu çözümün önce cümleyi bazı kısımlara ve bazı temel bilgilere ayırmasıdır.Bu bilgilere dayanarak, niyetlerinizi ve konuşma konularınızı derin bir öğrenme yoluyla değerlendirebilirim. , Yani veri hacmim çok daha küçük olabilir. Büyük kara kutunun tamamı 500.000 oran, 1 milyon oran ve 2 milyon oran gerektiriyorsa, belirli bir doğruluk oranına sahip olacaktır. Bugün yeterince söktüm, bu nedenle veri hacmim 30.000 veya 50.000'den fazla, böylece iyi bir model eğitebilirim.

NLU'nun "geçen hafta ne kadar kıyafet satın aldım" gibi temel bilgilerini nasıl kullandığımı tanıtayım. Konuşma Yasası'ndan bunun bir soru olduğunu biliyorum, bu bir soru-bilgi, "geçen hafta kıyafet al demez misin? Çok para ", bu bir soru değil, dolayısıyla bununla uğraşmaya gerek yok. Bu bir soru ise, bunun bir miktar sorusu mu, konum sorusu mu yoksa bir zaman sorusu mu olduğuna bakın, "Bu elbiseyi ne zaman satın aldım?" "Bu elbiseyi nereden aldım?" Cümleler aynı değil, daha sonra hangi veritabanının hangi tablosunu kontrol edeceğimi biliyorum. "Para harca" ve "kıyafet satın al" temel fiillerine göre, kategorinin yemek değil, ulaşım değil giyim aksesuarları olduğunu bilmek ve zamana göre "geçen hafta" olduğunu bilmek, her şeyi anlamanıza yardımcı olabilir. Bu, niyetinizi ve ayrıntılarınızı değerlendirmeden önce NLU tarafından analiz edilen cezamla eşdeğerdir.

Çok yönlü diyalog ve robot platformu

Şu anda bir otel rezervasyonu örneği gibi, "Otel rezervasyonu yapmak istiyorum" yazıyorsa, bir otel rezervasyonu yaparken çıkarılacak 8 parça bilgi vardır. Şu anda, robotun sizinle iletişim kurması gerekir: nerede rezervasyon yapmak, check-in, check-out, otel İsim, yıldız derecelendirmesi, fiyat vb. Bugün kullanıcılarımız itaatkar cevap vermeyecek. "Nerede otel rezervasyonu yapmak istiyorsunuz?" İtaatkar bir şekilde size "Şangay" veya "Pekin" diyebilir veya size "Yarın Şanghay'a uçup iki gün kalacağım ve evde olmak istiyorum" diyebilir, size bir cümleyle söyledi. Dört adet bilgim var, bu yüzden temelde yuvaları doldurma yöntemini kullanıyorum, doldurulacak N yuva var. Sonra bu cümledeki hangi bilgilerin olduğuna bakın, onu çıkarın, karşılık gelen boşlukları doldurun ve ardından hangi alanların eksik bilgi olduğuna bağlı olarak sonraki soru turunda hangi soruların sorulacağına karar verin. Örneğin, "Bir servet yönetimi ürünü satın almak istiyorum", "Sermayeyi korumaya ihtiyacın var mı?" Sana sadece sermayeyi koruyup korumaman gerektiğini sordum, ama o bir seferde "Garanti süresi bir yıl ve beklenen getiri 5'ten az değil Bir nokta. "Bana bir seferde 3 parça bilgi söyledi ve 3 parça bilgi yeterli, bu yüzden size" Bir yıl mı, altı ay mı yoksa iki yıl mı istiyorsunuz? "Diye sormadan doğrudan sizin için tavsiye edeceğim. Aptalca.

Şimdi bazı Canlı Demo öğelerine bakalım

Birincisi, diyalog robotlarının özelleştirilmesi, kendi robotlarınızı nasıl hızlı bir şekilde özelleştireceğinizdir.

Önce paylaşılan masaüstüne geçtik. Burada, şimdi bir robot yarattığımı varsayalım, adım "Küçük Bambu", o zaman ben hangi robotum? Sohbet mi, e-ticaret mi yoksa finans robotu mu? Ben bir sohbet botuyum. İki adım tamamlandı. Sonra bazı ayarları yapabilirsiniz Robotun bir görüntüsü var Herkes diyecek: Erkek misiniz kız mı? Gece uyur musun Uzun ayakların var mı? Kaç yaşındasınız? Baban kim? Senin annen kim? nerede yaşıyorsun? "Sen erkek misin kız mısın" diye sorduğun zaman "Ben kızım" dedim, değiştirebilir miyim? "Ben bir sihirbazım" veya "Cinsiyetim yok" u değiştirip kaydediyorum. Onu kaydettikten sonra değiştirmedim, çünkü onu yeniden biçimlendirmedim, önce soralım, "Erkek misin, kız mısın?" Hala "Ben kızım" diyor. Sonra "Adın ne?" "Küçük Bambu" yazıyordu. Ona "yarın Şangay'da yağmur yağacak mı?" "Pekin'e ne olacak?" Diye sormaya başladım. Bu bağlam, yarın Pekin'de yağmur mu yağacak, "yarın Pekin'de yağmur yağacak", sonra "yarından sonraki gün ne olacak?" Pekin veya Şanghay'dan sonraki gün mü? Pekin'de yarından sonraki gün olmalı, çünkü Pekin'e en yakın olanı.

Sonra ona bilgi tabanlı "Yao Ming ne kadar uzun?" Diye sordum. Bana bunun "226 cm" olduğunu söyledi ve ona "Yao Ming'in karısı ne kadar uzun", "190 cm" sordum ve bazı çıkarımlar yapılabilir. "Nicholas Tse'nin Chen Xiaochun ile ne ilgisi var?" Çok az kişi Nicholas Tse'nin eski karısının Cecilia Cheung olduğunu ve Chen Xiaochun'un eski kız arkadaşının da Cecilia Cheung olduğunu biliyor, bu yüzden Chen Xiaochun, Nicholas Tse'nin eski karısının eski erkek arkadaşı. Bu bilgi çıkarımıdır. Orada olması gereken bazı fonksiyonlar da var, eğer sıkıcıysa makine sizinle sohbet edecek. İstediğiniz cevabı değiştirebilir, bilgi grafiğini değiştirebilir ve kendi niyetlerinizi oluşturabilirsiniz.

İkinci demoya bakalım, çok yönlü bir diyalog sahnesinde nasıl yapılır?

Önce yeni bir sahne oluşturuyorum, sahnenin adı "Lokantaya gitmek", tetikleme koşulu, bu sahneyi nasıl bir cümle tetikleyecek? Yeni bir niyet yaratmak istiyorum, niyetin adı "bir restoran rezervasyonu yap" ve kullanıcı "Masa ayırtmak istiyorum" veya "Yemek istiyorum" diyor. Şimdi bir restoran rezervasyonu yapma niyeti var, "Yemek istiyorum" veya benzeri bir şey söylediğim sürece bu sahneye girmek istediğimi biliyor. Sonra, bir restoran sipariş etmek için iki parça bilgi var En azından zamanını ve kişi sayısını bilmeniz gerekiyor. Nasıl sorarım? "Ne zaman seçmek istiyorsun? Seçmek istediğin kişi sayısı kaç?" Şeklinde varsayılan soruyu alabilirim. Ama çok katı görünüyor, özelleştirebilirim "Ne kadar süre rezervasyon yaptırmak istediğinizi sorabilir miyim? Toplamda kaç kişi var? ? "Bu iki soru sırasıyla zaman ve kişi sayısını çeker ve ardından bir sonraki adıma geçer. Çıkarma işleminden sonra, koltuk ayırtmanıza yardımcı olacak bir yere bağlanan harici bir bağlantı olabilir. Şimdi "Rezervasyon başarılı, rezervasyon süreniz **, toplam kişi sayısı **, teşekkür ederim" şeklinde yanıt vermenin yolunu seçin, kaydedin, bir satır kod yazmadım ve sonra testi başlatın.

Bir sonraki demoya bakalım. Masaüstünü restoran sipariş etmek için doğrudan kullanalım. Neden bir restoran rezervasyonu yapmalı? Geçen ayki Google demosu restoran sipariş etmekle ilgili olduğu için, restoranlarda yer ayırtmanıza yardımcı olacak bir robot vardı. "Yer ayırtmak istiyorum" dedim ve bana "Saat kaç?" Diye sordu, şu anda bir cümleyi cevaplayabilirim ve buna "Milli gün, yaklaşık 7 veya 8 kişi ve 2 çocuğumuz var. Mümkünse benim için özel bir oda ayırtın. 7:30 civarı varırız ve 8: "Tamam". Sadece bir defa sorar benden çok şey cevapladım. Anlamanın bir yolu var mı? 7. 8 kişi 78 kişi değil 8 kişi, ayrıca 2 çocuk getir.Eğer yapabilirsen benim için özel bir oda ayır, yani o özel bir oda 7:30 civarı gelecek, bu yüzden saat 8'de rezervasyon yaptırmak iyi olur, anlamanın bir yolu var. "Tamam", saatin sabah 8 mi, akşam 8 mi olduğunu söylemedim, "20:00", "Bebek sandalyesine ihtiyacın var mı?" "Çünkü çocuğum var, bebek sandalyesi" ve bana "Adın "," Zengin adam "dedim, benim için yer ayırdı, ama yer yok." Numarayı ayarlamak ister misin? "" Tamam ", yaşlı bir insanım var dedim ve giriş ve çıkış için daha uygun bir yer ayarlamama yardımcı oldu. "Bilgiler doğru mu" ve "Evet", rezervasyon tamamlandı.

Başka bir tane deneyelim, "Masa rezerve etmek istiyorum" "Ne zaman?" "Yarından sonraki gün saat 9'da, 8 kişi." "Özel bir oda mı yoksa lobi mi istersiniz?" "Lobi çok gürültülü, özel oda hazır." Anahtar kelimeleri kullanmadım. Anahtar kelimeleri kullanırsanız, bir lobi ve özel bir oda var, hangisi? Soyadınız, "Li" ve sıra numaranız olan rezervasyonlar da vardır. "Kimse doğum gününü kutladı mı? Bir hata yaptı mı?" "Sorun değil" ve benim için ayırdı. Bunu bir robot yapabiliyorsa, istediğinizi söyleyebilirsiniz. Sırayı takip etmezsiniz ve hatta "8 kişim var, hayır, 9 kişi" diyerek onu değiştirebilirsiniz. Sizin 8 yerine 9 kişi olduğunuzu bilebilir. kişiye özel.

İnsan-bilgisayar etkileşiminin bir sonraki adımı

Paylaşılacak birkaç durum var:

İlk AIOT platformu. Bu şu anda bazı şirketler ve şirketler tarafından yapılıyor. Örneğin bilekliğime, hoparlörlerime ve kulaklıklarıma evde olduğumu söyledim ve çok karanlık olduğunu söyledim Çok karanlık olmak ne demektir? Bugün evimdeki birçok akıllı ışığın platformuma bağlı olduğunu varsayarak platformuma çok karanlık olduğunu söyledim, ışıkla ilgili şeyler neler? Perdelerin ışıkla, elektrik ışıklarının da ışıkla ilgili olduğunu buldum, bu yüzden oturma odasındaki, tuvaletteki veya mutfaktaki ışıkları açmak isteyip istemediğinizi sormak için koştum. Bunu sormak aslında çok aptalca, çünkü şu anda oturma odasında olabilirim, neden bana bunu soruyorsunuz? Ama kimseye yardım edemem, neredesin? Birkaç çözüm var, evimin her yerine kamera yerleştiriyorum ve nerede olduğunuzu biliyorum ama bu çok korkutucu bir şey, evde kamera kurmanın rahatsız edici olduğuna inanıyorum.

Tabii geçmişte birkaç tane daha WIFI kurdum.Evinizin üç farklı yerine üç tane WIFI kurdum. Nerede olduğunuzu bilmek için nirengi kullanıyorum. Oturma odasında olduğunuzu biliyorum. Çok karanlık derseniz koyarım Bunu benim için yapmak için arkamda aynı ALOT merkezi kontrol merkezine sahip olduğum sürece oturma odasındaki ışıklar yanıyor.

Ayrıca birden fazla seçeneğim olabilir. Çok sıcak dedim. Çok sıcaksa, pencereyi mi, klimayı mı yoksa elektrikli fanı mı açmam gerekir? Makine size fanı mı yoksa klimayı mı açmak istediğimi soruyor. Klima hakkında konuşalım. Şimdi çok sıcak, tamam, robot bunu sizin için yapacak. Bazen insanların niyetlerinin birden fazla olasılığı vardır. Birden fazla AIOT ev aleti, robotun ustalaşabileceği sıcaklık kontrolü ile ilgilidir. Tabii ki daha zeki olacak. Sıcaklıkla ilgili 18 olmayacak. Tek tek soruyor ve sonunda insanlar bayılacak. Bu çok uzak olmayacak. Bence bu şeyler bir buçuk ila iki yıl içinde çıkacak hatta Bir yıl içinde çıkacak. Yavaş yavaş, eviniz bunları yönetmenize yardımcı olmak için ALOT'un tüm platformunu ve LOT ekipmanını kullanacak ve hayatınız daha kolay hale gelecektir.

İkinci insan-bilgisayar etkileşiminin bir sonraki adımı, yüz + sesin eklenmesidir.Yüzünüze göre kız veya erkek olduğunuzu ve şu anki ruh halinizi bilebilir miyim? Uzun saç ve kısa saç, gözlük takıyor musun, sakalın var mı? Konuşma tanıma elbette en temel olanı Bu çok, çok olgundur Bu cümlenin ne anlama geldiğini biliyor musunuz? Ses onu metne dönüştürür. Yapabiliyorsanız tonunuzu da öğrenebilirsiniz. Sesiniz kızgın mı, üzgün veya mutlu mu? Biraz referans verebilirim, sesin duygusu çok önemlidir.

Bu şey kullanılabilir.Yüz ifadesi özelliklerinden ne yapabilirim. Cinsiyet, yaş, ten rengi, saç, kaş, yüz değeri gibi 22 özellik yaptım. Güzel değil mi? Yüz şekli soğuk ve soğuk. Acımasız, karizmatik ve güvenilir biri olduğunuza dair hala olumlu bir izlenim var Bu ilk izlenim imkansız. Dokuz tür ifade yaptık: sevinç, öfke, üzüntü, korku, korku, tiksinti, aşağılama, kafa karışıklığı ve tarafsız. Yüzün davranışının analizi de var Bakışım odaklanmış mı yoksa hep böyle aşağı mı bakıyor, güvensiz mi yoksa düzensiz mi, bu ne anlama geliyor?

Gerçek bir başvuru durumundan bahsedelim.

Şimdi, insansız mağazalar da dahil olmak üzere bazı yeni perakende, bazı akıllı mağazalar içeriyor. Örneğin, büyük bir TV üreticisinin sadece belirli bir mağazada bir mağaza açmasına ve teknolojimizi bu mağazaya koymasına yardımcı oluyoruz. Aynı zamanda, beş şirketin tümü Rakip Sony ve diğer tanınmış markalar dahil olmak üzere TV satışı. Bu mağazanın açılmasından üç gün sonra, Sharpın 900.000 gelir elde ettik ve diğer dördü toplamda 400.000den fazla oldu. Sharpın öldürdüğü dört kişinin toplamı ikiye katlandı. birçok. Bu nasıl yapılır? İlki insanları çekebilir mi? Dükkanımın girişine bir perde koy, bir şeyler koy, kameranı, yanından geçerken yakalayabilirsin, erkek ya da kızsın, görünüşün nasıl? Nasıl hissediyorsun? Çok ilginç. Herkes görmek için durdu ve 40 yaşında bir erkek olup olmadığınızı görmek için durdu. İçinde hangi özel teklifler öneriliyor. Beğendiniz. 20 yaşında bir kızsınız. Başka bir teklif önerin. Siz bir çiftsiniz, çocuklu bir aileysiniz ve size önerilenler farklı.

Bu şeyi gördükten sonra mağazaya diğerlerinden daha fazla kişi girecek ve sonra aktif olarak etkileşim kurabiliyorum.Rafın önüne yürüdünüz ve sizinle aktif olarak sohbet eden uzun saçlı bir kız görüyorum, bir robot , Bir ekran, bir tablet, uzun saçlı bu bayan, saçlarınız çok güzel, burada biraz şampuanım var, saç kremleri var. Neleri bilmekle ilgileniyorsunuz? Sana vereceğim Sizinle konuşmak için bir şeyler önerirsiniz, yüzümde bazı koyu lekeler olduğunu söyleyeceğim, kapatıcım var, ister misin? Sohbet sırasında bu kişinin yüzünün gittikçe daha çirkinleştiğini fark ettim, bu konuyu çabucak durdurdum bu şeye devam edilmemeli, yüzün özellikleri, yüzün duygusu ve tüm insan-bilgisayar etkileşiminin bütünleşik uygulamasıdır.

Bunu da yapabiliriz. Bu alışveriş merkezinin koridorlarında birkaç koridordayım. İnsanlarınızın mağazada nasıl yürüdüğünü biliyorum. Belli bir televizyonun önünde beş dakika durduğunuzu fark ettim. Hiçbir şey almadan gittin. Ailenle iki gün sonra geldin Bu ne anlama geliyor? Karınızı ve çocuklarınızı kapıya getiriyorsunuz, bu da bir karar vereceğiniz anlamına gelebilir.Para harcayacaksınız ve son çevrimiçi satın alma kaydınızı kullanıyorum çünkü yüzünüzü ve kim olduğunuzu biliyorum. Üyelik numaranızı bilerek, geçen sefer 20.000 yuan'dan fazla bir buzdolabı satın aldığınızı biliyorum, bu yüzden harcama gücünüzün bir veya iki bin yuan olmadığını, iki ila 30.000 yuan olabileceğini biliyorum, hemen satış elemanına haber vereceğim Ona, bu kişinin bir TV almaya geldiğini, çünkü iki gün önce belirli televizyonları izlediğini ve harcama gücünün 10.000 olarak hesaplandığını söyleyin, bu 10.000 seviyesi, bu yüzden ona 4.000 yuan TV önermiyorsunuz. Sadece yüksekten yükseğe doğru tavsiye ediyorsun. Ayrıca bu nedenle mağazamız, satış performansımız diğerlerinden daha iyi olabilir. İnanıyorum ki yarım yıl içinde herkes çeşitli alışveriş merkezlerinde pek çok görecek.

Son olarak bir örnek veriyoruz. Bugün herkesin bir robotu olduğunu, bir bileklik taktığımı ve bilekliğin arkasının robotumu aldığını söyleyebilirsiniz. Ayrıca her mağazada bir takım robotum var. McDonaldnın bir takım robotları ve KFCnin bir takım robotları var. Bugün ben McDonald's'a gittim ve bilekliğime Big Mac'leri yemeyi ve büyük bir kola ile buza gitmeyi sevdiğimi söyledi. Robotum bunu duyduktan sonra, robotum bir McDonald's robotu bulmak için inisiyatif aldı ve istediğimi söyledi, iki robot Aralarındaki diyaloğun Çince veya insan dilini kullanmasına gerek yoktur.Doğrudan veri alışverişi yaparlar.Robot, robotun diline sahiptir. Kendi kendilerine değiştirirler. Değişimden sonra McDonald's robotu sipariş bildirimini aldıktan üç dakika sonra bana söyler. Gel ve sonra al, böyle olabilir mi? Bileziğim üç dakika içinde alabileceğimi söylüyor. Yani gelecek gerçekten bir robot dünyası olacak, herkesin bir zamiri var, robotlar robotlarla iletişim kuruyor ve bunu iyi yapıyor.

QA zamanı

Bugün benim paylaşımım ve bir dahaki sefere etkileşim zamanı. Herhangi bir sorunuz var mı? Birisi ilgili teknolojilerden bahsetmek istiyor ve hangi ilgili teknolojilere bakmalı? Bir görüntü ise, onu görüntünün en iyi şirketleri tarafından kontrol edebilirsiniz.Elbette, güvenlik şu anda ana odak noktasıdır, ister yüzü süpüren bir erişim kontrolü olsun ve yavaş yavaş duygusal kısmı yapın. Platform kısmı ise, şu anda ülkede yaklaşık on veya yirmi firma var.Herkesin kendine göre avantajları ve dezavantajları var.Kapalı veya açık platform olmanıza bağlı.Bir yapay zeka platformu ve anlamsal bir anlayış platformu arıyorsunuz. Tüm yapay zeka makine öğrenimi eğitim platformları bulunabilir.

1. Birisi ortamın dışında ortaya çıkan duygusal robotların bununla baş edip edemeyeceğini sordu?

Örneğin, dört sesli duyguya sahipsem: mutlu, tarafsız, öfke ve üzüntü, o zaman aniden bir korku belirir Ses korkusu kategori olarak ayırt edilemez ve üstesinden gelinemez.

2. Birisi yüz ifadelerini anlamayı sordu, bunu nasıl yaptığımızdan bahsedeyim.

Yüz ifadelerimiz 2 milyondan fazla fotoğrafla işaretlenmiştir.Her fotoğraf üç kişi tarafından işaretlenmiştir.Üç kişi mutlu olduğunu söylüyor, tamam, mutlu, üç kişi üzgün, üzgün, üç kişi diyor Anlaşmazlıklar var, bir psikologdan son kararı vermesini istedim, hesaplayabilirsin. 2 milyon fotoğraf üç kişi tarafından işaretlenmiş ve toplam 6 milyon kişi ziyaret ediyor Ne kadar zamana ihtiyacın var? Ne kadar?

3. Çok modlu duygular nasıl yapılır?

Yüz ifadeleriyle bir puan hesaplanır, ses duyguları için bir puan hesaplanır ve metin duyguları için bir puan hesaplanır. Arkamızda iki modelimiz var. İlk kural, kaç puanın yüz ifadeleri ve kaç puanın ses duyguları veya daha fazlasıdır. Bir oranı veya kelimelerin duygularını hesaplamanın bir yoludur.

Diğeri ise daha sonra kullanacağımız bir derin öğrenme modelidir.Tüm bu değerleri toplam bir duyguyu hesaplamak için etiketleriz.Tabii ki çok fazla açıklama verisi gereklidir.

4. Birisi, diyaloğun cevabının robotlar tarafından otomatik olarak sentezlenip birleştirilip birleştirilemeyeceğini sordu?

Bu otomatik üretim aralığı ... Şu anda, doğru oranın yaklaşık% 3-50 olduğunu ve cevabının yaklaşık% 30-% 50 olduğunu ve olasılığın yarısının güvenilir olmadığını düşünüyorum.

5. Ne kadar bilgi grafiği öğrenimi mevcuttur?

Bu şey sizin alanınıza bağlıdır. Finans alanında iseniz, finansal bilgi 120.000 veya 180.000 olabilir. Tıbbi alandaysanız yüz binlerce olabilir.Ama sohbet, yemek, giyim, barınma, film alanındaysanız, TV ve bu şeyler 8-12 milyon bilgi grafiği verisi ekler. Bazı büyük şirketler arama motorları yapar ve doğal veri miktarı son derece büyüktür Bilgi grafiği 800 milyon veya 2 milyar olabilir ki bu çok çok büyük miktarda veri.

6. Birisi, iletişim sürecinde bir yazım hatası yaparsam ne yapmam gerektiğini sordu? Sesten metne etkisi iyi değil Niyet tanımanın doğruluğu nasıl artırılır?

Sınırlı senaryolarda bu yapılabilir.Örneğin TV'nin 68 niyeti ve 100 niyeti vardır, çok doğru bir şekilde yapılabilir.Gerçekten pinyine dönüştürülebilir veya bazı bulanık eşleştirme yöntemleriyle yapılabilir. Eşleşme eşiğini büyütmek iyi bir şekilde yapılabilir. Bir sohbet sahnesinde, sınırlı bir sahnede bunu başarmak imkansızdır.

Bu aslında konuşma tanımayı içerir.Herkesin konuşma tanıma için kullandığı Mandarin çok standart değildir.Benim gibi aksanım var, böylece konuşmamı metne dönüştürebilirim.Pinyin'e çevirebilir miyim?chczhz

7.

8.

9.

182020100100

10.

11.

12.

010035PPT

13.

14.

NLPNLPNLP

15.

bugbugbug

--Bitiş--

Yapay zeka teknolojisi ürünlerinin hızlı yinelemesiyle, sürekli olarak yaşamın her alanına entegre oluyor, yeni iş formatları yaratıyor, yeni büyümeyi teşvik ediyor ve yeni gelişime öncülük ediyor. Teknolojinin - geliştiricinin arkasındaki kolaylaştırıcı olarak, kod satırları aracılığıyla dünya renkli hale gelir. Herkesin geliştiricileri daha iyi anlamasını sağlamak için, CSDN topluluğu "Geliştiriciler ve Yapay Zeka Araştırması" etkinliğini başlatacak.

Yoğun programınız sırasında "AI Öğrenen Milyonlarca Kişi" anketinin ilk aşamasına katıldığınız için teşekkür ederiz. Aşağıdaki soruları yanıtlamanız 2 dakikanızı aldı. Elektronik dergi raporunun 2020 Haziran ayı sonunda CSDN resmi kanalı üzerinden yayınlanması beklenmektedir ve araştırma raporu sonuçları da elektronik bir dergi şeklinde posta kutunuza gönderilecektir.

Anketi doldurduktan sonra değer kazanacaksınız 299 yuan nın-nin `` 2020 AI Developer On Bin Konferansı '' Canlı çevrimiçi biletler Bir yaprak.

Bu ankete verdiğiniz destek için tekrar teşekkür ederiz. İletişim e-postası: jingqi@csdn.net

Ödülle ilgili olarak sizinle iletişime geçmek için lütfen iletişim bilgilerinizi doğru doldurunuz:

Milyonlarca insan yapay zekayı öğreniyor - geliştiriciler ve yapay zeka ile ilgili bir anket

Üç büyük operatör, yeni ve eski kullanıcı paketlerinde farklı haklar sorununu çözecek; Luo Yonghao, Douyin ile işbirliği yapıyor; Git 2.26 yayınlandı | Geek Headlines
önceki
Bir SIM kart nedeniyle Bitcoin Cash'te 30 milyon dolar mı kaybettiniz?
Sonraki
Zuckerberg tarafından yok edilen defter, Facebook'un tüm başarılarını ve başarısızlıklarını gizliyor
Sishui İlçesi Halk Kongresi Parti Şubesi "Bir Marka Şovu Stili Oluşturmak, Yoksulluğu Kalp ve Sevgiyle Azaltmaya Yardımcı Olmak"
"Şaheser" yalnızlık içinde gelişir
Wuhan'daki Fransız gönüllülerle diyalog: Korumayı artırmak için Çin tıbbı içmek ve bir kase sıcak kuru erişte yemek yeterli
Jingzhou, Hubei'den 900'den fazla çalışan Dongguan'a geldi ve belediye parti komitesi sekreteri ve belediye başkanı onları yerinde aldı.
İlk Hubei göçmen işçileri, işe dönmek için Shenzhen'e geri döndüler, özel tren geldi! 169 çalışanın noktadan noktaya teslimat
Özel G4368 treni: Hubei'den Guangdong'a ilk yeniden işleme treni
Avustralya'da salgının tırmanması: Süpermarketlerde 14 gün boyunca fast food yedim ve 20.000 denizaşırı tıp öğrencisi savaşa gidebilir
Salgın durumunun 60 günlük gözlemi: Şangay ve Shandong sık sık bilgilendirilir ve Guangdong dışındaki ithal vakaların yörüngesi detaylandırılır.
Xiaoman bel aydınlattı! Savaş kahramanlarından eve hoş geldiniz
Guangzhou'daki birinci katın çatısı "Mutlu Çiftlik" haline geldi, ancak sivrisinekler ve gübre alt kat sakinlerini mutsuz ediyor
Ülkedeki ilk vaka! Tüm serebral anjiyografi ameliyatının tamamlanmasına yardımcı olmak için bağımsız olarak bir robot geliştirdim
To Top