2018'de NLP alanı sıcak olmaya devam ediyor ve üreticiler iniş senaryoları bulmayı umuyor

Yapay zekanın temel teknolojilerinden biri olarak Doğal Dil İşleme (NLP) İlk ticari iniş başladı. Son iki yılda, bilgisayarla görme ve konuşma tanıma teknolojileri büyük bir hızla ilerledi. Tek nokta teknolojisine dayalı olarak bir milyar ABD dolarından fazla değerlemeye sahip dört AI tek boynuzlu at şirketi doğdu. Bunlar, trilyonlarca doları kullanarak güvenlik, tıp, perakende ve diğer alanlarda yaygın olarak kullanılıyor. Market. Ancak, NLP teknolojisinin geliştirilmesi ve ticari olarak uygulanması, belki de sadece ihtiyaç duyulan senaryoları bulamadığından, önemli ölçüde daha yavaş olmuştur.

2018'de NLP teknolojisinin, akıllı ses etkileşimi ve IOT platformlarının kombinasyonu, çeviri makineleri, AI eğitimi, AI oluşturma ve diğer alanlar gibi birçok senaryoda yeni bir canlılık kazandırdığını gördük.

Akıllı ses etkileşimi + IoT

2017'de akıllı hoparlörler, akıllı ses etkileşimi ve IoT platformlarının daha büyük ölçekte kombinasyonuna yol açan bir çılgınlık dalgası başlattı.

2018'de büyük şirketler, Xiaomi IoT Geliştirici Platformu, Alibaba Bulut Bağlantısı, Baidu "Tiangong", JD Alpha-IoT, QQ IoT Platformu, Microsoft Azure IoT gibi IoT platformları oluşturuyor, bu şirketlerin de kendi Akıllı ses asistanı. Xiaomi, Ali, Baidu, Microsoft vb. Akıllı ses + IoT'yi IoT platformlarının ve konuşmaya dayalı yapay zekanın geliştirilmesinin anahtarı olarak açıkça gördüler.

2018'den bu yana, Microsoft'ta konuşmaya dayalı yapay zeka ve akıllı terminallerin stratejik konumu önemli ölçüde yükseldi. Microsoft, 21 Mayıs'ta Pekin'de 2018 Yapay Zeka Konferansı düzenledi.Microsoft'un Küresel Başkan Yardımcısı ve Yapay Zeka ve Microsoft Araştırma Bölümü Başkanı Shen Xiangyang, Microsoft'un yeni dünya görüşünü vurguladı: akıllı bulut ve akıllı uç.

Microsoft Azure, Microsoft tarafından özellikle yapay zeka için oluşturulmuş bir bulut platformudur.En iyi yapay zeka bulut platformu olmak için şu dört yönle birleştirilecektir: bilişsel hizmetler, konuşmalı yapay zeka, açık platformlar ve araçlar ve gerçek zamanlı yapay zeka temelleri. tesis. Bunların arasında Azure üzerinde çalışan bilişsel hizmetler, geliştiricilere API şeklinde sağlanacak olan konuşma, vizyon, dil ve makine çevirisi gibi 24 yapay zeka teknolojisi özelliğini içeriyor. Konuşmalı yapay zeka, Microsoft'un ses, dil ve arama yeteneklerinde ustadır ve çeşitli terminallerde doğrudan uygulanabilir.

Microsoft'un konuşma yapay zekası temel olarak Microsoft Cortana ve Microsoft Xiaoice'u içerir. Son yıllarda Microsoft Xiaoice, Microsoft'un konuşma yapay zekasının temsilcisi haline gelerek giderek üstünlük kazandı. 26 Temmuz'da Microsoft Xiaoice, resmi olarak altıncı nesle yükseltildi. "Tam çift yönlü ses etkileşimi duyusal" ve "topluluk modeli" diyalog yeteneğini büyük ölçüde geliştirdi ve ayrıca şiir yazma, şarkı sözleri, müzik ve şarkı söyleme, metin özetleri, haber yazma vb. Geliştirdi. Çeşitli dil işleme yetenekleri. Microsoft Xiaoice'un Microsoft'un mevcut NLP ve sesli etkileşiminde ustalaştığı ve teknolojide diğer rakiplerinin çok ilerisinde olduğu söylenebilir. Şu anda, Microsoft Xiaoice, teknik yeteneklerini tamamen açmış ve hafife alınmaması gereken pek çok açıdan ticari işbirliği arayışı içindedir.

Microsoft ile karşılaştırıldığında, konuşmaya dayalı yapay zeka, Baidu'nun yapay zeka stratejisinde daha yüksek bir konuma sahip. Baidu güçlü bir şekilde yapay zekayı geliştirdiğinden, Baidu'nun yapay zeka stratejisi kademeli olarak netleşti ve üç konuya odaklandı: bilgi akışı, konuşmalı yapay zeka sistemi DuerOS ve otonom sürüş Apollo.

Baidu, 2017'de ortaklara temel beceriler ve sektör çözümleri sağlamak için konuşmaya dayalı bir yapay zeka işletim sistemi olan DuerOS'u yarattı , Robotlar, cep telefonları, TV'ler, hoparlörler, arabalar vb. Birden fazla donanım cihazına erişebilir ve aynı zamanda geliştiricileri platformda daha fazla beceri geliştirmeye teşvik edebilirsiniz.

Baidu'nun 2018 ikinci çeyrek mali raporuna göre, Haziran ayında DuerOS sesli uyandırma 400 milyonu aştı. Temmuz 2018 sonu itibarıyla DuerOS ile donatılmış aktifleştirilmiş akıllı cihaz sayısı 100 milyonu aştı. Aynı zamanda DuerOS ortaklarının sayısı 200'ü aştı ve DuerOS ile donatılmış 110'dan fazla ana kontrol cihazı bulunuyor. DuerOS, TV'ler, cep telefonları, hoparlörler, çocuk cihazları, otomobiller vb. Hemen hemen tüm senaryoları kapsar. DuerOS, Huawei P20, P20 Pro, vivo X21, NEX, OPPO FindX vb. Gibi her alanda yerli kafa üreticileriyle işbirliği yapmıştır. .

Xiaomi'ye tekrar bakalım. Xiaomi Group'un Yapay Zeka ve Bulut Platformu Başkan Yardımcısı Cui Baoqiu bir keresinde şunları söyledi: 2016'dan başlayarak, AI, Xiaomi'nin önümüzdeki on yıl için temel stratejisi haline geldi ve AI'ya yapılan yatırım abartılamaz. Bununla birlikte, pratik bir bakış açısıyla, Xiaomi AI'nın şu anki iki ana odağı hala akıllı telefonlarında ve Xiao Ai'de.

Cui Baoqiu'nun görüşüne göre Xiao Ai, AI ve IoT'yi birleştiren bir ürün. AI + IoT konusunda Xiao Ai belirli sonuçlar elde etti. 15 Ağustos'ta Xiaomi, Temmuz ayı sonu itibariyle Xiao Ai öğrencilerinin aylık aktif cihazlarının 30 milyonu aştığını duyurdu. Bu yılın Temmuz ayında, Xiao Ai 1 milyardan fazla kez uyandı ve kümülatif uyanış 5 milyar katı aştı.

Xiao Ai artık 10 kategori, 30'dan fazla model ve toplam 85 milyon akıllı cihazı sesle kontrol edebiliyor , En çok kullanılan üç sahne şunlardır: müzik, isteğe bağlı sesli kitaplar; küçük konuşma; akıllı cihaz kontrolü (anahtar ışıkları, TV düğmesi, eklenti dahil).

Neredeyse hiçbir donanım temeli bulunmayan Ali, 2018'in başlarında IoT'ye tam giriş yaptığını da duyurdu. Akıllı ses etkileşimi, IoT oluşturması için kilit nokta. Alibaba Dharma Akademisi Makine Zekası Teknolojisi Enstitüsü Sesli Etkileşim Zekası Laboratuvarı baş bilim adamı Yan Zhijie'ye göre, ses, IoT ile etkileşim kurmanın en doğal yoludur.Sesli etkileşim zekası, yapay zeka ile halk arasındaki en son iletişimdir. Sesli etkileşim zekası IoT olacak ve İnternet içeriği ve hizmetler arasında bir köprü.

Yan Zhijie, Tmall Genie, Roewe Smart Connected Car, Haier Yapay Zeka TV vb. Gibi kamusal alanlara da akıllı ses getirdi. Önceden, ev içi ses etkileşimi esas olarak yakın alan etkileşimiydi ve sahne, iç mekanlarda sessizlikle sınırlıydı. Yan Zhijie ekibi, sesli etkileşim donanımının mikrofon dizisini kullandı ve konuşmacıyı tanımlamak ve dış mekan sesli diyalog sorununu çözmek için bir kamera ekledi. Şu anda, sesli sipariş makineleri ve Şangay sesli metro bilet satış makineleri piyasaya sürüldü. Ali'nin akıllı ses etkileşimi + IoT, diğer şirketlerden farklı olarak zengin iş senaryoları ile karakterizedir.

çevirmen

2018'de NLP alanında kayda değer bir eğilim şudur: piyasada çeşitli çevirmenler vardır. Önceden Google, Baidu ve Netease gibi çevrimiçi çevirilere daha aşinaydık, ancak bu yıl birçok donanım çevirisi ürünü gördük. Çevirmenlerin popülaritesinin birkaç nedeni vardır: Öncelikle derin öğrenme çeviri seviyesinde bir gelişme getirmiş, bu da konuşmalardaki çeviri sorununu daha iyi çözebilir.Geçmişte cep telefonu donanımının kısıtlılığı nedeniyle mobil cihazlarda derin öğrenme modellerini çalıştıramıyorduk. Makine dışarı çıkarken ihtiyaç duyuldu. Ek olarak, gerçek zamanlı konuşmadan metne ve metinden sese işlevlerinin olgunluğu da rol oynar.

Mart 2017'de iFLYTEK, Xiaoyi tercümanını piyasaya sürdü. Ekranı yok, Çince-İngilizce çeviriyi, çevrimdışı çeviriyi, Wifi ve SIM kart bağlantısını destekliyor ve fiyatı 2799 yuan'a kadar çıkıyor. , Ve sonra Eylül 2017'de, iFlytek ekranı olmayan ve çevrimdışı çeviriyi desteklemeyen "Çeviri" yi başlattı ve fiyat 1399 yuan'a düştü. Nisan 2018'de iFLYTEK, dokunmatik ekran, kamera, 20 dilde çevrimiçi karşılıklı çeviri desteği ve Çince ile İngilizce arasında çevrimdışı çeviri ile Xiaoyi Translator 2.0'ı piyasaya sürdü. Fiyatı 2.999 yuan.

Eylül 2017'de Fenata Technology, 31 dil arasında çeviriyi destekleyen, çevrimdışı çeviriyi desteklemeyen ve fiyatı 1.288 yuan olan yarı çeviri makinesini piyasaya sürdü; NetEase, Ekim 2017'de dokunmatik ekranlı ve destekli Youdao Translation Egg'i önerdi 27 Birden çok dilde çevrimiçi çeviri, çevrimdışı çeviri desteklenmiyor, fiyat 638 yuan; Aralık 2017'de Baidu, Tuge çeviri makinesini piyasaya sürdü, ekran yok, 4 dil arasında karşılıklı çeviriyi destekliyor, fiyat 2399 yuan; Mart 2018'de Sogou, seyahat çevirisi hazinesini piyasaya sürdü , Dokunmatik ekran ve kamera ile; 24 dilde çevrimiçi çeviriyi, Çince ile İngilizce arasında çevrimdışı çeviriyi, 1498 yuan fiyatıyla destekler; Mayıs 2018'de Xiaomi Eco-chain Enterprise Banana Travel, bir Konjac AI çevirmeni önerdi, ekran yok, 14 dil desteği, Çevrimdışı çeviri desteklenmez ve fiyat 249 yuan'dır.

Tercümanın işlevi ve formunun hala keşif aşamasında olduğu görülmektedir.Ekranı olsun, kameralı veya kamerasız, kaç dili desteklediği, çevrimdışı çevrilip çevrilip çevrilemeyeceği fiyatını etkileyebilir. Bunların arasında, çevrimdışı çevirinin donanım ekipmanı için yüksek gereksinimleri vardır ve maliyetler üzerinde büyük bir etkisi vardır.

Çevrimiçi çevirinin bulut makine çevirisini kullanabildiğini, çevrimdışı çevirinin makine öğrenimini kullanabileceğini biliyoruz. Önceden, çevrimiçi çeviri çevrimdışı çeviriden çok daha iyiydi. İyi bir çevrimdışı çeviri elde etmek istiyorsanız, doğal olarak donanım ve yazılım üzerinde daha çok çalışmanız gerekir.

Leifeng.com, 13 Haziran 2018'de Google'ın, yapay zeka çevirisinin çevrimdışı bir durumda kullanılmasını ve 59 dili desteklemesini mümkün kılan çevrimdışı bir sinir makinesi çeviri teknolojisi (Neural Machine Translation) yayınladığını öğrendi. Nöral Makine Çevirisi'nin (NMT), bir kelime dizisinin olasılığını tahmin etmek için büyük bir yapay sinir ağı kullanan, genellikle tüm cümleyi tek bir entegre modelde modelleyen bir makine çevirisi yöntemi olduğu anlaşılmaktadır. Bu teknolojinin çevirmen üzerinde belirli bir etkisi olabilir.

AI + eğitim

Yapay zeka + eğitimi, 2017'den 2018'e kadar geleneksel bir yapay zeka kolektif mücadele alanı haline geldi. AI + eğitiminin birçok senaryosu ve ürünü NLP teknolojisini kullanır, örneğin: Çince kelime segmentasyonu, akıllı puanlama, bilgi grafikleri vb.

Çekirdek olarak ses + anlamsal teknoloji, bulut bilişim ve büyük veri ile birleştirilen iFlytek, AI + eğitiminde birçok sonuç elde etti ve eğitim, iFLYTEK'in önemli gelir kaynaklarından biri haline geldi. 2018'in ilk yarısı için iFLYTEK'in mali raporuna göre, 2018'in ilk yarısında eğitim sektörünün geliri, yıllık% 16,35 artışla 658 milyon yuan oldu.

Akıllı eğitim alanında iFLYTEK, akıllı sınavlar, akıllı kampüsler, akıllı sınıflar, akıllı öğretim ve akıllı yönetimi içeren entegre bir akıllı eğitim ürün sistemi oluşturmuştur. 31 ilde, özerk bölgelerde, belediyelerde ve Singapur ve diğer denizaşırı pazarlarda mevcuttur. Yaygın olarak kullanılmaktadır ve 80 milyondan fazla öğretmen ve öğrenciye hizmet veren 13.000'den fazla okulla işbirliği kurmuştur.

Ana senaryolar kampüs yönetimini içerir: okul tabanlı bir kaynak kütüphanesi oluşturmak, yüksek kaliteli kaynaklar için gerçek zamanlı bir güncelleme oluşturmak ve okullarda yüksek kaliteli ve karakteristik öğretim kaynaklarının biriktirilmesini ve paylaşılmasını sağlamak için paylaşılan bir ekosistem oluşturmak; AIUI semantiği: entegre konuşma tanıma, anlamsal anlama ile ilgili yetenekler Arka uç bilgi kaynağının birleştirilmesi, hava durumu tahmini, risk uyarısı ve diğer bilgilerin zamanında yayınlanması için doğrudan arama ile ilgili içerik bilgilerinin sesle birleştirilmesi; anlamsal anlama: ses işleme, anlamsal anlama, kullanıcı niyetlerini anlama ve bulut bilgi tabanı etkileşimi yoluyla zamanında bilgi elde etme yoluyla İletim; özel buluttan daha özelleştirilmiş bilgiler daha doğru ve etkili yanıtlar sağlar; Çince yeterlilik testi: Sistem, yaşam testi dışındaki tüm test sorularını doğru bir şekilde otomatik olarak değerlendirebilen ulusal Mandarin yeterlilik testi müfredatına dayanır.

Akıllı puanlama açısından, 20 Kasım 2017'de New Oriental ve HKUST Xunfei tarafından ortaklaşa kurulan ortak girişim şirketi "Oriental Xunfei", IELTS ve TOEFL sınavına girenlerin sözlü ve yazılı olarak akıllı puanlamasını elde etmek için ilk AI tabanlı akıllı öğrenme ürünü RealSkill'i piyasaya sürdü. Ve düzeltmeler.

Leifeng.com ayrıca NLP teknolojisinin İngilizce'ye ek olarak Çince okuma alanında da ticarileştirildiğini fark etti. Ağustos 2018'de, çocuklar için Çince notlandırılmış bir okuma platformu olan "Koala Reading", 20 milyon ABD Doları tutarında B Serisi finansmanın tamamlandığını duyurdu. Finansman esas olarak Koala Reading için orijinal "Çin Dereceli Okuma Sistemi ER Çerçevesi" nin optimizasyonu ve yükseltilmesi, yüksek kaliteli okuma içeriğinin üretim bir araya getirilmesi ve pazar ölçeğinin genişletilmesi için kullanılacaktır.

Koala Okuma için Çince Dereceli Okuma Standardı (ER Çerçevesi), yurtdışından gelen "kelime ve cümlelerin" analizine dayanmaktadır. ER Çerçevesinin dereceli okuma standardına dayanarak, "kelimeler" ve "cümleler" temelinde "kelimeler" ve "cümleler" ekliyoruz. "Paragraf" ve "paragraf" ın üç boyutu, yani Çince'nin zorluğunu ifade etmek ve paragrafların, konuların vb. Analizini gerçekleştirmek için "kelimelerin, cümlelerin, paragrafların" beş boyutundan onlarca özellik çıkarır. Örneğin, "karakter" altında, ortaklığın, konfigürasyonun ve kombinasyonun üç özelliği vardır. "Cümle", sözdizimsel yapı, anlamsal mantık, retorik ifade ve iç içe geçme derinliği olmak üzere dört özelliğe sahiptir. Metinler için bir derecelendirme okuma sistemi olan ER Çerçevesi, Çince metinleri zorluklarına göre ölçüp derecelendirir ve kişiselleştirilmiş okuma içeriği ve dil öğrenme çözümleri sağlamak için öğrencilerin farklı okuma becerilerini eşleştirir.

AI oluşturma

Bir makine birçok rasyonel şey yapabilir, bu yüzden bazı yaratıcı şeyler yapabilir mi? İnsanoğlunun yaratıcılık için yüksek gereksinimleri olsa da, Van Gogh'un resimleri, Beethoven'ın senfonileri ve Li Bai Du Fu'nun şiirleri, insanlığın uzun tarihindeki bu ışıltılı kültürel miras, insan yaratıcılığının vücut bulmuş halidir. Yapay zeka konusunda uzun vadeli beklentileri olan Kai-Fu Lee bile yapay zekanın yaratıcı olabileceğine inanmıyor.

Ancak Microsoft, AI oluşturma girişimlerinde ısrar ediyor ve son iki yılda pek çok sonuç elde etti.

Diyalog becerilerine ek olarak, Microsoft Xiaoice ayrıca şiir yazma, şarkı sözü yazma, müzik oluşturma ve şarkı söyleme becerisine de sahiptir.Bunların tümü NLP teknolojisinin uzantılarıdır. Mayıs 2018'de Microsoft Xiaoice, "şarkı derin öğrenme modelinin dördüncü büyük yükseltmeyi tamamladığını ve şarkı söyleme seviyesinin insanlara yakın olduğunu ve şarkı sözleri, beste ve şarkı söylemede kapsamlı bir şekilde gelişmeye başladığını duyurdu. Yeni şarkı" Yeni olduğumu biliyorum "Zhihu ile işbirliği içinde Sözlerini yazan ve söyleyen Xiaoice'du.

Raporlara göre, dördüncü yinelemeli sürümün üç ana güncellemesi var: Birincisi, solunum seslerini otomatik olarak sentezleme yeteneği eklendi.Şarkı sesi ve nefes entegre edildi ve kulağa daha doğal ve bulaşıcı geliyor. İkinci olarak, dördüncü iterasyon derin öğrenme modellemesinde kontrol yönteminin artırılmasıdır ve kelimeler ile karakterler, notlar ve notlar arasındaki geçiş daha tutarlı ve pürüzsüzdür. Son olarak, daha da optimize edilmiş derin sinir ağı yapısı ve büyük ölçüde tamamlanan eğitim verileri sayesinde XiaoIce, farklı insan şarkıcılardan şarkı stillerini paralel olarak öğrenebilir, manuel parametre girişinden daha da uzaklaşabilir ve yorumu kendi başına tamamlayabilir.

XiaoIcein sözleri, XiaoIcein şiirleriyle aynı üretken modeldir LSTM tabanlı seq2seq modeli, ancak eğitim verileri şiirlerden şarkı sözlerine değiştirilir. XiaoIce, 10 milyondan fazla şarkı sözü külliyatını öğrenmek için derin sinir ağlarını kullanır ve bu temelde Eğitim yapın ve ardından birden fazla duyu aracılığıyla yaratıcı ilham uyandırın ve şarkı sözleri oluşturun.

Yapay zeka oluşturma, daha güçlü doğal dil oluşturma yetenekleri gerektirir. Şu anda çoğu konuşmaya dayalı yapay zeka buna sahip değildir. Birçok yanıt önceden girilir veya arama yoluyla çıkarılır. Microsoft'un doğal dil üretme yetenekleri de konuşmalı yapay zekaya entegre edilmiştir. "Tam çift yönlü ses etkileşimi duyusal" teknolojisi piyasaya sürüldüğünde, Microsoft Xiaoice zaten bir "doğal dil oluşturma modeline" sahipti. Tüm Microsoft Xiaoice yanıtları Kendi kendine oluşturulan yanıt, geleneksel modül tabanlı ve arama tabanlı yanıttan farklıdır.

Microsoft, AI oluşturmaya büyük önem veriyor ve AI'nın başkalarıyla birlikte oluşturulabileceğini umuyor. AI, yalnızca genel alanda değil, aynı zamanda yaratıcı alanda da insanların yerini almak için değil, insan asistanları olmak için içerik üretimi alanına giriyor. Aslında herkesin yaratma arzusu vardır ama bazılarının sanatsal yetenekleri vardır ve ressam, müzisyen ve yazar olurken, bazılarının böyle yetenekleri yoktur. AI, her sıradan insana yardımcı olabilir, böylece bazı kişiselleştirilmiş içerikler oluşturma yeteneğine sahip olurlar.

Şiir yazmak ve şarkı söylemek henüz büyük ölçekte ticarileştirilmemiş olsa da, Xiaobing'in hikaye ve metin özetleri anlatma yeteneği büyük ölçüde uygulanmıştır. Xiaoiceun çocuklarının sesli kitapları otomatik olarak teknik başarılar üretiyor ve 4 milyon saatten fazla dinleme almış. Xiaobingin kız kardeşinin hikaye anlatan sesli kitapları, yerli erken çocukluk eğitim robotlarının% 90'ından fazlasını ve çevrimiçi dinleme platformlarının% 80'ini kapsıyor.

Microsoft Xiaoice, robotik yazı teknolojisini finans alanına uyguluyor ve daha katı bir şekilde ihtiyaç duyulan bir sahne bulduğu söylenebilir. Wang Yongdong, geçtiğimiz 248 günde, XiaoIce'in bir takma ad kullanarak Wind Information ve Wall Street ile düşük anahtarlı bir şekilde işbirliği yaptığını, finans sektöründeki 26 tür duyurunun tamamı üzerinde zorlu testler ve testler yaptığını ve finansal metinler aracılığıyla özetler ürettiğini açıkladı. Kurumlar, finansal uygulamalar ve bireysel yatırımcılar özet hizmetleri sağlar. Şu anda, Xiaoice'un metin oluşturma teknolojisi, yerel finans kuruluşlarının yaklaşık% 90'ını, onaylanmış ve nitelikli yurtdışı yatırım kuruluşlarının% 75'ini ve yerli bireysel yatırımcıların yaklaşık% 40'ını kapsıyor.

Finansal bilgi hizmetleri alanında hız para demektir, yapay zekanın insanlara göre bu konuda bariz avantajları vardır. Wang Yongdong, Microsoft Xiaoice'un kurumsal duyurunun yayınlanmasıyla aynı anda yaklaşık 20 saniyede yüksek kaliteli özetler oluşturabileceğini duyurdu. Xiaoice, gelecekte finans sektöründeki ürün gamını genişletecek ve daha fazla finansal hizmet sağlayacak.

Microsoft Xiaoice'a ek olarak Leifeng.com, IBM'in tartışacağı robotlar hakkında da bilgi verdi. Tartışmacı. Haziran 2018'de IBM Research, AI sistem Projesini başlattı.San Francisco'daki IBM ofisinde yapay zeka, bir tartışmada en iyi tartışmacıları yendi. Rakipleri, İsrail Uluslararası Tartışma Derneği başkanı Dan Zafrir ve 2016 İsrail Ulusal Tartışma Şampiyonu idi. Noa Ovadia. IBM'e göre Project Debater, karmaşık konularda insanlarla tartışabilen ilk yapay zeka sistemidir. Project Debater, büyük miktarda metni işler, belirli bir konuda iyi yapılandırılmış bir konuşma oluşturur, açık bir amaç sağlar ve rakibini çürütür. Nihayetinde, Proje Tartışmacısı, zorlayıcı, kanıta dayalı argümanlar sunarak ve duygu, önyargı veya belirsizliğin etkisini sınırlandırarak insanların akıl yürütmesine yardımcı olacaktır. Şu anda, Proje Tartışmacısının nasıl ticarileştirileceği hala bilinmemektedir.

AI ses çipi sıcak

Akıllı hoparlörler ve akıllı evler gibi donanım ürünlerinin popülaritesi, akıllı ses etkileşimini IoT ile birleştirme eğilimini doğruladı. Bu yeni trend, çipler gibi temel donanımlara da yeni gereksinimler getiriyor. . Daha önce, akıllı hoparlörlerdeki yapay zeka muhakemesi ve hesaplamaların tümü bulutta yapılıyordu ve yanıt hızı nispeten yavaştı ve gecikme açıktı.

Yunzhisheng'in kurucusu ve CEO'su Huang Wei, AIoT pazarı bugün hızlanırken, ağ, bant genişliği, enerji tüketimi, gizlilik ve uç bilgi işlem açısından bulut çözümlerinin sınırlamaları, Nesnelerin İnterneti için yapay zeka çiplerini kaçınılmaz bir seçim haline getirdi. "

16 Mayıs'ta Yunzhisheng, Nesnelerin İnterneti için ilk AI serisi çipi UniOne'ı ve Pekin'de birinci nesil çip "Swift" i piyasaya sürdü; Qinqian, 24 Mayıs'ta Pekin'de ilk AI ses çipini piyasaya sürdü. Modül, çekirdek Mobvoi A1'e soruyor; 26 Haziran'da Rokid, AI sese özgü SoC çipi KAMINO18'i Hangzhou'da piyasaya sürdü; aynı zamanda Spitz CEO'su Gao Shixing, şirketin bu yılın ikinci yarısında piyasaya sürülmesi beklenen bir AI ses çipi geliştirdiğini doğruladı; 4 Temmuz'da, Shenzhen Micro-Nano Perceptual Computing Technology Co., Ltd. (Micro-Nano Perception) ve Hangzhou Zhongtian Microsystems Co., Ltd. (Zhongtian Microsystems), bu yılın ikinci yarısında akıllı ses çiplerini piyasaya süreceklerini açıkladılar. Hangzhou Zhongtian Microsystems kısa bir süre önce Tamamen Alibaba tarafından satın alındı.

Bu AI ses yongalarının, cihazlar arası AI algılama yetenekleri ve yerel muhakeme yetenekleri ile sesli etkileşim donanımı sağlama; derin öğrenme ağ mimarisi, bilgi işlem yeteneklerini geliştirme ve veri bant genişliği gereksinimlerini azaltma gibi benzer amaçları vardır.

Aslında, AI ses çipleri ve NLP, ses şirketlerinin dikey geliştirme ihtiyaçlarıdır. Son yıllarda, iFLYTEK, Yunzhisheng ve Si ses tanıma gibi şirketler hızla gelişti ve ses tanımanın gelişmesi de doğal dil işlemenin gelişmesine yol açtı. Ancak bu aşamada konuşma tanıma, konuşma sentezi, akıllı cihaz erişimi, akıllı cihaz uyandırma vb. Problemler temelde çözülmüş olup, iki veya üç yılda tamamen çözülebilir. "İşitme" problemi çözüldükten sonra bir sonraki adım doğal olarak "dinleme" dir. "Anlama" açısından, doğal dil işleme teknolojisinin alacağı uzun bir yol var.

Sibiz CEO'su Gao Shixing bir keresinde Zhishi'ye, işinin başında tüm araştırma ekibinin konuşma tanıma ve insan-makine diyaloğu yaptığını söylemişti.Ancak, 2007'de o sırada, mobil İnternet dalgası bir yana, henüz yükselmedi. AI uygulanırsa, teknolojinin "işe yaramaz" olmasına gerek yoktur. Ancak Nesnelerin İnterneti aşamasının gelişiyle, sesli etkileşim talebi patlamaya başladı. Gao Shixing, "Teknolojik yenilik açısından, SPICE'ın özü insan-makine diyaloğuna odaklanacak" dedi. SPICE'ın ses teknolojisi birçok terminalde uygulanmış ve etkisi iyi olmasına rağmen, insan-bilgisayar etkileşimi deneyiminin tamamı hala yeterli değil. Evet, ancak aynı zamanda kullanıcı deneyimini iyileştirmek için çok çalışıyoruz.

Devlerin altında girişimcilik fırsatları

NLP teknolojisi, CV teknolojisinden daha zordur. Şu anda neredeyse tüm büyük şirketler, NLP teknolojisi araştırma ve geliştirme yapacak enerjiye sahiptir. Bilgi işlem gücü, veriler ve yetenekler açısından, yeni başlayanlar bununla eşleşemez. Bununla birlikte, NLP birçok araştırma içeriği içerdiğinden: Çince otomatik kelime bölümleme, konuşma parçası etiketleme, sözdizimsel analiz, doğal dil üretimi, metin sınıflandırması, bilgi alma, diyalog sistemi, metin düzeltme, otomatik özetleme vb. Bu teknolojiler yavaş yavaş ticarileştiriliyor, ancak çeşitli alanlarda kullanılan veri ve teknolojiler çok farklı olduğu için birleşik bir teknoloji olmayacak ve her alanda girişimlere hala yer var.

Akıllı telefon ekranı

Triangle Monster, tipik bir NLP başlangıç şirketidir. Triangle Monster'ın üç kurucusundan biri DuMi Central Control'den sorumlu kişi Wang Zhuoran, diğeri ise Microsoft XiaoIce'in kurucularından Qi Chao'dur. 2016 yılında Triangle Beast'in kuruluşundan bu yana şirket, doğal dil işleme teknolojisine dayalı çeşitli alanlar için insan-bilgisayar etkileşimi çözümleri yaratmaya kendini adamıştır.

Triangle Beast, esas olarak dört teknik yeterliliğe adanmış 110 milyon yuan'lık B turunu tamamladı: anlamsal anlayış, açık alan sohbeti, çoklu diyalog turları, alanlar arası merkezi kontrol, iniş akıllı müşteri hizmetleri, akıllı telefon çözümleri ve akıllı donanım üç yön.

Akıllı telefon çözümü Trianglemon için benzersiz bir iniş sahnesi ... Raporlara göre, yeni çıkan OPPO R15 ve VIVO X21 ile bu yıl bazı yeni telefonların "akıllı ekran tanıma" işlevinin tamamı Trianglemon tarafından sağlanıyor. Bu işlev, sistem katmanından geçer ve WeChat, Weibo, çeşitli uygulamaları ve kısa mesajları kapsar.Cep telefonundaki herhangi bir metin paragrafı üzerinde anlamsal analiz yapar ve kullanıcıların bilgi ve hizmet ihtiyaçlarını tek adımda karşılamak için birkaç kart başlatır. Triangle Beast daha önce Luo Yonghao'nun Hammer telefonu için "Bigbang" işlevini de sunmuştu; bu, büyük metin parçalarını - ister Çince ister İngilizce olsun, ister resim veya metin biçiminde olsun - anlamsal olarak kesilebilir hale getirebilir. Kelimeler veya karakterler daha kolay seçilebilir ve düzenlenebilir.

Multimodal duygu tanıma

Takema Intelligence 2016 yılında kuruldu. Kurucu Jian Renxian, Microsoft Asya Mühendislik Akademisi'nden sorumlu en üst düzey kişilerden biriydi. Katıldığı ve kendisine bildirdiği projeler arasında Bing'in Asya'daki stratejik ve işbirliğine dayalı ortaklığı ve Microsoft'un sanal asistanı Xiaona yer alıyor. Ve Asya'daki ticari gerçekleşme işi.

Takema Intelligence'ın temel işi metin analizi, doğal anlamsal anlama ve duygusal hesaplamadır. Takema Intelligence'ın iki ana ürün grubu vardır; biri beyin benzeri bir diyalog robotudur; müşteri hizmetleri robotları, alışveriş rehber robotları, finansal robotlar, pazarlama robotları, kişisel asistanlar, marka IP robotları vb.; Diğeri ise duyguları içeren çok modlu bir duygu tanıma sistemidir. Tanıma analiz sistemi, yüz ifadesi tanıma sistemi, izlenim analiz sistemi, reklam efekt analiz sistemi, çağrı merkezi kalite kontrol sistemi, sınıf duygu analiz sistemi vb.

Diyalog robotlarının uygulama senaryoları C-tarafı ve B-tarafı olarak ikiye ayrılabilir.C-tarafı doğrudan müşterilere hizmet eder ve kullanıcı deneyimi için çok yüksek gereksinimleri vardır.Bu alan esas olarak devler tarafından işgal edilmektedir. B tarafına hizmet vermenin daha dikey olması, çoğu müşteri hizmetleri ve alışveriş rehberi robotları olması ve dikey alanlar için farklı çözümlerin sağlanması gerekiyor. Bu alanda ayrıca Xiaoi Robot, Cloud Asking Robot, Smarter, Assistant Laiye, vb. Birçok başlangıç şirketi görüyoruz. Bu alan artık mavi bir okyanus olarak görülmüyor NLP şirketlerinin daha fazla farklılaşma arayışına girmesi gerekiyor.

Bambooun akıllı çok-modlu duygu tanıma sistemi farklılaştırılmış rekabete ulaşır. Yalnızca metin duygularını ve ses duygularını algılamakla kalmaz, aynı zamanda görsel duyguları da ekleyerek üçünü çoklu-modal duygu tanıma yapmak için birleştirir. Takema Intelligence CTO'su Weng Jiaqi'ye göre, insan-bilgisayar etkileşimi üç seviyeye bölünmüş, en düşük seviye doğal dil işleme, ikinci seviye kasıtlı anlama ve üçüncü seviye bunun arkasındaki anlamı anlamak ... Sektör hala ilk iki aşamada sıkışmış durumda. Üçüncü aşamaya ulaşmak için duygusal hesaplama kaçınılmazdır. Şu anda, Takema Smart'ın çok modlu duygu tanıma özelliği, yeni perakende senaryolarında da yenilikçi bir şekilde uygulanıyor.

Kurumsal bilgi yayımı

Spitz, akıllı terminaller alanına odaklanan, akıllı arabalar, akıllı evler, akıllı oyuncaklar / robotlar, akıllı giyilebilir cihazlar, akıllı telefonlar vb. İçin doğal dilde etkileşimli ürün çözümleri oluşturan, Çin'de lider bir ses teknolojisi üreticisidir. Şu anda yüz milyonlarca akıllı terminale bağlanmıştır. SPIRIT, bu yılın Temmuz ayında kurumsal akıllı hizmetler için özelleştirilmiş bir platformun piyasaya sürüldüğünü duyurdu - Talking Genie ( sezgisel diyalog teknolojisi ve karmaşık yapı bilgi yönetimi teknolojisini kullanarak kurumsal bilginin yayılması için konumlandırıldı Kitlesel işletmeler için bilgi ve bilgiyi iletmenin daha sorunsuz bir yolunu sağlayın.

Chu Min, SPICE'ın şu anki ana savaş alanının, insanlara günlük yaşamlarında yardımcı olmak için insanların hayatlarındaki eğlence, seyahat ve toplantıların her yerinde bulunan akıllı cihazlar ve IoT olduğunu söyledi. Ancak bu aşamada, akıllı ses cihazlarının altında yatan erişim, uyanma ve diyalog gibi temel problemler temelde çözüldü ve önümüzdeki iki veya üç yıl içinde tamamen çözülebilir, bu nedenle akıllı ses cihazı üreticileri arasındaki boşluk daralacak. Spitz artık akıllı ses cihazlarının gelişimini düşünmek için zihniyetini değiştirdi. Ona göre şu anda ihtiyaç duyulan şey daha fazla şirketin hizmetlerini akıllı ses cihazlarına ulaştırması ... Gelecekte sadece genel amaçlı bir konuşmacı kalmayabilir. Farklı senaryolarda farklı sorunları çözmek için birçok özel senaryo olacaktır.

Yapay zeka ve NLP alanında, devlerin yıllarca teknoloji birikimi ve platform avantajları var.Microsoft ve Baidu konuşmaya dayalı yapay zeka platformları ve becerileri geliştiriyor. Bu durumda, girişimler platformlar veya temel teknolojiler oluşturmaya ve birleştirmeye gidecek Gerçekçi değil, birden çok NLP teknolojisinin, farklılaştırılmış senaryoların ve daha dikey alanların bir kombinasyonunu gerektiriyor.

özet

2018'de bilgisayarla görme izi sakinleşti, ancak NLP pisti çok canlı. NLP araştırmasının birçok içerik alanı vardır: Çince otomatik kelime bölümleme, konuşma parçası etiketleme, sözdizimsel analiz, doğal dil üretimi, metin sınıflandırması, bilgi alma, bilgi çıkarma, metin düzeltme, soru yanıtlama sistemleri, makine çevirisi, otomatik özetleme, metin uygulaması vb. Bir alan çok zordur ve hiçbir evrensel teknoloji tüm sorunları çözemez.Teknik zorluk bilgisayarla görmeninkinden çok daha büyüktür.

NLP'nin geleceğini hayal ederken düşüneceğiz: özgürce sohbet edebilen diyalog robotları, doğru gerçek zamanlı çeviri ve okuyup yazabilen yapay zeka. 2018 yılında bu vizyonlar adım adım gerçekleştiriliyor. Leifeng.com, 2018'de akıllı ses etkileşimi ve IOT platformu, çeviri makineleri, AI eğitimi, AI oluşturma ve diğer alanların birleşiminin NLP teknolojisi için popüler uygulama senaryoları olduğunu ve devlerin ve büyük şirketlerin bir araya geldiğini gözlemledi. Aynı zamanda daha derin bir yerleşim planına sahip olmak için birçok dev ve ses şirketi IoT / ses çipleri yapmaya başladı. Ayrıca, NLP start-up şirketleri, Trianglemon'un akıllı telefon ekran tanıma çözümü, Takema Smart'ın çok modlu duygu tanıma ve Spitz'in kurumsal zeka hizmeti gibi uygun dikey alanları da aktif olarak araştırıyor.

Bu segmentlerdeki yeni gelişmelere ek olarak, büyük şirketlerin rekabet ortamı da oldukça ilgi çekicidir. Görülüyor ki Microsoft, Google, Baidu ve diğer devlerin NLP'deki birikimini aşmak zor olsa da, birçok şirketin de geç gelen güçlerle devlere meydan okuması bekleniyor.Örneğin, eğitim, hükümet, ses teknolojisi ile tıbbi tedavi gibi çeşitli alanlarda çiçek açan Bilim ve Teknoloji Üniversitesi Xunfei; Sogou'yu doğal etkileşim ve bilgi hesaplamasından oluşturmak için temel olarak arama ve giriş yöntemlerine güvenmek; Baidu'nun bugünün manşetlerini yakalamak için bilgi akışı, akıllı öneri ve NLP teknolojisine güveniyor.

"Devil May Cry 5" ilk çizgi roman bölümü 0 çevrimiçi, V'nin başlangıç hikayesini anlatıyor
önceki
Yıl sonundan sonra geriye ne kalacak? Bir ömür sonra geriye ne kalacak?
Sonraki
HP'nin kapsamlı gelişimi ve 66 ikinci nesil ince ve hafif iş dizüstü bilgisayarı değerlendirmesi
"Çılgın Yaz: Merhaba Canavar" yakında yayınlanacak, cevabın ortaya çıkmasını bekliyor
Nasıl daha iyi bir yıl geçirdin? Çin ve Japonya'nın aile sloganı hakkında konuşalım
LG'nin yeni AI TV tarzını takdir etmek için ses ve video CES 2019'un tam yükseltmesi
İkinci el yaşam
Z9G, 8K görüntü kalitesinde yeni bir çağ açıyor, Sony CES, yeni amiral gemisi TV ürünlerinin yoğun bir şekilde piyasaya sürülmesini gösteriyor
İnsanın ikinci hayatı nasıl tedavi edilir? Girişimcilik
Otomobil pazarı kışın erken gelir, Dongfeng Yueda Kia neden pazara karşı büyüyebilir?
"Seyahat! "Kuyunun Altındaki Kurbağa", Çin Sevgililer Günü'nde size eşlik edecek "Kurbağa Prens" gösterimini başlatıyor.
Şangay Moda Haftası'nın açılışından önceki gece çok eğlenceliydi, ama ondan sonra?
Çılgın Yüzük A ve Hayatın B Yüzüğü Geniş Görüş
Yedi üst düzey rapor, size yapay zekanın gelişimi hakkında büyük bir bakış açısı sunuyor | AITech
To Top