Nuance neden aniden Çin'de patlak verdi? Sesli ejderha sürüşü ne anlama geliyor?

Geçmiş içeriği takip etmek ve görüntülemek için yukarıdaki [Araba Bulutu] 'na tıklayın.

"

Sesli patron yerel tedarikçilerle tanışmak için nasıl yükselir?

"

15 Mart'ta, bir ses ve dil çözümleri sağlayıcısı olan Nuance, Şanghay'da 4. "Nuance Çin Otomotiv Forumu" nu düzenleyerek, sesli asistanların akıllı telefonlarda - "arabalar" dan sonra bir sonraki önemli mobil terminalde uygulanmasını tartışmak için düzenledi. Durum ve beklentiler ve araç içi sesli asistan ürününü sergiledi: Dragon Drive.

Bu dönem boyunca, Grup Başkan Yardımcısı ve Büyük Çin Başkanı Bay Kuai Wenrui, Otomotiv İşleri Departmanı Kıdemli Başkan Yardımcısı Arnd Weil ve Araştırma Departmanı Başkan Yardımcısı Dr. Wu Jianxiong dahil Nuance yöneticileri, Che Yun da dahil olmak üzere birçok medyayla röportajları kabul etti. Onların gözünde, Nuance'ın otomotiv alanındaki temel rekabet gücü nerede?

Nuance yöneticileri ilgili arka plan tanıtımlarını yapıyorlar (soldan: Wu Jianxiong, Arnd Weil, Kuai Wenrui)

Kuai Wenrui: Yapay Zeka Nuance'ın Belkemiğidir

Yapay zeka teknolojisi söz konusu olduğunda, önce doğal dil işleme ve görüntü tanımayı düşünürüz. İlki konuşma tanıma, makine çevirisi ve otomatik soru yanıtlamayı içerir. Nuance'ın 1994'teki kuruluşunun başlangıcındaki işi konuşma tanıma ile ilgiliydi.

Akıllı telefon sesli asistanları söz konusu olduğunda, önce Appleın Sirisi ve Google'ın Google Asistanını düşünürüz. Daha az bilinen şey, Siri'nin aslında Nuance ile ilgili olduğu - her ikisi de Stanford Research Institute International'dan (SRI International) doğdu. Nuance, 1994 yılında SRI Konuşma Teknolojisi ve Araştırma Laboratuvarı'ndan (STAR Lab) ayrıldı ve ayrı bir şirket kurdu ve Nisan 2000'de Nasdaq'da listelendi; Siri, 2007'de SRI Ticarileştirme Kurulu tarafından arama yapmasına izin verildi. Jobs, Nisan 2010'da harici fonlar satın aldı. Bu, Apple için ölümünden önce verdiği son önemli karardı.

Dikkatli bir gözlemin ardından, Google'ın yeni teknoloji alanları açma tarzının her zaman bu alandaki dünyanın en iyi uzmanlarını Google'a davet etmek ve tüm sorumluluğu üstlenmelerine izin vermek olduğunu gördük. Örneğin, 2013'te Google, Genentech'in CEO'su Dr. Arthur Levinson'dan biyolojik şirketi Calico'dan sorumlu olmasını istedi. 2005 yılında, dünyaca ünlü bir makine çevirisi uzmanı olan Dr. Franz Och, Google'ın makine çevirisi sisteminin geliştirilmesinden sorumlu olması için Güney Kaliforniya Üniversitesi'nden davet edildi. Google, 2004 yılında bir konuşma tanıma sistemi geliştirdiğinde, Nuance'ın kurucusu Dr. Michael Cohen'i davet etti.

Şu anda Nuance, en fazla sayıda patente ve en büyük pazar payına sahip, dünyanın en büyük bağımsız konuşma tanıma şirketidir. Otomobil endüstrisi söz konusu olduğunda, her yıl 40 milyon otomobil (küresel otomobil üretim kapasitesinin yaklaşık% 50'si) ve 20 milyon navigasyon sistemi Nuance'ın teknolojisini kullanacak.

Çin pazarının mevcut performansıyla ilgili olarak Kuai Wenrui, "2016 yılında, Nuance Çin patlayıcı bir büyümeye girdi. Temel olarak aşağıdaki üç nedene dayanmaktadır:

Ar-Ge'ye, özellikle Yerel olarak Ar-Ge

Kaynaklara önemli yatırım, yani Çin ekibi tarafından Çin pazarı için Çinli müşteriler için özelleştirilmiş hizmetler

Marka müşterileri de dahil olmak üzere pazardaki ortaklarla derinlemesine işbirliği;

Şangay ve Pekin'deki Ar-Ge merkezlerine ek olarak, Ayrıca Chengdu'da yeni bir Ar-Ge merkezi kurdu Şu anda 60 mühendis var ve 2018'den önce 200 mühendis olacak.

Wu Jianxiong: Üç düzeyde makine asistanı

60 yılı aşkın süredir yapay zekanın gelişim tarihine baktığımızda, tüm yapay zeka alanında büyük bir atılım getirenin konuşma tanıma araştırmalarındaki teknolojik rota değişikliği olduğunu görebiliriz.

Wright kardeşlerin kuşların kanatlarını havalandırmak yerine aerodinamik çalışarak yükselme elde etmenin bir yolunu bulmalarına benzer şekilde, Cornell Üniversitesi profesörü Frederick Jelinek ve kendisi akademik iznindeydiler. Önde gelen IBM Watson Labs (TJ Watson Labs) de 1972'de bilgisayarları akıllı hale getirmenin yeni bir yolunu buldu. Bu matematiksel modellere ve istatistiksel yöntemlere dayanır .

IBM, istatistik tabanlı yöntemler kullanarak konuşma tanıma oranını o sırada% 70'den% 90'a çıkardı.Aynı zamanda, konuşma tanıma ölçeği birkaç yüz kelimeden 20.000 kelimeye yükseldi ve konuşma tanımanın laboratuvardan pratik uygulamalara taşınmasını mümkün kıldı. 1988'de IBM'den Peter Brown ve diğerleri istatistiksel tabanlı bir makine çevirisi yöntemi önerdiler. Eğitim için mevcut sürekli veri birikimi ile Google, 2005 yılında bu yöntemi o dönemde dünyanın en iyi makine çevirisi sistemini yapmak için kullandı.

Dr. Jianxiong Wu 1986'dan beri konuşma tanıma teknolojisini araştırmaktadır ve 1999'da Nuance'a katılmıştır. Şu anda yaklaşık 250 kişilik bir araştırma ekibine liderlik etmektedir. Makine asistanlarının başarabileceği işlevleri tanımlamak için çok canlı bir analoji kullandı. Ona göre, gerçekte insan asistanlara atıfta bulunarak, makine asistanları üç seviyeye ayrılabilir:

En temel seviye daktilo: Söylediklerinizi doğru bir şekilde kaydedebilir, böylece aynı kelimeleri birden fazla kişiye tekrarlamanıza gerek kalmaz ve asistan kelimelerle verilen görevleri karşılık gelen kişiye verir;

İkinci düzey büro memuru: Bir katip ve bir daktilo arasındaki fark, katibin belirli bir görevi tamamlamanıza yardımcı olabilmesidir. Örneğin, hafta sonu bir restoranda yemek yemek istiyorsanız, katip, restoranın konumu ve yol tarifi, park yeri konumu, yer olup olmadığı ve yerin rezerve edilip edilemeyeceği gibi bilgileri sorgulayarak görevi tamamlayacaktır;

En yüksek seviye sekreterdir: Sekreter ile katip arasındaki fark, sekreterin liderin anlamını anlayabilmesi, yani lider çok şey söylemese bile sekreterin anlayıp tamamlayabilmesidir.

Bu üç düzeyin mevcut uygulamasıyla ilgili olarak Wu Jianxiong, "Nuance'ın teknolojisi söz konusu olduğunda, daktilo düzeyindeki işlevler zaten çok iyi. Şu anda çözülen şey, makine asistanının otomatik olarak nasıl yapılacağıdır. Bir görevi tamamlayın. Zorluk, bazen insanların görevdeki tüm ayrıntıları söylememeleri ve birden fazla insan-makine diyalogu ve sorgulama yoluyla eksik bilgileri aşamalı olarak elde etmelerinin gerekmesidir. Makine asistanının insanların anlamını anlamasına gelince, kişisel alışkanlıklar hakkında daha fazla veri biriktirmek ve bunu makine öğrenimi yoluyla makine asistanı sistemine entegre etmek gerekiyor. "

Nuance'ın yapay zeka alanındaki geliştirme stratejisiyle ilgili olarak Dr. Wu, Temelde dört yönden: çekirdek teknolojilere sürekli yatırım, belirli alanlara (otomobiller gibi) odaklanma ve uçtan uca çözümleri otomobil üreticilerinin gerçek ihtiyaçlarına göre özelleştirme. Çözüm (OEM'e uçtan uca özelleştirilebilir sistem sunun) ve teknik araştırma için Çinli yetenekleri küresel yeteneklerle birleştirin. En önemli nokta, Nuance'ın bir teknoloji şirketi olarak çekirdek teknolojilerde lider bir konum sağlaması gerektiğidir. "Bunlar arasında, Dr. Wu'nun bahsettiği Nuance'ın çekirdek teknolojisi temel olarak aşağıdaki 4 yönü içerir:

Akıllı Etkileşim (Akıllı Etkileşim Teknolojisi) : Sinyal edinimi, konuşma tanıma, doğal dil anlama, doğal dil üretimi vb. Dahil;

Kişiselleştirme (kişiselleştirme teknolojisi) : İyi bir asistanın sahibinin kişisel alışkanlıklarını bilmesi gerekir Aynı sistem hem A hem de B için aynı anda uygun değildir çünkü her iki tarafın alışkanlıkları farklıdır;

Bağlamlaştırma (bağlamı anlamak için teknoloji) : Farklı bağlamlarda, aynı kelime dağarcığının anlamı farklıdır ve makine asistanının doğru kararlar verebilmesi gerekir;

Bilgi (bilgiyi uygulama teknolojisi) : Farklı senaryolar için, makine asistanlarının görevleri tamamlamak ve bunları uygulamakla ilgili bilgileri ve sağduyuyu nasıl elde edeceklerini bilmeleri gerekir.

Pazarlama stratejisi: yalnızca kurumsal düzeyde pazar

Nuance'ın mevcut ürünleri ve hizmetleri, tüketici pazarını (B2C) değil, yalnızca kurumsal pazarı (B2B) hedeflemektedir. Ortakları arasında BMW, SAIC, Samsung, Huawei vb. Yer almaktadır. Bu seçimi açıklayan Kuai Wenrui, "Nuanceın pazarlama stratejisi ortağın hikayesi Nuanceın hikayesidir ve ortağın başarısı Nuanceın başarısıdır "dedi.

Gelecekte her şirket yapay zeka, büyük veri ve insan-bilgisayar etkileşimindeki teknolojik gelişmelere dikkat edecek, aksi takdirde rekabet avantajını kaybedecektir. Nuance'ın rolü, tüketici pazarı için bağımsız olarak ürün tasarlamak yerine, kendi teknolojisini işletme tarafından geliştirilen yeni ürün ve hizmetlere entegre etmektir.

Otomotiv sektörü söz konusu olduğunda, Çinin ilk İnternet otomobili Roewe RX5, Nuanceın teknolojisini kullanıyor. Arabanın konuşmalı ses arabirimi, sesli ejderha sürüşünün yerel yerleştirilmesini ve bulut hibrit konuşma tanıma ve derin sinir ağlarına dayalı doğal dili entegre ediyor. Teknolojinin anlaşılması, temel işlevlerin 4G ağı olmadan uygulanabilmesini ve kullanıcı kullanım verilerinin sistemin gelecekteki yinelemeleri için bulut aracılığıyla toplanabilmesini sağlayabilir.

Ses ejderhası sistemiyle uygun bir sesli etkileşim başlatmak için uyandırma kelimesini kullanın. Sistemi sesli olarak etkinleştirmek için Roewe RX5'e "Merhaba, Zebra!" Deyin (not: Roewe RX5 tarafından kullanılan yerleşik işletim sistemi Zebra Networks Teknolojisi tarafından geliştirilmiştir) ve sürücü, sistem konuşurken herhangi bir zamanda bilgileri kesip düzeltebilir. Ek olarak, sürücü, telefon görüşmeleri yapmak, medya akışı veya yerel müzik aramak ve hava durumu bilgilerini uygun ve hızlı bir şekilde sorgulamak için sesi kullanabilir ve yalnızca ilgi çekici noktaları aramak için ilgi noktası (POI) kategorisini veya hedef adını söylemesi yeterlidir. Sonuç olarak, sağlam ejderha sürüş sistemi, sürüşle ilgili görevleri tamamlarken sürücünün sürüş konsantrasyonunu en üst düzeye çıkarabilir.

Che Yun özeti: İnsan-bilgisayar etkileşiminin sesi veya geleceği

İnsani gelişme tarihine dönüp baktığımızda, geçtiğimiz birkaç milyon yıllık evrim sürecinde, insanlar arasındaki iletişimin yolu her zaman ses olmuştur ve bilgiyi aktarmanın yolu ağızdan ağza sözdür. Sadece daha sonra daha fazla bilginin kaydedilmesi gerektiğinden, onu yalnızca sesle tamamen örtmek zordu, bu yüzden yazı ve yazma icat edildi. Ancak sesli diyaloğun hala insanlar arasındaki en doğal iletişim yolu olduğu inkar edilemez.

Önceki makalede bahsedildiği gibi, Jobs'un ölümünden önce Apple için verdiği son karar Siri'yi edinmekti, çünkü bunun insan-bilgisayar etkileşimi yolunda önemli bir dönüşüm olacağına inanıyordu. Siri'nin satın alınmasından dört yıl sonra, Google benzer bir sanal asistan ürünü olan Google Now'ı piyasaya sürdü. Google Bilgi ekibinin başkanı Amit Singhal'a göre "Aşina olduğumuz aramaya son verecek." Çünkü insanların günlük yaptığı arama kutusunda statik arama yapmak yerine diyalog yoluyla yeni bilgiler elde etmek ve değiş tokuş etmektir.

Bu nedenle, Iron Man Tony Stark'ın akıllı uşağı Jarvis gibi her tür makine ve ekipman son derece akıllı olduğunda, insanların onlarla iletişim kurmasının en doğal yolu, özellikle dokunmatik ekranların veya klavyelerin kurulamadığı sahnelerde yine de sesli olmalıdır. .

Bununla birlikte, insan kullanımının doğasında olan alışkanlıkları uyandırmak hala zaman almaktadır.

Che Yun önerilir

Çıplak çıkıp kaçtıktan sonra en güzel aşkla tanıştı ve kendi cennetini yarattı!
önceki
ZUK: Hoşçakal diyemem!
Sonraki
Mercedes-Benz, şimdiye kadar gördüğünüz en lüks pikap olan X-Serisi'nin dışında olacak.
Çiftin tasarladığı güveç, yabancıların Çin tasarımına bakışını değiştirdi!
BMWnin 21 yatırım vakasını inceledikten sonra, otomobil şirketlerinin yeni şirketlere yatırım yapma konusundaki gerçek motivasyonlarını keşfettik
Qashqai hafif lüks versiyon, Dongfeng dökümhane Fan Bingbing onayladı, 200.000 hala Toyota RAV4 satın alıyor
21 yaşında tüm dünya tarafından aranıyordu ama sonunda bir kadına yenildi!
Dört eski çift birlikte yaşamaya başladığında, hayatları yeni bir dünyanın kapılarını açtı
Sonata'yı sunaktan çekerek Kia K4'e dayanak kalmaz, makyaj Kore satışlarını tutabilir mi?
19 yaşındaki yabancı, Brezilya sokaklarını patlatmak için basit bir sihir numarası kullanarak sayısız insanı izlemeye çekti
Bir araba soyağacı yapmayın, görünüşü kaybetmez Audinin iç mekanı Volkswageni bitirir, Alman sistemi değil Alman sistemi
Geleceğe odaklanan Vantage, ulusal duyguları futbol pazarlamasıyla yorumluyor
60'larda doğan ve "Okuyucu" da popüler olan göksel çift, çiçekler vadisinde oturuyor ve diğerlerini kıskanıyor
Binzhi'den daha erkeksi olan zorlu küçük SUV, yüzbinler için sadece Angkola'nın bir işareti
To Top