Yerel akıllı hoparlörler neden Amazon Echo ve Google Home'u yenmek için zor?

Lei Feng Net Not: Bu makalenin yazarı, Shengzhi Technology'nin kurucusu Ph.D. Chen Xiaoliang'dır. Leifeng.com'dan özel makale, lütfen yeniden basım için yetki ile iletişime geçin.

Akıllı hoparlörlerin ekolojik zincir tarafından parlatılması gerekir. Kungfu deneyimi belirler ve hiçbir ayrıntı göz ardı edilemez. Çoğu zaman büyük veriyi ve derin öğrenmeyi çok övüyoruz, ancak bu birçok araştırmacıyı tembelleştiriyor. Bu dünya asla verilerle anlaşılmaz. Fiziksel dünyanın keşfi ve insan felsefesinin düşüncesi Sosyal ilerlemeyi teşvik etme gücü.

Google Home'un piyasaya sürülmesiyle birlikte akıllı hoparlörlerin yaratıcısı Amazon Echo bir kez daha ilgi odağı oldu ve bu ürün yeni çağda akıllı donanımın temsilcisi oldu. Elbette Amazon Echo beklentileri karşılıyor. Satış hacmi on milyonlara çıktığı gibi Ar-Ge gücü de 1.000'i aştı. Birkaç gün önce 400 kişilik işe alımlara başladı.

Genel olarak konuşursak, başarılı yabancı modeller veya ürünler çoğaltılabilir ve hatta bir yıl içinde Çin'de hızla yakalanabilir. fakat Amazon Echo bir istisnadır 2014 yılında piyasaya sürüldüğünden bu yana, Google'ı Home gibi rakip bir ürünü piyasaya sürmek yaklaşık iki yıl boyunca yurtdışında aldı. Henüz piyasaya sürüldüğü için, belirli satış durumunu beklememiz ve görmemiz gerekiyor. Ama ev içi durum nedir? Çin'de birkaç ürünü taklit etmek iki yıldan fazla sürdü, ancak hiçbiri genel olarak halk tarafından kabul edilen Amazon Echo'yu kopyalamadı.

Bu aynı zamanda birçok yerli üretici için kafa karıştırıcı bir sorundur.Neden çok emek harcıyorlar ama ürettikleri ürünler kullanıcılar tarafından tanınmıyor? Benzer yerli ürünlerin kasvetli satışları, birçok yerli İnternet devini Amazon Echo gibi akıllı hoparlör ürünlerinin araştırma ve geliştirmesine yatırım yapmaya karar verememesine neden oldu. Sonunda bu neden?

| Akıllı hoparlörlerin ekolojik zincir tarafından parlatılması gerekir. Kungfu deneyimi belirler ve hiçbir ayrıntı göz ardı edilemez

Akıllı ses asistanlarının ev girişi olan akıllı hoparlörler, hoparlör tanımının kapsamının çok ötesindedir.Bu donanım mı? yazılım? Veya platform? Tanımlamak zordur, akıllı konuşmacılar eksiksiz bir ekolojik ses etkileşimi zinciri içerir. Bu ürün stratejik bir ürün olarak araştırma ve geliştirmeye alınmazsa, ürünün kaçınılmaz olarak tatmin edici olmayacağı tahmin edilmektedir. Pek çok yerli üretici yatırımın Amazon Echo'ya kıyasla çok büyük olduğunu düşünse de bu biraz önemsiz. Amazon sadece araştırma ve geliştirmeye binlerce insanı yatırmakla kalmaz, aynı zamanda Super Bowl'a Echo reklamları da yapabilir. Bu, cep telefonları arasındaki rekabete çok benziyor Bazı yerli cep telefonu markaları da iyi olduklarını düşünüyorlar, ancak kullanıcılar onları aldıklarında doğal olarak kalplerinde bir ölçüm ayrımı yapacaklar. Aslında, şirketler arasındaki rekabet% 20 yatırımla elde edilen% 80 ile ilgili değil,% 80 yatırımla elde edilen% 20 ile ilgilidir. Çoğu zaman, şirketin rekabetinin başarısını veya başarısızlığını belirleyen genellikle bu% 20'dir. Bununla birlikte, özellikle gelişmekte olan pazarlar için ürünler olmak üzere Çin'de bu% 80'i yatırmaya istekli az sayıda insan var.Eğer rafine bir kullanıcı deneyimi elde edemezseniz ve bunun için yeterince çaba sarf edemezseniz, kullanıcı onayı almamak mantıklıdır.

Aslında, Amazon Echo'nun doğuşu sorunsuz bir seyir değildi.

Amazon 126, Amazon Echo'nun araştırma ve geliştirmesinden sorumludur. Bu şirket, 2004 yılında kurulmuştur ve esas olarak Amazon donanım ürünlerinin araştırma ve geliştirilmesinden sorumludur. Amazon 126 aynı anda dört ürün geliştirdi, Echo, Kindle, Fire Phone ve AR'den sonra D Sınıfı bir Ar-Ge görevidir. , Ar-Ge üyeleri bile çoğunlukla AR proje grubundandır. 2010 yılının sonunda başlatıldığında kimse bu konuşmacı hakkında iyimser olmayacaktı. Amazon Echo orijinal adı değil, Amazon Flash, 2014 yılında sevkiyatın hemen öncesinde bile. Echo da şanslı. Fire Phone'un başarısızlığı nedeniyle, AR projesi durduruldu ve bu da Echo'ya doğrudan fayda sağladı. Kısa bir dahili ayarlamadan sonra, araştırma ve geliştirme yetenekleri büyük ölçüde geliştirildi.Ancak, yine de, hala birçok iç anlaşmazlık var, bu da Echo'nun yeni başlatılmasına neden oluyor. Bunun yerine halka satmaya korkuyor Satın almak için bir davetiye alın Pazarı test etmenin yolu.

Amazon Echo uzun yıllardır geliştirilse de teknoloji arayışı da aşırı bir durum ama bu 2014 yılında piyasaya sürüldüğünde Echo'nun utancını geri getirmedi. O dönemdeki kullanıcı deneyimi sadece bir demo modeldi, algoritmadan içeriğe kadar birçok sorun vardı. . Elbette, kullanıcı ölçeğinin sürekli genişlemesi ve araştırma ve geliştirme yeteneklerinin sürekli artmasıyla birlikte, Echo da önemli iyileştirmeler yaptı ve açık stratejisi sayesinde içerik birleştirme de hızla gelişti.Bu aynı zamanda Echo'nun defalarca 100 $ 'dan fazla ürün satışı şampiyonluğunu kazanmasına yardımcı oldu. Temellerini attı.

Amazon Echo'nun temel özelliği hala bir konuşmacıdır.Echo'nun ses kalitesi tatmin edici olmasa da, HiFi hoparlörlerin azaldığı ve Bluetooth hoparlörlerin hakim olduğu günümüzde, ses kalitesi çoğu tüketici için artık birinci unsur değildir. Basit kullanım ve güzel görünüm, kullanıcıların kablosuz hoparlör satın almasının ana motivasyonudur. Echo'nun tasarımı oldukça tatmin edici olmasına rağmen, Echo, akustik ve zekanın bir kombinasyonudur.Zeka, Echo'nun yalnızca genişletilmiş bir niteliğidir ve kasıtlı olarak kaldırılan ekran, Amazon'un ses etkileşimindeki güvenini ve ısrarını gösterir. Çin'de bu tür bir stratejik farkındalık genellikle eksiktir. Echo'nun işlevsel farklılıklarına çok fazla odaklanmak, Echo'nun başarısını taklit etmek için gerçekten zor Dahası, yerli ürün tasarımı ve planlaması aslında Echo kadar rafine değil.

Burada bahsedilen zarifliğin gerçekten yaşanması gerekiyor.

Örneğin, Çin'de ses uyanmasının her zaman Alexa'yı geçtiği ilan edilir.Ancak, gösterge gerçekten kullanılırsa, yerli ürünlerin yanlış alarm oranı yüksektir ve bir şekilde yanlışlıkla uyanırlar. Bu oldukça can sıkıcı, aniden bir konuşmacı Gereksiz yere sorduğunuz bir soruya cevap vermek için konuşursak, bu tür şeylerin ara sıra olması dayanılmazdır. Süreç tasarımına gelince, herkesin bir estetik standardı var Echo ve Home'un neden rahat göründüğünü yargılamak zor, ama en azından çöp kutusunun ses kutusundan daha iyi görünüyorlar.

Ekolojik bir zincir ürününü dikkatlice cilalamak için, çeşitli detayları göz önünde bulundurmanın yanı sıra, kendi avantajlı kaynaklarını da yoğunlaştırması gerekir. Örneğin, sesli etkileşim, Yabancı devler güçlerini güçlendirmek için ilgili şirketleri satın almaya devam ederken, yerli şirketler her şeyi halletmek için her zaman kendi küçük ekiplerini oluşturmayı severler. , Bu kadar dağınık enerjiyle yabancı devleri nasıl geçebiliriz? Dahası, sesli etkileşim, derin öğrenmeyle çözülebilecek bir şey değildir, akustik ve zeka hakkında derin bir anlayış ve başarılı olmak için uzun vadeli birikim gerektirir.

| Sesli etkileşimin varlığı ve dolaysızlığı anahtar faktörlerdir, ancak yine de yeterince ateşlenmemektedir.

Sesli etkileşim şüphesiz klavye, fare ve dokunmatik ekrandan sonra ana etkileşim yöntemidir, ancak her zaman milyonlarca haneye girmeye biraz daha yakındır.

Bunda pek çok faktör var: Örneğin, üreticiler her zaman sesli etkileşimin hiç akıllıca olmadığını düşünüyor ve bu doğru. Dünyada sesli etkileşimi aptalca yapabilecek hiçbir şirket yok.Ses zekası seviyesi, anahtar kelimelerin içerik tanıma ve bağlam analizinde kalmaya devam ediyor. Sözde gramer ve dil anlayışı akademik çevreleri henüz net fikirlere sahip değil. Bu, uzun vadeli araştırma atılımları gerektirir.Sadece mevcut sıcak makine öğrenimi ve büyük verilerle sınırlı değildir, aynı zamanda fiziksel dünyanın kavramlarını ve modellerini göz önünde bulundurmak ve en azından bebek öğrenme dil sürecini anlamak gerekir. Bu açıdan bakıldığında, mevcut yapay zeka, akıllı ses etkileşimini gerçekleştirmekten hala çok uzak.

Çoğu zaman büyük veriyi ve derin öğrenmeyi çok övüyoruz, ancak bu birçok araştırmacıyı tembelleştiriyor. Bu dünya asla verilerle anlaşılmaz. Fiziksel dünyanın keşfi ve insan felsefesinin düşüncesi Sosyal ilerlemeyi teşvik etme gücü.

Yukarıdakiler sadece bir ortak nokta olabilir.Amazon Echo aslında aynı ikilemle karşı karşıyadır.Echo'nun konuşma sentezini yeterince iyi olmadığı için eleştiren birçok insan bile vardır, çünkü insanlar her zaman sözlerinin benzer tepkiler almasını umarlar. Amazon'un bu soruna dikkat etmediği söylenemez.Aslında Amazon, konuşma sentezinin doğallığını değil, sesli cevapların cevap verme hızını başka bir yönü güçlendirdi. Konuşma sentezinin insanlar kadar doğal olması gerçekten zordur, ancak bu hedeften çok da uzak değildir. Google'ın geçen ay WaveNet yayınlaması, yeni bir fikir olan konuşma sentezi alanında bir şoka neden oldu. Bundan önce, konuşma sentezi uzun bir süredir önemli bir ilerleme kaydetmedi, parametrelendirme ve eklemeden başka bir şey değildi. "Google'ın konuşma sentezi WaveNet ve Microsoft'un konuşma tanıma" dönüm noktası "ndaki bu birkaç yöntemin yazarı? Karşılaştırmalı bir analiz yapıldı, ancak aslında bu, bu aşamada kullanıcıların endişelerinin odak noktası değil.

Gerçekler, Amazon Echonun bahis seçiminin doğru olduğunu kanıtladı. Kullanıcılar, insan-makine diyaloğunun canlılığı konusunda daha fazla endişe duyuyor. Göstergelerin analizinden, önemli parametrelerden biri Makinenin tepki hızı Yankı önce 5 saniye, sonra 1,5 saniye ve sonra 1 saniye içindeydi. Bunun yerel tepe göstergesi değil, ortalama yanıt süresi olduğuna dikkat edin.

Yerinde insan-bilgisayar diyalogu duygusu oldukça ilginçtir ve bazen insan dili diyaloğunun gelişiminden bir an önce görülebilen daldırma olarak da anılır. Dil iletişiminin insan etkileşimi için en önemli yol olduğunu ve insanların bilgi alışverişinde bulunmanın ve bilgi öğrenmenin en önemli yolu olduğunu biliyoruz, ancak dilin güncelliği ve zayıf kayıt işlevi nedeniyle kelimeler yavaş yavaş onunla şekilleniyor. Dilin güncelliği nedeniyle, dil iletişimi genellikle anında yüz yüze yapılır. . Elbette, insanların artık telefonları var, ancak telefonlara sahip olduktan sonra bile, dil iletişimi anlık olarak devam ediyor. Başka bir deyişle, Telefon aslında insan dili iletişiminin mesafesinin genişlemesidir, ancak dil iletişiminin doğrudan doğasını değiştirmemiştir, bu nedenle telekomünikasyon ve İnternetin gelişimi, özünde hala bu temettüye sahiptir. .

Tabii ki, telekomünikasyon ve İnternet teknolojisinin insan dili iletişim seviyesine ulaşmak hala zor ve çoğu zaman bu yakınlığı yok ediyor. Teknik olarak, genellikle tek yönlü veya çift yönlü mod olarak adlandırılır Tek yönlü olarak, muhatap dili "karşılıklı olarak dışlayıcıdır" ve ses çakışması veya kesintisi olmayacaktır. Açıkçası, Siri ve Echo'ya dayanan insan-makine ses etkileşimi bu Tek yönlü mod . Tek yönlü mod, yüz yüze iletişimde zevki ve mevcudiyet duygusunu sağlayamaz ve "diyalog" deneyiminin bir parçasından yoksundur. Dubleks modu aslında bunu değiştirmeyi umuyor, ancak şu anda insanlarla hala çok boşluk var, bunlar üstesinden gelmek için teknolojiye ihtiyaç duyan zorluklardır.

Sesli etkileşimin varlığı şu anda insan seviyesinde olmadığından, doğal olarak önce makinenin cevaplama süresini kısaltmayı ve bu göstergenin ortalama süre aldığını ve kararlı ve güvenilir olması gerektiğini tekrar hatırlatmayı umuyorum. Bu çok önemli, sadece yarım günde bir cümle açan bir makineyle konuşacak mısınız? Muhtemelen hayır, bu sizi kıracak, diğer kişi bir insan olsa bile, aynı zamanda saygınlık da içerebilir. Açıkçası, Şu aşamada yapay zeka, insan zekasını taklit etmeye çalışamaz. Çözülmemiş çok fazla fiziksel ve felsefi sorun var. "Tekillik teorisi" hakkında gerekçesiz tartışmayın. Makinelerin insanlara yönelik tehdidi hala uzun bir süreçtir Bunları düşünmeden önce, üründeki her bir temel sorunun nasıl çözüleceğini düşünmek daha iyidir.

| Doğu ve Batı arasındaki kültürel farklılıklar aynı zamanda yerli sesli akıllı etkileşimli teknolojinin gelişimini de kısıtlıyor

Yurtiçinde ve yurtdışında akıllı konuşmacıların anlaşılmasında daha fazla farklılıklar olabilir, ancak Doğulular akıllı konuşmacıların özünü, sesli akıllı asistanları kullanmaya çalıştıklarında kültürel bir engel de var, bu Doğu ile Batı arasındaki kültürel farklılıkların bir sonucu olabilir. . Bu noktayı anlamadan önce konuşma ve dil arasında ayrım yapalım Konuşma, dilin sinyal taşıyıcısıdır Konuşma, insan telaffuz organları tarafından yayılır ve belirli dil anlamlarını taşır, dil ise insan bilgeliğini taşır. Meslekten olmayanların terimleriyle, sesler doğası gereği doğar ve bebeklerin bebekleri de sesler olarak kabul edilir ve ağlama seslerinin bile belli bir anlamı vardır ve dilin öğrenilmesi ve gelişmesi gerekir. İnsan-bilgisayar ses etkileşimi aslında dilin etkileşimidir.Ses tanıma% 100 olsa bile, dili anlamak için özel bir anlamı yoktur, dilin her zaman bireysel, bağlamsal ve duygusal olduğundan bahsetmiyorum bile.

Dil, sosyal kültürün bir ürünüdür, kültür olmadan konuşulacak bir dil yoktur. Dil, sosyal kültürün bir tasviridir, sadece sosyal kültürün biçimini yansıtmaz, aynı zamanda dil yapısı da insanların değerlerini yansıtır. Açıkçası, farklı ülkelerin dil alışkanlıkları çok farklıdır ve bundan oluşan kültürel çağrışımlar ve dil alışkanlıkları, çeşitli etnik grupların farklı yaşam ortamları nedeniyle doğal olarak farklıdır. şüphesiz, Doğu ve Batı arasındaki büyük kültürel farklılıklar nedeniyle, dil ifadelerinde de büyük farklılıklar vardır. Ve bu fark, Echo gibi sesli zeki asistanların popülerleşme hızını da belirler.

Doğu kültürü her zaman örtüktür ve Batı'daki doğrudan ifadeden farklı olarak, anlamı her zaman dolambaçlı bir şekilde ifade etmeyi severiz. "Evet" iken "evet" demeyin, "hayır" deyin. "Hayır" iken "Hayır" demeyin, her zaman "Evet" deyin, bu da aşık Doğulu erkeklerin zaman zaman yıkılmasına neden olur. Aslında, doğu felsefesinin olaylarla başa çıkma felsefesindeki en önemli nokta " Dudaklarına bir cümle bırak "Bu, zeki asistanlar için acı verici bir sestir. Doğulular, Echo gibi akıllı konuşmacılarla karşılaştıklarında, kapsamlı deneysel gözlemlerimize göre, ihracattan önce gerçekten dikkatli düşünmeyi gerektirir.

Bu, herhangi bir teknolojinin kapsamının ötesine geçti. Batılılara kıyasla, Doğulular, sesli akıllı ürünleri kullanırken daha büyük psikolojik engellerle karşı karşıya . Makinelerin yeterince akıllı olmadığını düşünen Batılıların aksine Doğulular bu tür ürünlerle karşılaştıklarında daha çekingen ve utanıyorlar. Buna ek olarak, mevcut mevcudiyet duygusu ve ses etkileşiminin dolaysızlığı gerçekten yeterince iyi değil ve Doğulular'ın psikolojik engellerini ağırlaştırıyor. Bu engel, Doğuluların Echo gibi sesli istihbarat ürünlerini arka arkaya ondan fazla farklı ifade söylemesini zorlaştırıyor.

Aslında, Doğu ve Batı arasındaki iki boyutlu kültürel farklılıklar, Doğu ve Batı'daki sesli zeki asistanların farklı durumlarını da yansıtıyor. . Transformers gibi Batı animasyonu aslında tipik bir insan-bilgisayar ses etkileşimidir ve Iron Man, Star Wars vb. Gibi insanlar ve robotlar arasında doğal ses etkileşimleri vardır. Buna karşılık, Saint Seiya ve Final Fantasy gibi Doğu'nun iki boyutlu kültürü, insanlar arasındaki etkileşimi ve ifadeyi vurgular. Bu açıdan Batı ile karşılaştırıldığında Doğu, insan-bilgisayar diyalogu ve yapay zeka konusunda genel eğitimde Batı'dan çok daha kötü Doğal olarak Doğu'daki sesli zeki asistanların tanınması Batı kadar iyi değil.

Yerli akıllı konuşmacılar veya sesli zeki asistanlar hala piyasa eğitiminin erken aşamasındadır ve ileride hala dikenli bir yol var.Çukurlar olduğunu bilseniz bile birçok öncü düşebilirsiniz, ancak adımlar atılmalıdır. Beklentiler kaçınılmazdır. Harika. Yolculuk süreci, çok sayıda teknisyen ve pazarlamacı yetiştirmek ve çok sayıda sıkı kullanıcı biriktirmek için büyük fedakarlıklar gerektirebilir. Bu stratejik yerleşim, yurtdışında şimdiden bir adım attı. Çin'de köşelerde sollama hayalini kurmayın. Çok fazla köşe var, diğerleri aptal değil, sadece sağlam adımlar atın.

Aslında, yurtiçi İnternet gelişimi de bu yoldan geçmiştir BAT, çeşitli alanlarda ilk öncü değil, öncü olarak gelişmeye ve büyümeye devam ediyor. Bu yolculuğun ne kadar süreceğini kestirmek kolay değil, sonuçta milli futbol maçının sonucunun bir tahmini değil ama internet ve mobil internet süreçlerinden daha hızlı olacağına inanıyorum.

Bakış Açıları | Bir şirketteki iyi patronlar aynı özelliklere sahiptir
önceki
"GOT7" "Paylaş" 190416 Kısa bir aradan sonra tekrar yola çıktık. JUS2, Vitrin için Osaka, Japonya'yı gezecek
Sonraki
"Earth Forever" ın parlaklığı, Çinliler üzerinde büyük bir etkiye sahip olduğu bir zamanda adım adım ilerlemesine dayanmaktadır.
Model oyun kontrolü: Direnemiyorum, Zhagu ile renklendirin
Hideo Kojima: Oyun mücadele nedeniyle gelişmeyecek
Vaka | Microsoft'un 30 yıllık geliştirme geçmişi rakipler listesinde gizli. En yüksek piyasa değerine nasıl dönebilir?
Buna karşılık, Nisan ayındaki film pazarı daha da heyecan verici
Mod Oynatma Kontrolü: Doctor Strange'e Gundam Değişikliği
35 yıllık 3D baskı teknolojisi: model olmaktan üretimin geleceğineTitanium Science
Endüstri | Güzellik şirketlerinden güzellik teknolojisi şirketlerine yeni bir yol ortaya çıktı
Model oyun kontrolü: MB Zhengmei yakışıklı fotoğrafçılık işleri
"The Crew 2", Harley'nin arabasına katılıyor, asi eğlenmek için yolda lastikleri yakıyor
Öne Çıkanlar | Ürün olarak saklayın
IQiyi "zehir çalıştırıyor" ama Wu Yifan bu sefer yardımcı olmuyor.
To Top