Kuşkusuz, insan-bilgisayar etkileşim sistemlerinin değişmesiyle tetiklenen yeni bir endüstriyel dönüşüm turunda ses, cihaz etkileşiminin en etkili ve doğal yolu haline geldi. AI + IoT'ye dayalı akıllı IoT cihazları dalgası hızlanıyor.
Bir yıldan fazla süren hızlı gelişimin ardından, yerli sesli istihbarat pazarı yavaş yavaş ivme aşamasına girdi. Ses platformunun güçlendirme hareketi güçlü olsa da, yapay zekayı mevcut IoT ürünleriyle organik olarak entegre etmek ve ürün düzeyinde kullanıcı deneyiminin olgunluğunu elde etmek için hala küçük zorluklar yoktur.
Bir yandan, birçok ürün ekibi ve geleneksel ekipman üreticisi için teknik yetenekler yetersizdir ve ikincil geliştirme genellikle sorunsuz değildir, bu da ürün teslimatında sınırsız gecikmelere neden olur; diğer yandan platform tarafında, açıklıkla karşı karşıya Uzun kuyruklu müşterilere gelince, tek tek iyi bir işi yapacak enerjiye sahip olmak zordur Her şeyi güçlendirmek, platform partileri ve önde gelen marka satıcıları için kaçınılmaz olarak bir gösteri alanı haline gelecektir.
12 Eylül'de Shenzhen'de düzenlenen bir endüstri değişim toplantısında, Yunzhisheng'in kurucu ortağı Dr. Kang Heng, AI + IoT uygulamasının 5 ana zorluğunu analiz etti ve özetledi:
1. AIoT terminalleri, ürün formlarından işlevlere ve kullanım senaryolarına kadar geniş bir tür yelpazesine sahiptir, hepsi bariz parçalanma özellikleri gösterir ve genel çözümlerin tüm kategoriye uyarlanması zordur.
2. AIoT terminal ekipmanı tedarikçileri dağınık durumda.Çipler ve donanım platformlarına ek olarak, AI algoritmaları, bilgi işlem hizmetleri ve hatta uygulamalar daha fazla tedarikçi desteğine ihtiyaç duyuyor ve bu da şüphesiz terminal üreticilerinin zamanını ve finansal maliyetlerini artırıyor.
3. Kontrol edilemeyen ürün deneyimi. "Kaydedilmiş" ürünler, kolaylıkla kontrol edilemeyen kullanıcı deneyimine neden olabilir.
4. Ürün deneyiminin tekrar tekrar ayarlanması, TTM'yi (ürün başlatma döngüsü) garanti etmeyi imkansız kılar.
5. Çözüm, farklı ürünler arasında hızlı bir şekilde kopyalanamaz ve bu da yüksek maliyetlere neden olur.
Yunzhisheng'in kurucu ortağı Dr. Kang Heng
Akıllı hoparlörler ve akıllı evler yolunda, özelleştirilebilen, deneyimlenebilen ve hızlı bir şekilde gönderilebilen sesli AI çözümleri hala kıt kaynaklardır.
Yunzhisheng, endüstrinin sorunları ile yüzleşen ilk AIoT çipi Swift SoC'ye dayanan açık kaynaklı bir çözüm başlattı ve akıllı hoparlörlerin ve akıllı ev ürünlerinin hızlı ve akıllı hale getirilmesini ortaklaşa teşvik etmek için açık ve kazan-kazan tutumuna sahip ekipman satıcılarını, çözüm sağlayıcılarını ve geliştiricileri davet etti.
Neden açık kaynaklı çözümleri zorluyorsunuz? Kaynak kodu ne ölçüde açılacak? Konuşma motorunun orijinal SDK'sı yeterli mi? Açık kaynak çözümü hangi sektör kullanıcıları için geçerli? Fiyat ve rekabet gücü nasıl? Bu sorulara yanıt olarak, Shenzhen Bay yakın zamanda Yun Zhisheng'in başka bir kurucu ortağı olan Li Xiaohan ile röportaj yaptı ve bu "on soru" dan cevaplar alabilirsiniz.
Burada, bu açık kaynaklı çözümün, zeka yolunda ekipman satıcıları, çözüm satıcıları ve geliştiricilerin karşılaştığı sorunları nasıl çözebileceğini açıklamaya odaklanacağız.
Swift SoC mimarisi
Çipten başlayarak, Bao Qingfeng Swift AIoT yonga mimarisinin özelliklerini tanıttı:
Heterojen SoC: Genel amaçlı CPU (ARM), AI hızlandırıcı (DeepNet) ve dijital sinyal işlemcisi (DSP) içerir
Voice AI senaryoları için Audio IO sağlar ve 6 analog / dijital mikrofon erişimini destekler
Bağımsız fikri mülkiyet haklarına sahip NPU (Neural Network Processor) DeepNet
Bağımsız fikri mülkiyet haklarına sahip yüksek performanslı dijital sinyal işlemcisi uDSP
Üçüncü taraf uygulama geliştirmeyi kolaylaştırmak için ARM tabanlı genel amaçlı CPU kullanın
Bol çevresel arayüzler sağlayın: USB, SPI, I2S, SDIO, UART, GPIO, vb.
Birleştirilmiş uygulama senaryoları için genel amaçlı CPU ile karşılaştırıldığında Swift, DSP görev hızlandırma, miniNLP görev hızlandırma, TTS görev hızlandırma, bellek bant genişliği kullanım verimliliği ve NN görev iyileştirme gibi temel göstergelerde çok sayıda iyileştirmeye sahiptir. Swift, IoT AI için giriş seviyesi bir çözüm olarak da tanımlanıyor.
Yunzhisheng'in tam yığın sesli etkileşim teknolojisi
Donanım tasarımı açısından, Swift ve ilgili donanım referans tasarımı aracılığıyla, gürültü azaltma modülü ve harici ADC kaldırılarak toplam maliyet ve Ar-Ge seçim döngüsü azaltılır.
Sistem düzeyinde, Swift'in açık kaynak çözümü, 64M'den daha az bellek ayak izine sahip bir sistem oluşturmak için gömülü Linux'a dayanıyor. Anahtar bileşenler (DDR ve Flash ve WIFI) uyumluluğu sağlamak için en az 2 tedarikçiden sürücü desteği sağlar. Wi-Fi ve BT'nin farklı oynatma protokolleri (A2dp) ve ağ oluşturma yöntemleri (softAP, smartconfig) desteği ve çeşitli harici cihazlar için uyumlu desteği vardır.
Üçüncü taraf bir ses platformu olarak, Swift'in açık kaynak çözümünün bulut hizmeti, özelleştirme ve ölçeklenebilirlik açısından olağanüstüdür. 40 adede kadar alanın anlamsal anlaşılmasını destekler, müşteri tanımlı hesap sistemlerini ve mesaj merkezlerini destekler ve SSS'nin bulut tabanlı hızlı özelleştirilmesini destekler , Üçüncü taraf beceri erişimini ve üçüncü taraf içeriğinin entegrasyonunu destekleyin.
Aynı zamanda Swift'in açık kaynak çözümü, akustik yapı referans tasarımları sağlar, ürünler için yapısal tasarım önerileri sunar ve akustik yapıyı birlikte ayarlamaları için ses sinyali mühendisleri ve FAE ekipleri gönderir.
Yunzhisheng'in açık kaynak işbirliği modeli
Genel olarak, müşteriler, çözüm sağlayıcılar ve geliştiriciler için Yunzhisheng, müşterilere eksiksiz bir sesli yapay zeka uygulama referans çözümü, bulut yetenekleri ve özelleştirilmiş araçlar dahil olmak üzere tam yığın sesli etkileşim çözümü sunar. Aynı zamanda, esneklik açısından Yunzhisheng, müşterilerin çapraz biçimli IoT donanım ürünlerinde ihtiyaçlarını farklılaştırmalarına yardımcı olmak için çeşitli açık kaynak işbirliği modelleri sunar.
Bir AI bulut hizmeti sağlayıcısı, AI yazılım çözümü sağlayıcısı ve AI çip üreticisi olarak Yunzhisheng, IoT ekipman satıcılarının hızlı ve verimli bir şekilde akıllı ürün yükseltmeleri gerçekleştirmesine yardımcı olmak için kullanımı kolay API'leri, SDK'ları ve diğer geliştirme bileşenlerini kullanmayı umuyor.