Giriş yöntemlerinin AI kartları oynadığı çağda, iFLYTEK'in ilk hamle avantajı hala mı?

Ekim 2016'daki Hammer Technology yeni ürün lansman konferansında olduğu gibi, iFLYTEKin giriş yöntemi Luo Yonghaonun canlı gösterimi sayesinde popüler hale geldi. Lao Luo, olay yerinde çok hızlı konuşma hızıyla gelişigüzel bir şeyler söyledi. Metni yazın ve tanıma sonucu fena değil.

O sırada, Xunfei giriş yönteminin konuşma tanıma oranı% 97 idi. Dün öğleden sonra yapılan Xunfei girdi yöntemi medya toplantısında, ürün direktörü Zhai Jibo bu sayının % 98 .

Luo Yonghao, Xunfei giriş yöntemini tanıttı

Ayrıca, pazar markasından sorumlu kişi olan Li Qiangjun'a göre, iFLYTEK giriş yöntemi Kullanıcı sayısı 600 milyonu aşıyor ve aylık ses girişi kapsamı% 50'ye ulaşıyor , Ses penetrasyon oranı her yıl artmaya devam ediyor.

Doğruluk oranının ulaşıp ulaşamayacağına gelince yüzde yüz , Xunfei giriş yönteminin ürün direktörü Zhai Jibo'nun cevabı : Teknik olarak henüz mümkün değil .

Her şeyden önce, sesteş sözcükler zor bir sorundur ve isabet oranı ancak mümkün olduğu kadar artırılabilir.Bu nedenle Sogou, Baidu ve Xunfei, giriş yöntemlerine ses değiştirme işlevleri ekler. İkinci olarak, kullanıcının çok sözlü ifadesi makine tarafından tam olarak tanınamaz ve insan-bilgisayar etkileşim alışkanlıklarının ayarlanması gerekir. Ayrıca gürültülü bir ortamda konuşma tanıma, çevresel seslerden etkilenecektir.

Xunfei Giriş Yöntemi Ürün Direktörü: Zhai Jibo

Teknoloji: DFCNN konuşma tanıma çerçevesi

Xunfei girdi yöntemi, insan beyni sinirbilimi ile biyonik insan hafızasına başlar ve yapay olarak etiketlenmiş verilere yardımcı olmak için büyük miktarda denetimsiz veriyi gerçekleştirir. Görüntü alanında CNN uygulamasından esinlenen iFLYTEK, spektrogramı girdi olarak doğrudan almak için çok sayıda evrişimli katman kullanan bir Derin Tam Evrişimli Sinir Ağı (DFCNN) konuşma tanıma çerçevesi geliştirmiştir. Ses özellikleri, bilgi kaybını azaltmak ve sesin uzun vadeli alaka düzeyini ifade etmek için girdi olarak kullanılır.

Aynı zamanda, görüntü tanımada en iyi ağ yapılandırmasına atıfta bulunarak, her bir evrişimli katman, daha derin bir CNN modelini eğitmek için 3 × 3 küçük bir evrişim çekirdeği kullanır.Çıktı birimi, doğrudan algılayacak nihai tanıma sonucudur (heceler veya Çince karakterler gibi) Bir dakikada 400 kelimeyi tanıyabilen ve çok dilli gerçek zamanlı ses çevirisini, uzun ses girdisini, fısıltı girdisini, çevrimdışı ses girdisini ve diğer işlevleri destekleyen girdi yöntemine zeka ve bilişsel zeka gibi AI teknolojisi uygulanır.

Özellikler: lehçe ses çözümleri önerin

Aksan ve lehçe tanımanın zor problemi için, Xunfei giriş yöntemi, bunu çözmek için bir lehçe ses girişi çözümü önerdi. İFlytek'in AI teknolojisi ve dili üzerine derinlemesine araştırmalarının birikimine dayanarak, Çok dilli çok dilli modelleme kullanarak, çok dilli veri paylaşımı yoluyla eğitim; Global Telefon küresel ses birimi koleksiyonu ile desteklenir, çeşitli lehçelerin ses birimlerini akustiğin benzerliğinden birleştirir Tanım, diyalekt "dil haritası" modeli, hedeflenen bir şekilde lehçe dilini tanıma yeteneğini geliştirmek için daha da rafine edilmiştir.

Şu anda, Xunfei giriş yöntemi, aralarında Kanton, Siçuan lehçesi ve Kuzeydoğu lehçesinin tanıma oranının% 90'ı aştığı 22 lehçeyi desteklemektedir. 2017'de, "Diyalekt Koruma Planı" nı başlattık ve büyük diyalekt verilerini biriktirmek için bir "Çin Lehçesi Veritabanı" kurduk, böylece bu veriler derin öğrenme için materyal sağlayabilir. Bu ayın sonunda, Xunfei giriş yöntemi Suzhou lehçesi tanıma özelliğini ekleyecek ve lehçe tanıma dilleri 23 dile genişletilecek.

İFLYTEKin modernize edilmiş ve optimize edilmiş Hybrid-DFCNN yeni konuşma tanıma çerçevesine dayalı olarak, iFLYTEKin giriş yöntemi Haziran sonunda yeni Hyper-CNN konuşma motorunu başlatacak ve genel konuşma tanımanın doğruluğu% 15 artacaktır. Ek olarak, Çince-İngilizce karışımı optimize edilebilir Ses girişi, Kanton dili ve diğer anahtar lehçeleri ve noktalama kararının doğruluğu, ses girişi deneyimini geliştirir.

Klavyeyi yeniden tanımlayın, yüz yüze çeviri ve OCR kamera ekleyin

Baidu giriş yönteminin basın toplantısında AIG başkanı Wang Haifeng, ses girişi şu anda desteklense bile yeterli olmadığını düşünerek giriş yöntemi hakkındaki görüşlerini dile getirdi.Gelecekteki giriş yöntemi AI tarafından desteklenen "tam duyusal girdi" olmalıdır. . Xunfeinin kanaatine göre, giriş yöntemi artık Wubi, Jiugongge, Yirmi Altı tuş ve el yazısı sabit klavye formlarıyla sınırlı olmayacak, böylece "Mod klavye", "Ses klavyesi", "VG ses etkileşim paneli" ve diğer insan-bilgisayar etkileşimi başlatılacak modu.

Mod klavyesi, iFLYTEKin akıllı ses teknolojisine dayanan "hayır" klavyesidir, ses girişini, sesli şifre kontrolünü destekler ve klavyesiz girişi gerçekleştirir. Ses klavyesi yoğun ses kullanıcıları için özel olarak tasarlanmıştır ve kullanışlı bir ses giriş formu sunar.Başka becerileri öğrenmeden tek bir ağızla kolayca yazabilir, değiştirebilir ve hatta otomatik olarak noktalama işareti ekleyebilirsiniz. Akıllı ses uygulamasına dayalı olarak, VG (VoiceGame) sesli etkileşimli panel oluşturuldu ve etkileşimli düzeyde deney yapmak için AI kullanıldı. Giriş süreci "oyun oynamaya" eşdeğerdir ve konuşma hızı ve ses seviyesi doğrudan yaratıcı etkileşimi yansıtır.

Xunfei giriş yöntemi, konuşma tanıma, konuşma sentezi ve makine çevirisi gibi yeni teknolojileri entegre eder, yüz yüze çeviri ekler, Çince ile İngilizce, Japonca, Korece ve Rusça arasında gerçek zamanlı çeviriyi destekler ve sesli çeviri uygulamalarına yüz yüze etkileşimi getirir. Örneğin, görüşmedeki her iki taraf kendi ana dilini konuştuğunda, diğer taraf çeviri sonucunu aynı anda görecektir.

Kullanıcının ihtiyaçlarına bağlı olarak, kitaplar, yol işaretleri, kartvizitler vb. Gibi basılı metinleri ve el yazısı yazı tiplerini tanıyabilen OCR kamera girişi eklendi. El yazısı tanımanın doğruluğu% 90 kadar yüksektir.

Deneyim: Konuşma tanıma için hangisi daha iyidir?

Toplantıdan sonra Leifeng.com sırasıyla Sogou giriş yöntemini ve Xunfei giriş yöntemini denedi.

Xunfei Voice tek seferde kesintisiz 249 kelime girebilir ve Sogou Voice 221 kelime girebilir. Genel olarak, iFLYTEKin tanınma oranı daha yüksektir.

Şiirin tanınmasında, iki girdi yönteminin performansı iyidir. Okuyucular ayrıca, bu AI destekli giriş yöntemlerinin doğru bir şekilde tanımlanıp tanımlanamayacağını görmek için memleketlerinin lehçesini deneyebilirler.

Konuşma tanıma teknolojisinin gelişmesiyle birlikte, gelecekte artık ellerimizle yazmaya ihtiyaç duymayabiliriz. İFLYTEKin gelecekte yapay zeka konuşma girdisi vizyonuna gelince, Zhai Jibonun yanıtı şu oldu: "Mevcut ürünler zaman kazandıran, verimli ve yeterince basit. Bu boyutlar aşırı değil.Bir gün teknoloji olgunlaşırsa, fikirler veya beyin dalgaları yoluyla metin giriyoruz, WeChat'i açıyoruz, ekrana iki saniye bakıyoruz ve metin gönderilecek. Bunun daha aşırı olacağını düşünüyorum. Giriş."

AI'nın genelleştirilmesinden sonra, iFLYTEK'in yeni farklılıklar bulması gerekiyor

Sutu Araştırma Enstitüsü'nün 2017 anket verilerine göre girdi yöntemi pazarında Sogou% 63,6 pazar payı ile pazarda lider konumdadır, onu Baidu ve Xunfei izlemektedir. Wang Haifeng, Baidu giriş yönteminin Baidu AI teknolojisinin uygulanması için köprü kurucu olduğunu ve yeni AI teknolojisinin ilk olarak giriş yöntemine uygulanacağını söyledi. Sogou CEO'su Wang Xiaochuan, AI ile güçlendirilmiş girdi yönteminin Sogou'nun 2018 AI stratejilerinden biri olarak listelendiğini ve girdi yönteminin yalnızca yazmayı değil, aynı zamanda bilgi edinme ve trafik dağıtımını da taşıyabileceğini belirtti. Giriş yöntemlerinin AI kartları oynadığı çağda, iFLYTEK'in avantajları nelerdir?

Bu bağlamda Di Jibo, Leifeng.com ile yaptığı röportajda iFLYTEK'in her zaman ses girişine odaklandığını ve kullanıcı deneyimi ve ses girişinin gelecekteki gelişimi hakkında daha derin bir anlayışa sahip olduğunu söyledi. Ayrıca, ses teknolojisindeki sürekli yenilik her zaman yeni sorunları arayacak ve bunları teknoloji ve ürün tasarımıyla çözecektir. "Her zaman bir adım daha ileri gideceğiz ve keşfetmeye devam edeceğiz."

Bununla birlikte, Leifeng.com'a göre, mevcut kullanıcı girişi alışkanlıkları esas olarak pinyin girdisine dayanmaktadır. Sutu Araştırma Enstitüsü'nden alınan verilere göre, kullanıcıların% 60'ından fazlası hala pinyin girdisini seçiyor; bunların arasında Jiugongge pinyin girdisi, kullanıcının girdi alışkanlıklarına en yakın olanı ve tek elle kontrol edilebilen girdidir.

Teknolojinin gelişmesiyle birlikte, konuşmayı metne dönüştürmenin doğruluk oranı gittikçe artıyor ve konuşma girişini seçen kullanıcı sayısı artıyor. Ses girişi için, Xunfei Giriş Yöntemi 22 lehçeyi destekler, Baidu Giriş Yöntemi sesli çeviri sağlar ve 28 yüksek frekanslı alt dilde eşzamanlı çeviriyi destekler.

Şu anda girdi yöntemi pazarı çok güçlü bir durum oluşturmuştur Sogou girdi yöntemi uzun süredir pazardaki bir numaralı konumunu korumuştur ve sürekli gelişmektedir. Baidu giriş yöntemi, yapay zekanın gücünü yakalıyor ve iFLYTEK gibi giriş yöntemleri de sürekli olarak farklılaştırılıyor ve kişiselleştirilmiş özelliklerini güçlendirmek için çalışıyor. Tanıma oranı açısından, baş üreticiler% 97'nin üzerinde yüksek düzeyde bir konuşma tanıma doğruluğu elde ederken, Baidu ve Sogou'nun her ikisi de derin öğrenme algoritmaları için yakıt sağlamak üzere benzersiz bir şekilde donatılmış büyük arama veritabanlarına sahiptir, ancak ses girişi kullanıcılarının alışkanlıkları hala büyümektedir. Zamanla, AI ses tanımaya odaklanan iFLYTEK'in diğer farklılaştırma stratejilerini keşfetmeye devam etmesi gerekebilir.

Ford Escape neden bu kadar sıcak? Bu güçlü şasi sayesinde
önceki
Ocean King, Betta'dan kaçtı, kurtuluş görevlileri azarlandı, Mini yanlışlıkla netizenleri övmeye çekti
Sonraki
3699 yuan! Nokia 8 National Bank Edition'ın fiyatı açığa çıktı, bu yüzden satın alabilir misiniz?
visvim 2017 ilkbahar ve yaz sezonu için yeni tek ürün tasarımı ekledi! Zengin detaylar hala satın almaya değer
Feng Timo listedeki en "sevimli", Chen Yifa en "erkek", o en "gevrek" mi?
Bu 2 klasik müzik yazılımını kullanmış olmalısınız, ancak şimdi iyi karışmıyorlar!
Satın alma vergisi imtiyazının süresi dolmak üzere, bu 120.000 sedan modelini hemen düşünün
Yeni detaylar ortaya çıktı! adidas "Pride" serisi resmi olarak satışa sunuldu
"Boom 7" yeniden doğuş başlangıcı: Samsung, Galaxy Note 7 resmi çevirisini başlattı
LOL, UZI uzun bir aradan sonra RNG'ye gitti ve kişi sayısının yarısına katkıda bulundu! Netizen: UZI eski değil
Donanımı kıramıyor musunuz? Luo Yonghao ve Andy Rubin sistemi değiştirmek için fikirlerini ifade ettiler!
Yeni Atez için eski bir araba sahibinin söyleyecek bir şeyi var
Yeni YEEZY BOOST 350 V2 yakında satışa çıkacak, ancak Kylie Jenner bir şeyler yapmak için burada
Sanayi ve Bilgi Teknolojileri Bakanlığı'nda iki yeni LeTV modeli ortaya çıktı: tıpkı insan yüzlerine benzeyen çift arka kamera
To Top