Baidu Giriş Yöntemi 8.0 çevrimiçidir ve Wang Haifeng bunu "Baidu AI'nın köprübaşı" olarak adlandırır

Baidu of All in AI, bugün (17 Ocak) Baidu AI giriş yöntemini, yani Baidu giriş yönteminin 8.0 sürümünü yayınladı. Beklendiği gibi, yapay zeka hala en önemli özelliktir ve teknolojik bir atılım, iki yeni özellik ve rakip ürünlerin% 20'sini aşan göreceli bir doğruluk oranı getirdi.

Bu sürüm için Baidu, tanınmış sunucu ve "Çin'in İyi Dili" Hua Shao'yu ev sahibi olarak özel olarak davet etti. Hua Shao başkanlığında, Baidu Başkan Yardımcısı ve AIG Başkanı Wang Haifeng, Baidu Ses Teknolojisi Direktörü Gao Liang ve Baidu'nun giriş yönteminden sorumlu kişi olan Cai Yuting ilk çıkışını yaptı.

Wang Haifeng, delikli kağıt banttan karakterlere ve grafik arayüzlere kadar insan-bilgisayar etkileşiminin tarihini inceledi.Akıllı telefonların ortaya çıkmasının ardından dokunmatik etkileşim yöntemleri ortaya çıktı. Akıllı telefonlar için analog klavyelerin çok önemli olduğuna inanıyor, "bir cep telefonu oyun, harita ve sosyal yazılım olmadan olabilir, ancak klavyesiz olamaz." Ancak daha sonra ses girişi desteği olsa bile yeterli olmadığını, gelecekteki giriş yönteminin "tam duyusal girdi" olması ve AI teknolojisi ile desteklenmesi gerektiğini de söyledi.

Baidu giriş yöntemi ürünüyle ilgili olarak Wang Haifeng, Leifeng.com da dahil olmak üzere medyaya, Baidu giriş yönteminin Baidu AI teknolojisinin uygulanması için köprü kurucu olduğunu söyledi.Yeni AI teknolojisi ilk olarak giriş yöntemine uygulanacak ve gelecekte daha fazla AI yeteneği verilecek. , İnsan-bilgisayar etkileşimi deneyimini geliştirmek.

Teknolojik bir atılım: Deep Peak 2 modeli

Baidu'nun ses teknolojisi departmanının yöneticisi Gao Liang Wang Haifeng'den sonra sahneye çıktı ve "Baidu'nun son altı ayda ses teknolojisinde bir ilerleme", yani Deep Peak 2 modelini açıkladı:

Deep Peak 2 modelinin tam adı, LSTM ve CTC tabanlı bağlamdan bağımsız fonem kombinasyon modellemesidir. Bu teknoloji, bir fonem kombinasyonu oluşturmak için yüksek frekanslı fonemleri birleştirir ve ardından bu fonem kombinasyonunu temel bir modelleme birimi olarak görür. . Önceki bağlama bağlı modelleme yöntemleriyle karşılaştırıldığında, Deep Peak 2 modeli, sinir ağı modelinin parametre avantajlarına tam anlamıyla katkıda bulunabilir ve çoklu konuşma yöntemleri için daha kararlı ve doğrudur; aynı zamanda daha hızlı kod çözme sağlayabilir Hız, konuşma tanımanın genel verimliliğini artırın ve göreceli doğruluğu şu anda endüstriyi% 20 oranında yönlendiriyor.

Ek olarak, Gao Liang, bu modelleme yönteminin hem Çince hem de İngilizce için geçerli olduğunu ve ürüne karma Çince ve İngilizce'yi tanıma konusunda daha güçlü bir yetenek kazandırdığını söyledi. Göreceli doğruluk oranı, endüstrinin% 20 önündedir. Bu, 1.400 cümlelik bir kara kutu test setinin test sonuçlarına dayanmaktadır. Baidu giriş yönteminin önceki sürümüyle karşılaştırıldığında, Deep Peak 2 modeli, Baidu giriş yönteminin doğruluğunu bir bütün olarak iyileştirmektedir.

İki yeni özellik: sesli steno ve artırılmış gerçeklik ifadeleri

Bu atılımın desteğiyle, Baidu Giriş Yöntemi'nin yeni sürümü, ses kısaltma ve AR ifadesi olmak üzere iki yeni işlevi tanıttı. Leifeng.com bundan önce ses girişi aracılığıyla Baidu giriş yönteminin aslında ses değiştirme, Çince ve İngilizce arasında gerçek zamanlı çeviri, ses tanıma, sahne tabanlı ses tanıma, ses ilişkilendirme ifadeleri, OCR taraması gibi birçok işlevi olduğunu öğrendi. Giriş vb.

Sözde ses kısaltması iki moda ayrılmıştır: tek ve çok oyunculu. Tekli modda, not almak, makale yazmak, ilham almak ve diğer sahneleri kaydetmek için uygundur.Sürekli ve kesintisiz olabilir ve ses dosyaları aynı anda kaydedilebilir, bu da daha sonra yapılacak değişiklikler için uygundur. Çoklu kişi modu, 2-4 kişiyle bire bir görüşmeler ve küçük toplantılar için uygundur ve farklı konuşmacıları ayırt etmek için ses izi tanıma uygulanır.

Etkinlikte sunucu Hua Shao, 58 saniye içinde 426 karakterlik, karışık Çince ve İngilizce bir reklam konuştu ve giriş yöntemi gerçek zamanlı olarak yazıya döküldü.

Baidu'nun yüz tanıma teknolojisine ve AR teknolojisine dayanan sözde AR ifadeleri, kullanıcılar yalnızca yüzleri tanımak ve kameralara veya fotoğraf albümlerine dayalı ifadeler oluşturmakla kalmaz, aynı zamanda kullanıcıların sanal karakterleri kendi ifadeleri aracılığıyla kontrol etmelerini de destekler. Oluşturulan AR ifadeleri, giriş yöntemi araması, ses girişi ve klavye girişi yoluyla doğrudan görüntülenebilir. Cai Yuting, Baidu giriş yönteminin yalnızca mikrofonu ses girişi için kullanmak istemediğini, aynı zamanda daha fazla "duyuyu" kontrol etmek ve çok modlu girişi gerçekleştirmek istediğini açıkladı.

Aynı zamanda Baidu Girdi Yöntemi, Taohuawu ve diğer Çin soyut kültürel mirasları ile işbirliğine giderek Yeni Yıl resimleri gibi geleneksel Çin halk sanatını ifadelere sokarak, birçok klasik karakterin boyutsallık ve "yaşama" engellerini aşarak Çin tarihi ve kültürüne bir referans olmasını sağladı. En iyi miras.

Leifeng.com, şu an itibariyle Baidu giriş yönteminin 8 yıldır çevrimiçi olduğunu, aylık aktif hacim 400 milyona, günlük ses girişi trafiğinin 250 milyona ulaştığını, Android sürüm 8.0'ın piyasaya sürüldüğünü ve iOS sürümünün Apple tarafından gözden geçirildiğini öğrendi. Gelecekteki girdi yöntemi formuyla yüzleşen Cai Yuting, Baidu AI girdi yönteminin gelecekte yapmak istediği şeyin, kullanıcı girdisinin verimliliğini kapsamlı bir şekilde iyileştirmek için kullanıcıların ifadelerini duymak, görmek ve anlamak olduğuna inanıyor.

Ve bu aynı zamanda Baidu ile diğer üreticilerin giriş yöntemleri arasındaki en büyük fark olacak.

Retro duygular, nihai klasik OLYMPUS PEN-F görünüm değerlendirmesi
önceki
"Original Sin" "Soul Soul" olduktan sonra, başka bir "kadın merkezli" gerilim draması mı olacak?
Sonraki
Onimusha'nın HD versiyonu ile orijinal versiyon arasındaki fark nedir? Yetkili size bir karşılaştırma yapıyor
11 kişi, kırsal aile kötü güçleri tarafından hapsedildi: gündüzleri çalışan ve geceleri ahırları kapatan bir baba ve oğul 17 yıl boyunca ayrıldı.
"Hayvan Dünyası" kamera arkası özelini ortaya çıkardı, yönetmen Han Yan ek bir bütçe verebilir mi?
Sosyal Kaynakların Büyük Ağı Dahua Co., Ltd. Edge Computing Node Networking Çözümü
Phicomm K2 aniden yönlendirici pazarını yorumlamak için ortaya çıktı
"Fire King" her yıl arka arkaya iki saldırı düzenledi, "manga dramasının" acilen geri dönmesi gerekiyor
Kompleksi basitliğe dönüştürün | Dahua Zhixing hafif yüz kimlik doğrulama çözümüne
İlk dokuz Oscar yabancı dilde filmde Jiang Wen yok ve Çin filmi bu kez yine izleyici oldu
Migu Konka, yeni bir akıllı TV ekonomisi yaratmak için güçlerini birleştirdi
"Deep Sea Prison Break", Shangge Yundunun derin denizdeki yaşam ve ölüm savaşı görünen nihai fragmanı ortaya koyuyor
Manzaralı yerlerde satılan "pişmanlık ilaçları" yarı zorunlu mu? Turistler: itiraf etmeniz gerekiyorsa
Sanatçılar birbiri ardına editörlere ateş açtı, "Demon Cut" ın arkasında kim var?
To Top