Gerçek zamanlı transkripsiyon oranı% 98'e ulaşıyor. Sogounun yeni ses kaydedicisi, kaydedilen el yazmasının temel cümlelerini otomatik olarak çıkarabilen AI gürültü azaltma işlevine öncülük etti.

Lieyun.com Beijing 27 Şubat'ta bildirildi

Kasım 2017'de New York Borsası'nda listelendikten sonra, Sogou'nun "dil merkezli" yapay zeka stratejik düzeni kademeli olarak gelişti. Bu strateji iki bölümden oluşur: Biri algısal ve bilişsel düzeylerde dilin anlaşılmasını içeren insan-bilgisayar etkileşimidir; diğeri ise dili çekirdek olarak kullanmak ve bilgi hesaplama olarak adlandırılan okuma ve muhakeme yeteneklerini geliştirmek için makinelerin etrafında dönmektir.

Sogou CEO'su Wang Xiaochuan'a göre, Sogou'nun yapay zekaya odaklanma konusundaki asıl amacı ifade ve bilgiyi daha kolay hale getirmek.

Bu amaçla, giriş yöntemine ve çok sayıda arama kullanıcısına bağlı olarak Sogou, son yıllarda akıllı ses ve akıllı donanım pazarının düzenine katılmak için giriş noktası olarak AI kayıt cihazlarını kullandı ve temel gereksinimleri olarak art arda ses tanıma, transkripsiyon ve çeviriyi tanıttı. Çeşitli akıllı ses kayıt cihazları.

Ayın 26'sında Sogou, S1 ve E1 adlı iki yeni kayıt ürünü piyasaya sürdü ve S1 ve C1 Pro'yu başlatmak için Yasak Şehir'deki Saray Kültürü ile işbirliği yaptı. Orijinal C1 kayıt cihazı temelinde daha da yükseltildi ve ürüne süper güçlü ses alma, doğru transkripsiyon, verimli sonlandırma ve çok yönlü çeviri yetenekleri sağlayarak kullanıcı deneyimi daha da iyileştirildi.

İnsan sesi kaydının netliğini sağlamak için AI gürültü azaltmayı kullanın

Kayıt işlemi sırasında gürültü girişiminin neden olduğu belirsiz insan sesini azaltmak için, Sogou tarafından bu kez piyasaya sürülen AI kayıt cihazı S1, donanım ve algoritmalar açısından aşağıdaki büyük optimizasyonları yaptı:

Her şeyden önce, Donanım açısından S1, 2 Harman yönlü mikrofon ve 6 çok yönlü mikrofon ile donatılmıştır. Bunun aksine, sıradan ses kayıt cihazları ve akıllı telefonlarda genellikle yalnızca iki yönlü mikrofon bulunur.

S1, yalnızca 10 metreye kadar maksimum alım mesafesine sahip 2 Harman yönlü mikrofonla değil, aynı zamanda 360 ° çok yönlü alıcıyı destekleyen 6 çok yönlü mikrofonla donatılmıştır.

İkincisi, Algoritma kısmında, Sogou'nun clairVoice 8 mikrofon dizisi algoritmasına dayanan S1, kullanıcılara süper uzun mesafeli bir sahne ve 360 ° ölü açısız algılama deneyimi de sağlayabilir.

Sogou Sesli Etkileşim Merkezi Teknik Direktörü Chen Wei'ye göre, bu, Sogou'nun derin öğrenmeye dayalı gürültü azaltma yeteneklerinin tamamen ticarileştirildiği ilk kez.

"Derin sinir ağı tabanlı bir yaklaşım kullanıyoruz. Gürültünün dağılımı ve insan seslerinin dağılımı, frekans ve zaman alanlarında farklıdır. Modelin insan sesi ve gürültüsü hakkında bilgi edinmesini sağlamak için 40.000'den fazla gürültü türü kullandık. Fark, mikrofon dizisinin ve sektördeki diğer gürültü azaltma çözümlerinin ötesinde en iyi gürültü azaltma etkisini elde etmektir. "

Kayıtların gerçek zamanlı olarak metne dönüştürülmesini ve kayıt dosyalarının metne dönüştürülmesini desteklerken, aynı zamanda farklı konuşmacıları tanımlayabilen ve kullanıcı deneyimini büyük ölçüde geliştirebilen gelişmiş tanıma yeteneklerine sahip olduğunu belirtmek gerekir.

Kayıt transkripsiyonu sırasında aksan ve profesyonel kelime bilgisi gibi çeşitli faktörlerin neden olduğu zayıf transkripsiyon deneyimi sorunuyla karşı karşıya kalan iki yeni ürün S1 ve E1, yükseltmeler yoluyla% 98 transkripsiyon doğruluğu elde etti ve Çince, İngilizce, Japonca, Korece'yi destekliyor Almanca dahil 10 dilde ve Sichuan, Yuejin, Shangui vb. Dahil 10 lehçede kayıt ve yazıya dönüştürme

Aynı zamanda öğrenciler, gazeteciler, avukatlar, devlet işleri ve sıkça kayıt ihtiyacı olan diğer ilgili alanlar için, Sogou Voice ekibi ayrıca, sektöre özgü kelimelerin tanıma doğruluğunu iyileştirmek için finans ve ticaret, tıp ve sağlık, BT teknolojisi, politika ve hukuk, kültür ve spor dahil olmak üzere beş profesyonel alanda dil modelleri eğitti ve oluşturdu. .

Kayıt yönetimi verimli ve akıllıdır, kaydın içeriğini "tek cümle" içinde bulabilirsiniz

Çoğu ses kaydedici kullanıcısı için, geleneksel ses kayıt cihazları kayıttan sonra tekrar tekrar dikte gerektirir. Süreç zaman alıcı ve sıkıcıdır.Sogou'nun S1 ve E1 iki yeni ürünü bunu yapabilir. Kaydedilen yazının konusu ve anahtar cümleleri, kullanıcının transkripsiyonu yapılan içeriği düzenlemesini kolaylaştırmak için otomatik olarak çıkarılır.Kayıtlı içeriği tek bir cümlede bulmak için sesi de kullanabilirsiniz.

Bulut depolama teknolojisi sayesinde kullanıcılar, ses kayıt cihazları, mobil uygulamalar, web sayfaları ve PC istemcileri gibi çoklu terminale de erişebilirler. Kayıt verilerini otomatik olarak senkronize edin ve yönetin ve tek tıklamayla dışa aktarma ve tarama kodu paylaşımı gibi uygun işlemleri gerçekleştirin .

Bunların arasında S1, akıllı anlambilim yoluyla paragrafları düzenleyebilen, etiketleri oluşturmak için anahtar kelimeleri akıllıca çıkarabilen ve kullanıcıların bir bakışta bilmesi için akıllıca paragraf özetleri çıkarabilen endüstrinin ilk NLP motoru akıllı özetleme teknolojisini benimser.Aynı zamanda, kullanıcının kayıttaki kayıt işaretlerine ve alkışlarına da dayanabilir. Kahkaha, vb. Gibi düğümler, içeriğin kilit noktalarını çıkarır ve bunları özetler, bu da harmanlama çalışmasının rahatlığını büyük ölçüde artırır.

Bulut depolama hizmetlerine dayanan S1, kullanıcıların ses kayıt cihazları, mobil uygulamalar, web sayfaları ve PC istemcileri gibi birden çok istemcide kayıt verilerini otomatik olarak senkronize etmesini ve yönetmesini destekler.Aynı zamanda kayıt oynatma, belge inceleme, tek tıklamayla dışa aktarma ve tarama da gerçekleştirebilir Kod paylaşımı ve diğer işlemler kullanıcılar için oldukça dostane bir yöntemdir.

Sogou'nun ürün müdürü Li Jiantao, ürünün kullanıcı portreleri aracılığıyla, muhabirler, ofis çalışanları ve öğrenciler gibi üç grup insanın kayıt için daha fazla talep gördüğünü söyledi.

"Bu üç tür insan için, akıllı özetler, konuşmacıları ayırt etme, toplantı sırasında bazı kahkaha ve alkışları analiz etme gibi özelleştirilmiş hizmetler sunacağız ve bunların tümü toplantı tutanakları, notlar ve röportaj içeriği düzenlememizi kolaylaştıracak. Daha verimli bir şekilde işbirliği içinde organize edin ve çalışın. Bunlar, bu tür hedef gruplar için özelleştirilmiş AI inovasyon işlevi noktaları sağlamak içindir. "

Çok yönlü çeviri, iletişimi daha sorunsuz hale getirir

Çeviri her zaman Sogou AI kaydedicinin çok değer verdiği bir özellik olmuştur. Bu kez yayınlanan S1 diyalog çeviri işlevi, dünya çapında 200 ülkede 63 dilde çevrimiçi çevirinin yanı sıra Çince, İngilizce, Japonca, Korece, Fransızca ve Rusça da dahil olmak üzere 9 yaygın dilde çevrimdışı çeviriyi desteklemektedir.Sektörde ilk ücretsiz diyalog çeviri işlevi, Birden fazla senaryoda ücretsiz iletişim gerçekleştirebilir.

Aynı zamanda, kişisel simültane çeviri işlevini kullanan endüstrinin ilk ses kayıt cihazıdır.Çince ve İngilizce arasında gerçek zamanlı çeviriyi destekler ve transkripsiyon sonuçları eşzamanlı olarak görüntülenir, bu da verimli iletişimi büyük ölçüde teşvik edebilir.

Sogou AI ses kaydedici S12698 yuan, E11298 yuan fiyatlıdır . Şu anda, Sogou'nun kendi kendine çalışan amiral mağazasında ve JD.com'daki Sogou Youpin uygulamasında satışa sunuldu.

Sogou AI Ses Kaydedici S1

Geçtiğimiz dönemde, akıllı telefonlar, kolay taşınabilirlik ve rahat kullanım gibi avantajları nedeniyle geleneksel kayıt ekipmanlarının yerini aldı.İlgili kayıt uygulaması, ses kayıt cihazlarının dikey pazarını güçlü bir şekilde etkileyen çoğu sahnenin kaydını tamamlayabilir.

"Kayıt" segmentinden daha fazla pazar fırsatının nasıl açılacağına ilişkin olarak, Wang Xiaochuan basın toplantısından sonra yaptığı röportajda Sogou'nun yeni pazarlar açmak için yazılım ve donanım parçalarında daha fazla yardımcı işlevi ve aksesuarları optimize edeceğini söyledi. " Artık kayıt kalemi pazarı, altüst edilmiş ve yeniden tanımlanmış bir durum olarak görülebilir. "

Donanıma ek olarak, Sogou CTO'su Yang Hongtao, hizmet odaklı bir modeli keşfetmeyi ve kullanıcılara AI yetenekleri aracılığıyla iyi katma değerli hizmetler sunmayı umduğunu belirtti.

"Metin, el yazmaları oluşturmak için yazıya dönüştürülebilir ve daha sonraki önemli özetler düzenlenebilir. Çeviriye dayalı olarak daha fazla güçlendirme çalışması yapılır. İster sürekli ister eşzamanlı çeviri olsun, kullanıcılar bu tür hizmetlerden yararlanır. Geçmişte, geleneksel donanım satılırdı, ancak donanım satılabilirdi. Gelecekte brüt kâr, Sogounun kendi ürünlerini mi yoksa endüstri ve geleneksel donanım üreticileriyle etkileşimler yoluyla mı, kullanıcılara AI güçlendirme yoluyla daha fazla katma değerli hizmetler sağlamak ve kullanıcılara hizmet odaklı bir şekilde çok ince bir brüt kâr sağlayabilmek için keşfe çıkmayı dört gözle bekliyoruz. Katma değerli iş modeli alanının bir bölümünü elde etmek için ".

Minimalist Gundam vücut COS, kıdemli model arkadaşlar onun COS'un hangi vücut olduğunu görebilir
önceki
Çin'deki salgının önlenmesi ve kontrolüne ilişkin DSÖ uzmanlarının değerlendirmesini duyduktan sonra çevirmen boğuldu.
Sonraki
Dış şekil değiştirebilen ekipman, mükemmel tek boynuzlu at gundam
AutoNavi taksiler için 100 milyon yuan sübvansiyon başlattı ve sıcak dezenfeksiyon ve güvenlik arabaları üzerine spekülasyon yapmak için 48 platformla birleştirildi
Gundam Dönüştürülebilir Işık Enerjisi Messenger
Üçü bir arada Meteor, Lion Electric ve Floros
Endüstrinin iyileşmesine yardımcı olan Examstar, 10.000 zincir şirkete tam özellikli işlevlere ücretsiz erişim sağlar
Beş Yıldızlı Hikaye tarzı Barbatos değişikliği
"Sert adam" tarzı Gundam serisi illüstrasyonlar, bu stili beğendin mi?
Mekanik savaşçı konsept tasarım çizimi, en çok hangi tasarımı seviyorsun?
Post-95'ler çevrimiçi K şarkı pazarının ana gücü haline gelir ve çalmak ve şarkı söylemek kullanıcının favori özelliği haline gelir.
Bu anlar, yüksek yanma
Fengtai Bölgesi "bir, üç, üç" önleme ve kontrol politikasını uygular ve şehirdeki birinci düzey hastaneleri ve toplum sağlığı hizmeti kurumlarını acil olmayan randevuların yönetimine dahil etme konus
On dakikalık online satış, hammadde primi% 30 ... Sütlü çay güveci katı bir talep mi oldu?
To Top