· Otomatik Konuşma Tanıma;
· Konuşma tanıma nedir?
Konuşma tanıma, araştırma nesnesi olarak konuşmayı kullanan ve makinelerin insan konuşma dilini otomatik olarak tanımasına ve anlamasına ve ardından konuşma sinyalini karşılık gelen metne veya komutlara dönüştürmesine olanak tanıyan sinyal işleme ve tanıma teknolojisini kullanan bir teknolojidir.
Konuşma tanıma ve konuşma sentezi, doğal dil anlama ve anlamsal ağ gibi teknolojileri birleştiren ses etkileşimi, giderek çok kanallı, multimedya akıllı insan-bilgisayar etkileşiminin ana yöntemi haline geliyor.
· Konuşma tanıma süreci;
Konuşma tanıma süreci iki bölüme ayrılmıştır: eğitim ve tanıma.
Konuşma sinyali, ön uç sinyal işleme ve uç nokta tespiti ile önceden işlendikten sonra, konuşma özellikleri kare kare çıkarılır.Geleneksel özellik türleri arasında MFCC, PLP, FBANK ve diğer özellikler bulunur. Çıkarılan özellikler kod çözücüye ve eğitimli akustik modele gönderilecektir. Dil modeli altında, tanıma sonucunun çıktısı olarak en uygun sırayı bulun.
· Konuşma tanıma teknolojisi model diyagramı ve ilgili işletme diyagramı;
Temel katman : Üç parça büyük veri, bilgi işlem gücü ve algoritma içerir.Bunlardan büyük veri, ilgili alandaki üçüncü taraf hizmetlerine bağlanır.
Servis sağlayıcı. Makine, insan ses komutlarını tanıdıktan sonra bunlara erişir ve ilgili hizmetleri sağlar. Film ve televizyon, sinema biletleri, yemek hizmetleri vb.
Teknik katman : İFlytek başkanlığındaki ses teknolojisi sağlayıcısı;Uygulama katmanı : Geleneksel ev ortamındaki TV ve hoparlör üreticileri, ses tanıma işlevleri ve etkileşimli yöntemler eklediler;
Güvenliği artırmak için ellerin direksiyon simidinden çıkmasını engellemek için sesli etkileşimi kullanan akıllı arabalar da var; aramaya dayalı arama şirketleri var
Sesli asistan vb.
· Doğal Dil Anlayışı;
· Doğal dil anlayışı nedir?
Doğal dil anlama, konuşma ve görüntünün örüntü tanıma teknolojisinden temelde farklı olan metin anlamadır. Bilgi olarak dil
Taşıyıcısı, karmaşık miktarda bilgi taşır ve yüksek derecede soyutlamaya sahiptir.Dil anlayışı bilişsel seviyeye aittir ve tek başına örüntü eşleştirme ile tamamlanamaz.
· Doğal dil anlayışının uygulanması: arama motoru + makine çevirisi;Doğal dil anlamanın en tipik iki uygulaması arama motorları ve makine çevirisidir.
Arama motorları, insan doğal dilini bir dereceye kadar anlayabilir, temel içeriği doğal dilden çıkarabilir ve geri çağırmak için kullanabilir ve nihayet arama motorları ile doğal dil kullanıcıları arasında iyi bir bağlantı kurarak ikisi arasında daha verimli bir ilişki kurabilir. Daha derin bilgi aktarımı.
· Makine çevirisinde doğal dil anlama teknolojisinin uygulanması;
Aslında, arama motorları ve makine çevirisi birbirinden ayrı değildir ve İnternet ve mobil İnternet onlar için külliyatları zenginleştirmiştir ve geliştirme modları niteliksel bir değişikliğe uğramıştır. Çevrimiçi bilgilere (orijinal külliyat) ek olarak, İnternet ve mobil İnternet de yeni bir UGC modeli türetmiştir: yapay olarak kalibre edilmiş girdiler olan Wikipedia, Baidu Ansiklopedisi gibi bilgi paylaşım verileri. Düşük gürültü; Weibo ve WeChat gibi sosyal veriler, kişiselleştirilmiş öneri, duygu analizi ve sıcak kamuoyu tespiti ve takibi için kullanılabilen kullanıcının kişiselleştirmesini, öznelliğini ve zamanını gösterir; topluluk ve forum verileri, Guohu ve Zhihu gibi veri kaynakları, arama motorlarına Soru-Cevap bilgisi ve Soru-Cevap kaynakları sağlar.
Öte yandan, derin öğrenmenin benimsediği hiyerarşik yapı nedeniyle, büyük ölçekli verilerden kendiliğinden öğrenmenin kara kutu modeli açıklanamaz ve dili bir araç olarak kullanan insanlar arasındaki iletişim karşılıklı anlayışa dayanmalıdır. Bu nedenle, arama motorlarında derin öğrenmenin faydası ve makine çevirisi, konuşma ve görüntü tanıma alanında o kadar önemli değildir.