Wiener son filtrelemeye dayalı LS hüzmeleme yankılanma bastırma algoritması

Özet: Yankılanma, konuşma sinyalinin zamanının ve frekansının bulanıklaşmasına neden olur ve şiddetli olduğunda konuşmanın anlaşılması zorlaşır. Ses kalitesini iyileştirmek için, Wiener son filtreleme ile en küçük kare huzme oluşturan yankılanma bastırma algoritması önerilmiştir. Algoritma, yankılanan konuşma sinyalini doğrudan bir bölüme ve bir yankılanan bölüme böler ve Wiener son filtre kazanç tahminini elde eder; konuşma sinyalinin düşük frekans bölümündeki güçlü gürültü tutarlılığı sorunu için, en küçük kare hüzme oluşturma algoritması gerçekleştirmek için kullanılır. Frekans bölmeli işleme ve sonunda optimum ağırlığı çözün. Simülasyon deneyleri, önerilen algoritmanın daha iyi yankılanma bastırma özelliklerine sahip olduğunu göstermektedir.

TN912.16

Bir

10.16157 / j.issn.0258-7998.172043

Çince alıntı biçimi: Zhang Xiuzai, Wang Ting, Guo Yecai ve diğerleri.Wiener post-filtrelemeye dayalı LS hüzmeleme yankılanma bastırma algoritması.Elektronik Teknoloji Uygulaması, 2018, 44 (3): 131-134.

İngilizce alıntı biçimi: Zhang Xiuzai, Wang Ting, Guo Yecai ve diğerleri.Wiener son filtresine dayalı LS hüzmeleme için yankılanma bastırma algoritması.Elektronik Tekniğin Uygulanması, 2018, 44 (3): 131-134.

0 Önsöz

Mikrofon dizileri, uzamsal bilgileri doğru bir şekilde elde edebilir ve telekonferans, eller serbest sesli iletişim, insan-makine ses etkileşimi ve işitme cihazı cihazları gibi sistemlerde yaygın olarak kullanılır. Hüzmeleme, önemli bir mikrofon dizisi işleme teknolojisidir ve temel amacı, diğer yönlerdeki parazit sinyallerini ve gürültüyü bastırırken yararlı sinyalleri belirli bir yönde ışınlamaktır. Son yıllarda, sesli iletişim üzerine yapılan derinlemesine araştırmalarla, mikrofon dizileri daha yaygın bir şekilde kullanılmaktadır.

Birden fazla dağıtılmış mikrofona sahip sesli iletişim uygulamalarında, en yüksek kaliteye veya en küçük yankılanmaya sahip kanalı seçmek için her sensörde algılanan sinyalin yankılanma miktarının ölçülmesi genellikle arzu edilir. Farklı kanallardaki seslerin ilintisiz olduğunu varsayarak, ZELINSKI R, Wiener filtre tahmini problemini çözmek için uzamsal bilgiyi kullanan Wiener post-filtrelemeli bir hüzmeleyici önerir. Ancak bu tür tutarsız gürültü alanına, özellikle düşük frekanslı gürültü alanına nadiren rastlanır. BERKUN R ve MARRO C, bir mikrofon dizisi ve bir Wiener son filtresinin kombinasyonuna dayanan bir gürültü azaltma ve yankılama algoritması önerdi. MCCOWAN I, gürültü alanının karmaşık uyumluluğunun varsayımsal bilgisine dayalı olarak filtre tahmininin daha genel bir ifadesini geliştirir, ancak bu algoritma, gürültü tutarlılığı fonksiyonunun önceden elde edilmesini gerektirir ve uygulama kapsamı sınırlıdır. SIMMER K U tarafından önerilen çok kanallı Wiener filtresi (MCWF), yankılanmada ses kalitesini önemli ölçüde artırabilen en uygun çözüm ifadesini bulmak için minimum varyans bozulmasız yanıt hüzmeleyiciye ve tek kanallı bir son filtreye ayrıştırılabilir. LUEBS A, beyaz gürültü ve dağınık yansıma gürültüsü temelinde nokta parazit işlemeyi ekler ve küresel olarak en uygun en küçük kareler çözümü sağlayarak, ses kalitesini iyileştirmek için mikrofon dizisi tarafından toplanan bilgileri daha etkili bir şekilde kullanabilir.

Bu makale, Wiener post-filtering ile en küçük kare huzme oluşturan yankılanma bastırma algoritmasını önermektedir. Bu algoritma, LS hüzmeleme algoritması tarafından işlenen ve daha sonra üst üste bindirilen ve Wiener son filtrelemeye tabi tutulan yüksek frekanslı ve düşük frekanslı bileşenleri elde etmek için konuşma sinyalini yankılanma ile böler ve ardından yankılanmış konuşmayı elde etmek için ters Fourier dönüşümü kullanılır. sinyal. Bilgisayar simülasyon sonuçları, bu makalede önerilen Wiener son filtrelemeye dayanan LS hüzmeleme yankılama bastırma algoritmasının iyi yankılanma bastırma yeteneklerine sahip olduğunu kanıtlamaktadır.

1 Sinyal modeli

1.1 En küçük kareler hüzmeleme algoritması

Temel dizinin bir M-elemanlı tekdüze doğrusal dizi olduğunu ve her dizi elemanı kanalının arkasında bir L-sıralı FIR filtresi olduğunu varsayalım Alıcı geniş bant sinyalinin frekans bant genişliği Nf ve sinyalin yayılma yönü ile temel dizinin normal yönü arasındaki açı . Eleman aralığı d. En küçük kareler hüzmeleyicinin tasarım yönteminde maliyet fonksiyonu şu şekilde tanımlanır:

1.2 Wiener son filtrelemeli hüzmeleyici

ZELINSKI R tarafından önerilen uyarlamalı son filtrenin yapısı Şekil 1'de gösterilmektedir. Bunlar arasında, A (i) i-inci kanalın kendi kendine güç spektral yoğunluğunu temsil eder, C (i) çapraz güç spektral yoğunluğunu temsil eder ve y (t) çıktı sinyalidir. Sistem ilk olarak mikrofon dizisi tarafından alınan ses sinyalinin zaman gecikmesini telafi eder. İ'inci kanal tarafından alınan xi (t) sinyali şu şekilde ifade edilir:

1.3 Wiener son filtrelemeye dayalı LS geliştirilmiş hüzmeleme

LEBART K ve BOUCHER J M tarafından önerilen hipoteze göre, oda dürtü tepkisine dayanan h (k), şu şekilde ifade edilen rastgele bir süreçtir:

Sd (k) ve sr (k) 'nin saf konuşma sinyali s (t)' nin sırasıyla hd (k) ve hr (k) ile evrişimini temsil ettiğini varsayarsak, sd (k) işlenecek konuşma sinyalinin doğrudan sinyal kısmıdır, sr ( k) işlenecek konuşma sinyalinin yankılanma kısmıdır.

Geliştirilmiş Wiener filtresinin tahmini kazancı, yukarıdaki analizden elde edilir:

Zayıflatma faktörü yankılanma süresi T60 ile ilişkili olduğundan ve farklı frekans bantlarının yankılanma süresi farklı olduğundan, belirli bir odadaki farklı frekansların zayıflama derecesi ve yansıması, yani farklı frekansların akustik sinyalleri tarafından üretilen yankılanma ile değişir. Bazı farklılıklar vardır ve gerçek ses alanındaki düşük frekanslı gürültü nispeten tutarlıdır Bu nedenle, Fourier dönüştürülmüş sinyali yüksek frekanslı ve düşük frekanslı bileşenlere bölmek için frekans bölmeli işleme fikri benimsenir ve frekans bölme noktası 1 kHz olarak alınır. Normal bir sayı olan ağırlıklı matris katsayısı olsun, sırasıyla hL ve hH yüksek ve düşük frekans ağırlık vektörlerini ekleyin, yani frekans bölünmesinden sonraki sinyaller LS hüzme oluşturma algoritması tarafından ayrı ayrı işlenir ve sonra toplanır ve elde edilen sinyal Y ( ) Wiener post-filtrelemesini gerçekleştirin ve nihayet yankılanmış konuşma sinyalini elde etmek için sinyal üzerinde ters Fourier dönüşümü gerçekleştirin. Wiener son filtrelemeye dayalı olarak LS'nin geliştirilmiş hüzmeleme yapısı Şekil 2'de gösterilmektedir.

Denklemlerden (5) ve (12), geliştirilmiş huzme şekillendiricinin optimal ağırlık vektörü şu şekilde elde edilebilir:

2 Deney ve değerlendirme

Simülasyon ortamı: Ses kaynağı konumunun (-5, 1, 0) olduğu, ilk mikrofonun en soldaki konumunun (-5, 2, 1) olduğu ve mikrofon dizisi elemanının 1 m ile ayrıldığı 6 mikrofon sensöründen oluşan tek tip doğrusal bir dizi kullanılır. Dört duvarın, zeminin ve tavanın yansıma katsayıları sırasıyla 0,9, 0,95, 0,9, 0,95, 0,2, 0,4'tür. Odanın çapraz koordinatları (-7, -3, 0), (1, 3, 1.24). Bu deneyde, yankılanan sinyali elde etmek için oda dürtü yanıt fonksiyonu ile saf bir konuşma sinyali (ilk derste hoş geldiniz), saf konuşma sinyali örnekleme frekansı fs 8000 Hz'dir ve 2,3 sn sürer. Önerilen algoritma iki göstergeden doğrulanmıştır.

(1) Spektrogram: Şekil 3'te gösterildiği gibi, konuşma frekansı spektrumunun özelliklerini, dinamik bir frekans spektrumu olan üç boyutlu bir şekilde gösterir. Belirli bir frekans bandındaki enerji miktarını belirtmek için renk tonlarını kullanın.

Şekil 3 (a) saf konuşma sinyalinin spektrogramıdır; Şekil 3 (b) yankılanan konuşma sinyalinin spektrogramıdır.Bu şekilden biçimlendiricinin biçimlendirmeden önce ve sonra ciddi bir şekilde üst üste bindiği görülebilir.Konuşma sinyali yatay eksende (zaman ekseni) yer almaktadır. Yaklaşık 0.17 s'lik bir gecikme var ve ses kalitesi ciddi şekilde bozulmuş; Şekil 3 (c) 'deki tek kanallı Wiener filtreleme algoritmasının yankılanma üzerinde belirli bir engelleyici etkisi olmasına rağmen, sinyal bozulması hala ciddidir; Bu yazıda Şekil 3 (d) önerilmiştir Algoritma, yankılanmayı bastırmada daha iyi bir etkiye sahiptir ve sinyal bozulmasını önemli ölçüde iyileştirir.

(2) Konuşma Kalitesinin Algısal Değerlendirmesi (PESQ), yankılanmanın etkisini değerlendirmek için kullanılır. PESQ şu şekilde ifade edilir:

Formülde, Dind ve Aind sırasıyla ortalamanın doğrusal kombinasyonu ile elde edilen ortalama girişim değeri ve simetrik girişim değeridir. Tablo 1'den, yankılanma eklendikten sonra konuşma sinyalinin PESQ'sunun 1.9'a düştüğü ve konuşma sinyalinin kalitesinin ciddi şekilde düştüğü görülebilir. Bu makalede önerilen algoritma yankılanma bastırma gerçekleştirdikten sonra, PESQ 2.3'e ulaşır.

3 özet

Bu makalede önerilen Wiener son filtreleme ile en küçük kareler hüzmeleme yankılanma bastırma algoritması, geliştirilmiş bir Wiener filtre sonrası kazanç tahmini elde etmek için yankılanan sinyali doğrudan bir parçaya ve yankılanan bir parçaya böler ve ardından en küçük kareleri kullanır. Hüzmeleme algoritması sinyali frekansa böler ve son olarak optimum ağırlığı çözer ve simülasyon deneyleri yoluyla sinyalin spektrogramından ve konuşma kalitesi algı göstergelerinden algoritmayı değerlendirir. Simülasyon deney sonuçları, Wiener yankılanma bastırma algoritması ile karşılaştırıldığında, bu makalede önerilen algoritmanın yankılanma bastırma etkisinin daha anlamlı olduğunu göstermektedir.

Referanslar

LOIZOU P C. Konuşma geliştirme: Teori ve uygulama CRC Press, Inc. 2013.

DOBLINGER G. Uyarlanabilir sensör kalibrasyonu ile geniş bant sabit hüzmeleyicilerin optimizasyonu. Sinyal İşleme Konferansı, 2010, European.IEEE, 2010: 2062-2066.

Yankılanan odalarda gürültü azaltma için uyarlamalı son filtrelemeli ZELINSKI R.A mikrofon dizisi.Uluslararası Akustik, Konuşma ve Sinyal İşleme Konferansı. IEEE, 2002, 5: 2578-2581.

BERKUN R, COHEN I. Yankılı konuşmanın kalite değerlendirmesi için mikrofon dizisi güç oranı.EURASIP Sinyal İşlemede Gelişmeler Dergisi, 2015 (1): 1-11.

MARRO C, MAHIEUX Y, SIMMER K U. Son filtreli mikro telefon dizilerine dayalı gürültü azaltma ve azaltma tekniklerinin analizi Konuşma ve Ses İşleme IEEE İşlemleri, 2002, 6 (3): 240-259.

MCCOWAN I, BOURLARD H. Gürültü alanı koheransına dayalı mikrofon dizisi son filtresi, Konuşma ve Ses İşleme IEEE İşlemleri, 2003, 11 (6): 709-716.

SIMMER K U, BITZER J, MARRO C. Son filtreleme teknikleri Mikrofon Dizileri Springer Berlin Heidelberg, 2001: 39-60.

HUANG Y A, LUEBS A, SKOGLUND J, vd. Mikrofon dizisi konuşma iyileştirmesi için küresel olarak optimize edilmiş en küçük kareler son filtreleme. IEEE Uluslararası Akustik, Konuşma ve Sinyal İşleme Konferansı. IEEE, 2016: 380-384.

Wang Yan, Wu Wenfeng, Liang Guolong. Sağlam en küçük karelere dayalı sağlam hüzmeleme Açta Electronica Sinica, 2013, 41 (12): 2321-2326.

LEBART K, BOUCHER J M, DENBIGH P N. Konuşma bozunması için spektral çıkarmaya dayalı yeni bir yöntem Acta Acustica United With Acustica, 2001, 87 (3): 359-366.

yazar bilgileri:

Zhang Xiuzai 1, 2, Wang Ting 1, Guo Yecai 1, 2, Chen Xiaoyan 1

(1. Elektronik ve Bilgi Mühendisliği Okulu, Nanjing Bilgi Bilimi ve Teknolojisi Üniversitesi, Nanjing 210044, Jiangsu;

2. Jiangsu Eyaleti Atmosferik Çevre ve Ekipman Teknolojisi İşbirliğine Dayalı İnovasyon Merkezi, Nanjing, Jiangsu 210044)

"Life is Strange 2" Steam ön siparişi açılır "Kaptan Süper" artık ücretsiz olarak sunuluyor
önceki
Huang Bo'nun "Game of Desire" filminin tanıtım şarkısı "Appearance"
Sonraki
30 yıldan fazla bir süre sonra, bu film hala diğer Hong Kong filmlerinin ulaşamayacağı bir dağ!
Robin Li ilk kez üst beş çevre yoluna yanıt veriyor: gelecekteki sürücüsüz arabalar sürücülerden daha güvenli; Yu Chengdong: Huawei yapay zeka işlemcileri geliştiriyor | Lei Feng Morning Post
Ne oluyor, ana melodi Leiju'nun kahramanı oluyor?
"Adalet Ligi" yabancı medyanın ağızdan ağza yasağı kaldırıldı: "Bat Super" ve "Suicide Squad" dan daha iyi
Yapay zekanın başkalarına fayda sağlayacağına yemin ederek Google'ın "PAIR" projesi ne kadar güvenilir?
30'lu yaşlarındaki tüm kızlar için Amway
"Blog Gönderisi" PCIe Literacy-Reflected-Wave Signaling in PCI Bus
Dünyanın ilk L3 otonom üretim otomobili olmanın yanı sıra, Audi A8 başka hangi özellikleri beraberinde getiriyor?
"Mario Racing 8 Deluxe Edition" artık Labo motosiklet kiti ile uyumlu
Zhong Hanliang neden hala bu tür oyunlar oynuyor?
Guizhou Tongren konukları davet etmek için Changsha'ya geldi, Brahma Pure Land "Bahar Anlaşması" nı yayınladı.
Bebeği Pikachu filmini izlemeye götürün, "Annem yaşadığım güzelliği sizinle paylaşmak istiyor!"
To Top