"Akademik Rapor" Rüzgar Gürültüsünü Bastırmak için Frekans Ayrık Değer Ağırlıklı GCC-PHAT Zaman Gecikmesi Tahmin Algoritması

Ses kaynağının doğru bir şekilde yerleştirilmesi, mobil cihazın işitsel sahneyi analiz etmesi için ilk adımdır ve sonuç, karışık ses kaynaklarının, ses kaynağının tanımlanmasının ve konuşma tanımanın sonraki ayrımı üzerinde doğrudan bir etkiye sahiptir. Gecikme ve toplam hüzmeleme teknolojisi, ses kaynağı lokalizasyonunda yaygın olarak kullanılmaktadır ve sinyalin, mikrofon dizisindeki farklı mikrofonlara varış zaman farkını (TDOA) kullanması gerekir. Genelleştirilmiş Çapraz Korelasyon-Faz Dönüşümü (GCC-PHAT) algoritması kısa bir karar gecikmesine ve iyi bir izleme yeteneğine sahiptir ve düşük yankılanma ortamları için uygundur ve yaygın olarak kullanılan bir TDOA tahmin algoritmasıdır.

VALIN J M, orijinal algoritmanın ilave gürültüye karşı dayanıklılığını iyileştirmek için ağırlıkları, yani sürekli değer frekans noktası ağırlıklı GCC-PHAT algoritmasını hesaplamak için özyinelemeli bir yöntem kullanan gelişmiş bir GCC-PHAT algoritması önerdi. Sürekli ağırlık hesaplamasının gürültüyü tahmin etmek için Minimum Kontrollü Yinelemeli Ortalama (MCRA) algoritmasını kullanması gerekir, ancak MCRA algoritmasının gürültü değişikliklerinden sonra zaman ayarlama parametrelerine adapte olması gerekir, bu nedenle sabit olmayan ek veya gürültü için sürekli ağırlıklı Ağırlıklandırma yöntemi girişimini ortadan kaldıramaz ve sonunda TDOA tahmin hatalarına yol açar. Bu nedenle, frekans ağırlıklı GCC-PHAT algoritması temelinde, bu makale, rüzgar gürültüsünü ve arka plan gürültüsünü ortadan kaldırmak için frekans ayrık değer ağırlıklı bir GCC-PHAT algoritması önermek için alınan sinyaldeki rüzgar gürültüsü ile ses kaynağı sinyalinin frekansı arasındaki tutarlılık farkını kullanır. TDOA tahminlerine müdahale. Deneysel sonuçlar, orijinal algoritmaya kıyasla, yeni algoritmanın güvenilirliğinin ve hesaplama verimliliğinin önemli ölçüde arttığını göstermektedir.

1 Çapraz korelasyon algoritması sinyal zaman farkını tahmin eder

1.1 Sahne akustik modeli

Ses kaynağı sinyalinin ek gürültü ile yankılanan bir ortamda yayıldığını ve mikrofon dizisi tarafından alındığını varsayalım. Toplamsal gürültü, arka plan gürültüsü ve rüzgar gürültüsünden oluşur. Rüzgar gürültüsü, mikrofon zarının yüzeyindeki türbülanstan kaynaklanan ve alınan sinyalin ciddi şekilde bozulmasına neden olan özel bir tür sabit olmayan gürültüdür. Arka plan gürültüsü, akustik bir ortamda uzak alan ses kaynakları tarafından üretilen yaygın gürültüye benzer. Ses kaynağı sinyali, rüzgar gürültüsü ve arka plan gürültüsü gibi ek gürültü ile ilgili değildir.

N sinyal zaman alanı örnekleme numarası olsun, m dizideki mikrofon numarası olsun, s (n) ses kaynağı sinyalidir, hm (n) ses kaynağından mikrofona m oda sistemi dürtü yanıt dizisi ve wm (n) rüzgardır Gürültü, bm (n) arka plan gürültü sinyalidir. Arka plan gürültüsünün yankılanmayı hesaba katması gerekmez, mikrofon m alınan sinyal ym (n) şu şekilde ifade edilir:

1.2 Frekans noktası ağırlıklı GCC-PHAT algoritması

Alınan sinyal, tüm zaman alanında sabit değildir. Alınan sinyalin kısa süreli stabilite özelliklerinden yararlanılarak, çerçevelenmiş sinyal, kısa süreli Fourier dönüşümü yoluyla analiz için zaman-frekans alanına dönüştürülür. Sinyal çerçeveleri arasındaki frekans kesme etkisini azaltmak için alınan sinyali çerçevelemek için N uzunluğunda bir Haining penceresi h (n) seçin. Sinyal çerçeveleri arasındaki adım uzunluğunun N örnekleme aralığı olduğu varsayıldığında, alınan sinyalin ilk çerçevesi ym (lN + n) olarak ifade edilir ve Fourier dönüşümü sonucu:

2 Kesikli değer frekans noktası ağırlıklı GCC-PHAT algoritması

2.1 Ayrık frekans noktası ağırlıkları

VALIN J M ve diğerleri tarafından önerilen frekans noktalarının sürekli ağırlıklarının hesaplanması, önceki sinyal-gürültü oranı (SNR) tahminine dayanmaktadır. K frekans noktasına karşılık gelen sürekli ağırlık:

Nerede

MCRA algoritması ile elde edilen gürültü güç spektrumu tahminidir.

Sürekli ağırlık, sinyal-gürültü oranı hakkında tekdüze bir fonksiyondur ve değer aralığı yumuşak maske ile temsil edilir ve değer Şekil 1'de gösterilir.

Frekans noktalarının sürekli ağırlığının hesaplanması, gürültü gücü spektrumunun tahminine ve sinyalin bitişik çerçeveleri arasındaki sinyal-gürültü değerinin sürekliliğine bağlıdır. Rüzgar gürültüsü ile ses sinyali anlık güç değişim eğrisinin zaman içinde karşılaştırılmasıyla rüzgar gürültüsü zaman alanı değişim özelliklerinin ses sinyalinden daha güçlü olduğu görülebilir. Mevcut konuşma geliştirme algoritmalarının tümü, gürültünün konuşmadan daha yavaş değiştiğini varsayar, bu nedenle rüzgar gürültüsü içeren sinyaller için, yukarıdaki yöntem önceden bir SNR elde edemez. Ve sürekli ağırlık değeri, ses kaynağı sinyalinin gürültüden ciddi şekilde etkilendiği zamandır (SNR < 0) olduğunda, sinyal frekansının karşılık gelen ağırlığı sıfırdan büyüktür ve sinyal, ağırlıklandırmadan sonra gürültü bileşenlerini hala muhafaza eder, bu da nihai TDOA tahmininde bir hataya yol açar. Mevcut frekans noktası ağırlıklandırma yöntemine dayanan bu makale, frekans noktası ayrık ağırlıklarını kullanan bir rüzgar gürültüsü bastırma algoritması önermektedir. Yeni ağırlık, sinyal frekansı tutarlılık değerinin bir fonksiyonudur, gürültü tahminine dayanmaz ve yalnızca TDOA tahmin sonucundaki gürültülü frekans noktalarının parazitini tamamen ortadan kaldıran 0 ve 1 ayrık değerlerini alır. Yeni ağırlık

Rüzgar maskesi ile ifade edilir.

Rüzgar gürültüsü, mikrofon yüzeyindeki türbülans tarafından üretilir ve farklı mikrofonlar arasındaki rüzgar gürültüsünün frekansı tutarlı değildir. Ancak aynı ses kaynağı sinyali için, dizideki mikrofonların alınan sinyalleri her frekans noktasında yüksek tutarlılığa sahiptir. Sinyalin her bir frekans noktası arasındaki tutarlılığı ölçmek için Büyüklük Karesi Tutarlılığını (MSC) tanıtın:

Formülde, Pm1m2, Pm1m1, Pm2m2, sırasıyla mikrofon m1 ve m2 sinyallerinin çapraz güç spektral yoğunluğu ve kendi kendine güç spektral yoğunluğudur.

MSC değeri, k frekansındaki farklı sinyallerin tutarlılık derecesini yansıtır. Şekil 2'de gösterildiği gibi, yakın alan sabit ses kaynağının iki sinyali için MSC değeri, sinyalin frekans aralığı içinde yaklaşık 1 iken, rüzgar gürültüsünün olduğu düşük frekans alanında, MSC değeri her zaman 0 civarında dağıtılır. Şekil 3, rüzgar gürültüsü içeren bir çerçeve sinyali MSC'nin değerini gösterir. Rüzgar gürültüsünün olduğu düşük frekans aralığında, sinyalin her frekans noktasında 0MSC1 ve ne kadar fazla gürültü bileşeni dahil edilirse, MSC'nin değeri o kadar küçük olur. Rüzgar gürültüsünün frekans aralığı dışındaki sinyalin her frekans noktası MSC 1'e yakındır. Ancak arka plan gürültüsü de tutarlılığa sahiptir ve MSC değeri formül (8) 'i karşılar; burada dm1m2, mikrofonlar arasındaki mesafedir. Bu nedenle, rüzgar gürültüsü girişimini ortadan kaldırmak için tutarlı farkı kullanmadan önce arka plan gürültüsünü önceden ortadan kaldırmak gerekir.

Farklı sinyal türleri analiz edildiğinde, gürültü paraziti olmayan yalnızca yakın alan kararlı bir ses kaynağı sinyali olduğu ve her frekans noktası arasındaki MSC değerinin her zaman 1'e yakın olduğu bulunmuştur. Kalan sinyal frekansı noktaları MSC dahildir. Bu nedenle, sinyaller arasındaki frekans noktalarının tutarlılık değeri gürültüyü tespit etmek için kullanılabilir ve ağırlıklandırma yöntemi ile sadece sinyaldeki bozulmamış frekans noktaları korunabilir. Yukarıdaki sonucun matematiksel ifadesi formül (9) 'da gösterilmektedir, burada wind tutarlılık değeri eşiğidir.

Tek bir sinyale dayalı sürekli frekans noktası ağırlık hesaplamasından farklı olarak, yeni ağırlık hesaplaması aynı anda iki sinyale dayanır, daha sonra formül (3) şu şekilde ifade edilebilir:

2.2 Önceden geliştirilmiş sinyal

MCRA algoritması, düşük sinyal-gürültü ve sessiz segmentlerde sinyal aktivitesi tespit yönteminin yüksek yanlış tespit oranının neden olduğu yanlış tahminden kaçınır. Bununla birlikte, MCRA algoritması, sabit uzunluklu bir zaman penceresi içinde frekans bandının güç spektrumunun minimum değerini arar ve gürültü tahmininde bir gecikmeye neden olur. Bu makale, tahmin hızını iyileştirmek için sürekli zaman alanındaki minimum akım güç spektrumu için bir arama yöntemi önermektedir. Güç spektrumunun minimum değerini aramadan önce, düzgün bir güç spektrumu değeri elde etmek için zaman alanında aşağıdaki yinelemeli düzleştirmeyi gerçekleştirin:

Gürültünün önceki olasılık oranı monoton bir fonksiyon olduğundan, Bayes minimum risk maliyeti karar kriterine göre, MCRA algoritması, frekans noktasının sinyal bileşenleri içerip içermediğini belirlemek için sabit bir eşik ile karşılaştırmak için sinyal güç spektrumunun yerel minimum değerine oranını (Sr (l, k) kullanır. Sinyalin var olma olasılığını hesaplayın. Bununla birlikte, sabit eşik yalnızca durağan gürültü durumunda geçerlidir ve sabit olmayan gürültü içeren durumun kararına duyarlı değildir. Sinyal frekansı dağılım özelliklerine göre: rüzgar gürültüsü orta ve düşük frekans bölgelerinde dağıtılır ve orta ve yüksek frekanslar, arka plan gürültüsü içeren ses kaynağı sinyalleridir.Yeni algoritma aşağıdaki bölümlü eşiği seçer (k):

2.3 Algoritma hesaplama yük analizi

Mobil cihazların bilgi işlem kaynakları sınırlıdır ve gerçek zamanlı algoritmalar gerektirir, bu nedenle algoritma hesaplamalarının miktarı dikkate alınmalıdır. M mikrofon içeren bir dizi için, frekans noktası ağırlıklı GCC-PHAT algoritması TDOA'yı tahmin etmek için kullanılır ve sinyalin çerçeve başına M FFT ve M (M-1) / 2 IFFT işlemi gerçekleştirmesi gerekir. Analizi basitleştirmek için, Fourier dönüşümü ve ters dönüşümün aynı hesaplama miktarını varsayarak, M mikrofon dizisinin tahmini TDOA hesaplama miktarı (M2 + M) / 2 hesaplamaları olarak kaydedilir ve karmaşıklık O (M2) olarak kaydedilir. Ortadaki mikrofon sayısı artmış, algoritma hesaplamaları miktarı da hızla artmıştır.

3 Deneysel sonuçların analizi ve karşılaştırılması

3.1 Deneysel parametreler

Bu bölüm, farklı test koşulları altında farklı frekans noktası ağırlıklı GCC-PHAT algoritmasının performansını karşılaştıracaktır. Tablo 1, algoritmanın karşılık gelen parametrelerini göstermektedir. Alınan sinyalin tüm frekans bileşenlerinin zaman-frekans dönüşümünden sonra elde edilmesini sağlamak için fs 48000 Hz olarak ayarlanır; alınan sinyalin her çerçevesinde bulunan örnekleme noktalarının sayısı N 20 ms ila 30 ms sinyal süresine karşılık gelir ve pencere dizisi aynı uzunluğa ayarlanır; kararlı bir sinyali korumak için Çerçeveler arasındaki süreklilik için, çerçeve adımını N = N / 2, yani çerçeveler arasında% 50 örtüşme olarak ayarlayın; c, 20 ve 101.1 kPa koşullarında ses hızıdır; , pratik uygulamada Çin formülünün (11) sonucunun taşmasını önlemek için 0'a yakın bir ondalık sayıdır Yargı eşikleri wind, D, min birçok deneyin sonucuna göre belirlenir. Tablo 1'deki parametrelere göre, algoritma bir l · N / fs = 32 ms gecikmesi sunar. İnsan-makine ses etkileşiminde, bu büyüklükteki zaman gecikmesi göz ardı edilebilir.

IMAGE yöntemine dayalı olarak, 10 m × 8 m × 3,5 m boyutlarında yankılanan bir oda modelinin dürtü yanıt dizisi hesaplanır. Hedef ses kaynağı sinyali olarak 7 s'lik bir konuşma seçin ve sinyalin yankılanma etkisini simüle etmek için dürtü dizisini dönüştürün. Şu anda, deneyler yoluyla toplanması gereken karşılık gelen rüzgar gürültüsü sinyalini sağlayacak bir külliyat yoktur. Sinyal alımı, bir çift eşleştirilmiş çok yönlü Beyerdynamic MM1 mikrofon kullanır ve simüle edilmiş hava akışı bir hava kompresörü tarafından oluşturulur. Koordinatların başlangıç noktası olarak odanın bir köşesine sahip dikdörtgen bir koordinat sistemi oluşturulmuştur.Ses kaynağı ve mikrofon konumları Tablo 2'de gösterilmiştir. i, j ve k, x, y ve z ekseni birim vektörleridir.

3.2 Algoritma performans göstergeleri

3.3 Sonuç analizi

Şekil 5 ve 6 sırasıyla yankılanan ortamdaki (RT60 = 200 ms) gürültülü (SNR = 5 dB) sinyalin spektrogramını ve farklı frekans noktası ağırlıklandırma yöntemlerinin ağırlık dağılımını göstermektedir. Şekil 5 (a), rüzgar gürültüsünün sinyalin düşük frekans alanında yoğunlaştığını ve zamanla hızla değiştiğini göstermektedir. MCRA algoritması rüzgar gürültüsünü doğru bir şekilde tahmin edemez Bu nedenle, Şekil 5 (b) 'deki orta frekans noktasının sürekli ağırlık değeri düşük frekans bölgesinde 1'e yakındır ve rüzgar gürültüsü frekans noktası için herhangi bir zayıflama yoktur.Gürültü sinyali frekans noktası korelasyon değeri hesaplamasına getirilir. Şekil 6 (a) 'daki gürültü gücü spektrum tahmin eğrisi, sabit gürültü için, frekans bandındaki sinyal gücünün minimum zayıflaması genellikle gürültü gücü değerine yakın olduğundan, minimum istatistiklere dayalı algoritmanın sabit arka plan gürültüsünün ortadan kaldırılmasında etkili olduğunu göstermektedir. Ancak hızlı değişen gürültü için, algoritma tasarım temeli, tahmini değerin gecikeceğini belirler ve geliştirilmiş sinyal hala rüzgar gürültüsü içerir. Aynı zamanda, sinyal geliştirme yönteminin rüzgar gürültüsü girişimini ortadan kaldıramadığını da göstermektedir. Bu yazıda önerilen algoritmanın karşılık gelen ağırlık dağılımı Şekil 6 (b) 'de gösterilmiş olup, sinyalin düşük frekans aralığında (ağırlık 0'dır) karışan frekans noktalarını yargılar ve doğrudan kaldırır ve sadece güçlü tutarlılık frekans noktaları (ağırlık 1'dir) korunur. Rüzgar gürültüsü frekans aralığının dışında kalan orta ve yüksek frekans bölgelerindeki sinyal frekans noktaları, mümkün olduğu kadar korunur ve korelasyon değerinin hesaplanmasına dahil edilir.

Şekil 7, yukarıdaki deney koşullarında farklı ağırlıklarla GCC-PHAT algoritmasını kullanan TDOA tahmin sonuçlarının istatistiklerini göstermektedir. Deneysel sonuçlar, GCC-PHAT algoritmasının tahmin edilen değerlerinin ağırlıklandırılmadan ve sürekli ağırlıklar kullanmadan istatistiksel zirvelerinin hem c'de (Gecikme = -3) olduğunu ve karşılık gelen konumdaki ses kaynağının mikrofon yüzeyindeki türbülans olduğunu göstermektedir. Sadece rüzgar maskesi ağırlıkları ile ağırlıklandırılan GCC-PHAT algoritmasının tahmin sonuçları t (Gecikme = -18) civarında yoğunlaşır ve ilgili pozisyon, uygulama gereksinimlerini karşılayan hedef ses kaynağıdır.

Tablo 3, farklı yankılanma ve sinyal-gürültü oranı test koşulları altında farklı frekans ağırlıklı GCC-PHAT algoritması tarafından tahmin edilen TDOA sonuçlarının güvenilirliğinin (Tpq) ve hesaplama yükünün (Lpq) karşılaştırılmasını göstermektedir. Gerçek senaryolarda, rüzgar gürültüsü oluşturmanın özel yolu, sinyale ciddi parazite neden olması gerektiğini belirler. Örneğin, düşük yankılanma (RT60 = 0) ve düşük sinyal gürültüsü (SNR = 0 dB) ortamında, rüzgar maskesi ağırlıklandırma algoritmasının tahmini sonucu, sürekli ağırlık (% 31,2) ve ağırlıksız (% 31,2) kullanmaktan daha iyi olan Tpq =% 54,2'ye karşılık gelir. % 20.1) GCC-PHAT algoritması. Yankılanmalı düşük sinyal gürültülü bir ortamda (RT60 = 200 ms, SNR = 0 dB), rüzgar maskesi ağırlıklı algoritmanın sonucu, diğer ağırlıklandırma algoritmalarından hala daha iyi olan% 48.6'ya Tpq düşüşüne karşılık gelir. Yeni ağırlıklandırma algoritması, yankılanma durumunda hesaplama miktarını artırmasına rağmen, mevcut diğer algoritmalardan önemli ölçüde daha düşüktür. Deneyler, rüzgar gürültüsü paraziti varlığında, bu makalede önerilen algoritma kullanılarak elde edilen sonuçların daha güvenilir olduğunu ve hesaplama miktarının daha az olduğunu kanıtlamıştır.

4 sonuç olarak

GCC-PHAT algoritması aracılığıyla TDOA değerinin hüzmeleme algoritmasına tahmin edilmesi, ses kaynağının yerini tespit etmek için yaygın bir yöntemdir. Bu makale, mevcut GCC-PHAT algoritmasının rüzgar gürültüsü girişim problemini neden ortadan kaldıramayacağını analiz etmekte ve hedef sinyalin ve gürültü sinyalinin zaman-frekans özelliklerini inceleyerek, sinyaller arasındaki frekans tutarlılığındaki farka dayalı olarak GCC ağırlıklı bir frekans ayrık değeri önermektedir. PHAT algoritması. Deneyler, sinyal-gürültü oranı tahminine dayanan sürekli değer frekans noktası ağırlıklandırma algoritması ile karşılaştırıldığında, bu makalede önerilen yöntemin sonuçlarının doğru ve güvenilir olduğunu, küçük bir hesaplama miktarıyla ve belirli mühendislik pratik değerine sahip olduğunu göstermektedir.

Neden Orta Doğulu petrol tiranları ile uzaya yatırım yapmalıyız?
önceki
VR bu hafta şunları söyledi: AR / VR başlığı Q3 sevkiyatları yıldan yıla arttı ve Tesla, otomobil yapımına yardımcı olmak için AR kullandı
Sonraki
Zhang Xuanrui, Selina'nın hayvanat bahçesini ziyaret etmek için bir çift broşunu takmasına yardım etti, süper tatlı
Bu, "Zırhlı Çekirdek" in ruhani devamıdır! "Devil X Mecha" nın yaratıcısı ile röportaj
JD Big Data: 2018'de vefat eden büyük kahveler arasında klasiklerini kimler okuyor?
Başka bir popüler model grubu, önce 8 tane sipariş edeceğim
Zhou Xun, baharın kapağının ışık ve gölgede bir rüya gibi olduğunu ortaya koydu
Rüzgar Gürültüsünü Bastırmak için Frekans Ayrık Değer Ağırlıklı GCC-PHAT Zaman Gecikmesi Tahmin Algoritması
"Sirk Kralı" Karakter posterinin hayalet versiyonu ortaya çıktı, Hugh Amca en güzel ekran gösterisinin yaratılmasına öncülük ediyor
AP düzen optimizasyonu ve K-ortalama kümeleme algoritmasına dayalı iç mekan konumlandırma araştırması
Gişe sekiz gündür güçlü, ülkede ilk "Gizli Savaş"
Her Şeyin İnterneti STMicroelectronics STM32 sınırsız olanaklar sunar
"Sektör İncelemesi" Yerel RF endüstrisinin statükosu: denizaşırı devlerle açık bir boşluk
Liu Zuohu, OnePlus'ın son beş yılına geri dönüyor: Dünya çapında tanınırlık kazanmak için ürün itibarına güvenmek
To Top