利用麥克風(fēng)數(shù)組抑制背景噪聲
當(dāng)距離“x” 增加一倍時,兩條曲線的SPL均下降6dB 。圖1距離聲源200公分,而圖2則是距離聲源50公分的局部放大圖,從圖中可見聲音壓力會因與聲源距離的增加而急速下降,即使距離很短的情況下也一樣。例如,當(dāng)與聲源的距離為10公分時,SPL便減少了20 dB,即由96dB下降到約76dB。
近場對遠(yuǎn)場聲音
聲源的近場是指該位置處于相關(guān)最低頻信號的一個波長范圍之內(nèi)。假設(shè)相關(guān)語音的最低頻為300Hz,如此波長λ便等于c/f 或 331.1/300 ,又或是 1.104 米,其中c代表聲波于零度攝氏下的水平速度。當(dāng)頻率為3500Hz時,λ便等于c/f或 331.1/3500,又或是 0.0946米 (9.46公分)。因此,語音信號的典型近場范圍即由聲源距離約9.5公分到1.1米。
超過1米的距離,語音信號便會被考慮成語音聲源的遠(yuǎn)場。對于麥克風(fēng)間隔較近的數(shù)組,近場聲源會呈現(xiàn)出一個圓球狀的波陣面,并擁有很強(qiáng)的信號振幅、壓力梯度,以及對應(yīng)數(shù)組中各麥克風(fēng)與聲源之間的距離而出現(xiàn)的頻率相關(guān)差別。
現(xiàn)在假設(shè)兩個麥克風(fēng)的間隔距離為3公分,而最接近聲源的一個麥克風(fēng),其與聲源的距離為5公分。圖2表示出第一個麥克風(fēng)(即最接近聲源的一個),其感受到一個SPL為82dB的音頻信號,而第二個麥克風(fēng)(即與聲源相距8公分)所感受到的信號為78dB SPL。即使兩者間只有4 dB的差別,但相對于整體的信號級,這差別仍相當(dāng)大。
從頻譜含量的角度看,麥克風(fēng)數(shù)組內(nèi)的所有近場語音信號均關(guān)系密切。與最接近聲源的麥克風(fēng)比較,與聲源距離最遠(yuǎn)的麥克風(fēng)信號的振幅將會減少,并且會出現(xiàn)信號由最近麥克風(fēng)傳送到最遠(yuǎn)麥克風(fēng)的時間延遲。然而,要恢復(fù)該個案中的語音信號并不困難。
在麥克風(fēng)數(shù)組語音近場范圍以外的聲源將被看作是遠(yuǎn)場聲源,并對數(shù)組中排列緊密的麥克風(fēng)展現(xiàn)出實質(zhì)平面的波陣面。數(shù)組中每一個麥克風(fēng)均感受到幾乎一樣的聲波能量及隨機(jī)相位信號,但該些信號并沒有對應(yīng)關(guān)系,除非麥克風(fēng)之間的距離非常接近。假如這些信號與麥克風(fēng)的距離較遠(yuǎn),那麥克風(fēng)的絕對SPL值便會進(jìn)一步下降。
現(xiàn)舉出另一個例子,假若將相同的麥克風(fēng)數(shù)組放置到與聲源距離150公分(即1.5米)的位置,最近聲源的麥克風(fēng)的SPL值便會下降到52.5 dB,而距離聲源153公分的最遠(yuǎn)麥克風(fēng)的SPL值則稍微下降到52.3dB。雖然兩者僅有0.2dB的差距,但從聲源到最近麥克風(fēng)的整體信號級將出現(xiàn)30dB的下降。
麥克風(fēng)輸出之間的不同信號,在進(jìn)行了適當(dāng)?shù)奶幚砑盀V波后,可將遠(yuǎn)場噪聲消除,使兩個麥克風(fēng)的復(fù)合輸出及處理電路能提供高清晰度的語音信號。
聲音噪聲的特質(zhì)
這里的噪聲場可分為三種,分別是相干噪聲、非相干噪聲及擴(kuò)散噪聲。
相干噪聲是指當(dāng)聲波傳到麥克風(fēng)時,在該過程中沒有因環(huán)境中的障礙物而出現(xiàn)任何形式的反射、散射或衰減。
非相干噪聲是指某一位置的噪聲與其它位置的噪聲沒有任何關(guān)系,并且被看成空間白噪音。
擴(kuò)散噪聲是指擁有相同能量的噪聲同時軸射到所有方向。例子包括辦公室內(nèi)的噪音、機(jī)場候機(jī)樓及交通噪音等,換句話說就是指所有充滿噪音的環(huán)境。
這里所指的聲音噪聲有兩種,分別是穩(wěn)態(tài)噪聲及非穩(wěn)態(tài)噪聲。
穩(wěn)態(tài)噪聲是指噪聲的能量相對地穩(wěn)定,并具備已知及變化緩慢的頻譜含量,并且是可預(yù)知的。例子包括由引擎發(fā)出的噪音、空調(diào)風(fēng)扇、隨機(jī)或 “白” 噪音等等。噪聲抑制算法能有效抑制這類噪音。
非穩(wěn)態(tài)噪聲是指音量及聲音內(nèi)容會在短時間內(nèi)變化,例如高聲說話或叫喊、汽車經(jīng)過的聲音或拍手等,其發(fā)生是不可預(yù)知的。假若出現(xiàn)這類噪音,它們可能在被辨識及抑制前便會自動地消失掉,非穩(wěn)態(tài)噪聲一般都包含在穩(wěn)態(tài)噪聲之內(nèi)。
最麻煩的情況是當(dāng)噪聲源與語音信號擁有相同的出現(xiàn)時間、頻譜及相干特性,這種情況當(dāng)背景噪聲屬于非穩(wěn)態(tài),且旁邊有其它人說話時便會出現(xiàn),如在餐館和酒吧,車站及派對上等。
評論