動態(tài)提高回聲與噪聲消除性能解決方案
移動手持終端、無線網絡、免提設備及其它移動通信系統(tǒng)的語音質量是建立消費者偏好的關鍵因素?;芈暫驮肼暿菬o線通信固有的毛病。我們需要信號處理技術來解決語音質量問題,確保提供能被市場接受的高質量音頻輸出。傳統(tǒng)方法是在近端或傳輸路徑上采用獨立的回聲和噪聲消除模塊,這種方法在周邊條件不變的情況下表現出色,但如果周圍環(huán)境發(fā)生了變化,如出現開門或較大的噪聲,那么音頻系統(tǒng)會很難適應變化,且音頻性能也會下降。
本文引用地址:http://m.butianyuan.cn/article/201706/351177.htm新方法則集回聲消除、噪聲抑制及其它音響增強技術于一體,能夠根據環(huán)境變化更快地動態(tài)調節(jié)系統(tǒng)參數。在大多數情況下,消費者還沒發(fā)現音質出現問題之前,我們就能完成調節(jié)。同樣,這種新方法實現了更高的集成度,能解決較大的噪聲和回聲問題,從而能夠實現聽起來非常自然的全雙工語音通話。
回聲和噪聲消除技術的巨大進步來得非常及時,因為美國許多州都制定了相關法規(guī),全面或部分地禁止駕駛人員在駕車時手握移動電話通話。歐洲大多數國家及全球許多其它國家也都已經有了相關的法規(guī)。上述法規(guī)的出現,進一步提高了免提技術的需求,并要求能在汽車內部環(huán)境中有效消除噪聲及回聲,這也是免提系統(tǒng)的最大設計挑戰(zhàn)所在。設計人員需要簡單易用的軟硬件,以便能夠為免提音頻產品提供與傳統(tǒng)手持產品一樣的音質,這樣才能滿足用戶的需求。
無線通信中的回聲來源
無線系統(tǒng)中的回聲有兩大來源:電氣回聲和聲學回聲。如果設計方案不佳,導致揚聲器信號直接耦合到擴音器信號,那么就會出現電氣回聲。這一問題的最佳解決方案就是做好設計工作。
對我們提出更嚴峻挑戰(zhàn)的問題在于聲學回聲。如果放大后的揚聲器信號通過擴音器發(fā)生回聲,那么就會出現聲學回聲。消除這種回聲相當困難,我們必須考慮到多個因素。放大后的揚聲器聲音會在不同時間在多個通道上反射。這種間接的回聲明顯滯后于原始信號,這是因為聲音在空氣中的傳播速度僅為300米/秒,而且由于機械振動加大了復雜性,回聲反射也會失真。
半雙工交換技術
圖1:半雙工解決方案
解決回聲問題的最基本方法就是在檢測到遠端語音時禁用近端語音通道,這雖然能消除聲學回聲,但每次只允許一個人說話。舉例來說,就傳統(tǒng)的對講機而言,按下通話按鈕,就不能聽到其它在線人說的話了,因此雙向無線電通話規(guī)則中要求說話人講完話時必須明確表示“完畢”。后來又有新技術用語音活動檢測器 (VAD) 取代了通話按鈕,它能在檢測到遠端語音時自動開/關近端語音通道。在移動通信初期階段,我們尚能接受這種有局限性的技術,但隨著用戶逐漸習慣于全雙工有線通話,他們今后不再接受這種限制性的單向通話技術。因為全雙工有線通話技術使他們能夠隨意交流,表達想法,同意或不同意對方的觀點,隨時停頓,不用擔心擴音器突然不能使用。
圖2:傳統(tǒng)回聲消除技術
下 面我們將講述為什么幾乎所有手機、免提設備以及帶擴音器的電話均提供某種回聲消除技術。目前,幾乎所有設備都通過監(jiān)控遠端信號,然后從接收信號中去除遠端信號這一基本方法來消除回聲。如果回聲量已知且保持不變,那么上述方法就很容易實現回聲消除。但實際上回聲幅度及時間取決于無線設備使用的環(huán)境,而這一環(huán)境經常會發(fā)生變化,為此傳統(tǒng)回聲消除技術需要持續(xù)監(jiān)控近端及遠端信號。聲學回聲消除器算法用近端揚聲器的參考信號來估算回聲通道,并從近端擴音器信號中去除回聲。
自適應濾波器的設計與調節(jié)是回聲消除性能的決定性因素。濾波器通常使用音頻信號已知的特性來計算回聲估值,并就此調節(jié)濾波器的參數,以盡可能減小誤差。我們通常用歸一化最小均方 (NLMS) 算法來更新濾波器系數,以此來消除回聲。該算法可最小化消除器的均方誤差,該誤差為殘余回聲。自適應通常根據信號功率加以歸一,以獨立于信號電平。
我們在大多數情況下都能以足夠的準確度進行上述計算,以降低可感覺到的回聲。問題在于,算法能否發(fā)揮作用,取決于揚聲器與擴音器之間的回聲路徑的穩(wěn)定性。只要電話附近出現阻礙聲音傳遞的物體(比方說把手里的電話放到桌面上,觸摸鍵區(qū),把紙張蓋在揚聲器上),或當擴音器到揚聲器的距離變動時(帶線話筒放回原位),回聲路徑就會發(fā)生變化。當路徑變化時,算法就要根據新的回聲路徑進行調整,這就會出現延遲。在自適應延遲過程中,回聲就會在近端信號路徑上傳輸。
在設計回聲消除器時,了解這種器件的工作環(huán)境十分重要。擴音器與揚聲器是否處于固定位置?位置變動是否會對正常工作產生影響?器件工作環(huán)境允許的最長回聲路徑是多少?預計噪聲有多大?噪聲是否會發(fā)生變化(比如在汽車環(huán)境中)?設備音量應有多大?揚聲器與擴音器間的回聲返回損耗多大?近端通話人的講話音量與擴音器端的回聲相比應有多大?只有回答了上述問題,才能設計出可根據已知環(huán)境進行調整的最佳傳統(tǒng)回聲消除器。不過,當環(huán)境改變時,濾波器系數還在適應新的回聲通道,我們就已經聽到回聲了。根據初始參數設置的不同,適應過程需要 5 到 10 秒的時間。
除了回聲影響近端信號質量的問題外,背景噪聲也會造成不良影響。針對這一問題的解決方案就是采用噪聲消除器。典型的噪聲消除器獨立于回聲消除器工作,任何干擾問題都可忽略不計。與回聲消除器不同,噪聲消除器沒有參考信號作為依據。它必須對噪聲進行估測,并將其從揚聲器信號中消除,要么就只能估測語音。不管怎么說,上述兩種情況下都應瞄準噪聲,以盡可能提高性能。結合使用噪聲消除器與 AEC 的控制信號,我們能實現更準確的語音活動檢測環(huán)境,提高整合效果。如果沒有上述相互作用,系統(tǒng)可能會把語音信號當作噪聲而誤消除。
圖3:新方法將回聲與噪聲消除與其它音頻處理技術相集成
為了解決傳統(tǒng)技術的局限性,我們開發(fā)出一種可提高無線音頻質量的新方法(如圖 3 所示)。新老方法的基本差異在于:新方法將回聲消除、噪聲消除與其它音頻信號處理功能相集成,統(tǒng)一由新型全雙工控制模塊來控制。這種方法采用同一核心 NLMS 算法,不過擁有一些專門特性,這不僅能夠充分發(fā)揮這種集成型方法特有的系統(tǒng)技術廣度優(yōu)勢,還能動態(tài)調節(jié)系統(tǒng)參數,以便加速 NLMS 的重新整合。
全雙工控制技術是新方法能夠提高性能的關鍵所在。通過將無線通信設備的音頻部分與最新數字信號處理技術相結合,就能采用非線性控制算法,就突發(fā)的環(huán)境變化做出調整,如背景中的關門聲或用戶拿電話的手突然做出什么手勢或動作等。由于在主控制器下同時優(yōu)化了不同控制算法,從而進一步提高了音質。最后,由于采用了更強大的信號處理架構,因此我們還能添加新功能,如在背景中填充自然發(fā)聲的舒適噪聲以補償噪聲背景的改變,避免出現噪聲抽送 (noise pumping)。
將近端與遠端音頻路徑所有關鍵元件的系統(tǒng)處理技術加以整合,進而優(yōu)化通話兩端的信號質量,這對前代 DSP 來說是非常困難的。近期推出的 DSP 在性能與高級片上存儲器容量間實現了適當平衡,其算法的復雜程度與音頻處理的集成度都足以適應不同音頻元件快速優(yōu)化的要求,有助于實現最佳無線話音質量。
新方法的工作原理
新方法用整個系統(tǒng)來了解當前工作環(huán)境的情況,并動態(tài)調節(jié)系統(tǒng)參數以獲得最佳性能。分析與參數調節(jié)是集成式全雙工控制的任務。全雙工控制技術可評估近端與遠端信號,首先確定信號目前是否處于工作狀態(tài),然后從不同角度評估信號質量。根據上述信息,全雙工控制機制將對各模塊進行全面的動態(tài)調節(jié),以提高近端與遠端信號的質量。
近端信號通道上的全雙工控制機制控制著非線性處理器、回聲消除器以及噪聲消除器的參數,以降低回聲和噪聲。遠端信號路徑上的全雙工控制機制控制著動態(tài)處理機制,調節(jié)音頻信號,在降低揚聲器非線性的同時提高音量輸出。兩個信號路徑上都采用圖形均衡器與音質增強技術。圖形均衡器用于調節(jié)變送器(揚聲器與擴音器),也可用于調節(jié)音頻信號的頻率特性。音質增強技術則用于調節(jié)音質,以實現最佳的話音清晰度。
使用這種系統(tǒng)技術的特點在于,全雙工控制技術采用系統(tǒng)了解到的環(huán)境信息實現了更高音量與更低回聲,并能快速適應不斷變化的環(huán)境。
設計新型音頻處理系統(tǒng)
新型音頻處理系統(tǒng)的集成度大幅提高,這給我們提出了一系列設計挑戰(zhàn)。首先,我們應找到一種適當的 DSP,在為新設計提供所需高性能的同時,提供適當的編程環(huán)境,以支持復雜度較傳統(tǒng)回聲與噪聲消除技術高得多的設計,從而能夠縮短移動通信系統(tǒng)的設計周期。
例如,德州儀器 (TI) 的 C5000 DSP 平臺就實現了處理性能與大容量片上存儲器的優(yōu)化組合,有助于降低片外存儲器的工作強度,減少處理器的負擔。架構的選擇是非常重要的,該架構不僅要針對音頻處理進行優(yōu)化,而且要包含豐富的器件,從而實現領先節(jié)電特性、豐富外設選擇與小型封裝的完美結合。TI 擁有廣泛的第三方開發(fā)商網絡,可提供多樣化的產品,有助于 OEM 與 ODM 廠商添加 MP3 與 WMA 文件的音頻流、藍牙、話音識別、電話簿下載等特性。
開發(fā)工作采用基于模型的設計方法,能就多個設備的復雜聲音行為進行建模,并就設備環(huán)境生成測試矢量。我們用 MathWorks 的 Simulink來設計與開發(fā)有關模型。設計人員可用 C 代碼創(chuàng)建自主算法模塊,并集成到仿真環(huán)境中用于測試。
工程師只需編寫相應腳本,描述典型工作情況,即可利用軟件提供的模型仿真回聲與噪聲消除系統(tǒng)的性能。這種方法使我們能評估多種設計方案,進一步了解性能,同時還能節(jié)省設計時間與成本。設計人員能快速修改模型,觀察性能變化,從而快速優(yōu)化設計方案,實現最佳音頻性能。
工程師對系統(tǒng)仿真結果感到滿意后,就能針對 TMS320C5000? DSP 平臺生成 C 語言二進制代碼。我們用 Code Composer Studio? 集成式開發(fā)環(huán)境能很方便地創(chuàng)建二進制對象代碼,在對二進制影像進行測試同時,對其源代碼進行調試,從而幫助工程師方便地調試設計方案。建模技術與 Code Composer Studio 目標支持相結合使工程師能在實際硬件上用仿真輸入來驗證設計方案的性能有效性。隨后,他們還能用獨立于仿真模型的實時音頻輸入輸出來做進一步微調,在評估中對代碼作進一步優(yōu)化。
回聲消除和噪聲消除能否實現最佳性能,取決于系統(tǒng)解決方案能否動態(tài)適應于不斷變化的環(huán)境。系統(tǒng)參數的動態(tài)調節(jié)應快速響應于環(huán)境的變化,避免間歇性回聲和噪聲干擾電流生成技術。只有采用良好的建模環(huán)境,才能做好上述解決方案的測試工作。成功的終端產品的關鍵在于選擇適當的 DSP 技術,不僅要提供強大的信號處理功能,還要提供開發(fā)基礎局端,以確保在一定時間內適時向市場投放產品。
評論