新聞中心

EEPW首頁 > 模擬技術(shù) > 設(shè)計應用 > 利用高性能語音捕獲SoC提升語音辨識度

利用高性能語音捕獲SoC提升語音辨識度

作者: 時間:2011-04-15 來源:網(wǎng)絡(luò) 收藏

近年來,和筆記本電腦等移動/便攜設(shè)備市場持續(xù)快速發(fā)展。這些產(chǎn)品在不斷集成更多新功能以增強用戶體驗的同時,在基本語音通信功能的用戶體驗方面仍有充足提升空間,特別是在嘈雜環(huán)境下提升語音清晰度,同時保持語音自然逼真度。例如,用戶在擁擠的商業(yè)街區(qū)行走時,周圍環(huán)境中可能充斥著汽車喇叭、發(fā)動機轟鳴、建筑施工噪聲、嘈雜人群噪聲、腳步聲甚至是風噪等,此時用手機進行語音通話時,傳統(tǒng)技術(shù)難以提供清晰的語音通信效果。此外,制造商也在為新興的平板電腦等增加視頻通話功能。在利用這些移動/便攜設(shè)備用于電話會議時,周圍環(huán)境中同樣可能包括多種噪聲,如辦公室嘈雜人聲、周圍談話聲、電腦噪聲、筆劃噪聲及玻璃器皿碰擊聲等,要提供清晰的通話效果同樣不易。

在這些應用中,要降低或濾除環(huán)境噪聲,提升語音通信效果,可以采用不同的方法,如專門降噪麥克風、模擬電路降噪或數(shù)字電路降噪等(見表1)。這些方法各有其特點,相比較而言,采用數(shù)字電路降噪的方法靈活,聲學設(shè)計復雜度較低,且降噪效果優(yōu)越。當然,便攜設(shè)備設(shè)計人員除了要提供良好的降噪效果,還面臨著多種設(shè)計約束及挑戰(zhàn),如尺寸、能耗、物理聲學設(shè)計、音頻保真度及成本等。

利用高性能語音捕獲SoC提升智能手機及平板電腦等應用的語音辨識度[圖]

表1:不同降噪技術(shù)比較。

先進的雙麥克風實時自適應噪聲消減技術(shù)

安森美半導體最新推出了基于數(shù)字電路降噪技術(shù)的BelaSigna R261高性能系統(tǒng)級芯片()。該器件采用先進的雙麥克風噪聲消減技術(shù),能夠幫助設(shè)計提供優(yōu)異的噪聲消減效果(參見圖1)。這種先進的信號處理技術(shù)接受兩個麥克風的信號,能夠區(qū)分不同類型的信號,提取有效的語音信息并抑制環(huán)境噪聲,從而提升語音辨識度。

利用高性能語音捕獲SoC提升智能手機及平板電腦等應用的語音辨識度[圖]

圖1:BelaSigna R261采用先進的實時自適應噪聲消減算法。

BelaSigna R261在其集成的ROM存儲器中內(nèi)置了語音提取算法。這種算法利用一個或多個傳感器來提取波形傳播信號,而不需要預先知道聲源或傳感器位置。這種方案利用全局優(yōu)化準則,同時工作在頻域、時域和空域,對聲源的數(shù)量及傳感器的數(shù)量沒有限制,與信噪比(SNR)無關(guān),即在低SNR和高SNR環(huán)境下能夠同樣優(yōu)化地工作,非常適合于需要從不同噪聲域中提取有用語音信號的手機和便攜計算機等應用。

這種自適應噪聲抑制算法提供25 dB的噪聲抑制能力,能夠?qū)崟r地分離需要的語音與環(huán)境噪聲,適合于各種語音源和各種位置下的語音,同時能夠保證音質(zhì)自然(其它方案處理后聲音不自然、不飽滿),可以有效配合各種品質(zhì)的麥克風工作。

BelaSigna R261關(guān)鍵特性解析

BelaSigna R261是一款高性能的,集成了數(shù)字信號處理器(DSP)、穩(wěn)壓器、鎖相環(huán)(PLL)、電平轉(zhuǎn)換器及ROM存儲器,如此高的集成度與其它方案相比,能夠降低物料單(BOM)。如圖2所示,這器件支持雙麥克風直接輸入,噪聲消減算法內(nèi)置于集成的ROM存儲器中,基于DSP結(jié)構(gòu)的應用控制器提供高性能及超低能耗,提供雙通模擬輸出,并支持數(shù)字麥克風輸出。此外,內(nèi)置的電源管理模塊支持1.8 V至3.3 V的供電電壓,內(nèi)置的片上PLL提供多種頻率選擇,還提供I2C接口。

利用高性能語音捕獲SoC提升智能手機及平板電腦等應用的語音辨識度[圖]

圖2:BelaSigna R261 高性能功能架構(gòu)圖。

特別值得一提的是,BelaSigna R261采用的雙麥克風實時自適應噪聲消減算法提供兩種基本的算法模式,分別是遠距離拾音模式(算法模式0)和近距離拾音模式(算法模式1)。算法模式0針對遠距離拾音而優(yōu)化,可以拾取多達6米遠的語音,同時抑制噪聲,并支持360度全方位拾音,適合于筆記本電腦、免提電話/會議或手機免提通話模式。在這種模式下,即使用戶沒有對準麥克風,甚至是遠離麥克風,都能提供極佳的語音清晰度,從而增強用戶使用的自由度。算法模式1針對近距離拾音而優(yōu)化,這時用戶離麥克風極近(距離小于5厘米),即在近距離內(nèi)拾取語音,有效抑制各種環(huán)境噪聲,適用于手機、學習機、對講機等在強噪聲環(huán)境中工作的設(shè)備。

除了這兩種基本算法模式,BelaSigna R261還提供定制算法模式,幫助制造商滿足特定應用需求。這種算法模式支持特殊配置,并能夠通過外部EEPROM或I2C控制接口加載新的算法參數(shù)來調(diào)整。算法效果能夠根據(jù)特定應用、麥克風類型、位置及其它系統(tǒng)參數(shù)來優(yōu)化。

利用高性能語音捕獲SoC提升智能手機及平板電腦等應用的語音辨識度[圖]

表2:BelaSigna R261支持遠距離拾音、近距離拾音及定制等不同模式。

如上所述,BelaSigna R261提供高集成度,內(nèi)置自適應噪聲消減算法,能夠直接連接至數(shù)字麥克風接口或主芯片(基帶處理器)的麥克風輸入端。故除了支持多種拾音模式,這器件的另一項重要優(yōu)勢就是便于集成到設(shè)計之中,可將設(shè)計入選(design-in)所須的時間和工程工作減至最少,因為設(shè)計團隊不須開發(fā)或獲取算法,也不須設(shè)計復雜的支援及接口電路。

這器件也使關(guān)注成本的原設(shè)備制造商(OEM)能夠在設(shè)計中采用便宜的兩個(不一定匹配的)全向麥克風,令麥克風的布設(shè)更靈活,且生產(chǎn)線上不須調(diào)試麥克風,進一步節(jié)省時間及成本。這SoC采用極緊湊的5.3 mm2 WLCSP封裝(包括26球和30球兩種版本),占用的電路板空間比其它可選方案小得多,即使空間最受限的便攜消費電子產(chǎn)品外形因數(shù)也用得上。此外,這器件在3.3 V電壓時的電流消耗為15 mA,能耗極低。

BelaSigna R261應用設(shè)計要點

由于BelaSigna R261基于ROM的噪聲消減算法非常靈活,麥克風布局(物理聲學設(shè)計)就存在多種可能的選擇,但默認算法只有麥克風以下述方式布局時才能最優(yōu)工作:1)兩個麥克風面向用戶的嘴;2)兩個麥克風的中間點位于距離各個麥克風10至25 mm范圍內(nèi)。當然,使用定制模式時也能使用其它麥克風布局配置。

在電路設(shè)計方面,BelaSigna R261的設(shè)計針對的是在單個系統(tǒng)中同時支持數(shù)字及模擬處理。由于這種混合信號電路屬性,要維持高音頻保真度,審慎設(shè)計印制電路板(PCB)布線就至關(guān)重要。為了避免耦合噪聲進入音頻信號路徑,要使數(shù)字信號走線(trace)遠離模擬信號走線。為了避免電氣反饋耦合,還需要將輸入走線與輸出走線隔離。

在接地設(shè)計方面,接地層應該分為兩部分,分別是模擬接地層(VSSA)和數(shù)字接地層(VSSD)。這兩個接地層應當通過單個點(即星形連接點)連接在一起。星形連接點應當位于電源穩(wěn)壓器輸出端電容的接地端。當然,這些只是設(shè)計人員在應用BelaSigna R261設(shè)計時需要注意的部分問題。詳細的設(shè)計要點參見參考資料2。

總結(jié):

便攜設(shè)備音頻系統(tǒng)設(shè)計人員需要易于集成到其系統(tǒng)中的高性能語音捕獲方案,同時滿足其對尺寸、能耗及成本等方面的要求。安森美半導體身為應用于高能效電子產(chǎn)品的首要高性能硅方案供應商,以BelaSigna R261高性能語音捕獲SoC為設(shè)計人員提供簡便的選擇。這器件具備高集成度,內(nèi)置先進的自適應噪聲消減算法,支持多種語音拾取模式,使、對講機、筆記本及平板電腦等應用都能夠提供清晰舒適的語音通信,具有極高的設(shè)計靈活度,同時尺寸小、功耗低,便于選用低成本的麥克風,使各類便攜消費電子產(chǎn)品制造商都能大幅提升語音辨識度及客戶滿意度,并加快產(chǎn)品上市進程。



關(guān)鍵詞: 語音捕獲 SoC 智能手機

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉