新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 利用MEMS麥克風(fēng)陣列定位并識別音頻或語音信源的技

利用MEMS麥克風(fēng)陣列定位并識別音頻或語音信源的技

作者: 時間:2016-09-12 來源:網(wǎng)絡(luò) 收藏

麥克風(fēng)陣列通過RJ45以太風(fēng)接口或USB OTG FS接口連接其它器件,與其它器件交互是通過可控制基本板設(shè)置的DIP開關(guān)實(shí)現(xiàn)。

如下圖所示,每個麥克風(fēng)都是由同一個時鐘源觸發(fā),時鐘源由專用振蕩器驅(qū)動,對每個GPIO端口的一個引腳輸出1位PDM 高頻信號。輸出PDM數(shù)據(jù)頻率與輸入時鐘同步,因此,DMA控制器以同一頻率即音頻捕捉頻率對GPIO端口進(jìn)行讀操作,然后將1 ms音頻數(shù)據(jù)(每次)保存在存儲器緩沖電路。這時,該緩沖器包含麥克風(fēng)交叉信號,然后軟件利用優(yōu)化的快速解碼函數(shù)對數(shù)據(jù)進(jìn)行解復(fù)用處理。最后,PDM 數(shù)據(jù)通過數(shù)字信號處理環(huán)節(jié),再進(jìn)行PDM轉(zhuǎn)PCM處理。

圖 5.每個麥克風(fēng)都是由同一個時鐘源觸發(fā),時鐘源由專用振蕩器驅(qū)動,對每個GPIO端口的一個引腳輸出1位PDM 高頻信號

麥克風(fēng)傳來的PDM信號經(jīng)過過濾和十分之一降采樣率處理,以取得所需頻率和分辨率的信號。麥克風(fēng)輸出的PDM數(shù)據(jù)頻率(麥克風(fēng)的輸入時鐘)必須是系統(tǒng)最終音頻輸出的倍數(shù),濾波器管道輸出是一個16位值,我們將 [-32768, 32767]視為一個單位增益(0 dB)的輸出范圍。

原先濾波管道產(chǎn)生的數(shù)字音頻信號在信號調(diào)理前被進(jìn)一步處理。管道第一級是一個高通濾波器,主要用于除掉信號DC失調(diào)。為保護(hù)信號質(zhì)量,該濾波級是使用一個截止頻率不在可聽頻率范圍內(nèi)的 IIR濾波器,管道第二級是一個基于IIR濾波器的低通濾波器。兩個濾波器有啟用和禁用以及配置功能;可通過外部整數(shù)變量控制增益。

如上文所述,數(shù)據(jù)采集有兩個比特流解決方案,通過DP開關(guān)選擇使用哪一個方案。當(dāng)選用 USB且在主機(jī)USB插入麥克風(fēng)陣列時,主機(jī)將STM32__Microphones視為一個標(biāo)準(zhǔn)的USB音頻設(shè)備。因此,主機(jī)系統(tǒng)無需安裝驅(qū)動軟件。例如, STM32_MEMS_Microphones可直接連接第三方PC音頻采集軟件。當(dāng)選用以太網(wǎng)時,STM32_MEMS_Microphones發(fā)送 RTP數(shù)據(jù)包。在網(wǎng)絡(luò)服務(wù)器的以太網(wǎng)設(shè)置頁對目的地IP、設(shè)備單播地址和采集參數(shù)進(jìn)行配置。

4.結(jié)論

音源定位識別是技術(shù)中的一個重要的語音預(yù)處理環(huán)節(jié),對提高音頻應(yīng)用和聲控應(yīng)用性能具有重要意義。音源定位主要用于自動、音頻模式識別、說話人發(fā)現(xiàn)及識別。MEMS技術(shù)的問世讓麥克風(fēng)陣列能夠嵌入在上述應(yīng)用設(shè)計中,執(zhí)行音頻信號預(yù)處理過程,為應(yīng)用級提供最好的信息。

該嵌入式單個說話人及其語音定位識別方案基于一個集成ARM處理器和一組MEMS麥克風(fēng)的原型板。初步測試結(jié)果證明了這一集成方案的可行性,且系統(tǒng)級模塊可以做語音、音頻識別目標(biāo)板,滿足人機(jī)、人與周圍環(huán)境的自然用戶界面的功能要求。


上一頁 1 2 下一頁

關(guān)鍵詞: ARM處理器 MEMS STM32F4 語音識別

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉