新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 基于TMS320c55x電子耳蝸語音增強(qiáng)的實現(xiàn)

基于TMS320c55x電子耳蝸語音增強(qiáng)的實現(xiàn)

作者: 時間:2001-11-09 來源: 收藏

耳蝸通過植入電子耳蝸(Electronic Cochlear)為幾乎喪失了所有聽力的人恢復(fù)部分聽力,它模仿人的內(nèi)耳人為地產(chǎn)生電信號刺激聽覺神經(jīng)。電子耳蝸發(fā)展是令人鼓舞的,有些失聰?shù)娜艘呀?jīng)可以通過電話進(jìn)行交談。電子耳蝸的設(shè)計者面臨的一個挑戰(zhàn)就是發(fā)展能夠完整模仿人內(nèi)耳功能的語音信號處理技術(shù),這其中的研究方向之一就是發(fā)展語音增強(qiáng)技術(shù)來幫助接受耳蝸移植的人在噪聲環(huán)境中更好地溝通。目前的電子耳蝸還沒有很好地實現(xiàn)人的內(nèi)耳所具有的語音增強(qiáng)功能。因此,我們首先從選擇合適的語音增強(qiáng)算法入手,再用TIDSP(數(shù)字信號處理器)實現(xiàn)增強(qiáng)算法。由于篇幅所限只介紹基于子空間方法的增強(qiáng)算法。

本文引用地址:http://m.butianyuan.cn/article/2913.htm

為了選擇合適的語音增強(qiáng)算法,最終經(jīng)過反復(fù)對比驗證,我們決定使用基于子空間方法的增強(qiáng)算法對純凈語音信號進(jìn)行估計,再使用基于人耳聽覺特性的語音增強(qiáng)算法對語音信號進(jìn)行增強(qiáng)。基于子空間方法的增強(qiáng)算法主要是利用數(shù)據(jù)協(xié)方差矩陣的特征值分解,利用特征值的大小,將協(xié)方差矩陣的特征子空間分為信號子空間和噪聲子空間兩部分。數(shù)字信號處理中的一個關(guān)鍵問題是特征提取,它指的是數(shù)據(jù)空間變換到特征空間的過程。一般而言,理論上這是一種等維數(shù)的變換過程。而實際上,我們更樂于使數(shù)據(jù)矢量能夠用更低維數(shù)的有效特征表示,但仍然保留了數(shù)據(jù)矢量的內(nèi)在信息。其流程見圖1。

為了便于語音增強(qiáng)算法向DSP上移植,又考慮到目前多數(shù)DSP開發(fā)環(huán)境均提供對ANSI C的支持,因而首先將算法由仿真用的Matlab程序改寫為C語言。其中主要包括以下兩方面的問題:

1)語音信號的實時分幀處理。由于算法理論上是對語音信號以語音幀為單位進(jìn)行處理的,但實際Matlab仿真程序中在處理每一幀時都使用了其他所有幀的信息,因而要將算法改寫為適合于分幀處理。

2)算法的運行速度和存儲空間占用問題?;谧涌臻g方法的語音增強(qiáng)算法中大量用到矩陣運算,將使算法的速度受到很大影響。

針對以上兩個問題,我們對算法進(jìn)行了部分的改進(jìn),使其適應(yīng)實時分幀處理,程序調(diào)試過程中進(jìn)行了優(yōu)化,提高運行速度、減小存儲空間。其中具體改進(jìn)措施如下:

對噪聲功率的估計方法。仿真程序中估計噪聲的方法為尋找語音信號中能量最小的幾幀,將其平均能量作為噪聲平均功率。顯然這種方法不適合與實時分幀處理。因而改為尋找當(dāng)前幀以前的所有幀(包括當(dāng)前幀)中能量最小者的能量作為對噪聲功率的估計。實踐證明這種方法簡便易行,效果與仿真結(jié)果相差無幾。

程序中分幀方法的改進(jìn)。具體為在基于子空間的增強(qiáng)算法中使用的幀長為32。因為基于子空間的增強(qiáng)算法其時間復(fù)雜度與幀長平方成正比,所以使用的幀長較短!

CIS(連續(xù)分段采樣)方案是對人耳聽覺系統(tǒng)的一種模仿。CIS方案按照在人的內(nèi)耳的耳蝸,不同頻率的聲音信號在不同的位置被帶通濾波,傳送到那里的聽覺神經(jīng)上,將頻率分量轉(zhuǎn)換成生物電流,傳輸至大腦,最后形成聽覺這個原理,選擇了以有限的頻率點為中心頻率的一組帶通濾波器,將聲音信號分成幾個通道,經(jīng)過一定的調(diào)制和處理,將輸出信號傳送到相應(yīng)位置的電極上,刺激耳蝸內(nèi)相應(yīng)位置的聽覺神經(jīng),從而產(chǎn)生聽覺。經(jīng)過測試選取16通道的CIS方案。每個通道內(nèi),帶通濾波器的輸出再經(jīng)過波形校正(Rectifier),即用語音增強(qiáng)算法語音處理后,然后經(jīng)過低通濾波再調(diào)制相應(yīng)的正弦波形,得到相應(yīng)電極上的電刺激信號,所有的這些電極信號合并在一起就是系統(tǒng)的輸出信號。目前大多數(shù)基于CIS方案的電子耳蝸在安靜環(huán)境下可以使聾人獲得一定語音信息,但是在噪聲環(huán)境下,這種信息傳遞就會大打折扣。這不是一個簡單的干擾問題。正常人在噪聲環(huán)境下仍然能獲得相當(dāng)準(zhǔn)確的語音信息,但是電子耳蝸在噪聲環(huán)境下傳遞給聾人很可能就是不可懂的語音。所以抑制噪聲對CIS系統(tǒng)的干擾是重要的課題。

TMS320C54系列DSPTMS320家族的定點DSPC54x適用于很多方面,滿足了實時嵌入應(yīng)用的需要,如電信,無線應(yīng)用、語音處理等等。C54xCPU通過使用改進(jìn)的哈佛結(jié)構(gòu),實現(xiàn)了最小化的核心電源消耗和高度的并行運算能力。同時,多種尋址模式和完善的指令集提高了整個系統(tǒng)的性能。

C54x主要有如下特點:

1、增強(qiáng)的哈佛結(jié)構(gòu),一條程序總線和三條數(shù)據(jù)總線;

2、高度并行的先進(jìn)CPU設(shè)計,性能更好的面向應(yīng)用的硬件邏輯;

3、為快速算法和高級語言優(yōu)化設(shè)計的專用指令集;

4、標(biāo)準(zhǔn)化的模塊結(jié)構(gòu),適于快速開發(fā);

5、先進(jìn)的IC處理技術(shù),提高了性能,降低了電源消耗。

TMS320C55x DSP代表了TI公司最新的一代C5000系列 DSPC55x是在C54x基礎(chǔ)上發(fā)展起來的,代碼向下兼容于C54x。C55x在電源效率,低系統(tǒng)消耗和并行度方面做了很好的優(yōu)化。

集成開發(fā)環(huán)境采用的是TI TMS320VC5410 Evaluation Module System Kit的一整套硬件,以及TI公司的集成開發(fā)環(huán)境(IDE)Code Composer Studio IDE for C5000軟件。

集成開發(fā)環(huán)境提供從代碼開發(fā)、代碼優(yōu)化、可執(zhí)行代碼生成,軟件仿真,硬件仿真等等豐富的功能,我們的一切工作都是這上面開展的,這也是現(xiàn)代DSP開發(fā)的發(fā)展方向,TI公司大力推廣的Express DSP開發(fā)技術(shù)的就是以集成開發(fā)環(huán)境為中心,配以其他的軟件和硬件實現(xiàn)快速的DSP代碼開發(fā)。

1、信號先經(jīng)過一個預(yù)加重濾波器處理,濾波器截止頻率是2000Hz;

2、上一步的輸出信號被帶通濾波分為n個頻帶(n=16),這里使用的帶通濾波器是二階butterworth濾波器;

3、對上一步的輸出信號進(jìn)行全波整流。

4、通過低通濾波取出第三步信號的包絡(luò),所用的濾波器為二階butterworth濾波器,截止頻率為400Hz;

5、產(chǎn)生幅度為包絡(luò)算術(shù)平均值,頻率為帶通濾波器中心頻率的正弦信號。每個頻帶的正弦信號最后被疊加起來得到合成語音信號,合成語音信號段的電平被調(diào)節(jié)到和原始語音信號具有相同的算術(shù)平均值。

 

1、信度限制:為了防止處理過程中的溢出,我們必須限制語音信號幅度,否則會有難以預(yù)料的錯誤。

2、精確保證:必須使用一些通用目的函數(shù),例如FFT運算和正弦運算,因為有TI的DSP定點庫函數(shù),我們直接在程序中調(diào)用這些庫函數(shù),取得了較好的效果。

3、數(shù)據(jù)輸出的模擬實現(xiàn):借助集成開發(fā)環(huán)境的DATA I/O功能實現(xiàn)了從文件輸入處理數(shù)據(jù),處理后的數(shù)據(jù)也放到一個文件中。模擬實現(xiàn)數(shù)據(jù)的實時I/O。

運行結(jié)果:我們的試聽結(jié)果證明基于CIS的語音增強(qiáng)算法能提高電子耳蝸在噪聲環(huán)境下的性能,實驗用16個電極的結(jié)果完全是可以為人接受的。

由于篇幅的限制,具體的代碼就不附在這里?!?/font>



關(guān)鍵詞:

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉