基于DSP的人工耳蝸語音處理器設(shè)計(jì)

作者：時(shí)間：2014-04-04 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

摘要：傳統(tǒng)的人工耳蝸語音處理器采用ASIC設(shè)計(jì)，投入成本高，可移植性差，設(shè)計(jì)了一種基于A的人工耳蝸語音處理器。該處理器采用雙麥克風(fēng)接受語音信號，實(shí)現(xiàn)了語音信號的自適應(yīng)噪聲消除和CIS(Continuous Interleaved Sampling)方案。同一段語音由DSP采樣處理得到的刺激脈沖與MATLAB采樣處理的結(jié)果基本相同。實(shí)驗(yàn)結(jié)果表明，基于DSP的人工耳蝸語音處理器能實(shí)現(xiàn)語音信號中噪聲的消除并得到良好的刺激脈沖。

本文引用地址：http://m.butianyuan.cn/article/235932.htm

關(guān)鍵詞：DSP;人工耳蝸;自適應(yīng)噪聲消除;語音處理器

人工耳蝸又稱人造耳蝸、電子耳蝸，是目前唯一可以幫助重度耳聾患者恢復(fù)聽覺的裝置。相對于助聽器將聲音放大改善耳聾患者的聽力，人工耳蝸是將聲音轉(zhuǎn)換成電信號，然后以微弱電流刺激聽覺神經(jīng)纖維的形式傳遞聲音信息，從而產(chǎn)生聽覺。目前商用的人工耳蝸一般由體外語音處理器和體內(nèi)植人體組成，體外部分由麥克風(fēng)、語音處理器和編碼發(fā)射器組成，體內(nèi)部分由接收解碼器、刺激器和電極整列組成，并通過手術(shù)植入患者的體內(nèi)。目前國內(nèi)外商用的人工耳蝸語音處理器均采用ASIC設(shè)計(jì)，投入成本高，可移植性差。隨著現(xiàn)代微電子技術(shù)的發(fā)展，采用通用集成電路設(shè)計(jì)實(shí)用可靠的人工耳蝸已成為可能，其低成本、移植性好的特性將有助于人工耳蝸更好的普及。該系統(tǒng)基于TI公司的16位定點(diǎn)處理器，由完成語音采集和A/D轉(zhuǎn)換，系統(tǒng)設(shè)計(jì)包括硬件設(shè)計(jì)部分和軟件設(shè)計(jì)部分。本設(shè)計(jì)采用雙麥克風(fēng)接收語音輸入的自適應(yīng)噪聲消除技術(shù)，改善了在低信噪比環(huán)境中的語音識別效果。為了提高系統(tǒng)的運(yùn)行速度、降低系統(tǒng)的功耗，對軟件設(shè)計(jì)部分進(jìn)行了優(yōu)化。

1 帶自適應(yīng)噪聲消除技術(shù)的CIS算法

1.1 自適應(yīng)噪聲消除原理

在低信噪比的環(huán)境下，耳聾患者的語音識別率大幅下降?；谧赃m應(yīng)濾波器的噪聲消除法能有效的增強(qiáng)語音，消除背景噪聲，從而提高患者的語音識別率。本文中語音采集部分利用了兩個(gè)麥克風(fēng)接收語音，經(jīng)過采樣后作為兩個(gè)通道的輸入信號，輸入信號中均包括語音信號成分s和噪聲成分n。假設(shè)麥克風(fēng)1的采樣結(jié)果為s1+n1，麥克風(fēng)2的采樣結(jié)果為s2+n2。由于麥克風(fēng)1和麥克風(fēng)2分別對同一環(huán)境中的聲音進(jìn)行采樣，s1和s2為相關(guān)信號，n1和n2為相關(guān)信號。假設(shè)麥克風(fēng)1和麥克風(fēng)2收到的語音信號一樣，即s1等于s2。通過兩路信號相加得到主通道輸入信號x1=2s1+n1+n2，通過兩路信號相減得到參考通道輸入信號x2=n1-n2。由于主通道語音中的噪聲n1+n2與參考噪聲n1-n2是相關(guān)的，參考通道中的自適應(yīng)濾波器在接收n1-n2以后使輸出在最小均方誤差下最接近主通道噪聲n1+n2。輸出端e得到了消除噪聲后的增強(qiáng)語音信號。本文中自適應(yīng)濾波器采用了歸一化LMS算法，當(dāng)信噪比較大時(shí)，采用較小的收斂因子，減少穩(wěn)定失調(diào)誤差;當(dāng)信噪比較小時(shí)，采用較大的收斂因子，加快算法的收斂速度。自適應(yīng)噪聲消除原理如圖1所示。

1.2 帶自適應(yīng)噪聲消除技術(shù)的CIS方案

文中設(shè)計(jì)的人工耳蝸語音處理器采用CIS方案，即連續(xù)間隔采樣方案(Continuous Interleaved Sampling，CIS)。語音信號先經(jīng)過預(yù)加重處理，以補(bǔ)償語音信號中的高頻成分，然后做FFT變換，經(jīng)n個(gè)帶通濾波器后劃分為與刺激電極相對應(yīng)的通道，對各個(gè)通道能量求和并利用對數(shù)或指數(shù)函數(shù)壓縮已提高患者的聽力動態(tài)范圍。帶自適應(yīng)噪聲消除技術(shù)的CIS方案如圖2所示。

2 硬件結(jié)構(gòu)與設(shè)計(jì)

本系統(tǒng)以TMS320VC5509A DSP為核心，TLV320AIC23語音Codec芯片等其他外設(shè)為輔助設(shè)備。TMS320VC5509A控制系統(tǒng)的外設(shè)和處理CIS算法程序，TLV320AIC23對外部聲音進(jìn)行采樣和A/D轉(zhuǎn)換。TMS320VC5509A是TI公司推出的一款高性能低功耗的16位定點(diǎn)數(shù)字信號處理器，它擁有豐富的片內(nèi)資源，能方便的控制其他設(shè)備，輸出處理結(jié)果等。TLV320AIC23具有很低的功耗，在ADC和DAC的噪音可分別達(dá)到90 dB和100 dB。此外TLV320AIC23支持MIC和LINE IN兩種輸入方式，內(nèi)部ADC和DAC轉(zhuǎn)換模塊均帶有完整的數(shù)字濾波器，可以在8 kHz到96 kHz的采樣頻率范圍內(nèi)傳輸數(shù)據(jù)寬度為16位，20位，24位，32位的數(shù)據(jù)。

語音采集芯片TLV320AIC23與主處理芯片TMS320VC5509A的接口電路如圖3所示。

DSP與AIC23的接口有兩個(gè)，一個(gè)是控制接口采用I^2C模塊，通過編程完成對AIC23的配置;一個(gè)是數(shù)據(jù)音頻接口，通過MCBSP0傳輸數(shù)據(jù)。

AIC23的控制接口有SPI/和I^2C兩種工作方式，由于VC5509A片內(nèi)外設(shè)含有I^2C模塊.因此使用I^2C方式控制AIC23更為方便。此時(shí)VC5509A作為I^2C總線的主設(shè)備，AIC23作為從設(shè)備。在I^2C總線上AIC23有7位外設(shè)地址，9位寄存器的設(shè)置值。SCL和SD1分別是AIC23的控制端口和數(shù)據(jù)輸入端，分別和VC5509的I^2C模塊端口SCL，SDA相連。TLV3320AIC23的數(shù)據(jù)音頻接口支持右判，左判，I^2S和DSP 4種接口模式。本系統(tǒng)采用DSP模式，把AIC23設(shè)為主模式，DSP設(shè)為從模式，即MCBSP0的移位時(shí)鐘和幀同步時(shí)鐘全部由AIC23提供。在幀同步脈沖到來時(shí)第一個(gè)數(shù)據(jù)字即為左通道數(shù)據(jù)，右通道數(shù)據(jù)緊跟著左通道數(shù)據(jù)。

語音是時(shí)變的，非平穩(wěn)的隨機(jī)過程，但由于語音的形成過程與與人類發(fā)音系統(tǒng)的生理結(jié)構(gòu)密切相關(guān)，通常假設(shè)語音信號是短時(shí)平穩(wěn)的，即在10至30 ms的時(shí)間段內(nèi)其頻譜特性和一些物理特征參量可近似的看作是不變的。因此語音信號要進(jìn)行分幀處理，在采樣率為8 kHz時(shí)可將幀長取為N=256較為合適。

3 系統(tǒng)軟件設(shè)計(jì)

本系統(tǒng)中語音信號由LINE IN輸入，LLINE IN和RLINEIN分別對應(yīng)自適應(yīng)噪聲消除原理圖中的麥克風(fēng)1和麥克風(fēng)2，語音信號分別經(jīng)過AIC 23內(nèi)部的A/D轉(zhuǎn)換后，通過MCBSP0通道傳送到VC5509A內(nèi)。VC5509A對這些語音數(shù)據(jù)進(jìn)行CIS算法處理，得到各個(gè)通道的刺激脈沖。

系統(tǒng)軟件設(shè)計(jì)分為系統(tǒng)初始化，系統(tǒng)中斷處理程序和CIS算法程序。系統(tǒng)的初始化包括設(shè)置時(shí)鐘發(fā)生器，MCBSP初始化，I^2C初始化以及對AIC23控制寄存器的配置。系統(tǒng)中斷處理程序設(shè)置一個(gè)標(biāo)志位，每中斷一次左右聲道各采集一個(gè)數(shù)據(jù)，當(dāng)采集滿一幀時(shí)能使采樣值保存在兩個(gè)數(shù)據(jù)緩沖區(qū)的另一個(gè)緩沖區(qū)中。系統(tǒng)中主程序一直處于循環(huán)處理過程，在一幀信號執(zhí)行完CIS算法程序后，等待下一幀信號接收完畢，然后重新執(zhí)行CIS算法程序。為保證語音信號處理的連續(xù)性，CIS算法處理時(shí)間應(yīng)當(dāng)小于一幀數(shù)據(jù)的采樣時(shí)間。本系統(tǒng)CPU時(shí)鐘為144 MHz，采樣頻率8 kHz，中斷頻率8 kHz，因此每125μs采集一個(gè)點(diǎn)，采集一幀256個(gè)數(shù)據(jù)需32 ms，即每隔32 ms輸出1個(gè)刺激脈沖，CIS子程序運(yùn)行一次需23.1 ms。圖4為系統(tǒng)設(shè)計(jì)流程圖。

4 設(shè)計(jì)結(jié)果驗(yàn)證

文中設(shè)計(jì)的CIS算法首先用MATLAB進(jìn)行驗(yàn)證，然后修改成C語言在DSP上實(shí)現(xiàn)。為了更方便的分析算法結(jié)果，文中利用了集成在MATLAB 7.0中的CCSLlink工具。利用該工具可在MATLAB環(huán)境下完成對CCS和DSP目標(biāo)板的操作，自動實(shí)現(xiàn)調(diào)試，數(shù)據(jù)傳遞和驗(yàn)證。在創(chuàng)建好CCSIDE連接對象后，利用MATLAB把工程文件加載到CCSIDE中，經(jīng)過編譯連接生成DSP可執(zhí)行文件。把可執(zhí)行文件加載到DSP目標(biāo)板，運(yùn)行程序，由waver ead函數(shù)讀取wav格式音頻文件。該音頻文件是立體聲的波形文件，采樣精度16位，采樣率22 050 Hz，左聲道模擬麥克風(fēng)1，右通道模擬麥克風(fēng)2。為了模擬真實(shí)環(huán)境中的噪聲，左右聲道各加入了相關(guān)的高斯白噪聲，通過LINE IN連接線接到DSP目標(biāo)板。先將自適應(yīng)濾波前后的結(jié)果進(jìn)行對比，如圖5所示。

自適應(yīng)消噪后的語音信號經(jīng)過預(yù)加重，F(xiàn)FT變換，帶通濾波，能量求和及非線性壓縮后可得到與每個(gè)電極相對應(yīng)的刺激脈沖。以第一通道為例，同一語音分別經(jīng)DSP和MATLAB采樣處理的結(jié)果對比如圖6所示。

5 CIS算法實(shí)現(xiàn)優(yōu)化

功耗是人工耳蝸語音處理器設(shè)計(jì)需要考慮的重要內(nèi)容，本系統(tǒng)在降低功耗方面做了一些努力。由于語音實(shí)時(shí)采樣分析的需要，每幀數(shù)據(jù)的處理時(shí)間必須小于每幀數(shù)據(jù)的采樣時(shí)間。CIS算法優(yōu)化后減少了每幀數(shù)據(jù)的處理時(shí)間，可以使CPU工作在較低的工作頻率，一定程度上降低了系統(tǒng)功耗。CIS算法中開平方運(yùn)算和FFT運(yùn)算需要較多的處理時(shí)間，其中浮點(diǎn)數(shù)開平方運(yùn)算需要10 ms，浮點(diǎn)數(shù)FFT運(yùn)算需要51 ms。本算法中采用了DSP函數(shù)庫中的sqrt_16函數(shù)和cfft函數(shù)，這些函數(shù)全部為優(yōu)化過的匯編語言，可有C?語言方便調(diào)用，執(zhí)行速度得到了很大的提高。

6 結(jié)束語

文中介紹了基于16位定點(diǎn)DSP芯片TMS320VC5509A的人工耳蝸語音處理器的硬件設(shè)計(jì)和軟件設(shè)計(jì)。為了提高低噪聲中的語音識別率，本設(shè)計(jì)采用了雙麥克風(fēng)接收語音輸入的自適應(yīng)消噪技術(shù)。聲音經(jīng)過語音Codec芯片TLV320AIC23采集并進(jìn)行A/D轉(zhuǎn)換后傳輸?shù)紻SP內(nèi)。系統(tǒng)運(yùn)行結(jié)果表明，該系統(tǒng)可以實(shí)現(xiàn)語音信號中噪聲的消除，并得到良好的電極刺激脈沖，其低功耗、低成本、移植性好的特性將有助于人工耳蝸更好的普及。

射頻卡相關(guān)文章:射頻卡原理

新聞中心

基于DSP的人工耳蝸語音處理器設(shè)計(jì)

評論

相關(guān)推薦

技術(shù)專區(qū)