基于DSP嵌入式說(shuō)話人識(shí)別系統(tǒng)的設(shè)計(jì)

作者：時(shí)間：2012-03-21 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

0 引言

本文引用地址：http://m.butianyuan.cn/article/257627.htm

說(shuō)話人身份識(shí)別屬于生物認(rèn)證技術(shù)的一種，是一項(xiàng)根據(jù)語(yǔ)音中反映說(shuō)話人生理和行為特征的語(yǔ)音參數(shù)來(lái)自動(dòng)識(shí)別說(shuō)話人身份的技術(shù)。近年來(lái)，說(shuō)話人身份識(shí)別以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢(shì)受到矚目，在信息安全等領(lǐng)域的應(yīng)用逐漸增大，并成為人們?nèi)粘Ｉ詈凸ぷ髦兄匾移占暗陌踩?yàn)證方式。目前，說(shuō)話人身份識(shí)別在理論上和實(shí)驗(yàn)室條件下已經(jīng)達(dá)到了比較高的識(shí)別精度，并開(kāi)始走向?qū)嶋H應(yīng)用階段。ATT、歐洲電信聯(lián)盟、ITT、Keyware、T-NETIX，Motorola和Vi-sa等公司相繼開(kāi)展了相關(guān)實(shí)用化研究，國(guó)內(nèi)這方面研究主要在中科聲學(xué)所，中科院自動(dòng)化所，清華大學(xué)等研究所和大學(xué)中進(jìn)行。

基于嵌入式的說(shuō)話人身份識(shí)別系統(tǒng)具有高精度，適時(shí)性好，低功耗，低費(fèi)用，體積小等優(yōu)勢(shì)，逐漸成為說(shuō)話人身份識(shí)別面向?qū)嶋H應(yīng)用的新熱點(diǎn)。而隨著DSP新技術(shù)的發(fā)展，DSP芯片無(wú)論在處理速度、精度、功耗或者體積等方面都取得了突破性的進(jìn)展。DSP也越來(lái)越多的應(yīng)用于說(shuō)話人身份識(shí)別。但目前這方面研究主要局限于小數(shù)據(jù)量、與PC機(jī)配套使用上，沒(méi)有太大的實(shí)用價(jià)值。在此介紹一種基于TMS320C6713 DSP芯片設(shè)計(jì)的嵌入式，10個(gè)人范圍的說(shuō)話人身份識(shí)別系統(tǒng)。該系統(tǒng)可以自舉運(yùn)行，并可靈活的選擇訓(xùn)練、識(shí)別或者更換訓(xùn)練者、識(shí)別者，識(shí)別率達(dá)98％以上。

1 系統(tǒng)的架構(gòu)及硬件構(gòu)成

系統(tǒng)總體實(shí)現(xiàn)流程如圖1所示。系統(tǒng)主要分為訓(xùn)練和識(shí)別兩部分，系統(tǒng)初始化后由操作者控制訓(xùn)練或識(shí)別。訓(xùn)練目的是提取說(shuō)話人模型參數(shù)并將其存儲(chǔ)在FLASH ROM中。識(shí)別目的是讀取待識(shí)別者語(yǔ)音信息并將獲得的模型參數(shù)與訓(xùn)練的模型參數(shù)比較，從而獲得識(shí)別結(jié)果。

1．1 系統(tǒng)的主要硬件構(gòu)成

系統(tǒng)硬件構(gòu)成如圖2所示，主要包含語(yǔ)音采集模塊、數(shù)據(jù)處理模塊(DSP)、程序數(shù)據(jù)存儲(chǔ)及自舉FLASH模塊、數(shù)據(jù)存儲(chǔ)器RAM模塊、系統(tǒng)時(shí)序邏輯控制CPLD模塊、JTAG接口模塊。

語(yǔ)音采集模塊主要由TLV320AIC23音頻編解碼器來(lái)完成，該芯片是TI公司的一款高性能的立體聲音頻Codec芯片，內(nèi)置放大器，輸入／輸出增益可編程設(shè)置。模數(shù)，數(shù)／模轉(zhuǎn)換集成在一塊芯片中。采樣率8～96 kHz可編程實(shí)現(xiàn)。另外還具有低功耗，連接電路簡(jiǎn)單，性價(jià)比高的特點(diǎn)。

語(yǔ)音處理DSP采用TI公司的TMS320C6713芯片，該芯片實(shí)現(xiàn)浮點(diǎn)運(yùn)算，最高時(shí)鐘頻率225 MHz，使用該芯片外部存儲(chǔ)器接口可實(shí)現(xiàn)對(duì)外部存儲(chǔ)器(SDRAM)數(shù)據(jù)傳輸和程序存儲(chǔ)器(FLASH ROM)進(jìn)行程序讀寫(xiě)；依靠JTAG接口電路通過(guò)仿真器進(jìn)行仿真調(diào)試，實(shí)現(xiàn)與主機(jī)數(shù)據(jù)交換；通過(guò)片內(nèi)外設(shè)McBSP完成串行數(shù)據(jù)的接收和發(fā)送，實(shí)現(xiàn)對(duì)音頻處理模塊的控制等工作。

FLASH ROM最大可提供512 KB空間，通常為前256 KB可用。SDRAM最大容量為16 MB，為該系統(tǒng)提供較大的數(shù)據(jù)存儲(chǔ)空間。CPLD為存儲(chǔ)器的擴(kuò)展實(shí)現(xiàn)邏輯編碼。電源為T(mén)PS54310芯片，可為系統(tǒng)提供3．3 V和1．26 V兩種電壓。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解（linux不再難懂）

上一頁(yè) 1 2 3 4 5 下一頁(yè)

新聞中心

基于DSP嵌入式說(shuō)話人識(shí)別系統(tǒng)的設(shè)計(jì)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)