新聞中心

EEPW首頁(yè) > 消費(fèi)電子 > 設(shè)計(jì)應(yīng)用 > 基于DSP的語(yǔ)音識(shí)別計(jì)算器設(shè)計(jì)

基于DSP的語(yǔ)音識(shí)別計(jì)算器設(shè)計(jì)

作者: 時(shí)間:2010-08-05 來(lái)源:網(wǎng)絡(luò) 收藏

摘要:為解決特殊群體使用困難的問(wèn)題,了一種TMS320VC5509 的可系統(tǒng)。該系統(tǒng)的核心是采用HMM算法建立模型。通過(guò)對(duì)實(shí)時(shí)信號(hào)(數(shù)字、運(yùn)算符號(hào)等語(yǔ)音)進(jìn)行處理,將得到的參數(shù)與模板庫(kù)參數(shù)進(jìn)行匹配并加以,利用TMS320VC5509 自帶的計(jì)算模塊實(shí)現(xiàn)語(yǔ)音信號(hào)整數(shù)100以?xún)?nèi)的加、減、乘、除等計(jì)算功能。實(shí)驗(yàn)結(jié)果表明,該計(jì)算器系統(tǒng)在低噪聲場(chǎng)合和高噪聲場(chǎng)合下識(shí)別率分別達(dá)到94.73%和76.55%。
關(guān)鍵詞:語(yǔ)音識(shí)別;;HMM;計(jì)算器;TMS320VC5509

本文引用地址:http://m.butianyuan.cn/article/166656.htm

隨著電子技術(shù)的高速發(fā)展,現(xiàn)代普通民用計(jì)算器在保留基本的加減乘除等運(yùn)算外,加入了大量如三角函數(shù)、冪函數(shù)等比較復(fù)雜的運(yùn)算。但是其基本的操作沒(méi)有發(fā)生變化,依然是運(yùn)用手指操作,對(duì)于需要進(jìn)行實(shí)時(shí)數(shù)字計(jì)算的一些特殊人群(殘疾人士)或是在一些特殊場(chǎng)合在無(wú)法手動(dòng)操作計(jì)算器的情況下,用加入了語(yǔ)音識(shí)別模塊的計(jì)算器來(lái)進(jìn)行實(shí)時(shí)數(shù)字計(jì)算就有相當(dāng)?shù)谋匾?br /> 語(yǔ)音識(shí)別技術(shù)是人機(jī)最自然、最簡(jiǎn)潔的交流方式,它就是讓機(jī)器能夠自動(dòng)識(shí)別并理解說(shuō)話人要表達(dá)的意思,將語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)檎_的文本或者命令的高科技技術(shù)。根據(jù)實(shí)際的應(yīng)用,語(yǔ)音識(shí)別可以分為:特定人與非特定人的識(shí)別、孤立詞與連續(xù)詞的識(shí)別、中小詞匯量與無(wú)限詞匯量的識(shí)別。
考慮到成本及使用范圍因素,本文中應(yīng)用的是TMS320VC5509 DSP的非特定人、孤立詞、小詞匯量的語(yǔ)音識(shí)別系統(tǒng)。通過(guò)實(shí)際測(cè)試,使用該DSP的語(yǔ)音識(shí)別系統(tǒng)有著較高的實(shí)時(shí)性、識(shí)別率,該系統(tǒng)的計(jì)算器對(duì)實(shí)時(shí)數(shù)字計(jì)算有較高準(zhǔn)確性,基本能解決特殊群體和特殊地點(diǎn)使用計(jì)算器困難的情況。

1 系統(tǒng)硬件
1.1 語(yǔ)音識(shí)別系統(tǒng)
語(yǔ)音識(shí)別的基本原理框圖如圖l所示。語(yǔ)音識(shí)別過(guò)程主要包括語(yǔ)音信號(hào)前處理、特征提取、模式匹配等部分。語(yǔ)音信號(hào)輸入之后,預(yù)處理和數(shù)字化是進(jìn)行語(yǔ)音識(shí)別的前提條件。特征提取是進(jìn)行語(yǔ)音信號(hào)訓(xùn)練和識(shí)別必不可少的步驟,本文采用的是提取每幀的Mel系數(shù)的倒譜參數(shù)作為語(yǔ)音信號(hào)的特征值。模板匹配算法目前有DTW算法、HMM隱馬爾科夫模型、ANN人工神經(jīng)網(wǎng)絡(luò)等。本文采用HMM隱馬爾科夫模型的方法,提取出的特征值存入?yún)⒖寄J綆?kù)中,用來(lái)匹配待識(shí)別語(yǔ)音信號(hào)的特征值。匹配計(jì)算是進(jìn)行語(yǔ)音識(shí)別的核心部分,由待識(shí)別人的語(yǔ)音經(jīng)過(guò)特征提取后,與系統(tǒng)訓(xùn)練時(shí)產(chǎn)生的模板進(jìn)行匹配,在說(shuō)話人辨認(rèn)中,取與待識(shí)別語(yǔ)音相似度最大的模型所對(duì)應(yīng)的語(yǔ)音作為識(shí)別結(jié)果。


1.2 系統(tǒng)硬件結(jié)構(gòu)
圖2為系統(tǒng)硬件結(jié)構(gòu)框圖。此系統(tǒng)的核心器件是TI公司的TMS320VC5509定點(diǎn)DSP。在本系統(tǒng)中,它不僅是語(yǔ)音識(shí)別的核心,還負(fù)責(zé)計(jì)算器的運(yùn)算部分。TMS320VC5509是系統(tǒng)的運(yùn)算處理單元,具有2個(gè)乘法器(MAC),4個(gè)累加器(ACC);40位、16位的算術(shù)邏輯單元(ALU)各一個(gè),這大大增強(qiáng)了DSP的運(yùn)算能力;指令字長(zhǎng)不只單一的16位,可擴(kuò)展到最高48位,數(shù)據(jù)字長(zhǎng)16位;可通過(guò)USB接口對(duì)TMS320VC5509燒寫(xiě)程序而不必借助仿真器。正是基于這些優(yōu)點(diǎn),選擇該器件可節(jié)省開(kāi)發(fā)資金,減小電路板面積。DSP與TLV320AIC23的接口電路如圖3所示。


上一頁(yè) 1 2 3 下一頁(yè)

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉