基于Windows CE的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)

作者：時(shí)間：2011-01-10 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

　　對(duì)于一個(gè)基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)，主要有以下幾個(gè)要求：

　?。?）完成語(yǔ)音口令識(shí)別功能時(shí)，需要系統(tǒng)對(duì)人所發(fā)出的語(yǔ)音口令做出快速的響應(yīng)，然后給出相應(yīng)的判斷結(jié)果。

　　（2）自動(dòng)獲得語(yǔ)音信號(hào)。語(yǔ)音口令識(shí)別系統(tǒng)一直處于隨時(shí)接受語(yǔ)音口令的工作狀態(tài)，無(wú)需人工操作就能將人的語(yǔ)音命令與環(huán)境噪聲分離出來(lái)，舍棄靜音信號(hào)和環(huán)境噪聲信號(hào)部分，僅僅對(duì)有效的語(yǔ)音口令信號(hào)做處理和識(shí)別。

　?。?）需要有足夠的存儲(chǔ)器容量存儲(chǔ)操作系統(tǒng)文件和訓(xùn)練好的語(yǔ)音口令模型庫(kù)以及存儲(chǔ)大量數(shù)據(jù)的數(shù)據(jù)緩沖區(qū)。

　　論文給出的語(yǔ)音口令識(shí)別系統(tǒng)選擇高性?xún)r(jià)比的嵌入式微處理器S3C2440AL和64MB隨機(jī)存儲(chǔ)器和64MB的閃存來(lái)滿(mǎn)足計(jì)算速度和數(shù)據(jù)緩存的要求。

　　1.2 軟件程序的設(shè)計(jì)

　　選擇Windows CE 5.0為語(yǔ)音口令識(shí)別系統(tǒng)的操作系統(tǒng)，Windows CE 5.0是一個(gè)多任務(wù)操作系統(tǒng)。開(kāi)發(fā)工具主要有Platform. Builder 5.0和EVC++4.0。Platform. Builder5.0用于定制和開(kāi)發(fā)內(nèi)核，而EVC++4.0則用來(lái)編寫(xiě)基于操作系統(tǒng)的應(yīng)用層程序，也就是算法執(zhí)行程序與圖形化界面，而圖形化的界面使用MFC編寫(xiě)。

　　由于語(yǔ)音口令識(shí)別系統(tǒng)算法的運(yùn)算量比較大，所以為了能夠加快運(yùn)算速度，首先對(duì)Windows CE 5.0操作系統(tǒng)進(jìn)行配置，需要將相應(yīng)的板級(jí)支持包BSP（Board SupportPackage）導(dǎo)入到Platform. Builder 5.0，裁剪掉一些使用不到的資源，保留一些需要的資源，驅(qū)動(dòng)的配置正確后，將配置好的操作系統(tǒng)內(nèi)核裝入到嵌入式平臺(tái)中，然后進(jìn)行應(yīng)用程序的開(kāi)發(fā)。

　　語(yǔ)音口令識(shí)別系統(tǒng)分為訓(xùn)練和識(shí)別兩個(gè)過(guò)程。訓(xùn)練時(shí)，語(yǔ)音口令信號(hào)首先經(jīng)過(guò)預(yù)處理，然后提取語(yǔ)音特征參數(shù)，采用MFCC（Mel-Frequency Ceptral Coefficients）參數(shù)［4］，然后建立此口令的連續(xù)隱馬爾可夫（CDHMM）模型，把所有經(jīng)過(guò)訓(xùn)練的語(yǔ)音口令的模型放在模型庫(kù)中。

　　在識(shí)別階段，與訓(xùn)練時(shí)提取語(yǔ)音口令信號(hào)的特征參數(shù)一樣，也要提取MFCC特征參數(shù)，然后與保存在語(yǔ)音口令模型庫(kù)中的每一條語(yǔ)音口令模型相匹配，根據(jù)概率*分確定輸出識(shí)別結(jié)果。語(yǔ)音口令識(shí)別系統(tǒng)的程序流程圖如圖1所示。

上一頁(yè) 1 2 3 4 下一頁(yè)

新聞中心

基于Windows CE的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)