基于HMM的連續(xù)小詞量語音識(shí)別系統(tǒng)的研究
如果P(O/λZ)和距離太大,則返回步驟(2),反復(fù)迭代運(yùn)算,直到HMM模型參數(shù)不再發(fā)生明顯的變化為止。
2.2 HMM模型識(shí)別
HMM模型的輸出概率用Viterbi算法計(jì)算,因?yàn)楦怕手狄话愣歼h(yuǎn)小于1,這里用取對(duì)數(shù)后的概率作為輸出值:
以上式中δt(i)表示t時(shí)刻第i個(gè)狀態(tài)的累積輸出概率;φt(i)表示t時(shí)刻第i個(gè)狀態(tài)的前續(xù)狀態(tài)號(hào);為最優(yōu)狀態(tài)序列中t時(shí)刻所處的狀態(tài);P*為最終的輸出概率。
3 實(shí)驗(yàn)結(jié)果
系統(tǒng)首先通過語音錄入模塊的麥克風(fēng)將語音信號(hào)輸入U(xiǎn)DA1341 TS數(shù)字音頻處理芯片,通過S3C2410向UDA1341數(shù)字音頻處理芯片發(fā)送指令,數(shù)字音頻處理芯片由內(nèi)部A/D對(duì)語音信號(hào)進(jìn)行采樣,調(diào)用語音壓縮算法對(duì)語音信號(hào)進(jìn)行壓縮,并調(diào)用語音識(shí)別函數(shù)API對(duì)輸入語音進(jìn)行基于模式匹配算法的語音識(shí)別,最終UDA1341數(shù)字音頻處理芯片將識(shí)別結(jié)果通過I/O傳送到ARM S3C2410,S3C2410接收到識(shí)別結(jié)果后,根據(jù)不同的識(shí)別結(jié)果再向UDA1341 TS發(fā)送不同指令,以此實(shí)現(xiàn)語音識(shí)別系統(tǒng)的功能。
系統(tǒng)采用三星的S3C2410作為嵌入式CPU,這是一款高性價(jià)比、低功耗、高性能、高集成度的CPU,基于ARM9核,主頻為203 MHz,專為網(wǎng)絡(luò)通信和手持設(shè)備而設(shè)計(jì),能滿足語音識(shí)別系統(tǒng)中的低成本、低功耗、高性能、小體積的要求。
實(shí)驗(yàn)采用10字中文數(shù)碼,分別在室外環(huán)境和實(shí)驗(yàn)室環(huán)境下測試,結(jié)果如表1所示。本文引用地址:http://m.butianyuan.cn/article/150493.htm
通過測試表明,在實(shí)驗(yàn)室環(huán)境下該系統(tǒng)在UDA1314TS DSP芯片上得到的結(jié)果比較令人滿意,具有良好的魯棒性,識(shí)別率達(dá)到實(shí)用要求,但在室外較高噪音條件下的識(shí)別率相對(duì)實(shí)驗(yàn)室環(huán)境下有一定差距,滿足語音識(shí)別基本要求。
4 結(jié)論
本文系統(tǒng)采用隱馬爾可夫模型的語音識(shí)別算法,能夠?qū)?a class="contentlabel" href="http://m.butianyuan.cn/news/listbylabel/label/小詞">小詞量、連續(xù)語音進(jìn)行識(shí)別,識(shí)別率較高。ARMS3C2410微處理器和UDA1314TS音頻處理芯片的結(jié)合應(yīng)用,能使本語音識(shí)別系統(tǒng)具有較強(qiáng)的實(shí)時(shí)性。體積小,攜帶方便,使用靈活,可移植性強(qiáng)的特點(diǎn)使系統(tǒng)在進(jìn)一步改進(jìn)和發(fā)展后能夠用于工業(yè)語音控制領(lǐng)域中,還可用于聲控玩具、聲控設(shè)備等人們的日常生活中。
但由于技術(shù)水平和硬件環(huán)境的限制,該語音識(shí)別系統(tǒng)在算法、硬件方面都需要進(jìn)一步的研究和完善。該嵌入式語音識(shí)別系統(tǒng)的研究為進(jìn)一步開發(fā)和研究實(shí)用性嵌入式語音識(shí)別系統(tǒng)做出了重要的嘗試和探索工作。
評(píng)論