基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的實(shí)現(xiàn)
通過(guò)上述IIS總線(xiàn)能夠得到輸入的音頻數(shù)據(jù)信號(hào),而其它的信號(hào)如自動(dòng)增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等控制信號(hào)通過(guò)稱(chēng)為“L3”形式的接口總線(xiàn)傳輸。為了減少引腳數(shù)和保持連線(xiàn)簡(jiǎn)單,該接口總線(xiàn)采用串行數(shù)據(jù)傳輸方式,接口總線(xiàn)由3條信號(hào)線(xiàn)組成:時(shí)分復(fù)用的數(shù)據(jù)通道線(xiàn)L3DATA、模式控制線(xiàn)L3MODE和時(shí)鐘信號(hào)線(xiàn)L3CLOCK。模式控制線(xiàn)L3MODE為低電平時(shí)的傳輸模式為地址傳輸模式;為高電平時(shí)的傳輸模式為數(shù)據(jù)傳輸模式。
語(yǔ)音口令識(shí)別系統(tǒng)的硬件電路的核心芯片是嵌入式微處理器Samsung S3C2440 AL,主頻為400MHz。三星公司推出的RISC微處理器S3C2440 AL具有低功耗、高性能等特點(diǎn),可以廣泛應(yīng)用于便攜式設(shè)備中。S3C2440AL具有一個(gè)IIS總線(xiàn)音頻編碼/解碼接口,語(yǔ)音口令識(shí)別系統(tǒng)的硬件電路如圖2所示。其IIS總線(xiàn)控制器通過(guò)5根信號(hào)線(xiàn)與UDAl34lTS編解碼芯片相連。這些5根信號(hào)線(xiàn)分別是:系統(tǒng)時(shí)鐘信號(hào)CDCLK:位時(shí)鐘信號(hào)I2-SSCLK;字選擇控制信號(hào)I2SLRCK;串行數(shù)據(jù)輸入信號(hào)I2SSDI;串行數(shù)據(jù)輸出信號(hào)I2SDO。S3C2440 AL使用L3接口傳輸其他(如自動(dòng)增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等)控制信號(hào)。為了使系統(tǒng)間能夠更好地同步,S3C2440AL需要向芯片UDAl341TS提供CDCLK,該時(shí)鐘信號(hào)的頻率可以選擇采樣頻率的256倍、384倍或512倍。本文引用地址:http://m.butianyuan.cn/article/151538.htm
2 基于CDHMM的口令識(shí)別的軟件設(shè)計(jì)
2.1 口令識(shí)別的軟件系統(tǒng)框圖
語(yǔ)音口令識(shí)別的軟件系統(tǒng)分別由特征參數(shù)提取、語(yǔ)音模型庫(kù)和概率輸出評(píng)分三大模塊組成,如圖3所示:1)語(yǔ)音口令特征參數(shù)的提取,輸入不同的語(yǔ)音口令,首先要進(jìn)行特征參數(shù)提取,采用Mel頻率參數(shù)作為CDHMM的建模參數(shù),Mel頻率參數(shù)是根據(jù)人耳的聽(tīng)覺(jué)特性將語(yǔ)音信號(hào)的頻譜轉(zhuǎn)化為基于Mel頻率的非線(xiàn)性頻譜,然后轉(zhuǎn)換到倒譜域上。2)在訓(xùn)練階段,對(duì)不同的語(yǔ)音口令建立CDHMM模型。3)在口令識(shí)別階段,通過(guò)概率輸出評(píng)分對(duì)待測(cè)語(yǔ)音口令做出識(shí)別。
語(yǔ)音口令首先經(jīng)過(guò)預(yù)處理,提取MFCC特征參數(shù),然后建立此口令的CDHMM模型,把所有語(yǔ)音口令的模型放在模型庫(kù)中,在識(shí)別階段,通過(guò)概率輸出評(píng)分,取評(píng)分最大的一個(gè)作為識(shí)別出的口令。
評(píng)論