基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的實(shí)現(xiàn)

作者：時(shí)間：2010-09-15 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

通過(guò)上述IIS總線能夠得到輸入的音頻數(shù)據(jù)信號(hào)，而其它的信號(hào)如自動(dòng)增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等控制信號(hào)通過(guò)稱為“L3”形式的接口總線傳輸。為了減少引腳數(shù)和保持連線簡(jiǎn)單，該接口總線采用串行數(shù)據(jù)傳輸方式，接口總線由3條信號(hào)線組成：時(shí)分復(fù)用的數(shù)據(jù)通道線L3DATA、模式控制線L3MODE和時(shí)鐘信號(hào)線L3CLOCK。模式控制線L3MODE為低電平時(shí)的傳輸模式為地址傳輸模式；為高電平時(shí)的傳輸模式為數(shù)據(jù)傳輸模式。
語(yǔ)音口令識(shí)別系統(tǒng)的硬件電路的核心芯片是嵌入式微處理器Samsung S3C2440 AL，主頻為400MHz。三星公司推出的RISC微處理器S3C2440 AL具有低功耗、高性能等特點(diǎn)，可以廣泛應(yīng)用于便攜式設(shè)備中。S3C2440AL具有一個(gè)IIS總線音頻編碼／解碼接口，語(yǔ)音口令識(shí)別系統(tǒng)的硬件電路如圖2所示。其IIS總線控制器通過(guò)5根信號(hào)線與UDAl34lTS編解碼芯片相連。這些5根信號(hào)線分別是：系統(tǒng)時(shí)鐘信號(hào)CDCLK：位時(shí)鐘信號(hào)I2-SSCLK；字選擇控制信號(hào)I2SLRCK；串行數(shù)據(jù)輸入信號(hào)I2SSDI；串行數(shù)據(jù)輸出信號(hào)I2SDO。S3C2440 AL使用L3接口傳輸其他(如自動(dòng)增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等)控制信號(hào)。為了使系統(tǒng)間能夠更好地同步，S3C2440AL需要向芯片UDAl341TS提供CDCLK，該時(shí)鐘信號(hào)的頻率可以選擇采樣頻率的256倍、384倍或512倍。

本文引用地址：http://m.butianyuan.cn/article/151538.htm

2 基于CDHMM的口令識(shí)別的軟件設(shè)計(jì)
2．1 口令識(shí)別的軟件系統(tǒng)框圖
語(yǔ)音口令識(shí)別的軟件系統(tǒng)分別由特征參數(shù)提取、語(yǔ)音模型庫(kù)和概率輸出評(píng)分三大模塊組成，如圖3所示：1)語(yǔ)音口令特征參數(shù)的提取，輸入不同的語(yǔ)音口令，首先要進(jìn)行特征參數(shù)提取，采用Mel頻率參數(shù)作為CDHMM的建模參數(shù)，Mel頻率參數(shù)是根據(jù)人耳的聽覺(jué)特性將語(yǔ)音信號(hào)的頻譜轉(zhuǎn)化為基于Mel頻率的非線性頻譜，然后轉(zhuǎn)換到倒譜域上。2)在訓(xùn)練階段，對(duì)不同的語(yǔ)音口令建立CDHMM模型。3)在口令識(shí)別階段，通過(guò)概率輸出評(píng)分對(duì)待測(cè)語(yǔ)音口令做出識(shí)別。

語(yǔ)音口令首先經(jīng)過(guò)預(yù)處理，提取MFCC特征參數(shù)，然后建立此口令的CDHMM模型，把所有語(yǔ)音口令的模型放在模型庫(kù)中，在識(shí)別階段，通過(guò)概率輸出評(píng)分，取評(píng)分最大的一個(gè)作為識(shí)別出的口令。

上一頁(yè) 1 2 3 下一頁(yè)

新聞中心

基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的實(shí)現(xiàn)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)