基于Windows CE的語音口令識別系統(tǒng)的設(shè)計
圖1 語音口令識別系統(tǒng)的程序流程圖。
當(dāng)語音口令識別系統(tǒng)采集到命令語音信號后,要提取參數(shù),做出比較判斷,調(diào)用相應(yīng)語音口令識別算法。對每條語音口令信號,先切除靜音,進行預(yù)加重處理,然后通過Hamming窗分幀,幀長和幀移分別為20ms和10ms,對每一幀語音信號提取16階MFCC和△MFCC一共32維參數(shù)作為特征矢量。
語音口令識別軟件系統(tǒng)由許多不同的語音信號預(yù)處理、識別算法和其它子程序組成,為了實現(xiàn)參數(shù)的傳遞,每個程序執(zhí)行后的參數(shù)以文件的形式輸出,而這些程序的調(diào)用先后順序和參數(shù)的輸入輸出文件的位置等都由一個主程序管理。
在Windows CE中,編寫可執(zhí)行程序,需要調(diào)用應(yīng)用程序編程接口API(Application Programming Interface)函數(shù),并且要設(shè)定程序入口點。調(diào)用過程為:
無論是進行語音口令訓(xùn)練還是語音口令識別操作,都需要對語音口令信號的采集和實時處理程序,所以對語音口令信號的采集和實時處理程序是語音口令識別系統(tǒng)軟件中的重要部分之一。對于語音音頻接口的管理是通過Windows CE 5.0里的API函數(shù)完成的,對語音口令信號的采集和實時處理程序流程圖如圖2所示。
評論