孤立詞語音識別系統(tǒng)的DSP實現(xiàn)
0 引 言
在孤立詞語音識別中,最為簡單有效的方法是采用動態(tài)時間規(guī)整(Dynamic Time Warping,DTW)算法,該算法解決了發(fā)音長短不一的模板匹配問題,是語音識別中出現(xiàn)最早、較為經(jīng)典的一種算法。用于孤立詞識別,該算法較現(xiàn)在比較流行的HMM算法在相同的環(huán)境條件下,識別效果相差不大,但HMM算法要復雜的多,這主要體現(xiàn)在HMM算法在訓練階段需要提供大量的語音數(shù)據(jù),通過反復計算才能得到模型參數(shù),而DTW算法的訓練中幾乎不需要額外的計算。所以在孤立詞語音識別中,DTW算法仍得到廣泛的應用。本系統(tǒng)就采用了該算法。
1 系統(tǒng)概述
語音識別系統(tǒng)的典型實現(xiàn)方案如圖1所示。輸入的模擬語音信號首先要進行預處理,包括預濾波、采樣和量化、加窗、斷點檢測、預加重等。語音信號經(jīng)過預處理后,接下來重要的一環(huán)就是特征參數(shù)提取,其目的是從語音波形中提取出隨時間變化的語音特征序列。然后建立聲學模型,在識別的時候?qū)⑤斎氲恼Z音特征同聲學模型進行比較,得到最佳的識別結果。
2 硬件構成
2.1 系統(tǒng)構成
這里采用DSP芯片為核心(圖2),系統(tǒng)包括直接雙訪問快速SRAM、一路ADC/一路DAC及相應的模擬信號放大器和抗混疊濾波器。外部只需擴展FLASH存儲器、電源模塊等少量電路即可構成完整系統(tǒng)應用。
評論