新聞中心

EEPW首頁(yè) > EDA/PCB > 設(shè)計(jì)應(yīng)用 > 基于片上系統(tǒng)SoC的孤立詞語(yǔ)音識(shí)別算法設(shè)計(jì)

基于片上系統(tǒng)SoC的孤立詞語(yǔ)音識(shí)別算法設(shè)計(jì)

作者: 時(shí)間:2012-04-01 來(lái)源:網(wǎng)絡(luò) 收藏

3.2 LPCC特征參數(shù)提取

LPC參數(shù)是模擬人的發(fā)聲器官的,是一種基于語(yǔ)音合成的特征參數(shù)。在實(shí)際應(yīng)用中,使用較多的是由LPC系數(shù)推導(dǎo)出的另一種系數(shù),線性預(yù)測(cè)倒譜系數(shù)LPCC(Linear Predictive Ceptrum Coefficients)。

3.2.1線性預(yù)測(cè)編碼LPC算法

LPC模型的基本思想是:對(duì)于給定一n時(shí)刻采樣的語(yǔ)音信號(hào)采樣值s(n),可以用p個(gè)取樣值的加權(quán)和線性組合來(lái)表示[4]。 a1, a2,…, ap稱為L(zhǎng)PC系數(shù),也是全極點(diǎn)H(z)模型的參數(shù)。

7.jpg

cm為倒譜系數(shù),am為線性預(yù)測(cè)系統(tǒng),m為倒譜系數(shù)的階數(shù),p為線性預(yù)測(cè)系統(tǒng)的階數(shù)。這樣利用LPC系數(shù)通過(guò)遞推公式可以得到LPCC參數(shù)。LPCC由于利用了線性預(yù)測(cè)中聲道系統(tǒng)函數(shù)的最小相位特性,避免了相位卷積、求復(fù)對(duì)數(shù)

3.3 基于DTW的模式匹配

3.3.1 動(dòng)態(tài)時(shí)間規(guī)整DTW算法

存入模板庫(kù)的各個(gè)詞條稱為參考模板,一個(gè)參考模板可表示為R={R(1), R(2),…, R(m),…, R(M)}。m為訓(xùn)練語(yǔ)音幀的時(shí)序標(biāo)號(hào),m =1為起點(diǎn)語(yǔ)音幀,m =M為終點(diǎn)語(yǔ)音幀,M為該模式包含的語(yǔ)音幀總數(shù),R(m)為第m幀的語(yǔ)音LPC倒譜特征矢量。所要識(shí)別的一個(gè)輸入詞條語(yǔ)音稱為測(cè)試模板,可表示為T(mén)={T (1), T(2),…, T(n),…, T (N)},n為測(cè)試語(yǔ)音幀標(biāo)號(hào),模式中共包含N幀語(yǔ)音,T(n)為第n幀的LPC倒譜特征矢量。

比較參考模板和測(cè)試模板的相似度,可以計(jì)算它們的距離D[T,R],距離越小則相似度越高。語(yǔ)音中各個(gè)段落在不同情況下的持續(xù)時(shí)間會(huì)產(chǎn)生或長(zhǎng)或短的變化,大多數(shù)情況下測(cè)試模板和參考模板長(zhǎng)度不相等N≠M,因此采用動(dòng)態(tài)規(guī)整(DP)的方法。

DTW算法的實(shí)現(xiàn)為:分配兩個(gè)N×M矩陣,分別為累積距離矩陣D和幀匹配距離矩陣d,其中幀匹配距離矩陣d(i,j)的值為測(cè)試模板的第i幀與參考模板的第j幀間的距離。算法分為兩步:先要計(jì)算參考模板的所有幀和未知模板的所有幀之間的相互距離,結(jié)果存在矩陣d中;然后根據(jù)判斷函數(shù)計(jì)算累積距離矩陣D,D(N,M)即為最佳匹配路徑所對(duì)應(yīng)的匹配距離。DTW算法約束端點(diǎn)條件為:起點(diǎn)(1,1),終點(diǎn)(n,m),n和m分別為測(cè)試和參考語(yǔ)音模板的幀序列長(zhǎng)度。

3.3.2 應(yīng)用中提高識(shí)別率的改進(jìn)方法

在應(yīng)用中,提高DTW識(shí)別率的辦法有冗余模板法、松弛起點(diǎn)終點(diǎn)法、改進(jìn)局部路徑約束函數(shù)法等。

(1)冗余模板法。采用每個(gè)詞條多套模板的方法,可以改進(jìn)其識(shí)別效果。在實(shí)驗(yàn)中,采用在語(yǔ)音訓(xùn)練階段,每個(gè)詞條訓(xùn)練四次,即每個(gè)詞條提取出4個(gè)參考模板,這樣,只要測(cè)試模板與4個(gè)參考模板中的一個(gè)匹配成功,匹配結(jié)果就是正確的,這樣便大大提高了識(shí)別率。

(2)松弛起點(diǎn)終點(diǎn)法。將匹配過(guò)程中的固定起點(diǎn)(終點(diǎn))改為松弛起點(diǎn)(終點(diǎn))。端點(diǎn)對(duì)齊的限制條件提高了對(duì)語(yǔ)音端點(diǎn)檢測(cè)的精度要求。路徑不再是從(1,1)點(diǎn)出發(fā),可以從(n,m)=(1,2)或(2,1),或(1,3)或(3,1)…點(diǎn)出發(fā),稱為松弛起點(diǎn)。同樣,路徑也不必在(N,M)點(diǎn)結(jié)束,可在(n,m)=(N,M-1)或(N-1,M)或(N,M-2)或(N-2,M)點(diǎn)…結(jié)束,稱為松弛終點(diǎn)。松弛起點(diǎn)終點(diǎn)的優(yōu)點(diǎn)是可克服由于端點(diǎn)檢測(cè)不精確造成測(cè)試模板和參考模板起點(diǎn)終點(diǎn)不能嚴(yán)格對(duì)齊的問(wèn)題[6]。

(3)改變局部路徑約束函數(shù)法。不同的連續(xù)性條件導(dǎo)致了不同的路徑,局部路徑約束函數(shù)不一樣,DTW識(shí)別效果就會(huì)不同??梢詫?duì)局部約束路徑進(jìn)行加權(quán)處理,提高識(shí)別率。

8.jpg

本文中采用的模板匹配算法就是融合這三種改進(jìn)技術(shù)后的動(dòng)態(tài)規(guī)整算法,稱之為ADTW算法。對(duì)這種算法進(jìn)行了實(shí)驗(yàn),得到該算法的實(shí)際識(shí)別率,并對(duì)之進(jìn)行分析。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉