聲紋鑒定自動識別系統(tǒng)介紹
隨著研究手段和工具的不斷改進,說話人識別的研究逐漸擺脫了早期單純的人耳聽辨模式。
Bell實驗室的 L?G?Kesta用目視觀察語譜圖的方法進行識別,并提出了“聲紋”的概念。
“聲紋鑒定與自動識別技術(shù)研究”項目由公安部物證鑒定中心等單位完成,其主要研究成果是將聲紋自動識別功能植入VS99語音工作站,該系統(tǒng)能對說話人特征進行自動分析、判斷和語圖顯示及測量,并可結(jié)合專家鑒定以確定說話人身份,適合于法庭科學(xué)實際應(yīng)用。本項目研制出當(dāng)前聲紋鑒定工作中非常實用的集聲譜儀和說話人自動識別系統(tǒng)為一體的語音工作站,大大提高了結(jié)論的準(zhǔn)確率,為聲紋鑒定提供了一個實用系統(tǒng)。
◆創(chuàng)新技術(shù):
1.抗噪聲處理
噪聲對檢驗結(jié)果的影響是一個不可忽視的問題。在本系統(tǒng)中對于非平穩(wěn)噪聲,研究人員提出了利用偶數(shù)幀段主分量特征輸入隱馬爾可夫模型(HMM)結(jié)合時間方向平滑處理的SS方法來提高噪聲環(huán)境下漢語連續(xù)語音識別系統(tǒng)魯棒性的方法,取得較好的識別結(jié)果。
2.語音端點檢測
端點檢測可以避免由噪音引起的誤動作以及由噪音引起的誤識別,對于準(zhǔn)確檢測語音信號的起始、提高識別系統(tǒng)精度等有重要意義。采用傳統(tǒng)的語音端點檢測器SAD很容易造成語音激活的漏檢。另外,較大的干擾信號,又有可能被當(dāng)成是語音的激活,造成語音激活的虛檢。為克服這一缺點,研究人員采用一種基于相關(guān)性的語音激活檢測器,定義了一種有效的相關(guān)函數(shù),找到了判別門限設(shè)定方法以及防止漏檢和虛檢的方法。
3.識別算法
本系統(tǒng)采用的是基于GMM模型的優(yōu)化算法。
(1)改進的GMM的模型訓(xùn)練方法
實驗中發(fā)現(xiàn)EM算法存在出現(xiàn)奇異陣的重大缺陷,而最大似然估計(ML),雖然識別率比較低,但不會出現(xiàn)奇異陣。因此研究人員采用最大似然估計(ML)所得模型為初始模型,然后用EM算法中的每步的模型通過α值控制修正比例對其進行修正,稱為改進EM算法。
(2)基于遺傳算法的GMM的模型優(yōu)化算法
研究人員對傳統(tǒng)的遺傳算法進行了改進,用于GMM的參數(shù)優(yōu)化中,大大提高了模型的優(yōu)化程度。
(3)GMM的說話人識別方法的優(yōu)化
研究人員提出了一種新的優(yōu)化的基于GMM的說話人識別方案,該方案通過先對一次發(fā)音對應(yīng)一個模型的各幀似然度做一種特定變化然后再計算該音節(jié)總的似然度,也就是該音節(jié)對應(yīng)該模型的總的評分,記作Sc,與最大Sc所屬模型相對應(yīng)的說話人即為目標(biāo)說話人。
◆社會效益:
目前,公安部物證鑒定中心完成的國家“九五”攻關(guān)成果VS99語音工作站已經(jīng)在國內(nèi)普及,在實際辦案中發(fā)揮了重要作用。該項目是在VS99的基礎(chǔ)上增加自動判別功能,從而進一步提高辦案效率和鑒定的準(zhǔn)確率。
評論