新聞中心

EEPW首頁 > 消費電子 > 設(shè)計應(yīng)用 > 基于小波變換和自相關(guān)函數(shù)的基音頻率檢測算法

基于小波變換和自相關(guān)函數(shù)的基音頻率檢測算法

作者: 時間:2009-05-07 來源:網(wǎng)絡(luò) 收藏

0 引言
基音周期(Pitch)是指發(fā)濁音時聲帶振動所引起的周期運動的時間間隔,而基音是基音周期的倒數(shù)。由于基音周期只具有準(zhǔn)周期性,所有只能采用短時平均方法估計該周期,這個過程也稱為基音(Pitch De―tection)。在對說話人確認(rèn)和辨認(rèn)研究中,基音是一個重要的參數(shù),因此準(zhǔn)確基音有著十分重要的意義。
到目前為止,基音的方法主要有短時自法、平均幅度差法、倒譜解卷積法、Hil―be;t―Huang法等。但尚未找到一個完善的可以適用于不同語音狀況和環(huán)境的基音檢測。近幾年,分析理論發(fā)展迅速。它已經(jīng)被廣泛地應(yīng)用到信號處理中。這里利用的濾波特性對信號進(jìn)行預(yù)處理,然后利用自法檢測語音的基率,該方法利用濾波特性有效剔除了高頻共振峰和噪音的影響,估計基率準(zhǔn)確性高,穩(wěn)定性好,運算速度較快。實驗結(jié)果表明,此方法是一種有效的基率檢測

1 小波及其濾波特征

在多分辨分析中,塔式正交分解L。(R)空間:

本文引用地址:http://m.butianyuan.cn/article/166978.htm


對ν f∈L (R),設(shè)f在Vj上的投影系數(shù)為Cj,k,在wj上的投影系數(shù)為Dj,k(j=J,J一1,…,一J),于是,f有以下分解式:


在式(2)中,第一和式在小波空間中,它表示信號的細(xì)節(jié)部分(即高頻部分),Dj,k就是對應(yīng)于小波函數(shù)φj,k的小波系數(shù);第二和式在尺度空間中(即低頻部分),它反映了信號的本征部分,C-j,k就是對應(yīng)于尺度函數(shù)φ-j,k的尺度系數(shù)。
這里語音信號使用的采樣頻率是11 025 Hz,因此原始語音信號頻帶為0~5 512.5 Hz,如圖1所示,原始語音信號s2d0f占據(jù)頻帶為0~5 512.5 Hz,經(jīng)小波濾波器組濾波后,Sd23f占據(jù)頻帶0~689 Hz,S爭f就是需要的低頻信號,因為語音基音頻率變化范圍從老年男性的50 Hz到兒童和女性的450 Hz,所以這部分的信號將用于估計語音的基音頻率。

2 自函數(shù)估計基音周期
經(jīng)過小波變換后得到低頻語音信號記為:as,用長度為36 ms的矩陣窗對語音信號as進(jìn)行分幀,記第i幀信號為Fi;定義Fi的自相關(guān)函數(shù)(ACF)R(k)為:

其中:N是幀F(xiàn)i的長度;k=0,1,…,N一1;mod是取模運算。
自相關(guān)函數(shù)在基音頻率的整數(shù)倍位置上出現(xiàn)峰值,通過檢測其峰值的位置就可以提取基音頻率值,通常取第一極大值點為基音頻率點。如圖2所示,圖中顯示某一幀采樣頻率fs=11025 Hz語音信號的自相關(guān)函數(shù)曲線,曲線的第一個峰值點x=74,y=4.342,則可以計算出該幀的基音頻率廠fb=fs/74=148.9 Hz。
自相關(guān)函數(shù)估計語音基音頻率一般使用矩形窗,窗長至少大于2個基音周期,語音最小基音頻率為60 Hz,即16.7 ms,所以窗長使用36 ms是合適的。當(dāng)單獨使用自相關(guān)函數(shù)估計基音頻率時,易受共振峰和噪音的影響,如圖3所示,語音信號在小波變換前的自相關(guān)函數(shù)曲線不平滑,給檢測其峰值點造成困難;圖2就是語音信號在小波變換后的自相關(guān)函數(shù)曲線,曲線平滑,容易檢測其峰值點。


上一頁 1 2 3 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉