對(duì)線性預(yù)測(cè)語(yǔ)音解壓縮方法的探討

作者：時(shí)間：2006-05-07 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

摘要：本文針對(duì)常見(jiàn)的語(yǔ)音壓縮方法，具體敘述了線性預(yù)測(cè)編碼的基本原理及具體格式，并對(duì)算法實(shí)現(xiàn)的軟件及硬件進(jìn)行了詳細(xì)的分析。

本文引用地址：http://m.butianyuan.cn/article/242240.htm

關(guān)鍵詞：線性預(yù)測(cè)編碼格形濾波器 PWM MATLAB

引言

現(xiàn)實(shí)生活中，有大量語(yǔ)音數(shù)字存儲(chǔ)和傳輸、語(yǔ)音綜合、說(shuō)話人確認(rèn)和辨認(rèn)、語(yǔ)音識(shí)別的應(yīng)用，這些應(yīng)用需要處理的數(shù)據(jù)量很大，這必須采用一定的壓縮方法進(jìn)行處理。

對(duì)頻率范圍為300Hz——3000Hz的語(yǔ)音，諸如電腦語(yǔ)音圖書(shū)、真人發(fā)聲電子字典、語(yǔ)言學(xué)習(xí)機(jī)等，只需要一般的語(yǔ)音壓縮方法，而對(duì)20Hz——20KHz的音樂(lè)，則需高級(jí)的壓縮方法。當(dāng)然，在選擇語(yǔ)音表示方法時(shí)，數(shù)據(jù)壓縮率不是唯的考慮，還要考慮價(jià)格、表示的靈活性、語(yǔ)音考慮價(jià)格、表示的靈活性、語(yǔ)音的質(zhì)量等諸多因素。在選擇信號(hào)表示以及隨后作用的數(shù)字信號(hào)處理方法時(shí)最重要的考慮還是應(yīng)用的實(shí)際需要。

針對(duì)我們目前開(kāi)發(fā)的發(fā)音電子字典及語(yǔ)音學(xué)習(xí)機(jī)等產(chǎn)生，既需要音質(zhì)清晰又要價(jià)格便宜，我們考慮采用參數(shù)表示語(yǔ)音信號(hào)的LPC，MELP，CELP壓縮方法。

LPC（Linear Predictive Coding-線性預(yù)測(cè)編碼），是一種低速率的語(yǔ)音參數(shù)表示方法，它根據(jù)最小的方誤差的準(zhǔn)則，用過(guò)去的若干語(yǔ)音數(shù)字信號(hào)來(lái)預(yù)測(cè)當(dāng)前的語(yǔ)音信號(hào)，將估算出來(lái)的語(yǔ)音參數(shù)送到語(yǔ)音合成模型后輸出語(yǔ)音。混合激勵(lì)線性預(yù)測(cè)MELP和碼本激勵(lì)線性預(yù)測(cè)CELP也是基于線性預(yù)測(cè)上的語(yǔ)音壓縮方法，數(shù)據(jù)壓縮量銷(xiāo)遜于LPC，但因其語(yǔ)音數(shù)據(jù)的制作不需要專門(mén)的硬件與有經(jīng)驗(yàn)的調(diào)音人員，在語(yǔ)音產(chǎn)品的開(kāi)發(fā)中也得到了廣泛的應(yīng)用，本文重點(diǎn)描述LPC算法的軟件和硬件實(shí)現(xiàn)。

LPC原理簡(jiǎn)述

LPC語(yǔ)音編碼的基礎(chǔ)是語(yǔ)音產(chǎn)生模型，它模擬人的發(fā)生過(guò)程。在這個(gè)模型中，語(yǔ)音信號(hào)分為清音和濁間，在濁音時(shí)聲道中產(chǎn)生對(duì)應(yīng)音調(diào)周期的脈沖列，而在清音時(shí)，則產(chǎn)生白噪聲序列，語(yǔ)音就是由這些激勵(lì)信號(hào)激勵(lì)一個(gè)自適應(yīng)濾波器（即全極點(diǎn)濾波器）產(chǎn)生的。

LPC濾波器的參數(shù)ak是通過(guò)線性預(yù)測(cè)的方法，即用若干過(guò)去的樣值預(yù)測(cè)當(dāng)前樣值提取的，預(yù)測(cè)值與真值之間的誤差滿足最小均方誤差準(zhǔn)則。參數(shù)隨時(shí)間逐幀更新，更新速率30～100次/秒，即幀移為10～33ms。在每幀之間對(duì)參數(shù)進(jìn)行內(nèi)插以適應(yīng)參數(shù)隨時(shí)間緩慢變化。

因此，LPC模型只需傳輸增益系數(shù)，濁音和清音的判決信息、濁音音調(diào)和全極點(diǎn)濾波器的參數(shù){ak}，k=1，…p，用超低BIT率便可實(shí)現(xiàn)語(yǔ)音信號(hào)的傳送。這種高壓縮率可以大大降低語(yǔ)音識(shí)別中的存儲(chǔ)量。

語(yǔ)音合成模型見(jiàn)圖1。

LPC軟件實(shí)現(xiàn)

LPC算法的實(shí)現(xiàn)有直接法、協(xié)方差法、自相關(guān)法、斜格法等諸多分析方法。其中斜格法能解決精度和穩(wěn)定度的矛盾，它是以格形濾波器為基礎(chǔ)。我們所用的LPC聲碼器就是作斜格法來(lái)實(shí)現(xiàn)線性預(yù)測(cè)。

線性預(yù)測(cè)編碼算法的編碼格式中，有10個(gè)線性預(yù)測(cè)系數(shù)K1-K10、增益、音調(diào)、重復(fù)位總紅共編碼成54bits。

LPC各幀參數(shù)編碼格式見(jiàn)表1。

在解碼時(shí)，要對(duì)接收的數(shù)值進(jìn)行轉(zhuǎn)換與插值。其算法接收的的數(shù)值進(jìn)行轉(zhuǎn)換與插值。其算法流程見(jiàn)圖2.

線性預(yù)測(cè)系數(shù)、增益、基音周期等參數(shù)值每個(gè)基音周期更新一次，清音幀、濁音幀及靜音幀間相互轉(zhuǎn)換時(shí)不進(jìn)行插值更新。濁音和清音的激勵(lì)信號(hào)是按基音周期從內(nèi)部ROM區(qū)取出輸入到音調(diào)寄存器，與增益相乘后送到LPC濾波器。

LPC硬件實(shí)現(xiàn)

在線性預(yù)測(cè)分析中，語(yǔ)音信號(hào)直接決定一組預(yù)測(cè)系數(shù)，但由于語(yǔ)音信號(hào)有時(shí)變特性，為保證語(yǔ)音信號(hào)在短時(shí)間內(nèi)預(yù)測(cè)參數(shù)及頻率固定，實(shí)驗(yàn)以固定頻率聲響最后一響“嘀”為對(duì)象，對(duì)LPC聲碼器的硬件部分進(jìn)行測(cè)試。首先，借助專用的LPC編碼設(shè)備生成PCL十六進(jìn)制格式數(shù)據(jù)見(jiàn)表2。

從以上數(shù)據(jù)可以知道此語(yǔ)音由靜音幀、濁音幀和停止幀組成。第一幀是靜音幀，最后一幀是停止幀，中間40幀是濁音幀，該40個(gè)濁音幀具有相同的能量、音調(diào)及K參數(shù)。經(jīng)分析得出能量值、音調(diào)及其K參數(shù)（見(jiàn)表3）。

表3 各參數(shù)計(jì)算值

名稱	位數(shù)	標(biāo)號(hào)（二進(jìn)制）	標(biāo)號(hào)（十六制進(jìn)）	查表值	實(shí)際參數(shù)值
增益	4	1001	9H	1AH	208
重復(fù)幀	1	0	0	0	0
音調(diào)	7	0000001	1H	100H	500HZ
K1	6	101111	2FH	FECH	-0.009765625
K2	6	010111	17H	0	0
K3	5	10111	17H	14H	0.15625
K4	5	01011	BH	F9H	-0.0546825
K5	4	0101	5H	F3H	-0.1015625
K6	4	0100	4H	FCH	-0.03125
K7	4	1001	9H	14H	0.15625
K8	3	111	7H	58H	0.6875
K9	3	101	5H	10H	0.125
K10	3	101	5H	11H	0.1328125
K11	0
K12	0

我們借助MATLAB工個(gè)搭成了12組格形濾波器及二階低通濾波器來(lái)模擬LPC模型中的數(shù)字濾波器，見(jiàn)圖3。將帶有增益的濁音送入輸入端，線性預(yù)測(cè)系數(shù)送入格形濾波器，濾波器采用10KHz采樣。

填入其余相應(yīng)的參數(shù)后開(kāi)始仿真，得出的結(jié)果見(jiàn)圖4。

從圖中可以看出，不考慮頻率因素，對(duì)增益、預(yù)測(cè)參數(shù)固定的這組語(yǔ)音數(shù)據(jù)而言，實(shí)驗(yàn)結(jié)構(gòu)最后超趨近于1024。

把數(shù)據(jù)1024輸入PWM寄存器，經(jīng)過(guò)12位的脈寬調(diào)制（PWM）進(jìn)行D/A轉(zhuǎn)換處理，可得出輸出模擬信號(hào)，占空比為：

1024/2048=0.5

同時(shí)，我們通過(guò)示波器直接測(cè)試語(yǔ)音芯片的DAC+端，可以觀察到頻率為500Hz、占空比為0.5的一系列的矩形脈沖見(jiàn)圖5，波形結(jié)果與通過(guò)MATLAB工具搭成的電路結(jié)果一致。

結(jié)語(yǔ)

我們對(duì)PLC，MELP，CELP不可逆語(yǔ)音壓縮法進(jìn)行測(cè)試，得出了LPC語(yǔ)音合成格式、算法流程以及硬件12級(jí)格式、算法流程以及硬件12級(jí)形波器、低通濾波器的具體實(shí)現(xiàn)形式。從實(shí)驗(yàn)可以證明LPC算法是通過(guò)軟件從語(yǔ)音數(shù)據(jù)包提取數(shù)據(jù)，經(jīng)過(guò)軟件查表計(jì)算后將相應(yīng)的參數(shù)送往硬件各部分處理，最后合成語(yǔ)音。

新聞中心

對(duì)線性預(yù)測(cè)語(yǔ)音解壓縮方法的探討

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)