基于ACELP語音編譯碼算法的軟件實現(xiàn)及應用

作者：時間：2016-10-10 來源：網(wǎng)絡

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

摘要：文中針對Tetra通信系統(tǒng)中采用的ACELP算法，分析了該算法的基本原理，介紹了其算法基于VC++6.0的軟件實現(xiàn)過程，重點闡述了ACELP在網(wǎng)絡通信中的實現(xiàn)及應用情況。

本文引用地址：http://m.butianyuan.cn/article/201610/306455.htm

隨著通信技術(shù)的快速發(fā)展，語音編碼技術(shù)發(fā)展越來越迅速、應用越來越廣泛。TETRA(Terrestrial Trunked Radio)集群通信系統(tǒng)是歐洲電信標準協(xié)會ETSI制定的數(shù)字集群移動通信標準。近幾年發(fā)展很快，其產(chǎn)品已被包括我國在內(nèi)的世界多個國家廣泛采用。TETRA承載的語音通信業(yè)務采用ACELP語音編碼算法，該算法是一種改進型的CELP，它繼承了傳統(tǒng)CELP的主要優(yōu)點，并克服了其缺點。傳統(tǒng)CELP用固定的隨機碼本來逼近語音信號的余量信號，缺乏靈活性，不能很好地控制碼本的頻域特性。ACELP采用代數(shù)碼本結(jié)構(gòu)，不僅降低了碼本的存儲量和搜索量，還提供了頻域控制函數(shù)，從而增強了碼本的靈活性和多樣性，能更好地逼近余量信號，保證了高質(zhì)量的語音服務。該算法占用帶寬較小，其編碼速率僅為4.567 kbps，同時編碼語音質(zhì)量高，特別適合多媒體語音通信使用。目前該算法已有許多在嵌入式系統(tǒng)中實現(xiàn)的方案，但由于編譯環(huán)境以及硬件條件的限制，應用不夠靈活方便，因此本文基于Visual C++軟件編程技術(shù)，采用服務器與客戶端網(wǎng)絡通信模式，在服務器端采用聲卡對語音信號進行實時AD采樣，對采樣數(shù)據(jù)進行ACELP語音編碼處理，并將編碼后數(shù)據(jù)通過網(wǎng)絡實時發(fā)送到客戶端;在客戶端實時接收服務器端發(fā)送的語音編碼數(shù)據(jù)并進行軟件譯碼處理，同時將譯碼后數(shù)據(jù)采用聲卡進行實時播放，從而實現(xiàn)基于ACELP算法的網(wǎng)絡語音通信。

1 ACELP語音編譯碼算法的基本原理

ACELP是一種改進的代數(shù)碼本激勵線性預測算法，該算法要求輸入語音信號為8 kHz采樣、16比特量化，信號以30 ms分幀，每一幀分為4個子幀，每個子幀7.5 ms，每幀數(shù)據(jù)編碼后為137比特，包括線性預測參數(shù)、基音延遲T、最佳碼本索引和最佳增益參數(shù)。編碼器原理框圖如圖1所示。

編碼過程主要由短時預測、長時線性預測、碼本搜素和增益計算等組成。其中短時預測提取聲道濾波器的LPC系數(shù)并進行插值和量化;長時線性預測通常分為開環(huán)基音分析和閉環(huán)基音分析兩步，開環(huán)基音分析每幀數(shù)據(jù)(30 ms)處理一次，采用自相關(guān)法估算基音周期，按較低基音延遲優(yōu)先的原則獲取基音周期的大致范圍，閉環(huán)基音分析基于子幀完成，每7.5 ms處理一次，以獲取基音周期的準確值;碼本搜索和增益計算主要用于計算合適的碼本和增益，使重建語音的質(zhì)量具有更高的清晰度和自然度。

解碼過程就是將線性預測參數(shù)、基音延遲T、最佳碼本索引和最佳增益參數(shù)等各個編碼參數(shù)等從編碼比特流中提取出來，重構(gòu)輸出信號和各個濾波器，最后得到重構(gòu)語音。解碼過程以分幀為單位進行。首先將LSP矢量轉(zhuǎn)換為LP濾波器系數(shù)，然后通過基音延時查找基音的整數(shù)和分數(shù)分量，將激勵進行解碼，對解碼后的激勵信號通過后基音濾波器送入合成濾波器，得到合成信號。合成信號經(jīng)過共振峰后濾波器和增益放大單元控制得到語音信號。其ACELP解碼原理框圖如圖2所示。

2 ACELP語音編譯碼算法的軟件實現(xiàn)概述

根據(jù)ACELP語音編譯碼算法原理.本文基于VC++6.0軟件平臺，采用面向?qū)ο笏枷?，編制CTetra_ACELP_Cod類和CTetra_ACELP_Dec類分別實現(xiàn)語音信號編、譯碼。另外，本文采用動態(tài)鏈接庫方式對編譯碼類進行封裝，接口簡潔，使用方便。

2.1 CTetra_ACELP_Cod編碼類

該類為ACELP語音編碼類，主要實現(xiàn)對輸入該模塊的8 kHz采樣，16比特量化的語音樣點數(shù)據(jù)流進行編碼，類的主要函數(shù)定義如下：

其中Init(TETRA_ACELP_COD_PARAM*pCodParam)函數(shù)完成編碼模塊初始化工作，TETRA_ACELP_COD_PARAM結(jié)構(gòu)體參數(shù)實時存儲編碼過程中相關(guān)參數(shù)。void PreProcess(Word16 signal[]，Word16 lg)函數(shù)完成待編碼語音信號幀的預處理。ACELPCod(Word16 signal[]，Word16parm[]，TETRA_ACELP_COD_PARAM*pCodParam)函數(shù)完成語音編碼處理，signal[]參數(shù)為待編碼的語音樣本幀數(shù)據(jù)，parm[]為編碼后參數(shù)。Prm2 bi ts(Word16 prm[]，Word16 bits[])函數(shù)實現(xiàn)編碼參數(shù)到比特流的轉(zhuǎn)化。

2.2 CTetra_ACELP_Dec編碼類

該類為ACELP語音譯碼類，主要實現(xiàn)對輸入該模塊編碼數(shù)據(jù)幀(137比特幀長)進行譯碼處理，輸出8KHz采樣，16比特量化的語音數(shù)據(jù)。類的主要函數(shù)定義如下：

其中Init(TETRA_ACELP_DEC_PARAM*pDecParam)函數(shù)完成譯碼模塊的初始化工作，TETRA_ACELP_DEC_PARAM結(jié)構(gòu)體參數(shù)實時存儲譯碼過程中相關(guān)參數(shù)。Bits2prm(Word16 bits[]，Word16 prm[])函數(shù)實現(xiàn)137比特幀數(shù)據(jù)到ACELP編碼參數(shù)的轉(zhuǎn)化。ACELPDec(Word16 parm[]，Word16 synth[]，TETRA_ACELP_DEC_PARAM*pDecParam)函數(shù)完成編碼參數(shù)的譯碼處理。編碼參數(shù)通過ana數(shù)組返回。PostProcess(Word16 signal[]，Word16 lg)對合成語音進行后處理工作。

2.3 動態(tài)鏈接庫封裝接口介紹

其中bits為137比特編碼比特幀，signal為240*16bits的語音樣點數(shù)據(jù)，pCodParam和pDecParam為編、譯碼過程中的中間結(jié)構(gòu)體參量。

3 ACELP編譯碼算法在網(wǎng)絡通信中的應用

采用網(wǎng)絡服務器、客戶端通信模式，將ACELP編譯碼模塊應用到網(wǎng)絡語音通信中，最終實現(xiàn)了基于ACELP算法的網(wǎng)絡語音通信。具體通信過程為：服務器端采用聲卡以8 kHz采樣，16比特量化方式對語音信號進行實時采集，對采集到的語音信號每240樣點作為一幀送入ACELP編碼模塊進行壓縮編碼，壓縮后編碼數(shù)據(jù)幀長為137比特，每幀數(shù)據(jù)進一步封裝處理后通過網(wǎng)絡實時發(fā)送到客戶端。客戶端通過網(wǎng)絡實時接收服務器端編碼語音數(shù)據(jù)包，經(jīng)ACELP譯碼處理后實時發(fā)送到聲卡進行播放處理，從而實現(xiàn)網(wǎng)絡語音通信。

3.1 語音信號實時采集與播放技術(shù)實現(xiàn)

在語音信號實時采集與播放實現(xiàn)過程中，如何實現(xiàn)聲卡采集與播放數(shù)據(jù)的實時性、連續(xù)性和可靠性是軟件設計的關(guān)鍵所在。在本文軟件系統(tǒng)中，通過直接凋用Windows最底層波形音頻接口函數(shù)，實現(xiàn)聲卡的編程控制，系統(tǒng)中采用了多線程多緩沖技術(shù)，即在服務器端，聲卡采集與語音壓縮編碼使用不同的工作線程，同時給聲卡提供多個用于承載采集數(shù)據(jù)的緩沖區(qū)，在同一時刻部分緩沖區(qū)供聲卡采集線程裝載數(shù)據(jù)的同時，另外已經(jīng)裝滿數(shù)據(jù)的緩沖區(qū)供語音壓縮數(shù)據(jù)處理線程處理，從而使得語音信號采集和壓縮編碼處理工作同時進行，有效保證了采集數(shù)據(jù)的連續(xù)性和信號處理的實時性。服務器端聲卡實時采集原理框圖如圖3所示。

3.2 網(wǎng)絡通信技術(shù)實現(xiàn)

軟件系統(tǒng)采用客戶/服務器模式和TCP/IP協(xié)議，利用Socket套接字編程技術(shù)實現(xiàn)數(shù)據(jù)接收與發(fā)送。其中數(shù)據(jù)接收模塊采用VC++的CSo cket類，具體通信過程為：1)程序啟動的時候在指定端口創(chuàng)建網(wǎng)絡監(jiān)聽套接字，用以監(jiān)聽客戶端的連接請求。2)當有客戶請求連接時，創(chuàng)建接收套接字與客戶端建立連接。3)當有數(shù)據(jù)需要接收時，CAcceptSocket響應OnReceive消息，調(diào)用Receive函數(shù)從緩沖里獲取客戶端傳來的數(shù)據(jù)，實時的交給ACELP譯碼線程進行譯碼還原處理。4)當通信結(jié)束時，關(guān)閉監(jiān)聽套接字和接收套接字并釋放資源。數(shù)據(jù)發(fā)送接口采用SOCKET通信技術(shù)，為了使系統(tǒng)在實時編碼處理的同時及時將編碼數(shù)據(jù)發(fā)送到服務器端，軟件采用多線程技術(shù);同時為了避免由于待發(fā)送數(shù)據(jù)流不均勻?qū)е碌臄?shù)據(jù)幀丟失等情況發(fā)生，系統(tǒng)采用了多緩沖機制。主程序編碼模塊將要發(fā)送的編碼數(shù)據(jù)源源不斷的向緩沖隊列中寫，同時發(fā)送線程不斷的檢測緩沖隊列中緩沖情況，當有緩沖滿時及時進行發(fā)送。由于多線程與多緩沖機制的有效使用，使得網(wǎng)絡通信能夠?qū)崟r高效的運行。

3.3 系統(tǒng)情況介紹

該系統(tǒng)實現(xiàn)了基于ACELP算法的網(wǎng)絡語音通信，能夠?qū)νㄐ胚^程中的語音波形樣本數(shù)據(jù)、ACELP編碼數(shù)據(jù)等進行實時存儲和網(wǎng)絡發(fā)送，對通行過程中的波形進行實時顯示等。系統(tǒng)運行穩(wěn)定，延遲較小，語音通信質(zhì)量較好。圖4所示為本文設計的軟件系統(tǒng)運行截圖。

4 結(jié)束語

文中研究了TETRA系統(tǒng)采用的ACELP語音編譯碼算法，在此基礎(chǔ)上基于VC++編程技術(shù)實現(xiàn)ACELP編、譯碼軟件模塊，并采用動態(tài)鏈接庫對其進行封裝處理，接口簡單，使用方便。最后開發(fā)相應系統(tǒng)，實現(xiàn)了ACELP編譯碼算法在網(wǎng)絡語音通信中的應用。經(jīng)實踐證明，ACELP算法編碼質(zhì)量高，性能優(yōu)異，具有較好的應用價值。

新聞中心

基于ACELP語音編譯碼算法的軟件實現(xiàn)及應用

評論

相關(guān)推薦

技術(shù)專區(qū)