小波變換在Internet網(wǎng)多媒體業(yè)務(wù)中的應(yīng)用
摘要:介紹了小波變換在靜態(tài)圖像壓縮、實時連續(xù)媒體流等多媒體業(yè)務(wù)中的應(yīng)用,并結(jié)合ADV611芯片提出一套音視頻數(shù)據(jù)采集和壓縮的方案。為進(jìn)一步提高媒體服務(wù)質(zhì)量,在本方案中根據(jù)實際情況提出了幀間壓縮和碼率控制兩種解決方案。
本文引用地址:http://m.butianyuan.cn/article/242388.htm關(guān)鍵詞:小波變換 圖像壓縮 實時連續(xù)媒體流 碼率控制 幀間編碼
隨著網(wǎng)絡(luò)用戶對多媒體業(yè)務(wù)需求的大量增加,基于Internet的音視頻數(shù)據(jù)采集、壓縮技術(shù)成為各種多媒體業(yè)務(wù)運營的基本要求,國際標(biāo)準(zhǔn)化組織提出了多種國際標(biāo)準(zhǔn)(H.26X、MPEG-4等)來實現(xiàn)低碼率及甚低碼率下的多媒體數(shù)據(jù)壓縮、傳輸及存儲。而國內(nèi)外各大網(wǎng)絡(luò)軟硬件廠商紛紛出臺相應(yīng)的解決方案。在這些標(biāo)準(zhǔn)、方案中,小波變換使信號的低頻長時特性和高頻短時特性同時得到處理,有效地克服了傅氏變換在處理非常平穩(wěn)復(fù)雜圖像信號時所存在的局限性,因而各種多媒體業(yè)務(wù)應(yīng)用領(lǐng)域受到了廣泛的重視[1、2]。本文將以此為基礎(chǔ)對小波變換這一工具應(yīng)用到圖像壓縮、實時連續(xù)媒體流等領(lǐng)域做一些有益的嘗試與探討。
1 小波變換在圖像壓縮中的應(yīng)用
小波變換以其特有的變換特性在圖像壓縮領(lǐng)域得到了廣泛的應(yīng)用。如JPEG-2000、MPEG-4靜態(tài)圖像壓縮都采用了小波變換的方式。對于小波變換在靜態(tài)圖像壓縮中的應(yīng)用已經(jīng)有很多文獻(xiàn)對此做出了論述,此處不再贅述。以下只討論應(yīng)用價值更為廣闊的小波算法的硬件實現(xiàn)。
1.1 小波算法的硬件實現(xiàn)
美國AD公司的ADV611數(shù)字視頻編解碼芯片是一款低價、單片、多功能、全數(shù)字的CMOS超大規(guī)模集成電路,片內(nèi)集成了視頻接口、主機接口和SRAM,可以廣泛應(yīng)用于各個相關(guān)領(lǐng)域[5]。以下將從內(nèi)部框圖和算法分析兩個方面介紹該芯片的使用情況。
1.1.1 內(nèi)部框圖
圖1是ADV611的內(nèi)部框圖,大致可以分為六個模塊,其中較有特色的部分是清晰窗口和量化控制兩部分。清晰窗口(Quality Box)是將用戶感興趣的部分圖像采用壓縮比較小的方式編碼,而對其余背景區(qū)域則加大壓縮比。這種方式可以認(rèn)為是小波編碼在空間可伸縮性的一種應(yīng)用。量化控制是為了滿足不同的網(wǎng)絡(luò)帶寬,不同的服務(wù)質(zhì)量而設(shè)定的改變編碼碼率的參量。通過設(shè)置不同比特每象素值(Bit Per Pixel)而改變編碼碼流的數(shù)據(jù)量,滿足不同的網(wǎng)絡(luò)帶寬。圖2是采用與ADV611相同壓縮算法的軟件模擬結(jié)構(gòu)。表1是算法效果統(tǒng)計。
表1 算法效果統(tǒng)計
比特每象素值 | 1 | 0.5 | 0.1 |
壓縮后數(shù)據(jù)量 | 50K | 24K | 7K |
壓縮倍數(shù) | 20.5 | 42.7 | 146.4 |
恢復(fù)圖像與原圖的PSNR | 32.43 | 30.88 | 27.37 |
其中圖2(a)是原始圖像(720×486×24位1025K),(b1)、(b2)、(b3)是比特每象素值分別為1、0.5、0.1時的恢復(fù)圖像。從數(shù)據(jù)中可以看出隨著比特每象素值的降低,壓縮后數(shù)據(jù)量隨之降低,而恢復(fù)圖像與原圖的PSNR降低并不多。
1.1.2 算法分析
ADV611內(nèi)部的小波變換采用雙正交9-7小波基。經(jīng)過大量的實驗證明雙交9-7小波基在圖像處理中是一種較好的小波基,目前多個國際標(biāo)準(zhǔn)中有關(guān)小波壓縮的算法,一般都采用這種小波基。ADV611芯片中的小波算法生成的Mallat框圖如圖3所示。
在量化階段ADV611采用可程控的量化方式。在量化順序上采用先低頻后高頻的順序(ADV611沒有采用零樹編碼),如對圖3量化的順序為H、F、G、E、C、D、B、A。在量化系數(shù)的選取上充分考慮人類視覺特性給定了每個Mallat塊的參考量化系數(shù)如圖4.圖5顯示的編/解碼端相應(yīng)的量化方法,圖中的BW是Mallat塊的參考量化系數(shù)。
對量化后的數(shù)據(jù)ADV611采用游程編碼與霍夫曼編碼相結(jié)合的方式進(jìn)行熵編碼,以達(dá)到高壓縮比的目的。一般來說游程編碼和霍夫曼編碼屬于無損壓縮,壓縮比都不高,但在小波變換及系數(shù)量化后會出現(xiàn)大量的連零系數(shù),這時采用游程編碼與霍夫曼編碼相結(jié)合的方式能達(dá)到很高的壓縮比[3]。
2 小波變換在媒體流壓縮中的應(yīng)用
很多對小波變換的研究僅停留在靜態(tài)圖像上,沒有就此深入下去。筆者希望小波變換這種方式不僅在靜態(tài)圖像上,還要在連續(xù)媒體流上得到更為廣闊的應(yīng)用?;谛〔ㄗ儞Q本身的特點以及ADV611芯片的特性,將從以下兩個方面提出改進(jìn)方案以使系統(tǒng)更加適用于連續(xù)媒體流業(yè)務(wù)。
2.1 基于小波變換系數(shù)的幀間算法
靜態(tài)圖像小波壓縮是通過減少圖像本身的空間冗余性,達(dá)到壓縮效果的編碼方法,屬于幀內(nèi)壓縮。在處理連續(xù)媒體流時應(yīng)注意到幀間相似性是很大的,即幀與幀之間有著很大的時間冗余性,減少這種冗余可以達(dá)到更高壓縮比,使碼流適合于更低比特的信道傳輸。在處理這一部分上國際標(biāo)準(zhǔn)一般采用運動估計運動補償?shù)姆绞剑?span id="nua3f7l" class="main1">
實現(xiàn)幀間壓縮[4]。在綜合考慮ADV611硬件實現(xiàn)的基礎(chǔ)上,提出一種對小波變換后系數(shù)估計補償?shù)乃惴?。具體的原理圖如圖6所示。其中小波變換與熵編碼是由ADV611硬件實現(xiàn)的。編碼后的數(shù)據(jù)延時一幀后進(jìn)行存儲器,與后一幀系數(shù)數(shù)據(jù)相減,求殘差數(shù)據(jù),并對殘差數(shù)據(jù)重編碼,包括二次量化、霍夫曼編碼等。解碼端反操作即可。實現(xiàn)這種算法要求具有兩個先題條件:(1)小波變換的穩(wěn)定性。對同一幀圖像兩次小波變換后生成的碼流是相同的,那么當(dāng)其中一幀圖像發(fā)生輕微變化時,編碼生成后的碼流也只是發(fā)生少量變化,從而殘差數(shù)據(jù)將會有大量的連零數(shù)據(jù)出現(xiàn);(2)編碼后碼流數(shù)據(jù)量較小,考慮到硬件實現(xiàn)時要求有存儲器存儲前一幀變換后的系數(shù),如果碼流數(shù)據(jù)量太大將不適合硬件的實現(xiàn)(此處應(yīng)該注意的是連續(xù)兩幀之間熵編碼后數(shù)據(jù)量不一定相同,對缺少的數(shù)據(jù)補零處理)。利用news序列的前8幀做測試序列,得到的幀間相關(guān)性結(jié)果如表2所示。
表1 news序列前8幀編碼系統(tǒng)相關(guān)性列表
1~2幀 | 2~3幀 | 3~4幀 | 4~5幀 | 5~6幀 | 6~7幀 | 7~8幀 | |
小波變換后系數(shù)(%) 小波變換及熵編碼后系數(shù)(%) | 99.96 81.4 | 99.49 70.3 | 99.59 71.0 | 99.66 78.9 | 99.47 70.0 | 99.97 80.3 | 99.53 75.4 |
以上實驗數(shù)據(jù)表明小波變換后系數(shù)存在著極大的幀間相關(guān)性。熵編碼后相關(guān)性降低,但仍然較高,可以充分應(yīng)用這種相關(guān)性。進(jìn)行幀間壓縮。在硬件實現(xiàn)方案中,由于采用ADV611芯片,接口的輸出碼流是經(jīng)過熵編碼后的數(shù)據(jù),幀間壓縮的效果沒有如圖6中虛線所示流程的壓縮效果好,但仍然可以一步提高視頻序列的壓縮比。
2.2 基于小波變換的碼率控制
當(dāng)前連續(xù)媒體流業(yè)務(wù)中越來越多地考慮對客戶的服務(wù)質(zhì)量問題,QoS的提出要求對編碼碼率的控制更加靈活,以適應(yīng)不同的用戶要求和不同的信道狀況。利用ADV611中可程控的量化方式就可以方便地達(dá)到碼率控制的目的。其原理框圖如圖7所。B/P是比特每象素的設(shè)置,通過軟件監(jiān)控網(wǎng)絡(luò)狀態(tài)[5],并按照一定的經(jīng)驗規(guī)律實時更改壓縮過程中的B/P設(shè)置,以完成對碼率的控制。
3 實現(xiàn)方案
開發(fā)小組在充分地進(jìn)行理論研究及實現(xiàn)方案論證的基礎(chǔ)上,應(yīng)用小波壓縮算法,、按照MPEG-4標(biāo)準(zhǔn)的思路提出了一套音視頻采集壓縮傳輸?shù)慕鉀Q方案。硬件實現(xiàn)系統(tǒng)框圖如圖8所示。
主要分為六個模塊:(1)音視頻捕捉模塊,包括音視頻的獲取及量化;(2)壓縮/解壓縮模塊,該模塊是本方案中最重要的模塊,實現(xiàn)音視頻的編劇/解碼及同步;(3)接入模塊,該模塊完成數(shù)據(jù)的傳輸,為了進(jìn)一步減輕主機的負(fù)擔(dān),采用硬件打包發(fā)送的方式;(4)軟件控制模塊,該模塊實時監(jiān)控網(wǎng)絡(luò)狀態(tài),及時將分析后的網(wǎng)絡(luò)狀態(tài)結(jié)果通知硬件板卡;(5)控制單元模塊,該模塊是系統(tǒng)的處理、時序等管理控制中心,還根據(jù)軟件模塊得到的網(wǎng)絡(luò)狀態(tài)參數(shù)及時地控制編碼過程完成碼率控制過程;(6)總線接口模塊,采用PCI總線方式與主機交換數(shù)據(jù)。
在上述系統(tǒng)壓縮/解壓縮模塊中,采用ADV611壓縮芯片,并結(jié)合2.1中提出的小波變換系數(shù)的幀間算法,簡略地實現(xiàn)視頻序列的幀間壓縮;同時按照控制單元的速率控制參數(shù)完成碼率控制的過程。
評論