H.264解碼器中CAVLC碼表查找算法的分析與優(yōu)化
近年來,隨著信息技術(shù)飛速發(fā)展和互聯(lián)網(wǎng)的日益普及,尤其是以視頻為信息主要來源的多媒體領域越來越受到人們的關注。H.264是ITU-T的視頻編碼專家組(VCEG)和ISO/IEC的活動圖像編碼專家組(MPEG)的聯(lián)合視頻組(Joint Video Tearn,JVT)開發(fā)的一個新的數(shù)字視頻編碼標準,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的一部分。H.264和以前的標準一樣,也是DPCM加變換編碼的混合編碼模式。H.264標準可分為三檔:基本檔次(其簡單版本,應用面廣);主要檔次(采用了多項提高圖像質(zhì)量和增加壓縮比的技術(shù)措施,可用于SDTV、HDTV和DVD等);擴展檔次(可用于各種網(wǎng)絡的視頻流傳輸)。
H.264/AVC的編解碼框架的基本結(jié)構(gòu)與早期的編碼標準(H.263、MPEG4等)相似,都是由運動估計、變換、量化、熵編碼、環(huán)路去塊效應濾波器等功能單元組成的。H.264視頻編碼框架的主要變化包括:引入了環(huán)內(nèi)去塊效應濾波器,去塊效應處理后的宏塊被保存在內(nèi)存中用于對后續(xù)宏塊的預側(cè);采用了多參考幀運動估計,需要在內(nèi)存中保留多個參考視頻幀;引入了幀內(nèi)預測機制,可以通過同一幀內(nèi)的宏塊進行預測;采用了新的整型變換方式,取代了以前的離散余弦變換(DCT);H.264與以前視頻標準在運動估計的模式上也有了較大的變化,H.264支持7種模式的可變塊運動估計。此外,在熵編碼中還引入了上下文自適應的變長編碼(CAVLC)和二進制算術(shù)編碼(CABAC)。
在熵編碼方面,H.264使用了CABAC和CAVLC兩種不同的編碼方式。CABAC熵編碼是一種基于區(qū)間劃分的算術(shù)編碼方式。這種編碼方式的效率很高,接近信息熵值,但算法相對復雜,編解碼速度較慢。CAVLC是一種可變長編碼,它根據(jù)已編碼語法元素的情況動態(tài)調(diào)整編碼中使用的碼表,在編碼過程中有些語法元素是組合編碼的,當對這些元素進行查找時就會耗費很長的時間。因此對CAVLC的優(yōu)化顯得格外重要。
1 原碼表查找算法
原碼表的存儲結(jié)構(gòu)為二維表結(jié)構(gòu)。存儲的內(nèi)容為碼字,二維坐標分別代表解碼后的兩個語法元素。對于二維表結(jié)構(gòu)。若通過坐標查找內(nèi)容是很容易的;而通過內(nèi)容查找坐標,就需要對整個表進行遍歷。JM中的碼表查找算法就是通過遍歷整個碼表實現(xiàn)的,步驟如下:
(1)取碼表的中的一個碼字;
(2)根據(jù)碼字長度從碼流中取出相應長度的bit;
(3)比較此碼字和bit串,若相同則查找成功,否則若碼表中還有碼字,回步驟(1),否則查找失敗。
2 算法的優(yōu)化分析
2.1 基于前綴零分組子表搜索算法
基于上下文自適應的變長編碼的解碼算法需要不斷的讀取碼流,判斷,直到在碼表中找到該碼字,如此反復,直至解碼整個塊。由此可見該過程的時間空間復雜度都是相當高的。由于變長碼為霍夫曼前綴碼,所以可以根據(jù)碼表的特性,按照碼字長度將原來的一個碼表,按照碼字長度對原碼表進行分割,以Coeff_token碼表為例,原碼表如表1所示,表中NC=-1。
在參考模型中,搜索碼表算法過程如下:
(1)從最短碼長開始,讀出該長度二進制數(shù)據(jù)流對應的碼字;
(2)遍歷碼表,如找到該碼字進行步驟(4),否則進入(3);
(3)碼字長度加1,重定位指針位置,重復步驟(2);
(4)讀取該碼字對應值,更新指針位置。
從上面過程中不難發(fā)現(xiàn),碼字長度的不確定性使得在讀取字節(jié)流時只能一次次的試探,導致了效率的下降。如果可以將變長碼的讀取采取固定的策略,一次讀取固定的長度,之后再做判斷,再讀取一定長度,這樣將判斷的次數(shù)也固定,從理論上可以降低不斷搜索和重定位指針帶來的時間和空間復雜性。利用可以利用碼表中碼字前綴零數(shù)目的不同,將表1拆分為兩個子表,如表2,表3所示NC為-1。
改進后的碼表搜索算法如下:
(1)讀取最大碼字長度的二進制流;
(2)根據(jù)不同的前綴零位數(shù)、右移位、判零以確定碼字所在子表;
(3)直接根據(jù)碼值讀取對應值,更新指針位置。
新的搜索過程不但避免了不確定性,而且無需遍歷碼表,這樣可以在一定程度上提高變長解碼的效率。
按照改進的算法步驟,解碼時,首先從字節(jié)流中讀取8位碼字,由于前綴零個數(shù)分為大于3和小于3的兩種情形,所以右移5位,若為零,則查找表2,否則查找表1,根據(jù)碼值直接解碼出±1個數(shù),非零系數(shù)數(shù)目。此外在設計代碼時,還可利用二叉搜索樹的特性,設計搜索過程,提高解碼效率。
評論