新聞中心

EEPW首頁 > 消費電子 > 設計應用 > 視頻編碼標準H.264的核心技術分析

視頻編碼標準H.264的核心技術分析

作者: 時間:2012-07-24 來源:網(wǎng)絡 收藏

標簽:熵

本文引用地址:http://m.butianyuan.cn/article/165212.htm

/AVC建議是目前最新的壓縮。本文首先簡要介紹圖像通信中,H.261和H.263建議的基本原理和主要特點。

然后詳細研究了建議中的關鍵,包括幀內(nèi)幀間預測、去塊效應濾波、可變塊大小、多幀和亞像素運動估計、整數(shù)DCT變換以及新的熵編碼等新。

前言

圖像通信是近年來取得長足發(fā)展的現(xiàn)代通信,圖像壓縮的進步則是通信發(fā)展中的重要組成部分。國際建議H.261的問世,是對圖像編碼近40年研究成果的總結,解決了可視技術在通信中的應用這一長期困擾人們的問題,覆蓋了整個窄帶ISDN上視聽業(yè)務的圖像編碼,極大地推動了會議電視、電視電話等圖像通訊方式的國際化和產(chǎn)業(yè)化。隨后,ITU在H.261建議的基礎上著手極低碼率圖像壓縮的標準,制定了H.263建議,以及最新的H.264/AVC。本文首先對H.261和H.263建議的基本原理進行闡述,然后對新標準H.264/AVC中的新技術進行說明,最后再對H.26x系列標準進行總結。

1 H.261建議的基本原理

每一個圖像壓縮標準的制定,都針對它最適合的應用目標。H.261是最早定義的編碼標準。它首次使用了運動補償預測編碼與DCT變換相結合的方法,其視頻編碼信號的傳輸速率從64kbps到1.92Mbps,故為p×64K視頻編碼器(p取值在1~31之間)。H.261主要應用于ISDN網(wǎng)上的視頻會議系統(tǒng),定位在電路交換網(wǎng)絡系統(tǒng)。H.261編碼器的原理如圖1所示。

視頻編碼標準H.264的核心技術分析

該建議主要采用CIF圖像分辨率格式和QCIF分辨率格式, 以解決不同制式通信間的兼容問題。對于每一個幀間編碼的宏塊,H.261采用運動補償?shù)膸g預測算法,消除電視圖像時間域上的相關性;對預測誤差進行DCT變換以消除圖像空間域上的相關性;然后自適應量化DCT系數(shù),以充分利用人的視覺特性;接著進行熵編碼,以實現(xiàn)統(tǒng)計匹配編碼;最后采用輸出緩沖存儲器,以平滑數(shù)碼流,達到輸出數(shù)碼率保持恒定的目的。

該建議的圖像幀編碼模式包括I,P,B三類。I幀,采用幀內(nèi)編碼方式;P幀,采用幀間編碼方式,由I幀或前面的P幀進行運動補償,再對誤差估計進行編碼;B幀為雙向內(nèi)插幀不編碼傳輸,而由I幀和P幀或者P幀與PP幀插值重建。H.261不支持雙向運動預測以及GOP,每一個幀間編碼幀是以它的前一個已編碼幀為參考幀。

H.261標準的編碼數(shù)據(jù)結構從高層到底層定義了四個層次,即幀層、片層、宏塊層和塊層。H.261的運動估值補償是以宏塊為單位進行的。對某宏塊是選擇幀間還是幀內(nèi)編碼方式,首先需要判斷。若它與匹配宏塊相關性強,則可采用幀間編碼方式,反之,則采用幀內(nèi)編碼方式。

2 H.263建議的基本原理

H.263標準是在H.261標準的基礎上建議的。它在低碼率條件下,能夠在不增加太多復雜度的情況下,獲得更高的圖像質量。原則上它只需要一半的帶寬就可取得與H.261同樣的視頻質量。目前,H.263標準已經(jīng)被各種可視電話終端協(xié)議廣泛采用。

H.263標準基本模式編碼器的結構框圖與H.261標準相似。同樣,采用運動補償預測減少圖像的時間域冗余度;對運動補償預測的殘差場進行離散余弦變換(DCT)編碼;利用變長編碼(VCL)對量化的DCT系數(shù)、運動矢量以及附加信息進行熵編碼。

H.263在H.261建議的基礎上作了一定的改進。圖像尺寸采用QCIF格式,引入了sub-CIF格式,也允許使用CIF格式。采用8×8的DCT變換,宏塊統(tǒng)一使用同樣的量化步長進行量化,可以是一個宏塊使用一個運動矢量,也可以是宏塊的每個子塊各使用一個運動矢量,因而,具有塊運動補償能力,改善了幀間預測。運動矢量的x向和y向都支持半像素精度,運動估計的搜索窗大小被限制為[-16, +15.5],運動矢量進行差分預測編碼傳輸。編碼方式采用二維預測與VLC相結合的編碼;類似MPEG-1標準,將所有的圖像分為P幀和BP幀。

H.263建議為保證在極低碼率條件下獲得較好的圖像質量,在H.261混合編碼的基礎上,還采用了無限制的運動矢量模式、語法基算術編碼模式、高級預測模式以及PB-幀模式等編碼技術。在無限制的運動矢量模式中取消了作為基準的像素必須在編碼圖像區(qū)域內(nèi)的限制。在高級預測模式中使用了重迭塊運動補償,而且還允許運動矢量穿過運動邊界。在PB-幀模式中,B幀通過前一譯碼P幀和當前的一個譯碼P幀進行雙向預測重建,這樣就提高了幀速率但并未明顯增加比特數(shù)。以上三種方式主要是為了改善幀間預測?;谡Z法算術編碼方式的采用是為了進一步降低傳輸?shù)谋忍芈?。在這種方式中,所有的變長碼的編譯碼運算都用算術編譯的運算來代替。提供這些高級編碼模式,使得應用者可以在壓縮性能和復雜度之間進行均衡和取舍。

3 H.264標準的技術及其特點

H.264/AVC是ITU-T和ISO/IEC聯(lián)合制定的最新編碼標準,它最先由ITU-T的VCEG于1997年提出,目標是提出一種更高性能(相對于當時的H.263)的視頻編碼標準。

與先前的一些編碼標準相比,H.264標準繼承了H.263和MPEG1/2/4視頻標準協(xié)議的優(yōu)點,但在結構上并沒有變化,只是在各個主要的功能模塊內(nèi)部使用了一些先進的技術,提高了編碼效率。其主要表現(xiàn)在:編碼不再是基于8×8的塊進行,而是在4×4大小的快上,進行殘差的變換編碼。所采用的變換編碼方式也不再是DCT變換,而是一種整數(shù)變換編碼。采用了編碼效率更高的上下文自適應二進制算術編碼(CABAC),同時與之相應的量化過程也有區(qū)別。H.264標準具有算法簡單易于實現(xiàn)、運算精度高且不溢出、運算速度快、占用內(nèi)存小、消弱塊效應等優(yōu)點,是一種更為實用有效的圖像編碼標準。

下面介紹H.264/AVC標準在先前標準之上的新技術。H.264 標準仍采用圖像預測和變換編碼相結合的編碼結構,其編碼器的基本結構如圖2所示:

視頻編碼標準H.264的核心技術分析

編碼器的工作過程可根據(jù)數(shù)據(jù)流分為前向通道和重建通道。輸入幀F(xiàn)n的編碼,是對原始圖像16×16像素的宏塊進行編碼。宏塊編碼分為幀內(nèi)編碼和幀間編碼。在任何情況下,預測宏塊P都由重建幀獲得。在幀內(nèi)編碼模式中,P由當前幀中的已編碼宏塊經(jīng)解碼、重構預測獲得,如上圖中的uF’n。在幀間編碼模式下,P由一個或多個參考幀經(jīng)運動補償預測獲得,如F’n-1。以預測宏塊P與當前宏塊Fn的差值作為殘差宏塊Dn,經(jīng)變換、量化后得到一串變換參數(shù)X。參數(shù)X需要進行兩方面的處理,一是重排序和熵變換處理,整個過程沒有反饋分量,故稱為前向通道;二是反量化和逆變換處理,產(chǎn)生宏塊D’n,然后與宏塊P相加得到重構宏塊uF’n,再經(jīng)過一系列處理得到重建的參考幀F(xiàn)’n,用于下一幀的運動估計,因此稱為重建通道。


上一頁 1 2 3 下一頁

評論


相關推薦

技術專區(qū)

關閉