AVS視頻標(biāo)準(zhǔn)和H.264核心技術(shù)的區(qū)別

作者：時間：2011-04-20 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

視頻編碼技術(shù)在過去幾年最重要的發(fā)展之一是由ITU和ISO/IEC的聯(lián)合視頻小組 (JVT)開發(fā)了H.264/MPEG-4 AVC標(biāo)準(zhǔn)。在發(fā)展過程中，業(yè)界為這種新標(biāo)準(zhǔn)取了許多不同的名稱。ITU在1997年開始利用重要的新編碼工具處理H.26L（長期），結(jié)果令人鼓舞，于是ISO決定聯(lián)手ITU組建JVT并采用一個通用的標(biāo)準(zhǔn)。因此，大家有時會聽到有人將這項(xiàng)標(biāo)準(zhǔn)稱為JVT，盡管它并非正式名稱。ITU在2003年5月批準(zhǔn)了新的H.264標(biāo)準(zhǔn)。ISO在2003年10 月以MPEG-4 Part 10、高級視頻編碼或AVC的名稱批準(zhǔn)了該標(biāo)準(zhǔn)。

H.264 實(shí)現(xiàn)的改進(jìn)創(chuàng)造了新的市場機(jī)遇

H.264/AVC在壓縮效率方面取得了巨大突破，一般情況下達(dá)到MPEG-2及MPEG-4簡化類壓縮效率的大約2倍。在JVT進(jìn)行的正式測試中，H.264在85個測試案例中有78％的案例實(shí)現(xiàn)1.5倍以上的編碼效率提高，77％的案例中達(dá)到2倍以上，部分案例甚至高達(dá)4倍。H.264 實(shí)現(xiàn)的改進(jìn)創(chuàng)造了新的市場機(jī)遇，如：600Kbps的VHS品質(zhì)視頻可以通過ADSL線路實(shí)現(xiàn)視頻點(diǎn)播；高清晰電影無需新的激光頭即可適應(yīng)普通 DVD。

H.264標(biāo)準(zhǔn)化時支持三個類別：基本類、主類及擴(kuò)展類。后來一項(xiàng)稱為高保真范圍擴(kuò)展 (FRExt)的修訂引入了稱為高級類的4個附加類。在初期主要是基本類和主類引起了大家的興趣?；绢惤档土擞?jì)算及系統(tǒng)內(nèi)存需求，而且針對低時延進(jìn)行了優(yōu)化。由于B幀的內(nèi)在時延以及CABAC的計(jì)算復(fù)雜性，因此它不包括這兩者。基本類非常適合可視電話應(yīng)用以及其他需要低成本實(shí)時編碼的應(yīng)用。

主類提供的壓縮效率最高，但其要求的處理能力也比基本類高許多，因此使其難以用于低成本實(shí)時編碼和低時延應(yīng)用。廣播與內(nèi)容存儲應(yīng)用對主類最感興趣，它們是為了盡可能以最低的比特率獲得最高的視頻質(zhì)量。

盡管H.264采用與舊標(biāo)準(zhǔn)相同的主要編碼功能，不過它還具有許多與舊標(biāo)準(zhǔn)不同的新功能，它們一起實(shí)現(xiàn)了編碼效率的提高。其主要差別，概述如下：

幀內(nèi)預(yù)測與編碼：H.264采用空域幀內(nèi)預(yù)測技術(shù)來預(yù)測相鄰塊鄰近像素的Intra-MB中的像素。它對預(yù)測殘差信號和預(yù)測模式進(jìn)行編碼，而不是編碼塊中的實(shí)際像素。這樣可以顯著提高幀內(nèi)編碼效率。

幀間預(yù)測與編碼：H.264中的幀間編碼采用了舊標(biāo)準(zhǔn)的主要功能，同時也增加了靈活性及可操作性，包括適用于多種功能的幾種塊大小選項(xiàng)，如：運(yùn)動補(bǔ)償、四分之一像素運(yùn)動補(bǔ)償、多參考幀、通用 (generalized)雙向預(yù)測和自適應(yīng)環(huán)路去塊。

可變矢量塊大?。涸试S采用不同塊大小執(zhí)行運(yùn)動補(bǔ)償?？梢詾樾≈?(4的塊傳輸單個運(yùn)動矢量，因此在雙向預(yù)測情況下可以為單個MB傳輸多達(dá)32個運(yùn)動矢量。另外還支持16(8、8(16、8(8、8(4和4(8的塊大小。降低塊大小可以提高運(yùn)動細(xì)節(jié)的處理能力，因而提高主觀質(zhì)量感受，包括消除較大的塊化失真。

四分之一像素運(yùn)動估計(jì)：通過允許半像素和四分之一像素運(yùn)動矢量分辨率可以改善運(yùn)動補(bǔ)償。

多參考幀預(yù)測：16個不同的參考幀可以用于幀間編碼，從而可以改善視頻質(zhì)量的主觀感受并提高編碼效率。提供多個參考幀還有助于提高H.264位流的容錯能力。值得注意的是，這種特性會增加編碼器與解碼器的內(nèi)存需求，因?yàn)楸仨氃趦?nèi)存中保存多個參考幀。

自適應(yīng)環(huán)路去塊濾波器：H.264采用一種自適應(yīng)解塊濾波器，它會在預(yù)測回路內(nèi)對水平和垂直區(qū)塊邊緣進(jìn)行處理，用于消除塊預(yù)測誤差造成的失真。這種濾波通常是基于4(4塊邊界為運(yùn)算基礎(chǔ)，其中邊界各邊的3個像素可通過4級濾波器進(jìn)行更新。

整數(shù)變換：采用DCT的早期標(biāo)準(zhǔn)必須為逆變換的固點(diǎn)實(shí)施來定義舍入誤差的容差范圍。編碼器與解碼器之間的 IDCT 精度失配造成的漂移是質(zhì)量損失的根源。H.264利用整數(shù)4(4空域變換解決了這一問題--這種變換是DCT的近似值。4(4的小區(qū)塊還有助于減少阻塞與振鈴失真。

量化與變換系數(shù)掃描：變換系數(shù)通過標(biāo)量量化方式得到量化，不產(chǎn)生加大的死區(qū)。與之前的標(biāo)準(zhǔn)類似，每個MB都可選擇不同的量化步長，不過步長以大約12.5％的復(fù)合速率增加，而不是固定遞增。同時，更精細(xì)的量化步長還可以用于色度成分，尤其是在粗劣量化光度系數(shù)的情況下。

熵編碼：與根據(jù)所涉及的數(shù)據(jù)類型提供多個靜態(tài)VLC表的先前標(biāo)準(zhǔn)不同，H.264針對變換系數(shù)采用上下文自適應(yīng)VLC，同時針對所有其他符號采用統(tǒng)一的VLC (UniversalVLC)方法。主類還支持新的上下文自適應(yīng)二進(jìn)制算術(shù)編碼器 (CABAC)。CAVLC優(yōu)于以前的VLC實(shí)施，不過成本卻比VLC高。

CABAC利用編碼器和譯碼器的機(jī)率模型來處理所有語法元素 (syntax elements)，包括：變換系數(shù)和運(yùn)動矢量。為了提高算術(shù)編碼的編碼效率，基本概率模型通過一種稱為上下文建模的方法對視頻幀內(nèi)不斷變換的統(tǒng)計(jì)進(jìn)行適應(yīng)。上下文建模分析提供編碼符號的條件概率估計(jì)值。只要利用適當(dāng)?shù)纳舷挛哪Ｐ?，就能根?jù)待編碼符號周圍的已編碼符號，在不同的概率模型間進(jìn)行切換，進(jìn)而充份利用符號間的冗余性。每個語法元素都可以保持不同的模型（例如，運(yùn)動矢量和變換系數(shù)具有不同的模型）。相較于VLC熵編碼方法 (UVLC/CAVLC)，CABAC 能多節(jié)省10％bit速率。

加權(quán)預(yù)測：它利用前向和后向預(yù)測的加權(quán)總和建立對雙向內(nèi)插宏模塊的預(yù)測，這樣可以提高場景變化時的編碼效率，尤其是在衰落情況下。

保真度范圍擴(kuò)展：2004年7月，H.264標(biāo)準(zhǔn)增加了稱為保真度范圍擴(kuò)展 (FRExt) [11]的新修訂。這次擴(kuò)展在H.264中添加了一整套工具，而且允許采用附加的色域、視頻格式和位深度。另外還增加了對無損幀間編碼與立體顯示視頻的支持。FRExt修訂版在H.264中引入了4種新類，即：

?High Profile (HP)：用于標(biāo)準(zhǔn) 4:2:0色度采樣，每分量8位彩色。此類引入了新的工具-- 隨后詳述。

?High 10 Profile (Hi10P)：用于更高清晰度視頻顯示的標(biāo)準(zhǔn) 4:2:0 色度采樣，10位彩色。

?High 4:2:2 10 bit color profile (H422P)：用于源編輯功能。

?High 4:4:4 12 bit color profile (H444P)：最高品質(zhì)的源編輯與色彩保真度，支持視頻區(qū)域的無損編碼以及與新的整數(shù)色域變換（從RGB到Y(jié)UV及黑色）。

在新的應(yīng)用領(lǐng)域中，H.264 HP對廣播與DVD尤為有利。某些試驗(yàn)顯示出H.264 HP的性能比MPEG2 提高了3倍。下面介紹H.264 HP中引入的主要附加工具。

自適應(yīng)殘差塊大小與整數(shù)8(8變換：用于變換編碼的殘差塊可以在8(8與4(4之間切換。引入了用于8(8塊的新16位整數(shù)變換。較小的塊仍然可以采用以前的4(4變換。

8(8亮度幀內(nèi)預(yù)測：增加了8種模式，除之前的16(16和4(4塊以外，使亮度內(nèi)部宏模塊還能夠?qū)?(8塊進(jìn)行幀內(nèi)預(yù)測。

量化加權(quán)：用于量化8(8變換系數(shù)的新量化加權(quán)矩陣。

單色：支持黑／白視頻編碼。

AVS視頻標(biāo)準(zhǔn)

2002 年，中國信息產(chǎn)業(yè)部成立的音視頻技術(shù)標(biāo)準(zhǔn) (AVS)工作組宣布準(zhǔn)備針對移動多媒體、廣播、DVD等應(yīng)用編寫一份國家標(biāo)準(zhǔn)。該視頻標(biāo)準(zhǔn)稱為AVS [14]，由兩個相關(guān)部分組成針對移動視頻應(yīng)用的AVS-M和針對廣播與DVD的AVS1.0。AVS標(biāo)準(zhǔn)與H.264相似。

AVS1.0同時支持隔行和逐行掃描模式。AVS中P幀可以利用2幀的前向參考幀，同時允許B幀采用前后各一個幀。在隔行模式下，4個場可以用作參考?？梢詢H在幀級執(zhí)行隔行模式中的幀／場編碼，這一點(diǎn)與H.264不同，其中允許此選項(xiàng)的MB級自適應(yīng)。AVS具有與H.264相似的環(huán)路濾波器，可以在幀級關(guān)閉。另外，B幀還無需環(huán)路濾波器。幀內(nèi)預(yù)測是以8(8塊為單位進(jìn)行。MC允許對亮度塊進(jìn)行1／4象素補(bǔ)償。ME的塊大小可以是16(16、16(8、8(16或8(8。變換方式是基于16位的8(8整數(shù)變換（與WMV9相似）。VLC是基于上下文自適應(yīng)2D運(yùn)行／級別編碼。采用4個不同的Exp-Golomb編碼。用于每個已量化系數(shù)的編碼自適應(yīng)到相同8(8塊中前面的符號。由于Exp-Golomb表是參數(shù)化的表，因此表較小。用于逐行視頻序列的AVS 1.0的視頻質(zhì)量在相同比特率時稍遜于H.264主類。

AVS-M主要針對移動視頻應(yīng)用，與H.264基本規(guī)范存在交叉。它僅支持逐行視頻、I與P幀，不支持B幀。主要AVS-M編碼工具包括基于4(4塊的幀內(nèi)預(yù)測、1／４象素運(yùn)動補(bǔ)償、整數(shù)變換與量化、上下文自適應(yīng)VLC以及高度簡化的環(huán)路濾波器。與H.264基本規(guī)范相似AVS-M中的運(yùn)動矢量塊大小降至4(4，因此MB可擁有多達(dá)16個運(yùn)動矢量。采用多幀預(yù)測，但僅支持2個參考幀。此外，AVS-M中還定義了H.264 HRD／SEI消息的子集。AVS-M的編碼頻率約為0.3dB，在相同設(shè)置下稍遜于H.264基本規(guī)范，而解碼器的復(fù)雜性卻降低了大約20％。

H.264和AVS的背景

H.264/MPEG-4AVC是ITU-T的VCG（Video Coding Experts Group）和ISO/IEC的MPEG(Moving Picture Experts Group)聯(lián)合開發(fā)的新一代視頻編碼標(biāo)準(zhǔn)。應(yīng)用范圍包括可視電話、視頻會議等。H.264的主要特色就是極大得提高了壓縮率，是MPEG-2及MPEG-4壓縮效率的一倍以上。H.264核心技術(shù)與之前標(biāo)準(zhǔn)相同，仍采用基于預(yù)測變換的混合編碼框架，但是

新聞中心

AVS視頻標(biāo)準(zhǔn)和H.264核心技術(shù)的區(qū)別

評論

相關(guān)推薦

技術(shù)專區(qū)