H.264中多參考幀預(yù)測技術(shù)的優(yōu)化

作者：時間：2007-03-09 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

摘要：提出了一個低復(fù)雜度的快速多參考幀選擇算法。模擬結(jié)果表明本算法在保持率失真性能的前提下可以大大減少多參考幀預(yù)測的計算復(fù)雜度。關(guān)鍵詞：H.264運動估計多參考幀預(yù)測運動搜索運動估計是去除視頻序列相鄰幀之間冗余信息的有效方法，對整個視頻編碼效果有重要的影響。由兩大國際標(biāo)準(zhǔn)化組織（ISO/IEC的MPEG和ITU-T的VCEG）共同制定的最新的國際視頻編碼標(biāo)準(zhǔn)H.264/AVC仍然采用成熟的基于塊的混合編碼框架，但由于引入了很多新的編碼技術(shù)，如多參考幀預(yù)測運動估計，從而可以提供更高的編碼效率。以前的視頻編碼標(biāo)準(zhǔn)如MPEG-4和H.263等都只支持一個參考幀預(yù)測。H.264不同于以前的標(biāo)準(zhǔn)，采用了多參考幀預(yù)測技術(shù)，使得運動搜索范圍從原來的一個參考幀擴展為多個解碼后的參考幀，這樣通常能找到更精確的匹配，從而有助于獲得更高的編碼效率。但是多參考幀預(yù)測技術(shù)同時也存在一些缺點，對存儲空間和計算能力要求更高。 H.264中引入的拉格朗日率失真最優(yōu)策略采用窮盡搜索在所有候選參考幀中選擇率失真成本最低的參考幀。拉格朗日率失真最優(yōu)模式選擇問題可表述為：

其中m=(mx,my)T表示某個運動矢量，REF表示某個參考幀，Jmotion(s,c,m,REFf1λMotion)表示在運動矢量m和參考幀REF下的率失真成本，s為原始的視頻信號，c(m,REF)為在運動矢量m和參考幀REF下的重構(gòu)視頻信號，λmotion為拉格朗日乘子，R（m-P）表示編碼運動矢量m的比特數(shù)，R（REF）表示編碼參考幀REF的比特數(shù)，SAD（s,c,m,REF）(Sum Absolute Difference)為原始信號和重構(gòu)信號之間的絕對差和，采用（2）式計算：

其中B1,B2表示塊的水平和垂直像表數(shù)，可以取值16，8或4。設(shè)m表示運動矢量搜索范圍，若只允許一個參考幀進行預(yù)測，那么每個宏塊需要搜索（2%26;#215;m+1）2個候選點；若允許N個參考幀進行預(yù)測，那么每個宏塊總共有N%26;#215;2%26;#215;m+1）2個候選搜索點。這意味著，運動搜索的計算量、編碼時間隨著預(yù)測中總參考幀數(shù)成倍增長。允許的參考幀數(shù)越多，運動搜索的計算量、編碼時間就越大。為了減少上述多參考幀預(yù)測技術(shù)中存在的問題，本文利用相鄰幀間很高的相關(guān)性提出了一種低復(fù)雜度的快速多參考幀選擇算法。 1 快速多參考幀預(yù)測算法在H.264運動估計中，多參考幀運動搜索過程在7種不同的塊大小和形狀條件下進行，執(zhí)照從16%26;#215;16到4%26;#215;4的順序依次進行。對于每一個塊編碼大小，需要在所有可能的參考幀中找出率失真成本最低的參考幀和其相應(yīng)的運動矢量。多參考幀運動搜索過程首先從概率較高的參考幀REF(0)開始，一直進行到距離當(dāng)前編碼幀最遠(yuǎn)的參考幀REF（N-1）. 由于視頻序列相鄰幀間存在很強的時域相關(guān)性，一般情況下，最優(yōu)的匹配通常位于與當(dāng)前編碼幀緊密相鄰的參考幀，本文采用REF（0）表示這一參考幀；其余的參考幀（在本文中表示為REF（i），i=1，2，…，N-1，設(shè)允許的最大參考幀數(shù)為N）被選中的概率遠(yuǎn)遠(yuǎn)小于第一個參考幀REF(0)。為了進一步了解不同參考幀在實際視頻序列中被采納的情況，本文選擇了幾個典型的視頻測試序列，并利用拉格朗日率失真最優(yōu)搜索策略，在不同參考幀數(shù)條件下統(tǒng)計不同參考幀的被選中概率，實驗數(shù)據(jù)如表1所示。從表1可以看出，在所有參考幀，REF（0）成為最優(yōu)參考幀的概率最高，概率高達(dá)88.67%，而其余所有參考幀被選中的概率遠(yuǎn)遠(yuǎn)小于REF（0）。表1 參考幀概率統(tǒng)計結(jié)果測試序列總參考幀數(shù)REF（0）概率REF（i）概率，（i=1,...,N）Foreman_qcif.yuv587.2012.80Silent_qcif.yuv594.385.62Mobile_cif.yuv567.6432.36Akiyo_cif.yuv1096.123.88coastg_cif.yuv1096.093.91Stefan_cif.yuv1090.619.39Average　88.6711.33從上述分析可知，參考幀REF（0）成為最終預(yù)測幀的概率最高，在這一參考幀中獲得的運動搜索結(jié)果對整個編碼性能有著重要的影響。因此，可以認(rèn)為在REF（0）中的搜索范圍越大，對整個編碼性能的改善也會越大。相比較，由于其余的參考幀被選中的概率很低，而且每增加一個參考幀就會增加很大一部分計算量，所以在一定條件下合理地減少在這些參考幀中運動搜索的計算量，對整個編碼性能不會產(chǎn)生顯著影響。由于相鄰幀間存在很強的進域相關(guān)性，前一個參考幀中運動搜索后得到的運動信息可以用來預(yù)測下一個參考幀的搜索中心。根據(jù)運動矢量的中心偏置定理，最優(yōu)的運動矢量通常位于搜索中心周圍的小范圍里，利用螺旋搜索順序，只需搜索這一小部分區(qū)域。減少多參考幀預(yù)測計算量的思路如圖1所示。在最重要的參考幀REF（0）中，搜索范圍較大以保證取得較高的預(yù)測精度；而在其余不很重要的參考幀中，可以選擇較小的搜索范圍，同時利用前一幀已得到的運動信息預(yù)測下一幀的搜索中心。這樣既能減少計算量，同時又不會顯著影響整個編碼性能。本文提出了一種減少多參考幀預(yù)測計算量的快速算法。本算法不僅利用了運動矢量的空域相關(guān)性來預(yù)測第一個參考幀REF（0）的搜索中心，即利用當(dāng)前宏塊周圍的三個空域相鄰塊的中值運動矢量來預(yù)測REF（0）的搜索中心；而且利用了運動矢量的時域相關(guān)性，即利用前一幀REF(i-1)所得到的運動信息對下一個參考幀REF(i)的搜索中心進行修正。由于相鄰幀間存在很高的時域相關(guān)性，下一幀的最優(yōu)運動矢量很可能就位于修正后的搜索中心附件，只需對搜索中心周圍的很少一部分候選點進行匹配運算。這樣就省略了很大一部分運算量。

2 模擬結(jié)果和分析為了測試本文算法的性能，本文采用H.264參考軟件JM7.0作為實驗平臺。實驗參數(shù)設(shè)置如下：6個典型的視頻測試序列（Ailent、Mobile、Foreman、Template、Bus和Suzi）、CIF（352%26;#215;288）或QCIF(176%26;#215;144)圖像格式，每個序列150幀，幀率為30f/s，運動矢量搜索范圍為16，量化參數(shù)為32，采用Hadamard transform,GOP結(jié)構(gòu)為IPPP。表2列出了本文提出的算法與原始的采用窮盡搜索的拉格朗日率失真最優(yōu)模式選擇方法的比較結(jié)果。在表2中，ΔPSNR表示平均峰值信噪比（PSNR）下降值，單位為Db, Δbits表示平均碼率增長百分?jǐn)?shù)，Δtime表示運動估計編碼時間的減少百分?jǐn)?shù)。Δtime和Δbits分別采用式（3）和式（4）得到：

其中Toriginal和Borigind分別表示采用原始方法時所用的運動估計編碼時間和總比特數(shù)；Tproposed和Bproposed分別表示采用本文提出的方法時所用的運動估計編碼時間和總比特數(shù)。表2 實驗結(jié)果比較測試序列2個參考幀5個參考幀ΔPSNRΔbitsΔtimeΔPSNRΔbitsΔtimeSilent_quif.yuv-0.0220.166.67-0.0170.357.66Mobile_qcif.yuv0.004-0.225.57-0.1332.8722.97Foreman_cif.yuv-0.0380.438.05-0.0991.7011.82Football_qcif.yuv-0.0169.228.32-0.0310.6821.74Template_cif.yuv0.0030.284.52-0.0480.9516.50Bus_qcif.yuv-0.0642.896.03-0.1663.9614.21Suzi_quif.yuv0.0172.326.94-0.0430.3811.39Average-0.0172.156.60-0.0771.5615.18從表2中的實驗數(shù)據(jù)可以看出，與原始的采用窮盡搜索的拉格朗日率失真最優(yōu)模式選擇方法相比，本文提出的算法可以使運動估計編碼時間平均減少15.18%，同時平均PSNR僅僅下降0.077dB，碼率增長僅僅1.56%（5個參考幀情況下）。此外，對比不同參考幀數(shù)的實驗結(jié)果，很容易發(fā)現(xiàn)允許的參考幀數(shù)越多，節(jié)省的編碼時間就越多。模擬結(jié)果表明本文提出的算法可以節(jié)省H.264多參考幀運動預(yù)測的計算復(fù)雜度，同時對率失真性能的影響很小。這對H.264編碼的實時實現(xiàn)很有利。

新聞中心

H.264中多參考幀預(yù)測技術(shù)的優(yōu)化

評論

相關(guān)推薦

技術(shù)專區(qū)