MPEG視頻壓縮技術(shù)的發(fā)展及其特點
1.1 MPEG-1
在MPEG出現(xiàn)之前,關(guān)于圖像壓縮已經(jīng)有兩個標準,即用于靜態(tài)圖像數(shù)據(jù)壓縮的JPEG和用于電視電話、會議電視圖像壓縮的H.261,但是他們都與計算機數(shù)據(jù)標準無關(guān)。這就要求制定一個圖像、伴音、存儲和傳輸四個方面的計算機系統(tǒng)和廣播電視都統(tǒng)一的標準,從而有利于各種媒體廣泛交流,因此MPEG就應運而生了。
MPEG-1標準完成的基本任務就是質(zhì)量適當?shù)膱D像(包括伴音)數(shù)據(jù)必須成為計算機數(shù)據(jù)的一種,和已有的數(shù)據(jù)(如文字、繪圖等數(shù)據(jù))在計算機內(nèi)兼容,并且這些數(shù)據(jù)必須在現(xiàn)有的計算機網(wǎng)絡(luò)和廣播電視等通信網(wǎng)絡(luò)中兼容傳輸。MPEG-1標準有3個組成部分:MPEG視頻、MPEG音頻、MPEG系統(tǒng)。所以MPEG涉及的問題是視頻壓縮、音頻壓縮及多種壓縮數(shù)據(jù)流的復合和同步問題。MPEG-1標準是適用于傳輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲媒體動力圖像及其伴音的編碼標準,可以處理各種類型的活動圖像,其基本算法對于壓縮水平方向360個象素、豎直方向288個象素的空間分辨力,每秒24至30幅畫面的運動圖像有很好的效果。與JPEG不同,它沒有定義產(chǎn)生合法數(shù)據(jù)流所需的詳細算法,而是在編碼器設(shè)計中提供了大量的靈活性,另外定義已編碼位流和解碼器的一系列參數(shù)都包含在位流本身當中,這些特點允許算法可以用于不同大小和寬度比的圖像,也可以用在工作速率范圍很大的信道和設(shè)備上。
MPEG-1標準壓縮首先對色差信號進行亞采樣,減少數(shù)據(jù)量,采用運動補償技術(shù),減少幀間冗余度,利用二維DCT變換云除空間相關(guān)性,對DCT分量進行量化,舍去不重要的信息,將量化后DCT分量按照頻率得新排序,將DCT分量進行變字長編碼,最后對每個數(shù)據(jù)塊的直流分量(DC)進行預測差分編碼。MPEG視頻的編碼和解碼框圖如圖1所示。
1.2 MPEG-2
MPEG-2標準全稱為“運動圖像及其伴音的編碼”,主要針對高精晰度電視(HDTV)所需要的視頻及伴音信號,傳輸速率為10Mbps。
MPEG-2標準分為八個部分,統(tǒng)稱為ISO/IEC1318國際標準。第一部分:系統(tǒng),描述多個視頻,音頻和數(shù)據(jù)基本碼流合成傳輸碼流和節(jié)目碼流的方式;第二部分:視頻,描述視頻編碼方法;第三部分:音頻,描述與MPEG-1音頻標準反向兼容的音頻編碼方法;第四部分:符合測試,描述測試一個編碼碼流是否符合MPEG-2標準的第一、二、三部分的軟件實現(xiàn)方法;第五部分:數(shù)字存儲器體-命令與控制,描述交互式多媒體網(wǎng)絡(luò)中服務器與用戶間的會話信令集;第六部分;非向后兼容的音頻,規(guī)定不與MPEG-1音頻反向兼容的多通道音頻編碼;第七部分:10比特視頻,現(xiàn)已停止;第八部分:實時接口,規(guī)定了傳送碼流的實時接口。
MPEG-2視頻編碼標準是一個按等級劃分的系列,按編碼圖像的分辨率分成4個“級”:低級(LL:low level),輸入信號的像素為ITU-R601格式的四分之一;主級(ML:main level),輸入信號的像素為ITU-R601;高級-1440(H14L:high-1440 level)為4:3模式電視高清晰度格式;高級(HL:high level)為16:9模式電視的高清晰度格式。按所使用的編碼工具的集合分成5個“類”:簡單類(SP:simple profile),只有基準幀I和預測幀P;主類(MP:main profile),比SP增加了雙向推測幀B;信雜比分層類(SNRP:SNR scalable profile);空間可分層類(SSP:spatial scalable profile);高類(HP:high profile)。“級”與“類”的若干組合構(gòu)成MPEG-2視頻編碼標準在某種特定應用下的子集。對某一輸入格式的圖像,采用特定集合的壓縮編碼工具,產(chǎn)生規(guī)定速率范圍內(nèi)的編碼碼流。MPEG-2的編碼碼流分為6個層次。從上至下依次為:視頻序列層(Sequence);圖像組層(GOP:GroupofPicture);圖像層(Picture);像條層(Slice);宏塊層(MacroBlock)和像塊層(Block)。
MPEG-2的編碼流程:在幀內(nèi)編碼的情況下,編碼圖像僅經(jīng)過DCT,量化器和比特流編碼器即生成編碼比特流,而不經(jīng)過預測環(huán)處理。DCT直接應用于原始的圖像數(shù)據(jù)。在幀間編碼的情況下,原始圖像首先與幀存儲器中的預測圖像進行比較,計算出運動矢量,由此運動矢量和參考幀生成原始圖像的預測圖像。而后,將原始圖像與預測像素差值所生成的差分圖像數(shù)據(jù)進行DCT變換,再經(jīng)過量化器和比特流編碼器生成輸出的編碼比特流。
1.3 MPEG-4
MPEG-4標準的目標是:支持多種多媒體應用(主要側(cè)重于對多媒體信息內(nèi)容的訪問),可根據(jù)應用的不同要求現(xiàn)場配置解碼器。MPEG-4旨在為視(音)頻數(shù)據(jù)的通信、存取與管理提供一個靈活的框架與一套開放的編碼工具。
在MPEG-4圖像與視頻標準中,視頻表示工具的目標,是為多媒體環(huán)境下的紋理、圖像和視頻數(shù)據(jù)的有效存儲、傳輸及管理提供標準化的核心技術(shù)。尤其強調(diào)這些工具對圖像和視頻內(nèi)容的原子單元(稱為視頻對象VO)的編解碼能力。對任意形狀的視頻對象進行有效的表示,以支持所謂基于內(nèi)容的功能集。而此功能集支持內(nèi)容(即場景中的物理對象VO)的單獨編碼和解碼,這一特性為交互性提供了有力的底層機制支持,也為在壓縮域?qū)D像或視頻的VO內(nèi)容進行靈活的表示和管理提供了有利條件。MPEG-4圖像與視頻標準統(tǒng)一支持傳統(tǒng)矩形和任意形狀圖像與視頻的編解碼。對于基于內(nèi)容的應用,輸入的圖像序列可能具有任意形狀和位置。形狀可以用8位透明分量表示(一個VO由多個其它對象構(gòu)成時)或用一個二值掩模描述。另外,通過對場景中每個物理采用適當?shù)暮途毜幕趯ο蟮倪\動預測工具,可以大大提高某些視頻序列的壓縮比。對于MPEG-4擴展的基于內(nèi)容的編碼可視為傳統(tǒng)的VLBV內(nèi)核或HBV工具由矩形輸入向任意形狀輸入的邏輯延伸。從這個意義上,基于內(nèi)容的編碼是VLBV和HBV內(nèi)核的超集。
MPEG-4標準在原有的基礎(chǔ)上增加了七個新的功能。增加的各個功能的特點:
(1)基于內(nèi)容的操作與比特流編輯支持無需編碼就可進行基于內(nèi)容的操作與比特流編輯。(2)自然與合成數(shù)據(jù)混合編碼。提供將自然視頻圖像同合成數(shù)據(jù)(文本、圖形)有效結(jié)合的方式,同時支持交互性操作。(3)增強的時間域隨機存取。MPEG-4將提供具有效的隨機存取方式:在有限的時間間隔內(nèi),可按幀或任意形狀的對象,對一音、視頻序列進行隨機存取。(4)提高編碼效率。在與現(xiàn)有的正在形成的標準的可比擬速率上,MPEG-4標準將提供更好的主觀視覺質(zhì)量的圖像。(5)對多個并發(fā)數(shù)據(jù)流的編碼。MPEG-4將提供對一景物的有效多視角編碼,加上多伴音聲道編碼及有效的視聽同步。在立體視頻應用方面,MPEG-4將利用同一景物的多視點觀察所造成的信息冗余,在足夠的觀察視點條件下有效地描述三維自然景物。(6)錯誤易發(fā)環(huán)境中的抗錯性“靈活多樣”是指允許采用各種有線網(wǎng)和各種存儲媒體,MPEG-4將提高抗錯誤能力,尤其是在易發(fā)生嚴重錯誤環(huán)境下的低比特應用中(移動通信鏈路)。MPEG-4是第一個在其音、視頻表示規(guī)范中考慮信道特性的標準,目的不是取代已由通信網(wǎng)提供的錯誤控制技術(shù),而是提供一種對抗殘留錯誤是緊韌性。(7)基于內(nèi)容的尺度可變性。內(nèi)容尺度可變性意味著給圖像中的各個對象分配優(yōu)先級?;趦?nèi)容的尺度可變性是MPEG-4的核心,因為一旦圖像中所含對象的目錄及相應的優(yōu)先級確定后,其它的集內(nèi)容的功能就比較容易實現(xiàn)了。對甚低比特率應用來說,尺度可變形成一個關(guān)鍵的因素,因為它提供了自適應可用資源的能力。
以上七個新的功能可以歸納為三類:基于內(nèi)容的交互性、高壓縮率和靈活多樣的存取模式。前三個功能為基于內(nèi)容的交互性,四、五為高壓縮率模式,最后兩個為靈活多樣的存取模式。
評論