視頻壓縮
視頻數(shù)據(jù)中存在著大量的冗余, 即圖像的各像素?cái)?shù)據(jù)之間存在極強(qiáng)的相關(guān)性。 利用這些相關(guān)性, 一部分像素的數(shù)據(jù)可以由另一部分像素的數(shù)據(jù)推導(dǎo)出來, 結(jié)果視頻數(shù)據(jù)量能極大地壓縮, 有利于傳輸和存儲(chǔ)。 視頻數(shù)據(jù)主要存在以下形式的冗余。
1. 空間冗余
視頻圖像在水平方向相鄰像素之間、 垂直方向相鄰像素之間的變化一般都很小, 存在著極強(qiáng)的空間相關(guān)性。 特別是同一景物各點(diǎn)的灰度和顏色之間往往存在著空間連貫性, 從而產(chǎn)生了空間冗余, 常稱為幀內(nèi)相關(guān)性。
2. 時(shí)間冗余
在相鄰場(chǎng)或相鄰幀的對(duì)應(yīng)像素之間, 亮度和色度信息存在著極強(qiáng)的相關(guān)性。 當(dāng)前幀圖像往往具有與前、 后兩幀圖像相同的背景和移動(dòng)物體, 只不過移動(dòng)物體所在的空間位置略有不同, 對(duì)大多數(shù)像素來說, 亮度和色度信息是基本相同的, 稱為幀間相關(guān)性或時(shí)間相關(guān)性。
3. 結(jié)構(gòu)冗余
在有些圖像的紋理區(qū), 圖像的像素值存在著明顯的分布模式。 如方格狀的地板圖案等。 已知分布模式, 可以通過某一過程生成圖像, 稱為結(jié)構(gòu)冗余。
4. 知識(shí)冗余
有些圖像與某些知識(shí)有相當(dāng)大的相關(guān)性。 如人臉的圖像有固定的結(jié)構(gòu), 嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于臉部圖像的中線上。 這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)得到, 此類冗余稱為知識(shí)冗余。
5. 視覺冗余
人眼具有視覺非均勻特性, 對(duì)視覺不敏感的信息可以適當(dāng)?shù)厣釛墶?在記錄原始的圖像數(shù)據(jù)時(shí), 通常假定視覺系統(tǒng)是線性的和均勻的, 對(duì)視覺敏感和不敏感的部分同等對(duì)待, 從而產(chǎn)生了比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來編碼)更多的數(shù)據(jù), 這就是視覺冗余。 人眼對(duì)圖像細(xì)節(jié)、 幅度變化和圖像的運(yùn)動(dòng)并非同時(shí)具有最高的分辨能力。
人眼視覺對(duì)圖像的空間分解力和時(shí)間分解力的要求具有交換性, 當(dāng)對(duì)一方要求較高時(shí), 對(duì)另一方的要求就較低。 根據(jù)這個(gè)特點(diǎn), 可以采用運(yùn)動(dòng)檢測(cè)自適應(yīng)技術(shù), 對(duì)靜止圖像或慢運(yùn)動(dòng)圖像降低其時(shí)間軸抽樣頻率, 例如每?jī)蓭瑐魉鸵粠?對(duì)快速運(yùn)動(dòng)圖像降低其空間抽樣頻率。
另外, 人眼視覺對(duì)圖像的空間、 時(shí)間分解力的要求與對(duì)幅度分解力的要求也具有交換性, 對(duì)圖像的幅度誤差存在一個(gè)隨圖像內(nèi)容而變的可覺察門限, 低于門限的幅度誤差不被察覺, 在圖像的空間邊緣(輪廓)或時(shí)間邊緣(景物突變瞬間)附近, 可覺察門限比遠(yuǎn)離邊緣處增大3~4倍, 這就是視覺掩蓋效應(yīng)。
根據(jù)這個(gè)特點(diǎn), 可以采用邊緣檢測(cè)自適應(yīng)技術(shù), 對(duì)于圖像的平緩區(qū)或正交變換后代表圖像低頻成分的系數(shù)細(xì)量化, 對(duì)圖像輪廓附近或正交變換后代表圖像高頻成分的系數(shù)粗量化; 當(dāng)由于景物的快速運(yùn)動(dòng)而使幀間預(yù)測(cè)編碼碼率高于正常值時(shí)進(jìn)行粗量化, 反之則進(jìn)行細(xì)量化。 在量化中, 盡量使每種情況下所產(chǎn)生的幅度誤差剛好處于可覺察門限之下, 這樣能實(shí)現(xiàn)較高的數(shù)據(jù)壓縮率而主觀評(píng)價(jià)不變。
6. 圖像區(qū)域的相同性冗余
在圖像中的兩個(gè)或多個(gè)區(qū)域所對(duì)應(yīng)的所有像素值相同或相近, 從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲(chǔ), 這就是圖像區(qū)域的相似性冗余。 在這種情況下, 記錄了一個(gè)區(qū)域中各像素的顏色值, 與其相同或相近的區(qū)域就不再記錄各像素的值。 矢量量化方法就是針對(duì)這種冗余圖像的壓縮方法。
7. 紋理的統(tǒng)計(jì)冗余
有些圖像紋理盡管不嚴(yán)格服從某一分布規(guī)律, 但是在統(tǒng)計(jì)的意義上服從該規(guī)律, 利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量, 稱為紋理的統(tǒng)計(jì)冗余。
電視圖像信號(hào)數(shù)據(jù)存在的信息冗余為視頻壓縮編碼提供了可能。
6.1.2 視頻信號(hào)的數(shù)字化和壓縮
模擬電視信號(hào)(包括視頻和音頻)通過取樣、 量化后編碼 為二進(jìn)制數(shù)字信號(hào)的過程稱為模數(shù)變換(A/D變換)或脈沖編碼調(diào)制(PCM, Pulse Coding Modulation), 所得到的信號(hào)也稱為PCM信號(hào), 其過程可用圖6-1(a)表示。 若取樣頻率等于fs、 用n比特量化, 則PCM信號(hào)的碼率為nfs(比特/s)。 PCM編碼既可以對(duì)彩色全電視信號(hào)直接進(jìn)行, 也可以對(duì)亮度信號(hào)和兩個(gè)色差信號(hào)分別進(jìn)行, 前者稱為全信號(hào)編碼, 后者稱為分量編碼。
PCM信號(hào)經(jīng)解碼和插入濾波恢復(fù)為模擬信號(hào), 如圖6-1(b)所示, 解碼是編碼的逆過程, 插入濾波是把解碼后的信號(hào)插補(bǔ)為平滑、 連續(xù)的模擬信號(hào)。 這兩個(gè)步驟合稱為數(shù)模變換(D/A變換)或PCM解碼。
圖 6-1 電視信號(hào)的數(shù)字化和復(fù)原
(a) A/D變換; (b) D/A變換
評(píng)論