視頻壓縮技術(shù)解析
1. 奈奎斯特取樣定理
理想取樣時(shí), 只要取樣頻率大于或等于模擬信號(hào)中最高頻率的兩倍, 就可以不失真地恢復(fù)模擬信號(hào), 稱(chēng)為奈奎斯特取樣定理。 模擬信號(hào)中最高頻率的兩倍稱(chēng)為折疊頻率。
2. 亞奈奎斯特取樣
按取樣定理, 若取樣頻率fs小于模擬信號(hào)最高頻率fmax的2倍會(huì)產(chǎn)生混疊失真, 但若巧妙地選擇取樣頻率, 令取樣后頻譜中的混疊分量落在色度分量和亮度分量之間, 就可用梳狀濾波器去掉混疊成分。 本文引用地址:http://m.butianyuan.cn/article/165860.htm
3. 均勻量化和非均勻量化
在輸入信號(hào)的動(dòng)態(tài)范圍內(nèi), 量化間隔幅度都相等的量化稱(chēng)為均勻量化或線(xiàn)性量化。 對(duì)于量化間距固定的均勻量化, 信噪比隨輸入信號(hào)幅度的增加而增加, 在強(qiáng)信號(hào)時(shí)固然可把噪波淹沒(méi)掉, 在弱信號(hào)時(shí), 噪波的干擾就十分顯著。
為改善弱信號(hào)時(shí)的信噪比, 量化間距應(yīng)隨輸入信號(hào)幅度而變化, 大信號(hào)時(shí)進(jìn)行粗量化, 小信號(hào)時(shí)進(jìn)行細(xì)量化, 也就是采用非均勻量化(或稱(chēng)非線(xiàn)性量化)。
非均勻量化有兩種方法, 一是把非線(xiàn)性處理放在編碼器前和解碼器后的模擬部分, 編、 解碼仍采用均勻量化, 在均勻量化編碼器之前, 對(duì)輸入信號(hào)進(jìn)行壓縮, 這樣等效于對(duì)大信號(hào)進(jìn)行粗量化, 小信號(hào)進(jìn)行細(xì)量化; 在均勻量化解碼器之后, 再進(jìn)行擴(kuò)張, 以恢復(fù)原信號(hào)。 另一種方法是直接采用非均勻量化器, 輸入信號(hào)大時(shí)進(jìn)行粗量化(量化間距大) , 輸入信號(hào)小時(shí)細(xì)量化(量化間距小)。 也有采用若干個(gè)量化間距不等的均勻量化器, 當(dāng)輸入信號(hào)超過(guò)某一電平時(shí)進(jìn)入粗間距均勻量化器, 低于某一電平時(shí)進(jìn)入細(xì)間距量化器, 稱(chēng)為準(zhǔn)瞬時(shí)壓擴(kuò)方式。
通常用Q表示量化, 用Q-1表示反量化。 量化過(guò)程相當(dāng)于由輸入值找到它所在的區(qū)間號(hào), 反量化過(guò)程相當(dāng)于由量化區(qū)間號(hào)得到對(duì)應(yīng)的量化電平值。 量化區(qū)間總數(shù)遠(yuǎn)遠(yuǎn)少于輸入值的總數(shù), 所以量化能實(shí)現(xiàn)數(shù)據(jù)壓縮。 很明顯, 反量化后并不能保證得到原來(lái)的值, 因此量化過(guò)程是一個(gè)不可逆過(guò)程, 用量化的方法來(lái)進(jìn)行壓縮編碼是一種非信息保持型編碼。 通常這兩個(gè)過(guò)程均可用查表方法實(shí)現(xiàn), 量化過(guò)程在編碼端完成, 而反量化過(guò)程則在解碼端完成。
對(duì)量化區(qū)間標(biāo)號(hào)(量化值)的編碼一般采用等長(zhǎng)編碼方法。 當(dāng)量化分層總數(shù)為K時(shí), 經(jīng)過(guò)量化壓縮后的二進(jìn)制數(shù)碼率為lbK比特/量值。 在一些要求較高的場(chǎng)合, 可采用可變字長(zhǎng)編碼如哈夫曼編碼或算術(shù)編碼來(lái)進(jìn)一步提高編碼效率。
6.1.3 ITU-R BT.601分量數(shù)字系統(tǒng)
數(shù)字視頻信號(hào)是將模擬視頻信號(hào)經(jīng)過(guò)取樣、 量化和編碼后形成的。 模擬電視有PAL、 NTSC等制式, 必然會(huì)形成不同制式的數(shù)字視頻信號(hào), 不便于國(guó)際數(shù)字視頻信號(hào)的互通。 1982年10月, 國(guó)際無(wú)線(xiàn)電咨詢(xún)委員會(huì)(CCIR, Consultative Committee for International Radio)通過(guò)了第一個(gè)關(guān)于演播室彩色電視信號(hào)數(shù)字編碼的建議, 1993年變更為ITU-R(國(guó)際電聯(lián)無(wú)線(xiàn)電通信部分, International Telecommunications Union-Radio communications Sector)BT.601分量數(shù)字系統(tǒng)建議。
BT.601建議采用了對(duì)亮度信號(hào)和兩個(gè)色差信號(hào)分別編碼的分量編碼方式, 對(duì)不同制式的信號(hào)采用相同的取樣頻率13.5 MHz, 與任何制式的彩色副載波頻率無(wú)關(guān), 對(duì)亮度信號(hào)Y的取樣頻率為13.5 MHz。 由于色度信號(hào)的帶寬遠(yuǎn)比亮度信號(hào)的帶寬窄, 對(duì)色度信號(hào)U和V的取樣頻率為6.75 MHz。 每個(gè)數(shù)字有效行分別有720個(gè)亮度取樣點(diǎn)和360×2個(gè)色差信號(hào)取樣點(diǎn)。 對(duì)每個(gè)分量的取樣點(diǎn)都是均勻量化, 對(duì)每個(gè)取樣進(jìn)行8比特精度的PCM編碼。
這幾個(gè)參數(shù)對(duì)525行、 60場(chǎng)/秒和625行50場(chǎng)/秒的制式都是相同的。 有效取樣點(diǎn)是指只有行、 場(chǎng)掃描正程的樣點(diǎn)有效, 逆程的樣點(diǎn)不在PCM編碼的范圍內(nèi)。 因?yàn)樵跀?shù)字化的視頻信號(hào)中, 不再需要行、 場(chǎng)同步信號(hào)和消隱信號(hào), 只要有行、 場(chǎng)(幀)的起始位置即可。 例如, 對(duì)于PAL制, 傳輸所有的樣點(diǎn)數(shù)據(jù), 大約需要200 Mb/s的傳輸速率, 傳輸有效樣點(diǎn)只需要160 Mb/s左右的速率。
色度信號(hào)的取樣率是亮度信號(hào)取樣率的一半, 常稱(chēng)作4∶2∶2格式, 可以理解為每一行里的Y、 U、 V的樣點(diǎn)數(shù)之比為4∶2∶2。
6.1.4 熵編碼
熵編碼(Entropy Coding)是一類(lèi)無(wú)損編碼, 因編碼后的平均碼長(zhǎng)接近信源的熵而得名。 熵編碼多用可變字長(zhǎng)編碼(VLC, Variable Length Coding)實(shí)現(xiàn)。 其基本原理是對(duì)信源中出現(xiàn)概率大的符號(hào)賦以短碼, 對(duì)出現(xiàn)概率小的符號(hào)賦以長(zhǎng)碼, 從而在統(tǒng)計(jì)上獲得較短的平均碼長(zhǎng)。 所編的碼應(yīng)是即時(shí)可譯碼, 某一個(gè)碼不會(huì)是另一個(gè)碼的前綴, 各個(gè)碼之間無(wú)需附加信息便可自然分開(kāi)。
1. 霍夫曼(Huffman)編碼
霍夫曼(Huffman)編碼是一種可變長(zhǎng)編碼, 編碼方法如圖6-2所示。
(1) 將輸入信號(hào)符號(hào)以出現(xiàn)概率由大至小為序排成一列。
(2) 將兩處最小概率的符號(hào)相加合成為一個(gè)新概率, 再按出現(xiàn)概率的大小排序。
(3) 重復(fù)步驟(2), 直至最終只剩兩個(gè)概率。
(4) 編碼從最后一步出發(fā)逐步向前進(jìn)行, 概率大的符號(hào)賦予“0”碼, 另一個(gè)概率賦予“1”碼, 直至到達(dá)最初的概率排列為止。
圖 6-2 霍夫曼(Huffman)編碼
評(píng)論