依靠視頻預/后處理實現(xiàn)更出眾的高清多媒體
消費類視頻應用如今正在經(jīng)歷爆炸性的增長,可以提供逼真圖像并允許用戶根據(jù)不同顯示設備調整畫面的數(shù)字視頻壓縮技術正是這種增長的幕后推手。數(shù)字視頻技術的流行使得沉寂多年的電視市場再度活躍起來,視頻產品再次成為了消費電子領域的熱門商品。隨之而來的,如何借助視頻增強技術來進行產品差異化就變得異常重要。
視頻產品的差異化
高清數(shù)字視頻編解碼算法的標準化確保了不同產品之間的協(xié)同工作能力,標準編碼器的輸出必須能夠被所有標準解碼器解碼。因此在編解碼算法上沒有太多的差異化空間。這對于終端產品設計者來說有好處,因為它利于芯片設計人員針對算法作出非常高效的設計;而對于那些希望自己的產品與眾不同的設計者來說,則是個缺點。好在用于提高圖像質量和色彩還原能力的視頻預處理和后處理模塊提供了產品差異化的機會,同時也對產品的可編程性提出了要求。
視頻預處理算法
毫無疑問的,視頻流不會以來自傳感器的初始狀態(tài)傳輸,在進行編碼之前,會對原始碼流進行一系列的變換處理。主要的預處理操作包括:
* 像素掃描/數(shù)據(jù)傳輸–這一步操作只是簡單的從傳感器得到圖像。
* 拜爾格式解交織–現(xiàn)代視頻圖像技術用三色RGB拜爾濾波器替代了單色的圖像傳感器,因此來自傳感器的數(shù)據(jù)流包括了紅、綠、藍的顏色信息。這些信息被分離后,變換為YCbCr的亮度與色度信息來表示圖像。
* 噪聲濾波–電子世界中總是會有噪聲存在,而降低或消除噪聲的最佳階段是在進行編碼之前。
* 抖動檢測與補償–抖動檢測與補償可以減小因相機抖動造成的圖像質量下降。
* 局部動態(tài)范圍補償–在特定的模式下,圖像的動態(tài)范圍可能會超出傳感器的極限。而照相機或攝像機應該具備智能調整曝光量從而擴展傳感器基本動態(tài)范圍的功能。
* 對焦調整(銳化)–圖像傳感器無法捕獲連續(xù)的圖像信息。它們將圖像分解為一個個像素,然后根據(jù)不同的分辨率在像素間進行插值并重新組合成新的圖像。這種操作會導致圖像銳度的下降,但通過適當?shù)念A處理算法是可以糾正的。除此之外,銳化算法還可以使由于鏡頭原因輕微跑焦的圖像看起來更銳利。
* 顏色校正–不同色溫下的白光是有所不同的,這會影響到最終獲取的圖像。除此之外,不同的顯示設備處理顏色的方法也不一樣。視頻系統(tǒng)中的顏色校正補償功能可以糾正顏色偏移,特別是皮膚色調的偏移
* 人臉識別–在人物眾多的圖像中,拍攝者通常希望圖像聚焦在人物的面部。照相機和攝像機的一個重要功能就是能夠識別人臉并自動對焦。
* 立體圖像–根據(jù)平面圖像的密度信息來構建立體圖像,這種預處理常用在融合了虛擬和真實圖像的混合現(xiàn)實系統(tǒng)中。
圖1是四種預處理算法的示例圖像:噪聲濾波、抖動檢測與補償、動態(tài)范圍補償和顏色校正。
圖1: 四種預處理算法示例:噪聲濾波、抖動檢測與補償、動態(tài)范圍補償和顏色校正。
評論