關(guān) 閉

新聞中心

EEPW首頁 > 安全與國防 > 設(shè)計(jì)應(yīng)用 > 支持監(jiān)控視頻高效壓縮與識(shí)別的IEEE 1857標(biāo)準(zhǔn)

支持監(jiān)控視頻高效壓縮與識(shí)別的IEEE 1857標(biāo)準(zhǔn)

——
作者:黃鐵軍 張賢國 田永鴻 馬思偉 高文 時(shí)間:2013-06-26 來源:電子產(chǎn)品世界 收藏

  摘要:我國技術(shù)專家為主研究制定的數(shù)字視頻編解碼技術(shù)標(biāo)準(zhǔn)AVS于2013年6月4日被國際電子電氣工程師協(xié)會(huì)()標(biāo)準(zhǔn)化委員會(huì)頒布為 1857標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)獨(dú)具特色的一個(gè)部分是針對(duì)視頻監(jiān)控的監(jiān)控檔次,編碼壓縮性能達(dá)到目前視頻監(jiān)控業(yè)界主流使用的H.264(又稱MPEG-4 AVC)標(biāo)準(zhǔn)的兩倍,而且在碼流層支持感興趣區(qū)域的自動(dòng)提取與表達(dá)。本文介紹了的制定過程、關(guān)鍵技術(shù)及其與其它標(biāo)準(zhǔn)的壓縮效率對(duì)比情況。

本文引用地址:http://m.butianyuan.cn/article/146816.htm

  引言

  視頻監(jiān)控是繼數(shù)字電視、視頻會(huì)議之后的又一個(gè)重大視頻應(yīng)用,而且日益成為“體量”最大的一個(gè)視頻系統(tǒng):千千萬萬個(gè)攝像頭通過寬帶網(wǎng)絡(luò)聯(lián)系在一起,形成了一張覆蓋全球的“視聽感知網(wǎng)”,從此人類社會(huì)的運(yùn)行狀態(tài)都被海量的攝像頭采集下來。對(duì)大量攝像頭采集的海量有效傳輸、存儲(chǔ)、分析和識(shí)別是信息技術(shù)面臨的重大挑戰(zhàn)。

  根據(jù)EMC委托IDC做的研究報(bào)告[1],2012年全球各種數(shù)據(jù)的總量為2.84ZB。到2020年,這個(gè)數(shù)字將上升到40ZB,IDC稱之為“數(shù)字宇宙(Digital Universe)”?!皵?shù)字宇宙”中有分析利用價(jià)值的部分才是目前熱議的“大數(shù)據(jù)(Big Data)”,IDC估計(jì)2012年的數(shù)據(jù)中“大數(shù)據(jù)”占23%,2020年這個(gè)比例將增長到33%。據(jù)IDC測算,2010年“大數(shù)據(jù)”的一半是。2015年,所占比例會(huì)增長到65%。2020年仍將處于絕對(duì)領(lǐng)先地位,占44%(其次是25%的交易數(shù)據(jù)、20%的醫(yī)療數(shù)據(jù)、10%的娛樂和社交媒體)。

  按照IDC的上述測算,2020年將有5.8ZB的監(jiān)控視頻需要進(jìn)行存儲(chǔ)、傳輸和分析。其中,中國所占比例將達(dá)到21%。也就是說,2020年在我國將有1.2ZB(12億TB)的監(jiān)控視頻需要處理。這是一個(gè)什么樣的規(guī)模呢?據(jù)測算,人類歷史上說過的所有的話都數(shù)字化也就是5EB,1.2ZB是其240倍!

  面對(duì)如此海量的監(jiān)控視頻,需要對(duì)視頻編碼和分析技術(shù)進(jìn)行基礎(chǔ)性研究并實(shí)現(xiàn)重大突破。以北京為例,2008年奧運(yùn)會(huì)前全市監(jiān)控?cái)z像頭數(shù)量就超過了五十萬個(gè),每小時(shí)產(chǎn)生的視頻時(shí)長就相當(dāng)于中央電視臺(tái)建臺(tái)以來的所有庫存視頻。如果要在全市范圍內(nèi)調(diào)度、使用這些視頻,即使全部采用當(dāng)前的國家標(biāo)準(zhǔn)AVS或國際標(biāo)準(zhǔn)AVC/H.264,也需要500000(攝像頭)×10M(比特/秒/攝像頭)=5000Gbps的網(wǎng)絡(luò)帶寬,這是目前的網(wǎng)絡(luò)傳輸條件不可能支持的。這些監(jiān)控視頻往往要存儲(chǔ)數(shù)周乃至數(shù)月,盡管是分散在各個(gè)單位和部門,但整個(gè)北京為存儲(chǔ)監(jiān)控視頻付出的存儲(chǔ)成本十分龐大。仍然按當(dāng)前的視頻標(biāo)準(zhǔn)壓縮效率計(jì)算,每個(gè)小時(shí)產(chǎn)生的視頻總量仍達(dá)到500000(攝像頭)×3600(秒/小時(shí))×10M(比特/秒/攝像頭)=18000(Tb/小時(shí))=2.25(PB/小時(shí))。按照IDC對(duì)2012年存儲(chǔ)價(jià)格保守估計(jì)[1],北京市每小時(shí)存儲(chǔ)監(jiān)控視頻的成本需要2800萬元,一個(gè)月的成本就是200億。為了降低存儲(chǔ)代價(jià),往往只能以損失視頻質(zhì)量為代價(jià),但這是和監(jiān)控視頻需要滿足識(shí)別需要這個(gè)根本目的相抵觸的。因此,從傳輸和存儲(chǔ)成本考慮,都需要研究更高壓縮效率的視頻編碼技術(shù)和標(biāo)準(zhǔn)。

  2002年以前,我國的視頻壓縮一直直接采用國際視頻編碼標(biāo)準(zhǔn)。2002年后,為了支持國內(nèi)音視頻產(chǎn)業(yè)的健康發(fā)展,規(guī)避國際標(biāo)準(zhǔn)背后高額專利費(fèi)當(dāng)時(shí)已經(jīng)不斷出現(xiàn)的糾紛,工業(yè)和信息化部(原信息產(chǎn)業(yè)部)組織成立了數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組(簡稱AVS工作組)。此后,AVS工作組開始起草自主知識(shí)產(chǎn)權(quán)的國家標(biāo)準(zhǔn)《信息技術(shù)先進(jìn)音視頻編碼》,并于2006年頒布為國家標(biāo)準(zhǔn)GB/T 20090.2-2006[4]。AVS的編碼效率與同期國際標(biāo)準(zhǔn)MPEG-4 AVC/H.264相當(dāng)[5~6],在圖像質(zhì)量基本不損失的前提下對(duì)高清視頻的壓縮效率能達(dá)到150:1(以下談到壓縮效率時(shí)同此條件)。當(dāng)然,有些視頻監(jiān)控應(yīng)用中用戶將壓縮效率參數(shù)設(shè)為600:1甚至更高,但圖像質(zhì)量損失嚴(yán)重,對(duì)后續(xù)的使用會(huì)帶來負(fù)面影響,例如圖像中對(duì)象識(shí)別率下降等。

  從2007年開始,AVS工作組開始面向行業(yè)應(yīng)用對(duì)GB/T 20090.2進(jìn)行了定向擴(kuò)展,開始制定面向視頻監(jiān)控應(yīng)用的伸展檔次(簡稱AVS-S),2009年起草完成。這個(gè)標(biāo)準(zhǔn)新增了面向視頻監(jiān)控的一些技術(shù)特性,但在編碼效率這個(gè)核心指標(biāo)方面并無明顯提高,總體上處在與H.264相當(dāng)?shù)乃?。認(rèn)識(shí)到只有大幅度超越國際標(biāo)準(zhǔn)H.264,才能大幅度降低監(jiān)控系統(tǒng)成本,AVS工作組從2010年3月開始啟動(dòng)了第二代視頻監(jiān)控標(biāo)準(zhǔn)()的制定工作。2013年6月,包括AVS-S2在內(nèi)的AVS視頻編碼標(biāo)準(zhǔn)由頒布為編號(hào)1857的標(biāo)準(zhǔn)。

  AVS-S2的編碼效率有了大幅度提升,主要是因?yàn)椴捎昧吮尘敖<夹g(shù),對(duì)監(jiān)控視頻的編碼效率比H.264/AVC、以及2006年發(fā)布的AVS標(biāo)準(zhǔn)性能提高了一倍,編碼效率達(dá)到300:1左右,達(dá)到當(dāng)前最新國際標(biāo)準(zhǔn)H.265/HEVC同等的水平[7]。

  AVS–S2新增背景建模技術(shù)和感興趣區(qū)域提取等兩項(xiàng)技術(shù),是國外任何其他編碼標(biāo)準(zhǔn)所沒有使用的。其中,背景建模技術(shù)同樣可以用于增強(qiáng)其他國際標(biāo)準(zhǔn)的編碼壓縮性能,例如H.265/HEVC。實(shí)驗(yàn)表明,在H.265/HEVC參考軟件中加入AVS-S2背景建模技術(shù)后,針對(duì)監(jiān)控視頻可以將其壓縮效率再提高一倍,達(dá)到600:1左右。目前,AVS工作組正在將這套方法應(yīng)用到正在制定AVS2標(biāo)準(zhǔn)中(稱為AVS2-S),預(yù)計(jì)在監(jiān)控視頻編碼方面將比H.265/HEVC高一倍,這將是國際范圍內(nèi)監(jiān)控視頻編碼壓縮效率的最高水平。

  監(jiān)控視頻編碼標(biāo)準(zhǔn)發(fā)展歷程

  視頻編碼研究的目標(biāo)是通過各種技術(shù)手段大幅度降低視頻碼率,否則即使是單路數(shù)字視頻都難以正常傳輸。以高清晰度視頻為例,每秒鐘的數(shù)據(jù)量為 1920×1080×24比特×30幀每秒 = 1492992000比特每秒,約1.5Gbps,即使以今天的帶寬條件,傳輸這樣的一路視頻都耗資巨大,當(dāng)時(shí)的通信條件便更加難以企及。因此,從1952年貝爾實(shí)驗(yàn)室Cutler等人進(jìn)行DPCM (Differential Pulse Code Modulation)技術(shù)研究以來,視頻編碼技術(shù)一直得到高度重視和持續(xù)研究。  

?

  上世紀(jì)80年代,為了數(shù)字電視和視頻通信的需要,國際標(biāo)準(zhǔn)組織開始綜合已有技術(shù)成果來制定視頻編碼標(biāo)準(zhǔn),形成了以塊為單元的預(yù)測加變換的混合編碼框架(block-based hybrid coding framework),并相繼出臺(tái)了ITU-T H.261/H.262/H.263/H.264視頻編碼建議和ISO/IEC MPEG-1/MPEG-2/MPEG-4視頻編碼標(biāo)準(zhǔn)。其中,國際標(biāo)準(zhǔn)化組織(ISO)和國際電工技術(shù)委員會(huì)(IEC)在1994年出臺(tái)的MPEG-2標(biāo)準(zhǔn)在數(shù)字電視領(lǐng)域得到了廣泛采用,壓縮效率可以達(dá)到75:1,可以把原來一路1.5Gbps的高清視頻流編碼壓縮到20Mbps左右。國際電信聯(lián)盟1995年出臺(tái)的H.263標(biāo)準(zhǔn)也是同一時(shí)代的技術(shù),在視頻會(huì)議領(lǐng)域得到廣泛應(yīng)用。第一代數(shù)字視頻監(jiān)控系統(tǒng)主要采用MPEG-2或H.263標(biāo)準(zhǔn),某些系統(tǒng)出于實(shí)現(xiàn)成本考慮還對(duì)標(biāo)準(zhǔn)進(jìn)行了一定的簡化。

  2003年第二代視頻編碼技術(shù)國際標(biāo)準(zhǔn)發(fā)布。國際標(biāo)準(zhǔn)為ITU-T H.264和ISO/IEC MPEG-4 AVC,系同一套技術(shù)標(biāo)準(zhǔn)文本由兩個(gè)渠道出版[2~3]。因?yàn)榍懊嫣岬降脑颍覈趪H標(biāo)準(zhǔn)約一年之后制定出了自主知識(shí)產(chǎn)權(quán)的國家標(biāo)準(zhǔn),并經(jīng)過芯片實(shí)現(xiàn)等產(chǎn)業(yè)化驗(yàn)證后,于2006年2月頒布為《信息技術(shù)先進(jìn)音視頻編碼第二部分視頻》國家標(biāo)準(zhǔn)(國標(biāo)號(hào)GB/T 20090.2-2006,通常簡稱為AVS視頻編碼標(biāo)準(zhǔn))[4]。4個(gè)月后,微軟主導(dǎo)的VC-1視頻編碼標(biāo)準(zhǔn)由美國電影電視工程師協(xié)會(huì)SMPTE頒布為行業(yè)標(biāo)準(zhǔn)。這三個(gè)標(biāo)準(zhǔn)通常被稱為第二代視頻編碼標(biāo)準(zhǔn)的三個(gè)代表,其編碼效率均比第一代提高了一倍,編碼壓縮效率達(dá)到150:1左右,即可以把一路高清視頻壓縮到10Mbps左右。第二代標(biāo)準(zhǔn)在數(shù)字電視和視頻通信領(lǐng)域得到應(yīng)用后,也很快被視頻監(jiān)控系統(tǒng)所采用。目前基于IP的網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng),主要采用H.264標(biāo)準(zhǔn)。但廠商為了降低成本,往往會(huì)把標(biāo)準(zhǔn)中較為復(fù)雜的編碼工具剪裁掉,而不同廠商剪裁的方式又各不相同,因此雖然都號(hào)稱基于H.264標(biāo)準(zhǔn),但不同廠商的產(chǎn)品間之間是難以互聯(lián)互通,需要使用軟件或者硬件轉(zhuǎn)碼器進(jìn)行轉(zhuǎn)換。

攝像頭相關(guān)文章:攝像頭原理

上一頁 1 2 3 下一頁

關(guān)鍵詞: 監(jiān)控視頻 IEEE AVS-S2 201307

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉