視頻監(jiān)控的昨天、今天、明天
智能監(jiān)控系統(tǒng):網(wǎng)絡攝像機時代
本文引用地址:http://m.butianyuan.cn/article/201706/359905.htm3.1網(wǎng)絡攝像機
1996年,全球第一臺網(wǎng)絡攝像機在安訊士誕生,由此奠定了安訊士網(wǎng)絡視頻輝煌之路的基礎。由于當時中國互聯(lián)網(wǎng)發(fā)展處于起步階段,網(wǎng)絡視頻監(jiān)控更是無人問津。在互聯(lián)網(wǎng)大浪潮的背景下,經過數(shù)十年的發(fā)展,如今網(wǎng)絡攝像機已經隨處可見。
網(wǎng)絡攝像機,也叫IP攝像機,即IP Camera,簡稱IPC,近幾年得益于網(wǎng)絡帶寬、芯片技術、算法技術、存儲技術的進步而得到大力發(fā)展。IPC的特點主要體現(xiàn)在“ IP”上,即支持網(wǎng)絡協(xié)議的攝像機,IPC可以看成是“模擬攝像機+視頻編碼器”的結合體,從圖像質量指標講,又可實現(xiàn)高于“模擬攝像機+視頻編碼器”能達到的效果。
IPC是新一代網(wǎng)絡視頻監(jiān)控系統(tǒng)中的核心硬件設備,通常采用嵌入式架構,集成了視頻音頻采集、信號處理、編碼壓縮、智能分析、緩沖存儲及網(wǎng)絡傳輸?shù)榷喾N功能,再結合錄像系統(tǒng)及管理平臺,就可以構建成大規(guī)模、分布式的智能網(wǎng)絡視頻監(jiān)控系統(tǒng)。
在模擬攝像機中,CCD傳感器所產生的模擬信號首先經過模/數(shù)(A/D)轉換器轉換為數(shù)字信號,然后由攝像機內置的DSP芯片進行信號處理,如增益、降噪、背光補償?shù)忍幚?。經過DSP處理后的數(shù)字信號又經過數(shù)/模( D/A)轉換重新轉化為模擬信號,用于在同軸電纜上進行傳輸,然后傳輸至DVR或DVS后再次進行模/數(shù)(A/D)轉換來完成編碼壓縮工作,這樣多次模/數(shù)、數(shù)/模轉換過程犧牲了大量圖像質量。網(wǎng)絡攝像機就避免了這一問題,保證了圖像的清晰度
IPC的硬件構成一般包括鏡頭、圖像傳感器、聲音傳感器、信號處理器、模/數(shù)轉換器、編碼芯片、主控芯片、網(wǎng)絡及控制接口等部分組成。光線通過鏡頭進入傳感器,然后轉換成數(shù)字信號由內置的信號處理器進行預處理,處理后的數(shù)字信號由編碼壓縮芯片進行編碼壓縮,最后通過網(wǎng)絡接口發(fā)送到網(wǎng)絡上進行傳輸。
3.2高清監(jiān)控
在模擬監(jiān)控時代,根據(jù)攝像機的電視線數(shù)量來區(qū)分高清與否;在網(wǎng)絡視頻監(jiān)控時代,高清主要指百萬像素級的IP攝像機。目前高清視頻監(jiān)控系統(tǒng)可謂三足鼎立,模擬高(960H)、數(shù)字高清(HD-SDI)、網(wǎng)絡高清(IP高清)同時存在并各有其市場及應用。960H攝像機的清晰度相對傳統(tǒng)模擬攝像機可以提升30%,提升雖然有限但是基本可延續(xù)原來的模擬系統(tǒng)架構;HD-SDI的優(yōu)勢在于其高清晰度及無延時特點,不過整體系統(tǒng)相關配套設備要求較高;網(wǎng)絡高清發(fā)展迅猛,隨著編碼效率的提高、帶寬成本及存儲成本的逐步降低,已經得到越來越多的認可,不過實時性稍差。
目前,IP高清占絕對優(yōu)勢,HD-SDI技術在一定領域有其自身的優(yōu)勢及價值空間。 HD-SDI監(jiān)控以未壓縮高清數(shù)字信號實現(xiàn)高質量、低延時、高保真的圖像應用;而IP高清系統(tǒng)為了解決網(wǎng)絡傳輸及存儲問題,進行了視頻的壓縮及解壓縮過程。SDI系統(tǒng)在很大程度上是針對IP高清系統(tǒng)的無法克服的弱點而產生的, 即IP高清系統(tǒng)的網(wǎng)絡延遲性、 網(wǎng)絡架構復雜、攝像機與后端平臺&存儲設備的不兼容性等問題,但SDI的聯(lián)網(wǎng)應用靈活性遠不如IP高清應用
3.3智能視頻監(jiān)控系統(tǒng)
人工進行視頻監(jiān)控效率極低,比如一個監(jiān)控人員去監(jiān)控兩路不太繁忙的畫面,10分鐘之后將會丟失45%的監(jiān)控信息,22分鐘之后將會忽略95%的視頻信息。在網(wǎng)絡攝像機與互聯(lián)網(wǎng)的不斷發(fā)展下,智能視頻監(jiān)控系統(tǒng)就應運而生了。智能視頻監(jiān)控是針對紛繁復雜、動態(tài)變化的場景內感興趣的區(qū)域和目標自動進行檢測、分割、跟蹤、分類和識別,并對異常事件進行檢測和標注,對動態(tài)場景進行語義描述,包括IBM、Sony、CMU等科研院校和公司都在該領域進行了大量的研究。
馬里蘭大學在1999年開發(fā)了W4智能視頻監(jiān)控系統(tǒng)。該系統(tǒng)針對室外場景人的行 為識別展開研究,通過提取外觀特征可實時對人體四肢和頭部進行跟蹤,并根據(jù)局部跟蹤結果進行遮擋條件下的多人跟蹤、攜帶物品檢測、多人交互以及簡單的動作識別。AVITRACK (Aircraft surroundings, categorized Vehicles and Individuals Tracking for Airport Region Activity model interpretation and Check ) 的研究團隊以法國SILOGIC 為首,包括英國雷丁大學、法國INRIA、以及挪威、奧地利等國的多個計算機視覺研究機構,該系統(tǒng)于2003年立項,2005年10月初步實現(xiàn)了主要功能。
隨著智能視頻研究的不斷深入,采用多攝像機對目標進行大范圍、長時間跟蹤成為新的研究熱點。2007 年,位于硅谷的美國富士施樂帕拉阿圖 實驗室(FXPAL) 率先構建了一個網(wǎng)絡環(huán)境下室內多攝像機監(jiān)控系統(tǒng)DOTS (Dynamic Object Tracking System),采用二十部AXIS 網(wǎng)絡攝像機對辦公大樓內的走廊、電梯、出入口、會議室等公共場所進行24小時不間斷監(jiān)控。
智能視頻監(jiān)控的核心就是通過計算機來提取出符合人類認知的語義理解,像人一樣分析視頻數(shù)據(jù),比如判斷目標的行為以及運動軌跡等,不論是目標識別階段或者是行為分析階段,智能視頻監(jiān)控算法是其核心。
隨著日益嚴峻的安全形勢,全球范圍內對視頻監(jiān)控的需求與日俱增,部署的攝像頭密度也越來越高。根據(jù)獨立報數(shù)據(jù),2006年英國有450萬個由閉路電視控制的攝像頭,每個英國人平均每天會被拍到300次;2008年美國安裝的攝像機已經超過了2000萬臺;2010年中國超過1000萬個監(jiān)控攝像頭用于城市監(jiān)控與報警系統(tǒng)。據(jù)國土安全市場研究報告,攝像頭安裝的年復合增長率為10%左右,到2020年,每年將會產生3.3萬億小時的視頻。面對海量的數(shù)據(jù),智能視頻監(jiān)控系統(tǒng)是大勢所趨。
目前的智能攝像頭或多或少都具有計算能力,集成了數(shù)據(jù)處理芯片。簡單的比如對視頻圖像進行壓縮,功能強大的可以在攝像頭內部進行數(shù)據(jù)處理分析直接達到報警或者目標識別的預期功能。隨著最近十年來人工智能與深度學習的快速發(fā)展,智能視頻監(jiān)控算法的準確性與效率也上了一個新臺階。在2015年LFW國際人臉識別比賽中,機器識別的準確率達到了99.55%,首次超越了人眼。技術瓶頸逐漸被打破使得智能視頻監(jiān)控逐漸成為未來的主流。
評論