海康威視研究院院長浦世亮談深度學(xué)習(xí)+安防
備受關(guān)注的計算機視覺國際大賽——ImageNet 大規(guī)模圖像識別挑戰(zhàn)賽(ILSVRC2017)已經(jīng)拉開帷幕,今年的比賽分為四個主要項目:定位、識別以及視頻中物體識別和Tester Challenges。去年在比賽中拿下場景分類關(guān)鍵的深度學(xué)習(xí)與安防行業(yè)現(xiàn)狀的10個問題進行了深入解讀。
本文引用地址:http://m.butianyuan.cn/article/201703/345833.htm根據(jù) ImageNet官網(wǎng)的最新消息,今年的 ImageNet 大規(guī)模圖像識別挑戰(zhàn)賽(ILSVRC2017)已經(jīng)拉開帷幕。
今年的比賽項目分為4個:
物體定位
物體識別
視頻中物體識別
Tester Challenges
官網(wǎng)特別提示:已經(jīng)使用了幾種算法的參與者可以每個算法提交一個結(jié)果(最多5個算法)。算法參數(shù)的變化不構(gòu)成不同的算法(遵循PASCAL VOC中使用的過程)。
去年的 ImageNet上,來自中國的團隊大放異彩:CUImage(商湯和港中文),Trimps-Soushen(公安部三所),CUvideo(商湯和港中文),HikVision(??低?/em>),SenseCUSceneParsing(商湯和港中文),NUIST(南京信息工程大學(xué))分別拿下多個項目的冠軍。
另外,在物體探測任務(wù)上,??低曇灿辛裂郾憩F(xiàn):
??低曔@家做安防出身的企業(yè)目前在計算機視覺上已在國際上取得領(lǐng)先的地位,除了ImageNet 外,在PASCAL、KITTI和MOT等競賽中都有亮眼表現(xiàn)。
根據(jù)??低暿紫瘜<移质懒两榻B,在PASCAL VOC2012目標檢測上,海康威視基于Faster R-CNN深度學(xué)習(xí)目標檢測算法mAP性能達到87.9,排名第一,領(lǐng)先盤踞榜首近一年的第二名微軟4.1個點,刷新紀錄。
新智元最新一期的AI領(lǐng)軍人物專訪采訪到了??低暿紫瘜<?、研究院院長浦世亮,他分享了??低晩Z冠 ImageNet 背后的技術(shù),談到 2017年,深度學(xué)習(xí)在復(fù)雜網(wǎng)絡(luò)設(shè)計、模型壓縮方向的研究依然是熱點,深度學(xué)習(xí)和LSTM、增強學(xué)習(xí)的結(jié)合進一步加強。另外,針對當下安防行業(yè)的智能+現(xiàn)狀,他也提出了獨特的見解。
浦世亮 ??低曆芯吭涸洪L
浦世亮,法國國家科學(xué)研究院(CNRS)博士,浙江大學(xué)理學(xué)博士,現(xiàn)任??低暿紫瘜<摇⒀芯吭涸洪L,負責公司在人工智能及大數(shù)據(jù)領(lǐng)域的技術(shù)研究。浦世亮帶領(lǐng)研究院研發(fā)的Smart 265編碼技術(shù)、目標結(jié)構(gòu)化算法、車牌識別算法、人臉識別算法、視頻檢索引擎、多傳感器融合等技術(shù),被廣泛應(yīng)用于公共安全、金融、交通、司法、零售、智慧城市等多個領(lǐng)域。
??低?nbsp;ImageNet 2016 奪冠背后技術(shù)詳解
去年 ImageNet 大規(guī)模圖像識別挑戰(zhàn)賽(ILSVRC)中,??低?HikVision)拿下場景分類項目的冠軍。你能具體介紹一下這一比賽項目嗎???低晩Z冠的技術(shù)核心是什么?
浦世亮:ImageNet 場景分類任務(wù)采用MIT發(fā)布的 Place2 數(shù)據(jù)集,其目的是對圖像中存在的場景進行識別。該數(shù)據(jù)集擁有365個類別的場景目標,800多萬張已經(jīng)標記的訓(xùn)練樣本。相對于普通的ImageNet圖像分類任務(wù),場景分類任務(wù)的難點在于其數(shù)據(jù)分布非常不均衡,每個類別的數(shù)據(jù)從5000 到 30000不等,每張圖像都可能在不同的場景描述和相對更模糊的場景標簽。
場景分類技術(shù),對于視頻產(chǎn)業(yè)及其應(yīng)用領(lǐng)域有比較重要的應(yīng)用價值,基于對場景的理解有助于我們的系統(tǒng)更好地對于視頻中的信息進行理解和應(yīng)用。
??低晱某闪⒅蹙蛯W⒂谟嬎銠C視覺領(lǐng)域技術(shù)的研發(fā),13年就開始深度學(xué)習(xí)的技術(shù)布局,實現(xiàn)了一整套的深度學(xué)習(xí)訓(xùn)練框架,并探索了深度神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法,包括對網(wǎng)絡(luò)參數(shù)初始化、超參數(shù)搜索、正則項、損失函數(shù)、流形優(yōu)化理論等的研究。
另外,我們還從信號調(diào)制方向切入,圍繞信號在網(wǎng)絡(luò)前向反向傳輸中的保范性(norm-preserving),探索深層網(wǎng)絡(luò)優(yōu)化的可行性與新方向。
評論