新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > CVPR 2018獎項出爐:最佳論文花落斯坦福大學(xué)

CVPR 2018獎項出爐:最佳論文花落斯坦福大學(xué)

作者: 時間:2018-06-27 來源:網(wǎng)絡(luò) 收藏

  昨日,一年一度頂級會議 2018 在美國鹽湖城拉開帷幕,排起長龍的注冊隊伍讓現(xiàn)場參會的機器之心分析師看到了這屆 的火熱。據(jù)統(tǒng)計,本屆大會有超過 3300 篇的大會論文投稿,錄取 979 篇(接受率約為 29%,其中包括 70 篇 Oral 和 224 篇 Spotlight 論文)。

本文引用地址:http://m.butianyuan.cn/article/201806/382362.htm

  而在一個小時前,最受關(guān)注的 2018 最佳論文結(jié)果揭曉:來自斯坦福大學(xué)和 UC Berkeley 的 Amir R. Zamir 等人獲得 CVPR2018 的最佳論文(Best Paper Award);來自卡內(nèi)基梅隆大學(xué)的 Hanbyul Joo 等人獲得了本屆大會最佳學(xué)生論文獎(Best Student Paper Award)。此外,Tübingen 大學(xué)教授 Andreas Geiger 與 FAIR 研究科學(xué)家何愷明獲得本屆大會的 PAMI 年輕學(xué)者獎。

  在 19 號上午的主會議上,CVPR 方面先介紹了今年大會的數(shù)據(jù)信息,除了論文接收量再次超越往年,今年的注冊參會人員也達到了 6512 位。

  此外,論文評審人員的數(shù)量在今年也達到了新高,2385 名 reviewer,而 2014 年 CVPR 的參會人員也才 2000 人左右。

  介紹完大會數(shù)據(jù)方面的信息,接下來就是揭曉最佳論文得主了:

  最佳論文

  CVPR2018 的最佳論文(Best Paper Award)由斯坦福大學(xué)和 UC Berkeley 的 Amir R. Zamir 等人獲得。他們提出了一個映射視覺任務(wù)空間的框架,通過計算不同任務(wù)的相關(guān)性來確定遷移學(xué)習(xí)方案,從而可以在保持準確率的同時,大大降低對數(shù)據(jù)、監(jiān)督信息和計算資源的需求。

  最佳論文:Taskonomy: Disentangling Task Transfer Learning

  視覺任務(wù)之間是否相關(guān)?例如,能否使用曲面法線簡化估計圖像深度的過程?直覺上對這些問題的正面回答暗示著在各種視覺任務(wù)之間存在一種結(jié)構(gòu)。了解這種結(jié)構(gòu)具有巨大的價值;它是遷移學(xué)習(xí)背后的概念,且可為識別任務(wù)間的冗余提供了一種有理可依的方法,比如,為了在相關(guān)任務(wù)間無縫地重復(fù)使用監(jiān)督或在一個系統(tǒng)中解決多個任務(wù)而不增加復(fù)雜度。

  我們提出了一種完全計算的方法來建模視覺任務(wù)的空間結(jié)構(gòu),通過在一個位于隱空間內(nèi)的 26 個二維、2.5 維、三維和語義任務(wù)中尋找(一階或更高階)遷移學(xué)習(xí)依賴關(guān)系來實現(xiàn)。其成品是用于任務(wù)遷移學(xué)習(xí)的計算分類圖。我們研究了這個結(jié)構(gòu)的成果,比如出現(xiàn)的非平凡相關(guān)關(guān)系,并利用它們減少對標注數(shù)據(jù)的需求。比如,我們展示了解決一組 10 個任務(wù)所需的標注數(shù)據(jù)點總數(shù)可以減少約 2/3(與獨立訓(xùn)練相比),同時保持性能幾乎一致。我們提供了一套計算和探測這種分類結(jié)構(gòu)的工具,包括一個求解器,用戶可以用它來為其用例設(shè)計有效的監(jiān)督策略。

  會后,該論文的第一作者、斯坦福大學(xué)和加州大學(xué)伯克利分校的博士后研究員 Amir Roshan Zamir 告訴機器之心記者,「這篇論文主要圍繞了當(dāng)前機器學(xué)習(xí)系統(tǒng)最大的缺點,也就是需要很多標注數(shù)據(jù)才能完成它們想要的結(jié)果。人類是可以借鑒學(xué)到的不同技能,也就是遷移學(xué)習(xí),你在第一盤棋中學(xué)到的技能可以用到第 10、第 100 盤棋,這篇論文的重點就是將這個概念帶去機器學(xué)習(xí)、尤其是在感知(perception)這塊兒?;旧夏阌媚阒皩W(xué)的技能解決新的問題?!?br />

  該論文的共同二作,斯坦福大學(xué)計算機科學(xué)系的現(xiàn)本科生/準博士生沈博魁告訴記者,他們的目標是找到不同任務(wù)之間的關(guān)聯(lián),這些任務(wù)比如說是深度感知(depth-perception)、surface normal estimation 之類的,發(fā)現(xiàn)這些關(guān)聯(lián)之后就能用更少的數(shù)據(jù)來解決更多的任務(wù)。比如用邊緣檢測和 surface normal estimation 就能更好地學(xué)深度感知。

  最佳學(xué)生論文

  本屆大會的最佳學(xué)生論文(Best Student Paper Award)由來自卡耐基梅隆大學(xué)(CMU)的 Hanbyul Joo、Tomas Simon、Yaser Sheikh 獲得。該研究提出了一種 3D 人體模型,不僅可以追蹤身體的姿勢,還可以追蹤人臉表情和手勢等微小動作。

  最佳學(xué)生論文:Total Capture: A 3D Deformation Model for Tracking Faces, Hands, and Bodies

  摘要:我們展示了一種用于無標記捕捉多尺度人類動作(包括人臉表情、身體動作和手勢)的統(tǒng)一變形模型(deformation model)。初始模型通過將人體各部位的模型進行局部組合來形成,我們稱之為「弗蘭肯斯坦」模型。該模型能夠通過單個無縫模型完整表達人體部位的動作,包括人臉和手的動作。通過對穿著日常服飾的人們進行大規(guī)模數(shù)據(jù)收集,我們優(yōu)化弗蘭肯斯坦模型以創(chuàng)建「亞當(dāng)」(Adam)。亞當(dāng)是校準模型,它與初始模型具備同樣的基礎(chǔ)層級,但是它可以表現(xiàn)頭發(fā)和衣服的幾何形狀,使之可直接用于查看衣服和人是否相配,就像真的在日常生活中穿了這些衣服一樣。最后,我們展示了這些模型可用于整體動作追蹤,同時捕捉一組人的大規(guī)模身體動作和細微的面部和手部動作。

  榮譽提名獎(Honorable Mention)

  論文:Deep Learning of Graph Matching

  作者:Andrei Zanfir、Cristian Sminchisescu

  論文:SPLATNet: Sparse Lattice Networks for Point Cloud Processing

  作者:Hang Su、Varun Jampani、Deqing Sun、Subhransu Maji、Evangelos Kalogerakis、Ming-Hsuan Yang、Jan Kautz

  論文:CodeSLAM - Learning a Compact, Optimisable Representation for Dense Visual SLAM

  作者:Michael Bloesch、Jan Czarnowski、Ronald Clark、Stefan Leutenegger、Andrew J. Davison

  論文:Efficient Optimization for Rank-based Loss Functions

  作者:Pritish Mohapatra、Michal Rol′?nek、C.V. Jawahar、Vladimir Kolmogorov、M. Pawan Kumar

  除了以上獲獎?wù)撐模髸€公布了今年的 PAMI Longuet-Higgins Prize 與 PAMI Young Researcher Award。前者是頒發(fā)給至少 10 年前發(fā)布的論文,而后者是頒發(fā)給 7 年內(nèi)獲得博士學(xué)位且早期研究極為有潛力的研究人員。今年 Longuet-Higgins Prize 的得主為 CVPR 2008 年的論文《A discriminatively trained, multiscale, deformable part model》;PAMI Young Researcher Award 的得主為 Andreas Geiger 與何愷明。

  Andreas Geiger 是德國蒂賓根大學(xué)計算機科學(xué)系的教授,自動駕駛視覺組成員。今年他們有四篇論文被 CVPR 2018 接收。而另一位獲獎?wù)吆螑鹈鞔蠹叶急容^熟悉,他于 2016 年 8 月加入 FAIR(Facebook AI Research),擔(dān)任研究科學(xué)家。此前,他曾以第一作者身份拿過兩次 CVPR 最佳論文獎(2009 和 2016)。



關(guān)鍵詞: CVPR 的計算機視覺

評論


技術(shù)專區(qū)

關(guān)閉