博客專欄

EEPW首頁 > 博客 > 無需標注海量數(shù)據(jù),目標檢測新范式OVD讓多模態(tài)AGI又前進一步

無需標注海量數(shù)據(jù),目標檢測新范式OVD讓多模態(tài)AGI又前進一步

發(fā)布人:CV研究院 時間:2023-06-07 來源:工程師 發(fā)布文章
目標檢測是計算機視覺中一個非常重要的基礎(chǔ)任務(wù),與常見的的圖像分類 / 識別任務(wù)不同,目標檢測需要模型在給出目標的類別之上,進一步給出目標的位置和大小信息,在 CV 三大任務(wù)(識別、檢測、分割)中處于承上啟下的關(guān)鍵地位。

轉(zhuǎn)自《360AI研究院》

圖片

圖片

圖片

OVD基本流程示意

圖片

論文1:Open-Vocabulary Object Detection Using Captions

圖片

  • 論文地址:https://arxiv.org/pdf/2011.10678.pdf
  • 代碼地址:https://github.com/alirezazareian/ovr-cnn

圖片

圖片

圖片

圖片

  • 論文地址:https://arxiv.org/abs/2112.09106
  • 代碼地址:https://github.com/microsoft/RegionCLIP

圖片

圖片

圖片

論文3:CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching

圖片

  • 論文地址:https://arxiv.org/abs/2303.13076
  • 代碼地址:https://github.com/tgxs002/CORA

圖片

圖片


圖片

圖片




*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉