無需標注海量數(shù)據(jù),目標檢測新范式OVD讓多模態(tài)AGI又前進一步
目標檢測是計算機視覺中一個非常重要的基礎(chǔ)任務(wù),與常見的的圖像分類 / 識別任務(wù)不同,目標檢測需要模型在給出目標的類別之上,進一步給出目標的位置和大小信息,在 CV 三大任務(wù)(識別、檢測、分割)中處于承上啟下的關(guān)鍵地位。
轉(zhuǎn)自《360AI研究院》
OVD基本流程示意
論文1:Open-Vocabulary Object Detection Using Captions
- 論文地址:https://arxiv.org/pdf/2011.10678.pdf
- 代碼地址:https://github.com/alirezazareian/ovr-cnn
- 論文地址:https://arxiv.org/abs/2112.09106
- 代碼地址:https://github.com/microsoft/RegionCLIP
論文3:CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching
- 論文地址:https://arxiv.org/abs/2303.13076
- 代碼地址:https://github.com/tgxs002/CORA
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。