基于樹形檢測(cè)器的多標(biāo)志識(shí)別

作者：時(shí)間：2011-01-11 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

摘要：本文首先采用了soft cascade結(jié)構(gòu)的頭結(jié)點(diǎn)分類器檢測(cè)出大量的背景圖像；然后，通過一個(gè)貪婪搜索算法構(gòu)建分叉樹分類器，將不同的臺(tái)標(biāo)分類到正確的檢測(cè)線路中；最后，使用普通cascade結(jié)構(gòu)來得到更加準(zhǔn)確的識(shí)別結(jié)果。實(shí)驗(yàn)結(jié)果，本文的檢測(cè)器可以獲得較高的識(shí)別準(zhǔn)確度。
關(guān)鍵詞：soft cascade，joint boosting，canny算子

0 引言
自動(dòng)的電視臺(tái)標(biāo)檢測(cè)和識(shí)別已經(jīng)在多媒體領(lǐng)域獲得非常高的關(guān)注度。如今，多數(shù)的手機(jī)都具備了攝像頭功能，所以人們可以隨心所欲地拍攝各種事物，然后利用各種算法去分析處理獲得的圖像。本文中，展示一個(gè)系統(tǒng)一利用手機(jī)內(nèi)置攝像頭幫助人們識(shí)別電視頻道信息。日常觀看的電視頻道就有幾十個(gè)不同的臺(tái)標(biāo)，所以可以把這個(gè)問題看作是一個(gè)多類檢測(cè)問題，而單類的檢測(cè)即識(shí)別，最終就實(shí)現(xiàn)了多類識(shí)別。
對(duì)于單類檢測(cè)問題，Viola和Jones給出了state-of-the-art算法。他們先訓(xùn)練了一系列節(jié)點(diǎn)分類器去檢測(cè)圖像里的每一個(gè)子窗口，只有那些能夠通過所有節(jié)點(diǎn)分類器的子窗口圖像才被認(rèn)為是正樣本。吳將Voila的工作簡(jiǎn)單地拓展到了多視角人臉檢測(cè)上，為每個(gè)獨(dú)立的人臉視角訓(xùn)練了一個(gè)不同的 cascade結(jié)構(gòu)，并且并行地運(yùn)用它們進(jìn)行檢測(cè)。但是當(dāng)正樣本的類型數(shù)量增加時(shí)，這個(gè)方案所花費(fèi)的檢測(cè)時(shí)間也是線性增長的，而這個(gè)代價(jià)是我們無法負(fù)擔(dān)的。Torrobla提出了一種新的boosting框架，命名為jointboosting。他將N類分類問題轉(zhuǎn)化為N-1個(gè)兩類分類問題，然后自動(dòng)地共享相同的弱分類器。盡管它的檢測(cè)器可以共享特征，但是當(dāng)檢測(cè)目標(biāo)時(shí)，它仍然需要計(jì)算全部特征，所以它并不是一個(gè)快速檢測(cè)框架。
近些年來，樹形檢測(cè)器被引入了多視角人臉檢測(cè)應(yīng)用中。許多研究者更加偏愛于這種樹形結(jié)構(gòu)，例如，F(xiàn)leuret和Geman的scalar tree，Li等人的金字塔結(jié)構(gòu)，還有Huang chang的廣度優(yōu)先搜索樹。在他們的工作里，Huang的工作最有新意，他提出來一種新的輸出一個(gè)布爾矢量的boosting算法，取名為vector boosting。由于它具有良好的性能，本文選用它作為分叉樹的部分。有別于多視角人臉的并行結(jié)構(gòu)，經(jīng)驗(yàn)證明直接構(gòu)建一個(gè)由粗到精的樹是比較困難的。故此，本文設(shè)計(jì)了一種根據(jù)不同組合的誤報(bào)率來構(gòu)建分叉樹的方法。詳細(xì)的方案會(huì)在1．3中闡述。
本文的其他部分是這樣組織的：在1．1小節(jié)中，本文介紹所采用的特征集，然后簡(jiǎn)要地描述下普通cascade結(jié)構(gòu)和soft cascade結(jié)構(gòu)。在實(shí)驗(yàn)過程中，作者測(cè)試了本文算法的精確度和檢測(cè)所需的平均特征數(shù)。

1 檢測(cè)器框架
在實(shí)驗(yàn)中，本文采用了一架攝像機(jī)來拍攝電視節(jié)目的全屏幕圖像。考慮到此方法的通用性，不假設(shè)關(guān)于臺(tái)標(biāo)位置的先驗(yàn)信息(盡管臺(tái)標(biāo)通常會(huì)出現(xiàn)在屏幕的上部)。為了可以檢測(cè)出臺(tái)標(biāo)，本文先使用了一個(gè)分類器對(duì)大量的不同尺度和位置的子窗口進(jìn)行掃描。因?yàn)槎鄶?shù)的子窗
口都是背景，而背景的輪廓特征不明顯，所以可以將任務(wù)分割成兩個(gè)部分：首先是盡可能早的拒判掉非臺(tái)標(biāo)的子窗口，然后是區(qū)別每個(gè)臺(tái)標(biāo)屬于哪個(gè)頻道。接下來描述下算法的第一部分。

新聞中心

基于樹形檢測(cè)器的多標(biāo)志識(shí)別

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)