基于DCT域的公路車牌定位算法
2. 2 基于DCT 域的特征提取
對于彩色圖像, 圖像預(yù)處理部分首先將輸入的圖像去掉彩色, 進行灰度化。利用RGB 空間到灰度的轉(zhuǎn)換公式得到車牌的灰度圖像, 即:
其中, f ( x, y )為( x, y )位置像素的灰度值, R ( x,y )、G (x, y )、B ( x, y )為輸入彩色圖像在( x, y )位置像素的紅、綠、藍(lán)顏色對應(yīng)的彩色信息。
預(yù)處理后的圖像經(jīng)DCT 變換后所得到的系數(shù)位置及其幅值所反映的是該變換圖像的空間頻率及其能量。這里, 將圖像劃分為子塊, 子塊的大小為8 8, 對每個8 8的子塊進行DCT 變換使其能量按頻率集中, 得到的64個變換系數(shù), 分別代表對應(yīng)不同基波頻率分量的大小。
若將8 8的DCT系數(shù)劃分為0區(qū)、1區(qū)、2區(qū)、3區(qū)等4個區(qū)域, 則每個區(qū)域代表不同紋理的方向:0區(qū)表示的是直流分量(即8 8子塊的平均值) , 1區(qū)表示的是豎向紋理(即水平方向的頻率變化), 2區(qū)表示的是斜向紋理(即斜向的頻率變化) , 3區(qū)表示的是橫向紋理(即豎直方向的頻率變化)。
由于車牌字符區(qū)域具有特殊的線條結(jié)構(gòu), 它基本上可歸為橫向、豎向、斜向的線條組合。在圖像中, 這些線條主要顯示出特殊的紋理特點, 其灰度與背景相差較大, 即邊緣變化較劇烈, 且表現(xiàn)出明顯的豎向、斜向、橫向紋理特征。而在DCT 域中則主要表現(xiàn)為在圖的1、2、3區(qū)的中高頻部分的系數(shù)值較大, 即豎向線條的變換系數(shù)主要集中于1區(qū), 斜向線條的變換系數(shù)主要集中于2區(qū)( 1區(qū)與3區(qū)也有一定的分布) , 橫向線條的變換系數(shù)主要集中于3區(qū),這是圖像所含車牌字符在DCT 域中所表現(xiàn)出的紋理特征。可見, 車牌字符區(qū)所具有的特殊結(jié)構(gòu)使其在DCT 域能夠表現(xiàn)出更為豐富的中、高頻DCT 分量。同時, 車牌字符區(qū)在DCT域表現(xiàn)出明顯的方向性信息。綜合考慮上述兩點, 用一種基于DCT子塊的加權(quán)頻率特征(W eighted Frequency, WF) , 通過對不同方向DCT 分量進行非線性加權(quán)增強, 如公式( 5)所示, 從而使車牌字符區(qū)特征更加明顯。
其中c( i, j)為8 8塊中第i行第j列的DCT系數(shù); i取1~ 8; j取1~ 8, 圖1為輸入車輛圖像及其對應(yīng)的WF 特征圖。可見, 車牌字符區(qū)域的WF 值明顯高于背景。
圖1 輸入圖像及其WF特征圖。
2. 3 分類處理
在進行分類時, 如果圖像中車牌和背景之間的對比度較低, 此時的WF 值會比較小; 另外, 高頻信息豐富的非車牌區(qū)域背景經(jīng)常也具有較大的WF值。因此, 如果采用固定閾值, 則不利于低對比度車牌區(qū)域的提取, 同時也容易將高頻豐富的背景誤認(rèn)為車牌區(qū)域。因此本算法采用自適應(yīng)閾值法進行分類, 閾值的設(shè)定如公式( 6)所示。
其中aver為整幅圖像的平均WF 值, max 為整幅圖像的最大WF值, m in為整幅圖像的最小WF值, k為經(jīng)驗值, 可按公式( 7)進行分類。
圖2為分類結(jié)果圖, 可以看出, 大量的背景被去除, 車牌區(qū)被很好地提取出來。
圖2 分類結(jié)果圖。
評論