基于小波多尺度和熵在圖像字符特征提取方法的改進 作者: 時間:2007-03-09 來源:網(wǎng)絡 加入技術交流群 掃碼加入和技術大咖面對面交流海量資料庫查詢 收藏 摘要:提出了一種基于小波和熵提取圖像字符特征的方法。該方法利用小波變換對圖像字符進行多尺度分解,用marr零交叉邊緣檢測算子提取邊緣;用基于判別熵最小化提取每一尺度圖像的邊界特征,小波的“數(shù)字顯微鏡”的優(yōu)點與熵能確切地表達各類的交疊狀況且能直接表達錯誤率的特征相結合。與其它方法相比,該方法提取的特征向量穩(wěn)定、識別率高、算法快,非常有利于分類,且特征提取的方法有人類視覺的特點。關鍵詞:多尺度分析 Marr邊緣檢測算子 判別熵 特征提取 在線簽名驗證是通過計算機采集和驗證個人簽名,從而實現(xiàn)無紙化辦公的一種技術[1]。其中,從采集到的視頻圖像中提取有效的字符特片是在線簽名驗證系統(tǒng)的核心步驟。 隨著計算機和模式識別技術的迅速發(fā)展,出現(xiàn)了很多提取字符特征的方案,最具代表性的有邊緣描述法和矩描述法[2]。描述邊緣形狀的方法可用曲線擬合和傅立葉描述子方法。傅立葉描述子雖較好地描述了一封閉的圖像輪廓,但其特征很多,噪聲和量化誤差對具有較低幅值的系數(shù)影響較大。當用FFT計算傅立葉系數(shù),必須將其邊界點的長度修成2的整數(shù)次冪,且其描述不具有三個(方向、位置、大?。┎蛔冃?,不能直接用于目標識別,必須進行復雜的變換。這些都影響了它的使用。矩描述法就是利用圖像灰度分布的各階矩描述圖像灰度分布的特征。矩特征是定義在整個圖像空間上的一個二重積分,它同樣不具有三個不變性,使用時必須進行歸一化處理。不變矩只是一種旋轉歸一化方法,必須結合大小,位置歸一化處理才有三個不變性。圖1雖然用這些特征進行圖像識別取得了較為滿意的效果,但是,這些特征的定義都是相當復雜的,運算量很大,并且與人類認知的機理也是完全不同的,不能直觀地理解。本文提出了一種將統(tǒng)計特征與結構特征相結合的新思路,對字符圖像進行小波多尺度分解,有效地抑制了圖像中的噪聲,充分反映了圖像結構的精細特征;用基于判別熵最小化進行特征提取能確切地表達各類的交疊狀況,且能直接表達錯誤率,從而有效地提高識別率。 1 小波多尺度分解 為了尋找空間的L2的基,先從L2的某個子空間出發(fā),在這個子空間中先建立基底,然后利用簡單變換,把這個基底擴充到空間L2上,以形成一組基。這就是多尺度分析方法[3][4]。 對于二維的情況,設{V2J}jez是一個可分離的MRA:V2J=VjVj,其中{V2j}jez是L2(R2)的一個MRA,其尺度函數(shù)為¢是一維MRA{V2j}jez的實值尺度函數(shù),小波母函數(shù)采用Dabuechies[6]小波;相應于二維尺度函數(shù)V2j=VjVj,定義三個函數(shù): 構成子空間W2j的正交標準基,而它們的伸縮平移系(簡寫)為: 是L2(R2)的一個標準正交基。 在本系統(tǒng)中,通過與計算機相連的手寫板及電子筆將簽名采集到計算機并顯示在屏幕上。采集并輸入到計算機中的圖像是二維,本文中設要分解的圖像為f (x,y)ΕL2(R2)。為方便,設L2(R2)-V2N,即令fN是f在V2N的正交投影。這樣關于f的有限小波分解就是對fN的分解。由于: 假定{V2j}jez上的尺度函數(shù)Φj,Φj(x,y)=2jΦ(2jx,2jy)為二維MAR{V2j}jez的尺度函數(shù),小波函數(shù)ψ(α)j, α=1,2,3已分別由式(1)和式(2)給出,并由陣列{CNk1,k2},(k1,k1ΕZ2),使得: 其中,Cn,k1,k2= 同樣,有: 式中(6),j=N-1,Λ,N-M。fj是fN在f2j上的低通濾波信號,而gαj, α=1,2,3是fN在W2j上的三個高通濾波細節(jié)。再設有限長序列{Pk1}、{Pk2}分別是平面(x,y)上x方向與y方向的高通濾波系數(shù),{gk1}與{gk2}分別是x方向與y方向的低通濾波系數(shù),則由式(6)得到: 上式中箭頭右部分是左部分的矩陣表示,其中CN是原始信號f(x,y)的分布陣列,Pr、Pc是分別對CN的行與列作低通濾波的算子,而Qr、Qc是分別對CN的行與列作高通濾波的算子。而進一步地第j次分解應為: 式(7)中,j=N-2, Λ,N-M。式(7)便是二維信號fN或CN的有限正交小波分解的Mallat塔式算法[5]。通過實驗,選用Daubechies 8小波能達到較好的分解效果。對采集進入計算機的真實簽名與偽造簽名進行小波分解,限于遍幅,本文只給出了真實簽名的一次分解圖,如圖書1所示。 通常在實驗中,借助Matlab6.5將真假簽名的字符圖像通過兩個互補濾波器即低通濾波器和高通濾波器分別得到圖像的相似和細節(jié)部分。相似子圖主要是原始圖像的全局、低頻成分,而細節(jié)子圖通常是原始圖像的局部、高頻成分。細節(jié)子圖又包括水平子圖、斜向子圖和垂直子圖三部分。其中細節(jié)子圖經(jīng)過兩次濾波:水平方向允許低頻分量通過,而沿垂直方向允許高頻分量通過。這對橫向筆劃(灰度變化沿水平方向為低頻,沿垂直方向為高頻)是增強,而對豎筆劃(灰度變化沿水平方向為高頻,沿垂直方向為低頻)是平滑。垂直方向和斜方向的像素按同樣的道理分別在垂直子圖和斜子圖中被突出表示。這種方向選擇性與人眼視覺特性相吻合,使建立在此基礎上的特征提以算法具有類視覺特性。圖22 零交叉邊緣算子 經(jīng)典的邊緣檢測算子有Sobel算子、Laplace算子、Marr算子等,近年來又有學者提出了廣義模糊算子[7]、形態(tài)學邊緣算[8]等。而Marr邊緣檢測算子▽2G被譽為最佳邊緣監(jiān)測器之一,所以本文采Marr算子。該算子的特點是利用高斯濾波器對圖像進行平滑。二維高斯濾波器的響應函數(shù)。設f(x,y)為二值圖像函數(shù),由線性系統(tǒng)中卷積和微分的可交換性,得▽2{G(x,y)хI(x,y)}={ ▽2G (x,y)} хI(x,y),即:對圖像的高斯平滑濾波與拉普拉斯微分運算可結合成一個卷積子如下: 用上述算子卷積圖像,通過判斷符號的變化確定出零交叉點的位置,就是邊緣點。對小波一次分解后的真實簽名的處理結果如圖2所示。 通過圖2可以看出,Marr零交叉邊緣算子同時提取了強、弱邊緣,并且邊緣相對干凈,噪聲干擾少,連續(xù)性好。 3 基于判別熵最小化的特征提取 不同的類樣本占有不同的特征空間的區(qū)域,只要這些區(qū)域不相交疊,它們就可以分開。經(jīng)常用樣本間的平均距離作為特征提取的判據(jù)函數(shù)。重要的距離有Minkowski度量ΔM、歐氏距離δE、Chebychev距離δr、平方距離δQ和非線性度量δN等。在不考慮各類的概率分布時,不能確切地表達各類的交疊狀況,且不能直接表達錯誤率。為此,應考慮概率距離,利用不確定性最小的分征進行分類是最有利的,故可用熵來度量后驗證概率分布的集中程序。 某此概率分布密度偏離給定標準分布的程度的度量,叫相對熵。本文假定經(jīng)小波和Marr算子處理后的圖像函數(shù)?(xi,yj)的概率分布為P(xi,yj),給定標準分布ω(xi,yj),則兩者之間的相對熵為: 求和應在該特征所有可能的取值上進行。 相對熵越小,這兩類概率分布的差別就越大,當兩類概率分別完全相同時,相對熵達最大值(等于零)。因此可以定義判別熵W(p,q)來表征兩類分布p(xi,yj)和q(xi,yi)的差別大小。 在多類情況下,可以用ΣnΣmW(p(n),q(m))表示各類分布之間的分離程度。這里n,m代表類別號。 對特征提取來說,在給定維數(shù)d的條件下,求得這樣d個特征,它使上述判別熵最小。為了計算方便,本文用下列函數(shù)-U(p,q)= ΣiΣj(pi,j-qij)2≤0代替W(p,q),而不影響選取d個最優(yōu)特征的結果。 在不對概率分布作估計的情況下,可以用經(jīng)過歸一化處理的樣本特征值代替上式中的概率分布。 K是第一類樣本集中的樣本號,N1是第一類的樣本總數(shù),i是特征號。由于,這樣做是合理的。而U取最小值的坐標系統(tǒng)工程是由矩陣A=G(1)-G(2)滿足一定條件的d個本征值相應的本征向量組成的。這里G(1)和G(2)分別是第一類樣本集和第二類本集的協(xié)方差矩陣。即將矩陣A的本征向量uk對應的本征值λk,k=1,2,ΛD排隊:選取本征值對應的本征向量為所要求的坐標軸系統(tǒng),在這個坐標系統(tǒng)中判別熵最小。在實驗中選取Shannon熵。表1和表2分別列出了真實簽名和偽造簽名分解后的各尺度圖像的最小判別熵。 由表1和表2的計算數(shù)據(jù)可以看出,通過小波一次分解后的最小判別熵的數(shù)據(jù)可以很明顯地對真假簽名進行鑒別。并且,相似圖形與細節(jié)圖形的最小判別熵相差甚遠,區(qū)別較大;而細節(jié)圖形中的水平子圖、斜向子圖和垂直子圖三部分的最小判別熵卻相差較小。因此,這樣提取的特征向量穩(wěn)定性好、區(qū)別性大、正確性高。表1 真實簽名最小判別熵 相似圖形 水平子圖 斜線子圖 垂直子圖 相似圖形 0.0000 56.7827 58.371 60.5942 水平子圖 58.371 0.0000 1.5883 3.8115 斜線子圖 56.7827 1.5883 0.0000 2.2232 垂直子圖 60.5942 3.8115 2.2232 0.0000 表2 偽造簽名最小判別熵 相似圖形 水平子圖 斜線子圖 垂直子圖 相似圖形 0.0000 101.5640 126.6594 149.2631 水平子圖 101.5640 0.0000 25.0954 47.6991 斜線子圖 126.6594 25.0954 0.0000 22.6037 垂直子圖 149.25631 47.6991 22.6037 0.0000 4 實驗結論 對120個不同的真實簽名進行了實驗,且每份真實簽名對應20個不同的偽造簽名,用小波分別對這些簽名圖像進行6次分解,各選取其中的256幅圖像,分別進行邊緣連接及最小化判別熵特征提取,鑒別率達到了98.7%,取得了令人滿意的結果。通過以上的理論分析和實驗驗證說明,用小波分解使原來單一的時域信號分解為不同頻率尺度下的信號不僅能獲得圖像在各尺度上的細節(jié)信息,且噪聲干擾少,邊緣清晰;在特征提取時用熵函數(shù)的期望值表征類別的分離程度,可以作為分類有效性的評價。該方法的優(yōu)越性對提高在線簽名驗證的精確性具有重要的意義。 低通濾波器相關文章:低通濾波器原理 高通濾波器相關文章:高通濾波器原理
評論