條形碼識別算法研究與設(shè)計(jì)
本設(shè)計(jì)的目的是在AOI(Automatic Optical Inspection,自動(dòng)光學(xué)檢測)設(shè)備提供的PCB板圖片中對PCB板的條形碼信息進(jìn)行識別,應(yīng)用于電子通訊產(chǎn)品的生產(chǎn)線上,進(jìn)行PCB板的錯(cuò)誤檢測。AOI通過攝像頭自動(dòng)掃描PCB、采集圖像、測試的焊點(diǎn)與數(shù)據(jù)庫中的合格參數(shù)進(jìn)行比較,經(jīng)過圖像處理,檢查出PCB上的缺陷,并通過顯示器把缺陷顯示、標(biāo)識出來,供維修人員修正。PCB上所貼的條形碼記錄了該P(yáng)CB的身份信息,通過識別該條形碼字符來認(rèn)證PCB板。
本文主要解決的問題是條形碼的編碼規(guī)則如何轉(zhuǎn)換為實(shí)際獲得的像素點(diǎn)的參照標(biāo)準(zhǔn),如何分割條形碼以及如何以后臺數(shù)據(jù)庫為基準(zhǔn)識別條形碼。
1 條形碼識別的算法研究及其實(shí)現(xiàn)
1.1 條碼識別算法步驟
條形碼識別算法的過程主要分為以下這三個(gè)步驟:
(1) 對于一個(gè)條形碼圖像,要識別的是從靜區(qū)開始的有效區(qū)域,算法中考慮了判別是否到達(dá)靜區(qū),以此作為條碼識別工作的開始標(biāo)志;
(2) 算法中總體上采用把整個(gè)條形碼按照39碼型的編碼規(guī)則進(jìn)行分割,再依次找尋每個(gè)條形碼字符的邏輯值在數(shù)據(jù)庫中的匹配字符來輸出。
1.2 算法分析
在條形碼識別的算法分析過程中必須要解決三個(gè)比較關(guān)鍵的問題:1)條碼的長寬在圖像文件中用什么來衡量;2)條碼的碼字是不是要在識別之前分割出來,如果要分割出來,那么如何分割;3)分割后要怎么把對應(yīng)的碼字進(jìn)行處理。
在設(shè)計(jì)之前理解了這三個(gè)問題,整個(gè)設(shè)計(jì)就會(huì)獲得良好的解決。首先明確,所要處理的碼型是39碼。39碼的一個(gè)重要的特點(diǎn)就是,具有不可伸縮性,也就是說,一個(gè)條碼字符就是由占一定長度的,9個(gè)元素組成的,其中3個(gè)寬元素6個(gè)窄元素。39碼符號均以*號開始和結(jié)尾,即木號是39碼的起始,終止字符,并且39碼是離散碼,符號中兩個(gè)相鄰字符之間用一個(gè)位空分開。假設(shè)把條形碼抽取9個(gè)元素,然后跳過1個(gè)往下抽取9個(gè),依次類推,把抽取獲得的每9個(gè)元素組成條形碼的每個(gè)字符,只要檢測到前9條元素(由條和空組成,為了更好說明,文中把條說成黑條,而把空說成白條)是*就開始進(jìn)行條碼字符的識別,如果不是則放棄。
對于掃描得到的條碼BMP文件其白條和黑條的寬度及幾何長度已經(jīng)失去意義,必須用另一種方法來表示。此時(shí)可以給出問題1)的答案:長寬用像素的個(gè)數(shù)來表示。對一個(gè)BMP文件,其像素的數(shù)據(jù)包含對應(yīng)的RGB值,用以表征它的顏色。因此可以通過該像素的RGB值來辨認(rèn)出是白色還是黑色。在理想的狀況下,白顏色的RGB值為(255,255,255)而黑顏色的RGB值為(0,0,0),但是實(shí)際條件下,一個(gè)條碼圖像不會(huì)達(dá)到那樣標(biāo)準(zhǔn)的RGB值,也就是有模糊的狀況,規(guī)定這樣一個(gè)判決準(zhǔn)則:把RGB值大于(125,125,125)的像素認(rèn)為是白色像素,而把RGB值小于(12 5,125,125)的像素認(rèn)為是黑色的像素。在程序中采用列表PixelList=[]來存儲(chǔ)這些像素。然后基于以上的判決原則,程序?qū)崿F(xiàn)“掃描”X軸,獲得每個(gè)像素,如果該當(dāng)前的像素值符合是黑色的條件,就記錄到BlackCount,這時(shí)如果下一個(gè)的像素值還是黑色的就累加,如果下一個(gè)像素值符合是白色的條件,則把存儲(chǔ)黑色像素個(gè)數(shù)的變量BlackCount清空,以方便來記錄下一個(gè)黑條的像素個(gè)數(shù)。同樣地,對于白色像素也有類似的操作。至此得到了一個(gè)列表GeneralList=[],里面存放著掃描X軸每個(gè)被認(rèn)為是黑條或是白條其對應(yīng)的像素個(gè)數(shù)。
通過上面一步,把實(shí)際的條形碼轉(zhuǎn)換為用計(jì)算機(jī)所能運(yùn)算和操作的方式,這里必須解決第(2)個(gè)問題,即在開始條碼識別的時(shí)候,要不要進(jìn)行碼字分割。顯然,這一點(diǎn)對簡化整個(gè)識別工作是個(gè)很大的幫助,如果能夠正確地把條碼的各個(gè)碼字分離出來,那么剩下的工作就僅僅是把獨(dú)立的碼字的邏輯值和數(shù)據(jù)庫相匹配,找尋到數(shù)據(jù)庫中匹配的字符,再把它輸出來,實(shí)現(xiàn)這一點(diǎn)是容易的。因此,條碼分割是整個(gè)識別工作的難點(diǎn)和核心,整個(gè)算法重心也在此。
首先定義一個(gè)大列表CharList=[],由于列表中的元素可以為小列表,所以創(chuàng)建這個(gè)列表來放碼字,每個(gè)碼字為每個(gè)小列表,小列表里的元素是對應(yīng)的黑條和白條的像素個(gè)數(shù)。如何實(shí)現(xiàn)碼字分割,首先考慮到39碼的特點(diǎn):一個(gè)碼字為9個(gè)元素,每個(gè)碼字中間用一個(gè)白條隔開。所以只要在GeneralList=[]進(jìn)行操作,把需要的那個(gè)元素抽取存放到新的列表中即可。
其次是判斷是寬條還是窄條。先計(jì)算出黑條的平均像素個(gè)數(shù),之所以考慮采用計(jì)算平均像素個(gè)數(shù)的方法,是為了解決條形碼出現(xiàn)小角度傾斜依然能夠成功識別這樣的況。寬條或窄條的判斷原則是:對黑條而言,如果其像素個(gè)數(shù)大于這個(gè)平均值就是寬條,如果小于這個(gè)平均值就是窄條。如果是寬條就賦邏輯值1,如果是窄條就賦邏輯值0。把這些邏輯值都放到列表中,這個(gè)時(shí)候的列表,也是列表的列表,大列表的元素是單個(gè)條碼字符的黑條的邏輯值列表,小列表里的元素是01010這樣的邏輯值,用來表示寬窄。同樣地,對于白條而言,也有類似操作。至此,獲得了兩個(gè)大列表。一個(gè)是放黑條邏輯值的列表:BLogicList;一個(gè)是放白條邏輯值的列表WLogicList。大列表中的元素是每個(gè)碼字的邏輯值列表,這樣實(shí)現(xiàn)了碼字的分割工作。
對于第3)個(gè)問題:分割之后要對碼字如何處理。首先,可以建立一個(gè)數(shù)據(jù)庫,將條碼規(guī)則的信息放入數(shù)據(jù)庫中。然后,只要在條形碼識別軟件中把數(shù)據(jù)庫和相應(yīng)的程序相連接,查找匹配值即可。在Access 2000數(shù)據(jù)庫中,黑條邏輯值和白條邏輯值都是以文本的數(shù)據(jù)類型來存放,但是在列表中各個(gè)0101都是整型。因此把列表里面元素進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換,列表里的數(shù)字轉(zhuǎn)換為字符,成為一個(gè)字符串作為列表的元素存儲(chǔ)。
評論