新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 基于圖像的OMR技術的實現(xiàn)

基于圖像的OMR技術的實現(xiàn)

作者: 時間:2007-03-09 來源:網絡 收藏
摘要:在分析OMR與OCR的應用特點后,提出了基于圖像的OMR方式。詳細討論了該方法的硬件設計和工作原理,并在軟件處理方面著重介紹了傾斜校正和圖像分割。它具有對紙張質量要求低和識別準確度高等特點。 關鍵詞:OMR OCR 信號處理 傾斜校正 圖像分割 目前,許多文檔是以紙質文檔的形式存在,例如銀行票據、稅務報表、標準化考試中的機讀卡、人口普查表、彩標投注單、選票、定貨單等。而紙質文檔不便于保存、檢索、統(tǒng)計和修改。將這些信息錄入計算機是一件非常繁瑣的事情。長期以來人們通過鍵盤手工輸入,不但費時費力且容易出錯。在實時性要求較高的場合(如選舉中的統(tǒng)計選票)自動、快速、準確地處理文檔顯得尤為重要。因此,對這些文檔進行計算機自動錄入具有重要的實現(xiàn)意義。 計算機自動錄入是解決這個同瓶頸的關鍵所在。其中,光學字符識別OCR(Optical Character Recognition)和光學標記識別OMR(Optical Mark Recognition)是解決信號自動錄入的有效方法。它們利用光學方法將信息錄入到計算機并進行識別處理,能極大地提高數(shù)據信息的采集速度,便于計算機存儲、管理與檢索。 1 OCR與OMR (1)OCR的工作原理 OCR首先將要識別的文字和圖像掃描進計算機,然后進行圖像的預處理,再抽取字符特片進行識別,轉變?yōu)橛嬎銠C能夠識別的字符信息。圖像預處理包括去除噪聲、歪斜校畫龍點睛、圖像分割、平滑及規(guī)范化等。其中圖像分割是一個重要的步驟,它的作用是將要識別的單個字符的圖像找到并分割出來。OCR技術主要應用于文字圖像識別及處理,例如用于印刷體和限制手寫體字符的識別。OCR技術已成為大規(guī)模數(shù)據錄入的首選方案,它將隨著計算機技術的發(fā)展而更加成熟。 (2)OMR的工作原理 OMR識別“涂點”上有無標記兩種狀態(tài)?!巴奎c”就是信息卡上可以涂寫標記的地址。“涂點”所代表的含義可以事先定義,可以代表一個阿拉伯數(shù)字,也可以表示一個英文字母或符號。OMR技術快速簡單,識別率高且成本低,廣泛應用于標準化考慮自動閱卷、各類調查問卷的統(tǒng)計、選舉結果的統(tǒng)計等,是自動識別領域中應用較多的一種方法。2 基于圖像的OMR技術 目前OMR一般采用光電對管閱讀技術。識別用的器件是半導體發(fā)光管及光敏管。發(fā)光管是光源器件,由它發(fā)出的光照射到“涂點”上。光敏管是接收器件,接收來自“涂點”位置的反射光。因為涂有標記的地方反光弱,未涂標記的地方反光強,所以光敏管接收到的光信號強度不同。不同強度的光信號可以代表有無標記兩種狀態(tài)。將“涂點”位置處的發(fā)光管和光敏這組成一只電眼,可識別一個涂點。若干個電眼排列起來組成光電頭可完成對一排涂點的識別。 該方法實現(xiàn)應用中有如下限制:信息卡上的“涂點”要與電眼完全對齊,即信息卡在錄入時不能傾斜;信息卡不能折皺;紙張質量、印刷技術要求高;填寫標記要規(guī)范,否則就要影響識別結果。實際應用中,信息卡在錄入時由于走紙機構機械誤差而略有傾斜,會造成識別出錯。 OCR由于采用了圖像處理技術,信息卡在錄入時的傾斜能自動校正,保證錄入的高精度,也能處理略有折皺的信息卡。因此,OCR對所用紙張的質量、印刷技術要求不高,降低了運行成本。同時可以保留填寫的原始圖像備查,進行復核或重新識別。 在借鑒OCR優(yōu)點的基礎上,筆者在課題《彩標閱讀及識別系統(tǒng)》中采用了基于圖像的OMR技術。所謂基于圖像的OMR技術,就是將信息卡經光電變換,形成二值化圖像;再經歪斜校正、圖像分割,對分割出的小塊圖像(含“涂點”)中的黑點數(shù)進行計數(shù)。若大于某個閾值,就認為有標記,否則就沒有標記,從而完成了標記識別。相對OCR而言,它省去了最耗時的字符特征抽取步驟。 3 硬件組成 本系統(tǒng)框圖如圖1所示。 (1)圖像傳感器 采用國產的CIS(Contact Image Sensor)圖像傳感器,其光學分辨率比CCD略低,但是其驅動電路、光學系統(tǒng)和機械結構卻比CCD簡單。光學系統(tǒng)中采用特殊光源實現(xiàn)光學濾波,消除或減輕了信息卡背景信息對分割、識別的影響。工作時,由CPLD(Complex Programable Logic Device)產生一個周期性的同步脈沖SYN引導每次掃描,時鐘信號CLK在移動寄存器的作用下,對CIS內的像元依次進行掃描,像元上的光電信號串行輸出。(2)走紙控制 輸入的信息卡通過光學系統(tǒng)成像在圖像傳感器的光敏面上,在CPLD器件產生的掃描信號的驅動下,圖像傳感器對信息卡進行橫向自掃描;步進電機驅動輸紙機構使信息卡縱向運行,從而實現(xiàn)了信息卡的二維掃描。 (3)模擬信號處理 模擬信號處理要考慮信息卡顏色的深淺、字跡的輕重和光強均勻度的變化等引起的脈沖幅度的變化。在光電變換中,對信號幅值影響較大的是:光束照射在光敏面上,光強的不均勻性及波動影響表現(xiàn)為白電平浮動對比度的變化也會引起信號幅值的較大起伏。處理的好壞直接影響到采集圖像的質量。其過程為:CIS圖像傳感器攝取的原始圖像信號,經放大、采樣保持及濾波、對消、浮動閾值及二值化等一系列處理,消除或減輕了信息卡背景明暗變化、光源變化、開關噪聲、高低頻干擾等對系統(tǒng)的影響,獲得高質量的二值化信號。 (4)數(shù)字信號處理 采用A、B兩塊大容量的SRAM輪流工作在讀或寫狀態(tài)。合并二值化的信號,同時為了加快數(shù)據采集的速度,每次將16位的串行信號轉換為2個字節(jié)的并行數(shù)據。在標志寄存器的控制下,將信號暫時寫入A中,同時計算機通過16位ISA總線從B中取數(shù)據。在下一周期,二值化信號寫入B中,計算機通過16位ISA總線從A中取數(shù)據。這樣就保證數(shù)據傳輸?shù)母咝浴? (5)邏輯控制 整個系統(tǒng)的邏輯控制采用Lattice公司的CPLD——L1032,它負責控制輪紙機構、圖像傳感器、兩塊SRAM的輪換;并隨時檢測系統(tǒng)的工作狀態(tài),協(xié)調各部分的工作;并將檢測到的狀態(tài)即時送給計算機,便于計算機對整個系統(tǒng)的管理。 4 軟件處理 在大數(shù)據量的文檔處理中,為了滿足快速高效地處理,文檔必須針對OCR技術或OMR技術進行專門設計。這樣才適合光電閱讀。在信息卡上設計定位標記塊是一種有效手段。它分為水平定位標記塊和垂直定位標記塊,并且按照與填寫的字符相同的顏色(黑色)來印刷。一個水平定位標記塊表示一個字符行,垂直定位標記表示一個字符列。標記填寫在以字符行列交叉點為中心的矩形區(qū)域。定位標記塊主要用于字符定位和信息卡圖像的傾斜校正,如圖2所示。 另一種有效手段就是常常對信息卡學習,獲得相應的先驗知識,如信息卡的行數(shù)、列數(shù)、標記出現(xiàn)的主要區(qū)域、表格類型、每個黑色定位標記塊的大致位置等。由于對同一批表格而言這些參數(shù)都是相同的,在對后續(xù)表格的處理中就可利用這些參數(shù)指導圖像的分割和識別,從而提高了整批表格的處理效率。 硬件系統(tǒng)對信息卡進行掃描信號處理后,得到二值化的圖像信號,但是二值化的圖像信號中標記所代表的數(shù)字信息才是最終結果。為此,還要對二值化的圖像信號在PC機上利用軟件進行噪聲處理、傾斜校正、分割及識別處理,得到感興趣的識別結果。最后再將識別結果進行輸出顯示。在基于圖像的OMR技術中,傾斜校正和圖像分割是最關鍵的。 (1)傾斜校正 由于輸紙機構有走紙不均勻的情況,信息卡圖像不可避免地會產生一定的傾斜。因此必須對傾斜的圖像進行旋轉,旋轉到正常位置,才便于圖像分割。 對信息卡學習,獲得正常圖像的定位標記塊的位置。將傾斜圖像沿X,Y軸方向投影,所有的水平定位標記塊和垂直定位標記塊會分別在投影圖上產生對應的峰,從而可以確定水平定位標記塊和垂直定位標記塊的位置。根據正常圖像和傾斜圖像的定位標記塊的位置,就可以計算出旋轉角δ。 將傾斜圖像f(x,y)繞坐標原點O(0,0)旋轉一個角度-δ,圖像的原始坐標為(x,y),旋轉后的坐標為(x",y"),按式(1)旋轉變換,旋轉后的圖像為(x",y")。 (2)圖像分割 根據上述投影法,可以獲得水平定位標記塊和垂直定位標記塊的位置,并得到交叉點的位置。由于標記填寫在以字符行列交叉點為中心的矩形區(qū)域,并且設矩形區(qū)域長為X列,寬為Y行,以此交叉點向左向右各擴展(X+4)/2列,向上向下各擴展(Y+4)/2行形成一分割框,即矩形區(qū)域完全包含在該分割框內。逐行以分割框為單位對整個圖像進行分割,并統(tǒng)計各分割框內的黑點數(shù)。若大于某個閾值,就認為有標記;否則就沒有標記。再結合各標記事先定義的含義,得到識別結果。 基于圖像的OMR技術采用圖像傳感器作為掃描部件,將信息卡的完整圖像讀入微機,并進行圖像識別。它克服了采用光電對管閱讀的OMR方式的缺點,同時它具有如下優(yōu)點: %26;#183;識別精度高; %26;#183;紙張質量、印刷技術要求低,可以處理略有折皺的信息卡; %26;#183;調整表格靈活,可適應多種信息卡; %26;#183;采用了計算機圖像處理技術,可保存信息卡的原始圖像備查,提高了系統(tǒng)的安全性、可靠性和防偽性。 基于圖像的OMR技術提高了信息卡處理準確率,應用在彩票閱讀及識別系統(tǒng)課題中取得了良好的效果。 linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)


評論


相關推薦

技術專區(qū)

關閉