新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于ARM的文本獨(dú)立筆跡鑒別系統(tǒng)設(shè)計(jì)

基于ARM的文本獨(dú)立筆跡鑒別系統(tǒng)設(shè)計(jì)

作者: 時(shí)間:2016-09-12 來源:網(wǎng)絡(luò) 收藏

筆跡,是具有個(gè)人特征的書寫文字符號的形象系統(tǒng),與個(gè)人書寫習(xí)慣有密切聯(lián)系。利用計(jì)算機(jī)進(jìn)行個(gè)人,是模式識別的分支問題,是通過分析比較不同人筆跡的書寫風(fēng)格來判斷書寫者身份的一種技術(shù)方法。(Text—independent)是指進(jìn)行鑒別時(shí),對書寫者書寫的內(nèi)容沒有特殊要求,具有樣本依存性小、信息采集方便等特點(diǎn),具有廣泛的應(yīng)用前景。通過對筆跡分析做出身份判斷,在計(jì)算機(jī)登錄、電子商務(wù)、金融安全、文物監(jiān)測、信息安全等方面具有重要應(yīng)用。國內(nèi)外對基于PC平臺的系統(tǒng)算法進(jìn)行了細(xì)致研究,師寶山等人解決了紙質(zhì)筆跡信息的預(yù)處理問題,張德賢等人提出了筆跡信息的特征提取算法,劉海等人提出了基于輪廓方向特征提取的方法,劉愛真提出了利用希爾伯特-黃變換(HHT)方法對脫機(jī)手寫體漢字特征進(jìn)行提取,楊彩霞提出了基于和最鄰近分類器的筆跡鑒別方法,劉宏等人提出了基于紋理分析優(yōu)化(Support Vector Machines,SVM)的筆跡鑒別方法。這些方法的鑒別性較好,可實(shí)現(xiàn)性強(qiáng),但都局限在PC系統(tǒng)層面,筆跡的采集方式復(fù)雜,不能實(shí)現(xiàn)實(shí)時(shí)的筆跡鑒別系統(tǒng)。本文提出了一種基于嵌入式系統(tǒng)的實(shí)時(shí)筆跡鑒別系統(tǒng),該系統(tǒng)主要針對離線的筆跡進(jìn)行嵌入式鑒別研究,使用ARM終端實(shí)時(shí)采集筆跡信息,使用Gabor濾波器提取筆跡樣本的紋理特征,使用(SVM)訓(xùn)練和識別筆跡信息的特征。

本文引用地址:http://m.butianyuan.cn/article/201609/304006.htm

1 筆跡鑒別系統(tǒng)總體設(shè)計(jì)

基于ARM的筆跡鑒別系統(tǒng)主要由3個(gè)模塊部分組成,包括筆跡采集端、數(shù)據(jù)傳輸部分、上位機(jī)處理部分。系統(tǒng)的總體設(shè)計(jì)原理如圖1所示。

基于ARM的文本獨(dú)立筆跡鑒別系統(tǒng)設(shè)計(jì)

進(jìn)行筆跡鑒別時(shí),需要提前將書寫人筆跡數(shù)據(jù)存入系統(tǒng)數(shù)據(jù)庫中,以便于后期比對分析。待檢測人需通過筆跡采集端的手寫式觸摸屏實(shí)時(shí)輸入手寫筆跡信息。筆跡采集端進(jìn)行簡單處理后通過數(shù)據(jù)傳輸部分傳送給上位機(jī),上位機(jī)接收數(shù)據(jù)后采取筆跡鑒別算法對實(shí)時(shí)采集的筆跡信息進(jìn)行預(yù)處理和歸一化操作。處理后的筆跡數(shù)據(jù)通過Gabor濾波器和支持

向量機(jī)方法與數(shù)據(jù)庫數(shù)據(jù)進(jìn)行比對,從而實(shí)時(shí)顯示書寫者的身份信息。

2 基于ARM的筆跡采集端技術(shù)及設(shè)計(jì)

文本獨(dú)立的筆跡鑒別系統(tǒng)的筆跡采集端主要負(fù)責(zé)筆跡信息的實(shí)時(shí)采集及發(fā)送功能,主要由ARM核心處理器、觸摸屏模塊、書寫信息顯示模塊和數(shù)據(jù)發(fā)送端口組成。

2.1 筆跡采集模塊

觸摸屏部分是筆跡采集的關(guān)鍵核心,主要由電阻式觸摸屏和觸摸屏控制器組成,負(fù)責(zé)筆跡信息的實(shí)時(shí)采集。采集的數(shù)據(jù)信息將被實(shí)時(shí)保存成圖片格式并簡單處理后發(fā)送。電阻式觸摸屏的基層是玻璃。玻璃上面涂覆有兩層透明氧化金屬(ITO氧化銦)導(dǎo)電層,兩導(dǎo)電層之間有細(xì)小的透明隔離點(diǎn),這些隔離點(diǎn)起到了將兩導(dǎo)電層隔離和絕緣的作用。當(dāng)書寫者的筆尖或手指按下觸摸屏?xí)r,兩個(gè)導(dǎo)電層就會相互接觸而形成回路,通過測量接觸點(diǎn)的電壓值等特定數(shù)據(jù)就可得到屏幕上的坐標(biāo)位置。采用電阻式觸摸屏具有價(jià)格低廉、型號齊全、耐筆尖或手指磨損、感應(yīng)度高、精確性好等特點(diǎn)。

除了通過觸摸屏實(shí)時(shí)顯示書寫者的筆跡數(shù)據(jù)外,為了更便于書寫者觀察書寫,設(shè)計(jì)了專門書寫信息顯示模塊顯示筆跡信息。該模塊采用TFT液晶屏和液晶屏控制器組成。液晶顯示屏收到來自核心處理器的筆跡數(shù)據(jù)信息后,實(shí)時(shí)地將手寫筆跡顯示在屏幕上方,使得書寫者的筆跡輸入更加直觀。由于電阻式觸摸屏采集到的筆跡信息是當(dāng)前觸摸點(diǎn)電壓值經(jīng)過模數(shù)轉(zhuǎn)換后X坐標(biāo)和Y坐標(biāo)的數(shù)字值,對TFT液晶屏沒有使用價(jià)值,因而需要通過坐標(biāo)轉(zhuǎn)換將觸摸屏坐標(biāo)映射到TFT屏幕上。具體轉(zhuǎn)換過程可以由核心處理器及驅(qū)動(dòng)程序完成。

筆跡采集端的核心處理器選擇三星公司ARM9內(nèi)核的S3C2440A處理器,它負(fù)責(zé)整個(gè)筆跡采集端的運(yùn)行控制,包括負(fù)責(zé)完成觸摸屏模塊的顯示和手寫數(shù)據(jù)的采集、書寫信息顯示模塊的數(shù)據(jù)輸出、數(shù)據(jù)通信模塊的管理控制,還負(fù)責(zé)包括坐標(biāo)映射和簡單筆跡數(shù)據(jù)處理等功能。

2.2 數(shù)據(jù)通信模塊

數(shù)據(jù)通信模塊主要負(fù)責(zé)筆跡采集端采集的筆跡信息實(shí)時(shí)傳送到上位機(jī)端的功能。實(shí)現(xiàn)上位機(jī)與筆跡采集端的通信,主要包括有線和無線兩種方式。

有線通訊方式即通過實(shí)體數(shù)據(jù)線路進(jìn)行連接,包括串口線、USB通信線等方式。其中,USB通信模塊是S3C2440A核心處理器的集成部分。S3C2440A核心內(nèi)部包括USB控制器和外

圍電路,可以直接實(shí)現(xiàn)通過USB端口數(shù)據(jù)線將大量書寫數(shù)據(jù)實(shí)時(shí)準(zhǔn)確傳送給上位機(jī)端的功能,具有簡單實(shí)用的特點(diǎn)。

為增加系統(tǒng)的可用性,實(shí)現(xiàn)相對較遠(yuǎn)距離(10 m)的自由終端式筆跡采集模塊,可以采用基于無線通訊方式進(jìn)行數(shù)據(jù)傳輸。目前較常用的無線通訊方式包括藍(lán)牙、Wi—Fi、基于nRF24L01工業(yè)模塊等方式。其中,nRF24L01是一款使用2.4 GHz ISM開放頻段、采用FSK調(diào)制、基于內(nèi)部自有協(xié)議的無線通信模塊,本身擁有126頻道,可以實(shí)現(xiàn)點(diǎn)對點(diǎn)或1對多點(diǎn)的無線通信功能,通信速度可以達(dá)到2 Mbps。采用基于nRF24L01的工業(yè)化通信模塊可以實(shí)現(xiàn)較小體積較遠(yuǎn)距離的數(shù)據(jù)傳輸,且開發(fā)方便,可以極大提高筆跡鑒別系統(tǒng)的實(shí)用性。

3 上位機(jī)文本獨(dú)立筆跡鑒別模塊的設(shè)計(jì)

文本的筆跡信息包括在線和離線兩類。離線信息是指寫在紙上的字符,具有采集方便、信息量小的特點(diǎn)。筆跡鑒別方法主要包括文本依存和文本獨(dú)立兩種,其中文本依存要求必須使用相同的文字進(jìn)行比對,而文本獨(dú)立是依據(jù)大量筆跡特征提取,與書寫內(nèi)容無關(guān),應(yīng)用更廣。本文針對離線的文本獨(dú)立筆跡信息進(jìn)行研究,利用多通道Gabor濾波器,作為圖像紋理特征提取分析方法,它被廣泛應(yīng)用于紋理分析、筆跡鑒別等領(lǐng)域。為了解決訓(xùn)練樣本不足的問題,可以采用(SVM)的方法對筆跡特征進(jìn)行訓(xùn)練和識別。上位機(jī)端的算法流程設(shè)計(jì)如圖2所示。

基于ARM的文本獨(dú)立筆跡鑒別系統(tǒng)設(shè)計(jì)

3.1 筆跡圖像預(yù)處理

筆跡圖像的預(yù)處理主要包括濾波、二值化、歸一化等。首先將圖像進(jìn)行顏色聚類和二值化,以消除背景色的干擾,根據(jù)分布特征除去背景和網(wǎng)格線,并將圖像二值化。然后需要進(jìn)行濾波以消除噪點(diǎn)的干擾,常用的圖像濾波方法有:中值濾波、鄰域均值濾波和低通濾波。由于筆跡采集終端采集的圖片質(zhì)量較高,噪聲多為小噪聲的孤立點(diǎn),因此可以采用鹽和胡椒濾波法去噪。然后將圖像分別沿水平和豎直方向進(jìn)行投影,以壓縮空行和字符間的空白。為便于數(shù)據(jù)處理,需要按統(tǒng)一的行高對每行字符進(jìn)行歸一化處理,即調(diào)整不同字符的大小相同。歸一化處理時(shí)可以根據(jù)筆跡圖像的水平直方圖做行的分割,圖像的水平直方圖就是圖像在水平方向上的投影,即每一行像素值直接相加。實(shí)驗(yàn)中我們采集了20人的筆跡信息,每人兩份,每份的漢字?jǐn)?shù)量、內(nèi)容、紙張、書寫用筆均沒有特殊限制。與此同時(shí),實(shí)驗(yàn)還采用了哈爾濱工業(yè)大學(xué)多人手寫庫(HIT—MW)中的筆跡圖像作為樣本,共使用40份,由20個(gè)人書寫,每人兩份。對于采集的手寫筆跡信息,我們將每個(gè)人的筆跡信息一分為二,一份用于訓(xùn)練,另一份用于測試,以保證兩組數(shù)據(jù)完全不同。實(shí)驗(yàn)采集筆跡圖像預(yù)處理效果如圖3所示。


上一頁 1 2 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉