電路原理圖紙識別系統(tǒng)研究與實(shí)現(xiàn)

作者：時(shí)間：2007-11-30 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

摘要：本文討論了紙質(zhì)電路原理圖的自動(dòng)輸入和識別，主要理解圖紙字符、分立元件和相互間的拓?fù)潢P(guān)系。首先對掃描得到的光柵圖像進(jìn)行了字符的模式分離，采用8x8網(wǎng)格抽取63種字符的特征，并采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行識別。提出探索試探法快速跟蹤直線/曲線；用特征匹配方法混合識別導(dǎo)線和部分元器件；提出了X/Y坐標(biāo)正交投影的方法識別元器件，提高了識別速度；而右手邊緣跟蹤的識別方法抗噪聲的性能較強(qiáng)。最終將字符、導(dǎo)線和元器件符號三元素有機(jī)結(jié)合，得到規(guī)范化的圖紙輸出。
關(guān)鍵詞：模式識別；圖像處理；電路原理圖；神經(jīng)網(wǎng)絡(luò)

引言

目前，國內(nèi)外許多大中型企業(yè)都在開始自己的信息化進(jìn)程，而企業(yè)中長期積累下來的各種圖紙、文檔資料是一筆巨大的財(cái)富。如何在信息化過程中將這部分資料電子化以利再利用，是一件很有意義的事。

國內(nèi)外對于工程圖紙識別研究工作是從80年代后期興起的，至今仍然是模式識別領(lǐng)域的熱點(diǎn)之一。研究主要集中在機(jī)械圖紙矢量化、理解上。電路原理圖同樣是很重要的工程圖紙，但是因?yàn)樵柕亩鄻有裕黾恿俗R別系統(tǒng)實(shí)用化的難度。使得這方面的研究成果較少見諸紙面。

2 圖紙識別的模式分離

電路原理圖主要由三種元素構(gòu)成：導(dǎo)線、元器件符號和字符。其中字符包括英文字母、數(shù)字、以及器件的一部分，比如電解電容的“＋”，電感的極性標(biāo)識“”等等。成分比較復(fù)雜，差異較大，因此要對圖紙的內(nèi)容做模式分離。整個(gè)識別系統(tǒng)的結(jié)構(gòu)如圖1所示。

圖紙經(jīng)過掃描之后得到光柵圖像。有必要對光柵圖像中的色度或者灰度信息進(jìn)行動(dòng)態(tài)二值化處理。再經(jīng)過必要的濾波降噪的處理之后，開始圖紙內(nèi)容的理解工作。

在圖紙理解的過程中，由于字符的特征明顯，且與導(dǎo)線或者元器件不易產(chǎn)生混淆，因此容易分割出來單獨(dú)進(jìn)行識別。但是某些器件的局部特征和導(dǎo)線是不易區(qū)分的，比如電阻或者集成塊矩形較長的一條邊和導(dǎo)線的特征是相同的，所以需要混合處理。先對全圖判別線段和節(jié)點(diǎn)，分別標(biāo)注屬性；然后進(jìn)行器件識別；器件識別后可以認(rèn)定剩余的線段屬于導(dǎo)線，進(jìn)行導(dǎo)線的校正處理；最后，判別字符和元器件的從屬關(guān)系，將字符、器件和導(dǎo)線有機(jī)地結(jié)合起來，輸出新的圖紙。

3 字符分割與BP網(wǎng)絡(luò)識別

3.1 字符分割

如圖2所示，字符的特征有三點(diǎn)：（1）孤立；（2）尺寸較小；（3）各個(gè)字符大小相近。為此，采用區(qū)域生長的方法，對全圖進(jìn)行區(qū)域擴(kuò)充，并且計(jì)算得各個(gè)連通區(qū)域的外接矩形大小。圖紙中的器件和導(dǎo)線作為一個(gè)連通區(qū)域，外接矩形很大，與光柵圖像尺寸接近，首先拋棄。其次，字符在圖中一般會(huì)有多個(gè)，它們的外接矩形尺寸近似。因此，利用第3項(xiàng)特征，統(tǒng)計(jì)剩余外接矩形尺寸出現(xiàn)的次數(shù)，可以得到字符的有效尺寸如式1所示。字符分割后，記錄好各個(gè)字符的原始位置，送交BP網(wǎng)絡(luò)識別。

3.2基于BP神經(jīng)網(wǎng)絡(luò)的字符識別

采用“誤差反向傳播”學(xué)習(xí)算法的神經(jīng)網(wǎng)絡(luò)被稱為BP網(wǎng)絡(luò)。它可以對任意形狀的非交觀察向量集合進(jìn)行正確地分類，是目前應(yīng)用十分廣泛的一種人工神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3(a)所示。

假設(shè)輸入輸出對是（X_k, Y_k），其中，X_k是第k個(gè)輸入向量，X_k =（x_k1, x_k2, ……, x_kn）^T； T_k是第k個(gè)樣本的期望輸出，T_k =（t_k1, t_k2, ……, t_km）^T； O_k是第k個(gè)樣本的網(wǎng)絡(luò)實(shí)際輸出，O_k =（o_k1, o_k2, ……, o_km）^T。w_ji為前一層第個(gè)神經(jīng)元輸入到后一層第j個(gè)神經(jīng)元的權(quán)重，是第j個(gè)神經(jīng)元的閥值。所有神經(jīng)元都采用非線性激活函數(shù)如式（3）所示，于是神經(jīng)元的模型如式（1）所示：

對于輸入層的神經(jīng)元，其輸出O_k＝X_k。對于隱層和輸出層，樣本k、神經(jīng)元j的狀態(tài)定義為：；神經(jīng)元j的輸出為：。如果取訓(xùn)練指標(biāo)函數(shù)為：，使用BP算法將使E在每個(gè)訓(xùn)練循環(huán)中按梯度下降。對于輸出層單元：；而對于隱層單元：。它們的權(quán)值調(diào)整為：。通過迭代訓(xùn)練，E小于規(guī)定值的時(shí)候，可以認(rèn)為網(wǎng)絡(luò)收斂。并取當(dāng)前的w_ij作為實(shí)際識別的權(quán)值向量進(jìn)行識別。

工程圖紙上的字符通常只包含英文字母大寫A～Z、小寫a～z，數(shù)字0～9，以及電解電容的符號“＋”，字符數(shù)一共63個(gè)。實(shí)際操作的時(shí)候，將字符逐一放置到2ⁿx2ⁿ（n>2）的位圖的左上角，n的選取以該位圖可以無縮放地容納最大的字符圖像為準(zhǔn)。把該位圖平均分割成8X8的特征矩陣，得到的64個(gè)特征值，作為BP網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練。試驗(yàn)表明，訓(xùn)練后的BP網(wǎng)絡(luò)對圖紙中的字符識別效果很好。

4 導(dǎo)線和幾種常用器件的識別

在字符分離之后，圖紙上仍然有導(dǎo)線和元器件符號兩種元素。對于它們的模式分離，我們首先識別線段和節(jié)點(diǎn)（包括端點(diǎn)、分歧點(diǎn)、交叉點(diǎn)和拐點(diǎn)等），以此為基礎(chǔ)首先識別出器件。則剩余的線段和節(jié)點(diǎn)就可以認(rèn)為是屬于導(dǎo)線的了。電路元器件的種類繁多，我們選取了其中最常見而且具有代表性的幾種分立元件進(jìn)行了識別。它們包括：電阻、電容、電解電容、電感、可變電感、接地和三極管（PNP和NPN）。這些元器件的形態(tài)特征差異較大，因此選擇了不同的方法來識別。

4.1 探索試探法線段追蹤算法和節(jié)點(diǎn)的識別

圖紙中線段特征是：（1）長寬比動(dòng)態(tài)范圍很大；（2）邊緣有毛刺，參差不齊；（3）包含有各種節(jié)點(diǎn)。

我們首先在圖中尋找長寬比大于3的平滑線段，在噪聲的影響下，將得到間斷的線段。接著將已識別出的橫線和豎線分別標(biāo)識。再利用連通性判別橫線間或者豎線間的連接關(guān)系，將識別得到的線段貫通，連接成一條完整的線段。在橫線和豎線相連的地方判別為節(jié)點(diǎn)；最后做濾波清除掉線段邊緣的毛刺。

另外一種方法，探索試探法是快速跟蹤直線/曲線的算法。該算法不拘泥于固定匹配模板，對于長度大于線寬3倍的直線/曲線能夠搜索出線的中心，在搜索過程中對線寬進(jìn)行統(tǒng)計(jì)，在一定程度上克服線條毛刺對線寬的影響。。其具體的跟蹤過程中，當(dāng)掃描整幅圖形時(shí)（掃描自上而下，自左而右），總是可以發(fā)現(xiàn)線條的頂點(diǎn)A：在A點(diǎn)向八個(gè)方向引伸試探搜索。假定線條所覆蓋的像素為1，背景為0，即可統(tǒng)計(jì)從A點(diǎn)引伸出的八個(gè)方向上1像素的個(gè)數(shù) ，取。如圖（4）所示，在n₇方向上s₀取得最大值。B點(diǎn)是從A點(diǎn)開始沿s₀方向延伸與邊界相交的點(diǎn)。計(jì)算AB的中點(diǎn)C的坐標(biāo)。

在C點(diǎn)，沿AB的垂直方向計(jì)算線寬d₁，d₁為DE方向上的1像素個(gè)數(shù)。將A點(diǎn)移至C點(diǎn)，重復(fù)以上步驟，可以得到CF引伸最長。通過中心點(diǎn)G，可以得到線寬d2。如此連續(xù)搜索，直至第K次搜索與K+1次搜索的方向相反，則搜索結(jié)束。于是線寬的平均值為。

4.2 特征匹配識別

在分割導(dǎo)線的時(shí)候，不易將導(dǎo)線與電阻、電容或者接地區(qū)別開來。因此在能夠?qū)?dǎo)線分割之前，需要將部分器件先行識別出來。我們把節(jié)點(diǎn)作為特征點(diǎn)，導(dǎo)線和器件的區(qū)別在于特征點(diǎn)的拓?fù)潢P(guān)系不同。通過對直線的追蹤和連通性的判別，可以識別特征點(diǎn)的屬性，以及各個(gè)特征點(diǎn)之間的拓?fù)潢P(guān)系。將特征點(diǎn)的屬性和拓?fù)潢P(guān)系作為特征，配合補(bǔ)充特征，與標(biāo)準(zhǔn)元器件特征進(jìn)行匹配，得到識別結(jié)果。

我們獲取了標(biāo)準(zhǔn)電阻、（電解）電容和接地符號的特征，如表1所示

實(shí)際操作時(shí)，在先行識別完電容之后，接地符號實(shí)際上就是電容的上半部分。并且取接地符號的“地”的線條寬度和電容的兩條平行線條長度相當(dāng)。

表格 1 電阻、（電解）電容和接地的特征

器件	節(jié)點(diǎn)特征	節(jié)點(diǎn)間拓?fù)潢P(guān)系	補(bǔ)充特征
電阻	4個(gè)拐點(diǎn)，2個(gè)分歧點(diǎn)	都落在同一矩形上；分歧點(diǎn)落在寬度上，且分歧方向相反，都指向矩形之外	矩形中空，長寬比>3
（電解）電容	4個(gè)端點(diǎn)，2個(gè)分歧點(diǎn)	每2個(gè)端點(diǎn)和1個(gè)分歧點(diǎn)共線為一組，兩組線段平行；2分歧點(diǎn)居中，方向相反	電解電容有一個(gè)“＋”
接地	2個(gè)端點(diǎn)，1個(gè)分歧點(diǎn)	3點(diǎn)共線，分歧點(diǎn)居中，分歧方向向上	無

4.3 投影快速識別三極管

經(jīng)過仔細(xì)觀察我們發(fā)現(xiàn)，很多元器件的輪廓特征可以通過它的投影提取出來，快速判別。水平方向和垂直方向的投影，將反映出器件中包含的水平和垂直線段的數(shù)量和大致位置。和器件連接的導(dǎo)線也提供了重要特征，因此分割時(shí)我們保留了長度為5倍線條寬度的導(dǎo)線。f_ij表示處在第i行與第j列的圖像素值，元器件光柵圖可以用矩陣表示。對它做水平和垂直兩方向投影，如式（5）。

（5）

我們以發(fā)射極向下的PNP三極管為例說明，從圖6我們可以清楚地看到三極管的光柵圖像和它在X/Y軸上的投影效果。如圖6（b），根據(jù)X軸上位于中間的脈沖靠近基極或者靠近集電極來判斷是NPN或者PNP型三極管。如圖6（c）所示，基極導(dǎo)線的脈沖是位于投影中央的，根據(jù)另一脈沖位置來判斷箭頭，從而得到三極管的放置方式。

手繪圖紙上三極管的箭頭兩翼不一定是水平和垂直的，箭頭張角比較小。因此脈沖寬度稍寬一些。取脈沖的中心位置作為脈沖的位置參與比較和判別。

該方法同樣可以用來輔助識別包括可變電感、可變電容和可變電阻這一類型的可變器件。

（5）（6）

如式（5）、（6）將圖像順時(shí)針旋轉(zhuǎn)45^o或者135^o，做水平和垂直投影。這相當(dāng)于對F做45^o或者135^o投影。對可變器件，投影上會(huì)出現(xiàn)一個(gè)脈沖，于是取得箭桿的位置；再對F做水平和垂直投影，在接近外接矩形位置上又可以取得箭頭位置。將箭頭和箭桿部分剝離后，再對剝離箭頭以后的核心器件做識別。

4.4 右手跟蹤法識別電感

器件的輪廓包含了器件的大部分特征，因此也可以通過輪廓跟蹤的方法提取器件的輪廓特征，據(jù)此識別器件。另一方面，投影方法有時(shí)會(huì)由于噪聲的影響，使得脈沖高度落差不大，不易判別。使用輪廓跟蹤技術(shù)可以較為準(zhǔn)確地描述出器件的輪廓特征，抗噪聲能力強(qiáng)。

如圖7，以水平放置的電感為例，我們從電感左側(cè)沿著電感輪廓下沿開始跟蹤，到電感右側(cè)結(jié)束，記錄下跟蹤的軌跡。這是一條不封閉的輪廓線。我們根據(jù)軌跡的極大值和極小值出現(xiàn)的次數(shù)和相對位置關(guān)系來判別是否是電感。（1）包含起點(diǎn)，共有5個(gè)極值相近的極小值點(diǎn)，4個(gè)極值相近的極大值點(diǎn)；（2）極小值點(diǎn)不低于導(dǎo)線虛擬連接線；（3）相鄰的極小值點(diǎn)和相鄰極大值點(diǎn)水平間距相當(dāng)。在實(shí)際識別的時(shí)候，我們考慮了線條寬度的影響，于是認(rèn)定極大值和極小值之差大于3倍線條寬度。

5 試驗(yàn)結(jié)果

圖8展示了字符、元器件和導(dǎo)線識別之后整理得到的輸出圖像。整個(gè)系統(tǒng)有如下的功能：

(1) 在已經(jīng)完成的系統(tǒng)中，能成功識別32種元件符號（包括4個(gè)方向）

(2) 能識別63種字符，包括26個(gè)大小寫英文字母、10個(gè)數(shù)字和符號“＋”

(3) 對300DPI的A4圖紙，在CII 1G的計(jì)算機(jī)上，圖紙理解速度Q1分鐘

6 結(jié)束語

在本文中，對手繪電路原理圖中導(dǎo)線、元器件和字符這三種元素的識別提出了有效的方法，并在實(shí)踐中取得了比較好的識別效果。在經(jīng)過最后的拼合，將導(dǎo)線、字符和元器件三種元素有機(jī)結(jié)合起來之后，整張電路圖紙中各種元器件和字符的屬性、元件之間的拓?fù)浣Y(jié)構(gòu)都得到了理解。利用現(xiàn)有模式繼續(xù)擴(kuò)充，即可快速和準(zhǔn)確地識別更多地元器件。

參考文獻(xiàn)
1. 施澤生. 電子電路圖的自動(dòng)輸入、理解及與ORCAD的鏈接[J]. 系統(tǒng)工程與電子技術(shù), 1996第2期
2. Yu Yuhong, Ashok Samal, Seth. Isolation Symbols from Connection Lines in A Class of Engineer Drawings. [J] Pattern Recognition, 1994, 27(3):391-404
3. Kei EGUCHI. Design of a fuzzy based circular pattern recognition circuit using current-mode techniques [J]. T.IEE Japan, Vol.120-C, No.12, 2000
4. 章毓晉. 圖像圖形科學(xué)叢書：圖像分割[M]. 科學(xué)出版社, 2001.2
5. 高學(xué). 一種基于支持向量機(jī)的手寫漢字識別方法[J]. 電子學(xué)報(bào), 2002第5期, P651~654
6. Kenneth. R. Castleman. Digital Image Processing[M]. Prentice Hall, 1996
7. 楊建剛. 人工神經(jīng)網(wǎng)絡(luò)實(shí)用教程[M]. 浙江大學(xué)出版社, 2001年1月

DIY機(jī)械鍵盤相關(guān)社區(qū):機(jī)械鍵盤DIY

新聞中心

電路原理圖紙識別系統(tǒng)研究與實(shí)現(xiàn)

評論

相關(guān)推薦

技術(shù)專區(qū)