關(guān) 閉

新聞中心

EEPW首頁 > 工控自動化 > 設(shè)計應(yīng)用 > 基于機器視覺的帶鋼焊縫定位

基于機器視覺的帶鋼焊縫定位

作者:張勇(馬鋼冷軋總廠,安徽馬鞍山 243000) 時間:2022-12-25 來源:電子產(chǎn)品世界 收藏
編者按:提出了一種基于機器視覺的帶鋼焊縫檢測與定位技術(shù),在原CenterNet算法的基礎(chǔ)上增加旋轉(zhuǎn)角度的回歸實現(xiàn)了旋轉(zhuǎn)目標(biāo)檢測,并根據(jù)網(wǎng)絡(luò)的輸入?yún)?shù)制作合適的數(shù)據(jù)集。為了進(jìn)一步提高模型的精度和魯棒性,分別引入了可變形卷積和金字塔分割注意力模塊,多組實驗結(jié)果對比表明,該方法能在精確率、召回率、F值和檢測速度上得到提升,滿足實際檢測的需求。

冷軋連退生產(chǎn)線的原材料為帶鋼卷,為保持生產(chǎn)的連續(xù)性,需將前一個帶鋼卷的尾部與后一個帶鋼卷的頭部焊接起來,從而得到連續(xù)的帶鋼材料。為了避免焊縫焊接質(zhì)量問題引起的帶鋼撕裂或者斷帶事故的發(fā)生[1],需要對焊接質(zhì)量進(jìn)行檢測,文中分析了帶鋼焊縫焊接質(zhì)量的自動檢測系統(tǒng)中應(yīng)用旋轉(zhuǎn)目標(biāo)檢測對月牙邊焊縫的識別和定位及評判標(biāo)準(zhǔn),并進(jìn)行了實驗分析。

本文引用地址:http://m.butianyuan.cn/article/202212/442064.htm

1   分析

1.1 CenterNet

CenterNet 網(wǎng)絡(luò)的輸出為3 個部分,依靠邊緣特征信息獲取的檢測目標(biāo)中心點的預(yù)測熱力圖,匹配角點獲取預(yù)測寬高模塊(Object Size) 回歸目標(biāo)的寬和高,Offsets 模塊回歸中心點偏移量[3-4]。

1.2 金字塔分割注意力

為了在不增加模型復(fù)雜度的前提下解決主流注意力目前存在的問題,金字塔分割注意力(PSA Module) 機制以通道注意力機制為基礎(chǔ)[5-6],通過使用不同大小的卷積核來獲取多尺度的特征圖。輸入特征圖通過四個不同大小卷積核的卷積操作將特征圖切分為4 個部分,接著對含有不同尺度特征的特征圖進(jìn)行拼接,定義如式(1)所示。

1671965591523530.png

1672107263408336.png

1672107295886891.png

其中,Cat 為concat 算子;Z 為多尺度注意力權(quán)重向量。

直接拼接的多尺度注意力權(quán)重向量不滿足所有權(quán)重之和為1,通過使用Softmax 對多尺度注意力權(quán)重進(jìn)行全局歸一化實現(xiàn)了局部與全局通道注意力的交互,定義如式(4)所示。

1671965983126734.png

其中,att 代表注意力交互后的多尺度通道注意力權(quán)重。

在獲取多尺度預(yù)處理的特征圖F 和重新校準(zhǔn)的多尺度通道注意力權(quán)重att 后,將兩者按對應(yīng)元素進(jìn)行點乘操作,輸出含有多尺度特征信息注意力的特征圖,定義如式(5) 所示。

1671966749295249.png

其中, ? 代表按通道方式的乘法;注意力交互后的多尺度通道權(quán)重。Y 代表得到的含有多尺度特征信息注意力的特征圖。

1.3 定位算法

1.3.1 R-Center Net

通過使用改進(jìn)的R-CenterNet 算法對月牙邊焊縫進(jìn)行旋轉(zhuǎn)目標(biāo)檢測, R-CenterNet 相較于CenterNet 在經(jīng)過上采樣獲取高分辨率特征圖后的head 部分,增加了一路特征圖來回歸矩形框的旋轉(zhuǎn)角度信息。增加的這一路特征圖的構(gòu)建方法與寬高圖的獲取方法相同,不同點為獲取含有旋轉(zhuǎn)因子角度圖的卷積層僅需要1 個輸出通道。

1.3.2 損失函數(shù)

R-CenterNet 算法的損失函數(shù)為熱力圖的中心點預(yù)測損失函數(shù)、寬高圖的尺寸預(yù)測損失函數(shù)、中心點修正圖的中心點偏置損失函數(shù)和角度圖的損失函數(shù)之和,定義如式(6)所示。

1672107362871381.png

1672107434786411.png

1672107465793659.png

2   實驗與分析

2.1 實驗環(huán)境

實驗服務(wù)器的硬件配置分別為15.5 GiB 內(nèi)存,Intel Core i7-6800K 中央處理器,NVIDIA GTX1080Ti圖形處理器。軟件配置分別為Ubuntu16.04,Python3.7編程語言,PyTorch 深度學(xué)習(xí)框架。

2.2 數(shù)據(jù)采集及評估

從生產(chǎn)現(xiàn)象采集了1 200 張月牙邊無規(guī)律位置的樣本圖像,隨機選取1 000 張作為訓(xùn)練集,返回?fù)p失更新模型權(quán)重,100 張作為驗證集,計算訓(xùn)練模型的損失但不返回,僅用來判斷當(dāng)前模型性能并判斷是否保存當(dāng)前模型,其余100 張作為測試集,通過輸出模型的評價指標(biāo)來檢測模型的泛化能力。

從生產(chǎn)線上切割下來的月牙邊被機械臂隨機的放置在定位相機的視覺區(qū)域內(nèi),其中采集圖像的尺寸為3 648×3 648。數(shù)據(jù)集使用labelImg2 進(jìn)行標(biāo)注,圖2 對應(yīng)的標(biāo)注信息如表1 所示,其中cxcy 分別代表標(biāo)注中心點橫縱坐標(biāo),wh 分別代表標(biāo)注框的寬和高,單位均為像素值。angle 代表標(biāo)注框相對于垂直向上順時針的旋轉(zhuǎn)角度,單位為弧度制。

焊縫定位實驗的算法網(wǎng)絡(luò),采用4 個評價指標(biāo)來評估模型的性能,分別為:精確率(P)、召回率(R)、F 值(F)和檢測速度(S)。

image.png

圖2 焊縫定位實驗月牙邊樣本

image.png

其中精確率的定義如式(11)所示。

1672107545384207.png

1672107577875467.png

其中,num_image為測試集的圖片數(shù)量,time 為檢測測試集圖片的總時間。

2.3 實驗結(jié)果分析

通過實驗對比不同骨干網(wǎng)絡(luò)下R-CenterNet的性能,設(shè)計了不同骨干網(wǎng)絡(luò)的3組對比方案進(jìn)行驗證。驗證實金字塔分割注意力的有效性,實驗的不同方案所使用結(jié)構(gòu)如表2 所示。

image.png

表3 所有方案使用相同的參數(shù):①初始學(xué)習(xí)率設(shè)置為0.000125,總訓(xùn)練步數(shù)為50 步,從第20 步開始每隔10 步將初始學(xué)習(xí)率乘以0.1;②優(yōu)化器采用Adam,權(quán)重衰減設(shè)置為0.0001;③訓(xùn)練集和驗證集的批量均設(shè)置為4,訓(xùn)練集進(jìn)行隨機打亂處理,驗證集不進(jìn)行打亂處理。

在獲取最優(yōu)模型后通過測試集對模型進(jìn)行評估,設(shè)置所有實驗方案的中心點置信度閾值為0.3、預(yù)測框與標(biāo)注框的重合度閾值為0.3,所得的輸出精確率(P)、召回率(R)、F 值(F)和檢測速度(S)如表3 所示。

image.png

由表3 方案1 與方案2 的數(shù)據(jù)可知,增加網(wǎng)絡(luò)深度不能提高本章實驗的模型精度,反而會減少一定的檢測速度。將骨干網(wǎng)絡(luò)更換為DLANet 后,精確率、召回率和F 值分別上升了1.01、1.00 和1.00 個百分點,單張圖片的檢測時間減少了6.4 ms 秒。方案4 證明了在提取特征時使用金字塔分割注意力均能較明顯的提高檢測結(jié)果的F 值。金字塔分割注意力使該模型的精確率增加了1.01 個百分點,召回率提高了1.00 個百分點,說明該模塊主要增強的是模型精確率。

3   結(jié)束語

本文通過對比試驗證明基于DLANet 骨干網(wǎng)絡(luò)的算法檢測速度更快、檢測精度更高。同時證明了金字塔分割注意力能夠增強模型的泛化能力,實驗結(jié)果表面旋轉(zhuǎn)目標(biāo)檢測算法能夠?qū)M足月牙邊焊縫的識別和定位要求。

參考文獻(xiàn):

[1] 趙宗楠,劉文亮,歐家.搭接滾壓焊機傳動側(cè)焊縫開裂原因分析[J].南方金屬,2022(1):6-9.

[2] 余瓊,賈建,唐萬象.連退機組在線全自動帶鋼焊縫感應(yīng)退火裝置研究與開發(fā)[J].冶金動力,2020(6):71-74.

[3] 邵光梅.基于深度卷積網(wǎng)絡(luò)的板帶鋼表面缺陷類別檢測[D].馬鞍山:安徽工業(yè)大學(xué),2019.

[4] TULBURE A A, DULF E H. A review on modern defect detection models using DCNNs–Deep convolutional neural networks[J].Journal of Advanced Research, 2022,35: 33-48.

[5] JIANG Y, ZHU X, WANG X, et al. R2CNN: Rotational region CNN for orientation robust scene text detection[J].arXiv preprint arXiv:1706.09579, 2017.

[6] 王明陽,王江濤,劉琛.基于關(guān)鍵點的遙感圖像旋轉(zhuǎn)目標(biāo)檢測[J].電子測量與儀器學(xué)報,2021,35(6):102-108.

(本文來源于《電子產(chǎn)品世界》雜志2022年12月期)



評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉