王一,龔肖杰,程佳,蘇皓,3
基于改進(jìn)YOLOv5的金屬工件表面缺陷檢測
王一1,2,龔肖杰1,程佳1,蘇皓1,3
(1.華北理工大學(xué) 電氣工程學(xué)院,河北 唐山 063210;2.唐山市金屬構(gòu)件產(chǎn)線智能化技術(shù)創(chuàng)新中心,河北 唐山 063210;3.唐山市半導(dǎo)體集成電路重點實驗室,河北 唐山 063210)
針對金屬工件表面小尺寸缺陷檢測精度低的問題,提出以YOLOv5網(wǎng)絡(luò)為基礎(chǔ),結(jié)合注意力機(jī)制與Ghost卷積的表面缺陷檢測算法。首先,在原網(wǎng)絡(luò)中增加SE通道注意力模塊,增加缺陷有關(guān)信息的權(quán)重,減少無用特征的干擾,從而提高目標(biāo)的檢測精度。然后,將網(wǎng)絡(luò)中空間金字塔池化模塊的池化方式由最大池化替換為軟池化,使得在下采樣激活映射中保留更多的特征信息,獲得更好的檢測精度。最后,采用Ghost卷積塊替換主干網(wǎng)絡(luò)中的常規(guī)卷積模塊,提取豐富特征及冗余特征,以此提高模型效率。改進(jìn)后網(wǎng)絡(luò)平均精度均值達(dá)到0.997 8,相比原網(wǎng)絡(luò)提高了7.07個百分點。該網(wǎng)絡(luò)顯著提高了金屬工件表面缺陷檢測的精度。
表面缺陷檢測;YOLOv5模型;通道注意力;軟池化;Ghost卷積
金屬材料工件是一些產(chǎn)品的重要組成部分,金屬工件的質(zhì)量不僅影響產(chǎn)品的壽命及企業(yè)的發(fā)展,更可能危機(jī)使用者的安全,因此對金屬工件表面缺陷進(jìn)行檢測至關(guān)重要。
傳統(tǒng)方法對金屬工件表面缺陷檢測具有過程煩瑣,難以實現(xiàn)自動檢測;檢測速度較慢,檢測效率較低;檢測容易產(chǎn)生誤檢、漏檢等缺點[1]。采用深度學(xué)習(xí)及其他方法解決傳統(tǒng)方法在金屬表面檢測存在的一些問題。代小紅等[2]針對傳統(tǒng)方法對工件表面缺陷檢測過程煩瑣、精度不高、準(zhǔn)確率較低等問題,通過數(shù)據(jù)增強擴(kuò)充數(shù)據(jù)集,并在Faster RCNN網(wǎng)絡(luò)中引入非極大值及多級ROI池化層結(jié)構(gòu),實現(xiàn)對零件表面缺陷的準(zhǔn)確檢測。陳宗仁等[3]針對傳統(tǒng)方法對圖像處理準(zhǔn)確性差的問題,提出用中值濾波和深度學(xué)習(xí)結(jié)合,用多個級聯(lián)分類器和決策權(quán)重實現(xiàn)零件缺陷的檢測,相較于傳統(tǒng)方法,此方法準(zhǔn)確率更高。Qiu等[4]設(shè)計由雙加權(quán)主成分分析算法的圖像配準(zhǔn)模塊與有先驗約束的圖像差分算法的缺陷檢測模塊組成的框架實現(xiàn)金屬零件自動檢測,該框架提高了金屬表面缺陷檢測的準(zhǔn)確性。Liu等[5]采用提高信號分辨率的SPWVD方法和CNN算法實現(xiàn)金屬表面的有效檢測。通過激光器獲取缺陷信息,并采用數(shù)據(jù)增強對數(shù)據(jù)擴(kuò)增,提高缺陷檢測特性,此方法對處理激光超聲信號和缺陷分類具有一定效果。Lee等[6]利用光學(xué)獲取鑄造產(chǎn)品的3個信道融合數(shù)據(jù),結(jié)合深度學(xué)習(xí)實現(xiàn)鑄造產(chǎn)品表面缺陷的檢測。該模型的平均精度達(dá)到88%遠(yuǎn)高于單通道數(shù)據(jù)缺陷檢測的平均精度。
以上方法解決了傳統(tǒng)方法在金屬表面檢測中存在的一些問題,但對于一些金屬表面缺陷的檢測效果不理想。以下方法可以進(jìn)一步完善金屬表面缺陷檢測的準(zhǔn)確性。Yang等[7]針對鋼板上輥印具有周期性不均勻、對比度低、并且不同批次鋼板缺陷特征差異比較大,缺陷分類準(zhǔn)確度較低的問題,提出注意力與機(jī)制長短期記憶相結(jié)合周期性檢測的方法,此方法有效地提高了輥印缺陷的檢測準(zhǔn)確度。但是對于其他類型的缺陷沒有進(jìn)行檢測,也沒有實現(xiàn)多分類的檢測。He等[8]針對鋼類表面缺陷檢測分類率低的問題,提出了多組卷積神經(jīng)網(wǎng)絡(luò)和分類優(yōu)先網(wǎng)絡(luò)檢測鋼表面缺陷。圖像分類采用MG-CNN,通過訓(xùn)練不同的卷積核組,從而提取不同類型缺陷的特征圖組。通過大量的試驗,其分類率和平均檢出率均達(dá)到90%以上,該方法具有較好的檢測效果。He等[9]對于鋼板缺陷分類又提出了一種新的分級學(xué)習(xí)框架,即基于卷積神經(jīng)網(wǎng)絡(luò)Inception?V4和自編碼器學(xué)習(xí)框架,此方法采用自編碼器對特征進(jìn)行降維,并引入多尺度感受野進(jìn)行提取多尺度特征。經(jīng)過實驗,分類率遠(yuǎn)遠(yuǎn)高于傳統(tǒng)方法,達(dá)到97%以上。程婧怡等[10]針對金屬表面特征不清晰及小尺寸目標(biāo)導(dǎo)致漏檢的問題,在YOLOv3中引入DIOU邊框回歸損失及K?Means++聚類并將淺層特征與深度特征融合,此方法提升了檢測速度及精度。Wang等[11]針對金屬表面不同缺陷檢測效率低的問題,提出改進(jìn)的YOLOv5檢測網(wǎng)絡(luò),提出自適應(yīng)錨幀的方法,并在主要部件中添加一個特征層,增強有用的特征信息。在預(yù)測部分采用有效的損失函數(shù)解決由于小尺寸目標(biāo)所引起的數(shù)據(jù)不均衡的問題。
在基于深度學(xué)習(xí)的目標(biāo)檢測中,大目標(biāo)的檢測準(zhǔn)確性正在逐漸完善,對于小目標(biāo)的檢測,需要進(jìn)一步深入。為解決金屬工件表面小尺寸缺陷檢測精度低,容易產(chǎn)生漏檢的問題,提出一種改進(jìn)YOLOv5的金屬工件表面缺陷檢測方法。通過對YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),進(jìn)而改善金屬工件表面缺陷檢測的精度。
YOLO模型能直接預(yù)測目標(biāo)類別和位置,并且一直在不斷改進(jìn)。YOLOv5模型是YOLO系列算法中檢測速度及精度表現(xiàn)較好的檢測算法[12]。根據(jù)網(wǎng)絡(luò)寬度和寬度的不同YOLOv5模型又分為s、m、l、x這4個版本。對于金屬工件表面缺陷的檢測,考慮精度與速度的需要,選擇YOLOv5s作為檢測網(wǎng)絡(luò)模型。YOLOv5網(wǎng)絡(luò)模型結(jié)構(gòu)見圖1。
YOLOv5網(wǎng)絡(luò)由Input、Backbone、Neck和Head等4部分組成[13]。輸入端(Input)包括為擴(kuò)充數(shù)據(jù)樣本將輸入圖像隨機(jī)裁剪、縮放、拼接操作的Mosaic數(shù)據(jù)增強,自適應(yīng)錨框計算及自適應(yīng)圖片縮放。
主干網(wǎng)絡(luò)(Backbone)主要由Focus、CBL、CSP、SPP模塊組成,作為特征提取模塊,提取三種尺度的特征圖。避免原始信息丟失的Focus模塊,處于輸入與特征提取器之間,主要原理是切片操作,根據(jù)區(qū)域?qū)斎雸D片進(jìn)行裁剪,再在通道方向上拼接,可以保留更完整的特征。CBL模塊將Focus切片處理的圖像先后進(jìn)行卷積、歸一化、激活操作操作。YOLOv5的作者設(shè)計了2種CSP(Cross Stage Partial)模塊,CSP1–x與CSP2–x分別用于主干部分和頸部。CSP主要對特征圖進(jìn)行特征提取。還可以在卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化過程中,減少梯度信息重復(fù)。YOLOv5 4種不同參數(shù)的型號是通過調(diào)整CSP模塊的尺寸得到的??臻g金字塔池化(Spatial Pyramid Pooling,SPP),先后進(jìn)行卷積及最大池化操作,再將輸出結(jié)果進(jìn)行融合,擴(kuò)大特征圖的感受野,提取出重要的特征。
特征融合模塊頸部(Neck)采用特征金字塔網(wǎng)絡(luò)(Feature Pyramid Networks,F(xiàn)PN)+感知對抗網(wǎng)絡(luò)(Perceptual Adversarial Networks,PAN)結(jié)構(gòu),F(xiàn)PN層采用上采樣方式,融合網(wǎng)絡(luò)自上而下的特征信息,實現(xiàn)語義特征的傳遞,PAN層則通過下采樣方式,拼接低層與高層的特征,實現(xiàn)定位特征傳遞。兩者強強聯(lián)手,增強網(wǎng)絡(luò)特征融合的能力,解決了多尺度的問題。
輸出端(Head)作為預(yù)測部分,主要完成分類與回歸。輸出端包括GIOU損失函數(shù)和非極大值抑制(Non-Maximum Supression,NMS)。通過NMS可以通過消除多余的框,篩選目標(biāo)框。通過輸出端生成邊界框并預(yù)測缺陷類別。
改進(jìn)的YOLOv5模型結(jié)構(gòu)見圖2。在網(wǎng)絡(luò)的主干部分將常規(guī)卷積用Ghost卷積替換,并用GhostBackbone替換主干網(wǎng)絡(luò)的CSP模塊,使網(wǎng)絡(luò)輕量化。在主干網(wǎng)絡(luò)3個GhostBackbone模塊后分別加入1個SE模塊,并在網(wǎng)絡(luò)Neck與Head之間加入SE模塊,實現(xiàn)對輸入的校正,并增強模型對重要通道信息的選擇,提高網(wǎng)絡(luò)目標(biāo)檢測的精確率,特別是對于小尺寸缺陷。將主干網(wǎng)絡(luò)中SPP中池化方式用Softpool代替,保留更多相關(guān)信息的特征,進(jìn)一步提高金屬工件表面缺陷目標(biāo)檢測的精度。
網(wǎng)絡(luò)中引入通道注意力模塊,可以強化相關(guān)的通道信息,抑制無關(guān)緊要的通道信息,提高模型對目標(biāo)特征的提取能力及檢測精度。SE模塊通過給每個通道一個權(quán)重,讓不同通道對結(jié)果有著不同的作用力,并且SE模塊很容易嵌入神經(jīng)網(wǎng)絡(luò)中[14]。SE模塊見圖3。
圖1 YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)
圖2 改進(jìn)YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)
圖3 SE通道注意力模塊
輸入經(jīng)過卷積后得到維度為[,,]的特征圖(),再對特征圖進(jìn)行Squeeze壓縮,即對其進(jìn)行平均池化或最大池化,維度降為[,1,1],通道數(shù)不變,[,1,1]即為從每個通道中提取出來對特征提取有影響力的權(quán)重。壓縮公式為:
池化操作后,進(jìn)行Excitation激勵操作,向量經(jīng)過包括全連接層FC、激活函數(shù)ReLU與Sigmiod的MLP,得到每個通道的權(quán)重[,1,1]。激勵公式為:
式中:為維度;c為經(jīng)過激勵ex操作后生成的注意力權(quán)重。
最后進(jìn)行Reweight重定權(quán)重操作,將權(quán)重[,1,1]作用于維度為[,,]的特征圖,即每個通道乘以各自的權(quán)重,完成權(quán)重的重新分配。加權(quán)公式為:
池化操作的本質(zhì)是通過減小特征圖尺寸。在目標(biāo)識別任務(wù)中大都采用最大池化和平均池化,但是這兩種池化容易丟失重要的缺陷信息。Softpool是一種高效、快速的池化方式,可以保留更多的金屬工件缺陷特征信息,提高目標(biāo)檢測的精度[15]。Softpool可以使反向傳播時,梯度值不斷更新,并且是以指數(shù)加權(quán)方式累加激活。具體來說,Softpool利用內(nèi)核區(qū)域內(nèi)的最大近似,每個指數(shù)為的激活a應(yīng)用一個權(quán)重w,該權(quán)重與相應(yīng)的激活值做非線性變化,公式為:
Ghost卷積易于實現(xiàn),可以很方便地代替常規(guī)卷積插入網(wǎng)絡(luò)中,可以降低網(wǎng)絡(luò)的計算量使其輕量化,并能保證網(wǎng)絡(luò)檢測的精度[16]。它的結(jié)構(gòu)參照了mobilenetv3,并把基本單元替換掉。Ghost模塊見圖4。
圖4 Ghost過程示意圖
Ghost模塊包含少量常規(guī)卷積及線性操作兩部分。首先第1步將輸入進(jìn)行常規(guī)卷積,減少通道數(shù)。然后第2步在第1步的基礎(chǔ)上進(jìn)行深度可分離卷積,第2步還有卷積并行的一個連接分支。最后將第1步與第2步得到的結(jié)果進(jìn)行融合。Ghost模塊的輸出通道數(shù)為第1步卷積后的通道數(shù)與第2步卷積后的通道數(shù)*之和,即最終通道數(shù)為(+1)*。
GhostBackbone模塊包含2部分,首先第1部分輸入依次經(jīng)過常規(guī)卷積和具有殘差結(jié)構(gòu)的Ghost操作,第2部分輸入經(jīng)過常規(guī)卷積操作,然后將2部分的輸出進(jìn)行融合后經(jīng)過一個常規(guī)卷積。
以凸輪軸為實驗對象,搭建圖像采集視覺平臺采集圖像,運用改進(jìn)的算法實現(xiàn)凸輪軸表面缺陷的精確檢測和識別。
圖像采集系統(tǒng)見圖5,選用堡盟的VCXG–25.1工業(yè)相機(jī)和computar M1614–MP2工業(yè)鏡頭,以及2個條形LED光源。將光源放置在待檢凸輪軸兩側(cè),并形成約45°的照明角度,減少金屬表面的強反光,從而增加缺陷與背景的對比度。
用于深度學(xué)習(xí)的硬件采用Intel(R) Core(TM) i5–1035G1中央處理器和MX350顯卡,軟件框架采用Pytorch。訓(xùn)練epoch設(shè)為150,學(xué)習(xí)率設(shè)置為0.000 1,動量參數(shù)設(shè)置為0.92,權(quán)重衰減系數(shù)設(shè)置為0.000 5,并選用Adam優(yōu)化器訓(xùn)練網(wǎng)絡(luò),GIOU–loss作為損失函數(shù),公式為:
其中:為交并比;Ac為真實目標(biāo)邊界框與預(yù)測目標(biāo)邊界框最小外接矩形框面積;U為真實與預(yù)測目標(biāo)邊界框的并集面積。
通過圖像視覺平臺采集了凸輪軸污漬、劃痕、及凹坑3種缺陷圖像,并分別用bl、sc、sca字母代表,其中污漬130張,劃痕與凹坑分別100張。對采集圖像通過裁剪、翻轉(zhuǎn)進(jìn)行擴(kuò)增,得到1 782張缺陷圖像,并對1 782圖像使用labelme軟件進(jìn)行標(biāo)記用于模型訓(xùn)練。采集污漬圖像70張,劃痕圖像54張,凹坑圖像57張,經(jīng)過數(shù)據(jù)增強后得到505張圖像,用于驗證。為了保證圖像長寬比例,使用letterbox方式填充,圖像填充前后對比圖圖見6。
選用平均精度均值(Mean Average Precision,mAP)作為評價指標(biāo),mAP是所有類別平均精度AP的均值。AP是精確率和召回率曲線下的面積[17]。精確率、召回率及平均精度均值mAP公式為:
在相同硬件和數(shù)據(jù)集條件下,分別將原YOLOv5網(wǎng)絡(luò)、在原網(wǎng)絡(luò)中加入Ghost卷積的YOLOv5–G網(wǎng)絡(luò)、在原網(wǎng)絡(luò)中改變SPP池化方式的YOLOv5–SP網(wǎng)絡(luò)、在原網(wǎng)絡(luò)中加入SE通道注意力的YOLOv5–SE網(wǎng)絡(luò)、在原網(wǎng)絡(luò)中同時有Ghost卷積、SE通道注意力并運用Softpool的YOLOv5–G–SP–SE網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試。5個模型的損失值變化曲線圖見圖7,損失圖橫坐標(biāo)表示權(quán)重更新的次數(shù),縱坐標(biāo)表示損失值。從圖7中可以看出各個模型迭代幾次后,損失值降到較低的數(shù)值,并保持下降,當(dāng)Epoch值為120時,損失值保持相對穩(wěn)定水平,改進(jìn)后模型整體收斂性比較好,訓(xùn)練效果較理想。
各模型的mAP值見圖8。從圖8中可以看出,120次之后,5種模型基本趨于平穩(wěn)。原YOLOv5網(wǎng)絡(luò)mAP值達(dá)到0.9271,YOLOv5–G網(wǎng)絡(luò)mAP值達(dá)到0.939 4,YOLOv5–SP網(wǎng)絡(luò)mAP值達(dá)到0.961 6,YOLOv5–SE網(wǎng)絡(luò)mAP值達(dá)到0.972 1,YOLOv5–G– SP–SE網(wǎng)絡(luò)mAP值達(dá)到0.997 8。改進(jìn)后的YOLOv5– G–SP–SE網(wǎng)絡(luò)mAP值高于原始網(wǎng)絡(luò),改進(jìn)的網(wǎng)絡(luò)能夠提取到更多關(guān)鍵信息,在目標(biāo)檢測和定位性能上優(yōu)于未改進(jìn)的網(wǎng)絡(luò),能更好地檢測識別出凸輪軸表面的缺陷。
幾種模型檢測的效果對比見圖9,目標(biāo)框的左上角字母表示凸輪軸表面缺陷類別,右上角的數(shù)值表示置信度。從圖9中可以看出,改進(jìn)后的YOLOv5–G– SP–SE網(wǎng)絡(luò)對于凸輪軸表面缺陷置信度高于98%。與原網(wǎng)絡(luò)相比,改進(jìn)后的網(wǎng)絡(luò)可以提取出更多豐富的缺陷特征,正確預(yù)測的置信度更高,能更準(zhǔn)確地鑒別凸輪軸表面缺陷類別,并且預(yù)測框可以準(zhǔn)確地定位缺陷的位置。
圖7 損失值變化曲線
圖8 平均精度均值
圖9 檢測效果對比
為解決金屬工件表面小尺寸缺陷,容易導(dǎo)致漏檢,檢測精度低的問題,文中提出了改進(jìn)的YOLOv5網(wǎng)絡(luò)檢測金屬工件表面的缺陷。在網(wǎng)絡(luò)中引入注重重要信息目標(biāo)區(qū)域的SE通道注意力模塊、Softpool池化及插即用的Ghost模塊,增強了模型的特征提取能力,保留更多有用的特征信息,降低漏檢小缺陷概率。改進(jìn)后的YOLOv5–G–SP–SE網(wǎng)絡(luò)在目標(biāo)檢測任務(wù)中比原網(wǎng)絡(luò)具有更高的檢測精度,能更準(zhǔn)確的檢測出金屬工件表面的缺陷。
[1] 徐鏹, 朱洪錦, 范洪輝, 等. 改進(jìn)的YOLOv3網(wǎng)絡(luò)在鋼板表面缺陷檢測研究[J]. 計算機(jī)工程與應(yīng)用, 2020, 56(16): 265-272.
XU Qiang, ZHU Hong-jin, FAN Hong-hui, et al. Study on Detection of Steel Plate Surface Defects by Improved YOLOv3 Network[J]. Computer Engineering and Applications, 2020, 56(16): 265-272.
[2] 代小紅, 陳華江, 朱超平. 一種基于改進(jìn)Faster RCNN的金屬材料工件表面缺陷檢測與實現(xiàn)研究[J]. 表面技術(shù), 2020, 49(10): 362-371.
DAI Xiao-hong, CHEN Hua-jiang, ZHU Chao-ping. Surface Defect Detection and Realization of Metal Workpiece Based on Improved Faster RCNN[J]. Surface Technology, 2020, 49(10): 362-371.
[3] 陳宗仁, 謝文達(dá), 余君, 等. 基于深度學(xué)習(xí)的金屬機(jī)械零件表面缺陷檢測方法[J]. 制造業(yè)自動化, 2021, 43(12): 170-173.
CHEN Zong-ren, XIE Wen-da, YU Jun, et al. Surface Defect Detection Method of Metal Mechanical Parts Based on Deep Learning[J]. Manufacturing Automation, 2021, 43(12): 170-173.
[4] QIU Ke-peng, TIAN Luo, WANG Peng. An Effective Framework of Automated Visual Surface Defect Detection for Metal Parts[J]. IEEE Sensors Journal, 2021, 21(8): 20412-20420.
[5] LIU Zi-xi, HU Zheng-liang, WANG Long-xiang, et al. Effective Detection of Metal Surface Defects Based on Double-Line Laser Ultrasonic with Convolutional Neural Networks[J]. Modern Physics Letters B, 2021, 35(15): 2150263.
[6] HYUK L J, HAK K B, YOUNG K M. Machine Learning-Based Automatic Optical Inspection System with Multimodal Optical Image Fusion Network[J]. International Journal of Control, Automation and Systems, 2021, 19(10): 3503-3510.
[7] LIU Yang, XU Ke, XU Jin-wu. Periodic Surface Defect Detection in Steel Plates Based on Deep Learning[J]. Applied Sciences, 2019, 9(15): 1-14.
[8] HE Di, XU Ke, ZHOU Peng. Defect Detection of Hot Rolled Steels with a New Object Detection Framework Called Classification Priority Network[J]. Computers & Industrial Engineering, 2019, 128: 290-297.
[9] HE Di, XU Ke, WANG Da-dong. Design of Multi-Scale Receptive Field Convolutional Neural Network for Surface Inspection of Hot Rolled Steels[J]. Image and Vision Computing, 2019, 89: 12-20.
[10] 程婧怡, 段先華, 朱偉. 改進(jìn)YOLOv3的金屬表面缺陷檢測研究[J]. 計算機(jī)工程與應(yīng)用, 2021, 57(19): 252-258.
CHENG Jing-yi, DUAN Xian-hua, ZHU Wei. Research on Metal Surface Defect Detection by Improved YOLOv3[J]. Computer Engineering and Applications, 2021, 57(19): 252-258.
[11] WANG Kun, TENG Zi-xuan, ZOU Teng-yue. Metal Defect Detection Based on Yolov5[J]. Journal of Physics: Conference Series, 2022, 2218(1): 012050.
[12] YAN Peng-cheng, SUN Quan-sheng, YIN Ni-ni, et al. Detection of Coal and Gangue Based on Improved YOLOv5.1 Which Embedded ScSE Module[J]. Measurement, 2022, 188: 110530.
[13] YING Zhi-ping, LIN Zhong-tao, WU Zhen-yu, et al. A Modified-YOLOv5s Model for Detection of Wire Braided Hose Defects[J]. Measurement, 2022, 190: 110683.
[14] 謝書翰, 張文柱, 程鵬, 等. 嵌入通道注意力的YOLOv4火災(zāi)煙霧檢測模型[J]. 液晶與顯示, 2021, 36(10): 1445-1453.
XIE Shu-han, ZHANG Wen-zhu, CHENG Peng, et al. Firesmoke Detection Model Based on YOLOv4 with Channel Attention[J]. Chinese Journal of Liquid Crystals and Displays, 2021, 36(10): 1445-1453.
[15] HU Yao-wen, ZHAN Jia-lei, ZHOU Guo-xiong, et al. Fast Forest Fire Smoke Detection Using MVMNet[J]. Knowledge-Based Systems, 2022, 241: 108219.
[16] 李北明, 金榮璐, 徐召飛, 等. 基于特征蒸餾的改進(jìn)Ghost-YOLOv5紅外目標(biāo)檢測算法[J]. 鄭州大學(xué)學(xué)報(工學(xué)版), 2022, 43(1): 20-26.
LI Bei-ming, JIN Rong-lu, XU Zhao-fei, et al. An Improved Ghost-YOLOv5 Infrared Target Detection Algorithm Based on Feature Distillation[J]. Journal of Zhengzhou University (Engineering Science), 2022, 43(1): 20-26.
[17] WAN Guang, FANG Hong-bo, WANG Deng-zhun, et al. Ceramic Tile Surface Defect Detection Based on Deep Learning[J]. Ceramics International, 2022, 48(8): 11085-11093.
Surface Defect Detection of Metal Workpiece Based on Improved YOLOv5
WANG Yi1,2, GONG Xiao-jie1, CHENG Jia1, SU Hao1,3
(1. College of Electrical Engineering, North China University of Science and Technology, Hebei Tangshan 063210, China; 2. Tangshan Technology Innovation Center of Intellectualization of Metal Component Production Line, Hebei Tangshan 063210, China; 3. Tangshan Key Laboratory of Semiconductor Integrated Circuits, Hebei Tangshan 063210, China)
The work aims to propose a surface defect detection method based on YOLOv5 network by combining attention mechanism and Ghost convolution to solve problem of low detection accuracy of small size defects on metal workpiece surface. First, the SE channel attention module was added to the original network. The weight of the defect-related information was increased and the interference of useless features was reduced to improve the detection accuracy of the target. Then, the maxpool module of the spatial pyramid pooling module in the network was replaced with Softpool so as to retain more feature information in the down sampling activation map and obtain a better classification accuracy. Finally, Ghost convolutional blocks were used to replace the conventional convolutional modules in the backbone network to extract rich and redundant features and improve the efficiency of the model. The mean average accuracy of the improved network reached 0.997 8, increased by 7.07% over the original network. The proposed network significantly improves the accuracy of surface defect detection in metal workpieces.
surface defect detection; YOLOv5 model; channel attention; Softpool; Ghost convolution
TP391
A
1001-3563(2022)15-0054-07
10.19554/j.cnki.1001-3563.2022.15.006
2022–05–11
河北省高等學(xué)校科學(xué)技術(shù)研究項目(ZD2022114);唐山市科技計劃項目(21130212C)
王一(1981—),男,博士,華北理工大學(xué)副教授,主要研究方向為視覺檢測與感知技術(shù)。
責(zé)任編輯:曾鈺嬋