摘" 要: 為準(zhǔn)確檢測(cè)出布料表面微小損傷如缺維、漿斑、膠斑等問題,提出基于改進(jìn)YOLO?DETR的布料表面微小損傷檢測(cè)方法。在改進(jìn)YOLO?DETR模型中增加殘差模塊并擴(kuò)展特征圖尺度,以減少漏檢可能性。在模型中融入了CBAM注意力機(jī)制和Anchor box,采用K?means聚類算法,通過選取[K]個(gè)聚類中心,并基于距離將其他目標(biāo)劃分到最近的聚類中心,形成[K]個(gè)群組。在迭代過程中,通過最小化群內(nèi)距離和最大化群間距離,優(yōu)化聚類結(jié)果,采用復(fù)合損失函數(shù)進(jìn)行檢測(cè),增強(qiáng)模型在復(fù)雜環(huán)境下的識(shí)別能力。實(shí)驗(yàn)結(jié)果表明,該方法檢測(cè)精度在90%以上,在面對(duì)缺維、漿斑、膠斑等復(fù)雜性問題時(shí)也有較好的檢測(cè)能力。
關(guān)鍵詞: 改進(jìn)YOLO?DETR; 布料表面; 布料損傷; 損傷檢測(cè); K?means聚類; 注意力機(jī)制
中圖分類號(hào): TN606?34; TP391.4" " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " "文章編號(hào): 1004?373X(2024)13?0160?04
Improved YOLO?DETR based method for detecting minor damage on surface of fabric
HU Yuheng, WU Jin
(School of Information Science and Engineering, Wuhan University of Science and Technology, Wuhan 430080, China)
Abstract: To accurately detect minor damage on the surface of fabrics, such as lack of dimensionality, slurry spots and glue spots, an improved YOLO?DETR based method for detecting minor damage on the surface of fabrics is proposed. In the improved YOLO?DETR model, adding residual modules and expanding feature map scales can reduce the possibility of missed detections. CBAM attention mechanism and Anchor box are integrated into the model. K?means clustering algorithm is adopted. By selecting [K] cluster centers, other objects are classified into the nearest cluster center according to the distance, and then [K] groups are formed. During the process of iteration, the clustering results are optimized by minimizing intra group distance and maximizing inter group distance. A compound loss function is used for detection to enhance the recognition ability of the model in complex environments. The experimental results show that the detection accuracy of this method is over 90%, and it also has good detection ability in the face of complex situations, such as lack of dimensionality, slurry spots, and glue spots.
Keywords: improve YOLO?DETR; fabric surface; fabric damage; damage detection; K?means clustering; attention mechanism
0" 引" 言
布料及紡織制品在生產(chǎn)過程中不可避免地會(huì)出現(xiàn)磨損、撕裂、劃痕等,導(dǎo)致布料表面會(huì)出現(xiàn)微小的損傷,這些微小損傷會(huì)影響到產(chǎn)品的質(zhì)量和功能。因此,對(duì)布料表面微小損傷進(jìn)行有效檢測(cè)和評(píng)估變得尤為重要。
對(duì)此,文獻(xiàn)[1]提出了織物疵點(diǎn)檢測(cè)方法,基于MobileNet深度可分離卷積的織物疵點(diǎn)檢測(cè)方法改進(jìn)了傳統(tǒng)SSD網(wǎng)絡(luò),加速了特征提取,通過采樣不同尺度的卷積特征層,構(gòu)建了特征圖像金字塔網(wǎng)絡(luò),有效提取多尺度特征。雖然其檢測(cè)精度達(dá)到了90.1%的平均精度均值,但檢測(cè)速度不足以滿足工業(yè)實(shí)時(shí)需求,限制了其在高速生產(chǎn)線的應(yīng)用,需要進(jìn)一步提高精度。文獻(xiàn)[2]介紹了一種基于卷積神經(jīng)網(wǎng)絡(luò)的創(chuàng)新織物瑕疵檢測(cè)技術(shù),該方法通過對(duì)VGG16模型進(jìn)行改進(jìn)和簡(jiǎn)化,細(xì)致地優(yōu)化網(wǎng)絡(luò)參數(shù)以實(shí)現(xiàn)最優(yōu)性能。針對(duì)織物瑕疵的大小差異,該方法將瑕疵邊緣作為檢測(cè)重點(diǎn),并使用64×64像素的小圖進(jìn)行訓(xùn)練,從而提高網(wǎng)絡(luò)的分類準(zhǔn)確率。但該方法未對(duì)VGG16網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行深度改造或引入更高級(jí)的架構(gòu),限制了網(wǎng)絡(luò)的潛在性能和準(zhǔn)確性。
基于這一背景,本文提出了改進(jìn)YOLO?DETR算法的布料表面微小損傷檢測(cè)方法。
1" 改進(jìn)YOLO?DETR模型
本文深入探討了如何針對(duì)工業(yè)級(jí)布料表面損傷檢測(cè)的需求對(duì)YOLO?DETR模型進(jìn)行改進(jìn),以達(dá)到速度和精度的最優(yōu)平衡。YOLO?DETR模型是一種將DETR[3]結(jié)構(gòu)與YOLOv3[4]高效性能結(jié)合起來的創(chuàng)新算法,融合了DETR的Encoder、Decoder和Prediction三大部分,實(shí)現(xiàn)了YOLOv3快速檢測(cè)與DETR準(zhǔn)確識(shí)別的雙重優(yōu)勢(shì)。
為了進(jìn)一步提升檢測(cè)精度,同時(shí)保持模型的高速處理能力,本文移除了模型中的部分殘差模塊,減少了卷積層和多尺度特征融合層的數(shù)量,降低對(duì)硬件的需求,加快檢測(cè)流程。此外,為了應(yīng)對(duì)融合注意力機(jī)制可能導(dǎo)致的檢測(cè)速度下降問題,采用深度可分離卷積替換傳統(tǒng)卷積[5]。卷積過程如圖1所示。
接著,在預(yù)測(cè)層前增加了三個(gè)CBL模塊和SE?C混合注意力機(jī)制模塊,這一步驟不僅深化了網(wǎng)絡(luò)結(jié)構(gòu),也強(qiáng)化了模型對(duì)于背景噪聲的抵抗能力。同時(shí),考慮到低層特征能夠保留更豐富的原始圖像信息并具有更高的分辨率,本文將YOLO?DETR模型中的Y2路徑拼接層與淺層網(wǎng)絡(luò)結(jié)合[6],創(chuàng)建新的52×52尺寸的Y3輸出層,解決了深層網(wǎng)絡(luò)中淺層低維特征丟失導(dǎo)致的漏檢問題。以上調(diào)整顯著提高了模型對(duì)小型目標(biāo)損傷的檢測(cè)準(zhǔn)確率。
最后,引入了多尺度長(zhǎng)距離上下文特征提取層的概念,該層能夠有效捕獲布料表面不同尺寸的損傷信息,進(jìn)一步提升了小尺度損傷的特征提取能力,使模型能夠有效提高多類別損傷的檢測(cè)準(zhǔn)確率和精度。
2" 布料表面微小損傷檢測(cè)
在改進(jìn)YOLO?DETR模型的基礎(chǔ)上,運(yùn)用聚類分析技術(shù)對(duì)改進(jìn)的YOLO?DETR模型進(jìn)行了細(xì)致優(yōu)化,提高模型在復(fù)雜背景下對(duì)織物微小損傷的識(shí)別能力和準(zhǔn)確度。構(gòu)建復(fù)合損失函數(shù)實(shí)現(xiàn)損傷檢測(cè),優(yōu)化模型在定位準(zhǔn)確性和損傷類型識(shí)別方面的性能。
2.1" 聚類分析
在改進(jìn)的YOLO?DETR模型中,聚類分析的應(yīng)用關(guān)鍵在于降低圖像背景的影響,同時(shí)強(qiáng)化對(duì)目標(biāo)瑕疵特征的重視。為此,本文引入了CBAM的混合注意力機(jī)制,優(yōu)化模型對(duì)于布料表面損傷特征的識(shí)別能力,提高對(duì)損傷特征的精確識(shí)別,降低背景噪聲對(duì)檢測(cè)結(jié)果的干擾,從而使得改進(jìn)后的YOLO?DETR模型在布料表面微小損傷檢測(cè)方面表現(xiàn)出更高的準(zhǔn)確性和可靠性。通過卷積操作對(duì)輸入特征進(jìn)行處理,并將處理結(jié)果作為CBAM模塊的輸入。利用通道注意力和空間注意力機(jī)制的雙重作用[7],模型在輸出特征圖中更加突出關(guān)鍵信息,有利于區(qū)分出布料中的微小損傷特征。根據(jù)斷裂伸長(zhǎng)率判斷試樣伸長(zhǎng)率,如圖2所示。
此外,Anchor box的優(yōu)化也在模型改進(jìn)中扮演著重要角色。在原始的YOLO?DETR模型中,Anchor box是根據(jù)COCO和PASCAL VOC數(shù)據(jù)集的聚類結(jié)果確定的,而這些數(shù)據(jù)集中的目標(biāo)尺寸差異較大。鑒于改進(jìn)的YOLO?DETR模型主要用于檢測(cè)布料表面的微小損傷,本文對(duì)特定的目標(biāo)類型進(jìn)行了重新聚類,以獲得更加適合的Anchor box。在目標(biāo)檢測(cè)中,為了確保預(yù)測(cè)框與真實(shí)框的高度重合,本文采用IoU作為度量距離的標(biāo)準(zhǔn),其計(jì)算公式為:
[d(A,B)=1-IoU(A,B)] (1)
式中[A]、[B]分別表示物體真實(shí)框和聚類中心框集合。
改進(jìn)后的模型包含一個(gè)YOLO層,分配了3個(gè)特定尺寸的Anchor box,即[K]=3,以適應(yīng)微小損傷的檢測(cè)需求[8]。以下預(yù)選框尺寸(26,26)、(49,37)、(58,65)分別對(duì)應(yīng)于感受野最小的層,專門用于檢測(cè)微小損傷,Anchor box極大提高了模型在織物表面微小損傷檢測(cè)方面的性能和準(zhǔn)確度,使得模型在實(shí)際應(yīng)用中能夠更有效地識(shí)別和定位布料上的微小損傷。
2.2" 損傷檢測(cè)
為了提高改進(jìn)后的YOLO?DETR模型在檢測(cè)精度方面的表現(xiàn),設(shè)計(jì)了一個(gè)包含三種不同計(jì)算誤差的復(fù)合損失函數(shù)進(jìn)行損傷檢測(cè),損傷檢測(cè)流程圖如圖3所示。
用于優(yōu)化的網(wǎng)絡(luò)參數(shù)為:
[ Loss =aEclsf +bEcoord +(1-a-b)Econf ] (2)
式中:[a]表示分類誤差權(quán)重系數(shù);[b]表示坐標(biāo)誤差權(quán)重系數(shù);[Eclsf ]表示分類誤差[9];[Econf]表示置信度誤差;[Ecoord ]表示坐標(biāo)誤差。
[Eclsf ]關(guān)注于模型在區(qū)分不同損傷類型時(shí)的性能,確保模型能準(zhǔn)確分類各種損傷。
[Eclsf=-i=0L2Robjijc∈ classes CjilogCji+1-Cjilog1-Cji] (3)
式中:[L]表示特征圖的網(wǎng)格寬度;[Robjij]表示第[i]個(gè)網(wǎng)格的第[j]個(gè)邊框是否負(fù)責(zé)預(yù)測(cè)目標(biāo)[10],如果負(fù)責(zé)則為1,否則為0;[Cji]和[Cji]分別表示第[i]個(gè)網(wǎng)格預(yù)測(cè)的第[j]個(gè)邊框的目標(biāo)類別概率和真實(shí)邊框的目標(biāo)類別概率。
[Econf]用于評(píng)估模型預(yù)測(cè)損傷存在的置信度與實(shí)際情況之間的差異[11],旨在提高模型預(yù)測(cè)損傷存在的準(zhǔn)確性。
[Econf=-i=0L2j=0NRobjijFjilogFji+1-Fjilog1-Fji-][" " " " " " "i=0L2j=0NRnoobjijFjilogFji+1-Fjilog1-Fji] (4)
式中:[Fji]和[Fji]分別表示第[i]個(gè)網(wǎng)格預(yù)測(cè)的第[j]個(gè)邊框的置信度和真實(shí)邊框的置信度;[N]表示每個(gè)網(wǎng)格預(yù)測(cè)邊界框的數(shù)量[12]。
[Ecoord ]集中于模型在定位損傷具體位置方面的精度,確保損傷檢測(cè)不僅準(zhǔn)確[13],還能精確到具體位置。
[Ecoord =i=0L2j=0NRobjijxji-xji2+yji-yji2+i=0L2j=0NRobj ijwji-wji2+hji-hji2] (5)
式中:[xji]、[yji]、[wji]、[hji]分別表示第[i]個(gè)網(wǎng)格預(yù)測(cè)的第[j]個(gè)邊框的坐標(biāo)信息;[xji]、[yji]、[wji]、[hji]表示第[i]個(gè)網(wǎng)格的真實(shí)損傷坐標(biāo)信息。
通過綜合性的損失函數(shù)計(jì)算結(jié)果確定損失程度,得到布料表面微小損傷,從而實(shí)現(xiàn)更高的精度和效率。
3" 實(shí)驗(yàn)研究
為了驗(yàn)證本文提出的改進(jìn)YOLO?DETR的布料表面微小損傷檢測(cè)方法的實(shí)際應(yīng)用效果,選用文獻(xiàn)[1]基于MF?SSD網(wǎng)絡(luò)的檢測(cè)方法和文獻(xiàn)[2]基于卷積神經(jīng)網(wǎng)絡(luò)的檢測(cè)方法進(jìn)行實(shí)驗(yàn)對(duì)比。
實(shí)驗(yàn)過程中選擇適當(dāng)分辨率的工業(yè)相機(jī),確保高質(zhì)量圖像采集,配備高質(zhì)量鏡頭,提供清晰的圖像。集成先進(jìn)的自適應(yīng)Mura檢測(cè)算法,提高檢測(cè)的準(zhǔn)確性和效率。通過工業(yè)級(jí)處理器確??焖俣行У膱D像處理,增加GPU處理器,加速圖像處理和算法運(yùn)算。集成打標(biāo)裝置,根據(jù)檢測(cè)結(jié)果自動(dòng)標(biāo)記缺陷的位置,以便后續(xù)處理。選用的檢測(cè)對(duì)象支持涂布、印刷、塑料、橡膠、薄膜及皮革等材料,檢測(cè)寬度可調(diào)節(jié),范圍從20~3 000 mm,檢測(cè)速度范圍為5~25 m/min,可以根據(jù)用戶需求進(jìn)行調(diào)整,檢測(cè)精度可調(diào)節(jié),范圍從10~50 μm,以滿足不同的檢測(cè)需求。
設(shè)定實(shí)驗(yàn)環(huán)境如圖4所示。
根據(jù)上述實(shí)驗(yàn)環(huán)境,同時(shí)針對(duì)缺維、漿斑、膠斑等問題布料進(jìn)行檢測(cè),以部分布料表面微小損傷實(shí)驗(yàn)對(duì)象為例,如圖5所示。
基于上述實(shí)驗(yàn)環(huán)境,進(jìn)一步對(duì)實(shí)驗(yàn)參數(shù)進(jìn)行設(shè)置:初始學(xué)習(xí)率為0.001,使用指數(shù)衰減策略,每5個(gè)epoch衰減0.1倍,訓(xùn)練輪數(shù)為20個(gè)epoch,處理尺寸為64,Anchor Box長(zhǎng)寬比為1∶2、1∶1、2∶1的三個(gè)大?。▽挾群透叨确较蛏戏謩e設(shè)置為128、256、512像素)。CBAM注意力機(jī)制參數(shù):通道注意力權(quán)重為0.5,空間注意力權(quán)重為0.5;K?means聚類參數(shù):[K]為100,迭代次數(shù)為1 000次。
不同方法對(duì)問題布料的檢測(cè)結(jié)果如圖6所示。
根據(jù)圖6可知,改進(jìn)YOLO?DETR的布料表面微小損傷檢測(cè)方法對(duì)缺維、漿斑、膠斑等問題的檢測(cè)精度在95%以上,與傳統(tǒng)方法相比,具有較好的檢測(cè)效果?;赥ransformer的YOLO?DETR方法在布料表面微小損傷檢測(cè)中,能夠全局感知布料表面的微小損傷,提高了檢測(cè)精度和魯棒性。多尺度檢測(cè)機(jī)制使YOLO?DETR還可以適應(yīng)不同尺寸的目標(biāo),進(jìn)一步增強(qiáng)了其實(shí)用性。通過自適應(yīng)特征學(xué)習(xí)和端到端的訓(xùn)練,簡(jiǎn)化了流程,減少了人工干預(yù)。相較于傳統(tǒng)方法,YOLO?DETR在處理布料表面微小損傷檢測(cè)問題上表現(xiàn)出更高的效率和準(zhǔn)確性,為相關(guān)領(lǐng)域帶來了革命性的突破。
4" 結(jié)" 語(yǔ)
針對(duì)傳統(tǒng)自動(dòng)化布料表面損傷檢測(cè)技術(shù)效率低下和適應(yīng)性差的問題,本文提出了一種基于改進(jìn)YOLO?DETR算法的微小損傷檢測(cè)方法,其主要?jiǎng)?chuàng)新和成果如下:
1) 采用YOLO?DETR模型針對(duì)布料損傷進(jìn)行優(yōu)化,提升了檢測(cè)速度和精度,包括新增殘差模塊、特征圖擴(kuò)展和深度可分離卷積,以及多尺度特征提取層,使模型更適用于高效、精確的工業(yè)應(yīng)用。
2) 實(shí)驗(yàn)結(jié)果顯示,本文方法在檢測(cè)復(fù)雜背景下的微小瑕疵方面,準(zhǔn)確率顯著提升,且相比其他深度學(xué)習(xí)算法在檢測(cè)效率和適應(yīng)能力上有明顯優(yōu)勢(shì)。
總體而言,本文基于改進(jìn)的YOLO?DETR算法提出了一種高效的布料表面微小損傷檢測(cè)方法,有效提升了檢測(cè)速度、精度,并強(qiáng)化了對(duì)復(fù)雜背景的識(shí)別能力。這一技術(shù)進(jìn)展不僅代表了紡織品質(zhì)量控制領(lǐng)域的重大突破,也彰顯了深度學(xué)習(xí)在工業(yè)應(yīng)用中的廣闊前景。
參考文獻(xiàn)
[1] 黃漢林,景軍鋒,張緩緩,等.基于MF?SSD網(wǎng)絡(luò)的織物疵點(diǎn)檢測(cè)[J].棉紡織技術(shù),2020,48(12):11?16.
[2] 劉艷鋒,鄭云波,黃惠玲,等.基于卷積神經(jīng)網(wǎng)絡(luò)的織物瑕疵檢測(cè)方法研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(11):62?68.
[3] CARION N, MASSA F, SYNNAEVE G, et al. End?to?end object detection with transformers [C]// 16th European Conference on Computer Vision. Heidelberg, Germany: Springer, 2020: 213?229.
[4] 謝景洋,王巍,劉婷.基于YOLOv3算法的不同主干網(wǎng)絡(luò)對(duì)織物瑕疵檢測(cè)[J].測(cè)控技術(shù),2021,40(3):61?66.
[5] 于海濤,李福龍,劉亞姣,等.改進(jìn)注意力機(jī)制的型鋼表面微小缺陷檢測(cè)方法[J].計(jì)算機(jī)工程與應(yīng)用,2022,58(11):250?259.
[6] 鄒旺,吉暢.一種改進(jìn)YOLOv4?tiny的帶鋼表面缺陷實(shí)時(shí)檢測(cè)方法[J].機(jī)械科學(xué)與技術(shù),2023,42(6):883?889.
[7] 劉宜軒,程志江,吳動(dòng)波,等.基于改進(jìn)YOLOv5的航空發(fā)動(dòng)機(jī)葉片表面缺陷檢測(cè)方法研究[J].激光雜志,2023,44(7):57?61.
[8] 陳德富,閆坤,熊經(jīng)先,等.基于改進(jìn)YOLOv4的工件表面缺陷檢測(cè)方法[J].計(jì)算機(jī)應(yīng)用,2022,42(z1):94?99.
[9] 呂金銳,付燕,倪美玉,等.基于改進(jìn)YOLOv4模型的番茄成熟度檢測(cè)方法[J].食品與機(jī)械,2023,39(9):134?139.
[10] 何湘杰,宋曉寧.YOLOv4?Tiny的改進(jìn)輕量級(jí)目標(biāo)檢測(cè)算法[J].計(jì)算機(jī)科學(xué)與探索,2024,18(1):138?150.
[11] 艾明璐,丁紅昌,吳智勇.改進(jìn)YOLOv5s網(wǎng)絡(luò)的膠囊表面缺陷檢測(cè)方法[J].激光雜志,2023,44(10):44?51.
[12] 曾飛,周健,章生,等.基于RW?YOLOv3的輸送帶表面損傷實(shí)時(shí)檢測(cè)[J].現(xiàn)代制造工程,2023(2):92?98.
[13] 趙嘉威,田光兆,邱暢,等.基于改進(jìn)YOLOv4算法的蘋果葉片病害檢測(cè)方法[J].江蘇農(nóng)業(yè)科學(xué),2023,51(9):193?199.