摘要:現(xiàn)有基于深度學(xué)習(xí)的輸送帶異物檢測(cè)模型較大,難以在邊緣設(shè)備部署,且對(duì)不同尺寸異物和小目標(biāo)異物存在錯(cuò)檢、漏檢情況。針對(duì)上述問(wèn)題,提出一種基于改進(jìn)YOLOv8 的煤礦輸送帶異物檢測(cè)方法。采用深度可分離卷積、壓縮和激勵(lì)(SE) 網(wǎng)絡(luò)將YOLOv8 主干網(wǎng)絡(luò)中C2f 模塊的Bottleneck 重新構(gòu)建為DSBlock,在保持模型輕量化的同時(shí)提升檢測(cè)性能;為增強(qiáng)對(duì)不同尺寸目標(biāo)物體信息的獲取能力,引入高效通道注意力(ECA) 機(jī)制,并對(duì)ECA 的輸入層進(jìn)行自適應(yīng)平均池化和自適應(yīng)最大池化操作,得到跨通道交互MECA 模塊,以增強(qiáng)模塊的全局視覺(jué)信息,進(jìn)一步提升異物識(shí)別精度;將YOLOv8 的3 個(gè)檢測(cè)頭修改為4 個(gè)輕量化小目標(biāo)檢測(cè)頭,以增強(qiáng)對(duì)小目標(biāo)的敏感性,有效降低小目標(biāo)異物的漏檢率和錯(cuò)檢率。實(shí)驗(yàn)結(jié)果表明:改進(jìn)YOLOv8 的精確度達(dá)91.69%,mAP@50 達(dá)92.27%,較YOLOv8 分別提升了3.09% 和4.07%;改進(jìn)YOLOv8 的檢測(cè)速度達(dá)73.92 幀/s,可充分滿(mǎn)足煤礦輸送帶異物實(shí)時(shí)檢測(cè)的需求;改進(jìn)YOLOv8 的精確度、mAP@50、參數(shù)量、權(quán)重大小和每秒浮點(diǎn)運(yùn)算數(shù)均優(yōu)于SSD,F(xiàn)aster-RCNN,YOLOv5,YOLOv7?tiny 等主流目標(biāo)檢測(cè)算法。
關(guān)鍵詞:輸送帶異物檢測(cè);YOLOv8;SE 網(wǎng)絡(luò);高效通道注意力機(jī)制;輕量化;小目標(biāo)檢測(cè);自適應(yīng)平均池化;自適應(yīng)最大池化
中圖分類(lèi)號(hào):TD634.1 文獻(xiàn)標(biāo)志碼:A
0 引言
帶式輸送機(jī)是煤礦井下運(yùn)輸?shù)闹匾O(shè)備[1]。在煤炭運(yùn)輸過(guò)程中,石塊、錨桿等異物的存在可能會(huì)造成帶式輸送機(jī)工作異常,導(dǎo)致煤塊溢出、轉(zhuǎn)軸磨損、出煤口堵塞等情況,甚至可能造成煤礦停產(chǎn),嚴(yán)重威脅煤礦生產(chǎn)安全。
隨著人工智能技術(shù)的快速發(fā)展,眾多研究者利用機(jī)器視覺(jué)對(duì)輸送帶異物進(jìn)行識(shí)別。目前主流的目標(biāo)檢測(cè)算法主要分為單階段和兩階段。單階段代表算法包括YOLO[2],SSD[3],RetinaNet[4]等,兩階段代表算法包括Faster R-CNN[5], Mask R-CNN[6]等。劉富強(qiáng)等[7]通過(guò)灰度直方圖實(shí)現(xiàn)視覺(jué)檢測(cè),但存在矸石被煤塵覆蓋無(wú)法識(shí)別的問(wèn)題;Wang Yuanbin 等[8]通過(guò)改進(jìn)SSD 算法提高異物檢測(cè)精度,在識(shí)別速度方面尚難滿(mǎn)足需求;任國(guó)強(qiáng)等[9]通過(guò)先驗(yàn)框和損失函數(shù)解決樣本不平衡問(wèn)題,未能解決模型大的問(wèn)題;Xie Yehui 等[10]通過(guò)改進(jìn)損失函數(shù)CIoU 實(shí)現(xiàn)異物識(shí)別,但識(shí)別精度較低;程德強(qiáng)等[11]采用殘差輕量級(jí)網(wǎng)絡(luò)和融入交叉學(xué)習(xí)機(jī)制增強(qiáng)模型的提取能力,但模型參數(shù)量依舊較大; Mao Qinghua 等[12]通過(guò)改進(jìn)YOLOv5 提升模型性能,但未針對(duì)細(xì)長(zhǎng)物目標(biāo)進(jìn)行優(yōu)化,易造成錯(cuò)檢;張旭[13]通過(guò)剪枝進(jìn)行模型輕量化,易破壞網(wǎng)絡(luò)結(jié)構(gòu);Liu Jiehui 等[14]通過(guò)K-means++聚類(lèi)進(jìn)行數(shù)據(jù)優(yōu)化,融入GhostNet 和深度可分離卷積降低模型計(jì)算量,但模型的權(quán)重依舊較大;高涵等[15]通過(guò)引入可變形卷積構(gòu)建數(shù)據(jù)增強(qiáng),解決輸送帶異物識(shí)別精確度低等問(wèn)題,但泛化能力仍有較大提升空間; Yang Dengjie 等[16]對(duì)YOLOv7 算法進(jìn)行改進(jìn),通過(guò)減少卷積和加入小尺度探測(cè)層增強(qiáng)模型檢測(cè)能力,但模型的參數(shù)量和浮點(diǎn)計(jì)算負(fù)擔(dān)依舊較大。上述方法均取得了不錯(cuò)的研究成果,但仍然存在錯(cuò)檢、漏檢情況,以及對(duì)不同尺寸異物和小目標(biāo)異物檢測(cè)性能不佳、異物檢測(cè)模型較大、難以在邊緣端部署等問(wèn)題。
針對(duì)上述問(wèn)題, 本文提出一種基于改進(jìn)YOLOv8 的煤礦輸送帶異物檢測(cè)方法。主要的創(chuàng)新點(diǎn):① 構(gòu)建了基于Bottleneck 的輕量化模塊,可增強(qiáng)模型對(duì)前景信息的提取能力,同時(shí)減小模型的體積,便于后期在邊緣端部署。② 提出一種有效的跨通道注意力機(jī)制MECA,以增強(qiáng)模塊的全局視覺(jué)信息,從而適應(yīng)不同大小的異物目標(biāo)識(shí)別,進(jìn)一步提升網(wǎng)絡(luò)識(shí)別精度。③ 將3 個(gè)檢測(cè)頭修改為4 個(gè)輕量化小目標(biāo)檢測(cè)頭,可更加準(zhǔn)確地捕捉和定位小型異物目標(biāo),能夠適應(yīng)復(fù)雜環(huán)境。
1 YOLOv8 網(wǎng)絡(luò)結(jié)構(gòu)
YOLOv8 是YOLO 系列中最新的版本,主要由InPut,Backbone,Neck,Head 4 個(gè)部分組成,如圖1 所示。① InPut 部分主要負(fù)責(zé)對(duì)輸入的特征圖像進(jìn)行預(yù)處理,包括自適應(yīng)縮放、調(diào)整輸入尺寸、數(shù)據(jù)增強(qiáng)等,以提升網(wǎng)絡(luò)模型的魯棒性。② Backbone 主要由Conv、C2f 和快速空間金字塔池化(Spatial PyramidPooling Fast, SPPF) 組成。YOLOv8 將YOLOv5 的C3 模塊替換為C2f 模塊, C2f 模塊相較于原C3 模塊,增加了跳層連接和額外的拆分操作,使模型的梯度數(shù)據(jù)流更加豐富, 提升了模型的性能。此外,YOLOv8 對(duì)模塊個(gè)數(shù)進(jìn)行了改進(jìn),從[3,6,9,3]優(yōu)化為[3,6,6,3],從而使模型進(jìn)一步輕量化。SPPF 將不同尺度的特征信息融合在一起,豐富特征圖的語(yǔ)義特征,從而進(jìn)一步提升模型的特征提取能力。③ Neck部分主要對(duì)Backbone 提取到的特性圖信息進(jìn)行處理,繼續(xù)沿用YOLOv5 的路徑聚合網(wǎng)絡(luò)(Path AggregationNetwork, PAN) +特征金字塔網(wǎng)絡(luò) (Feature PyramidNetworks,F(xiàn)PN)結(jié)構(gòu)。相較于YOLOv5 模型,YOLOv8移除了1×1 降采樣層,通過(guò)自頂向下和自下向頂?shù)目鐚舆B接使特征更加充分融合。④ Head 部分的主要作用是利用前面提取的特征,完成目標(biāo)檢測(cè)的識(shí)別任務(wù)。YOLOv8 采用了解耦頭結(jié)構(gòu),將回歸解耦和分類(lèi)的過(guò)程進(jìn)行分離,并根據(jù)回歸解耦和分類(lèi)加權(quán)得到的分?jǐn)?shù)來(lái)確定最終的正負(fù)樣本數(shù),從而解決了復(fù)雜背景下定位準(zhǔn)確率低和分類(lèi)錯(cuò)誤的問(wèn)題,有效提升模型的性能。