楊豚,郭永存,王爽,馬鑫
(1.安徽理工大學(xué) 深部煤礦采動響應(yīng)與災(zāi)害防控國家重點實驗室,安徽 淮南 232001;2.安徽理工大學(xué) 礦山智能裝備與技術(shù)安徽省重點實驗室,安徽 淮南 232001;3.安徽理工大學(xué) 機(jī)械工程學(xué)院,安徽 淮南 232001)
隨著智慧礦山的提出,傳統(tǒng)礦山設(shè)備正朝著智能化的方向發(fā)展,少人化、無人化作業(yè)成為未來礦山的發(fā)展目標(biāo)[1-2].煤礦輔助運輸是礦山生產(chǎn)的重要環(huán)節(jié)之一,煤礦井下軌道電機(jī)車作為輔助運輸?shù)闹饕O(shè)備,承擔(dān)對作業(yè)人員、設(shè)備、物料等的運輸任務(wù).傳統(tǒng)軌道電機(jī)車主要依靠人工駕駛,然而井下巷道地質(zhì)條件復(fù)雜、道路交叉且盲區(qū)大等環(huán)境因素易造成電機(jī)車的碰撞及傷人事故[3].利用電機(jī)車無人駕駛技術(shù),能夠有效地避免安全事故的發(fā)生,提高作業(yè)效率,但目前國內(nèi)外對軌道電機(jī)車無人駕駛技術(shù)的研究尚處于起步階段,國內(nèi)少數(shù)煤礦研發(fā)出的電機(jī)車無人駕駛系統(tǒng)存在建設(shè)成本高、對煤礦環(huán)境要求高、技術(shù)成熟度低等限制條件,無法廣泛投入使用.
準(zhǔn)確且快速地識別障礙物是無人駕駛電機(jī)車安全運行的重要前提.目前,常用的障礙物識別方法主要包括激光雷達(dá)、毫米波雷達(dá)及基于計算機(jī)視覺的目標(biāo)檢測技術(shù)等.其中激光雷達(dá)與毫米波雷達(dá)分別通過激光和電磁波的反射來識別障礙物,然而煤礦巷道環(huán)境不同于地面環(huán)境,光線不足以及凹凸不平的巷道壁面容易使毫米波雷達(dá)和激光雷達(dá)產(chǎn)生噪聲,導(dǎo)致障礙物檢測不準(zhǔn)確的問題.激光雷達(dá)價格昂貴、使用壽命短,增加了生產(chǎn)成本[4].基于計算機(jī)視覺的深度學(xué)習(xí)目標(biāo)檢測模型具有部署簡單、成本低廉、抗干擾能力強(qiáng)等優(yōu)點,更適合作為煤礦無人駕駛軌道電機(jī)車的障礙物識別方法.
隨著圖像處理技術(shù)的發(fā)展,基于計算機(jī)視覺的目標(biāo)檢測技術(shù)在各個領(lǐng)域中得到了廣泛使用,被越來越多地應(yīng)用到礦山領(lǐng)域的檢測場景中.靳舒凱等[5]通過構(gòu)建輕量級YOLOv4 網(wǎng)絡(luò)模型,提高了煤礦副井礦車裝載物識別的速度.盧萬杰等[6]基于深度學(xué)習(xí)算法建立煤礦設(shè)備類型識別模型,實現(xiàn)了巡檢機(jī)器人對煤礦設(shè)備的精確識別與分類.李偉山等[7]提出改進(jìn)Faster RCNN 算法,提高了模型在環(huán)境惡劣的煤礦井下巷道中對行人的檢測精度.Pan 等[8]通過對tiny-YOLOv3 進(jìn)行改進(jìn),提出有效的煤和矸石快速識別模型,為煤矸分選技術(shù)提供理論依據(jù).張慶賀等[9]基于YOLOv5,結(jié)合數(shù)字圖像相關(guān)技術(shù)(digital image correlation,DIC)構(gòu)建的云圖,提出智能識別復(fù)雜裂隙巖石破壞的方法,定量研究復(fù)雜裂隙巖石變形破壞的規(guī)律及裂隙擴(kuò)展特征.李飛等[10]提出改進(jìn)型YOLOv4檢測模型,實現(xiàn)對礦用帶式輸送機(jī)的縱向撕裂裂紋的精準(zhǔn)識別檢測.可見,深度學(xué)習(xí)目標(biāo)檢測算法在煤礦領(lǐng)域中的應(yīng)用能夠提高安全生產(chǎn)水平,提高了生產(chǎn)效率和經(jīng)濟(jì)效益,對實現(xiàn)煤礦智能化具有重要意義.
利用基于計算機(jī)視覺的目標(biāo)檢測技術(shù),能夠保證物體邊界的完整性,實現(xiàn)在不同的光照條件、角度和尺度等情況下準(zhǔn)確地識別目標(biāo)物體,然而復(fù)雜的煤礦井下巷道環(huán)境對模型的檢測性能提出了較高的要求.本研究基于YOLOv5,通過構(gòu)建C3_P 特征提取模塊,增強(qiáng)模型的泛化能力和魯棒性.對模型的預(yù)測頭進(jìn)行解耦,提高模型的收斂速度和檢測精度.優(yōu)化Mosaic 數(shù)據(jù)增強(qiáng)方法,豐富訓(xùn)練樣本特征.提出用于無人駕駛電機(jī)車障礙物精準(zhǔn)實時檢測的PDM-YOLO 模型,旨在為煤礦無人駕駛軌道電機(jī)車提供安全、可靠的障礙物檢測方法.
“更快更輕”的神經(jīng)網(wǎng)絡(luò)是計算機(jī)視覺領(lǐng)域的未來發(fā)展趨勢,現(xiàn)有如MobileNet[11]、ShuffleNet[12]、GhostNet[13]等輕量化神經(jīng)網(wǎng)絡(luò)利用深度卷積(depthwise convolution)或組卷積(group convolution)提取特征,與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,在計算量(浮點運算數(shù)量FLOPs)方面得到了一定程度的改進(jìn),降低了模型的復(fù)雜性.這些網(wǎng)絡(luò)由于頻繁的內(nèi)存訪問及伴有較多的卷積、池化、級聯(lián)等額外的數(shù)據(jù)操作,增加了運行時間和延遲時間,降低了模型的計算效率.為了降低模型的計算量,提高模型的計算速度,采用部分卷積(partial convolution,PConv)[14]替換YOLOv5 模型C3 模塊中的傳統(tǒng)卷積(Conv),構(gòu)建C3_P 特征提取模塊.部分卷積過程如圖1 所示,僅對一部分輸入通道cp應(yīng)用傳統(tǒng)卷積,并保持其余通道不變,通過減少冗余計算和內(nèi)存訪問,更加有效地提取空間特征.
圖1 部分卷積過程Fig.1 Partial convolution process
部分卷積與傳統(tǒng)卷積的FLOPs 表達(dá)式如下所示:
部分卷積與傳統(tǒng)卷積的內(nèi)存訪問量(memory access cost,MAC)的表達(dá)式如下所示:
通常部分卷積的通道數(shù)cp與輸入通道數(shù)c的比值為1/4,則部分卷積的FLOPs 僅為傳統(tǒng)卷積的1/16,有效降低了模型的計算總量.部分卷積的MAC 為傳統(tǒng)模型的1/4,有效減少了模型的延遲時間,提高了計算速度.
傳統(tǒng)C3 與C3_P 特征提取模塊的結(jié)構(gòu)如圖2所示,通過將卷積塊(Conv BN SiLU)中的傳統(tǒng)卷積Conv 替換為部分卷積PConv,得到新的卷積塊(PConv BN SiLU),其中BN 為批標(biāo)準(zhǔn)化(batch normalization),SiLU 為激活函數(shù).傳統(tǒng)YOLOv5 的每秒浮點運算次數(shù)(FLOPs)為15.9×109,檢測速度為118.9 幀/s.引入C3_P 模塊后模型的FLOPs 為13.0×109,檢測速度為135.1 幀/s.C3_P 模塊的引入使得模型的FLOPs 減少了2.9×109,檢測速度提高了16.2 幀/s.
綜上所述,核酸檢驗在篩查獻(xiàn)血者乙型肝炎病毒中有著重要的應(yīng)用價值,其檢驗靈敏度比較高,縮短了窗口期,保證了輸血的安全性。
圖2 C3 與C3_P 的結(jié)構(gòu)Fig.2 Structure of C3 and C3_ P
YOLOv5 的預(yù)測頭負(fù)責(zé)從輸入特征圖中提取目標(biāo)檢測的結(jié)果,輸出包含每個檢測到的目標(biāo)的類別標(biāo)簽(Cls)、邊界框位置信息(Reg)及目標(biāo)存在的置信度得分(Obj).傳統(tǒng)YOLOv5 采用耦合的檢測頭輸出預(yù)測結(jié)果,如圖3(a)所示,通過1×1 的卷積實現(xiàn)分類與回歸任務(wù),但這種耦合的預(yù)測頭通常存在定位精度不準(zhǔn)確的問題.為了解決該問題,對預(yù)測頭進(jìn)行解耦,分別開展分類與回歸任務(wù).在YOLO 系列模型中,YOLOX[15]模型采用解耦預(yù)測頭(decoupled head),如圖3(b)所示,輸入特征圖經(jīng)過1×1 的卷積進(jìn)行降維處理,經(jīng)過分類、回歸2 個分支,每個分支上包括2 個3×3 的卷積,負(fù)責(zé)回歸任務(wù)的分支劃分為2 個,分別用于確立邊界框位置信息及置信度得分的分支.解耦后的預(yù)測頭提高了模型的收斂速度和檢測精度,但會大幅增加模型的計算成本.對YOLOX 解耦頭進(jìn)行改進(jìn),如圖3(c)所示,在分類和回歸2 個分支上分別減少3×3 的卷積,以減小模型的參數(shù)量和推理時間.YOLOv5 模型分別添加傳統(tǒng)YOLOX 解耦頭及改進(jìn)解耦頭的計算量及檢測速度v對比如表1 所示,改進(jìn)后解耦頭的FLOPs 較傳統(tǒng)解耦頭減少了19.8×109,檢測速度提高了14.7 幀/s.
表1 模型添加2 種解耦頭的浮點運算總量及檢測速度的對比Tab.1 Comparison of total floating-point operations and detection speed for two decoupled heads added to model
圖3 幾種預(yù)測頭的結(jié)構(gòu)Fig.3 Structure of several prediction heads
當(dāng)訓(xùn)練目標(biāo)檢測模型時,數(shù)據(jù)增強(qiáng)是常用的豐富數(shù)據(jù)集的技術(shù).數(shù)據(jù)增強(qiáng)通過對原始圖像進(jìn)行變換、扭曲、縮放等操作,增加了訓(xùn)練樣本的多樣性,使得模型能夠更好地學(xué)習(xí)到不同場景下的目標(biāo)特征,提高了模型的泛化能力和魯棒性,在提升檢測精度的同時不會增加計算成本,非常有益于目標(biāo)檢測任務(wù).常用的數(shù)據(jù)增強(qiáng)方法分為基于光學(xué)畸變和基于幾何畸變兩大類.基于光學(xué)畸變的數(shù)據(jù)增強(qiáng)方法包括調(diào)整訓(xùn)練圖像的亮度、對比度、飽和度和圖像噪聲等,幾何畸變包括對訓(xùn)練圖像進(jìn)行隨機(jī)縮放、剪裁、翻轉(zhuǎn)、旋轉(zhuǎn)等.
YOLOv5 除了使用基本的光學(xué)畸變及幾何畸變數(shù)據(jù)增強(qiáng)方法外,還采用 Mosaic 數(shù)據(jù)增強(qiáng)[16].Mosaic 數(shù)據(jù)增強(qiáng)的主要思想是在模型訓(xùn)練時隨機(jī)挑選4 張圖像進(jìn)行任意尺寸的裁剪、縮放,再隨機(jī)排列拼接形成1 張圖像,有效地增加了訓(xùn)練樣本的數(shù)量和圖像的復(fù)雜度,提高了模型的魯棒性及訓(xùn)練效率.煤礦井下巷道環(huán)境惡劣,障礙物目標(biāo)存在光照不足、遮擋及小目標(biāo)特征不明顯的問題.為了進(jìn)一步豐富障礙物目標(biāo)特征,優(yōu)化Mosaic數(shù)據(jù)增強(qiáng)方法,將一次隨機(jī)處理4 張圖像改進(jìn)為一次隨機(jī)處理9 張圖像.如圖4(a)、(b)所示分別為改進(jìn)前(Mosaic-4)與改進(jìn)后(Mosaic-9)的Mosaic數(shù)據(jù)增強(qiáng)效果示意圖.可以看出,改進(jìn)后的Mosaic-9 數(shù)據(jù)增強(qiáng)處理后的圖像包含更多的障礙物目標(biāo)數(shù)量,有利于模型在訓(xùn)練過程中學(xué)習(xí)到更多的障礙物目標(biāo)特征.
圖4 優(yōu)化前、后的Mosaic 數(shù)據(jù)增強(qiáng)效果對比Fig.4 Comparison of Mosaic data enhancement effects before and after optimization
PDM-YOLO 網(wǎng)絡(luò)結(jié)構(gòu)如圖5 所示,模型由輸入端(Input)、骨干(Backbone)、頸部(Neck)及預(yù)測頭(Head)4 部分組成.根據(jù)Bottleneck 結(jié)構(gòu)的不同,設(shè)計C3_P1 與C3_P2 2 種特征提取模塊,如圖6所示,C3_P1 與C3_P2 分別應(yīng)用在模型的骨干和頸部中.模型骨干的末端采用金字塔池化模塊(spatial pyramid pooling-fast,SPPF).SPPF 采用3 個相同大小的池化核,分別對輸入特征圖進(jìn)行最大池化,得到統(tǒng)一大小的特征向量.將這些特征向量按照一定的規(guī)則拼接在一起,形成固定大小的輸出特征向量.該輸出特征向量包含了不同大小、比例和位置的目標(biāo)的信息,可以用于后續(xù)的分類和回歸任務(wù),即SPPF 能夠在不同大小的感受野下提取特征并保持特征圖的尺寸不變.模型頸部采用特征金字塔(feature pyramid network,FPN)和路徑聚合網(wǎng)絡(luò)(path aggregation network,PANet)2 個特征融合組件[17-18].FPN 是自上而下傳遞高層語義特征的金字塔結(jié)構(gòu),PANet 是自下而上傳遞低層定位特征的金字塔結(jié)構(gòu).模型頸部通過FPN 結(jié)合PANet 的結(jié)構(gòu),可以從不同尺度上對特征圖進(jìn)行聚合和加權(quán),實現(xiàn)特征的有效融合.模型預(yù)測頭采用改進(jìn)后的解耦頭,從3 種不同尺度輸出預(yù)測結(jié)果.
圖5 PDM-YOLO 模型的結(jié)構(gòu)Fig.5 Structure of PDM-YOLO model
圖6 2 種C3_P 及2 種BottleneckFig.6 Two types of C3_ P and Bottleneck
煤礦井下巷道不同于地面環(huán)境,傳統(tǒng)的PASCAL VOC、COCO 公共數(shù)據(jù)集難以準(zhǔn)確體現(xiàn)出井下障礙物的特征,因此在安徽省淮南市顧橋煤礦及淮北市袁店一礦的井下巷道中沿著電機(jī)車的行駛路線采集圖像,創(chuàng)建障礙物檢測數(shù)據(jù)集.為了進(jìn)一步豐富數(shù)據(jù)集,提高模型的魯棒性,在拍攝時考慮不同的拍攝角度、障礙物所處的不同光照條件、位置以及障礙物部分遮擋情況等,獲取的每張圖像中包含多個數(shù)量或者不同種類的障礙物目標(biāo).經(jīng)過篩選得到訓(xùn)練集圖像3 000 張,建立測試集圖像500 張,用于驗證模型的檢測效果.其中3 000 張訓(xùn)練集圖像中包含的障礙物目標(biāo)總數(shù)量為16 195 個,500 張測試集圖像包含的障礙物目標(biāo)數(shù)量為2 857 個.
影響井下無人駕駛軌道電機(jī)車安全運行的障礙物類別主要為行走的礦工、同軌道行駛的電機(jī)車、煤礦運輸小車、載物平板車及灑落的矸石等.將這5 種典型的障礙物作為檢測對象(與其他4 類障礙物相比,矸石的體積更小且目標(biāo)特征不明顯,因此將矸石作為小目標(biāo)障礙物進(jìn)行檢測,本研究檢測的矸石粒徑大于100 mm),采用LabelImg 標(biāo)注工具對圖像中的障礙物進(jìn)行標(biāo)注,分別以“Miner”、“Locomotive”、“Mine_car”、“Flat_car”、“Gangue”作為礦工、電機(jī)車、煤礦運輸小車、載物平板車及矸石的訓(xùn)練標(biāo)簽.部分訓(xùn)練數(shù)據(jù)集的圖像如圖7 所示.
圖7 部分障礙物的檢測數(shù)據(jù)集Fig.7 Detection dataset of partial obstacle
本研究的模型訓(xùn)練基于Ubuntu 系統(tǒng),計算機(jī)使用的CPU 及GPU 型號分別為AMD-5800X 與GeForce-RTX-3060.在訓(xùn)練模型前,調(diào)整訓(xùn)練超參數(shù)以獲取最優(yōu)模型,具體參數(shù)如表2 所示.
表2 模型訓(xùn)練超參數(shù)設(shè)定Tab.2 Model training hyper-parameter setting
式中:TP 為正樣本被正確檢測的數(shù)量,F(xiàn)P 為負(fù)樣本被檢測為正樣本的數(shù)量,F(xiàn)N 為正樣本未被檢測出的數(shù)量,Npred為預(yù)測出的所有檢測框的數(shù)量,NGT為所有真實框(人工標(biāo)注框ground truth)的數(shù)量.
通過消融實驗,驗證各個改進(jìn)方案的有效性.基于建立的障礙物檢測數(shù)據(jù)集,分別測試不同改進(jìn)方案下模型的檢測性能,結(jié)果如表3 所示.模型僅使用構(gòu)建的C3_P 特征提取模塊時,mAP 為95.7%,F(xiàn)LOPs 為13.0×109,與傳統(tǒng)YOLOv5 相比,單一使用C3_P 的模型(YOLOv5-C3_P)使得mAP 提高了2.6%,F(xiàn)LOPs 降低了2.9×109.當(dāng)模型僅采用改進(jìn)的解耦預(yù)測頭(YOLOv5-Decoupled)時,mAP 由原來的93.1% 提高至96.1%,但FLOPs 增加了20.6×109.模型使用優(yōu)化后的Mosaic數(shù)據(jù)增強(qiáng)(YOLOv5-Mosaic9)未改變模型的計算總量,使得mAP 提高了0.1%.綜合使用3 種改進(jìn)方法得到的PDM-YOLO 模型,使得mAP 由傳統(tǒng)YOLOv5 的93.1%提高至96.3%.綜上所述,3 種改進(jìn)方案均有利于提高模型的檢測精度,使用改進(jìn)的解耦預(yù)測頭方案更加有效地提升了模型的檢測精度.
表3 消融對比分析Tab.3 Comparative analysis of ablation
訓(xùn)練模型時,模型損失函數(shù)的數(shù)值隨著迭代次數(shù)的增加而逐步減少,最終趨于穩(wěn)定值而達(dá)到收斂狀態(tài).YOLOv5 的損失函數(shù)由3 部分組成,分別為定位損失函數(shù)、分類損失函數(shù)及置信度損失函數(shù).其中定位損失函數(shù)采用CIoU 損失函數(shù),分類損失函數(shù)及置信度損失函數(shù)采用二元交叉熵?fù)p失函數(shù),模型的總損失值為3 部分損失之和.如圖8 所示為表4 中各模型的訓(xùn)練總損失L對比.圖中,n為迭代次數(shù).YOLOv5、YOLOv5-C3_P、YOLOv5-Decoupled、YOLOv5-Mosaic9、PDMYOLO 這5 種模型的損失分別在迭代訓(xùn)練約240、320、100、350、180 次后趨于穩(wěn)定狀態(tài),YOLOv5-Decoupled 模型的收斂速度更快,驗證了解耦后的預(yù)測頭提升了模型的收斂速度.
表4 不同模型的對比分析Tab.4 Comparative analysis of different models
圖8 訓(xùn)練損失的對比Fig.8 Comparison of training loss
目標(biāo)檢測模型主要分為以下2 大類:一類是以RCNN 系列[21-23]為代表的雙階段目標(biāo)檢測模型,首先生成候選框,再進(jìn)行樣本分類;另一類是以YOLO 系列[24-26]為代表的單階段目標(biāo)檢測模型,直接輸出包含位置及分類信息.雙階段目標(biāo)檢測模型的檢測精度較高,但由于計算過程繁瑣、推理時間長,檢測速度通常僅為幾幀每秒,無法在實時檢測的場景中使用[27-28].基于建立的障礙物檢測數(shù)據(jù)集,將PDM-YOLO 模型與綜合檢測性能較優(yōu)越的單階段YOLO 系列模型進(jìn)行訓(xùn)練及測試,測試結(jié)果如表4 所示.YOLOv3 及YOLOv4模型的mAP 分別達(dá)到93.2%和93.1%,但模型的FLOPs 較大,分別為154.6×109和141.1×109.2 種模型的檢測速度分別為27.0 和31.8 幀/s,與其他模型相比,檢測速度較小,2 種模型的內(nèi)存大小分別為246.4 和256.1 MB,其尺寸是PDM-YOLO 的近10 倍,不利于模型的部署.YOLOv3-Tiny 以及YOLOv4-Tiny 這2 種輕量化模型的計算量少,檢測速度快,模型內(nèi)存小,但2 種模型的mAP 分別為88.9%和88.7%,對障礙物的檢測精度較低.與較高版本的YOLOv5、YOLOv6、YOLOv7 及YOLOv8 相比,4 種模型的mAP 及檢測速度處于平均水平,但YOLOv6、YOLOv7 及YOLOv8 的計算量和內(nèi)存大小均高于YOLOv5.在YOLOv5 模型的基礎(chǔ)上提出PDM-YOLO 模型,PDM-YOLO模型的mAP 達(dá)到96.3%,檢測速度達(dá)到109.2 幀/s,在計算量和內(nèi)存大小方面均處于較低水平,PDMYOLO 模型的綜合性能優(yōu)于表4 中的其他模型.
為了驗證PDM-YOLO 模型對障礙物的檢測效果,在煤礦井下巷道的實際場景中對傳統(tǒng)YOLOv5和PDM-YOLO 進(jìn)行對比檢測,測試結(jié)果如圖9 所示.圖中,A1~A12 為PDM-YOLO 的檢測結(jié)果,B1~B12 為傳統(tǒng)YOLOv5 的檢測結(jié)果.2 種模型的對比檢測情況如表5 所示.表中,圖A1~A3、B1~B3 為障礙物部分遮擋的場景,圖A4~A6、B4~B6為光照不足的場景,圖A7~A9、B7~B9 為小目標(biāo)障礙物的場景,圖A10~A12、B10~B12 為遠(yuǎn)距離障礙物的場景.PDM-YOLO 在不同場景下均能夠準(zhǔn)確識別出障礙物,未出現(xiàn)障礙物漏檢的情況,而傳統(tǒng)YOLOv5 出現(xiàn)了較多的障礙物漏檢問題,PDMYOLO 具有較高的魯棒性和優(yōu)良的檢測性能.
表5 PDM-YOLO 與YOLOv5 檢測結(jié)果的對比分析Tab.5 Comparative analysis of test results between PDMYOLO and YOLOv5
圖9 PDM-YOLO 與YOLOv5 檢測結(jié)果的對比Fig.9 Comparison of PDM-YOLO and YOLOv5 detection results
為了探究PDM-YOLO 模型與表4 中其他不同模型之間的實際檢測結(jié)果差異,利用表4 中的所有模型,分別對建立的500 張測試集圖像進(jìn)行檢測.統(tǒng)計對障礙物目標(biāo)的正確檢測數(shù)量、誤檢數(shù)量及漏檢數(shù)量,結(jié)果如表6 所示.表中,Nc為正確檢測數(shù)量,Nf為誤檢數(shù)量,Nm為漏檢數(shù)量,Nz為總數(shù)量.500 張測試集圖像包含的障礙物目標(biāo)總數(shù)量為2 857 個,其中PDM-YOLO 模型正確檢測目標(biāo)的數(shù)量為2 786個,高于表6 中的其他模型,PDM-YOLO 模型的障礙物誤檢數(shù)量為19 個,漏檢數(shù)量為52 個,均低于表6 中的其他模型.綜合比較可知,PDM-YOLO 模型具有更好的檢測能力.
表6 障礙物檢測數(shù)量的對比Tab.6 Comparison of obstacle detection numbers
為了驗證PDM-YOLO 模型的檢測精度,基于2.1 節(jié)的同一計算機(jī)配置及訓(xùn)練超參數(shù),分別在PASCAL VOC 2007 和PASCAL VOC 2012 公共數(shù)據(jù)集上對比測試了PDM-YOLO、傳統(tǒng)YOLOv5、YOLOv6、YOLOv7 及YOLOv8 模型.對比結(jié)果如表7 所示.PDM-YOLO 模型在PASCAL VOC 2007 公共數(shù)據(jù)集上的mAP0.5為70.9%,在PASCAL VOC 2012 公共數(shù)據(jù)集上的mAP0.5為71.1%,均高于YOLOv5~YOLOv8 模型組.PDM-YOLO 模型在PASCAL VOC 2007 公共數(shù)據(jù)集上的mAP0.5:0.95為49.0%,高于YOLOv5~YOLOv8 模型組,在PASCAL VOC 2012 公共數(shù)據(jù)集上的mAP0.5:0.95為49.6%,高于YOLOv5 和YOLOv6 模型,略低于YOLOv7 和YOLOv8 模型.綜合比較可知,PDMYOLO 模型在公共數(shù)據(jù)集上具有較高的檢測精度.
表7 不同模型在公共數(shù)據(jù)集上的檢測精度比較Tab.7 Comparison of detection accuracy of different models on public datasets
(1)針對現(xiàn)有煤礦井下無人駕駛軌道電機(jī)車因巷道環(huán)境惡劣導(dǎo)致障礙物識別精度低的問題,提出基于傳統(tǒng)YOLOv5 的PDM-YOLO 檢測模型.實驗結(jié)果表明,在自制障礙物檢測數(shù)據(jù)集上,PDMYOLO 模型的mAP 由原來的93.1%提高至96.3%,模型的檢測速度達(dá)到109.2 幀/s,在PASCAL VOC 2007 及PASCAL VOC 2012 公共數(shù)據(jù)集上具有較高的檢測精度.與現(xiàn)有的YOLO 系列模型相比,PDM-YOLO 模型具有更好的綜合檢測性能,在地質(zhì)復(fù)雜的煤礦巷道環(huán)境中能夠準(zhǔn)確地識別障礙物,模型具有較高的魯棒性.
(2)通過在傳統(tǒng)YOLOv5 的C3 模塊中引入部分卷積,構(gòu)建C3_P 特征提取模塊,使得模型的FLOPs 減小了2.9×109,模型的mAP 提高了2.6%,檢測速度提高了16.2 幀/s.
(3)模型采用改進(jìn)后的解耦頭,與傳統(tǒng)解耦頭相比,F(xiàn)LOPs 減少了19.8×109,檢測精度由93.1%提高至96.1%.采用解耦后的預(yù)測頭,能夠有效地提升模型的檢測精度,加速模型的收斂.
(4)當(dāng)采用優(yōu)化后的Mosaic 數(shù)據(jù)增強(qiáng)方法訓(xùn)練模型時,在沒有增加額外計算成本的情況下,模型的mAP 提高了0.1%.優(yōu)化后的Mosaic 數(shù)據(jù)增強(qiáng)豐富了訓(xùn)練樣本,有利于提高模型的識別精度.
本研究實現(xiàn)了無人駕駛電機(jī)車在復(fù)雜巷道環(huán)境下對障礙物的精準(zhǔn)實時檢測,為井下無人駕駛電機(jī)車的障礙物精準(zhǔn)識別提供有效的方法.由于井下巷道狹窄,攝像機(jī)獲取的畫面信息包含整個巷道斷面,模型會識別出畫面中包含的所有障礙物,造成電機(jī)車誤將相鄰軌道上運行的電機(jī)車以及軌道兩側(cè)處于安全區(qū)域內(nèi)的工人視為危險障礙物,導(dǎo)致電機(jī)車錯誤預(yù)警而頻繁啟停的問題.后期將深入研究如何建立有效的危險檢測區(qū)域,避免識別處于安全行駛區(qū)域內(nèi)的障礙物,對危險區(qū)域內(nèi)識別出的障礙物進(jìn)行距離估計,實現(xiàn)機(jī)車遠(yuǎn)距離鳴笛示警及近距離主動剎車的動作,進(jìn)一步保障煤礦無人駕駛電機(jī)車的安全持續(xù)運營.