高 偉,郭美青,張興忠,劉 軍
(1. 國網(wǎng)山西省電力公司互聯(lián)網(wǎng)部,山西 太原 030000;2. 太原理工大學(xué)軟件學(xué)院,山西 晉中 030600)
保持電力設(shè)備安全穩(wěn)定的運行是系統(tǒng)運維的首要任務(wù),及時監(jiān)測設(shè)備的運行狀態(tài),能夠預(yù)防由設(shè)備缺陷或故障引起的電網(wǎng)事故發(fā)生。紅外熱成像技術(shù)具有非接觸、全天候監(jiān)測的特點,在電力系統(tǒng)運維的安全性、可靠性、經(jīng)濟性等方面具有明顯優(yōu)勢。但目前對電力設(shè)備紅外圖像的分析仍需依賴經(jīng)驗豐富的工程師[1],需消耗大量人力和時間成本,極大地降低了設(shè)備狀態(tài)監(jiān)測效率,因此基于紅外圖像的目標(biāo)檢測及應(yīng)用已成為當(dāng)前電力領(lǐng)域人工智能研究的熱點,而對目標(biāo)快速精確地定位是實現(xiàn)電力智能巡檢的前提和關(guān)鍵。
目前針對電力設(shè)備目標(biāo)定位的計算機視覺技術(shù)主要分為兩類:一類是基于圖像處理的檢測方法;另一類是基于深度學(xué)習(xí)的檢測方法[2]。基于圖像處理的檢測方法大多基于提取目標(biāo)的某些特征,或再輔以特征的訓(xùn)練得到特征分類器[3]。曾軍[4]等提出改進(jìn)的K-means算法對圖像進(jìn)行分割,然后結(jié)合SURF算法和感知哈希算法完成設(shè)備的定位。郭文誠[5]通過對電力設(shè)備提取Zernike矩特征,再應(yīng)用相關(guān)向量機分類器實現(xiàn)設(shè)備的分類識別。但是該類方法通過手動特征提取的方法與目標(biāo)特性緊密相關(guān),在應(yīng)用中具有一定的局限性,且檢測時間較長,人工無法短時間實現(xiàn)對大規(guī)模復(fù)雜設(shè)備特征進(jìn)行提取的設(shè)計工作,并不能滿足電網(wǎng)快速發(fā)展的需求[6]?;谏疃葘W(xué)習(xí)的目標(biāo)檢測方法在電力巡檢工作中的應(yīng)用,表現(xiàn)效果最好的還是以檢測少類目標(biāo)或背景簡單的目標(biāo)為主。劉子全[7]借鑒并改進(jìn)Mask-RCNN方法,利用圖像語義分割識別紅外圖像中的一個或多個電力設(shè)備,實現(xiàn)模型檢測精度的進(jìn)一步提高。黃銳勇[8]采用CenterNet結(jié)合結(jié)構(gòu)化定位的算法模型,從復(fù)雜的紅外圖像中以較高的準(zhǔn)確率將不同變電站設(shè)備及其部件識別定位。
相較于傳統(tǒng)的圖像處理方法,深度學(xué)習(xí)方法在檢測效果上既提高了精度又提高了速度,但在應(yīng)對復(fù)雜環(huán)境變化、精度、處理速度等方面仍需持續(xù)改進(jìn)[9]。因此,研究者們也逐漸將研究重點轉(zhuǎn)移到保證必要檢測精度的前提下盡可能提高檢測效率。YOLO系列算法以其又快又好的效果在學(xué)術(shù)及產(chǎn)業(yè)界全面風(fēng)靡,鄭含博[10]提出改進(jìn)YOLOv3的電力設(shè)備紅外目標(biāo)檢測模型,對設(shè)備快速精確地檢測定位;劉楊帆[11]提出改進(jìn)YOLOv4的空間紅外弱目標(biāo)檢測方法,滿足了空間紅外弱目標(biāo)檢測任務(wù)的需求。舒朗[12]提出Dense-Yolov5的網(wǎng)絡(luò)模型,提高了對紅外目標(biāo)尤其是特征不明顯的小目標(biāo)的識別效果。Huang X[13]等首次提出了PP-YOLOv2模型,在檢測速度和精度上均表現(xiàn)出了巨大優(yōu)勢,本文將該模型首次應(yīng)用于電力設(shè)備紅外圖像的目標(biāo)檢測。
研究發(fā)現(xiàn)原始模型存在幾個問題:模型高性能是根據(jù)自然圖像公開數(shù)據(jù)集中的目標(biāo)得到,電力場景下的紅外圖像與自然圖像存在較大差異,以往的目標(biāo)檢測算法沒有充分考慮到這種情況,導(dǎo)致檢測效果不理想,因此不完全適用于該目標(biāo)檢測任務(wù);深度學(xué)習(xí)方法需要大量的訓(xùn)練樣本,而復(fù)雜電力環(huán)境下獲取大量完備紅外圖像進(jìn)行分析的難度較高,因此對小樣本數(shù)據(jù)集下目標(biāo)檢測有一定難度[14]。針對以上問題,本文基于PP-YOLOv2,提出小樣本條件下的紅外圖像數(shù)據(jù)擴增方法Mix_Grid,增強模型的泛化能力及魯棒性;在特征提取階段,融合注意力機制,優(yōu)化主干網(wǎng)絡(luò),提高檢測精度;在模型訓(xùn)練損失函數(shù)部分,引入梯度均衡機制,解決正負(fù)樣本與難易樣本不平衡問題,提高對各類設(shè)備的識別能力。
本文建立的電力設(shè)備紅外圖像樣本數(shù)據(jù)庫,來源于運檢部門歷次采用FLIR_P630紅外熱像儀采集的紅外圖譜數(shù)據(jù),包括絕緣子、套管、電流互感器、斷路器、變壓器、電壓互感器、隔離開關(guān)等八種典型設(shè)備類型,圖像分辨率640×480。數(shù)據(jù)集經(jīng)篩選剔除后得到的總樣本數(shù)為594幅。每張圖像包含多個設(shè)備。該數(shù)據(jù)集是一個相對小型的數(shù)據(jù)集,圖像數(shù)量未達(dá)到充足和完善的工業(yè)檢測領(lǐng)域要求,為避免卷積網(wǎng)絡(luò)的過擬合問題,數(shù)據(jù)增強技術(shù)是解決該問題最有效的方法。部分樣本如圖1所示。
圖1 部分樣本圖
紅外圖像具有對比度較低、設(shè)備特征信息不明顯、各目標(biāo)特征差異集中在較小部位等特點,為保持對真實數(shù)據(jù)的良好了解,避免嚴(yán)重破壞特征的完整性,設(shè)計了一種快速、高效的數(shù)據(jù)增強方法Mix_Grid,主要通過多樣本數(shù)據(jù)增強方法與基于區(qū)域刪除的Gridmask方法的結(jié)合,一方面旨在關(guān)注樣本的顯著性區(qū)域,豐富被檢測目標(biāo)的背景,增加數(shù)據(jù)集的多樣性,另一方面有效加大訓(xùn)練難度,防止過擬合,在一定程度上增強網(wǎng)絡(luò)的泛化能力,使網(wǎng)絡(luò)具有更好的魯棒性。Mix_Grid方法流程如圖2。
圖2 Mix_Grid數(shù)據(jù)增強方法流程圖
首先,多樣本數(shù)據(jù)增強具體過程為:將圖像進(jìn)行灰度化與高斯濾波處理,去掉不必要的像素點;利用紅外圖像具有明顯的亮度特征,對其進(jìn)行Otsu閾值分割;采用DBSCAN算法對坐標(biāo)值進(jìn)行聚類,對其進(jìn)行圖像形態(tài)學(xué)處理,生成mask;兩張圖像分別與mask、1-mask相乘疊加的得到融合圖像。
其次,Graidmask[15]方法通過刪除圖像的信息來減少數(shù)據(jù)的過擬合,增強模型對圖像局部空間特征的學(xué)習(xí),降低模型的泛化能力,提高網(wǎng)絡(luò)魯棒性。相較于其它信息刪除方法,Graidmask通過簡單的網(wǎng)格掩碼,刪除均勻分布的正方形區(qū)域,以極低的計算預(yù)算,避免過度刪除圖像中的重要信息,又避免沒有刪除到目標(biāo)信息而不能起到增加網(wǎng)絡(luò)泛化能力的作用。實現(xiàn)過程如圖2右側(cè)所示,主要通過生成一個和原圖相同分辨率的mask,然后將mask與原圖相乘,得到特定區(qū)域信息刪除的新圖像。其中虛線框部分為基本的mask單元,(s,k)表示第一個mask單元離圖像邊緣的距離,t為保留圖像的比例,r為mask單元的邊長。
PP-YOLOv2模型主要包括特征提取網(wǎng)絡(luò)Backbone、特征融合網(wǎng)絡(luò)Neck和多尺度預(yù)測網(wǎng)絡(luò)Head三部分。首先模型選擇ResNet50vd-DCN作為骨干網(wǎng)絡(luò),ResNet50vd是擁有50個卷積層的ResNet-D網(wǎng)絡(luò),并即在ResNet的最后一個階段增加可變形卷積(Deformable Convolution,DCN),引入極少計算量而提高模型檢測精度。其次模型采用路徑聚合網(wǎng)絡(luò)(Path Aggregation Network,PANet)作為特征融合網(wǎng)絡(luò)。PANet避免了信息丟失問題,先進(jìn)行自頂向下的特征融合,再進(jìn)行自底向上的特征融合,使得底層信息更容易傳遞到頂層,拼接后的信息既包含底層特征也包含語義特征。在經(jīng)過PANet結(jié)構(gòu)后,輸出3維特征圖。Head部分使用卷積對其進(jìn)行編碼,然后將其經(jīng)過矩陣非極大抑制算法后處理,調(diào)整先驗框得到最終檢測結(jié)果。
數(shù)據(jù)集通過現(xiàn)場多種拍攝角度收集,可能存在溫度間界限不明顯、目標(biāo)輪廓模糊、背景干擾較為嚴(yán)重、被紅外探測設(shè)備顯示的實時數(shù)據(jù)遮擋,導(dǎo)致檢測難度較大等問題,此時算法的有效性和高效性尤為重要。PP-YOLOv2模型有較強的檢測能力,但它對紅外圖像沒有針對性,特征提取效果較差。針對PP-YOLOv2網(wǎng)絡(luò)對因受部分遮擋和紅外圖像信息較少而使設(shè)備目標(biāo)置信度較低、錯檢和漏檢等情況,本文優(yōu)化PP-YOLOv2模型,在特征提取階段,融合協(xié)調(diào)注意力機制[16](Coordinate Attention,CA),優(yōu)化主干網(wǎng)絡(luò),提高檢測精度;在模型訓(xùn)練損失函數(shù)部分,引入梯度均衡機制[17](gradient harmonizing mechanism,GHM)解決樣本不平衡問題,提高對設(shè)備特征的預(yù)測能力。最終該模型可在復(fù)雜背景下對相似目標(biāo)、遮擋目標(biāo)均具有很強的識別能力。改進(jìn)模型的結(jié)構(gòu)如圖3所示。
圖3 改進(jìn)的PP-YOLOv2網(wǎng)絡(luò)結(jié)構(gòu)
3.2.1 CA注意力模塊
原模型中采用通道注意力機制(Squeeze and excitation Network,SENet)[18]為各種深層卷積架構(gòu)帶來性能提升。但SENet只考慮內(nèi)部通道信息而忽略位置信息的重要性,位置信息對于生成空間選擇性注意力特征圖極其重要。與通常場景相比,復(fù)雜電力場景下的紅外目標(biāo)檢測中對位置預(yù)測的要求更高。而CA注意力模塊同時考慮了通道間關(guān)系和位置信息,不僅捕獲跨通道的信息,而且包含位置敏感的信息,因此模型能更準(zhǔn)確地識別并定位到目標(biāo)區(qū)域。且注意力機制消耗的顯存和計算量與輸入大小成倍增長,嵌入位置會影響模型訓(xùn)練和測試效率,因此為了不影響骨干網(wǎng)絡(luò)預(yù)訓(xùn)練參數(shù)的加載,本文僅在ResNet50_vd_dcn的最后三個卷積層添加CA模塊,特征提取網(wǎng)絡(luò)命名為ResNet50_vd_dcn_CA,通過把位置信息嵌入到通道注意力,從而使網(wǎng)絡(luò)獲取更豐富區(qū)域的語義信息,而避免引入更大的開銷,提升網(wǎng)絡(luò)獲取全局信息的能力,增強網(wǎng)絡(luò)對于目標(biāo)檢測任務(wù)的泛化能力,使其更加符合電力領(lǐng)域高準(zhǔn)確率和實時檢測的要求。CA注意力模塊結(jié)構(gòu)如圖4所示,其中r是一個縮放參數(shù),用于減少網(wǎng)絡(luò)的參數(shù)量和計算復(fù)雜度。其步驟可總結(jié)如下。
圖4 CA注意力模塊結(jié)構(gòu)
1)分別使用尺寸為(H,1)和(1,W)的池化核沿水平坐標(biāo)與垂直坐標(biāo)對輸入特征圖x的每個通道進(jìn)行編碼,分別得到兩個方向感知的特征輸出和,其計算公式如下
(1)
(2)
式中,w、h分別表示特征圖的寬高,c表示通道數(shù)。
2)對輸出特征和進(jìn)行連接操作,將空間信息在水平方向和垂直方向進(jìn)行編碼得到中間特征映射f。
f=δ(F1([zh,zw]))
(3)
式中,[,]為沿空間維數(shù)的連接操作,δ為非線性激活函數(shù),F1為卷積操作。
3)沿著空間維數(shù)將f分解為2個單獨的張量fh和fw。利用另外2個1×1卷積變換Fh和Fw,分別將fh和fw變換為具有相同通道數(shù)的張量,得到兩個方向?qū)?yīng)輸出。
th=σ(Fh(fh))
(4)
tw=σ(Fw(fw))
(5)
式中,σ是sigmoid激活函數(shù)。
4)最終得到經(jīng)過CA注意力機制模塊的輸出特征圖y。
(6)
3.2.2 損失函數(shù)
模型的損失函數(shù)由分類誤差、邊界框坐標(biāo)預(yù)測誤差、置信度誤差、用于學(xué)習(xí)預(yù)測框與真實框的損失函數(shù)四部分組成。研究發(fā)現(xiàn),自建數(shù)據(jù)集中存在類別間的正負(fù)樣本和難易樣本不均衡問題,如電流互感器與電壓互感器、斷路器與避雷器等設(shè)備輪廓特征相近,分類任務(wù)較困難,而變壓器、絕緣子等設(shè)備特征與其它設(shè)備外觀差異較大,較易分類。模型若直接進(jìn)行訓(xùn)練,對于正樣本中預(yù)測概率不高的,負(fù)樣本中預(yù)測概率較高的難分樣本,很難被正確分類。
目前解決樣本不平衡問題的方法,比如Focal loss[19],存在過多關(guān)注難分樣本,忽略樣本離群點從而影響檢測效果以及超參數(shù)需進(jìn)行大量實驗調(diào)整等問題。而GHM方法從梯度分布的角度考慮,表示難度不同樣本的不均衡性可體現(xiàn)在梯度模長的分布上,該梯度均衡化策略可優(yōu)化訓(xùn)練過程,進(jìn)而有效地改進(jìn)單階段檢測器的性能。因此本文將分類損失嵌入到GHM分類損失中,修正不同屬性樣本的梯度貢獻(xiàn),從而解決樣本不平衡問題,提高網(wǎng)絡(luò)對目標(biāo)正負(fù)樣本和難易樣本的判別能力。損失函數(shù)計算過程如下:
1)置信度誤差Lobj的計算公式如下
(7)
2)模型使用LIoU優(yōu)化真實框與預(yù)測框的交并比(Intersection OverUnion,IoU),計算過程如下
LIoU=1-IoU2
(8)
3)用于學(xué)習(xí)預(yù)測框與真實框的IoU的損失函數(shù)LIoU_aware計算公式如下
LIoU_aware=-(IoU*log(σ(s))
-(1-IoU)*log(1-σ(s))
(9)
式中,s為該預(yù)測分支的原始輸出。
4)原始模型的分類損失采用二進(jìn)制交叉熵表示,如下所示
(10)
利用GHM對分類損失函數(shù)進(jìn)行處理后得到最終分類損失LGHM_cls,通過交叉熵除以梯度密度,梯度密度大的損失會被抑制,減小簡單樣本和異常樣本的權(quán)重,且梯度密度由每次迭代計算所得,因此權(quán)值隨著訓(xùn)練動態(tài)改變適應(yīng),最終起到樣本均衡的作用。計算過程如下
p=sigmoid(x)
(11)
(12)
(13)
(14)
(15)
(16)
(17)
式中,x表示模型未經(jīng)過sigmoid激活函數(shù)之前的輸出,g為梯度的模長,GD為梯度密度,gn為第n個樣本的梯度模長,ε表示一段可微的距離,δε表示該樣本是否落在區(qū)間,lε表示區(qū)間長度。βn為梯度密度協(xié)調(diào)參數(shù)。
數(shù)據(jù)樣本量經(jīng)Mix_Grid方法擴充到1235張,包含3364個目標(biāo)。本文在構(gòu)建數(shù)據(jù)集時參考PASCAL VOC數(shù)據(jù)集的構(gòu)建方法,嚴(yán)格按照標(biāo)注規(guī)范對其進(jìn)行標(biāo)注,并劃分?jǐn)?shù)據(jù)集,其中訓(xùn)練集、驗證集、測試集占比分別為70%、10%、20%。各類別樣本分布情況見表1。
表1 數(shù)據(jù)集分布
操作系統(tǒng)為Linux ubuntu 18.04 LTS,Intel core i7-6800k CPU,采用paddle2.1.0、CUDA 10.1等環(huán)境搭建模型,運用搭載2塊GeForce GTX 2080Ti顯卡的服務(wù)器進(jìn)行模型訓(xùn)練等。利用平均檢測準(zhǔn)確率(mean Average Preci-sion,mAP)以及每秒幀數(shù)(Frame per Second,FPS)作為模型定量的評估指標(biāo),mAP從召回率和準(zhǔn)確率兩個角度來衡量算法的準(zhǔn)確性,是評價模型準(zhǔn)確性的直觀評價標(biāo)準(zhǔn);FPS為各模型在單塊2080Ti GPU上的推理速度。IOU>0.5被認(rèn)定為檢測成功。
訓(xùn)練過程中四個損失值隨迭代次數(shù)增加而變化的曲線如圖5。隨著訓(xùn)練輪次的增加,收斂速度較快,且誤差波動范圍逐漸縮小,當(dāng)?shù)螖?shù)到達(dá)800時,損失下降趨勢明顯變緩,且不再趨于降低。這表明模型達(dá)到較為理想的訓(xùn)練,訓(xùn)練過程中未出現(xiàn)過擬合現(xiàn)象。
圖5 訓(xùn)練過程中損失曲線
4.4.1 數(shù)據(jù)增強方法對比
為了驗證本文所提數(shù)據(jù)增強方法Mix_Grid的有效性與實用性,將Mix_Grid、典型多樣本數(shù)據(jù)增強方法Mixup[20]、Cutmix[21],信息刪除數(shù)據(jù)增強方法RErase[22]、Gridmask與二階段目標(biāo)檢測算法Faster R-CNN[23]、Cascade R-CNN[24]、一階段目標(biāo)檢測算法YOLOv4[25]、YOLOv5[26]、PP-YOLOv2進(jìn)行結(jié)合。數(shù)據(jù)增強方法在數(shù)據(jù)集上的應(yīng)用效果如圖6。
圖6 不同數(shù)據(jù)增強方法效果
檢測結(jié)果對比如圖7。圖中橫軸“+”表示在模型基礎(chǔ)上所使用的技術(shù)。結(jié)果顯示,分別結(jié)合不同的數(shù)據(jù)增強方法后,模型性能均有所提高,mAP漲點從2.1%~2.6%不等。此外,Mix_Grid方法表現(xiàn)最佳,對于分類精度提升具有極大的推動作用。分析其原因可能是RErase隨機選取掩碼區(qū)域,容易出現(xiàn)對重要部位全掩蓋的情況;Mixup需在樣本間進(jìn)行插值,抑制了模型學(xué)習(xí)特定特征的能力;CutMix選取一個固定的矩形區(qū)域,較容易覆蓋重要區(qū)域。Gridmask可避免此類問題,因此也證明了所提方法中選擇Gridmask的可行性。最終結(jié)果表明,Mix_Grid結(jié)合多樣本數(shù)據(jù)增強方法與信息刪除方法后,既為紅外圖像的目標(biāo)檢測提供了數(shù)據(jù)來源,又可以與不同目標(biāo)檢測方法相結(jié)合,有效提升檢測精度,從而驗證了本方法的先進(jìn)性與可行性,應(yīng)用于小型數(shù)據(jù)集對提高模型檢測的精度有一定積極作用。
圖7 模型與增強方法結(jié)合的檢測結(jié)果
4.4.2 主流實時檢測模型性能對比
為了驗證本文模型的有效性,本部分將上述主流模型和本文提出的模型在經(jīng)過數(shù)據(jù)擴充后的數(shù)據(jù)集上進(jìn)行實驗評估,并討論實驗結(jié)果。本文方法無論是在mAP還是預(yù)測速度上,本文算法表現(xiàn)均優(yōu)于其它模型。對比PP-YOLOv2,本文方法mAP提升了2.3%,推理速度僅僅相差1FPS,雖增加了極少的計算量,仍滿足目標(biāo)檢測任務(wù)中高精度與良好實時性的要求。實驗結(jié)果見表2。
表2 主流目標(biāo)檢測方法性能對比
4.4.3 不同改進(jìn)策略實驗對比
為研究每種改進(jìn)策略產(chǎn)生的性能增益,以PP-YOLOv2模型為基礎(chǔ)網(wǎng)絡(luò),逐步添加CA模塊和GHM策略,并分別計算在擴充數(shù)據(jù)集上的mAp和FPS。模型分別引入CA模塊和GHM機制后,均帶來檢測精度的性能增益,同時添加CA模塊與GHM機制后,模型檢測精度提升更大,說明兩種改進(jìn)策略聯(lián)合應(yīng)用檢測效果要優(yōu)于單一改進(jìn)的檢測效果,且綜合考慮方法檢測精確度的提升與用時,模型足夠適用于高精度與速度要求的紅外圖像電力設(shè)備檢測場景。實驗結(jié)果見表3。
表3 消融實驗測試結(jié)果
4.4.4 與基準(zhǔn)方法對比
改進(jìn)模型與原始模型檢測的8類設(shè)備的PR曲線對比如圖8,進(jìn)一步比較不同算法之間的性能差異。可以看出改進(jìn)模型在擴充數(shù)據(jù)集上各類別的整體檢測效果優(yōu)于原始模型。其中電流互感器、斷路器、避雷器3類設(shè)備AP結(jié)果提升較高,說明了本文方法不僅可以提升目標(biāo)特征提取的效果,對這種設(shè)備輪廓相似的組件也有較好的檢測效果,改進(jìn)策略在模型整體檢測效果上都起到了正向增益效果,有效緩解了復(fù)雜場景下引起的紅外目標(biāo)難檢測問題。
圖8 不同檢測識別模型的PR曲線
本文增加可視化實驗來對比原始算法與改進(jìn)算法在實際檢測時的效果。從數(shù)據(jù)集中選取具有代表性的四幅圖:選取圖像溫度場顯著,設(shè)備邊界清晰、少目標(biāo)的樣本時,兩模型檢測準(zhǔn)確率均較高,而改進(jìn)模型檢測目標(biāo)的置信度處在較高水平,對目標(biāo)的檢測畫框會更精準(zhǔn)些;選取存在目標(biāo)密集重疊、遮擋嚴(yán)重等情況的樣本,PP-YOLOv2出現(xiàn)的錯檢和漏檢情況明顯多于改進(jìn)模型;選取存在失真、分辨率低、存在邊緣模糊的小目標(biāo)情況下的樣本,PP-YOLOv2出現(xiàn)小目標(biāo)漏檢現(xiàn)象,而改進(jìn)模型對特征不明顯的小目標(biāo)檢測效果好很多;選取稍遠(yuǎn)距離拍攝,存在多種因被遮擋而關(guān)鍵區(qū)域信息缺失的設(shè)備的樣本,此時PP-YOLOv2出現(xiàn)了誤檢與漏檢,比如將隔離開關(guān)的一部分誤識別為套管,在加引入CA模塊和GHM策略后,模型對這種干擾情況能夠得到一定程度的改善??傊?改進(jìn)方法在絕大多數(shù)場景下的檢測準(zhǔn)確度高于基準(zhǔn)算法,表明改進(jìn)方法在保證檢測效果的前提下適用于多種場景的紅外圖像目標(biāo)檢測任務(wù)。對比結(jié)果如圖9。
圖9 不同模型對同組圖像的檢測效果對比
針對復(fù)雜電力場景下對紅外目標(biāo)檢測任務(wù)中存在的目標(biāo)重疊、相似度高、部分遮擋以及目標(biāo)樣本稀缺、算法檢測精度與速度不高等問題,本文提出了一種基于數(shù)據(jù)增強和樣本均衡的電力設(shè)備紅外圖像檢測模型。實驗表明,所提數(shù)據(jù)增強方法可應(yīng)用于小樣本數(shù)據(jù)集,對提高模型檢測的精度有一定積極作用,且改進(jìn)模型在擴充數(shù)據(jù)集上mAP值達(dá)到93.15%,檢測速度達(dá)66FPS,優(yōu)于基準(zhǔn)方法PP-YOLOv2,有效緩解復(fù)雜場景下多設(shè)備引起的難檢測問題,能夠滿足電力場景紅外圖像目標(biāo)檢測任務(wù)的高精度與實時性需求。