程 鑫 褚雪汝 鄧旭暉 楊 凱 譚林林 陳 中 曹衛(wèi)國
(1東南大學(xué)軟件學(xué)院,南京 211189)(2東南大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,南京 211102)(3東南大學(xué)電氣工程學(xué)院,南京 210096)
電氣廠站接線圖紙作為發(fā)電廠、變電站施工布局和維護(hù)擴(kuò)建的重要工程依據(jù),是電力企業(yè)極具價(jià)值的文檔資產(chǎn).傳統(tǒng)廠站接線圖紙的維護(hù)、修改和更新主要依靠工作人員自身經(jīng)驗(yàn),這種工作方式不僅消耗大量的人力物力,使圖紙資料無法得到科學(xué)有效的管理與利用,同時(shí)也限制了電網(wǎng)智能化及數(shù)字化的進(jìn)程.大數(shù)據(jù)分析和計(jì)算機(jī)圖像處理技術(shù)在不斷改造傳統(tǒng)產(chǎn)業(yè)的同時(shí),也對(duì)傳統(tǒng)圖紙檔案管理模式提出了新的思路,即圖紙數(shù)字化歸檔[1-5].本文利用深度學(xué)習(xí)算法和形態(tài)學(xué)方法對(duì)電氣廠站接線圖進(jìn)行圖元符號(hào)的檢測(cè)識(shí)別,進(jìn)而得到圖元的類別名稱及其在圖紙上的準(zhǔn)確位置.這為后續(xù)廠站接線圖紙拓?fù)潢P(guān)系檢測(cè)并將其轉(zhuǎn)換為電氣廠站的數(shù)字化模型提供了信息基礎(chǔ).
近年來,國內(nèi)外已有學(xué)者嘗試將目標(biāo)檢測(cè)技術(shù)和圖像形態(tài)學(xué)方法應(yīng)用于圖紙和文檔的分析識(shí)別.Pacha等[6]使用Faster-RCNN、R-FCN和SSD等目標(biāo)檢測(cè)網(wǎng)絡(luò)對(duì)滑動(dòng)切割后的樂譜符號(hào)進(jìn)行檢測(cè)識(shí)別,但大型樂符的識(shí)別精度不高.Rahul等[7]首先使用傳統(tǒng)的圖像處理技術(shù)對(duì)管道進(jìn)出口進(jìn)行識(shí)別,然后利用深度學(xué)習(xí)方法對(duì)管道儀表流程圖中的符號(hào)和文本進(jìn)行檢測(cè),但個(gè)別符號(hào)的識(shí)別準(zhǔn)確率不高,只有64%.李昊等[8]使用Faster R-CNN模型、光學(xué)字符識(shí)別技術(shù)(OCR)進(jìn)行廠站接線圖中的電器元件檢測(cè)和文字識(shí)別,并利用跨平臺(tái)計(jì)算機(jī)視覺庫(OpenCV)的輪廓跟蹤技術(shù)實(shí)現(xiàn)連接線和拓?fù)潢P(guān)系的檢測(cè),之后使用改進(jìn)的圖匹配算法對(duì)廠站一次接線圖進(jìn)行匹配校核.
綜上所述,工程圖紙的識(shí)別分析已有一定研究基礎(chǔ),但小目標(biāo)檢測(cè)及樣本不均衡等問題尚在探索階段,已有方法未能較好地解決技術(shù)瓶頸.同時(shí),圖紙識(shí)別的應(yīng)用場(chǎng)景未涉及高分辨率電氣廠站接線圖.因此,本文設(shè)計(jì)一種基于YOLOv5算法的雙層-分塊檢測(cè)網(wǎng)絡(luò),用以處理和分析大尺寸高分辨率廠站接線圖.該網(wǎng)絡(luò)分為關(guān)鍵區(qū)域檢測(cè)層和具體圖元識(shí)別層,通過分層檢測(cè)的方法提高小目標(biāo)圖元符號(hào)的召回率和檢測(cè)的準(zhǔn)確率.
電氣廠站接線圖主要是指在發(fā)電廠、變電所、電力系統(tǒng)中,為滿足預(yù)定的功率傳送和運(yùn)行等要求而設(shè)計(jì)的、表明高壓電氣設(shè)備之間相互連接關(guān)系的傳送電能的電路圖.本文研究的數(shù)據(jù)集是一組JPG圖像格式的電氣廠站一次接線圖紙,共100張,圖片分辨率跨度較大,但是大多集中在1 500×1 000~8 000×6 500像素范圍內(nèi).選取一張典型圖紙,像素為4 092×2 019,如圖1所示.
為分析數(shù)據(jù)情況,對(duì)數(shù)據(jù)集中需要識(shí)別的11類圖元數(shù)量、圖元寬/高和尺寸大小進(jìn)行統(tǒng)計(jì),如表1所示.表中,圖元寬/高-最大面積和圖元寬/高-最小面積分別為每一類圖元面積最大和最小時(shí)的寬和高;圖元寬/高-平均為每一類圖元寬和高的平均值.表中圖元設(shè)備尺寸為大、中、小目標(biāo)的設(shè)定依據(jù)如下:①大目標(biāo)為圖元平均寬高乘積大于100×100.②中目標(biāo)為圖元平均寬高乘積小于等于100×100,且大于等于50×50.③小目標(biāo)為圖元平均寬高乘積小于50×50.
由圖1和表1可以看出:①圖紙電氣設(shè)備中,小目標(biāo)圖元占比高達(dá)54.55%,電容器、箭頭等極小圖元的尺寸不足原圖的2%,該特征會(huì)導(dǎo)致識(shí)別結(jié)果有較高的漏檢、誤檢率.②圖片分辨率較大,而圖元尺寸相對(duì)較小.特征提取時(shí),圖元部分特征會(huì)因網(wǎng)絡(luò)模型的圖片尺寸重置處理而丟失,同時(shí),多次采樣也會(huì)造成小目標(biāo)圖元數(shù)據(jù)殘缺.③母線結(jié)構(gòu)類似于長直線,長寬較其他圖元更為特殊,傳統(tǒng)的正方形結(jié)構(gòu)卷積網(wǎng)絡(luò)對(duì)母線處理不具有普適性.④不同圖元類別間樣本不均衡,斷路器、隔離開關(guān)及接地刀閘的數(shù)量遠(yuǎn)大于其他類,發(fā)電機(jī)和無功補(bǔ)償裝置的數(shù)量過少.網(wǎng)絡(luò)模型的訓(xùn)練會(huì)偏向于數(shù)量較多的目標(biāo),這將會(huì)導(dǎo)致發(fā)電機(jī)、無功補(bǔ)償裝置等圖元的精度極低.
不同設(shè)計(jì)院的圖元畫法不盡相同,每種圖元根據(jù)圖紙布局也有多種角度位置.以隔離開關(guān)為例,圖2展示了它的4種典型樣式,可以看出每種樣式均有較大差異,且與接地刀閘和斷路器特征類似,圖元像素經(jīng)過二值化處理后,難以區(qū)分.
(a) 樣式1
針對(duì)上述分析中多種類小目標(biāo)檢測(cè)問題和目標(biāo)特征類似問題,多采用指定尺寸的窗口滑動(dòng)切割原圖,并設(shè)有部分區(qū)域的重疊,將切割后圖片作為模型輸入,然后通過非極大值抑制(NMS)將結(jié)果過濾合并.此種方法多用于衛(wèi)星圖像這類超高分辨率圖片[9],但是本文研究的廠站接線圖分辨率低于衛(wèi)星圖像,且每張圖紙母線長短不一,圖1中母線的長度甚至超過了圖片寬度的70%.如果直接采用窗口滑動(dòng)切割,滑窗的尺寸及重疊部分難以設(shè)定.考慮到廠站接線圖的特殊性,本文的解決方法如下:①識(shí)別母線及其周圍圖元區(qū)域,確保母線圖元區(qū)中有且僅有一根母線(單母或雙母),同時(shí)提取相對(duì)獨(dú)立的變壓器區(qū).②在檢測(cè)出的母線圖元區(qū)和變壓器區(qū)中,對(duì)具體圖元進(jìn)行識(shí)別,其中母線根據(jù)長度及面積特性可以采用OpenCV形態(tài)學(xué)的方式單獨(dú)提取檢測(cè).
針對(duì)數(shù)據(jù)分析中不同圖元類別間樣本不均衡問題,可以增大難樣本與少類別的損失權(quán)重,從而增大模型對(duì)這些樣本的懲罰,緩解不均衡情況的發(fā)生.YOLOv5算法中有自適應(yīng)圖片采樣策略,可實(shí)現(xiàn)數(shù)目越多的種類權(quán)重越小的目的.
YOLOv5算法[10]是一種單階段目標(biāo)檢測(cè)算法,根據(jù)含有的殘差組件個(gè)數(shù)不同分為4個(gè)目標(biāo)檢測(cè)版本,分別為YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x.其中,YOLOv5s是網(wǎng)絡(luò)深度和特征圖寬度最小的網(wǎng)絡(luò),另外3個(gè)版本可以認(rèn)為是在其基礎(chǔ)上,進(jìn)行了加深、加寬.YOLOv5算法網(wǎng)絡(luò)結(jié)構(gòu)分為輸入層、骨干層、瓶頸層、預(yù)測(cè)層4個(gè)部分.
在輸入層使用馬賽克數(shù)據(jù)增強(qiáng)、自適應(yīng)錨框計(jì)算等方法對(duì)圖片進(jìn)行處理后送入骨干層,使用Focus模塊、跨階段局部融合模塊(CSP/C3)和空間金字塔池化模塊(SPP)完成特征提取.瓶頸層使用特征金字塔網(wǎng)絡(luò)(FPN)和路徑聚合網(wǎng)絡(luò)(PAN)結(jié)構(gòu)生成特征金字塔,以實(shí)現(xiàn)不同層次特征圖的融合.預(yù)測(cè)層根據(jù)瓶頸層網(wǎng)絡(luò)輸出的大、中、小特征圖,分別用于預(yù)測(cè)原圖的小、中、大目標(biāo).
與Faster R-CNN[11]等兩階段目標(biāo)檢測(cè)方法相比,YOLOv5網(wǎng)絡(luò)具有收斂速度快、泛化能力強(qiáng)、多尺度特征學(xué)習(xí)等特點(diǎn).本文研究的廠站接線圖數(shù)據(jù)集樣本較少,且圖元尺寸大小不一、相似度高、特征少,當(dāng)使用基于深度學(xué)習(xí)的方法檢測(cè)這些組件時(shí),恰好需要一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)來融合低分辨率特征圖和高分辨率特征圖,從而表示不同尺度圖元的位置和類別信息.因此,本文基于YOLOv5算法構(gòu)建雙層-分塊檢測(cè)網(wǎng)絡(luò)對(duì)廠站接線圖進(jìn)行分析識(shí)別.
本文采用分區(qū)域逐級(jí)檢測(cè)思想,構(gòu)建出基于 YOLOv5網(wǎng)絡(luò)的雙層-分塊檢測(cè)模型.圖3展示了檢測(cè)方法的工作流程,主要包括圖片預(yù)處理、雙層分塊檢測(cè)網(wǎng)絡(luò)和推理去重等部分.
圖3 雙層-分塊檢測(cè)方法工作流程
2.1.1 圖像增強(qiáng)處理
廠站接線圖存在一些小的噪點(diǎn),且部分圖元輪廓周圍有一定模糊區(qū)域,為改善圖像的視覺效果,提高圖像的清晰度,對(duì)圖像進(jìn)行高斯濾波.本文使用3×3的高斯卷積核進(jìn)行高斯濾波計(jì)算,對(duì)不同位置的像素賦予不同的權(quán)重.
2.1.2 灰度化和二值化
廠站接線圖屬于紅綠藍(lán)(RGB)三通道圖像,包含的像素信息數(shù)量較多,但后續(xù)識(shí)別的圖符主要基于紋理和形狀信息,顏色信息反而會(huì)增加圖符檢測(cè)時(shí)間.為減少計(jì)算量,提高運(yùn)算速度,首先將濾波平滑處理后RGB三通道的接線圖轉(zhuǎn)換為灰度的單通道圖像,再設(shè)定閾值將其轉(zhuǎn)化為二值圖像.其中灰度化使用的是加權(quán)平均法,公式如下:
G(i,j)=0.299r(i,j)+0.578g(i,j)+0.114b(i,j)
(1)
式中,G(i,j)為像素坐標(biāo)(i,j)處的灰度值;r(i,j)、g(i,j)、b(i,j)分別為原圖在(i,j)處紅、綠、藍(lán)3個(gè)分量的亮度值.
2.1.3 剪裁處理
廠站接線圖的分辨率跨度較大,可能會(huì)影響后續(xù)識(shí)別,且圖紙周圍一般會(huì)有邊框和大量白色像素,因此對(duì)大于8 000×6 000像素的圖片進(jìn)行邊框和二值化后白色像素的剪裁.
考慮到廠站接線圖屬于較高分辨率圖片,且區(qū)域檢測(cè)層中需要檢測(cè)的目標(biāo)屬于大目標(biāo),因此采用YOLOv5-P6網(wǎng)絡(luò),相較于上一版本增加了P6/64輸出層,且輸入圖片尺寸也從640×640像素增加到了1 280×1 280像素.考慮到需要檢測(cè)的關(guān)鍵區(qū)域塊只有母線圖元區(qū)和變壓器區(qū),所以采用網(wǎng)絡(luò)深度最小、特征圖寬度最小的YOLOv5s-P6網(wǎng)絡(luò).由于檢測(cè)的目標(biāo)種類少且尺寸較大,因此在原有網(wǎng)絡(luò)結(jié)構(gòu)4層特征圖的基礎(chǔ)上,刪除小目標(biāo)層以減少計(jì)算量.將刪除后的網(wǎng)絡(luò)結(jié)構(gòu)命名為Area-YOLOv5,如圖4所示.
2.3.1 滑窗切割
對(duì)母線圖元區(qū)和留白區(qū)進(jìn)行滑窗切割,剪裁切割步驟如下:
①滑窗大小設(shè)置為YOLOv5網(wǎng)絡(luò)輸入圖片尺寸640×640像素.
②分別對(duì)橫向位移和縱向步長設(shè)置dx、dy的偏移量,其中dx、dy為數(shù)據(jù)集中圖元最大尺寸.
③當(dāng)滑動(dòng)窗口中不存在任何待檢測(cè)目標(biāo)時(shí)則直接跳過.
④圖片長寬均不足640時(shí)則放棄切割,若只有一邊大于窗口大小時(shí),則在此方向上進(jìn)行切割.
⑤根據(jù)窗口與步長記錄切割圖的坐標(biāo)與長寬信息,方便后續(xù)圖元坐標(biāo)還原.
2.3.2 Obj-YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)
文獻(xiàn)[12]已經(jīng)驗(yàn)證了使用大卷積核可以提升模型性能和檢測(cè)的精度,因此考慮對(duì)原有YOLOv-5m網(wǎng)絡(luò)進(jìn)行如下改進(jìn):將瓶頸中3×3的小卷積也替換成卷積核為5×5的深度可分離大卷積,并且融合壓縮激勵(lì)(SE)注意力機(jī)制模塊來衡量通道的重要性,將此改進(jìn)部分稱為LC_Block模塊.將改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)命名為Obj-YOLOv5,如圖5所示,LC_Block模塊詳細(xì)示意圖如圖6所示.
LC_Block模塊使用深度可分離卷積并融合 SE注意力機(jī)制,在減少參數(shù)和計(jì)算量的同時(shí),通過SE注意力機(jī)制中的壓縮和激勵(lì)操作得到可以衡量通道重要性的權(quán)重矩陣對(duì)特征進(jìn)行重構(gòu).相比原始YOLOv5網(wǎng)絡(luò)中的CBS(Conv+BN+SiLU)卷積模塊,LC_Block模塊中的深度可分離卷積參數(shù)量更少,融合SE注意力模塊中用1×1的卷積層代替全連接層后,參數(shù)量略微增加.假設(shè)輸入特征圖尺寸為Win×Hin×Cin,輸出特征圖尺寸為Wout×Hout×Cout,模塊改進(jìn)前后參數(shù)量之比為
(2)
式中,MLC為LC_Block模塊參數(shù)量;MCBS為CBS普通卷積模塊參數(shù)量;k為卷積核的尺寸;C為特征圖通道數(shù),C=Cin=Cout;R為縮放參數(shù),起到減少通道個(gè)數(shù)從而降低計(jì)算量的作用.
圖5 Obj-YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)
圖6 LC_Block模塊示意圖
由于采用雙層-分塊網(wǎng)絡(luò)進(jìn)行模型推理,因此輸入的廠站接線圖將會(huì)經(jīng)歷分塊和切割操作.切割圖中的圖元坐標(biāo)為相對(duì)坐標(biāo),需要經(jīng)歷3次坐標(biāo)還原,具體步驟如下:
①將Obj_YOLOv5網(wǎng)絡(luò)推理計(jì)算出的圖元相對(duì)坐標(biāo)(xi,yi)加上圖元識(shí)別層切割圖的左上角坐標(biāo)(xj,yj),變?yōu)?xi+xj,yi+yj).
②將第1次還原后的坐標(biāo)加上Area_YOLOv5推理計(jì)算出的關(guān)鍵區(qū)域左上角坐標(biāo)(xz,yz),即為(xi+xj+xz,yi+yj+yz).
③將第2次還原后的坐標(biāo)進(jìn)一步還原到原圖中,還原后坐標(biāo)為(xi+xj+xz+xk,yi+yj+yz+yk).具體坐標(biāo)還原示意圖如圖7所示,圖中區(qū)域A為關(guān)鍵區(qū)域,區(qū)域B為切割圖,區(qū)域C為識(shí)別出的圖元符號(hào),虛線框?yàn)樽鴺?biāo)還原步驟.
圖7 坐標(biāo)還原示意圖
為了避免圖元被切割造成漏檢,在2.3.1節(jié)設(shè)置了大于最大圖元長寬的重疊區(qū)域,所以還原到原始圖像后會(huì)出現(xiàn)同一圖元有多個(gè)檢測(cè)框的情況.針對(duì)重復(fù)檢測(cè)問題,本文采用了改進(jìn)后的NMS算法,算法示意圖如圖8所示,具體步驟如下:
①設(shè)定最低閾值,刪除小于最低閾值的所有檢測(cè)框.
②計(jì)算一個(gè)檢測(cè)框與其他檢測(cè)框的交并比(IoU),公式為
(3)
式中,A、B為檢測(cè)出的2個(gè)邊框.
③如果IoU值大于設(shè)定的閾值,則進(jìn)行檢測(cè)框合并,閾值取高的標(biāo)簽,坐標(biāo)合并方式為取2個(gè)檢測(cè)框的坐標(biāo)最值,即圖8中點(diǎn)劃線框內(nèi)部分,即
(4)
否則保留檢測(cè)框,并重復(fù)上述步驟.式中,(xl,yl)和(xr,yr)分別為合并后檢測(cè)框的左上角和右下角坐標(biāo).
圖8 改進(jìn)后的NMS算法示意圖
與一般NMS算法不同的是,本文對(duì)IoU計(jì)算公式進(jìn)行了調(diào)整,將2個(gè)檢測(cè)框的交集面積與并集面積的比值改為2個(gè)檢測(cè)框的交集面積與檢測(cè)框最小面積的比值,如式(4)所示.原因在于對(duì)那些被截?cái)嗟膱D元,相鄰檢測(cè)框可能會(huì)重復(fù)誤識(shí)別,若除以相交面積IoU值較低,會(huì)導(dǎo)致本應(yīng)合并的檢測(cè)框被認(rèn)為是2個(gè)獨(dú)立圖元的檢測(cè)框,因此將除以檢測(cè)框合并面積改為除以檢測(cè)框最小面積.
本文采用某市變電站接線圖數(shù)據(jù)集,訓(xùn)練集與測(cè)試集的比值為9∶1.其中,第1層區(qū)域識(shí)別層的Area-YOLOv5訓(xùn)練集,由預(yù)處理后的電氣廠站接線圖構(gòu)成,標(biāo)簽信息為母線區(qū)域及變壓器區(qū)域;第2層具體圖元識(shí)別層的Obj-YOLOv5訓(xùn)練集,由母線區(qū)域切割圖、留白區(qū)域切割圖及變壓器區(qū)構(gòu)成,標(biāo)簽信息為11類圖元,即表1中不包含母線的10類圖元和其他類圖元,其他類圖元是指圖紙中的非關(guān)鍵圖元,為后續(xù)判斷拓?fù)潢P(guān)系提供便利.
本文實(shí)驗(yàn)環(huán)境為Windows 10操作系統(tǒng),32 GB內(nèi)存,NVIDIA GeForce RTX3090顯卡,AMD Ryzen 9 3900X 12-Core Porcessor處理器,在Pytorch 1.7.0、CUDA11.1下完成模型的搭建、訓(xùn)練和結(jié)果測(cè)試.
本文的Area-YOLOv5網(wǎng)絡(luò)和Obj-YOLOv5網(wǎng)絡(luò)模型參數(shù)如表2所示.
表2 模型參數(shù)
此外,本文使用平均精度(AP)、平均精度均值(mAP)、每秒幀數(shù)(FPS)、參數(shù)量來表征網(wǎng)絡(luò)改進(jìn)前后的有效性.其中,AP是P-R(準(zhǔn)確率-召回率)曲線與坐標(biāo)軸圍成的面積值,P-R曲線是以召回率和準(zhǔn)確率作為橫縱坐標(biāo)的二維曲線.將廠站接線測(cè)試圖像用上述網(wǎng)絡(luò)模型和參數(shù)進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果如圖9、圖10和表3、表4所示.表中,mAP@0.5為IoU等于0.5時(shí)的平均精度,mAP@0.5∶0.95為在不同IoU閾值(從0.5到0.95,步長為0.05)時(shí)的平均精度.
表3 Area-YOLOv5改進(jìn)前后檢測(cè)結(jié)果對(duì)比
表4 Obj-YOLOv5改進(jìn)前后檢測(cè)結(jié)果對(duì)比
(a) 改進(jìn)前
(a) 改進(jìn)前
由表3可知,Area-YOLOv5網(wǎng)絡(luò)刪去小目標(biāo)層后,模型參數(shù)量減少5.75%,速度從76.97幀/s增加到83.33幀/s,有8.33%的提升,mAP@0.5和mAP@0.5∶0.95為0.985和0.717,分別增加9.57%和5.29%,在提升速度的同時(shí)達(dá)到了較高的檢測(cè)精度和準(zhǔn)確度.分析可知,刪除小目標(biāo)層前的模型較復(fù)雜,但識(shí)別目標(biāo)簡(jiǎn)單且數(shù)據(jù)量較少,出現(xiàn)了過擬合現(xiàn)象.
由表4可知,Obj-YOLOv5網(wǎng)絡(luò)在瓶頸部分中將普通卷積替換成LC_Block模塊后,參數(shù)量減少6.48%,推理速度稍有增長,mAP@0.5變化不大,為0.963,但mAP@0.5∶0.95增加2.98%.從圖10可以看出,小目標(biāo)圖元的平均精度有一定增長,說明LC_Block模塊可以有效提升小目標(biāo)的檢測(cè)精度.
為進(jìn)一步說明本文構(gòu)建的雙層-分塊檢測(cè)網(wǎng)絡(luò)的有效性,將經(jīng)過2.1.1節(jié)和2.1.2節(jié)預(yù)處理后的數(shù)據(jù)集直接送入YOLOv5m網(wǎng)絡(luò)模型中進(jìn)行對(duì)比實(shí)驗(yàn).標(biāo)簽信息也為11類圖元,檢測(cè)結(jié)果如表5所示.
表5 雙層分塊檢測(cè)網(wǎng)絡(luò)使用前后圖元檢測(cè)結(jié)果對(duì)比
從表5可以看出,直接將大尺寸、高分辨率圖片送入YOLOv5m網(wǎng)絡(luò)模型對(duì)圖元的檢測(cè)識(shí)別效果較差,無法實(shí)現(xiàn)電氣廠站接線圖圖符的精確檢測(cè).而本文提出的基于YOLOv5算法的雙層-分塊檢測(cè)網(wǎng)絡(luò)模型充分考慮電氣廠站接線圖的布局特征,能夠有效解決電氣廠站接線圖圖符檢測(cè)精度不高、小目標(biāo)圖元符號(hào)漏檢誤檢等問題.
1)本文針對(duì)較高分辨率的電氣廠站接線圖識(shí)別檢測(cè)問題,構(gòu)建了基于YOLOv5算法的雙層-分塊檢測(cè)網(wǎng)絡(luò)模型,經(jīng)實(shí)驗(yàn)證明能夠有效提升多目標(biāo)和小目標(biāo)的檢測(cè)能力.
2)關(guān)鍵區(qū)域檢測(cè)層充分考慮了電氣廠站接線圖的布局特征,將高分辨率的圖片按電氣邏輯劃分成區(qū)域塊,方便后續(xù)圖元識(shí)別.在具體圖元識(shí)別層中,對(duì)YOLOv5算法進(jìn)行改進(jìn),在提高精度的同時(shí)減少了數(shù)據(jù)量,提升了運(yùn)行速度.
3)目前實(shí)驗(yàn)數(shù)據(jù)較少,同時(shí)忽略了廠站接線圖的部分圖元,缺乏普遍性,將對(duì)后續(xù)圖紙拓?fù)溥€原造成困擾.未來將對(duì)全國各省份設(shè)計(jì)院的廠站接線圖紙進(jìn)行分析識(shí)別,進(jìn)一步優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),提高圖元檢測(cè)精度.
4)本文在樣本類別不平衡問題上處理較簡(jiǎn)單,后續(xù)可以采用生成對(duì)抗神經(jīng)網(wǎng)絡(luò)的方式生成相似樣本,擴(kuò)充數(shù)據(jù)集,提高識(shí)別精度.