陸志欣,田涵寧,郭國(guó)偉
(廣東電網(wǎng) 佛山供電局,廣東 佛山 528000)
變壓器作為電網(wǎng)“變電”和“配電”環(huán)節(jié)的核心電器設(shè)備,保證其安全穩(wěn)定運(yùn)行意義重大[1]。當(dāng)前變壓器主要分兩種:干式變壓器[2]和油浸式變壓器[3],油浸式變壓器因制作工藝簡(jiǎn)單、造價(jià)成本低、環(huán)境適應(yīng)性強(qiáng)、壽命長(zhǎng)等優(yōu)點(diǎn),而被廣泛應(yīng)用,尤其是在特高壓線路和低壓戶外場(chǎng)景。油浸式變壓器相較于干式變壓器,最大的區(qū)別就是油浸式變壓器為實(shí)現(xiàn)散熱和絕緣功能,內(nèi)部含有大量的介質(zhì)液體“油”,俗稱變壓油,是變壓器的重要工作介質(zhì),能起到冷卻和滅弧等保護(hù)作用。
而在變壓器的工作過(guò)程中因質(zhì)量、安裝運(yùn)輸、工作環(huán)境和負(fù)荷多方面原因會(huì)造成電網(wǎng)變壓器油液滲漏[4],不僅影響了變壓器散熱效率,而且導(dǎo)致水分進(jìn)入、絕緣強(qiáng)度下降,從而引起絕緣擊穿、繞組燒毀等事故,將嚴(yán)重威脅電網(wǎng)的正常運(yùn)行。
為減少電網(wǎng)變壓器油液滲漏情況的出現(xiàn),電網(wǎng)工作人員會(huì)定期對(duì)變壓器進(jìn)行巡檢,但因人力成本的原因,巡檢頻率較低,一般為月檢或季檢,無(wú)法實(shí)現(xiàn)全天候地對(duì)變壓器進(jìn)行監(jiān)測(cè)。
近年來(lái),電網(wǎng)的重要設(shè)備周邊都部署了監(jiān)控?cái)z像頭,如何利用計(jì)算機(jī)視覺(jué)技術(shù)實(shí)時(shí)監(jiān)測(cè)設(shè)備運(yùn)行狀態(tài),減少巡檢人力資源的消耗和保障巡檢人員的安全成為電網(wǎng)的迫切需求。
目前常用于電網(wǎng)設(shè)備監(jiān)測(cè)的計(jì)算機(jī)視覺(jué)方法主要分為兩種:一是基于機(jī)器學(xué)習(xí)的圖像處理方法,通過(guò)分析應(yīng)用場(chǎng)景下圖像的自有屬性特征如顏色、輪廓、大小、紋理形狀等人為設(shè)計(jì)特征[5-7],分析出圖像的標(biāo)志性的信息,標(biāo)記和識(shí)別出圖像內(nèi)容,最后通過(guò)分類器分類。此類方法特征提取簡(jiǎn)單,計(jì)算量較小,在某些單一場(chǎng)景下表現(xiàn)優(yōu)秀,但也受限于人工設(shè)計(jì)特征提取方法的局限性,在現(xiàn)實(shí)復(fù)雜場(chǎng)景下,易受復(fù)雜背景、光照亮度等影響和干擾,方法的魯棒性較差,可用性不強(qiáng);二是基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法,通過(guò)遷移當(dāng)前廣泛應(yīng)用于通用領(lǐng)域具有優(yōu)異性能的目標(biāo)檢測(cè)算法,如SSD(Single Shot multi-boxes Detector)[8]、YOLO(You Only Look Once)[9-13]、Retina Net[14]、Faster RCNN(Region Convolution Neural Network)[15-16]、Mask RCNN[17-18]等主流目標(biāo)檢測(cè)方法,將電網(wǎng)設(shè)備正常運(yùn)行狀態(tài)和異常狀態(tài)作為兩個(gè)不同目標(biāo)來(lái)檢測(cè),但這類目標(biāo)檢測(cè)算法都采用卷積網(wǎng)絡(luò)模型作為主干網(wǎng)絡(luò)如VGG[19]、Residual Net[20]、Dense Net[21]等分類模型實(shí)現(xiàn)特征提取,其出發(fā)點(diǎn)是卷積結(jié)構(gòu)在視覺(jué)圖像處理中擁有較好的空間局部偏置歸納性,可以幫助模型較好地提取局部特征和模型學(xué)習(xí),但是局部偏置歸納的特性也限制了模型的全局感知能力和性能。
隨著Transformer[22]的提出,Transformer結(jié)構(gòu)在自然語(yǔ)言處理領(lǐng)域有著廣泛的應(yīng)用,且表現(xiàn)非凡。ViT[23]將Transformer引入到圖像處理領(lǐng)域,并取得了超越卷積神經(jīng)網(wǎng)絡(luò)的性能。Transformer結(jié)構(gòu)可以實(shí)現(xiàn)長(zhǎng)距離跨度的相似度或關(guān)聯(lián)度學(xué)習(xí),實(shí)現(xiàn)全局的信息感知,可以有效地提升模型的表現(xiàn)。但圖像的數(shù)據(jù)維度較高,進(jìn)行高分辨率下的推理計(jì)算復(fù)雜度高,且優(yōu)化較不穩(wěn)定。為了加快推理速度,且進(jìn)一步提升模型的性能,Mehta等人[24]提出了Mobile-ViT提出一種輕量級(jí)的ViT分類網(wǎng)絡(luò)模型,保證了較低計(jì)算量的同時(shí)也兼顧了卷積和Transformer的特性。
為了進(jìn)一步實(shí)現(xiàn)對(duì)電網(wǎng)變壓器油液滲漏快速且準(zhǔn)確的檢測(cè),本文提出了一種改進(jìn)YoloV4的電網(wǎng)變壓器油液滲漏檢測(cè)方法。本文貢獻(xiàn)主要有以下幾點(diǎn):
1)本文提出了一種改進(jìn)YoloV4的網(wǎng)絡(luò)模型,使用Mobile-ViT作為模型的骨干結(jié)構(gòu),利用卷積和Transformer有效地提取目標(biāo)的局部和全局信息特征,降低了計(jì)算量。
2)本文在改進(jìn)YoloV4模型的基礎(chǔ)上,針對(duì)性地提出了一種多尺度特征融合方法,實(shí)現(xiàn)了局部和全局信息的多尺度特征融合,增強(qiáng)了上下文語(yǔ)義表達(dá),有效提升算法的檢測(cè)精度。
3)本文提出一種改進(jìn)YoloV4的電網(wǎng)油液滲漏檢測(cè)方法及整體系統(tǒng)架構(gòu),同時(shí)構(gòu)建了電網(wǎng)油液滲漏相關(guān)數(shù)據(jù)集。
針對(duì)電網(wǎng)變壓器油液滲漏實(shí)際應(yīng)用需求,本文設(shè)計(jì)了一種油液滲漏檢測(cè)系統(tǒng),系統(tǒng)的總體結(jié)構(gòu)如圖1所示。主要包含有攝像終端,邊緣推理,云端數(shù)據(jù)和運(yùn)維中心等4個(gè)部分。
其中攝像終端一般指包含有高清攝像頭,通過(guò)攝像頭實(shí)現(xiàn)對(duì)目標(biāo)24小時(shí)的監(jiān)控成像,獲取高分辨率圖像數(shù)據(jù)。
邊緣推理設(shè)備包含有硬件部分和軟件部分。其中硬件采用Atlas 200DK,主板芯片為昇騰310,內(nèi)存規(guī)格為L(zhǎng)PDDR4X 8G,支持16路H.264硬件解碼,功耗為20 W。軟件部分包含有Linux-18.04操作系統(tǒng),Mind Spore推理框架。通過(guò)將圖像進(jìn)行模型處理后得到輸出結(jié)果,將輸出結(jié)果與圖像通過(guò)網(wǎng)絡(luò)同時(shí)輸入到云端。
云端服務(wù)器包含有兩個(gè)方向的信息處理:一方面為接收邊緣設(shè)備的數(shù)據(jù)和預(yù)測(cè)結(jié)果。將獲取的圖像數(shù)據(jù)進(jìn)行存儲(chǔ)和進(jìn)一步標(biāo)注后的模型訓(xùn)練。云端服務(wù)器也可以將數(shù)據(jù)和指令傳輸給邊緣服務(wù)器實(shí)現(xiàn)模型的遠(yuǎn)程部署和更新等相關(guān)任務(wù)。另一方面服務(wù)器可以接收和反饋運(yùn)維中心的指令,運(yùn)維中心通過(guò)下達(dá)指令可以調(diào)控和管理云端的數(shù)據(jù)存儲(chǔ)、標(biāo)注、模型訓(xùn)練及模型遠(yuǎn)程部署等相關(guān)任務(wù)。此外,云端服務(wù)器會(huì)將檢測(cè)結(jié)果直接反饋給運(yùn)維中心,并進(jìn)行相應(yīng)的處理結(jié)果提示。
通過(guò)基于深度學(xué)習(xí)的智能監(jiān)控系統(tǒng)可以有效地實(shí)現(xiàn)變壓器油液滲漏的24小時(shí)的遠(yuǎn)程全天候的監(jiān)管、訓(xùn)練和升級(jí),這大大地提升了電網(wǎng)的智能化水平,有效地降低工作量,降低人力成本,提高系統(tǒng)的工作效率。本系統(tǒng)的核心部分為基于深度學(xué)習(xí)的模型檢測(cè)算法。
YoloV4目標(biāo)檢測(cè)算法結(jié)構(gòu)主要可分為3部分,主干網(wǎng)絡(luò)、頸部結(jié)構(gòu)和預(yù)測(cè)層3部分構(gòu)成,如圖2所示。
圖2 YOLOV4模型結(jié)構(gòu)
其主干網(wǎng)絡(luò)采用CSPdarknet-53網(wǎng)絡(luò)模型作為特征提取模型;從主干網(wǎng)絡(luò)中獲取3個(gè)特征尺度經(jīng)過(guò)頸部層進(jìn)行信息的整合,預(yù)測(cè)層在整合后的特征上進(jìn)行目標(biāo)預(yù)測(cè)。CSPdarknet-53是一個(gè)純卷積的網(wǎng)絡(luò)結(jié)構(gòu),其提取的特征信息具備較強(qiáng)的空間歸納偏置;此外,CSPdarknet-53在深層尾部結(jié)構(gòu)中增加了SPP(spatial pyramid pooling)結(jié)構(gòu),一方面,有利于擴(kuò)大對(duì)全局信息的感知。盡管如此,但卷積結(jié)構(gòu)缺乏足夠的全局信息獲取以及不同位置之間的相似關(guān)聯(lián)度感知用以目標(biāo)預(yù)測(cè),導(dǎo)致基于YoloV4的目標(biāo)檢測(cè)算法對(duì)液面和陰影的檢測(cè)效果不佳。此外,CSPdarknet-53網(wǎng)絡(luò)結(jié)構(gòu)的計(jì)算復(fù)雜度相對(duì)較高,在邊緣設(shè)備上推理速度較慢。
頸部結(jié)構(gòu)采用PA Net結(jié)構(gòu),通過(guò)多尺度聚合不同尺度的特征用以融合多尺度上下文信息,對(duì)增強(qiáng)特征表達(dá)具有一定的效果。但是此結(jié)構(gòu)特征層次串聯(lián)度嚴(yán)重,耦合程度較高,淺層的特征需深層網(wǎng)絡(luò)依次上采樣后融合處理。再將獲取到的融合特征送入預(yù)測(cè)層進(jìn)行特征預(yù)測(cè)。此結(jié)構(gòu)不利于并行計(jì)算,拖慢了檢測(cè)推理速度。
預(yù)測(cè)層包含了分類、坐標(biāo)回歸和置信度3種預(yù)測(cè)分支用于頸部結(jié)構(gòu)輸出特征的檢測(cè)與分類。
針對(duì)上述問(wèn)題和實(shí)際需求,為進(jìn)一步提升YoloV4算法在電網(wǎng)變壓器油液滲漏的檢測(cè)性能。本文設(shè)計(jì)了一種改進(jìn)YoloV4的油液檢測(cè)模型,其結(jié)構(gòu)如圖3所示。本部分將從主干網(wǎng)絡(luò)、頸部結(jié)構(gòu)、預(yù)測(cè)層3部分詳細(xì)介紹其結(jié)構(gòu)。
圖3 改進(jìn)YOLOV4模型結(jié)構(gòu)。
1.3.1 主干網(wǎng)絡(luò)
為了改善原有CSPdarknet-53卷積模型對(duì)全局信息感知的不足和加快推理速度。改進(jìn)的YoloV4模型引入Mobile-ViT結(jié)構(gòu)代替原有CSPdarknet-53作為主干網(wǎng)絡(luò)。Mobile-ViT模型由MobileNetV2區(qū)塊和Mobile-ViT區(qū)塊堆疊構(gòu)成,去除分類任務(wù)帶有的1×1卷積層、全局平均池化層和全連接層。其具體結(jié)構(gòu)如表1所示。
表1 主干網(wǎng)絡(luò)(Mobile-ViT)結(jié)構(gòu)表
其中:MV2表示MobileNetV2區(qū)塊,S1、S2表示Stride為1和2,MViTBlock表示Mobile-ViT區(qū)塊,LX表示Transformer的層數(shù)為x層。
此外,由于Transformer結(jié)構(gòu)計(jì)算復(fù)雜度高,基于低分辨率下的特征處理有利于提升模型的運(yùn)算速度。下面將詳細(xì)介紹MobileNetV2區(qū)塊和Mobile-ViT區(qū)塊結(jié)構(gòu)。
1)MobileNetV2區(qū)塊:
MobileNetV2區(qū)塊采用深度可分離卷積有效地降低了卷積的運(yùn)算復(fù)雜度和可訓(xùn)練參數(shù)數(shù)量,極大地提高了模型的推理速度。
通過(guò)1×1的卷積實(shí)現(xiàn)特征維度的升維,緩解狹窄維度會(huì)降低信息流形特征傳遞的問(wèn)題,采用3×3的深度可分離卷積提取表達(dá)特征,再采用1×1的卷積還原其輸入維度。在本網(wǎng)絡(luò)中包含有兩種類型的MobileNetV2區(qū)塊結(jié)構(gòu),如圖4所示。步長(zhǎng)S取值為1的區(qū)塊結(jié)構(gòu)如圖4(a)所示,采用殘差連接,防止反向傳播時(shí)梯度消失,其輸入輸出特征尺度保持不變;步長(zhǎng)S取值為2的區(qū)塊結(jié)構(gòu)如圖4(b)所示,用于降低特征尺度,實(shí)現(xiàn)特征下采樣。
2)Mobile-ViT區(qū)塊:
受限于Transformer處理需要二維線性數(shù)據(jù)流,因此,需將輸入的三維特征轉(zhuǎn)換為二維數(shù)據(jù)進(jìn)行Transformer處理,將處理后輸出進(jìn)行維度還原回復(fù)空間維度。因此,Mobile-ViT區(qū)塊包含了展開(kāi)、Transformer層和折疊等三部分組成。其具體結(jié)構(gòu)如圖5所示。
圖5 Mobile-ViT區(qū)塊結(jié)構(gòu)
展開(kāi)部分,輸入特征先后經(jīng)過(guò)3×3和1×1的卷積,得到尺度為特征F將F劃分成N塊patches,每塊為Fs,其具體表達(dá)如公式(1)所示:
(1)
將Fs∈(h×w×d)按照h,w維度進(jìn)行壓平,得到Fp∈(p×d),其具體表達(dá)式如式(2)所示:
(2)
式中,p=w×h;FP表示展開(kāi)后的特征;FS表示split后的特征。
然后,經(jīng)過(guò)Transformer層部分的處理,F(xiàn)S(N,h,w,d)轉(zhuǎn)變?yōu)镕P(N,p,d),此部分展開(kāi)處理與原有的不同,會(huì)將h,w,d三個(gè)特征維度進(jìn)行壓縮,得到二維的特征。然而本區(qū)塊展開(kāi)后的特征Fp為三維特征。在本區(qū)塊中,將得到的特征輸入FP進(jìn)行按n次拆分輸入Transformer的處理結(jié)構(gòu)中,其結(jié)構(gòu)如圖6所示。
圖6 Transformer結(jié)構(gòu)
輸入特征拆分為p1…pn,F(xiàn)pi∈(N×1×d),其中1≤i≤n;Fpi經(jīng)過(guò)線性層得到FQ,F(xiàn)K,F(xiàn)V∈(nxd)共3個(gè)特征,將d分成j組,每組為dk個(gè)進(jìn)行多個(gè)注意力處理。其表達(dá)式如公式(3)所示:
(3)
式中,Z表示元素個(gè)數(shù),×表示矩陣乘法,σ表示Softmax函數(shù);Ft∈(NxN)。
將得到的Ft與Fv矩陣相乘得到Fa′,再將特征聯(lián)合其它多頭得到Fa。其表達(dá)如公式(4)、(5)所示:
Fa′ =Ft×Fv
(4)
Fa=Concat(Fa′)
(5)
式中,F(xiàn)t∈(NxN)表示Q特征,F(xiàn)v∈(Nxdk)為V特征,表示分組特征分為j組,每組數(shù)量為dk,F(xiàn)a∈(N,d)表示注意力特征,Concat表示融合層;
將Fa通過(guò)激活層和兩層線性層得到Fout,其具體表達(dá)式如式(6)和式(7)所示,通過(guò)聚合n層輸入折疊層。
Fpi=FFN(GeLU(Fa))
(6)
FP=Concat(Fpi)
(7)
式中,F(xiàn)pi∈(Nxd)表示;FFN(·)表示兩層線性層,GeLU表示高斯誤差線性激活層。
在原有的Tran sformer自注意力結(jié)構(gòu)需要與0特征圖里面每個(gè)區(qū)域進(jìn)行相似關(guān)聯(lián)度計(jì)算,如圖7(a)所示。但在本文中,Transformer中每個(gè)patch采用了p=w×h分塊操作,并分別進(jìn)行注意力特征計(jì)算,由于patch在輸入之前進(jìn)行了3×3的卷積核計(jì)算,而每個(gè)patch的w和h的選取都為2,小于3。如圖7(c)所示。patch中的元素可以選擇只與相同位置的元素進(jìn)行相似度計(jì)算。而不需要像Transformer一樣對(duì)所有的位置進(jìn)行計(jì)算,一定程度上提升了Transformer推理的速率,如圖7(b)所示。
圖7 Transformer自注意力機(jī)制對(duì)比
折疊層部分與展開(kāi)層剛好相反,將展開(kāi)的部分還原成三維特征,如圖5所示。其具體的表達(dá)式如式(8)和式(9)所示:
(8)
(9)
式中,符號(hào)表達(dá)與式(1)和式(2)中的一致,并先后經(jīng)過(guò)1×1卷積和3×3卷積得到輸出特征,其表達(dá)如式(10)所示:
F=Conv3×3(Conv1×1(F))
(10)
式中,F(xiàn)表示特征,Conv3×3表示3×3卷積,Conv1×1表示1×1卷積操作。
1.3.2 頸部結(jié)構(gòu)
頸部結(jié)構(gòu)可分為特征融合層和特征金字塔層兩個(gè)模塊。特征融合層分別從主干網(wǎng)絡(luò)中多個(gè)特征尺度上獲取卷積特征和Transformer自注意力特征;特征金字塔層通過(guò)采用并行的雙層金字塔結(jié)構(gòu)實(shí)現(xiàn)特征多尺度運(yùn)算,如圖2所示。
特征融合層分別從主干網(wǎng)絡(luò)的3個(gè)特征尺度上引出一組卷積特征和Transformer自注意力特征,將提取的特征分別經(jīng)過(guò)1x1的卷積層進(jìn)行特征聯(lián)合得到多尺度特征。
特征金字塔層可分為兩層:第一層是上采樣過(guò)渡層,第二層為下采樣過(guò)渡層。在上采樣過(guò)渡層中,將輸入的多尺度特征并行通過(guò)上采樣與淺層特征進(jìn)行相加融合,其融合的過(guò)程為:深層特征采用雙線性插值的方式實(shí)現(xiàn)2x上采樣后,結(jié)合1×1的卷積與淺層特征實(shí)現(xiàn)通道維度對(duì)齊;淺層特征通過(guò)1×1的卷積層與上采樣后的深層特征通過(guò)對(duì)應(yīng)元素相加的方式融合。
在下采樣過(guò)渡層中,將淺層特征通過(guò)下采樣與深層特征進(jìn)行融合,下采樣過(guò)渡層中的淺層特征采用2×2的不重疊平均池化層實(shí)現(xiàn)特征下采樣。其余操作與上采樣過(guò)渡層基本相同。
與原有算法相比,特征融合層整合了卷積特征和Transformer自注意力特征,有利于整合局部偏置歸納信息和全局注意力特征信息。金字塔層通過(guò)采用并行的雙層金字塔結(jié)構(gòu)實(shí)現(xiàn)多尺度信息融合和運(yùn)算解耦,有利于提升模型精度和提高模型推理速度。
1.3.3 預(yù)測(cè)層
預(yù)測(cè)層包含有3個(gè)檢測(cè)分支,分別為置信度、分類和坐標(biāo)回歸3種。將輸入的3個(gè)尺度的預(yù)測(cè)特征分別采用3×3的卷積層進(jìn)行目標(biāo)預(yù)測(cè)。本置信度表示為目標(biāo)預(yù)測(cè)類別的概率值,置信度預(yù)測(cè)范圍為[0,1],由Pr(Object)*IOU(Pred,Groundtruth)組成,其中Pr(Object)包含物體則表示Pr(Object)取1,否則取值為0。判斷是否包含該類物體,IOU(Intersection over Union)表示預(yù)測(cè)框與目標(biāo)框的重疊區(qū)域占總覆蓋區(qū)域占比,這有利于篩選出背景和前景目標(biāo)區(qū)域。類別預(yù)測(cè)是對(duì)包含有目標(biāo)的框進(jìn)行概率預(yù)測(cè),其值范圍為[0,1],判斷該目標(biāo)框的概率匹配某類別的概率,總共包含C個(gè)類?;貧w框預(yù)測(cè)包含有4個(gè)值(x,y,w,h)其中x表示橫坐標(biāo),y表示縱坐標(biāo),w表示寬度,h表示高度。Anchor的個(gè)數(shù)和尺寸由數(shù)據(jù)集由聚類統(tǒng)計(jì)得到。因此,每次需要預(yù)測(cè)K*(4+1+C)個(gè)值,K為Anchor個(gè)數(shù)。
對(duì)應(yīng)預(yù)測(cè)層的3個(gè)檢測(cè)分支,對(duì)應(yīng)的優(yōu)化目標(biāo)損失包含有置信、分類、坐標(biāo)回歸3類損失。其中置信損失采用MSE損失計(jì)算,其如式(11)所示:
(11)
分類損失采用交叉熵?fù)p失計(jì)算,其具體表達(dá)式如公式(12)所示:
(12)
坐標(biāo)回歸損失主要衡量預(yù)測(cè)真實(shí)值與anchor之間的偏移值的區(qū)間,這樣可以有效地降低坐標(biāo)預(yù)測(cè)的不穩(wěn)定性。采用MSE作為其損失如公式(13)所示:
(13)
txi=Gxi-Cxi;tyi=Gyi-Cyi
(14)
twi=log(Gwi/Cwi);thi=log(Ghi/Chi)
(15)
式中,G表示真實(shí)框,C表示anchor的坐標(biāo),x,y,w,h表示中心點(diǎn)的坐標(biāo)、寬度和高度。
總體的損失為置信、分類和坐標(biāo)回歸3類損失之和。其表達(dá)如公式(16)所示:
L=λLloc+βLclass+ηLconf
(16)
式中,L表示總體損失,λ、β和η為系數(shù)常數(shù),分別取值為1、1和0.5。
電網(wǎng)變壓器油液滲漏檢測(cè)算法模型具體實(shí)現(xiàn)的流程如圖8所示。首先將輸入圖像進(jìn)行尺寸縮放,將圖像固定在256×256的輸入大小,再將圖像均值化,采用訓(xùn)練樣本的均值和方差作為圖像均值化的估計(jì)參數(shù)。
圖8 電網(wǎng)變壓器油液滲漏檢測(cè)算法模型流程
然后,將圖像輸入到Mobile ViT主干網(wǎng)絡(luò)中進(jìn)行多尺度特征提取,將提取的特征實(shí)現(xiàn)多尺度特征融合,進(jìn)而構(gòu)建出多尺度的特征金字塔層特征;在多尺度特征上進(jìn)行目標(biāo)預(yù)測(cè),得到大量的不同置信度和目標(biāo)區(qū)域重疊的目標(biāo)候選框,需要進(jìn)一步進(jìn)行篩選,主要由置信度閾值和重疊區(qū)域非極大抑制兩方面構(gòu)成。一方面,通過(guò)設(shè)定置信度閾值排除一部分低置信度的目標(biāo)候選區(qū)域;另一方面將篩選出高置信度區(qū)域進(jìn)行目標(biāo)框非極大抑制操作(Non-Max Suppression),將挑選出置信度最高的目標(biāo)框作為正樣本和標(biāo)準(zhǔn),依次計(jì)算與同類別其它目標(biāo)框的交并比。最后,將交并比高的目標(biāo)框進(jìn)行去除,再繼續(xù)從剩下的低交并比目標(biāo)框中重復(fù)此操作,直到篩選完所有的目標(biāo)框,此操作進(jìn)一步去除了高置信度且重疊的目標(biāo)框,得到最后的目標(biāo)預(yù)測(cè)框。
目前,針對(duì)電網(wǎng)中電網(wǎng)變壓器油液滲漏領(lǐng)域內(nèi),沒(méi)有通用的開(kāi)源數(shù)據(jù)集。通過(guò)整理配電日常工作中變壓器出現(xiàn)油液滲漏異常時(shí)的視頻數(shù)據(jù),對(duì)其進(jìn)行了篩選,截取電網(wǎng)變壓器油液滲漏圖像,同時(shí)結(jié)合網(wǎng)絡(luò)上開(kāi)源的電網(wǎng)變壓器油液滲漏圖像,總共獲得了4 000張電網(wǎng)變壓器油液滲漏圖像,形成了電網(wǎng)變壓器油液滲漏數(shù)據(jù)集。圖9為本文構(gòu)建數(shù)據(jù)集的部分?jǐn)?shù)據(jù)示例。
圖9 電網(wǎng)變壓器油液滲漏樣本示例
再根據(jù)4:1的原則做訓(xùn)練集測(cè)試集劃分。訓(xùn)練集的圖片數(shù)據(jù)為3 200張,測(cè)試集的圖片數(shù)據(jù)為800張。
同時(shí)本文在訓(xùn)練算法模型前,采用了旋轉(zhuǎn)、翻轉(zhuǎn)、明暗度調(diào)整、旋轉(zhuǎn)、隨機(jī)擦除和Mosaic等方式對(duì)訓(xùn)練集進(jìn)行了數(shù)據(jù)增廣。其示例如圖10所示。
圖10 數(shù)據(jù)集增廣圖像
本文實(shí)驗(yàn)固定輸入圖片尺寸為256×256,采用在Image Net上預(yù)訓(xùn)練的模型作為主干網(wǎng)絡(luò)。在訓(xùn)練中將固定主干模型的參數(shù),同時(shí),新增層參數(shù)采用Kaiming初始化方式進(jìn)行初始化。在檢測(cè)訓(xùn)練中,本文設(shè)定學(xué)習(xí)率為0.001,終止學(xué)習(xí)率為1×10-7,采用步進(jìn)學(xué)習(xí)率(Step_lr)的方式訓(xùn)練35個(gè)周期,分別在10,20,25,30上逐次降低0.1,批尺度為64。采用自適應(yīng)隨機(jī)梯度下降的方式進(jìn)行權(quán)重優(yōu)化,其中衰減權(quán)重系數(shù)設(shè)置為0.95。錨定框尺寸采用Yolov4的聚類策略進(jìn)行設(shè)定,其長(zhǎng)寬尺寸比為1∶1,1∶2,2∶1,1∶5。本文實(shí)驗(yàn)設(shè)備為NVIDIA RTX2080ti GPU計(jì)算平臺(tái),在UBUNTU18.04操作系統(tǒng)下,使用Pytorch2.0深度學(xué)習(xí)框架訓(xùn)練算法模型。
為了評(píng)估檢測(cè)模型的檢測(cè)效果,本文統(tǒng)一采用目標(biāo)檢測(cè)常用的精度評(píng)價(jià)指標(biāo),值越大表示檢測(cè)模型的總體識(shí)別準(zhǔn)確率越高。同時(shí),為了準(zhǔn)確測(cè)試出目標(biāo)檢測(cè)模型檢測(cè)的速度,本文統(tǒng)一采用速度評(píng)價(jià)指標(biāo)FPS(frame per second),即模型每秒處理圖像的張數(shù),其值越大,證明模型檢測(cè)速度越快。
為了驗(yàn)證本文方法各部分的有效性,本文對(duì)提出的改進(jìn)的方法(MViT-YoloV4)各組成部分進(jìn)行消融實(shí)驗(yàn),消融實(shí)驗(yàn)的結(jié)果如表2所示。消融結(jié)果表明:直接結(jié)合MobileNet ViT和YoloV4的目標(biāo)檢測(cè)方式相對(duì)原有YoloV4目標(biāo)檢測(cè)方法有著一定差距,單純引入注意力網(wǎng)絡(luò)結(jié)構(gòu)并不能帶來(lái)性能上的提升。數(shù)據(jù)增廣對(duì)模型性能有一定的提升;增加特征融合層提升了2.7個(gè)百分點(diǎn),有效地說(shuō)明了全局信息特征和局部信息特征的有效融合有利于提升模型的檢測(cè)效果;增加特征金字塔層可以提升了3.2個(gè)百分點(diǎn);特征融合層與特征金字塔層的增加對(duì)模型的表現(xiàn)效果最佳,二者總共提升了5.2個(gè)百分點(diǎn)。此外,本文嘗試引入原有YoloV4模型的SPP(Spatial pyramid pooling)結(jié)構(gòu)用于特征維度的對(duì)齊,發(fā)現(xiàn)其并不能較好提升模型的表現(xiàn)能力。本文推測(cè)可能是SPP層可能會(huì)破壞原有的全局感知特征,導(dǎo)致造成信息的丟失和特征不對(duì)齊等問(wèn)題,這與純卷積結(jié)構(gòu)的作用效果并不完全一致。
表2 消融實(shí)驗(yàn)結(jié)果
為了驗(yàn)證本文方法整體的有效性,在相同實(shí)驗(yàn)環(huán)境下,訓(xùn)練和測(cè)試了Faster R-CNN、SSD、YoloV3、YoloV4、MV2-YoloV4等模型,與本文設(shè)計(jì)的模型進(jìn)行了精度、速度和參數(shù)量進(jìn)行全方位對(duì)比。實(shí)驗(yàn)結(jié)果如表3所示。
表3 模型精度、速度對(duì)比
如表3所示,本文方法為MViT-YoloV4,在精度上遠(yuǎn)高于Faster R-CNN、SSD、YoloV3等方法,同時(shí)比原有的YoloV4模型提升了2.6個(gè)百分點(diǎn),相比MV2-YoloV4(MobileNetV2-YoloV4)模型提升4.2個(gè)百分點(diǎn)。同時(shí),在模型速度對(duì)比中,本文方法僅低于MV2-YoloV4,高于對(duì)比的其他方法,說(shuō)明輕量化模型比基線模型上存在著一定的速度優(yōu)勢(shì)。此外,本實(shí)驗(yàn)發(fā)現(xiàn)推理速度與參數(shù)量之間的關(guān)系并不存在著對(duì)應(yīng)的近似線性的關(guān)系。YoloV4模型參數(shù)量比Yolov3要多,但是其推理速度反而要略快些,MV2-YoloV4參數(shù)量是YoloV4的1/6,但速度卻快了不到1倍。
從實(shí)驗(yàn)結(jié)果表明本文的方法在電網(wǎng)變壓器油液滲漏檢測(cè)任務(wù)中檢測(cè)精度和速度均取得了較好的效果。相對(duì)于YoloV4模型,本文方法在電網(wǎng)變壓器油液滲漏檢測(cè)精度由92.7%提高到95.3%。此外,在邊緣設(shè)備上進(jìn)行測(cè)試對(duì)比發(fā)現(xiàn),MViT-Yolo V4在Atlas NPU的基礎(chǔ)上其推理速度可以達(dá)到43FPS。圖11為電網(wǎng)變壓器油液滲漏實(shí)際檢測(cè)效果圖。
圖11 測(cè)試效果示例圖
如何快速并準(zhǔn)確發(fā)現(xiàn)設(shè)備異常是保障電網(wǎng)安全與穩(wěn)定的前提之一。針對(duì)電網(wǎng)變壓器油液滲漏檢測(cè)問(wèn)題,本文提出一種改進(jìn)YoloV4的電網(wǎng)變壓器油液滲漏檢測(cè)方法。該方法使用Mobile-ViT作為模型的骨干結(jié)構(gòu),利用卷積和Transformer有效地提取目標(biāo)的局部和全局信息特征,降低了計(jì)算量。同時(shí)本文在改進(jìn)YoloV4模型的基礎(chǔ)上,針對(duì)性地提出了一種多尺度特征融合方法,實(shí)現(xiàn)了局部和全局信息的多尺度特征融合,增強(qiáng)了上下文語(yǔ)義表達(dá)。本文方法有效地增強(qiáng)了檢測(cè)模型的泛化能力和適用性,提高了電網(wǎng)變壓器油液滲漏準(zhǔn)確率和速度。但是Transformer結(jié)構(gòu)的計(jì)算復(fù)雜度依舊相對(duì)較高,下一步將繼續(xù)在提高模型檢測(cè)準(zhǔn)確率和速度的基礎(chǔ)上,研究進(jìn)一步降低模型的計(jì)算量和誤檢率的可能性方案。