夏利玲,顧建華
(鹽城工業(yè)職業(yè)技術學院 信息與安全學院,江蘇 鹽城 224005)
伴隨著我國電力設備的不斷建設以及輸電線路的不斷延伸,傳統(tǒng)電力巡檢工作模式一方面因為嚴重依賴人力方式解決,人工成本較高,另一方面由于受限于如地形、天氣、人員經驗等多種因素影響,想要在全天候條件下完成對電力巡檢數(shù)據信息安全性的排查工作,存在一定安全風險,這導致傳統(tǒng)電力巡檢方式已無法滿足我國電力發(fā)展現(xiàn)狀。因此數(shù)據信息采集設備被廣泛應用于電力巡檢任務中。日常電力巡檢工作的主要內容包括:對電力線路進行異物檢測[1],避免出現(xiàn)因為異物遮擋而造成安全隱患事件。對重要電力設備的潛在安全風險進行評估,必要時為電力設備進行維護與搶修提供依據。對電力設備缺陷進行日常排查,做到早發(fā)現(xiàn)早解決。雖然通過智能采集設備可以獲取到相關電力設備的數(shù)據信息,例如利用無人機[2]進行電力巡視,利用電子監(jiān)控設備對電力設施的安全狀況進行實時監(jiān)控等,且這類方式具有全天候工作、跨越地形限制、節(jié)約人力成本等優(yōu)點,但依舊需要經驗豐富的人力對采集到的數(shù)據信息的安全性進行主觀分析,存在漏檢和錯檢的風險。針對上述問題,如何對數(shù)據信息的安全性進行有效識別[3]并提高識別效率,是目前研究人員要重點解決的問題。圖像數(shù)據具有蘊含信息量豐富、可跨距離、傳輸速率快等優(yōu)點,因此圖像數(shù)據成為人類獲取數(shù)據信息的主要載體[4]。目前關于電力巡檢數(shù)據安全性識別檢查方法主要針對三種電力巡檢數(shù)據類型:可見光照條件下采集到的數(shù)據類型、紅外[5]和紫外光照條件下[6]采集到的數(shù)據數(shù)據類型,并對這三種數(shù)據類型開展智能信息安全性檢測。本文主要針對在自然可見光條件下采集到的電力巡檢圖像數(shù)據,同時結合深度學習技術訓練網絡模型,實現(xiàn)對數(shù)據信息的安全性進行有效識別,具有識別效率高、高準確率和可靠性強等優(yōu)點。
當前圖像數(shù)據信息識別方法可以分為兩類,第一類是傳統(tǒng)基于目標物識別的方法,此類方法多數(shù)是基于待選區(qū)域特征提取的目標安全性識別方法,如文獻[7]采用滑動窗口在待識別圖像上對區(qū)域特征進行滑動提取。文獻[8]是較早將紅外圖像數(shù)據應用于電力線路相關信息安全性檢查的方法,主要思想是使用自適應方法,利用自然可見光照條件下原始電力設備圖像與其紅外光照條件下的圖像進行背景校對,以增強紅外圖像數(shù)據信息質量,實現(xiàn)對電力線路相關信息的安全檢測。針對文獻[8]方法存在對高噪聲抑制效果不佳,容易產生電力線路相關信息安全識別度低的問題,文獻[9]將彩色圖像融合技術應用于紅外圖像高噪聲抑制問題,有助于提升輸出圖的視覺效果,經實驗驗證增強后的輸出圖可有效提升電力線路數(shù)據信息安全性識別準確度。傳統(tǒng)圖像數(shù)據信息安全性識別方法雖然一定程度上可以實現(xiàn)對電力巡檢數(shù)據信息的安全性識別,但受制于計算機硬件性能上限,以及數(shù)據量有限等問題,識別結果存在魯棒性差,抗噪聲能力弱等缺點。第二類是基于深度學習技術特征提取的數(shù)據信息安全性識別方法,如SIFT(scale invarint frature transform)因為其在目標識別過程中可對目標進行濾波,并且在關鍵節(jié)點的提取和創(chuàng)建上具有獨特優(yōu)勢,被眾多識別模型應用,文獻[10]首次將SIFT應用于電力塔側傾檢測問題上,并取得不錯的效果,其主要思想是通過SIFT計算電力塔的關鍵節(jié)點,最后經過計算匹配度完成對電力塔側傾問題的檢測。文獻[11]是較早利用R-CNN(region-convolutional neural networks)進行目標識別的方法,主要思路是對待識別圖像通過分類,組成多個待判別區(qū)域構成的層次組,最后進行分類識別。隨著卷積神經網絡模型(CNN, convolutional neural network)結構的不斷改進,誕生了許多改進方法,文獻[12]創(chuàng)新性的將數(shù)據信息安全性的識別過程分兩個階段,第一階段主要對數(shù)據信息中含有待識別目標的區(qū)域進行識別,第二階段對區(qū)域內的目標通過類別標簽匹配完成對數(shù)據信息安全性的識別。雖然基于深度學習技術特征提取的數(shù)據信息安全性識別方法在精準度方面取得較大進步,但因為電力巡檢相關圖像數(shù)據存在特殊性,用于識別網絡訓練的數(shù)據集缺少多元性,導致多數(shù)情況下只能對有限的數(shù)據類型特征進行提取,無法做到對整體數(shù)據類型的特征進行表達。
針對目前電力巡檢采集到的圖像數(shù)據缺乏統(tǒng)一性的問題,本文提出一種基于生成對抗網絡[13]和密集連接網絡的數(shù)據信息安全識別方法,解決電力巡檢任務采集數(shù)據困難,以及傳統(tǒng)CNN識別方法存在梯度爆炸等問題。
生成對抗網絡(GAN, generative adversarial nets)[14]是由生成器G(generator)網絡和判別器D(discriminator)網絡二者相互競爭組成,GAN組成結構如圖1所示。以生成圖像為例,首先,隨機噪聲z輸入G網絡,輸出偽造圖像G(z);其次,從預先準備好的數(shù)據集中抽取真實圖像x,同時與G(z)作為輸入一起傳入D網絡,由D網絡負責鑒定輸入圖像是真實圖像還是偽造圖像,在此期間,G網絡一直在不斷提高生成能力,D網絡一直在不斷提高判別能力,G網絡與D網絡二者間不斷相互競爭;最終,當D網絡無法對偽造圖像G(z)的真?zhèn)巫龀稣_判斷時,說明此時的G網絡與D網絡相互之間保持在一種動態(tài)平衡的狀態(tài),此時G網絡的生成效果最佳。
圖1 生成對抗網絡原理圖
最后給出GAN的目標函數(shù):
Ex~PG[log(1-D(x))]
(1)
其中:V為 D網絡和G網絡的最終優(yōu)化目標;E為數(shù)學期望;x~Pdata表示數(shù)據來源于真實數(shù)據;G(z)為生成的偽造數(shù)據;D(x)和D(G(z))為D網絡分別對真實數(shù)據和生成數(shù)據進行判別的結果。
由于傳統(tǒng)GAN中生成器網絡過于自由導致無法有效控制生成內容,造成生成效果欠佳。條件生成對抗網絡(CGAN, condition generative adversarial nets)[15]對傳統(tǒng)GAN加入了約束條件,起到了監(jiān)督作用,一定程度上控制了生成器的輸出,CGAN的網絡結構如圖2所示。
圖2 CGAN的網絡結構圖
CGAN的目標函數(shù)表達式如下:
Εz~P(z)[log(1-D(G(z,y)))]
(2)
其中:x代表真實的圖像數(shù)據;y代表約束條件;z代表隨機噪聲,目標函數(shù)的作用是要最小化生成器D網絡的生成結果與真實結果之間的分布距離。
基于CNN的深度學習模型雖然在圖像處理方面取得不錯的成果,但也存在發(fā)展瓶頸,最突出的問題就是在訓練過程中,深度學習模型的準確率會隨著網絡層數(shù)的復雜化而降低,這類現(xiàn)象被稱之為“梯度彌散”現(xiàn)象,隨著對生成對抗網絡研究的不斷加深,梯度彌散現(xiàn)象是一個急需解決的問題,雖然出現(xiàn)了WGAN(wasserstein GAN),其優(yōu)勢是采用Wasserstein距離替代原始的JS散度衡量辦法,實現(xiàn)對生成數(shù)據分布與真實數(shù)據分布之間距離差異更加平滑的刻畫,可有效解決梯度彌散現(xiàn)象,但由于WGAN的先決條件是要滿足Lipschitz約束條件,并對參數(shù)取值范圍使用Weight Clipping截斷操作,導致網絡對分布在邊界處的權值處理效果不佳,造成WGAN網絡梯度學習速度較慢,影響網絡收斂速度。針對WGAN中存在的不足,而后出現(xiàn)了(WGAN-GP),使用梯度懲罰項代替原始WGAN中的Weight Clipping截斷操作,實現(xiàn)解決梯度彌散現(xiàn)象的同時有助于網絡平穩(wěn)訓練,但因為缺乏對梯度懲罰項的泛化,導致WGAN-GP對數(shù)據分布之間距離差異刻畫的多樣性欠佳。針對上述問題,殘差網絡(ResNet, residual neural network)[16]因此誕生,其特點在于建立前一層與后一層間的快速連接,實現(xiàn)提升訓練過程中梯度反向傳播的速度。密集連接網絡(DenseNet, dense connection net)[17]的構建思想類似于ResNet,它們二者的結構區(qū)別如圖3所示。
圖3 殘差網絡與稠密連接網絡
DenseNet與ResNet的區(qū)別在于,A層輸出和B層輸出并不是作加法,知識對層與層之間做通道維度上的連接,如圖3(b)所示,A層的輸出直接和B層后面所有層進行連接,其優(yōu)勢在于特征重用以及方便梯度傳遞,可以有效緩解梯度消失。DenseNet由多個稠密連接模塊(Densely Connected Block)[18]組成,由于采用這種密集連接不需要進行卷積操作,如圖4所示,所以產生的參數(shù)較少,可以讓DenseNet在參數(shù)、樣本和計算成本更少的任務中獲得比ResNet更具有優(yōu)勢的性能。
圖4 DenseNet連接示意圖
假設傳統(tǒng)CNN中一共有N層,那么一共會產生N個連接,而在DenseNet中,N層網絡結構一共會產生N(N+1)/2個連接,以圖4為例,是一個四層結構的DenseNet Block,其中x1,x2,x3,x4表示每一層輸出的特征圖;H1,H2,H3,H4表示每一層的非線性變換。具體過程從x0輸入卷積層開始,依次通過H1卷積層后得到輸出x1,接著合并x0,x1,結果作為輸入傳入第二層,輸入H2卷積層得到x2,再將x2與x0,x1通道維度合并作為第三層的輸入,如此循環(huán)反復,直到最后第四層輸出的特征結果包含前面所有層的特征輸出。由于DenseNet采用稠密連接方式,每一層都直接與輸入的特征信息和損失函數(shù)連接,使特征信息和梯度值在網絡訓練過程中可以更加高效地傳遞。
本文方法模型一共包含兩部分功能模塊:
1)基于條件生成對抗網絡的數(shù)據擴充模塊,該功能模塊負責在有限規(guī)模的數(shù)據集條件下通過對網絡的不斷訓練,得到具有較好生成效果的生成器網絡模型,實現(xiàn)生成擁有較高圖像質量的電力巡檢數(shù)據,完成對現(xiàn)有電力巡檢圖像數(shù)據集的擴充。有效改善實際情況下電力巡檢數(shù)據存在采集困難的缺點,同時擴充后的數(shù)據集為下一步提升深度學習網絡對電力巡檢數(shù)據信息安全性識別精準度提供了可靠的數(shù)據基礎。具體實現(xiàn)步驟為:首先,將隨機噪聲z作為輸入傳入條件生成對抗網絡,其中生成器G網絡在約束條件即預先準備好的電力巡檢圖像數(shù)據的引導下生成逼真的電力巡檢圖像數(shù)據;然后,將生成圖像作為輸入傳入判別器D網絡,并在約束條件的輔助下進行真?zhèn)闻袆e,利用損失函數(shù)反向優(yōu)化生成器D網絡與判別器G網絡的權重參數(shù);最后,當損失值更新停滯不前時,得到具有較好生成效果的生成器G網絡,并利用其生成能力,生成逼真的電力巡檢圖像數(shù)據來彌補現(xiàn)有數(shù)據集規(guī)模有限與類型單一的缺點。
2)基于DenseNet的電力巡檢數(shù)據信息安全識別模塊,該功能模塊負責對電力巡檢數(shù)據集中的目標物進行特征提取,引導網絡訓練不斷收斂,完成對數(shù)據信息中目標物的檢測,實現(xiàn)對電力巡檢數(shù)據信息安全性的識別。具體實現(xiàn)步驟為:首先,將擴充后的數(shù)據集作為輸入,并劃分為待識別集與目標集,其中目標集中的標簽已被預先處理好,待識別集中的標簽是需要被分類識別的;然后,利用DenseNet的稠密連接方式對待識別圖像數(shù)據特征進行提取學習,快速定位出待識別數(shù)據信息中包含待識別物所在的區(qū)域,緊接著計算其與目標集中提取到的特征信息之間距離分布差異,并利用池化層分類器對目標進行分類識別,對待識別物的位置和類別進行精細化判別;最后,根據類別情況給出識別標志,輔助工作人員對數(shù)據信息的安全性進行識別[19]。其中DenseNet映射公式為式(3),DenseNet特征提取公式為式(4)。本文對電力巡檢數(shù)據信息安全性的識別方法流程如圖5所示。
圖5 本文識別方法流程圖
XL=HL([X0,X1,...,XL-1])
(3)
F=f+t×L
(4)
其中:XL表示第L層特征通道數(shù)的輸出;[]表示對第0層到第L-1層的所有特征輸出進行通道維度的合并;HL()表示對第L層使用卷積操作+批歸一化+Relu的非線性變化。F表示經過一層密集連接后的的通道數(shù);f表示經過一層密集連接前的的通道數(shù);t表示通道增長率;N表示層數(shù)。
由于電力巡檢圖像數(shù)據涉及國家安全相關信息,一般很難對外公開,因此本文利用現(xiàn)有公開的電力巡檢圖像數(shù)據通過輸入本文提出的CGAN來生成樣本數(shù)據,實現(xiàn)對數(shù)據集規(guī)模的擴充,同時增加樣本數(shù)據集的多樣性。
本次仿真實驗的條件生成對抗網絡在訓練期間學習率為固定參數(shù)0.000 2,迭代次數(shù)為600次,batch-size為64,Adam參數(shù)設置為:一階矩估計的動量參數(shù)的指數(shù)衰減率b1=0.5, 二階矩估計的動量參數(shù)的指數(shù)衰減率b2=0.999,另外依據深度學習衰減策略,當網絡訓練過程中遇到損失值無法更新迭代時,需將模型網絡學習率下調至原學習率的一半,同時結合普歸一化和梯度懲罰對判別器進行收斂控制,確保網絡模型的穩(wěn)定訓練,本次仿真實驗在訓練到第56輪和第112輪時,對網絡模型學習率進行下調,調整到原始學習率的十分之一,實驗環(huán)境參數(shù)如表1所示。
表1 本章實驗環(huán)境配置
圖像數(shù)據信息識別評價標準通常使用平均檢測精度(mAP)[20],mAP的計算包括兩項:精準度(Precision)計算和召回率(Recall)計算,二者的數(shù)學表達式為式(5)、式(6),Precision和Recall的調和平均數(shù)使用F1-Score,其數(shù)學表達式為式(7):
(5)
(6)
(7)
其中:TP表示圖像數(shù)據信息被識別網絡正確識別出非安全性異物的樣本數(shù)量,F(xiàn)P表示圖像數(shù)據信息被識別網絡錯誤識別出非安全性異物的樣本數(shù)量,F(xiàn)N表示圖像數(shù)據信息中存在的異物未被識別網絡正確識別出的樣本數(shù)量。
仿真實驗最后采用準備好的驗證數(shù)據集對方法模型的精準度進行檢驗,驗證本文方法對圖像數(shù)據信息中存在的異物具有較高的識別正確度。識別結果展示如圖6所示,需要說明的是測試集中共有樣本180張,其中將非安全性異物類別進一步劃分為重視類和警惕類,重視類主要包含一些非生命的環(huán)境障礙物,如樹葉、絕緣子、車輛等。警惕類主要包含一些需要及時處置的障礙物,包括人物、塑料袋、鳥類等。當數(shù)據信息中包含警惕類非安全性異物時,需要方法模型能夠快速進行識別并給出警惕報警,利于巡檢人員第一時間進行確認和排查。
圖6 數(shù)據信息安全性識別檢測結果
如圖6(a)所示,本文方法準確識別出圖像數(shù)據信息中包含警惕類異物,并且給出了所屬類別為人物的概率值為0.875,說明該圖像數(shù)據信息的安全性需要得到警惕。圖6(b)是本文法規(guī)范準確識別出圖像數(shù)據信息中的絕緣子,并給出所屬類的概率值為0.891,方便電力巡檢人員快速對圖像數(shù)據信息安全性進行判斷,并對其安全工作運行狀態(tài)進行評估。
本文經過多次仿真實驗測試,最終得出在學習率固定為0.000 2,并且識別方法模型訓練到第23000輪時,本文方法的識別精準度最佳,對重視類和警惕類非安全性異物的識別結果如表2所示。從表2可以看出本文方法對大部分異物的識別正確度較高。尤其是對警惕類別中的車輛、人物、鳥類、塑料袋具有較高的識別正確度,特別是針對人物和車輛的識別指標Recall值得分表現(xiàn)優(yōu)秀,可以證明本文方法對數(shù)據信息的安全性識別覆蓋率較高,不易產生漏檢和錯檢的現(xiàn)象。警惕性異物中鳥類事件因為具有很強的隨機性和不確定性,對其及時進行安全性檢測一直是電力巡檢過程中的難點和重點,從表2結果中可以看出本文方法對鳥類的正確識別率處于次優(yōu)位置,說明本文方法可以對警惕類別中的鳥類做到有效檢測。但是對塑料袋異物和樹葉的識別度表現(xiàn)欠佳,這一定程度上是因為塑料袋形狀的過于多變且形狀不規(guī)則,對其正確識別結果造成一定影響,而樹葉作為異物識別目標,由于目標體積較小導致不易識別。本文針對塑料袋與樹葉這兩類異物存在不易識別且識別正確度不高的問題,采取高斯濾波法對圖像進行預處理,高斯濾波法主要是對圖像邊緣區(qū)域的高頻噪聲進行過濾,可以對內容信息進行增強處理,有助于增強方法模型的泛化能力,仿真實驗結果表明本文方法對先經過高斯濾波法處理后得到結果圖,再對其進行數(shù)據信息安全性識別,最終結果的AP得分與Recall得分相比較無高斯濾波法處理的結果均有較明顯的提升,對比結果如表2所示。
表2 數(shù)據信息安全識別結果
為進一步驗證本文方法采用CGAN生成圖像數(shù)據以擴充現(xiàn)有數(shù)據集,實現(xiàn)提高數(shù)據信息安全識別目標正確率的有效性,本次實驗分別使用數(shù)據擴充前和數(shù)據擴充后的數(shù)據集,同時進行15000輪訓練后得到的測試結果對比如表3所示。其中原始數(shù)據集擴充前,共包含180張真實圖像數(shù)據,經擴充后新增360張由CGAN生成的電力巡檢圖像數(shù)據用以擴充原始數(shù)據集規(guī)模,實驗使用40張圖像數(shù)據分別對模型進行測試,從表3中結果可明顯看出,使用CGAN生成數(shù)據得到擴充后的數(shù)據集,對方法模型進行訓練后,其評價指標的Precision值,Recall值,F(xiàn)1-score值得分情況均有明顯幅度的提升,提升率分別為22.1%,13.8%,21.8%。證明本文使用CGAN對有限數(shù)據集進行擴充,從而提高方法模型對數(shù)據信息安全識別準確度的方法具有較好的實施效果。
表3 數(shù)據集擴充識別結果
電力巡檢數(shù)據信息安全性檢測方法之所以因其為我國電力設施承擔相關安全事故檢測與預警工作,所以電力巡檢數(shù)據信息安全性檢測方法模型需具有高可靠性與穩(wěn)定性。目前在深度學習領域借助統(tǒng)計學思想提出,在極端情況下模型對邊界值也能保持平滑、可靠的性質,被稱之為魯棒性。進一步如果一個網絡模型的魯棒性越好,意味著該模型具有三大優(yōu)點:具有高精準度和多數(shù)有效性;在模型遇到較小偏差值時,模型整體性能只受到較小影響;在模型遇到較大偏差值時,模型整體性能并不會出現(xiàn)“災難性”的結果;圖7是本文方法模型在測試集上關于Recall, Precision的得分分布情況,從中可以看出本文法模型對于大部電力巡檢圖像數(shù)據信息的安全性識別得分較高,且得分分布情況趨近于正態(tài)分布,表明本文方法模型具有較強的魯棒性,證明本文方法模型具有較高的可靠性與穩(wěn)定性。
圖7 本文方法在擴充數(shù)據集上的Recall和Precision得分分布情況
針對電力巡檢任務采集到的數(shù)據,需要進行信息安全識別的問題,本文提出一種基于CGAN和DenseNet的數(shù)據信息安全識別方法。首先,本文使用CGAN,在現(xiàn)有數(shù)據的規(guī)?;A上生成逼真的數(shù)據集,解決電力巡檢任務采集數(shù)據較為困難的缺點;然后,利用DenseNet搭建識別網絡,對數(shù)據信息的安全性進行識別,判斷出異物類別,相比傳統(tǒng)人工巡檢方式,不僅可以提升工作效率,還可以節(jié)約資源;最后,通過對仿真實驗,證明本文方法對數(shù)據信息的安全性具有較好的識別效果。