李 鵬,李 丹,李喜旺,高 宇
1(中國科學(xué)院大學(xué),北京 100049)
2(中國科學(xué)院 沈陽計算技術(shù)研究所,沈陽 110168)
3(國家電網(wǎng)東北分部,沈陽 110180)
4(美國加州州立大學(xué)富勒頓分校,加利福尼亞州 92834)
隨著信息化的不斷發(fā)展,很多行業(yè)都從信息技術(shù)中受益.電力行業(yè)調(diào)度系統(tǒng)也從傳統(tǒng)的人工監(jiān)測、人工控制慢慢轉(zhuǎn)變?yōu)槿谧詣踊O(jiān)測與自動化控制為一體的自動化系統(tǒng).電力調(diào)度自動化系統(tǒng)主要擔(dān)負(fù)著對所屬各電廠數(shù)據(jù)采集、存儲以及電廠的啟停調(diào)度.其安全性與穩(wěn)定性直接影響著電力調(diào)度網(wǎng)的運行質(zhì)量.傳統(tǒng)的電力調(diào)度系統(tǒng)的安全性與穩(wěn)定性監(jiān)測主要依靠技術(shù)工程師對設(shè)備進(jìn)行定期檢修和事后維修[1,2].定期檢修的時機(jī)完全依靠經(jīng)驗進(jìn)行分析,而電力調(diào)度自動化系統(tǒng)功能與結(jié)構(gòu)都比較復(fù)雜,存在諸多不確定因素,很難依靠主觀經(jīng)驗確定合適的檢修時機(jī),較大的檢修周期會增加系統(tǒng)出故障的可能性,較小的檢修周期又會增加檢修成本.當(dāng)系統(tǒng)出現(xiàn)故障后再進(jìn)行維修的事后維修策略則更加無法保證系統(tǒng)的安全穩(wěn)定運行.因此在系統(tǒng)出現(xiàn)故障之前通過對設(shè)備各運行指標(biāo)進(jìn)行監(jiān)測,然后建立設(shè)備狀態(tài)評估模型進(jìn)行有效的評估顯得格外重要.
許麗佳等[3,4]將隱馬爾可夫模型應(yīng)用于電子設(shè)備的狀態(tài)監(jiān)測和健康評估,但是受隱馬爾可夫模型假設(shè)的限制,導(dǎo)致模型評估結(jié)果的準(zhǔn)確性不高.神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)、自適應(yīng)以及強(qiáng)大的非線性化逼近能力,張璇[5]利用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行電力通信網(wǎng)絡(luò)設(shè)備的狀態(tài)評估,但是傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)為”黑盒模型”,可解釋能力較弱.倪麗等[6]利用模糊綜合評判理論進(jìn)行電力變壓器的狀態(tài)評估,但是因為模糊評判理論沒有學(xué)習(xí)能力,并且建立模糊關(guān)系矩陣比較困難,因此評估結(jié)果的準(zhǔn)確率不高.文獻(xiàn)[7]將模糊理論與支持向量機(jī)結(jié)合進(jìn)行設(shè)備狀態(tài)的評估,但是支持向量機(jī)學(xué)習(xí)算法對于所用模糊參數(shù)的調(diào)整能力較弱,無法充分發(fā)揮模糊理論的作用.
電力調(diào)度自動化設(shè)備狀態(tài)受諸多評價指標(biāo)的影響,同時各評價指標(biāo)之間也存在著復(fù)雜的聯(lián)系,針對此類非線性評估問題,神經(jīng)網(wǎng)絡(luò)模型強(qiáng)大的非線性擬合能力能夠很好的予以解決,然而評價指標(biāo)與設(shè)備狀態(tài)之間的關(guān)系并不是確定的,而是模糊的,難以精確表達(dá)的,考慮到模糊模型在模糊表達(dá)知識上的優(yōu)越性,本文將模糊理論與神經(jīng)網(wǎng)絡(luò)進(jìn)行結(jié)合應(yīng)用到設(shè)備狀態(tài)評估當(dāng)中,模型的非線性擬合能力以及模糊表達(dá)能力的都得到較大提升,提高了評估模型的準(zhǔn)確率.
模糊神經(jīng)網(wǎng)絡(luò)將模糊理論與神經(jīng)網(wǎng)絡(luò)進(jìn)行結(jié)合[8,9],將模糊概念和模糊推理引入神經(jīng)網(wǎng)絡(luò),一方面提高了神經(jīng)網(wǎng)絡(luò)的可解釋性和靈活性,另一方面利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法設(shè)計和調(diào)整模糊系統(tǒng)的相關(guān)參數(shù)[10],實現(xiàn)了模糊系統(tǒng)的自適應(yīng)功能.
如圖1所示,傳統(tǒng)模糊神經(jīng)網(wǎng)絡(luò)一般分為五層[11].第一層為輸入層,節(jié)點個數(shù)為輸入變量的個數(shù);第二層為模糊化層,將輸入變量進(jìn)行模糊化;第三層為模糊規(guī)則層,節(jié)點個數(shù)為模糊規(guī)則數(shù);第四層為反模糊化層,用于將模糊量進(jìn)行去模糊化;第五層為輸出層.
圖1 傳統(tǒng)模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
本文在對設(shè)備進(jìn)行狀態(tài)評估時,將第四層直接作為輸出,輸出層共四個神經(jīng)元節(jié)點,每個神經(jīng)元節(jié)點代表設(shè)備的一種狀態(tài),神經(jīng)元節(jié)點的數(shù)值代表設(shè)備對這種狀態(tài)的隸屬度.這樣具有四個輸出層節(jié)點的四層模糊神經(jīng)網(wǎng)絡(luò)如圖2所示,詳細(xì)介紹如下:
第一層為輸入層,xi,i=1,2,,n,代表n個輸入變量,本文中指影響設(shè)備運行狀態(tài)的性能指標(biāo),如CPU溫度、內(nèi)存占用率、網(wǎng)絡(luò)丟包率等,第一層的作用是直接將輸入傳遞到第二層.
第二層為模糊化層: 用于計算輸入變量對不同模糊集的隸屬度.該層神經(jīng)元的作用是將第一層的輸入變量xi劃分為mi個模糊度,因此共m個 神經(jīng)元,m=m1+m2+ +mn.該層神經(jīng)元與第一層神經(jīng)元之間的連接權(quán)值都為1,隸屬函數(shù)作為每個神經(jīng)元的激活函數(shù).考慮到高斯型隸屬函數(shù)在處理非二值輸入和空間映射方面具有較大優(yōu)勢[12],因此選擇式(1)所示的高斯型隸屬函數(shù)作為模型的隸屬度函數(shù):
圖2 四層模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
其中,μij表示第i個輸入變量隸屬與第j個模糊集的隸屬度 函數(shù);cij為隸屬函數(shù)μij的中心值;σij為隸屬函數(shù)μij的寬度值.
第三層為模糊規(guī)則層,也稱為“與”層,該層神經(jīng)元的個數(shù)表示模糊規(guī)則數(shù).每個神經(jīng)元與上一層的mi個神經(jīng)元中的一個節(jié)點相連,因此共R=m1+m2+ +mn個神經(jīng)元,每個連接的權(quán)值為1.每個神經(jīng)元內(nèi)部進(jìn)行“與”操作,即“AND”操作,也就是求每個輸入變量的隸屬度的最小值,通過式(2)進(jìn)行計算:
第四層為反模糊化層,也稱為“或”層,該層神經(jīng)元的個數(shù)表示模糊集合的個數(shù),本文中表示設(shè)備可能的狀態(tài).該層神經(jīng)元與上一層神經(jīng)元之間為全連接,權(quán)值ωjk為需要調(diào)整的參數(shù),神經(jīng)元的輸出值表示設(shè)備對這個狀態(tài)的隸屬度.
采用均方誤差函數(shù)作為該模糊神經(jīng)網(wǎng)絡(luò)的損失函數(shù):
由式(5)-(7)可以發(fā)現(xiàn)模型需要進(jìn)行調(diào)整的參數(shù)有三種:cij,σij和ωjk,這三種參數(shù)可以通過如下方法進(jìn)行迭代更新:
其中,η表示學(xué)習(xí)率,t表示迭代的次數(shù).
針對電力自動化設(shè)備健康評估,設(shè)備不同狀態(tài)下不一定會出現(xiàn)某些顯而易見的現(xiàn)象,實際情況更多的是設(shè)備的某些參數(shù)偏高或者偏低,而在設(shè)備健康評估時,一般依靠經(jīng)驗來處理這些“偏高”或者“偏低”的模糊概念.為解決此類具有模糊性以及參數(shù)難以定量描述的問題,本文引入模糊理論進(jìn)行處理.模糊神經(jīng)網(wǎng)絡(luò)能夠?qū)⑤斎脒M(jìn)行模糊化處理然后進(jìn)行模糊推理,由于設(shè)備健康評估的影響因素如溫度、占用率等具有很強(qiáng)的模糊性難以定量描述,采用模糊神經(jīng)網(wǎng)絡(luò)將輸入通過隸屬函數(shù)進(jìn)行處理,從而可以進(jìn)行定量描述,很好的適應(yīng)了設(shè)備健康評估問題.
在復(fù)雜系統(tǒng)中,每個對象對于集合的隸屬關(guān)系并不是明確的,而是相對模糊的[14].電力調(diào)度自動化系統(tǒng)就是一個相對復(fù)雜的系統(tǒng),在這個系統(tǒng)中有數(shù)量龐大的IT設(shè)備,設(shè)備的評價指標(biāo)有很多,如溫度、網(wǎng)口狀態(tài)、網(wǎng)絡(luò)流量、內(nèi)存使用率、硬盤使用率、CPU負(fù)荷率等[15],這些指標(biāo)量更適合用模糊理論進(jìn)行分析,用模糊集合描述評價指標(biāo),用數(shù)據(jù)指標(biāo)的隸屬度描述當(dāng)前運行情況.神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的自學(xué)習(xí)功能,可根據(jù)歷史數(shù)據(jù)學(xué)習(xí)結(jié)果來調(diào)整系統(tǒng)運行參數(shù),針對個體設(shè)備提供更準(zhǔn)確的、更具個性化的健康評價.本文采用的將模糊概念和神經(jīng)網(wǎng)絡(luò)結(jié)合的模糊神經(jīng)網(wǎng)絡(luò)模型可以極大提升電力調(diào)度自動化設(shè)備健康評估的效果.
將模糊神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到電力調(diào)度自動化設(shè)備健康評估的具體流程如圖3所示,具體步驟如下:
(1)整理存儲的設(shè)備6個月內(nèi)的運行信息,包括:CPU溫度、硬盤溫度、板卡溫度、網(wǎng)口狀態(tài)、網(wǎng)絡(luò)流量、網(wǎng)絡(luò)延遲、內(nèi)存使用率、硬盤使用率、CPU使用率、網(wǎng)絡(luò)丟包率、設(shè)備運行時間11個指標(biāo).
(2)對設(shè)備的運行狀態(tài)進(jìn)行劃分等級.根據(jù)專業(yè)人員的分析和歷史經(jīng)驗的總結(jié),將設(shè)備運行狀態(tài)分為四個等級,如表1所示.
(3)通過計算設(shè)備各運行指標(biāo)之間的皮爾遜相關(guān)系數(shù),刪除部分冗余特征.皮爾遜相關(guān)系數(shù)是衡量兩個隨機(jī)變量之間線性相關(guān)程度的指標(biāo),描述的是一種非確定性相關(guān)系數(shù)[16],計算公式如式(8)所示:
其中,Cov(X,Y)表示隨機(jī)變量X與Y的協(xié)方差矩陣,μX,μY分別表示隨機(jī)變量X與Y的期望,σX,σY分別表示隨機(jī)變量X與Y的方差.相關(guān)系數(shù)r的取值范圍為[-1,1],絕對值越大說明兩個隨機(jī)變量的相關(guān)程度越高,r大于0表示正相關(guān),r小于0表示負(fù)相關(guān),r等于0表示不相關(guān).通過利用皮爾遜相關(guān)系數(shù)篩選最終用于訓(xùn)練模型的特征包括: CPU溫度、硬盤溫度、板卡溫度、內(nèi)存使用率、CPU使用率、網(wǎng)絡(luò)丟包率、設(shè)備運行時間7個指標(biāo).
圖3 電力調(diào)度自動化設(shè)備健康評估流程
表1 設(shè)備狀態(tài)分級
(4)因為各指標(biāo)的值域不同,因此需要對各指標(biāo)進(jìn)行歸一化處理,歸一化計算公式如式(9)所示:
其中,Xmax表 示屬性X的最大值,Xmin表示屬性X的最小值.各特征經(jīng)過歸一化處理后,數(shù)值范圍都變換到[0,1]之間,這不僅可以消除量綱的差異還可以加速模型的收斂速度[17].
(5)初始化需要訓(xùn)練的模型參數(shù),主要包括三類參數(shù):cij,σij和ωjk.其中cij表 示隸屬函數(shù)的中心值,σij為隸屬函數(shù)的寬度值,ωjk為模糊規(guī)則層與反模糊層之間的連接權(quán)重.
(6)更新模型參數(shù)直到滿足模型訓(xùn)練的結(jié)束條件.傳統(tǒng)的模型終止條件有兩種,一種是當(dāng)模型的輸出值與真實值的誤差小于設(shè)置的閾值時終止模型訓(xùn)練,另一種是當(dāng)?shù)螖?shù)到達(dá)設(shè)置的次數(shù)時終止訓(xùn)練.本文在此基礎(chǔ)上增加模型訓(xùn)練的早停技巧,即當(dāng)模型在測試集上的誤差增大時,提前停止訓(xùn)練模型,這樣可以有效的避免模型的過擬合問題.
(7)保存模型.當(dāng)模型訓(xùn)練完成之后需要將模型保存到文件中,以便之后的模型使用.采用python語言的pickle模塊將模型序列化存儲到本地文件中,當(dāng)使用模型時,對序列化后的文件進(jìn)行反序列化處理,即可恢復(fù)原始模型進(jìn)行使用.
為了體現(xiàn)本文所用方法在電力自動化機(jī)房設(shè)備健康評估方面的有效性,對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的模型效果和本文所用模型效果進(jìn)行了對比,通過實驗結(jié)果顯示,本文所采用模型的效果優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的效果.
利用6個月內(nèi)共計17 280個設(shè)備運行數(shù)據(jù)進(jìn)行模型的搭建,將17 280個數(shù)據(jù)劃分為訓(xùn)練集、驗證集和測試集,如表2所示.每一條數(shù)據(jù)包含4個設(shè)備運行信息和3個設(shè)備硬件信息,如表3所示.
表2 數(shù)據(jù)集劃分
利用上述處理好的實驗數(shù)據(jù)進(jìn)行模型訓(xùn)練,模型的訓(xùn)練集均方根誤差和測試集均方根誤差如圖4所示,縱坐標(biāo)表示均方根誤差RMSE,橫坐標(biāo)表示迭代次數(shù),可以看出模型的訓(xùn)練誤差隨著迭代次數(shù)的增加整體趨勢是不斷減小的,但是測試誤差先是不斷減小然后又有上升趨勢,其原因就是模型發(fā)生了過擬合,因此需要提前終止模型訓(xùn)練,根據(jù)結(jié)果分析,選取迭代75輪時的模型作為最終的模型.
表3 設(shè)備監(jiān)測特征
圖4 訓(xùn)練誤差與測試誤差
傳統(tǒng)的三層BP神經(jīng)網(wǎng)絡(luò),激活函數(shù)為Sigmoid函數(shù),此類BP神經(jīng)網(wǎng)絡(luò)模型無法有效處理模糊輸入信息同時無法利用已有的專家知識.本文所采用的模糊神經(jīng)網(wǎng)絡(luò)模型將神經(jīng)網(wǎng)絡(luò)與模糊理論有機(jī)的結(jié)合起來,不僅可以處理模糊信息同時具有較強(qiáng)的學(xué)習(xí)能力與自適應(yīng)能力,通過圖5的結(jié)果對比可以看出本文所用的模糊神經(jīng)網(wǎng)絡(luò)模型效果要優(yōu)于傳統(tǒng)的三層BP神經(jīng)網(wǎng)絡(luò)模型,說明模糊神經(jīng)網(wǎng)絡(luò)更加適用于電力自動化機(jī)房設(shè)備的健康評估.
本文首先介紹了模糊理論與神經(jīng)網(wǎng)絡(luò)的相關(guān)概念,接著分析了將二者進(jìn)行結(jié)合的模糊神經(jīng)網(wǎng)絡(luò)的原理,然后將模糊神經(jīng)網(wǎng)絡(luò)應(yīng)用到電力調(diào)度自動化系統(tǒng)設(shè)備健康評估中.具體操作包括: 數(shù)據(jù)的收集、特征的選取以及模型的搭建,并且比較了本文所建立的四層模糊神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)三層BP神經(jīng)網(wǎng)絡(luò)模型的效果,實驗結(jié)果表明,本文所建立的模型極大的提升了設(shè)備健康評估的效果,針對IT設(shè)備可以給出更加精確的評估,對于電力自動化機(jī)房的正常運行具有重要意義.雖然本文所建立的模型效果優(yōu)于傳統(tǒng)的三層BP神經(jīng)網(wǎng)絡(luò)模型,但是還有較大的提升空間,比如選取更加有效的反映設(shè)備狀態(tài)的特征,選取更加合適的算法學(xué)習(xí)率和模型的初始參數(shù),這些問題都可以進(jìn)一步提升模型對設(shè)備狀態(tài)的評估效果,這將是下一步需要進(jìn)行完善的.
圖5 傳統(tǒng)神經(jīng)網(wǎng)絡(luò)與模糊神經(jīng)網(wǎng)絡(luò)結(jié)果對比