王 瑾, 裴 亮
(1. 南京大學(xué) 軟件學(xué)院, 南京 211102; 2. 國電南瑞南京控制系統(tǒng)有限公司 電網(wǎng)分公司, 南京 211106)
隨著智能電網(wǎng)的日益完善,電網(wǎng)調(diào)度在計算機技術(shù)、通信以及控制技術(shù)的加持下更加智能化.其不僅能夠直接采集電網(wǎng)數(shù)據(jù),對電網(wǎng)狀態(tài)進行監(jiān)視,還可以實時為各級運行調(diào)度人員提供輔助分析,進行決策控制[1-2].但海量多源監(jiān)測數(shù)據(jù)對精細化的調(diào)度控制提出了新的挑戰(zhàn),尤其對于電網(wǎng)運行過程中的異常風(fēng)險預(yù)警與處理,亟需精細化、實用化的處理方案[3-4].
針對智能電網(wǎng)調(diào)控系統(tǒng)異常告警與控制,目前已取得較多的研究成果.汪偉等[5]在研究在線監(jiān)測評估技術(shù)的基礎(chǔ)上,提出了在線監(jiān)測評估的軟硬件架構(gòu),并進行實際應(yīng)用.王鈺楠等[6]通過制定歸一化的風(fēng)險指標和線性評估方案,實現(xiàn)了網(wǎng)絡(luò)狀態(tài)實時運行風(fēng)險的有效評估,其不僅保證了分析準確性,更提高了計算效率.李存斌等[7]提出了一種將替代數(shù)據(jù)法與多重分形去趨勢波動相結(jié)合的方法以確定電力負荷風(fēng)險閾值,有效解決了傳統(tǒng)風(fēng)險預(yù)警閾值設(shè)定時對動態(tài)性能的需求.但現(xiàn)有研究大多只針對系統(tǒng)異常檢測或風(fēng)險評估展開,對電網(wǎng)運行狀態(tài)所處階段涉及較少,在評估過程中對不同電網(wǎng)階段的分析不夠全面[8].
本文提出了一種電網(wǎng)調(diào)控系統(tǒng)異常檢測與多階段風(fēng)險預(yù)警技術(shù),其利用隨機森林(RF)算法完成異常檢測,并采用人工神經(jīng)網(wǎng)絡(luò)(ANN)模型對系統(tǒng)異常狀態(tài)發(fā)展趨勢進行預(yù)測[9],便于運維人員采取風(fēng)險預(yù)警措施.
電網(wǎng)調(diào)控系統(tǒng)由數(shù)據(jù)采集管理層、在線監(jiān)視管理層、高級應(yīng)用管理層以及可視化展示層4部分組成,其架構(gòu)如圖1所示.
圖1 電網(wǎng)調(diào)控系統(tǒng)的架構(gòu)Fig.1 Architecture of power grid control system
由圖1可知,數(shù)據(jù)采集層的任務(wù)包括主站端、調(diào)度數(shù)據(jù)網(wǎng)以及變電站端的數(shù)據(jù)采集管理;經(jīng)過數(shù)據(jù)整合與預(yù)處理后,通過數(shù)據(jù)總線上傳至監(jiān)視管理層,進而監(jiān)視所有設(shè)備的數(shù)據(jù)采集指標.在線監(jiān)視管理層的任務(wù)除了包括主站端、調(diào)度數(shù)據(jù)網(wǎng)和變電站端的監(jiān)視管理外,還需對各項數(shù)據(jù)進行實時監(jiān)控與分析,并實時推送異常告警,以便及時發(fā)現(xiàn)、排除隱患[10].高級應(yīng)用管理層主要負責(zé)提高系統(tǒng)的風(fēng)險預(yù)測準確率和實時性,通過健康度評估、風(fēng)險預(yù)測控制以及異常智能檢測3方面實現(xiàn)[11].可視化管理層則在上述分析的基礎(chǔ)上,將系統(tǒng)運行狀態(tài)和異常檢測結(jié)果等信息進行全面的展示,能夠?qū)崿F(xiàn)對所有應(yīng)用功能的完全統(tǒng)一呈現(xiàn),從而實現(xiàn)對設(shè)備健康度的實時監(jiān)控.
通過對電網(wǎng)調(diào)控系統(tǒng)運行狀態(tài)的分析可知,基礎(chǔ)軟件環(huán)境、網(wǎng)絡(luò)環(huán)境、數(shù)據(jù)處理環(huán)境以及軟件模塊自身的故障均會對系統(tǒng)穩(wěn)定運行造成極大影響[12-13].為提升電網(wǎng)調(diào)控系統(tǒng)的運行穩(wěn)定性、降低故障發(fā)生頻率,在全面考慮系統(tǒng)健康狀態(tài)的前提下,利用RF算法實現(xiàn)異常檢測.
對于電網(wǎng)異常狀態(tài),故障發(fā)生集中點主要在3個方面:高級應(yīng)用層,如調(diào)用的函數(shù)庫、應(yīng)用服務(wù)等;數(shù)據(jù)處理層,如前端事務(wù)調(diào)用、數(shù)據(jù)庫服務(wù)等;基礎(chǔ)設(shè)備,如數(shù)據(jù)庫主機、前置服務(wù)主機等.根據(jù)電網(wǎng)調(diào)控系統(tǒng)運行過程中得到的日常異常類型匯總進行健康狀態(tài)評估,其中數(shù)據(jù)質(zhì)量健康度在電網(wǎng)調(diào)控系統(tǒng)中最為關(guān)鍵,主要體現(xiàn)在越限、狀態(tài)估計合格率以及跳變率等方面[14].
在系統(tǒng)健康狀態(tài)評估過程中,首先需要基于底層指標的評價結(jié)果結(jié)合專家經(jīng)驗權(quán)重進行加權(quán)求和,以得到上一層健康度,并以此逐層往上進行推算,最終得出系統(tǒng)整體健康度.
系統(tǒng)健康狀態(tài)量主要包括:二值型和數(shù)值型兩類,前者0或1分別對應(yīng)異常或正常兩種狀態(tài),如數(shù)據(jù)庫表結(jié)構(gòu)正確性表示;而數(shù)值型則通過0~100的分段函數(shù)將健康度指標量化,如CPU占用率表示等;健康度閾值設(shè)置為80%,即整體健康度小于該數(shù)值時將進行告警.
RF的基本塊是一個決策樹,以遞歸形式分割K維特征空間,直到劃分P個類型.在二叉決策樹的情況下,樹的每個節(jié)點將K維空間分成兩個分區(qū),重復(fù)執(zhí)行拆分直到實現(xiàn)P大小的分區(qū).
為了緩解決策樹過擬合問題,RF算法從多個決策樹聚合決策,即每個樹從訓(xùn)練數(shù)據(jù)的隨機樣本中學(xué)習(xí),且樹的每個節(jié)點處的最優(yōu)分割從訓(xùn)練數(shù)據(jù)特征的隨機樣本中選擇.此外,根據(jù)多數(shù)票機制,生成最終的樣本類型.
電網(wǎng)調(diào)控系統(tǒng)的異常檢測主要是針對系統(tǒng)運行中已經(jīng)產(chǎn)生但運維人員難以發(fā)現(xiàn)的異常狀況發(fā)出告警,同時對異常完成初步的剖析、診斷以及相應(yīng)的類型劃分,為后續(xù)的異常預(yù)警提供依據(jù)[15].由于RF算法具備較高的數(shù)據(jù)使用率、建??烨覍W(xué)習(xí)精度高等優(yōu)勢,所提技術(shù)將其引入.基于RF算法的電網(wǎng)調(diào)控系統(tǒng)異常檢測過程如圖2所示.
由圖2可知,異常檢測首先基于所采集到的歷史數(shù)據(jù),通過RF異常檢測算法訓(xùn)練風(fēng)險閾值,以完成初始異常檢測模型的建立;然后通過輸入相關(guān)實時數(shù)據(jù),計算系統(tǒng)健康度得分進行系統(tǒng)狀態(tài)判斷.最終對檢測模型進行實時更新以匹配運行狀態(tài),從而提高檢測的準確度和實時性.
在系統(tǒng)狀態(tài)實時監(jiān)測的基礎(chǔ)上,本文提出了一種基于ANN的風(fēng)險預(yù)警技術(shù).通過分析系統(tǒng)的歷史狀態(tài)數(shù)據(jù)來預(yù)測其發(fā)展趨勢,并針對可能出現(xiàn)的異常狀況采取預(yù)防性措施.基于深度學(xué)習(xí)的風(fēng)險預(yù)警流程如圖3所示.
圖2 基于RF算法的異常檢測流程Fig.2 Flow chart of anomaly detection based on RF algorithm
圖3 風(fēng)險預(yù)警技術(shù)的處理流程Fig.3 Flow chart of treatment of risk pre-warning technology
在電網(wǎng)調(diào)控系統(tǒng)中,首先通過隨機森林算法進行異常檢測,然后結(jié)合當(dāng)前的系統(tǒng)狀態(tài),利用ANN學(xué)習(xí)預(yù)測異常點后續(xù)的發(fā)展趨勢.參數(shù)一旦超過安全閾值,系統(tǒng)會發(fā)出告警,而調(diào)控人員也會采取相應(yīng)的防御措施.
由于電網(wǎng)調(diào)控系統(tǒng)的數(shù)據(jù)量較大,當(dāng)面對不斷增加的數(shù)據(jù)流時,其數(shù)據(jù)處理能力的衰減是一個緩慢的變化過程,如圖4所示.對于異常數(shù)據(jù)的檢測,可將采集數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)健康度并乘以適當(dāng)?shù)臋?quán)重作為整體健康度評估指標.數(shù)據(jù)健康度α可表示為檢測到的異常數(shù)據(jù)量x與對應(yīng)階段數(shù)據(jù)量(x1或x2)的比值,輕風(fēng)險階段數(shù)據(jù)量為x1,拐點區(qū)域數(shù)據(jù)量為x2,崩潰區(qū)α直接記為100%.
系統(tǒng)在3個壓力區(qū)中的運行狀態(tài)分別表述如下:
1) 輕壓力區(qū).隨著系統(tǒng)實時數(shù)據(jù)變化量的增加,輕壓力區(qū)的系統(tǒng)性能影響較小,系統(tǒng)穩(wěn)定系數(shù)始終為1.
圖4 系統(tǒng)穩(wěn)定性拐點模型Fig.4 Inflection point model of system stability
2) 拐點區(qū).繼續(xù)加大數(shù)據(jù)量壓力,系統(tǒng)運行狀態(tài)進入拐點區(qū),系統(tǒng)仍能維持穩(wěn)定運行一段時間,即電網(wǎng)故障持續(xù)時間小于閾值時,系統(tǒng)仍可穩(wěn)定運行.
3) 崩潰區(qū).當(dāng)數(shù)據(jù)量達到系統(tǒng)處理極限時,系統(tǒng)性能急劇下降甚至崩潰,穩(wěn)定系數(shù)接近于0,此時系統(tǒng)不可用.
ANN由一個輸入層、2個隱藏層、一個輸出層構(gòu)成.網(wǎng)絡(luò)中每個節(jié)點間連接均帶有一個相關(guān)的權(quán)重和一個將輸入映射到已知輸出的函數(shù).其中輸入層共設(shè)置20個節(jié)點,兩個隱藏層各5個節(jié)點,輸出層3個節(jié)點.單個節(jié)點的計算表達式為
(1)
式中:bj為可學(xué)習(xí)的標量偏差項;xi為輸入;oj為輸出;ωij為連接權(quán)重;δj為非線性激活函數(shù).ANN將多個節(jié)點組合在多個級聯(lián)層中,實現(xiàn)任意復(fù)雜的分類和回歸函數(shù).激活函數(shù)有多個選擇,所提技術(shù)中選擇雙曲正切函數(shù).
在訓(xùn)練過程中,首先初始化網(wǎng)絡(luò)權(quán)值ωij,通常使用隨機系數(shù).該網(wǎng)絡(luò)每次處理一個訓(xùn)練樣本,將網(wǎng)絡(luò)的預(yù)測輸出與真實值進行比較,并調(diào)整節(jié)點連接權(quán)重以最小化訓(xùn)練誤差.ANN分類器對噪聲數(shù)據(jù)具有較強的容錯性,能夠?qū)W習(xí)任意復(fù)雜的決策邊界.
為模擬系統(tǒng)實際運行場景,搭建電網(wǎng)調(diào)控系統(tǒng)閉環(huán)仿真環(huán)境,驗證其異常檢測及風(fēng)險情況下的預(yù)警能力.系統(tǒng)測試平臺應(yīng)用場景如圖5所示.
搭建系統(tǒng)由4臺雙網(wǎng)工作站構(gòu)成,其中兩臺工作站模擬220 kV以上站端實現(xiàn)調(diào)控信號傳輸,兩條工作站互為主備,包含網(wǎng)絡(luò)通道及2 M通道共738條,通道模式包含了2 C、4 C兩種連通方
圖5 系統(tǒng)配置圖Fig.5 Diagram of system configuration
式,模擬220 kV以上廠站和轉(zhuǎn)發(fā)通道;另外兩臺工作站模擬220 kV以下站端實現(xiàn)調(diào)控信號傳輸,兩條工作站互為主備,包含一平面及二平面通道共974條,通道模式為2 C連通方式,用以模擬220 kV以下的地級調(diào)度站.
本文共使用3項評價指標進行系統(tǒng)測評,相關(guān)說明如下:
1) 系統(tǒng)穩(wěn)定系數(shù).當(dāng)實時數(shù)據(jù)量達到一定壓力時,系統(tǒng)并非瞬間崩潰,而是能先穩(wěn)定運行一段時間,即有一定穩(wěn)定運行裕度的時長.因此可以定義系統(tǒng)穩(wěn)定系數(shù)為系統(tǒng)維穩(wěn)時長除以數(shù)據(jù)量峰值持續(xù)時長,其中,數(shù)據(jù)量峰值持續(xù)時長為發(fā)生異常時系統(tǒng)接收數(shù)據(jù)量持續(xù)某一峰值的時長;維穩(wěn)時長為系統(tǒng)在數(shù)據(jù)量峰值狀態(tài)下,仍能正常穩(wěn)定運行的時長.
2) 準確率.為有效評估異常檢測模型的性能,使用檢測率(ACC)和誤報率(FPR)指標進行評估,其計算表達式為
(2)
(3)
式中:M為所有異常樣本數(shù);N為所有正常樣本數(shù);m為檢測出的樣本數(shù);f為將正常樣本誤判為異常的正常樣本數(shù).
3) 平均絕對百分比誤差(MAPE)可以定義為
(4)
式中:yt為預(yù)測變量在t時刻的值;y′t為預(yù)測算法得到的預(yù)測值.
如前文所述,每一層健康度由底層數(shù)據(jù)健康評價指標和系統(tǒng)穩(wěn)定系數(shù)進行加權(quán)求和求得,經(jīng)逐層推算最終得出系統(tǒng)整體健康度.依據(jù)專家經(jīng)驗,底層數(shù)據(jù)健康度和系統(tǒng)穩(wěn)定系數(shù)權(quán)值分別取0.7和0.3.
電網(wǎng)調(diào)控系統(tǒng)中包含廠站、斷路器、刀閘、線路等對應(yīng)的變化數(shù)據(jù),異常檢測率、誤報率與并發(fā)用戶數(shù)的關(guān)系如圖6所示.其中用電行為模式數(shù)據(jù)參照文獻[16]設(shè)置,并發(fā)用戶由10人逐漸增加到100人.
圖6 異常檢測率、誤報率與并發(fā)用戶數(shù)的關(guān)系Fig.6 Relationship among anomaly detection rate,false alarm rate and concurrent user number
由圖6可以看出,隨著并發(fā)用戶數(shù)的增加,誤報率不斷增長,而檢測率持續(xù)下降.當(dāng)并發(fā)數(shù)到達80時,誤報率約為8%,檢測率下降至84%,處于系統(tǒng)運行的拐點區(qū).當(dāng)并發(fā)數(shù)到達100時,絕大部分并發(fā)用戶響應(yīng)超時,誤報率接近20%,且檢測率低于80%,低于系統(tǒng)運行的最低指標.
為了論證所提異常檢測方法的性能,將其與文獻[5]、文獻[6]、文獻[7]進行對比分析.在3個階段的檢測準確率對比結(jié)果如表1所示.
表1 多階段異常檢測性能對比結(jié)果Tab.1 Performance comparison results of multi-stage anomaly detection %
由表1可以看出,相比于其他方法,所提方法在3個階段的檢測率最佳,分別為94.53%、88.79%和80.12%.由于所提方法綜合考慮了系統(tǒng)異常的各種情況,并利用RF算法進行分析,保證檢測的正確率.雖然當(dāng)數(shù)據(jù)量增加,檢測性能有所下降,但整體檢測率不低于80%.文獻[5]利用在線監(jiān)測評估技術(shù)實現(xiàn)異常檢測,但缺乏相應(yīng)的分析算法,整體性能不佳.尤其當(dāng)系統(tǒng)處于崩潰區(qū)時,檢測率低于70%.文獻[6]和文獻[7]在輕壓力區(qū)表現(xiàn)較好,但難以應(yīng)對數(shù)據(jù)量陡增的情況,整體性能有待提升.
當(dāng)調(diào)控系統(tǒng)處于不同的階段,其風(fēng)險預(yù)警措施也不相同.由于數(shù)據(jù)量達到一定值后,可能會出現(xiàn)響應(yīng)時間長、窗口信息丟失等問題.此外,當(dāng)調(diào)控系統(tǒng)處于崩潰區(qū)時,系統(tǒng)也會直接發(fā)出預(yù)警并采取措施,故僅對系統(tǒng)的輕壓力區(qū)和拐點區(qū)進行實驗分析.
1) 輕壓力區(qū).在輕壓力區(qū),系統(tǒng)裕量較大,CPU使用率較低,能夠處理大量的檢測數(shù)據(jù).此時系統(tǒng)預(yù)測誤差對比結(jié)果如圖7所示.
圖7 輕壓力區(qū)的預(yù)測誤差對比結(jié)果Fig.7 Comparison results of prediction error in light pressure area
由圖7可以看出,在輕壓力區(qū),所提技術(shù)的預(yù)測誤差小于1%,優(yōu)于其他對比技術(shù).其結(jié)合RF算法和ANN模型進行風(fēng)險評估,能夠較為全面地檢測系統(tǒng)運行狀態(tài),因此具有理想的預(yù)測效果.文獻[5]利用在線監(jiān)測評估技術(shù),文獻[6]通過制定歸一化的風(fēng)險指標與線性評估技術(shù),文獻[7]的多重分形去趨勢波動,均能夠得到較好的預(yù)測效果.但數(shù)據(jù)量增加到60點/s時,MAPE均超過3%,且分析大數(shù)據(jù)時整體效果不佳.
2) 拐點區(qū).在拐點區(qū),系統(tǒng)CPU使用率較高,且存在數(shù)據(jù)信息延遲等情況,因此預(yù)警性能有所下降.此時系統(tǒng)狀態(tài)的預(yù)測誤差對比結(jié)果如圖8所示.
由圖8可以看出,拐點區(qū)的MAPE較輕壓力區(qū)有所增加.當(dāng)數(shù)據(jù)變化量達到85點/s后,系統(tǒng)出現(xiàn)嚴重卡頓,此時MAPE陡增.尤其是文獻[7]方法,MAPE超過32%,其利用替代數(shù)據(jù)法并結(jié)合多重分形的方法實現(xiàn)風(fēng)險預(yù)測.因為算法本身較為復(fù)雜,所以當(dāng)數(shù)據(jù)量急劇增加時,會導(dǎo)致系統(tǒng)崩潰.由于所提方法采用RF算法完成異常檢測,利用ANN預(yù)測系統(tǒng)運行狀態(tài)進行風(fēng)險評估,因此其能夠較好地處理海量數(shù)據(jù),整體性能較為理想,MAPE不超過10%.
圖8 拐點區(qū)的預(yù)測誤差對比結(jié)果Fig.8 Comparison results of prediction error in inflection point area
隨著可再生能源不斷接入電網(wǎng),更多不確定因素對電網(wǎng)的安全、穩(wěn)定運行造成極大影響,為此,本文基于深度學(xué)習(xí)提出了一種電網(wǎng)調(diào)控系統(tǒng)異常檢測與多階段風(fēng)險預(yù)警方法.利用RF算法進行系統(tǒng)異常狀態(tài)的檢測,并根據(jù)檢測結(jié)果利用ANN模型預(yù)測系統(tǒng)的發(fā)展趨勢.若超過健康度閾值,則發(fā)出預(yù)警.實驗結(jié)果表明,所提技術(shù)在3個階段的異常檢測率分別為94.53%、88.79%和80.12%,輕壓力區(qū)的MAPE小于1%,拐點區(qū)MAPE不超過10%,均優(yōu)于其他對比方法,其不僅提高了系統(tǒng)運行維護效率,還保障了系統(tǒng)的安全、穩(wěn)定運行.
由于本文考慮的系統(tǒng)異常類型大多為確定性的,而對于臺風(fēng)等自然災(zāi)害造成的突發(fā)性異常狀況并未深入分析,因此在接下來的研究中,將更多地考慮不確定性因素影響,提高風(fēng)險預(yù)警技術(shù)的普適性.