李向偉, 劉思言, 高昆侖*
(1.華北電力大學電氣與電子工程學院,北京 102206; 2.全球能源互聯(lián)網(wǎng)研究院,北京 102209)
隨著電力系統(tǒng)的復雜度日益提升,給系統(tǒng)安全帶來嚴峻考驗,也對電網(wǎng)在線暫態(tài)穩(wěn)定評估(transient stability assessment, TSA)的快速性和精確性提出了更高要求[1-3]。傳統(tǒng)的時域仿真法[4]和直接法[5-7]分別受限于其計算速度慢和建模困難,使得兩種方法不能同時滿足快速性和精確性要求。近年來,廣域測量系統(tǒng)和機器學習方法的快速發(fā)展為問題的解決提供了新思路[8-13]。
機器學習方法不需要建立復雜的物理模型,而是通過合適的輸入輸出量,即可建立一個對應的非線性映射,自學習能力強;對于訓練完成的模型,將測試樣本輸入即可立即進行分類,評估速度快,因此成為暫態(tài)穩(wěn)定評估的熱點方法[8-13]。
以往研究取得了較好的評估效果,但同時也有很大局限。一是所選特征的構造多以所有發(fā)電機的功角、轉速等電氣量數(shù)據(jù)為基礎,而這些特征的計算難度相對較大或采集所需時間較長[14],同時,還因現(xiàn)有條件下相量測量單溫(PMU)不能全面覆蓋而使得特征量的構造更加困難;二是傳統(tǒng)研究均在純凈數(shù)據(jù)條件下進行評估,而機器學習模型由于其非線表達能力有限,在處理復雜問題時數(shù)據(jù)挖掘能力不強[15],進而限制了其在復雜條件下的評估準確性。
近年來,機器學習中的深度學習方法發(fā)展迅猛,它通過靈活多變的結構、多樣的訓練策略及不同的權值共享方式使其相對于機器學習模型能夠提取到更有用的特征,進而挖掘數(shù)據(jù)的潛在規(guī)律[16],在圖像、自然語言處理等領域取得較大成功[17]。
為了克服傳統(tǒng)方法的缺點,進一步提高模型評估的準確性,本文考慮到暫態(tài)過程的時間變化特點以及深度學習在處理復雜問題上的優(yōu)勢,將深度學習中常用來處理時間序列問題的雙向長短時記憶網(wǎng)絡[18](bidirectional long short term memory network, BiLSTM)引入并和利用輕量梯度提升機[19](light gradient boosting machine, LGBM)改進的卷積神經(jīng)網(wǎng)絡(improved convolutional neural networks, ICNN)在TSA問題中進行模型融合。此外在考慮了PMU不能全面覆蓋以及數(shù)據(jù)傳輸量不宜過大的場景上,提出在PMU最優(yōu)布點上進行特征構建的方法,在此基礎上構建了“全階段”時間序列特征,所選數(shù)據(jù)易于計算采集,同時又能在應用較少輸入量的條件下保證模型評估的準確率。
雙向長短時記憶網(wǎng)絡由連接著一個輸出層的前后兩向LSTM構成,如圖1所示,其總輸出為前后向輸出之和。
圖1 雙向長短時記憶網(wǎng)絡模型結構示意圖Fig.1 The model structure diagram of bidirectional long short term memory network
BiLSTM能綜合時間序列兩個方向的信息,主要用于多變量時間序列分類任務。每向LSTM計算方法相同,均由輸入層、輸出層和隱藏層構成,隱藏層每一個記憶單元都擁有圖2所示結構。
圖2 記憶單元結構示意圖Fig.2 The structure diagram of memory cell
記憶單元的3個門接收當前狀態(tài)xt、上一時刻的輸出ht-1以及歷史狀態(tài)信息ct-1作為輸入,隨后,每一個門通過對不同來源的輸入進行運算來決定對歷史信息和當前信息的記憶程度。具體過程如下:首先,輸入門和遺忘門通過非線性函數(shù)對數(shù)據(jù)進行變換,分別輸出it和ft,具體公式如下所示:
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
(1)
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
(2)
隨后,將ft與歷史狀態(tài)信息ct-1相乘,并和與經(jīng)控制激活函數(shù)相乘后的遺忘門的輸出疊加構成當前單元的狀態(tài)ct:
ct=ftct-1+itσ1(Wxcxt+Whcht-1+bc)
(3)
最后,再將當前狀態(tài)信息ct與輸出門的控制激活值相乘構成本單元的輸出:
ot=σ(Wxoxt+Whoht-1+Wcoct-1+bo)
(4)
ht=otσ1(ct)
(5)
式中:Wxc、Wxi、Wxf、Wxo為連接輸入信號xt的權重矩陣;Whc、Wih、Whf、Who為連接隱含層輸出信號ht的權重矩陣;Wci、Wcf、Wco為連接神經(jīng)元輸出矢量ct和門函數(shù)的對角矩陣;bi、bc、bf、bo為偏置向量;σ和σ1為sigmoid和tanh函數(shù);ft和it分別為遺忘門和輸入門的輸出;xt、ht-1及ct-1分別為歷史狀態(tài)信息、上一時刻的輸出和歷史狀態(tài)信息。
卷積神經(jīng)網(wǎng)絡通過卷積和池化操作能夠自動提取到使模型易于分類的高階特征,隨后送入全連接層進行分類。然而由于全連接層表達能力有限,因此其往往并不能作為最優(yōu)分類器來執(zhí)行任務。針對此問題首次提出利用LGBM對其進行替換。LGBM是微軟在2017年提出的改進的梯度提升決策樹[20](gradient boosting decision tree, GBDT)模型,和GBDT一樣是一種集成分類器模型,每個子分類器為分類回歸樹。LGBM在GBDT的基礎上除了吸收了集成模型具有較高準確率的優(yōu)點,又通過改進直方圖算法[19]極大地加快了分類速度,降低了內(nèi)存的使用率,提高了模型的泛化性能。
設計了一種基于BiLSTM-ICNN的模型,結構如圖3所示??紤]到TSA問題的時間序列數(shù)據(jù)較長,首先利用能夠存儲長期記憶并能綜合前后兩個方向信息的雙向長短時記憶網(wǎng)絡對初始化處理后的電網(wǎng)的時間序列數(shù)據(jù)進行特征抽象,數(shù)據(jù)抽象后的電氣量維度變換為k,時間序列維度不變;隨后,利用一維卷積神經(jīng)網(wǎng)絡對BiLSTM抽象后的數(shù)據(jù)進行進一步的特征提取。一維卷積神經(jīng)網(wǎng)絡一方面能通過窗口大于1的卷積核的卷積操作進一步抽取特征的前后時間序列信息,另一方面,相比傳統(tǒng)神經(jīng)網(wǎng)絡,CNN能夠通過權值共享方式加速模型的訓練以及通過最大池化操作保留最重要的特征;卷積神經(jīng)網(wǎng)絡的最后一次池化操作后,將特征數(shù)據(jù)變換成為一維向量,考慮到集成模型在分類能力上優(yōu)于單一模型,因此將最后一次池化后的一維特征數(shù)據(jù)輸入到輕量梯度提升機中來進行分類任務。
圖3 本文TSA模型結構示意圖Fig.3 The TSA model structure diagram of this paper
為了防止深度學習出現(xiàn)過擬合,通過正則化方法來增強模型的泛化性和穩(wěn)定性。利用L2-范數(shù)對各層的權值矩陣進行約束[21],使模型學習到更小的權值,降低模型復雜度,讓數(shù)據(jù)擬合方式更恰當。此外,采用批歸一化技術[22](batch normalization)以及Dropout[23]策略進一步防止過擬合現(xiàn)象。Dropout策略是對網(wǎng)絡訓練期間的優(yōu)化,體現(xiàn)在網(wǎng)絡訓練時按一定概率隨機丟棄部分神經(jīng)網(wǎng)絡單元,即每次均訓練不同的網(wǎng)絡,因而使得網(wǎng)絡不依賴于某些局部特征而去學習更加魯棒的特征,同時文獻[24]指出Dropout具有數(shù)據(jù)增強功能;批歸一化技術于2015年由谷歌提出,設計在激活函數(shù)之前,主要操作是將神經(jīng)元的輸出進行類似歸一化的操作,減小輸出數(shù)據(jù)分布的變化,進而充分利用激活函數(shù)[22]。
電力系統(tǒng)在擾動發(fā)生后各電氣量將會隨時間的變化而變化,構造能反映系統(tǒng)暫態(tài)動態(tài)過程的特征是暫態(tài)穩(wěn)定能夠進行有效評估的前提。
傳統(tǒng)TSA問題的特征構建往往是在PMU全面覆蓋的基礎上進行的,主要包括基于“三段式”特征[8-10, 13]及基于受擾后軌跡特征[11-12]的構建方法。從PMU配置的實際出發(fā),吸收兩種方法的優(yōu)點,并克服其缺點,構建了在最優(yōu)PMU配置基礎上的“全階段”時間序列特征。
由于對系統(tǒng)進行狀態(tài)監(jiān)測為PMU主要功能之一[25],因此以系統(tǒng)的可監(jiān)測性為前提,采用0~1整數(shù)規(guī)劃方法進行PMU最優(yōu)布點。在此最優(yōu)布點基礎上,根據(jù)所用數(shù)據(jù)易于計算采集且能充分反映系統(tǒng)動態(tài)變化的原則進行初始電氣量選擇。由于PMU可直接量測其布點的母線電壓和與布點母線相連的線路的電流,進而量測PMU布點所連線路的功率,而與發(fā)電機母線直接相連線路的有功功率能反映發(fā)電機出力變化,對暫態(tài)穩(wěn)定具有重要意義,因此選擇該類線路有功功率作為特征;除此之外,電壓作為電力系統(tǒng)里最基本的電氣量,一方面能夠通過PMU直接進行采集計算,另一方面,由于電壓軌跡是系統(tǒng)故障后的直接時域響應,可作為系統(tǒng)受擾程度和穩(wěn)定性質的重要表征,因此再選取布點母線的電壓幅值和相角作為特征。最終選取了最優(yōu)節(jié)點的上述三類特征從故障發(fā)生前2周波至故障切除后3周波的全時間序列作為輸入數(shù)據(jù)。
基于深度學習的暫態(tài)穩(wěn)定評估最終要給出系統(tǒng)在擾動下穩(wěn)定與否,因此是一個二分類問題,根據(jù)暫態(tài)穩(wěn)定指標(transient stability index, TSI)對樣本穩(wěn)定與否進行標注。TSI的計算如下:
(6)
式(6)中:Δδmax為發(fā)生擾動后4 s末任意兩臺發(fā)電機功角差最大值。對于每個樣本,如果TSI為正,則系統(tǒng)是穩(wěn)定的,樣本標簽標注為1;如果TSI為負,系統(tǒng)是不穩(wěn)定的,樣本標簽標注為0。
由于電力系統(tǒng)對于穩(wěn)定樣本判定為失穩(wěn)和失穩(wěn)樣本判定為穩(wěn)定的代價不同,前者將失穩(wěn)樣本錯判為穩(wěn)定,導致運行人員在系統(tǒng)即將失穩(wěn)前不采取任何控制措施,將給系統(tǒng)造成嚴重破壞,而后者將穩(wěn)定樣本誤判為失穩(wěn),帶來的影響要小得多,因此為了檢驗模型的綜合評價性能除采用準確率(accuracy, Acc)外,還引入召回率(recall, Rec)作為評估指標,以更好地評估模型的實用性。召回率計算公式如下:
(7)
式(7)中:Tus表示失穩(wěn)樣本被正確分類的樣本數(shù);Fs表示“失穩(wěn)樣本誤判為穩(wěn)定”的樣本數(shù)。
基于BiLSTM-ICNN的評估方法可在離線階段通過離線數(shù)據(jù)對模型進行訓練,保存一個具有較好泛化性能的模型,以便在發(fā)生故障時進行快速在線評估??赏ㄟ^對典型運行方式下的測試系統(tǒng)設置故障,得到各種典型工況和典型故障下的時域仿真樣本集,并通過訓練得到能夠適應不同場景和工況下的評估模型。在擾動發(fā)生時,即可通過PMU獲取實時量測數(shù)據(jù)并利用訓練好的TSA模型進行在線穩(wěn)定評估。
采用TSA問題中眾多專家學者[8-13]常用的系統(tǒng)頻率為60 Hz的新英格蘭10機39節(jié)點系統(tǒng)對所提方法進行驗證(圖4)。應用PSS/E仿真軟件,發(fā)電機模型采用六階模型,負荷為恒阻抗模型。分別設置了80%~120%的五種負荷水平,在不同線路的10%、35%、50%、65%、90%處設置永久性三相短路故障,保護裝置動作時間為故障發(fā)生后0.2~0.6 s,數(shù)據(jù)采樣間隔為0.008 3 s。仿真共得到樣本10 200條,其中穩(wěn)定樣本7 714條,失穩(wěn)樣本2 486條,穩(wěn)定/失穩(wěn)樣本比例為3∶1。PMU最優(yōu)布點采用整數(shù)規(guī)劃方法,最終布點結果為母線:2、6、9、10、13、14、17、19、22、23、25、29、34。
圖4 IEEE39節(jié)點系統(tǒng)Fig.4 IEEE39 node system
由于故障切除時間不是一個固定常數(shù),因此按2.1節(jié)所選的序列長度會因不同的故障切除時間而不同。由于基于深度學習的模型能夠識別出不對特征做出貢獻的0值序列,因此以最長故障切除時刻為基準對不足序列進行補零,使得最終數(shù)據(jù)的特征矩陣大小相等。考慮到實際采樣條件下由于數(shù)據(jù)采集過程中會產(chǎn)生噪聲和異常值,因此對干凈數(shù)據(jù)集添加10 dB的高斯噪聲和1%的異常值(用0值表示),此類數(shù)據(jù)以下簡稱噪聲數(shù)據(jù)。
將樣本集隨機按8∶1∶1比例劃分為訓練集/驗證集/測試集,BiLSTM-ICNN模型的超參數(shù)根據(jù)問題實際及參數(shù)尋優(yōu)確定,BiLSTM神經(jīng)元個數(shù)為64;CNN卷積層共有2層,每一個卷積層均設計具有64個窗口大小為3的卷積核;LGBM葉子數(shù)為50,最大樹深度限制為6;采用Adam[26]優(yōu)化算法對學習率進行自適應調(diào)整,初始學習率0.001。將所提模型與傳統(tǒng)機器學習算法人工神經(jīng)網(wǎng)絡(artificial neural network, ANN)、決策樹(decision tree, DT)及支持向量機(support vector machine, SVM)和傳統(tǒng)深度學習算法CNN、LSTM進行對比。其中ANN和CNN的激活函數(shù)、正則化策略和優(yōu)化算法與所提模型保持一致,6種模型的結構及參數(shù)均進行尋優(yōu),最終確定ANN結構為[500,200,50,1];CNN采用四次卷積加池化操作,4層卷積核分別為[32,32,64,64],CNN利用全連接層進行分類;LSTM結構同本文模型的BiLSTM中的前向長短時記憶網(wǎng)絡,并利用全連接層進行分類;4種神經(jīng)網(wǎng)絡模型的迭代次數(shù)均設計為50。DT采用CART樹,SVM選用線性核函數(shù)。
3.2.1 模型在干凈數(shù)據(jù)條件下的評估性能
將不考慮噪聲和異常值條件下的數(shù)據(jù)分別輸入6種模型中進行暫態(tài)穩(wěn)定評估,結果如表1所示。
表1 干凈數(shù)據(jù)條件下的評估結果Table 1 Assessment results of clean data
由表1可知,干凈數(shù)據(jù)集下本文模型具有最高的評估性能,準確率和召回率分別達到98.54%和97.19%,對比另外兩種深度學習模型,體現(xiàn)了融合模型能夠利用各自優(yōu)勢對時間序列進行更好地處理。對比三種深度學習模型與三種機器學習模型可知,機器學習模型的準確率雖然都處于90%以上,但從召回率指標可以看出三種機器學習模型在樣本比例不均的情況下更傾向于分類為比例較高樣本;ANN相較于另外兩種模型而言性能較高,但因其結構不能較好地利用時間序列數(shù)據(jù),因此其準確率和召回率仍不如三種深度學習模型。
3.2.2 模型在噪聲條件下的評估性能
在干凈數(shù)據(jù)集中添加1%的異常值和10 dB的高斯噪聲數(shù)據(jù)以驗證模型的抗噪性能。將數(shù)據(jù)分別輸入6種模型,結果如表2所示。
表2 噪聲條件下的暫態(tài)穩(wěn)定評估結果Table 2 Assessment results of noisy data
由表2可知本文所提算法的評估性能依然較其他算法有著很大優(yōu)勢,具有較好的穩(wěn)定性,同時另外兩種深度學習模型在含有異常值和10 dB噪聲數(shù)據(jù)下也保持著較機器學習更優(yōu)越的抗噪性能。這是由于深度學習在有著強大的自動特征提取能力外還通過Dropout、批歸一化操作保持了較高的泛化性能,因此不易陷入過擬合和局部最優(yōu),同時本文模型的LGBM結構所采用的改進直方圖算法也在一定程度上提高了模型的泛化性。ANN也采用了和深度學習一樣的正則化方法,因而其評估性能好于另外兩種機器學習方法,但相對于深度學習模型,表現(xiàn)依然不盡如人意。
3.2.3 模型在PMU不同布點下的評估性能
為了測試在不同布點條件下的模型評估性能,將最優(yōu)配置方案與方案a(在所有發(fā)電機母線以及部分重要母線進行布點)和方案b(隨機布點)在噪聲集上進行對比,兩種方案PMU布點數(shù)與3.1節(jié)一致,選用布點如表3所示。
三種不同布點方案下的模型評估結果如表4所示。
表3 方案a、b的PMU布點位置Table 3 The PMU placement of plan a and b
表4 三種布點方案下的評估結果Table 4 The assessment results of three different plans
結果表明相較于基于PMU最優(yōu)配置方案,在方案a、方案b下各模型準確率和召回率均有所下降,且隨機方案普遍下降較大,這是因為PMU最優(yōu)布點方案滿足系統(tǒng)可觀測要求,具有較高的代表性,所選布點大多為所連線路較多的重要母線,因此具有更高的優(yōu)越性。同時,三種深度學習模型在另外兩種布點上仍然具有相對較高的準確率和召回率,機器學習模型依舊傾向于分類為高比例樣本,因此體現(xiàn)了深度學習模型具有較高的魯棒性,且本文方法同樣保持著最優(yōu)越的評估性能。
3.2.4 模型在PMU全布點下的評估性能
采用所有母線的電壓幅值、相角和所有與發(fā)電機母線直連線路的有功功率三類電氣量的時間序列數(shù)據(jù)作為輸入,在噪聲集中評估結果如表5所示。
表5 PMU全布點方案下的評估結果Table 5 The assessment results of PMU full placement
PMU全布點下的性能指標普遍有所上升,但由于現(xiàn)有條件下一方面PMU價格昂貴無法全面覆蓋,另一方面由于數(shù)據(jù)傳輸量巨大也會造成通信延時,因此使得其應用受限。雖然本文模型在最優(yōu)PMU配置條件下,準確率和召回率分別降低了0.39%和1.20%,但仍然保持在一個較高的水平,且將數(shù)據(jù)量壓縮到了近1/3,因此具有較好的實用性。
首次在電力系統(tǒng)暫態(tài)穩(wěn)定問題中提出一種基于BiLSTM-ICNN的評估方法,并在PMU最優(yōu)布點基礎上構建了全階段時序特征以適應其不能全面覆蓋的現(xiàn)實場景,通過在新英格蘭10機39節(jié)點系統(tǒng)上進行實驗,得到如下結論。
(1)相比傳統(tǒng)機器學習和傳統(tǒng)深度學習方法,所提模型能夠有效利用暫態(tài)過程的時序特征,評估準確率及召回率較高。
(2)對于現(xiàn)實場景中存在噪聲以及PMU不能全面覆蓋的限制,模型依然具有較好的評估性能,體現(xiàn)了方法的穩(wěn)定性和魯棒性。
(3)方法利用故障發(fā)生前2周波至故障切除后3周波的數(shù)據(jù)即可迅速對系統(tǒng)進行判穩(wěn),滿足快速性的要求。
深度學習方法在電力系統(tǒng)暫態(tài)穩(wěn)定問題中具有較好的應用前景,未來可研究所提方法在加入單相故障、兩相故障以及復故障的場景下如何進行應用,同時利用深度學習方法進行暫態(tài)穩(wěn)定控制也是未來的研究方向。