晏光輝,劉頌凱,張磊,龔小玉
(1. 三峽大學 電氣與新能源學院,湖北 宜昌 443002; 2. 三峽大學 經(jīng)濟與管理學院,湖北 宜昌 443002)
隨著智能電網(wǎng)和能源互聯(lián)網(wǎng)的建設與推進,電力系統(tǒng)的規(guī)模和復雜度不斷增加,系統(tǒng)運行日益接近穩(wěn)定極限,電壓穩(wěn)定問題愈發(fā)凸顯[1]。近年來,由電壓失穩(wěn)導致的大停電事故頻頻發(fā)生,造成了巨大的經(jīng)濟損失和嚴重的社會影響[2]。因此,實時、準確的靜態(tài)電壓穩(wěn)定評估對于保障電力系統(tǒng)安全穩(wěn)定運行至關重要。
靜態(tài)電壓穩(wěn)定分析的實質(zhì)是通過迭代求解潮流,獲取系統(tǒng)當前運行點到電壓崩潰點之間的量化距離[3]。傳統(tǒng)基于機理分析的靜態(tài)電壓穩(wěn)定評估方法主要從潮流多解[4]、奇異值分解[5]、模態(tài)分析[6]和靈敏度分析[7]等方面展開研究。由于計算復雜度高,耗時長,此類方法難以保障在線應用的時效性。
近年來,隨著廣域測量系統(tǒng)(Wide Area Measurement Systems,WAMS)在電力系統(tǒng)中的快速發(fā)展,相量測量單元(Phasor Measurement Unit,PMU)獲取的大量量測數(shù)據(jù)為基于數(shù)據(jù)驅動的靜態(tài)電壓穩(wěn)定評估研究奠定了堅實的基礎[8]。這類研究的基本思路:首先,通過數(shù)據(jù)仿真生成大量訓練樣本;其次,數(shù)據(jù)驅動工具通過離線訓練建立電力系統(tǒng)運行特征與電壓穩(wěn)定指標之間的映射關系;從而實現(xiàn)靜態(tài)電壓穩(wěn)定評估。文獻[9]利用支持類別特征的梯度提升(Gradient Boosting With Categorical Features Support,Catboost)算法進行電壓穩(wěn)定評估,并基于沙普利值加性解釋方法(Shapley Additive Explanations,SHAP)對評估結果進行可解釋性分析。文獻[10]基于梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)算法實現(xiàn)電壓穩(wěn)定裕度的在線監(jiān)測,其對噪聲干擾具有較好的魯棒性。文獻[11]通過模態(tài)分析和相關系數(shù)分析進行數(shù)據(jù)降維,進而利用決策樹(Decision Tree,DT)算法實現(xiàn)在線靜態(tài)電壓穩(wěn)定裕度評估。文獻[12]提出了一種基于極限學習機(Extreme Learning Machine,ELM)的分層自適應數(shù)據(jù)分析方法進行短期電壓穩(wěn)定評估,并利用多目標優(yōu)化實現(xiàn)評估準確率和時間的最優(yōu)權衡。
上述數(shù)據(jù)驅動方法取得了諸多成果,但在實際電力系統(tǒng)的應用中仍存在不足之處。第一,隨著系統(tǒng)規(guī)模的逐漸擴大,電力系統(tǒng)的運行特征不斷增加,大量與電壓穩(wěn)定分析無關的特征和冗余的特征會嚴重影響評估模型的性能;第二,電力系統(tǒng)拓撲結構可能發(fā)生改變,離線生成的訓練樣本集難以包含時變電力系統(tǒng)所有潛在的運行工況,訓練好的模型可能無法為未知拓撲的系統(tǒng)提供準確可靠的評估結果。
基于上述分析,文中提出了一種基于遷移學習的智能靜態(tài)電壓穩(wěn)定評估方案:考慮特征冗余問題,通過最大相關最小冗余(Maximal Relevance Minimal Redundancy,MRMR)準則[13]和shapley值[14]建立S-MRMR特征選擇框架,實現(xiàn)有效的數(shù)據(jù)降維,使得評估模型可以利用較少的輸入特征提供準確的結果;采用梯度提升分段線性回歸樹(Gradient Boosting With Piecewise Linear Regression Trees,GBDT-PL)算法[15]構建靜態(tài)電壓穩(wěn)定評估模型,有效提高評估準確率和計算效率;為了提升評估模型的泛化能力,將遷移學習引入靜態(tài)電壓穩(wěn)定評估中,對評估模型進行實時更新。通過在23節(jié)點系統(tǒng)和1648節(jié)點系統(tǒng)上的性能測試,驗證文中所提智能電壓穩(wěn)定評估方案的有效性。
隨著智能電網(wǎng)規(guī)模日益增大,系統(tǒng)運行特征(母線電壓幅值和相角,發(fā)電機和負荷的功率等)呈指數(shù)級增長。然而,大量不具有代表性的特征不僅不能提高數(shù)據(jù)驅動模型的性能,還增大了模型的學習難度。針對該問題,目前一些特征選擇方法(如Fisher線性判別[16]和ReliefF[17-18]等)被用來降低輸入數(shù)據(jù)的維數(shù),但這些方法仍存在許多不足。首先,冗余特征難以完全剔除;其次,共同作用的相互依賴的特征經(jīng)常作為冗余特征被剔除。為了解決上述問題,文中基于MRMR準則和shapley值構建S-MRMR特征選擇框架,該框架能夠有效降低輸入數(shù)據(jù)的維度,選擇較少的關鍵特征來訓練高性能的評估模型。
設電力系統(tǒng)靜態(tài)電壓穩(wěn)定評估原始數(shù)據(jù)集為Z,即:
(1)
式中Vi和θi分別為母線i的電壓幅值和相角;PLi和QLi分別為負荷i的有功功率和無功功率;PGi和QGi分別為發(fā)電機i的有功功率和無功功率;QSi為分流器i的無功功率;PTi-j和QTi-j分別為輸電線路i-j的有功功率和無功功率;y為電壓穩(wěn)定指標,且y∈{1,0},1表示穩(wěn)定,0表示不穩(wěn)定;n為樣本數(shù)量。
基于互信息的MRMR準則由最大相關準則和最小冗余準則兩部分構成,即:
(2)
(3)
式中X為所選的關鍵特征集;|X|為X中的特征數(shù)量;I(xi,y)為特征xi與電壓穩(wěn)定指標y的互信息值;I(xi,xj)為特征xi與特征xj的互信息值;O為X中特征與指標間互信息的平均值,表征相關性;R為X中特征間互信息的平均值,表征冗余性。
結合相關性和冗余性,MRMR準則為:
maxJ(O,R),J=O-R
(4)
盡管MRMR準則可選擇與電壓穩(wěn)定指標相關性最大且與已選特征冗余性最小的特征,但實際應用時,一些評估結果可能需要多個特征共同表征。這些相互依賴的特征作為個體與電壓穩(wěn)定指標并無強相關性,且它們之間高度關聯(lián)。因而,此類特征往往被當作冗余特征[19]。針對此問題,文中引入博弈論中的shapley值對MRMR準則進行改進,通過賦予特征不同的權重來區(qū)分特征間的依賴關系和冗余關系。特征xi的shapley值的計算方式如下:
(5)
Δi(E)=(P(E∪{xi})-P(E))
(6)
式中Δi(E)為特征xi的邊際貢獻;E為不包含特征xi的子集;P(E)為僅使用特征集E作為輸入時模型對于樣本處于不穩(wěn)定狀態(tài)的評估概率;P(E∪{xi})為使用特征集E和特征xi作為輸入時模型對于樣本處于不穩(wěn)定狀態(tài)的評估概率;P(E∪{xi})和P(E)之差反映了特征xi對評估結果的影響。
通過上述分析,所提基于S-MRMR的電力系統(tǒng)關鍵特征選擇過程如下:
(1)設原始數(shù)據(jù)集Z中每個特征的初始權重β(xi)為1,計算Z中每個特征與對應電壓穩(wěn)定指標y之間的互信息值,選取互信息值最大的特征作為關鍵特征集X中的首個特征;
(2)計算Z中剩余候選特征的shapley值w(xi),對其特征權重進行更新,即:
(7)
(3)結合MRMR準則和更新后的權重構建式(8)所示的評價函數(shù)ξ(xi),對Z中剩余候選特征進行評價。ξ(xi)值越大表明特征與電壓穩(wěn)定指標之間的相關性越強,且與已選特征的冗余性越弱。選取ξ(xi)值最大的特征作為關鍵特征:
ξ(xi)=β(xi)′×J
(8)
(4)重復步驟(2)~步驟(3),直至m個關鍵特征被選出。
GBDT是由Friedman提出的一種集成學習算法,它以DT作為基學習器來構建分類模型,其基本原理如下:
(9)
令l表示單個數(shù)據(jù)點的損失函數(shù),引入表示DT:tk復雜度的正則化項Ω(tk)來防止過擬合,可得目標函數(shù)為:
(10)
(11)
(12)
GBDT雖然呈現(xiàn)出較好的評估性能,但仍存在容易過擬合、訓練速度慢等問題。為了加快GBDT的收斂速度,降低過擬合概率,提高準確率,GBDT-PL采用分段線性回歸樹(Piecewise Linear Regression Trees,PL Trees)代替GBDT中的分段常數(shù)樹,用線性模型fs代替葉子上的常數(shù)值,則式(12)可替換為:
(13)
式中?(fs)表示fs的L2范數(shù);Γs表示葉子s上的數(shù)據(jù)集。
對于樹的每個節(jié)點,通過最小化式(13)尋找最優(yōu)分裂方式。為了減少訓練PL Trees的計算成本,在樹的生長過程中采用增量特征選擇(Incremental Feature Selection,IFS)策略和半加性擬合(Half-Additive Fitting,HAF)方法來約束線性模型的大小。
泛化能力不佳是數(shù)據(jù)驅動工具在實際工程應用時所需要解決的重要問題。對于時變電力系統(tǒng)而言,系統(tǒng)拓撲結構會因各種可能的運行需求(如定期維護和發(fā)電調(diào)度等)而發(fā)生變化?,F(xiàn)有的訓練數(shù)據(jù)集難以包含所有潛在的運行工況,當未知的系統(tǒng)拓撲導致預測集與訓練集數(shù)據(jù)分布不同時,離線訓練的數(shù)據(jù)驅動模型可能無法為拓撲改變后的系統(tǒng)提供準確可靠的預測結果。因此,有必要對訓練好的模型進行更新以適應新的拓撲結構,提高模型評估性能。
遷移學習旨在將源域中學到的知識遷移到目標域中,使得在源域訓練好的模型可以直接用于目標域上,且不會造成嚴重的性能損失。因此,文中利用如圖1所示的遷移成分分析(Transfer Component Analysis,TCA)法[20]對GBDT-PL評估模型進行實時更新,以改善GBDT-PL模型泛化能力不足的問題。
圖1 TCA示意圖Fig.1 Schematic diagram of TCA
設基于電力系統(tǒng)基準拓撲生成的數(shù)據(jù)集(源域)為DS={XS,YS},XS為源域特征矩陣,YS為電壓穩(wěn)定指標向量。當電力系統(tǒng)拓撲結構改變后,設其數(shù)據(jù)集(目標域)為DT={XT},XT為目標域特征矩陣。XS和XT的維數(shù)可能不同,為便于處理,對維數(shù)較低的特征矩陣補充零向量,使XS和XT維數(shù)一致[21]。由于XS和XT所對應的電力系統(tǒng)拓撲結構不同,導致其邊緣概率分布不同P(XS)≠P(XT),若直接利用由DS訓練好的GBDT-PL模型對XT進行評估,評估準確率難以保證。
(14)
式中nS為源域樣本數(shù);nT為目標域樣本數(shù);H表示再生核希爾伯特空間。
為降低計算難度,引入核矩陣K和分布差異矩陣L,則式(14)可簡化為:
(15)
式中tr表示求矩陣的跡;K和L的計算公式為:
(16)
(17)
式中KS,S、KT,T、KS,T和KT,S分別表示源域,目標域及跨域數(shù)據(jù)的核矩陣。核矩陣中的元素為:
Ki,j=φ(xi)Tφ(xj)
(18)
(19)
(20)
綜上所述,TCA最終的優(yōu)化目標為:
(21)
式中μ為正則化參數(shù);tr(WTW)為正則化項,用于控制W的復雜度;H=InS+nT-[1/(nS+nT)]VVT為中心矩陣,V是全為1的列向量;I為單位矩陣;約束條件用于維持數(shù)據(jù)的散度。通過拉格朗日乘子法求解式(21)的目標函數(shù),得到的映射矩陣W即為φ。
基于S-MRMR特征選擇框架、GBDT-PL算法和遷移學習,文中提出了如圖2所示的電力系統(tǒng)智能電壓穩(wěn)定評估方案,包括特征選擇,模型訓練和在線評估三個階段。
圖2 智能電壓穩(wěn)定評估方案流程圖Fig.2 Flow chart of intelligent voltage stability assessment scheme
原始數(shù)據(jù)集中包含母線電壓幅值和相角、負荷有功/無功功率、發(fā)電機有功/無功功率、分流器無功功率、輸電線路有功/無功功率和相應的電壓穩(wěn)定指標?;赟-MRMR特征選擇過程,篩選出與電壓穩(wěn)定指標相關性較強的關鍵特征,剔除無關特征和冗余特征,降低GBDT-PL評估模型的訓練難度。
將選擇的關鍵特征作為GBDT-PL評估模型的輸入,相應的電壓穩(wěn)定指標作為評估模型的輸出,對評估模型進行離線訓練,建立電力系統(tǒng)輸入特征與電壓穩(wěn)定指標之間的映射關系。模型訓練過程中,通過網(wǎng)格化方法尋找最優(yōu)超參數(shù),最終設置GBDT-PL模型的迭代次數(shù)為500,學習率為0.1,每棵樹的葉子數(shù)目為256,L2正則化系數(shù)為0.01。
在線應用階段,若電力系統(tǒng)當前的拓撲結構未改變,則將PMU實時收集的電力系統(tǒng)運行數(shù)據(jù)輸入到訓練好的GBDT-PL模型中進行電壓穩(wěn)定評估;若電力系統(tǒng)當前的拓撲結構發(fā)生改變,則通過TCA將源域特征矩陣和目標域特征矩陣映射到再生核希爾伯特空間,基于映射后的源域數(shù)據(jù)對GBDT-PL模型進行重新訓練,使之對映射后的目標域數(shù)據(jù)輸出更為準確的評估結果。
文中采用由電力系統(tǒng)仿真軟件PSS/E提供的23節(jié)點系統(tǒng)和1648節(jié)點系統(tǒng)作為測試系統(tǒng)來驗證文中所提智能評估方案的有效性。所有性能測試均在配置為Intel Core i7 3.40-GHz CPU和8 GB RAM的計算機上進行。
P-V曲線能夠反映隨著負荷的增加,節(jié)點電壓持續(xù)降低直至電壓崩潰的過程,如圖3所示,其中A為當前運行點,B為電壓崩潰點(最大功率傳輸點),C為臨界運行點。
圖3 P-V曲線Fig.3 P-V curve
文中基于連續(xù)潮流(Continuous Power Flow,CPF)法[22-23]獲取電力系統(tǒng)P-V曲線,以此確定系統(tǒng)最大功率傳輸點,進而計算電壓穩(wěn)定裕度(Voltage Stability Margin,VSM),即:
(22)
式中Pmax為最大功率傳輸點的負荷功率;P0為當前運行點的負荷功率。
根據(jù)VSM將電力系統(tǒng)當前運行狀態(tài)分為穩(wěn)定狀態(tài)和不穩(wěn)定狀態(tài),即:
(23)
式中u為用戶自定義的閾值,可根據(jù)不同的靜態(tài)電壓安全標準進行調(diào)整。
文中選取總體準確率(Accuracy, Acc)和不穩(wěn)定樣本識別準確率(True Negative Rate, TNR)作為模型性能的評價指標。定義電力系統(tǒng)靜態(tài)電壓評估的混淆矩陣如表1所示,表1中TP表示預測正確的穩(wěn)定樣本,F(xiàn)N表示預測錯誤的穩(wěn)定樣本,F(xiàn)P表示預測錯誤的不穩(wěn)定樣本,TN表示預測正確的不穩(wěn)定樣本。Acc和TNR的表達式為:
表1 混淆矩陣Tab.1 Confusion matrix
(24)
(25)
總體準確率越高表示模型誤分類概率越小,模型評估性能越好;不穩(wěn)定樣本識別準確率越高,模型對不穩(wěn)定情況的預測越準確。
5.3.1 樣本生成
23節(jié)點測試系統(tǒng)拓撲結構如圖4所示,包含23條母線、6臺發(fā)電機和10臺變壓器。
圖4 23節(jié)點測試系統(tǒng)Fig.4 23-bus test system
文中基于PSS/E仿真軟件和Python程序進行潮流分析和數(shù)據(jù)仿真,利用MATLAB程序從潮流報表中提取電力系統(tǒng)運行特征。所有的潮流計算結果都進行越限檢查,并剔除所有出現(xiàn)過載或電壓越限的樣本。
為了生成足夠的樣本數(shù)據(jù),以10%為步長,設置70%~130%范圍內(nèi)的7種負荷水平,并對每種負荷水平的發(fā)電機和負荷增加80%~120%范圍內(nèi)的隨機擾動。然后,基于CPF確定最大功率傳輸點,進而根據(jù)式(22)和式(23)計算電壓穩(wěn)定指標,共仿真生成5 730個樣本,其中穩(wěn)定樣本3 381個,不穩(wěn)定樣本2 349個。每個樣本包含403個運行特征和相應的電壓穩(wěn)定指標。利用S-MRMR特征選擇框架進行特征選擇,最終選取30個關鍵特征作為GBDT-PL評估模型的輸入特征。
在下述的算例分析中,采用五折交叉驗證法對模型性能進行測試,隨機選取80%的樣本作為訓練集,其余20%作為測試集。
5.3.2 評估模型性能對比
為了證明GBDT-PL評估模型的優(yōu)勢,文中將其與支持向量機(Support Vector Machine,SVM)、DT、深度神經(jīng)網(wǎng)絡(Deep Neural Network,DNN)、隨機森林(Random Forest,RF)和GBDT進行對比。在此次測試中,SVM使用徑向基核函數(shù),DT使用C 4.5算法,DNN的學習率為0.001,RF的樹個數(shù)為100,GBDT的迭代次數(shù)為500,其余參數(shù)使用Scikit-learn默認值。
通過表2所示的測試結果可以看出,SVM、DT、RF和GBDT在總體準確率和不穩(wěn)定樣本識別準確率上都低于GBDT-PL;DNN的總體準確率雖然略高于GBDT-PL,但由于其模型相對復雜,參數(shù)過多,導致其訓練時間相對較長。綜合對比,GBDT-PL評估模型展現(xiàn)出優(yōu)越的整體評估性能,更適用于電力系統(tǒng)靜態(tài)電壓穩(wěn)定評估領域。
表2 不同模型性能對比Tab.2 Performance comparison of different models
5.3.3 泛化能力測試
為了分析文中所提智能電壓穩(wěn)定評估方案的有效性,通過考慮如表3所示的拓撲結構變化情況對文中所提方案進行性能測試。對于表3中6種不同的拓撲結構,采用5.3.1節(jié)中樣本生成方法生成6組不同的測試集(A,B,C,D,E,F(xiàn)),每組測試集包含1 000個樣本。相應的測試結果如表4所示,其中Acc1表示未使用遷移學習的GBDT-PL評估模型的總體準確率,Acc2表示基于遷移學習更新后的GBDT-PL評估模型的總體準確率。
表3 拓撲結構變化Tab.3 Topology changes
表4 泛化能力測試結果Tab.4 Generalization ability test results
測試結果表明,對于不同的拓撲結構,文中所提方案的評估性能未出現(xiàn)較大的波動,均能展現(xiàn)出95%以上的總體準確率。與不使用遷移學習的方案對比,文中所提智能電壓評估方案可以大幅度提升評估模型的泛化能力,使其對于電力系統(tǒng)的各種拓撲變化具有較好的魯棒性。
為了進一步分析文中所提方案應用于大電網(wǎng)時的有效性,將其應用于1648節(jié)點系統(tǒng)進行性能測試。1648節(jié)點系統(tǒng)包含1 648條母線、313臺發(fā)電機、182個分流器和2 294條線路?;?.3.1節(jié)中的樣本生成方法生成12 574個樣本,每個樣本包含37 439個運行特征。
5.4.1 特征選擇框架效果測試
為了測試文中所提S-MRMR特征選擇框架對于GBDT-PL模型性能提升的效果,選取不同數(shù)量的輸入特征進行模型性能測試,測試結果如圖5所示。當特征數(shù)量為800時,評估模型準確率為98.74%,訓練時間為60.24 s。之后再增加輸入特征,模型準確率無明顯提升,但模型訓練時間大幅度增加。文中所提S-MRMR特征選擇框架可以選擇較少特征訓練出準確率較高的評估模型,顯著縮減模型訓練所需時間。
圖5 模型性能隨特征數(shù)量變化關系Fig.5 Relationship between model performance and number of features
5.4.2 PMU測量誤差
文中所提智能電壓穩(wěn)定評估方案在實際應用時可能會受到PMU測量誤差的影響。為了分析測量誤差對文中所提方案的影響,通過在數(shù)據(jù)集中添加不同信噪比的高斯白噪聲模擬PMU測量誤差進行性能測試。根據(jù)IEEE C37.118標準,PUM測量的總矢量誤差(Total Vector Error,TVE)應小于1%[24]。在測試過程中,考慮如下兩個場景:場景1:只在測試集中添加噪聲;場景2:訓練集和測試集中均添加噪聲。
兩種場景下文中所提智能評估方案的性能測試結果如圖6所示??梢钥闯?,智能評估方案在場景2下的總體準確率高于場景1下的總體準確率。此外,隨著噪聲的增大,兩種場景下的智能評估方案性能均略有下降,但仍然保持在一個可接受的范圍(Acc>96%)。由此可見,文中所提智能評估方案對PMU測量誤差具有較強的魯棒性。
圖6 兩個場景下的性能測試結果Fig.6 Performance test results for two scenarios
文中提出了基于GBDT-PL的靜態(tài)電壓穩(wěn)定評估模型,并利用遷移學習對靜態(tài)電壓穩(wěn)定評估模型進行實時更新,提高模型的泛化能力。在23節(jié)點系統(tǒng)和1648節(jié)點系統(tǒng)進行了仿真分析,結論如下:
(1)文中提出的電壓穩(wěn)定評估模型在實際應用中可及時提供可靠的評估結果,使系統(tǒng)運行人員有足夠的反應時間執(zhí)行相應的預防控制策略,避免不必要的損失;
(2)針對評估模型泛化能力不足的問題,文中基于遷移學習對GBDT-PL模型進行實時更新,提高了評估模型在新拓撲結構下的評估準確率;
(3)為了提高模型數(shù)據(jù)處理速度,文中設計了一個基于MRMR準則和Shapley值的S-MRMR特征選擇框架。該框架能夠有效地剔除無關特征與冗余特征,大幅度降低輸入數(shù)據(jù)的維度。因此,評估模型可以使用較少的輸入特征提供準確的評估結果。