劉煉, 王強(qiáng), 陳浩
(三峽大學(xué)電氣與新能源學(xué)院, 宜昌 443002)
隨著現(xiàn)代電力系統(tǒng)的廣域互聯(lián)和電力電子設(shè)備的廣泛部署,電力系統(tǒng)運(yùn)行的不定因素劇增且運(yùn)行狀態(tài)愈發(fā)接近穩(wěn)定運(yùn)行的極限,對(duì)其進(jìn)行快速、準(zhǔn)確的暫態(tài)穩(wěn)定評(píng)估已成為保證系統(tǒng)安全穩(wěn)定運(yùn)行的重要手段[1-2]。近年來(lái),隨著同步相量測(cè)量單元(phasor measurement unit,PMU)在電網(wǎng)中的廣泛應(yīng)用,電力系統(tǒng)運(yùn)行數(shù)據(jù)的采集變得更加迅速和精確,數(shù)據(jù)量變得尤為龐大[3]。同時(shí),由于智能電網(wǎng)建設(shè)的逐步推進(jìn)和人工智能技術(shù)的飛速發(fā)展,促使基于機(jī)器學(xué)習(xí)的暫態(tài)穩(wěn)定評(píng)估方法成為電網(wǎng)安全領(lǐng)域的研究熱點(diǎn)[4-5]。
目前,常用于分析電力系統(tǒng)暫態(tài)穩(wěn)定的機(jī)器學(xué)習(xí)算法有支持向量機(jī)(support vector machine,SVM)[6-7]、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)[8-10]、決策樹(decision tree,DT)[11-12]和隨機(jī)森林(random forest,RF)[13-14]等。在文獻(xiàn)[6]中,考慮暫態(tài)穩(wěn)定評(píng)估的時(shí)效性要求,提出了一種基于SVM的預(yù)想事故篩選方法。文獻(xiàn)[9]基于遺傳算法和極限學(xué)習(xí)機(jī)對(duì)暫態(tài)穩(wěn)定評(píng)估中的特征選擇問(wèn)題進(jìn)行了探討。文獻(xiàn)[10]通過(guò)數(shù)據(jù)增強(qiáng)技術(shù)處理輸入數(shù)據(jù)存在噪聲和信息缺失的問(wèn)題,并基于深度殘差網(wǎng)絡(luò)構(gòu)建電力系統(tǒng)暫態(tài)穩(wěn)定預(yù)測(cè)模型。文獻(xiàn)[12]提出了一種由線性SVM和DT構(gòu)成的組合式暫態(tài)穩(wěn)定評(píng)估方法。文獻(xiàn)[13]為了實(shí)現(xiàn)實(shí)時(shí)的電力系統(tǒng)暫態(tài)穩(wěn)定監(jiān)測(cè),提出了一個(gè)基于迭代隨機(jī)森林的在線應(yīng)用框架。
雖然上述方法已經(jīng)取得了較好的效果,但在實(shí)際應(yīng)用過(guò)程中仍會(huì)面臨以下問(wèn)題:一方面,隨著電網(wǎng)規(guī)模的不斷擴(kuò)大,電力系統(tǒng)運(yùn)行數(shù)據(jù)的維度也在不斷增加,如何選取與暫態(tài)穩(wěn)定標(biāo)簽具有強(qiáng)相關(guān)性的關(guān)鍵特征是一個(gè)難題;另一方面,在離線訓(xùn)練過(guò)程中,由于數(shù)據(jù)庫(kù)中的穩(wěn)定樣本遠(yuǎn)多于失穩(wěn)樣本,導(dǎo)致暫態(tài)穩(wěn)定評(píng)估模型會(huì)傾向于對(duì)穩(wěn)定樣本的學(xué)習(xí),容易造成對(duì)失穩(wěn)樣本的誤判。
基于以上分析,提出一種基于特征選擇和改進(jìn)隨機(jī)森林的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法。通過(guò)最大化聯(lián)合互信息(joint mutual information maximisation,JMIM)進(jìn)行特征選擇,篩選出初始特征集中的關(guān)鍵特征子集,并基于改進(jìn)的RF構(gòu)建關(guān)鍵特征子集與暫態(tài)穩(wěn)定標(biāo)簽之間的映射關(guān)系,建立相應(yīng)的暫態(tài)穩(wěn)定評(píng)估模型。在新英格蘭10機(jī)39節(jié)點(diǎn)系統(tǒng)進(jìn)行仿真實(shí)驗(yàn),結(jié)果表明,該方法能夠較好地處理樣本數(shù)據(jù)的類別不平衡問(wèn)題,具有較高的評(píng)估精度和較強(qiáng)的泛化能力。
電力系統(tǒng)在運(yùn)行過(guò)程中,PMU會(huì)實(shí)時(shí)采集系統(tǒng)運(yùn)行的電氣量信息。常用于反映電力系統(tǒng)運(yùn)行狀態(tài)的特征包括節(jié)點(diǎn)的電壓幅值/相角、負(fù)荷節(jié)點(diǎn)的有功/無(wú)功功率、發(fā)電機(jī)節(jié)點(diǎn)的有功/無(wú)功功率和線路傳輸?shù)挠泄?無(wú)功功率等。這些特征可以組成一個(gè)電力系統(tǒng)運(yùn)行的樣本o,通過(guò)結(jié)合多個(gè)運(yùn)行樣本,可以將初始特征集構(gòu)建為矩陣形式,即
(1)
式(1)中:u為初始輸入樣本的數(shù)量;v為包含電壓、相角、有功/無(wú)功功率等運(yùn)行狀態(tài)信息的特征維度。
基于機(jī)器學(xué)習(xí)算法建立暫態(tài)穩(wěn)定評(píng)估模型的本質(zhì)就是建立特征數(shù)據(jù)與暫態(tài)穩(wěn)定標(biāo)簽之間的映射關(guān)系。因此,選擇合適的輸入特征能夠降低評(píng)估模型的計(jì)算負(fù)擔(dān),提高模型計(jì)算的效率。本文中采用JMIM對(duì)初始樣本進(jìn)行特征選擇,JMIM是一種基于聯(lián)合互信息和“最大最小原則”的特征選擇方法,能夠有效處理某些特征的高估問(wèn)題[15]。JMIM進(jìn)行特征選擇的原理介紹如下。
對(duì)于變量X=[x1,x2,…,xm],其熵的計(jì)算式為
(2)
式(2)中:p(xi)為xi在X中的概率密度函數(shù)。信息熵越大,表明相關(guān)變量的信息含量越大,不確定性就越高。
對(duì)于X和變量C=[c1,c2,…,cn],X和C之間的條件熵被定義為
(3)
式(3)中:p(xi,cj)為xi和cj的聯(lián)合概率密度函數(shù);p(xi|cj)為已知cj條件下xi的條件概率密度函數(shù)。
熵的大小用于衡量變量之間的穩(wěn)定性,而互信息的大小用于衡量變量之間的相關(guān)性。根據(jù)式(2)和式(3),將變量X和C之間的互信息定義為
I(X;C)=H(X)-H(X|C)=
(4)
式(4)中:p(cj)為cj的概率密度函數(shù)。互信息I(X;C)越大,表明變量X和C之間的相關(guān)性越強(qiáng)。如果兩個(gè)隨機(jī)變量之間相互獨(dú)立,則它們的互信息值為0。
當(dāng)加入另一條件Y=[y1,y2,…,yn]時(shí),在Y條件下X和C的條件互信息定義為
I(X;C|Y)=H(X|C)-H(X|C,Y)
(5)
根據(jù)式(4)和式(5),將X、C和Y之間的聯(lián)合互信息定義為
I(X,Y;C)=I(X;C|Y)+I(C;Y)
(6)
聯(lián)合互信息I(X,Y;C)考慮了X、Y整體和變量C之間的聯(lián)系,I(X,Y;C)越大,表明X、Y和C之間的相關(guān)性越強(qiáng)。
基于以上分析,文中將電力系統(tǒng)的初始特征集定義為F={f1,f2,…,fn},需要選擇的特征子集定義為S,且fi∈F-S,類別為C。JMIM的計(jì)算公式為
fJMIM=argmaxfi∈F-S{minfs∈S[I(fi,fs;C)]}
(7)
式(7)中:I(fi,fs;C)表示特征fi和fs以及類別C之間的聯(lián)合互信息;minfs∈SI(fi,fs;C)表示每個(gè)特征fi加入到集合S時(shí)計(jì)算I(fi,fs;C)得到的最小值,稱為最小聯(lián)合互信息。其中,I(fi,fs;C)的計(jì)算公式為
(8)
式(8)中:p(fi,fs,cj|fs)為已知fs條件下,fi、fs和cj的聯(lián)合條件概率密度函數(shù);p(fi|fs)和p(cj|fs)分別為已知fs條件下,fi和cj的條件概率密度函數(shù)。
每個(gè)特征fi計(jì)算得到一個(gè)最小聯(lián)合互信息,最終的集合為{minfs∈SI(fi,fs;C)}。JMIM選擇集合{minfs∈SI(fi,fs;C)}中使最小聯(lián)合互信息值最大的特征作為新選擇的特征,并通過(guò)如下迭代貪婪搜索算法在特征空間內(nèi)尋找一個(gè)大小為k的特征子集S。
改進(jìn)的RF算法整體流程如圖1所示,主要包括bootstrap抽樣方法的改進(jìn)和DT的加權(quán)投票。
R、R′分別為初始樣本和抽取樣本的不平衡度;w1,w2,…,wT為決策樹的投票權(quán)重圖1 加權(quán)隨機(jī)森林算法Fig.1 Weighted random forest algorithm
RF是一種集成學(xué)習(xí)算法,由多棵DT組成[16]。傳統(tǒng)的RF使用bootstrap進(jìn)行有放回的隨機(jī)抽樣,每次隨機(jī)抽取初始樣本的2/3作為一個(gè)子集訓(xùn)練一棵樹。bootstrap抽樣是RF隨機(jī)性的保證,但這存在一個(gè)問(wèn)題,假設(shè)初始樣本集P為類別不平衡數(shù)據(jù)集,樣本的不平衡度為R,其計(jì)算式為
(9)
式(9)中:Pmax和Pmin分別表示初始樣本中的多數(shù)類和少數(shù)類樣本。
在bootstrap抽樣過(guò)程中,若隨機(jī)抽取的子集的不平衡度比R大,表明該子集的類別不平衡問(wèn)題較為突出,由此類子集訓(xùn)練得到的DT會(huì)更加傾向于對(duì)多數(shù)類樣本的學(xué)習(xí),不利于對(duì)少數(shù)類樣本的識(shí)別。為了降低抽樣過(guò)程的影響,文中通過(guò)在bootstrap抽樣中添加約束條件,可以保證在每次抽樣過(guò)程中至少抽取2/3的少數(shù)類樣本。該約束條件為
(10)
(11)
式中:P′max和P′min分別表示抽取的多數(shù)類和少數(shù)類樣本。
傳統(tǒng)的RF不加以區(qū)分的對(duì)待所有的DT,導(dǎo)致分類性能不同的DT具有相同的投票權(quán)重。為了提高RF對(duì)少數(shù)類樣本的識(shí)別能力,現(xiàn)提出一種加權(quán)隨機(jī)森林算法(weighted random forest,WRF)。在DT訓(xùn)練階段,通過(guò)評(píng)估每棵DT的分類性能,為能夠準(zhǔn)確分類少數(shù)類樣本的DT賦予一個(gè)更高的權(quán)重,并通過(guò)加權(quán)投票的方式獲得最終的預(yù)測(cè)結(jié)果。文中將WRF的預(yù)測(cè)結(jié)果定義為
(12)
式(12)中:N為測(cè)試集;T為DT的數(shù)量;I(·)為指示函數(shù);ft(N)為第t棵DT的預(yù)測(cè)結(jié)果;y表示類別;ωt為第t棵DT的投票權(quán)重。當(dāng)DT的預(yù)測(cè)結(jié)果為真時(shí),指示函數(shù)I(·)的值為1,反之為0。
首先,列出如表1所示的混淆矩陣。其中,TP表示將穩(wěn)定樣本判別為穩(wěn)定樣本,F(xiàn)N表示將穩(wěn)定樣本判別為失穩(wěn)樣本,F(xiàn)P表示將失穩(wěn)樣本判別為穩(wěn)定樣本,TN表示將失穩(wěn)樣本判別為失穩(wěn)樣本。
表1 混淆矩陣Table 1 Confusion matrix
文中使用每棵DT對(duì)失穩(wěn)樣本分類的精確率Pre(precision)和召回率Rec(recall)的調(diào)和平均值F1作為該樹的權(quán)重,將每棵樹的投票權(quán)值ωt定義為
(13)
(14)
(15)
F1越大,表明該決策樹對(duì)少數(shù)類樣本的分類性能越好。
基于JMIM和WRF的在線暫態(tài)穩(wěn)定評(píng)估流程如圖2所示,主要包括離線訓(xùn)練和在線應(yīng)用兩個(gè)階段。
圖2 在線暫態(tài)穩(wěn)定評(píng)估流程Fig.2 Online transient stability assessment process
3.1.1 數(shù)據(jù)庫(kù)生成
通過(guò)電力系統(tǒng)仿真軟件PSS/E進(jìn)行時(shí)域暫態(tài)仿真,生成一個(gè)包含多個(gè)樣本的暫態(tài)穩(wěn)定數(shù)據(jù)庫(kù),并為每個(gè)樣本附上其對(duì)應(yīng)的暫態(tài)穩(wěn)定標(biāo)簽。
3.1.2 特征選擇
通過(guò)仿真生成的初始特征集中包含了各發(fā)電機(jī)、母線和輸電線路等關(guān)鍵設(shè)備的運(yùn)行狀態(tài)信息,特征維度較高。為了降低模型計(jì)算的復(fù)雜度,通過(guò)JMIM挖掘初始特征之間的相關(guān)性,剔除冗余特征,篩選出一個(gè)與暫態(tài)穩(wěn)定標(biāo)簽具有強(qiáng)相關(guān)性的關(guān)鍵特征子集。
3.1.3 模型訓(xùn)練及測(cè)試
基于篩選的關(guān)鍵特征子集,對(duì)WRF模型進(jìn)行訓(xùn)練及測(cè)試,建立一個(gè)能夠準(zhǔn)確反映關(guān)鍵特征數(shù)據(jù)與暫態(tài)穩(wěn)定標(biāo)簽之間的映射關(guān)系離線暫態(tài)穩(wěn)定評(píng)估模型。
3.1.4 知識(shí)庫(kù)建立
考慮到電力系統(tǒng)是一個(gè)時(shí)變的大系統(tǒng),經(jīng)常會(huì)因?yàn)闄z修等原因造成系統(tǒng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)發(fā)生變化。由于初始訓(xùn)練樣本中不可能涵蓋電力系統(tǒng)所有的運(yùn)行拓?fù)鋱?chǎng)景,當(dāng)電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)發(fā)生改變時(shí),原模型會(huì)出現(xiàn)評(píng)估精度降低甚至變得不適用。因此,需要進(jìn)行多種電力系統(tǒng)拓?fù)浣Y(jié)構(gòu)下的仿真,針對(duì)不同的運(yùn)行場(chǎng)景進(jìn)行暫態(tài)穩(wěn)定分析,建立相對(duì)應(yīng)的離線評(píng)估模型。然后,將所有的離線模型集成到一個(gè)知識(shí)庫(kù)中,以備后續(xù)出現(xiàn)緊急事故時(shí)的快速調(diào)用。
在應(yīng)用階段,首先通過(guò)控制中心服務(wù)器判斷電力系統(tǒng)的網(wǎng)絡(luò)架構(gòu),并從知識(shí)庫(kù)中調(diào)用與當(dāng)前網(wǎng)絡(luò)拓?fù)湎鄬?duì)應(yīng)的暫態(tài)穩(wěn)定評(píng)估模型。選擇PMU采集的關(guān)鍵特征數(shù)據(jù)輸入離線訓(xùn)練好的評(píng)估模型,實(shí)時(shí)監(jiān)測(cè)系統(tǒng)的穩(wěn)定狀況。當(dāng)系統(tǒng)被判別為穩(wěn)定運(yùn)行時(shí),則保持對(duì)系統(tǒng)運(yùn)行狀態(tài)的持續(xù)監(jiān)測(cè);當(dāng)系統(tǒng)被判別為失穩(wěn)運(yùn)行時(shí),則應(yīng)立即采取控制措施。
由于電力系統(tǒng)長(zhǎng)期處于穩(wěn)定運(yùn)行狀態(tài),導(dǎo)致電力系統(tǒng)數(shù)據(jù)庫(kù)中穩(wěn)定樣本數(shù)量遠(yuǎn)多于失穩(wěn)樣本,若模型能夠較好地分類穩(wěn)定樣本,即使對(duì)失穩(wěn)樣本的識(shí)別能力較低,模型也能獲得較高的總體分類精度。而在電力系統(tǒng)的暫態(tài)穩(wěn)定評(píng)估中,將失穩(wěn)樣本判別為穩(wěn)定樣本這類誤判情況對(duì)系統(tǒng)的影響更大。因此,文中采用WRF模型分類的總體準(zhǔn)確率Acc(accuracy)和對(duì)失穩(wěn)樣本識(shí)別的召回率Rec兩個(gè)指標(biāo)作為模型性能的評(píng)價(jià)指標(biāo)。其中,Rec用于反映所有失穩(wěn)樣本被正確識(shí)別的比例,其計(jì)算式見式(15),Acc為正確分類的穩(wěn)定樣本和失穩(wěn)樣本占所有樣本的比例,其計(jì)算式為
(16)
為了驗(yàn)證所提方法的有效性,將圖3所示的新英格蘭10機(jī)39節(jié)點(diǎn)系統(tǒng)作為測(cè)試系統(tǒng)。所有測(cè)試均是在一臺(tái)配置Intel Core i7 3.40-GHz CPU和8 GB運(yùn)行內(nèi)存的電腦上進(jìn)行。
圖3 新英格蘭10機(jī)39節(jié)點(diǎn)系統(tǒng)Fig.3 New England 10-machine 39-bus system
在仿真過(guò)程中,將負(fù)荷模型設(shè)置為恒阻抗模型,通過(guò)在不同的線路上設(shè)置三相短路故障來(lái)模擬多種運(yùn)行工況。模擬總的負(fù)荷為[80%,120%]增長(zhǎng)變化,以5%為步長(zhǎng),并根據(jù)負(fù)荷水平相應(yīng)調(diào)整發(fā)電機(jī)的出力。將故障的持續(xù)時(shí)間分別設(shè)置為0.1、0.15、0.2、0.25、0.3 s,單次仿真時(shí)長(zhǎng)設(shè)置為10 s。文中以任意兩臺(tái)發(fā)電機(jī)的功角是否超過(guò)360°作為暫態(tài)穩(wěn)定的判斷依據(jù)。最終生成了4 680個(gè)樣本,其中穩(wěn)定樣本3 694,失穩(wěn)樣本986。隨機(jī)選取仿真樣本的80%作為訓(xùn)練集,其余20%作為測(cè)試集。
文中通過(guò)JMIM方法分別選擇不同維度的特征進(jìn)行模型性能的測(cè)試,測(cè)試結(jié)果如圖4所示。結(jié)果表明,隨著特征數(shù)量的增多,模型的評(píng)估精度逐步上升,最后趨于穩(wěn)定。由于基于機(jī)器學(xué)習(xí)的暫態(tài)穩(wěn)定評(píng)估模型需要經(jīng)常進(jìn)行更新迭代,在考慮精度的同時(shí),模型的訓(xùn)練時(shí)間需越短越好。因此,文中考慮時(shí)間與精度的權(quán)衡,最終選擇初始特征的42維作為關(guān)鍵特征子集。
圖4 特征選擇的影響Fig.4 Influence of feature selection
為了體現(xiàn)文中所提特征選擇方法的優(yōu)越性,將其與互信息特征選擇(mutual information feature selection,MIFS)[17]、聯(lián)合互信息(joint mutual information,JMI)[18]和最大相關(guān)最小冗余(maximum relevance minimum redundancy,MRMR)[19]三種特征選擇方法進(jìn)行對(duì)比測(cè)試?;诓煌椒ㄟx擇的子集,模型的性能測(cè)試結(jié)果如表2所示。
表2 不同特征選擇方法的對(duì)比Table 2 Comparison of different feature selection methods
MIFS和MRMR在特征選擇時(shí)只考慮單個(gè)特征加入的互信息值,而無(wú)法排除多個(gè)特征相關(guān)的情況,因此模型的評(píng)估精度總體偏低。JMIM和JMI不僅考慮了多個(gè)特征相關(guān)的情況,并且在計(jì)算特征之間互信息值的同時(shí)考慮了類別標(biāo)簽的影響,JMIM是JMI方法的改進(jìn),JMIM能夠緩解JMI在特征選擇過(guò)程中對(duì)部分特征的高估問(wèn)題??傮w來(lái)看,基于JMIM選擇的特征子集,模型能夠獲得最優(yōu)的評(píng)估性能,分類的總體準(zhǔn)確率和對(duì)失穩(wěn)樣本識(shí)別的召回率分別高達(dá)99.07%和98.87%。
將WRF模型與不同的機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比測(cè)試,主要包括ANN、SVM、DT和傳統(tǒng)的RF,所有的機(jī)器學(xué)習(xí)模型均基于Scikit-learn搭建。在測(cè)試過(guò)程中,ANN使用單隱藏層網(wǎng)絡(luò)結(jié)構(gòu),隱藏層的激活函數(shù)使用的ReLU激活函數(shù),SVM使用多項(xiàng)式核函數(shù),DT使用C4.5算法。所有模型在訓(xùn)練過(guò)程中使用相同的輸入特征。其中,RF和WRF在不同DT數(shù)量下評(píng)估的準(zhǔn)確率如圖5所示。結(jié)果表明,當(dāng)DT數(shù)量達(dá)到100左右時(shí),模型的評(píng)估精度趨于穩(wěn)定。因此,文中將RF和WRF的DT數(shù)量均設(shè)置為100。
圖5 不同決策樹數(shù)量下的準(zhǔn)確率Fig.5 Accuracy under different number of decision trees
不同機(jī)器學(xué)習(xí)模型的性能測(cè)試結(jié)果如表3所示??傮w來(lái)看,RF為基于樹的集成模型,其評(píng)估精度優(yōu)于SVM、DT和ANN這類淺層模型。此外,由于RF需要經(jīng)過(guò)多次迭代,模型訓(xùn)練的時(shí)間復(fù)雜度也相對(duì)更高。與傳統(tǒng)的RF相比,bootstrap抽樣的改進(jìn)和加權(quán)投票的方式雖然增加了模型的訓(xùn)練時(shí)間,但WRF分類的總體準(zhǔn)確率和對(duì)失穩(wěn)樣本識(shí)別的召回率分別提高了0.22%和1.25%,表明算法的改進(jìn)在一定程度增強(qiáng)了RF對(duì)失穩(wěn)樣本的識(shí)別能力,提高了模型的總體分類精度。
表3 不同模型的性能對(duì)比Table 3 Performance comparison of different models
PMU在數(shù)據(jù)采集過(guò)程中,可能會(huì)出現(xiàn)兩類數(shù)據(jù)異常情況:①PMU在監(jiān)測(cè)過(guò)程中可能會(huì)產(chǎn)生測(cè)量誤差,這會(huì)給數(shù)據(jù)疊加一定的噪聲;②由于PMU發(fā)生故障和通信鏈路延遲等原因,可能會(huì)造成部分監(jiān)測(cè)數(shù)據(jù)缺失。本文中針對(duì)這兩種情況分別進(jìn)行了模型性能的測(cè)試。
根據(jù)IEEE C37.118標(biāo)準(zhǔn),PMU測(cè)量的總矢量誤差應(yīng)小于1%[20]。文中通過(guò)在數(shù)據(jù)集中加入不同信噪比(signal to noise ratio,SNR)的高斯白噪聲來(lái)模擬PMU的測(cè)量誤差。其中,噪聲為20 dB對(duì)應(yīng)的測(cè)量誤差為1%。文中主要考慮了以下兩種測(cè)試場(chǎng)景:①在測(cè)試集加入噪聲;②在訓(xùn)練集和測(cè)試集中同時(shí)加入噪聲。
兩種場(chǎng)景下WRF分類的準(zhǔn)確率如圖6所示,對(duì)失穩(wěn)樣本識(shí)別的召回率如圖7所示。結(jié)果表明,由于WRF為基于樹的集成模型,原本就對(duì)噪聲具有一定的魯棒性。在上述兩種場(chǎng)景下,隨著噪聲的增加,WRF仍能夠維持評(píng)估的總體準(zhǔn)確率在97%以上,雖然WRF對(duì)失穩(wěn)樣本識(shí)別的召回率下降幅度偏高,但仍能維持在一個(gè)可接受的范圍,表明了針對(duì)數(shù)據(jù)存在噪聲的問(wèn)題,本文所提方法具有一定的魯棒性。此外,當(dāng)訓(xùn)練集和測(cè)試集都存在噪聲時(shí),模型能夠給出更加穩(wěn)定的評(píng)估結(jié)果。
圖6 不同噪聲條件下的準(zhǔn)確率Fig.6 Accuracy under different noise conditions
圖7 不同噪聲條件下的召回率Fig.7 Recall rate under different noise conditions
為了檢驗(yàn)數(shù)據(jù)缺失對(duì)WRF模型評(píng)估性能的影響,在測(cè)試集中考慮了10%、20%、30%和40%四種比例的特征缺失情況。其中,缺失特征的選擇是隨機(jī)的。測(cè)試的結(jié)果如表4所示。結(jié)果表明,隨著特征缺失比例的增加,對(duì)WRF模型的負(fù)面影響也越來(lái)越大。由于WRF由多棵樹組成,每棵樹都是隨機(jī)選取多個(gè)特征進(jìn)行訓(xùn)練,這在一定程度緩解了特征缺失的影響。總體來(lái)看,WRF的評(píng)估精度并不會(huì)因?yàn)樘卣魅笔П壤脑黾佣霈F(xiàn)大幅度下降,仍能夠維持評(píng)估的精度在96%以上,表明了針對(duì)數(shù)據(jù)缺失問(wèn)題,WRF具有一定的容錯(cuò)性。
表4 不同數(shù)據(jù)缺失下的性能測(cè)試Table 4 Performance test under different data missing
由于電力系統(tǒng)數(shù)據(jù)庫(kù)中很難涵蓋電力系統(tǒng)所有的運(yùn)行場(chǎng)景,針對(duì)新的運(yùn)行場(chǎng)景,模型的評(píng)估性能也會(huì)發(fā)生改變。因此,模型的泛化能力也是衡量模型性能的重要指標(biāo)。
基于4.1節(jié)所提的樣本生成方法,文中通過(guò)考慮多種未包含在初始數(shù)據(jù)庫(kù)中的電力系統(tǒng)拓?fù)浣Y(jié)構(gòu)進(jìn)行模型的泛化能力測(cè)試。針對(duì)每種拓?fù)浣Y(jié)構(gòu)仿真生成300個(gè)新樣本,將新樣本直接輸入WRF進(jìn)行性能測(cè)試。其中,電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)變化如表5所示,模型的泛化能力測(cè)試結(jié)果如表6所示。結(jié)果表明,雖然拓?fù)浣Y(jié)構(gòu)的變化在一定程度影響了WRF評(píng)估的準(zhǔn)確性,但模型仍能夠維持評(píng)估的精度在94%以上,表明針對(duì)未知的電力系統(tǒng)拓?fù)鋱?chǎng)景,文中所提模型具有一定的泛化能力。
表5 拓?fù)浣Y(jié)構(gòu)的變化Table 5 Changes of topological structure
表6 不同拓?fù)浣Y(jié)構(gòu)下的評(píng)估精度Table 6 Assessment accuracy under different topologies
為了進(jìn)一步提高電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估的準(zhǔn)確性,文中提出了一種基于JMIM和WRF的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法。在新英格蘭10機(jī)39節(jié)點(diǎn)系統(tǒng)對(duì)所提方法的性能進(jìn)行仿真驗(yàn)證,結(jié)果表明:
(1)采用JMIM方法挖掘電網(wǎng)運(yùn)行數(shù)據(jù)之間的相關(guān)性,能夠有效降低數(shù)據(jù)的維度。JMIM能夠篩選一個(gè)與暫態(tài)穩(wěn)定標(biāo)簽具有強(qiáng)相關(guān)性的關(guān)鍵特征子集,有利于降低后續(xù)模型訓(xùn)練的時(shí)間復(fù)雜度,提高計(jì)算效率。
(2)通過(guò)在bootstrap抽樣中添加約束條件和DT的加權(quán)處理,降低了訓(xùn)練樣本類別不平衡帶來(lái)的影響。與ANN、DT、SVM和傳統(tǒng)的RF相比,文中的WRF模型對(duì)失穩(wěn)樣本的識(shí)別能力更強(qiáng),能夠獲得更高的評(píng)估精度。
(3)針對(duì)未知的電力系統(tǒng)運(yùn)行拓?fù)鋱?chǎng)景以及輸入數(shù)據(jù)存在噪聲和數(shù)據(jù)缺失問(wèn)題,文中所提WRF模型的評(píng)估精度不會(huì)出現(xiàn)大幅度下降,仍能夠給出相對(duì)穩(wěn)定的評(píng)估結(jié)果,具有較強(qiáng)的魯棒性和泛化能力。