王 強(qiáng),劉 煉,陳 浩
(三峽大學(xué)電氣與新能源學(xué)院,宜昌 443002)
隨著現(xiàn)代電網(wǎng)的廣域互聯(lián)和大規(guī)模新能源的接入,電力系統(tǒng)運(yùn)行面臨的風(fēng)險(xiǎn)也在不斷增加,快速、準(zhǔn)確的暫態(tài)穩(wěn)定評(píng)估已成為保證系統(tǒng)安全穩(wěn)定運(yùn)行的重要手段[1]。傳統(tǒng)用于分析電力系統(tǒng)暫態(tài)穩(wěn)定的方法有時(shí)域仿真法[2]和直接法[3]。其中:時(shí)域仿真法計(jì)算速度較慢,難以適應(yīng)在線應(yīng)用的需求;直接法雖然計(jì)算速度快,但對(duì)于復(fù)雜系統(tǒng),其能量函數(shù)構(gòu)造困難,模型的適應(yīng)性較差。
近年來(lái),廣域測(cè)量系統(tǒng)的不斷發(fā)展促進(jìn)了同步相量測(cè)量單元PMU(phasor measurement unit)在電網(wǎng)中的廣泛應(yīng)用。PMU能夠快速采集電力系統(tǒng)中各種關(guān)鍵設(shè)備的運(yùn)行狀態(tài)信息,為在線暫態(tài)穩(wěn)定預(yù)測(cè)創(chuàng)造了條件[4-5]。并且,PMU采集的海量數(shù)據(jù)為人工智能方法在電力系統(tǒng)中的應(yīng)用提供了數(shù)據(jù)支撐,掀起了機(jī)器學(xué)習(xí)在暫態(tài)穩(wěn)定評(píng)估領(lǐng)域的研究熱潮[6-8]。
基于機(jī)器學(xué)習(xí)的暫態(tài)穩(wěn)定評(píng)估方法不需要建立復(fù)雜的數(shù)學(xué)模型,主要通過(guò)在離線階段訓(xùn)練大量的樣本建立特征數(shù)據(jù)與暫態(tài)穩(wěn)定指標(biāo)之間的映射關(guān)系,然后將訓(xùn)練好的模型應(yīng)用于在線暫態(tài)穩(wěn)定預(yù)測(cè)。常用于分析電力系統(tǒng)暫態(tài)穩(wěn)定的機(jī)器學(xué)習(xí)方法有神經(jīng)網(wǎng)絡(luò)[9-10]、支持向量機(jī)SVM(support vector machine)[11-12]、決策樹DT(decision tree)[13-14]和深度學(xué)習(xí)[15-17]等。雖然上述方法已經(jīng)取得了較多的成果,但仍存在著不足之處。其中:DT和SVM由于模型結(jié)構(gòu)簡(jiǎn)單,對(duì)數(shù)據(jù)的挖掘能力有限,其評(píng)估精度仍存在提升的空間;神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)模型屬于“黑箱模型”,模型的結(jié)構(gòu)較為復(fù)雜,導(dǎo)致模型離線更新的成本較高,很難應(yīng)用于實(shí)際。
此外,機(jī)器學(xué)習(xí)方法在應(yīng)用過(guò)程中,通常還會(huì)面臨以下問(wèn)題:一方面,隨著電網(wǎng)規(guī)模的不斷擴(kuò)大,電力系統(tǒng)運(yùn)行數(shù)據(jù)的維度也在不斷增加,如何篩選初始樣本中的關(guān)鍵運(yùn)行特征是暫態(tài)穩(wěn)定評(píng)估中的一個(gè)難題;另一方面,基于機(jī)器學(xué)習(xí)的暫態(tài)穩(wěn)定評(píng)估方法通常只是評(píng)估系統(tǒng)的穩(wěn)定與否,并未給出系統(tǒng)的穩(wěn)定裕度信息,容易造成低暫態(tài)穩(wěn)定裕度情況下由于預(yù)防控制措施采取不及時(shí)而導(dǎo)致電力系統(tǒng)出現(xiàn)暫態(tài)失穩(wěn)。
基于上述分析,本文提出了一種基于關(guān)系探索和核-樹聯(lián)合提升KTBoost(combined kernel and tree boosting)的暫態(tài)穩(wěn)定裕度評(píng)估方法。首先,通過(guò)分析特征與目標(biāo)變量之間的相關(guān)性以及特征之間的冗余性和協(xié)同性,篩選出初始特征集中的關(guān)鍵特征子集。然后,使用關(guān)鍵特征數(shù)據(jù)及其對(duì)應(yīng)的暫態(tài)穩(wěn)定裕度指標(biāo)訓(xùn)練KTBoost模型,構(gòu)建KTBoost驅(qū)動(dòng)的暫態(tài)穩(wěn)定裕度評(píng)估模型。最后,在新英格蘭10機(jī)39節(jié)點(diǎn)系統(tǒng)和1648節(jié)點(diǎn)系統(tǒng)進(jìn)行仿真實(shí)驗(yàn),驗(yàn)證了該方法的準(zhǔn)確性和有效性。
暫態(tài)穩(wěn)定裕度TSM(transient stability margin)用于反映電力系統(tǒng)的暫態(tài)穩(wěn)定水平,本文通過(guò)引入電力系統(tǒng)故障的極限清除時(shí)間CCT(critical clear?ing time)來(lái)構(gòu)建每個(gè)運(yùn)行點(diǎn)的暫態(tài)穩(wěn)定裕度指標(biāo)。CCT是指電力系統(tǒng)故障后可以恢復(fù)穩(wěn)定運(yùn)行所允許的最大故障切除時(shí)間,CCT越長(zhǎng),表明系統(tǒng)維持穩(wěn)定運(yùn)行的能力越強(qiáng)。文獻(xiàn)[18]將CCT作為電力系統(tǒng)的暫態(tài)穩(wěn)定裕度指標(biāo),提出了一種基于Elastic Net的暫態(tài)穩(wěn)定裕度評(píng)估方法;文獻(xiàn)[19]使用不同故障位置的CCT與故障清除時(shí)間的差值來(lái)表征電力系統(tǒng)的穩(wěn)定水平,并采用隨機(jī)森林RF(random for?est)實(shí)現(xiàn)暫態(tài)穩(wěn)定裕度的回歸預(yù)測(cè)。基于上述研究,本文將暫態(tài)穩(wěn)定裕度指標(biāo)構(gòu)建為
式中:TCCT為故障的極限清除時(shí)間;TACT為故障的實(shí)際清除時(shí)間。當(dāng)TSM>0時(shí),表明系統(tǒng)處于穩(wěn)定運(yùn)行,反之則表明系統(tǒng)失穩(wěn)。TSM越大,則系統(tǒng)的穩(wěn)定性越強(qiáng)。本文采用二分法計(jì)算故障的CCT,將能夠保持系統(tǒng)穩(wěn)定運(yùn)行的最長(zhǎng)清除時(shí)間作為該故障位置的CCT。在CCT的求解過(guò)程中,以任意兩臺(tái)發(fā)電機(jī)的最大功角差是否超過(guò)360°作為系統(tǒng)穩(wěn)定的判斷依據(jù)。
1.2.1 初始輸入特征
1.2.2 關(guān)鍵特征的選擇
由于初始特征中包含了許多冗余重復(fù)的信息,若將其作為機(jī)器學(xué)習(xí)模型的輸入,將會(huì)極大程度地增加模型的計(jì)算負(fù)擔(dān),因此需要進(jìn)行特征降維。最大信息系數(shù)MIC(maximal information coefficient)是一種基于互信息的關(guān)系探索方法,常用于挖掘變量之間的隱含關(guān)系[20]。MIC的基本思想是將兩個(gè)變量的關(guān)系離散到一個(gè)二維空間并通過(guò)散點(diǎn)圖進(jìn)行表示。給定一個(gè)數(shù)據(jù)集D={(X,Y)}={(x1,y1),(x2,y2),???,(xn,yn)},其中n為樣本的數(shù)量。首先,將xi和yi構(gòu)成的散點(diǎn)圖進(jìn)行x行y列網(wǎng)格化,再根據(jù)兩個(gè)變量在網(wǎng)格中的近似概率密度分布,分別計(jì)算這兩個(gè)變量的互信息。其中,網(wǎng)格的劃分方式有很多種,求取不同網(wǎng)格劃分下互信息的最大值作為最終的MIC。MIC的計(jì)算公式為
式中:a、b為在x軸和y軸方向上劃分格子的個(gè)數(shù);I(X;Y)為變量X、Y之間的互信息;B為網(wǎng)格劃分的閾值,通常設(shè)置為n0.6。MIC∈[0,1],MIC越大,表明變量之間的相關(guān)性越強(qiáng)。
雖然MIC能夠篩選出與目標(biāo)變量具有強(qiáng)相關(guān)性的關(guān)鍵特征,但在考慮相關(guān)性的同時(shí),還應(yīng)考慮特征之間的冗余性和協(xié)同性。為此,本文提出了一種基于施密特正交化GSO(Gram-Schmidt orthonor?malization)[21]和信息增益 IG(information gain)[22]的GSO-MIC-IG特征選擇框架。
首先,通過(guò)GSO分析變量之間的冗余度。假設(shè)F為包含N個(gè)特征的初始特征集,需要選擇的特征子集為S={f1,f2,…,fm},其中,第i次選擇的特征為fi,fi∈F-S,目標(biāo)變量為Y。將fi關(guān)于特征子集S的正交化變量,定義為
式中:‖v‖為正交化向量v的模;GSO(fi,S)為表征變量fi獨(dú)立于已選特征子集S之外的信息。通過(guò)計(jì)算GSO(fi,S)與目標(biāo)變量Y之間的MIC[GSO(fi,S),Y]來(lái)衡量待選變量fi與子集S的相關(guān)度。MIC[GSO(fi,S),Y]越大,表明fi所包含獨(dú)立于已選子集S的信息越多,對(duì)子集S越重要。通過(guò)分析特征fi獨(dú)立于子集S之外的信息間接考慮了特征之間的冗余度,避免了無(wú)關(guān)冗余信息的干擾。
在分析特征之間冗余性的同時(shí),還需對(duì)特征之間的協(xié)同作用進(jìn)行分析。對(duì)于特征fi、fS以及目標(biāo)變量Y,將這三者的協(xié)同增益定義為
式中:I([fi,fS],Y)為特征fi和fS協(xié)同作用時(shí)與Y的互信息,I(fi,Y)和I(fS,Y)分別為fi和fS單獨(dú)作用時(shí)與Y的互信息。當(dāng)IG(fi,fS,Y)≥0時(shí),表明特征fi和fS之間存在協(xié)同作用;反之,則表明fi和fS對(duì)于目標(biāo)變量Y存在冗余。將特征fi和子集S對(duì)于Y的協(xié)同度VI(variable interaction)定義[23]為
結(jié)合上述冗余性和協(xié)同性分析過(guò)程,文中所提特征選擇框架的整體流程如下所示。
KTBoost[24]是一種結(jié)合核提升和樹提升的新型Boosting算法,其基本思想是通過(guò)回歸樹和再生核希爾伯特空間RKHS(reproducing kernel Hilbert space)函數(shù)相結(jié)合,從而獲得學(xué)習(xí)能力更強(qiáng)的強(qiáng)學(xué)習(xí)器。KTBoost在每一次增強(qiáng)迭代中,首先通過(guò)牛頓法或梯度下降法來(lái)學(xué)習(xí)回歸樹和RKHS函數(shù),然后選擇使經(jīng)驗(yàn)風(fēng)險(xiǎn)最低的基學(xué)習(xí)器加入到集成模型中。KTBoost算法的工作原理如下。
基于關(guān)系探索和KTBoost的暫態(tài)穩(wěn)定裕度評(píng)估流程如圖1所示,包括離線訓(xùn)練和在線應(yīng)用2個(gè)階段。
圖1 暫態(tài)穩(wěn)定裕度評(píng)估流程Fig.1 Process of assessment on transient stability margin
(1)初始數(shù)據(jù)庫(kù)。準(zhǔn)備一個(gè)可靠且豐富的初始數(shù)據(jù)庫(kù)是構(gòu)建準(zhǔn)確映射關(guān)系的前提。文中借助電力系統(tǒng)仿真軟件PSS/E[25]進(jìn)行電力系統(tǒng)預(yù)想事故的時(shí)域仿真,得到包含多個(gè)樣本的初始數(shù)據(jù)庫(kù),并通過(guò)第1.1節(jié)所提方法計(jì)算每個(gè)樣本對(duì)應(yīng)的暫態(tài)穩(wěn)定裕度指標(biāo)。
(2)特征選擇。為了降低模型的計(jì)算復(fù)雜度,文中通過(guò)第1.2小節(jié)提出的方法對(duì)初始數(shù)據(jù)進(jìn)行降維,篩選出具有強(qiáng)相關(guān)性、低冗余性和高協(xié)同度的關(guān)鍵特征子集。
(3)模型訓(xùn)練及測(cè)試。將特征選擇后的數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集對(duì)KTBoost模型進(jìn)行訓(xùn)練及測(cè)試,構(gòu)建能夠準(zhǔn)確反映輸入特征數(shù)據(jù)與暫態(tài)穩(wěn)定裕度指標(biāo)之間映射關(guān)系的暫態(tài)穩(wěn)定裕度評(píng)估模型。
(4)知識(shí)庫(kù)的建立。由于檢修和調(diào)整運(yùn)行方式等原因,電力系統(tǒng)的運(yùn)行場(chǎng)景會(huì)經(jīng)常發(fā)生改變,而初始訓(xùn)練樣本中不可能涵蓋電力系統(tǒng)所有的運(yùn)行場(chǎng)景,導(dǎo)致離線訓(xùn)練好的模型在應(yīng)用階段的適用性大為降低。為了保證評(píng)估模型在應(yīng)用階段的有效性,需要進(jìn)行暫態(tài)穩(wěn)定評(píng)估模型的更新。
通常,電力系統(tǒng)的調(diào)度會(huì)根據(jù)“日前-日內(nèi)-小時(shí)內(nèi)”的負(fù)荷預(yù)測(cè)結(jié)果來(lái)安排電力系統(tǒng)下一階段的運(yùn)行方式和啟停計(jì)劃,表明電力系統(tǒng)的運(yùn)行方式和拓?fù)浣Y(jié)構(gòu)是可以提前預(yù)測(cè)的。對(duì)于這種情況,可以通過(guò)在離線階段生成多個(gè)未來(lái)的運(yùn)行場(chǎng)景和相應(yīng)的預(yù)想事故集,構(gòu)建針對(duì)不同運(yùn)行場(chǎng)景的暫態(tài)穩(wěn)定裕度評(píng)估模型,并將所有的模型集成到一個(gè)知識(shí)庫(kù)中,以備后續(xù)出現(xiàn)緊急事故時(shí)的快速調(diào)用。對(duì)于在應(yīng)用階段出現(xiàn)的計(jì)劃外的停運(yùn)或故障情況,則需及時(shí)仿真生成新的樣本進(jìn)行模型的更新,并將更新后的模型添加到知識(shí)庫(kù)中。
隨著知識(shí)庫(kù)的不斷豐富,更多潛在的電力系統(tǒng)運(yùn)行場(chǎng)景將被覆蓋,未考慮的運(yùn)行場(chǎng)景將會(huì)越來(lái)越少,模型的適應(yīng)性及在線應(yīng)用的可靠性將不斷提高。
在應(yīng)用階段,首先對(duì)電力系統(tǒng)的運(yùn)行場(chǎng)景進(jìn)行判斷,然后選擇PMU采集的關(guān)鍵特征數(shù)據(jù)輸入離線訓(xùn)練好的暫態(tài)穩(wěn)定裕度評(píng)估模型,實(shí)時(shí)評(píng)估系統(tǒng)的穩(wěn)定情況。當(dāng)電力系統(tǒng)的暫態(tài)穩(wěn)定裕度較高時(shí),說(shuō)明系統(tǒng)的穩(wěn)定水平較強(qiáng),則保持對(duì)系統(tǒng)的持續(xù)監(jiān)測(cè)。當(dāng)系統(tǒng)處于失穩(wěn)或暫態(tài)穩(wěn)定裕度較低時(shí),應(yīng)及時(shí)采取預(yù)防控制措施,使電力系統(tǒng)恢復(fù)到較為穩(wěn)定的運(yùn)行狀況。
文中采用決定系數(shù)(R2)和均方根誤差RMSE(root mean square error)兩個(gè)統(tǒng)計(jì)指標(biāo)來(lái)衡量模型的預(yù)測(cè)性能。R2和RMSE的計(jì)算公式分別為
式中:n為樣本數(shù)量;yi為xi對(duì)應(yīng)的暫態(tài)穩(wěn)定裕度指標(biāo);為預(yù)測(cè)值;為yi的平均值。一般來(lái)說(shuō),R2越接近于1,RMSE越小,表明模型的擬合效果越好。
為驗(yàn)證所提方法的有效性,本文通過(guò)PSS/E軟件對(duì)如圖2所示的新英格蘭10機(jī)39節(jié)點(diǎn)系統(tǒng)進(jìn)行仿真。所有測(cè)試均是在一臺(tái)配置Intel Core i5-4200H 2.80 GHz CPU和8 GB RAM的電腦上進(jìn)行。
圖2 新英格蘭10機(jī)39節(jié)點(diǎn)系統(tǒng)Fig.2 New England 10-machine 39-bus system
3.1.1 數(shù)據(jù)生成及參數(shù)設(shè)置
在仿真過(guò)程中,以5%為步長(zhǎng),模擬總負(fù)荷在[75%,125%]之間增長(zhǎng)變化,并根據(jù)負(fù)荷水平相應(yīng)調(diào)整發(fā)電機(jī)出力。通過(guò)在線路上設(shè)置三相短路故障來(lái)模擬電力系統(tǒng)的預(yù)想事故情況,將故障的持續(xù)時(shí)間設(shè)置在0.1~0.4 s之間變化,通過(guò)切除線路來(lái)清除故障?;诓煌某跏歼\(yùn)行方式進(jìn)行電力系統(tǒng)的時(shí)域仿真,采集不同初始運(yùn)行方式下的電網(wǎng)運(yùn)行數(shù)據(jù),最終一共生成了4 590個(gè)樣本。通過(guò)五折交叉驗(yàn)證法隨機(jī)選取初始樣本的80%作為訓(xùn)練集,剩余20%作為測(cè)試集。
KTBoost模型參數(shù)的設(shè)置在一定程度上影響了模型的評(píng)估性能,通過(guò)網(wǎng)格搜索法優(yōu)化模型的參數(shù),最終得到KTBoost的最優(yōu)參數(shù)組合:基回歸器數(shù)量為200,葉子最大深度為4,學(xué)習(xí)率為0.05,核函數(shù)設(shè)置為徑向基核函數(shù)。
3.1.2 特征選擇的影響
KTBoost在不同特征維度下測(cè)試的精度及訓(xùn)練時(shí)間如圖3所示。結(jié)果表明,隨著特征維度的增加,模型的評(píng)估精度逐步上升,最后趨于穩(wěn)定??紤]到基于機(jī)器學(xué)習(xí)的暫態(tài)穩(wěn)定評(píng)估模型需要經(jīng)常進(jìn)行更新迭代,為了避免計(jì)算資源的浪費(fèi),最終選擇初始特征的30維作為關(guān)鍵特征子集。
圖3 不同特征維度下的性能測(cè)試Fig.3 Performance tests under different feature dimensions
為了體現(xiàn)本文所提特征選擇方法的優(yōu)越性,將其與MIC、最大相關(guān)最小冗余MRMR(maximum rel?evance minimum redundancy)和聯(lián)合互信息JMI(joint mutual information)3種特征選擇方法進(jìn)行對(duì)比測(cè)試。基于不同的方法分別選擇初始特征的30維作為關(guān)鍵特征子集,測(cè)試結(jié)果如表1所示。結(jié)果表明,由于MIC只是挖掘特征與目標(biāo)變量之間的相關(guān)性,并未考慮其他因素的影響,因此模型評(píng)估的精度偏低;JMI考慮了多個(gè)特征以及目標(biāo)變量之間的相關(guān)性,能夠獲得比MIC更高的評(píng)估準(zhǔn)確性;MRMR在特征選擇過(guò)程中,并未考慮特征之間的協(xié)同作用,其評(píng)估精度低于本文所提的GSOMIC-IG特征選擇框架??傮w來(lái)看,基于GSO-MICIG篩選的特征子集,KTBoost模型能夠獲得最優(yōu)的評(píng)估結(jié)果。
表1 不同特征選擇方法的對(duì)比Tab.1 Comparison among different feature selectionmethods
3.1.3 預(yù)測(cè)精度與時(shí)間復(fù)雜度
隨著同步相量測(cè)量技術(shù)的不斷發(fā)展,PMU對(duì)電網(wǎng)運(yùn)行數(shù)據(jù)的采集頻率已經(jīng)高達(dá)50次/s[5]。即對(duì)每個(gè)時(shí)間步的電力系統(tǒng)暫態(tài)穩(wěn)定裕度的評(píng)估,評(píng)估模型對(duì)PMU數(shù)據(jù)的處理時(shí)間必須少于0.02 s。其中,KTBoost模型的性能測(cè)試結(jié)果如表2所示,其擬合效果隨迭代次數(shù)變化的曲線如圖4所示。結(jié)果表明,模型對(duì)每個(gè)樣本的評(píng)估時(shí)間遠(yuǎn)小于0.02 s,并且隨著迭代次數(shù)的增加,KTBoost模型的擬合效果越好??傮w來(lái)看,KTBoost模型能在短時(shí)間內(nèi)實(shí)現(xiàn)高精度的暫態(tài)穩(wěn)定裕度評(píng)估,能夠滿足在線應(yīng)用的需求。
表2 預(yù)測(cè)精度和時(shí)間復(fù)雜度Tab.2 Prediction accuracy and time complexity
圖4 不同迭代次數(shù)下的RMSEFig.4 RMSE under different numbers of iterations
3.1.4 不同機(jī)器學(xué)習(xí)模型的性能對(duì)比
為了體現(xiàn)本文所提KTBoost模型的優(yōu)越性,將其與不同的機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比測(cè)試。主要包括人工神經(jīng)網(wǎng)絡(luò)ANN(artificial neural network)、DT、RF、梯度提升決策樹 GBDT(gradient boosting decision tree)、SVM和卷積神經(jīng)網(wǎng)絡(luò)CNN(convolu?tional neural network)。其中,CNN基于深度學(xué)習(xí)庫(kù)TensorFlow搭建,其他機(jī)器學(xué)習(xí)模型均基于機(jī)器學(xué)習(xí)庫(kù)Scikit-learn搭建。在測(cè)試過(guò)程中,所有模型均使用相同的輸入特征。不同機(jī)器學(xué)習(xí)模型的性能測(cè)試結(jié)果如表3所示。
表3 不同模型的性能測(cè)試Tab.3 Performance tests of different models
結(jié)果表明,ANN、DT和SVM相對(duì)與其他方法,總體評(píng)估精度處于一個(gè)較低的水平。與基于樹提升的GBDT和簡(jiǎn)單樹集成的RF相比,KTBoost通過(guò)回歸樹與RKHS回歸函數(shù)相結(jié)合,能夠獲得一個(gè)更高的評(píng)估精度。CNN雖然能夠獲得一個(gè)較高的評(píng)估準(zhǔn)確性,但CNN在訓(xùn)練時(shí)需要調(diào)整大量的網(wǎng)絡(luò)參數(shù),導(dǎo)致模型的計(jì)算量較大,模型離線訓(xùn)練的成本較高??傮w來(lái)看,KTBoost在保證精度的同時(shí)不會(huì)消耗大量的訓(xùn)練時(shí)間,更加適用于電力系統(tǒng)的在線暫態(tài)穩(wěn)定裕度預(yù)測(cè)。
3.1.5 不同訓(xùn)練集規(guī)模的影響
當(dāng)電力系統(tǒng)出現(xiàn)緊急事故時(shí),已經(jīng)訓(xùn)練好的離線模型可能無(wú)法給出滿意的評(píng)估結(jié)果,因此需要進(jìn)行模型的更新。為了快速建立暫態(tài)穩(wěn)定裕度評(píng)估模型,如何確定訓(xùn)練數(shù)據(jù)的規(guī)模使模型能夠達(dá)到滿足要求的評(píng)估精度也是一個(gè)非常關(guān)鍵的問(wèn)題。為此,文中分別測(cè)試了不同訓(xùn)練集規(guī)模對(duì)模型評(píng)估精度的影響,結(jié)果如圖5所示。由圖5可知,隨著訓(xùn)練集規(guī)模的逐步遞增,KTBoost模型的評(píng)估精度也隨之增加,表明了需要充足的訓(xùn)練樣來(lái)保證評(píng)估的高準(zhǔn)確性。此外,對(duì)于電網(wǎng)運(yùn)行人員而言,可以根據(jù)暫態(tài)穩(wěn)定評(píng)估所需的精度要求來(lái)選擇合適的訓(xùn)練樣本規(guī)模,快速建立適用于某個(gè)運(yùn)行場(chǎng)景的暫態(tài)穩(wěn)定裕度評(píng)估模型。
圖5 不同訓(xùn)練集規(guī)模下的測(cè)試Fig.5 Tests under different sizes of training set
3.1.6 模型的魯棒性測(cè)試
PMU在數(shù)據(jù)采集與傳輸?shù)倪^(guò)程中,可能會(huì)出現(xiàn)以下兩類數(shù)據(jù)異常情況:①由于PMU測(cè)量誤差導(dǎo)致部分輸入數(shù)據(jù)存在噪聲;②由于PMU故障導(dǎo)致部分輸入特征缺失。本文針對(duì)上述兩種情況分別進(jìn)行了研究。
為了測(cè)試噪聲對(duì)KTBoost模型評(píng)估性能的影響,文中在原始數(shù)據(jù)中考慮了4種不同信噪比SNR(signal to noise ratio)的高斯白噪聲。在不同噪聲條件下,各種機(jī)器學(xué)習(xí)模型評(píng)估的R2如圖6所示。結(jié)果表明,ANN和DT由于結(jié)構(gòu)簡(jiǎn)單,模型的評(píng)估精度總體偏低。SVM在低噪聲條件下能夠維持評(píng)估的R2在0.97左右,但當(dāng)噪聲增加到20 dB時(shí),模型評(píng)估的R2驟減至0.96以下,表明SVM對(duì)噪聲的魯棒性較差。RF、GBDT和KTBoost都為集成模型,對(duì)噪聲具有一定的魯棒性,因此都能夠維持一個(gè)較為穩(wěn)定的評(píng)估精度。CNN借助其深層結(jié)構(gòu),對(duì)數(shù)據(jù)的挖掘能力較強(qiáng),雖然CNN對(duì)噪聲的魯棒性較強(qiáng),但其評(píng)估精度仍要低于文中所提的KTBoost模型??傮w來(lái)看,與其他機(jī)器學(xué)習(xí)模型相比,KTBoost在不同噪聲條件下能夠保持一個(gè)較高的評(píng)估精度,具有更高的實(shí)用價(jià)值。
圖6 不同模型的抗噪能力測(cè)試Fig.6 Anti-noise capability tests of different models
為了測(cè)試輸入數(shù)據(jù)存在部分特征缺失情況下KTBoost模型的評(píng)估性能,本文在測(cè)試集中考慮了4種不同比例的特征缺失情況。在不同條件下,模型評(píng)估的精度如表4所示。結(jié)果表明,隨著特征缺失比例的增加,對(duì)KTBoost模型的負(fù)面影響也越來(lái)越大,雖然模型的評(píng)估精度出現(xiàn)一定程度地下降,但仍能夠維持相對(duì)穩(wěn)定的預(yù)測(cè)結(jié)果。
表4 數(shù)據(jù)缺失的影響Tab.4 Impact of missing data
3.1.7 模型的泛化能力測(cè)試
由于電力系統(tǒng)是一個(gè)時(shí)變的系統(tǒng),在考慮模型評(píng)估精度的同時(shí),泛化能力也是衡量模型性能的重要指標(biāo)。本文測(cè)試了以下5種場(chǎng)景模型的泛化能力:
場(chǎng)景1:負(fù)荷水平仍保持在[75%,125%],系統(tǒng)拓?fù)浣Y(jié)構(gòu)不變,改變發(fā)電機(jī)出力;
場(chǎng)景2:負(fù)荷水平為100%,輸電線路16-17和27-28退出運(yùn)行;
場(chǎng)景3:負(fù)荷水平為70%,輸電線路23-36、母線36和7號(hào)發(fā)電機(jī)退出運(yùn)行;
場(chǎng)景4:負(fù)荷水平為100%,在母線8處新增1臺(tái)發(fā)電機(jī)、1條母線和1條輸電線路;
場(chǎng)景5:負(fù)荷水平為130%,在母線8和母線16處新增2臺(tái)發(fā)電機(jī)、2條母線和2條輸電線路。
針對(duì)每種運(yùn)行場(chǎng)景仿真生成450個(gè)新樣本,通過(guò)將新樣本輸入KTBoost模型測(cè)試其評(píng)估性能,測(cè)試結(jié)果如表5所示。結(jié)果表明,在場(chǎng)景1和場(chǎng)景2中,由于系統(tǒng)的負(fù)荷水平和拓?fù)浣Y(jié)構(gòu)變化較小,KT?Boost模型仍能夠維持評(píng)估的R2在0.98以上;在場(chǎng)景3至場(chǎng)景5中,隨著變化的加劇,雖然KTBoost模型的評(píng)估精度出現(xiàn)明顯的下降,但仍能夠給出可接受的評(píng)估結(jié)果,顯示出KTBoost模型針對(duì)未知的電力系統(tǒng)運(yùn)行場(chǎng)景具有一定的泛化能力。
表5 不同場(chǎng)景下的預(yù)測(cè)精度Tab.5 Prediction accuracy under different scenarios
為了進(jìn)一步驗(yàn)證本文所提方法的有效性,將PSS/E軟件自帶的一個(gè)1648節(jié)點(diǎn)系統(tǒng)作為測(cè)試系統(tǒng)。該系統(tǒng)包含1 648條母線、313臺(tái)發(fā)電機(jī)、182個(gè)分流器和2 294條輸電線路。采用第3.1.1節(jié)所提方法進(jìn)行仿真,共生成了9 240個(gè)樣本。KTBoost模型的參數(shù)使用第3.1.1節(jié)所設(shè)置的參數(shù)。
3.2.1 模型的評(píng)估性能檢驗(yàn)
1648節(jié)點(diǎn)系統(tǒng)的每個(gè)仿真樣本包含37 439個(gè)初始運(yùn)行特征,為了降低KTBoost模型的計(jì)算負(fù)擔(dān),文中利用第1.2節(jié)所提的GSO-MIC-IG特征選擇框架選取初始特征的1%作為關(guān)鍵特征子集?;诤Y選的關(guān)鍵特征子集,不同機(jī)器學(xué)習(xí)模型的性能測(cè)試結(jié)果如表6和表7所示。結(jié)果表明,在無(wú)噪聲條件下,KTBoost模型能夠獲得比其他模型更高的預(yù)測(cè)精度。當(dāng)SNR為20 dB時(shí),除了KTBoost模型外,其他模型的預(yù)測(cè)精度均出現(xiàn)顯著下降,體現(xiàn)了KT?Boost優(yōu)異的預(yù)測(cè)性能。
表6 不同模型預(yù)測(cè)的R2Tab.6 R2predicted by different models
表7 不同模型預(yù)測(cè)的RMSETab.7 RMSE predicted by different models
3.2.2 模型的泛化能力測(cè)試
為了測(cè)試KTBoost模型在大系統(tǒng)中的泛化能力,文中保持負(fù)荷水平在[75%,125%],主要考慮如表8所示的5種電力系統(tǒng)拓?fù)浣Y(jié)構(gòu)變換場(chǎng)景,針對(duì)每種場(chǎng)景仿真生成450個(gè)新樣本,不同場(chǎng)景的測(cè)試結(jié)果如表9所示。結(jié)果表明,在1648節(jié)點(diǎn)系統(tǒng)中,電力系統(tǒng)運(yùn)行拓?fù)浣Y(jié)構(gòu)的改變不會(huì)導(dǎo)致KTBoost模型的評(píng)估精度出現(xiàn)大幅度下降,體現(xiàn)了文中所提方法在大系統(tǒng)中的有效性。
表8 電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)Tab.8 Topology of power system
表9 不同場(chǎng)景下的預(yù)測(cè)精度Tab.9 Prediction accuracy under different scenarios
本文提出了一種基于關(guān)系探索和KTBoost的電力系統(tǒng)暫態(tài)穩(wěn)定裕度評(píng)估方法。在新英格蘭10機(jī)39節(jié)點(diǎn)系統(tǒng)和一個(gè)1648節(jié)點(diǎn)系統(tǒng)進(jìn)行了仿真研究,實(shí)驗(yàn)結(jié)果表明:
(1)所提GSO-MIC-IG特征選擇框架能夠有效挖掘特征與目標(biāo)變量之間的相關(guān)性以及特征之間的冗余性和協(xié)同性,能夠有效降低樣本數(shù)據(jù)的維度。與MIC、JMI和MRMR等方法相比,本文所提特征選擇方法能夠篩選出更為關(guān)鍵的特征子集。
(2)與DT、SVM、ANN、RF、GBDT和CNN等模型相比,KTBoost模型能夠在較短的時(shí)間給出更為精確的評(píng)估結(jié)果,具有更高的實(shí)用價(jià)值。
(3)針對(duì)未知的電力系統(tǒng)運(yùn)行場(chǎng)景以及輸入數(shù)據(jù)存在噪聲和數(shù)據(jù)缺失的問(wèn)題,本文所提KTBoost模型仍能夠給出相對(duì)穩(wěn)定的評(píng)估結(jié)果,具有較強(qiáng)的魯棒性和泛化能力。