吳云亮, 鄧韋斯, 姚海成, 蘇寅生, 周毓敏
(中國南方電網(wǎng)電力調(diào)度控制中心, 廣州 510000)
電網(wǎng)運(yùn)行斷面是電力系統(tǒng)調(diào)度運(yùn)行監(jiān)控的重要內(nèi)容。美國大停電、加拿大大停電、印度大停電等電網(wǎng)事故表明,及時(shí)、準(zhǔn)確地生成與監(jiān)控電網(wǎng)運(yùn)行斷面,對(duì)確保系統(tǒng)安全穩(wěn)定運(yùn)行,防止事故擴(kuò)大具有重要作用[1-2]。
傳統(tǒng)模式下,電網(wǎng)運(yùn)行斷面生成主要是從電網(wǎng)物理特性出發(fā),采用圖論、復(fù)雜網(wǎng)絡(luò)理論等相關(guān)理論對(duì)電網(wǎng)分區(qū),從而實(shí)現(xiàn)對(duì)運(yùn)行斷面的辨識(shí)[3-5]。文獻(xiàn)[3-4]以系統(tǒng)中廠站地理位置為初始狀態(tài),形成初始分區(qū),利用圖論中割集算法生成分區(qū)間運(yùn)行斷面。文獻(xiàn)[5-6]則利用復(fù)雜網(wǎng)絡(luò)理論,利用社團(tuán)發(fā)現(xiàn)方法中的GN分裂算法對(duì)網(wǎng)絡(luò)實(shí)施深度分區(qū),以提高網(wǎng)絡(luò)分區(qū)與網(wǎng)架特征的匹配程度;文獻(xiàn)[7]在傳統(tǒng)復(fù)雜理論分區(qū)方法基礎(chǔ)上進(jìn)一步優(yōu)化,提出了線路樞紐性評(píng)價(jià)指標(biāo),改進(jìn)提升分區(qū)效果。
近年來,隨著電網(wǎng)發(fā)展,特別是新能源大規(guī)模接入和電力現(xiàn)貨市場的改革深化,電力系統(tǒng)對(duì)運(yùn)行斷面在線生成的需求日益迫切[8-10]。而上述傳統(tǒng)運(yùn)行斷面生成方法由于需要對(duì)電網(wǎng)物理特性進(jìn)行大量復(fù)雜的分析判定,耗時(shí)較長,難以滿足實(shí)時(shí)運(yùn)行需要。為此,采用機(jī)器學(xué)習(xí)等人工智能算法實(shí)現(xiàn)運(yùn)行斷面的在線自動(dòng)生成成為當(dāng)前電網(wǎng)運(yùn)行控制領(lǐng)域研究的熱點(diǎn)[11-12]。文獻(xiàn)[13]提出了一種電網(wǎng)運(yùn)行仿真大數(shù)據(jù)架構(gòu),在此基礎(chǔ)上提出了一種基于改進(jìn)支持向量機(jī)模型的關(guān)鍵斷面是否生效判定方法,通過將運(yùn)行斷面與電網(wǎng)運(yùn)行特征參數(shù)校驗(yàn),判斷運(yùn)行斷面是否起作用。文獻(xiàn)[14]利用機(jī)器學(xué)習(xí)中的聚類算法,提出了一種基于改進(jìn)K-means算法的運(yùn)行斷面相似性匹配方法,通過電網(wǎng)特征參數(shù)聚類,定位相似運(yùn)行場景,從而為運(yùn)行斷面生成提供參照。文獻(xiàn)[15]則采用K-鄰近法,利用選定的電網(wǎng)特征參數(shù)對(duì)運(yùn)行斷面進(jìn)行聚類分析,在線生成運(yùn)行斷面。
由于現(xiàn)代大電網(wǎng)規(guī)模龐大,利用機(jī)器學(xué)習(xí)有關(guān)算法解決運(yùn)行斷面生成問題時(shí),將面臨規(guī)模龐大的運(yùn)行狀態(tài)參數(shù)。準(zhǔn)確高效地實(shí)施特征選擇,不僅是避免“維數(shù)災(zāi)”、提升計(jì)算效率的必然途徑,也是消除干擾因素、提升判定準(zhǔn)確性的有效方法[14]。
為此,針對(duì)電網(wǎng)運(yùn)行斷面在線生成問題實(shí)際特點(diǎn),提出了基于兩層模式的特征選擇與在線生成方法。第一層采用過濾式特征選擇,剔除大量無關(guān)的干擾因素,輸出基礎(chǔ)因素集。第二層采用包裹式特征選擇,在基礎(chǔ)因素集中進(jìn)一步利用序列后向搜索算法,輸出生成準(zhǔn)確性最佳的在線生成智能體。并基于中國某地區(qū)電網(wǎng)數(shù)據(jù)構(gòu)造算例,驗(yàn)證所提出方法的有效性。
利用機(jī)器學(xué)習(xí)算法解決電網(wǎng)運(yùn)行斷面在線生成的核心思路是通過對(duì)電網(wǎng)運(yùn)行歷史數(shù)據(jù)挖掘,研究電網(wǎng)運(yùn)行狀態(tài)參數(shù)與運(yùn)行斷面之間的對(duì)應(yīng)關(guān)系,據(jù)此訓(xùn)練形成運(yùn)行斷面生成智能體,并將其用于在線分析。然而電網(wǎng)運(yùn)行狀態(tài)參數(shù)規(guī)模異常龐大,表1列舉了文獻(xiàn)[14]所提出的13個(gè)方面運(yùn)行斷面生成中所需要考慮的電網(wǎng)運(yùn)行狀態(tài)參數(shù)類型。參照該類型劃分,以中等規(guī)模的地市級(jí)電網(wǎng)220 kV主網(wǎng)架為例,其電網(wǎng)運(yùn)行狀態(tài)參數(shù)將超過500項(xiàng)。不加區(qū)分地將所有運(yùn)行狀態(tài)參數(shù)均用于機(jī)器學(xué)習(xí)訓(xùn)練,將導(dǎo)致出現(xiàn)參數(shù)“維數(shù)災(zāi)”問題。
表1 電網(wǎng)運(yùn)行狀態(tài)參數(shù)類型
為此,提出一種基于兩層結(jié)構(gòu)的電網(wǎng)運(yùn)行斷面特征選擇與在線生成方法,其實(shí)施框架如圖1所示?;舅悸肥菑碾娋W(wǎng)運(yùn)行歷史數(shù)據(jù)出發(fā),利用所提出的兩級(jí)結(jié)構(gòu)運(yùn)行斷面特征選擇與生成方法逐一分析各運(yùn)行斷面的在線生成特征因素集,并輸出對(duì)應(yīng)的在線生成智能體;從電網(wǎng)實(shí)時(shí)運(yùn)行數(shù)據(jù)中提取特征因素集中各因素的實(shí)時(shí)參數(shù),由各智能體輸出其對(duì)應(yīng)運(yùn)行斷面的狀態(tài),并生成該狀態(tài)下的運(yùn)行斷面集。
兩級(jí)結(jié)構(gòu)的運(yùn)行斷面特征選擇與在線生成方法是上述實(shí)施流程的核心。在該框架下,第一層為
圖1 實(shí)施框架Fig.1 Implementation framework
基于過濾式結(jié)構(gòu)的特征選擇層。在該層中,龐大的電網(wǎng)運(yùn)行狀態(tài)參數(shù)將構(gòu)成初始因素集,過濾式特征選擇層將從消除重復(fù)因素和無關(guān)因素兩個(gè)維度出發(fā)過濾初始因素集,輸出基礎(chǔ)因素集。將采用Fisher分和信息增益兩種過濾式特征選擇方法,分別從特征類別距離角度和概率統(tǒng)計(jì)角度對(duì)電網(wǎng)運(yùn)行參數(shù)進(jìn)行特征選擇;并將兩類選擇結(jié)果交叉處理,取其交集作為輸出量,以獲得同時(shí)滿足兩方面要求的因素。第二層為基于包裹式結(jié)構(gòu)的特征選擇與智能體訓(xùn)練層,該層中將采用序列向前算法動(dòng)態(tài)調(diào)整所選擇的基礎(chǔ)因素集,通過跟蹤調(diào)整基礎(chǔ)因素集中的因素,同時(shí)得到滿足訓(xùn)練精度要求的運(yùn)行斷面特征因素集和與之匹配的運(yùn)行斷面生成智能體。
機(jī)器學(xué)習(xí)是一種多學(xué)科交叉專業(yè),其根本特征在于利用計(jì)算機(jī)對(duì)歷史經(jīng)驗(yàn)的學(xué)習(xí)實(shí)現(xiàn)對(duì)人類分析判斷過程的模擬,以解決聚類、選擇、判斷等實(shí)際問題。典型的機(jī)器學(xué)習(xí)算法包括神經(jīng)網(wǎng)絡(luò)算法、決策樹算法、強(qiáng)化學(xué)習(xí)算法、支持向量機(jī)算法等。
與其他算法相比,支持向量機(jī)算法具有較為嚴(yán)格的統(tǒng)計(jì)學(xué)理論基礎(chǔ),能夠較好地解決非線性、小樣本下的數(shù)據(jù)分析問題,具有較好的數(shù)據(jù)泛化能力[16-18]。為此,選用支持向量機(jī)作為運(yùn)行斷面生成智能體的核心算法,其模型和算法可參考文獻(xiàn)[16-18]。
對(duì)于單個(gè)運(yùn)行斷面,僅存在生成或不生成兩個(gè)輸出狀態(tài)。因此,其智能體訓(xùn)練中采用準(zhǔn)確率指標(biāo)評(píng)價(jià)智能體訓(xùn)練效果,可表示為
(1)
式(1)中:AC_R為評(píng)價(jià)結(jié)果準(zhǔn)確率;N為智能體校驗(yàn)環(huán)節(jié)中樣本數(shù);N1為智能體輸出結(jié)果正確的樣本數(shù)。
所謂Fisher分本質(zhì)上是一種對(duì)不同類樣本離散程度的量化評(píng)價(jià)指標(biāo),其公式為
(2)
在利用Fisher分進(jìn)行運(yùn)行斷面特征選擇時(shí),其實(shí)施流程如圖2所示。其包括以下實(shí)施要點(diǎn)。
(1)Fisher分計(jì)算與因素排序。根據(jù)待分析運(yùn)行斷面在訓(xùn)練集中是否生成,將樣本劃分為正類、負(fù)類兩個(gè)類型,其中正類為該運(yùn)行斷面生成的訓(xùn)練樣本集合,負(fù)類反之。利用式(2)依次計(jì)算初始因素集中各因素的Fisher分值,并將其按照從大到小的順序排列。
(2)依次構(gòu)建運(yùn)行斷面生成判定支持向量機(jī)智能體,并計(jì)算準(zhǔn)確性評(píng)價(jià)指標(biāo)。先給定一個(gè)空集合Ω。按照Fisher分值排列后的因素順序,依次將因素添入集合Ω中。以訓(xùn)練集數(shù)據(jù)為基礎(chǔ),構(gòu)建基于集合Ω的支持向量機(jī)智能體;將智能體用于校驗(yàn)集,計(jì)算其準(zhǔn)確性評(píng)價(jià)指標(biāo)。
(3)選定準(zhǔn)確性最高的分類器,并輸出其對(duì)應(yīng)的因素集Ω。待遍歷所有因素后,統(tǒng)計(jì)并定位所有組合方式下驗(yàn)證集準(zhǔn)確性指標(biāo)最大的支持向量機(jī)智能體。該智能體對(duì)應(yīng)的集合即為基于Fisher分法選定的基礎(chǔ)因素集H。
圖2 基于Fisher分的過濾式特征選擇流程Fig.2 Filter feature selection process based on Fisher score
所謂信息增益是指某項(xiàng)因素加入因素集合后,該集合信息熵的增加幅度。信息增益可表示為
J(A)=Info(D)-InfoA(D)=
(3)
利用信息增益進(jìn)行過濾式特征選擇時(shí),其實(shí)施流程與Fisher分方式下流程基本一致,區(qū)別在于因素排序的依據(jù)是其信息增益,而不是Fisher分。規(guī)定利用信息增益法所得的基礎(chǔ)因素集為K。
Fisher分和信息增益法分別從兩個(gè)維度對(duì)初始因素集中因素進(jìn)行了特征選擇。Fisher分側(cè)重于從因素相關(guān)性角度出發(fā),篩選出與待分析運(yùn)行斷面聯(lián)系最緊密的因素集;而信息增益法更側(cè)重于因素變化過程分析,篩選出于待分析運(yùn)行斷面變化模式最接近的因素集。
過濾式特征選擇需要兼顧兩個(gè)方法選擇的差異。為此,將兩種方法選定的基礎(chǔ)因素集作交集,輸出最終的基礎(chǔ)因素集,即
L=H∩K
(4)
式(4)中:L為第一層過濾式特征選擇層所輸出的基礎(chǔ)因素集。
經(jīng)過第一層過濾式特征選擇,能夠剔除大量非相關(guān)的“噪聲”因素。為進(jìn)一步降低因素維度,提高其生成準(zhǔn)確性和有效性,第二層將采用序列后向包裹式特征選擇算法實(shí)施特征選擇。
序列搜索算法是一種經(jīng)典的包裹式特征選擇算法,按照搜索方向不同,可分為序列后向搜索和序列前向搜索。序列后向搜索是指基于給定的因素集合,每次剔除一項(xiàng)因素,直至集合所對(duì)應(yīng)的智能體評(píng)價(jià)指標(biāo)能達(dá)到最大。序列前向搜索則與之相對(duì),是指每次增加一項(xiàng)因素,直至獲得最大評(píng)價(jià)指標(biāo)??紤]到經(jīng)過第一層過濾,基礎(chǔ)因素集中的因素?cái)?shù)量已經(jīng)較少,因此選用序列后向搜索算法。
基于序列后向搜索的第二層過濾式特征選擇與生成智能體訓(xùn)練實(shí)施步驟如圖3所示。該實(shí)施過程包括如下實(shí)施要點(diǎn)。
(1)計(jì)算基礎(chǔ)因素集下的準(zhǔn)確性評(píng)價(jià)指標(biāo)。將第一層所輸出的基礎(chǔ)因素集作為特征集,利用歷史數(shù)據(jù)訓(xùn)練支持向量機(jī)智能體;并統(tǒng)計(jì)訓(xùn)練完畢的支持向量機(jī)智能體在驗(yàn)證數(shù)據(jù)集的準(zhǔn)確性評(píng)價(jià)指標(biāo)。
(2)遍歷基礎(chǔ)因素集中所有因素,計(jì)算并統(tǒng)計(jì)剔除一項(xiàng)因素后新因素集的準(zhǔn)確性評(píng)價(jià)指標(biāo)。遍歷基礎(chǔ)因素集中所有因素,逐一將其從基礎(chǔ)因素集中剔除,并基于剔除一項(xiàng)因素后的因素集訓(xùn)練智能體,計(jì)算其準(zhǔn)確性評(píng)價(jià)指標(biāo)。統(tǒng)計(jì)所有因素剔除后的準(zhǔn)確性評(píng)價(jià)指標(biāo)。
(3)判定新因素集下準(zhǔn)確性評(píng)價(jià)指標(biāo)變化情況。將上一步中所得的準(zhǔn)確性評(píng)價(jià)指標(biāo)最大值與原基礎(chǔ)因素集對(duì)比。若新因素集準(zhǔn)確性評(píng)價(jià)指標(biāo)更大,則將該因素集替代原基礎(chǔ)因素集,返回步驟(1),重復(fù)上述過程;否則,搜索結(jié)束,輸出基礎(chǔ)因素集和訓(xùn)練所得的運(yùn)行斷面生成智能體。
圖3 基于序列后向搜索的包裹式特征選擇流程Fig.3 Wrapped feature selection process based on sequential backward search
截取南方某省區(qū)一地區(qū)電網(wǎng),在其基礎(chǔ)上簡化構(gòu)造算例,以驗(yàn)證所提出方法的有效性。簡化后該地區(qū)電網(wǎng)220 kV網(wǎng)架結(jié)構(gòu)如圖4所示。該網(wǎng)架結(jié)構(gòu)圖中共有變電站節(jié)點(diǎn)10座,發(fā)電廠節(jié)點(diǎn)6座,輸電線路26條。
圖4 算例網(wǎng)架Fig.4 Power grid in the case
算例中選取了2018年全年逐日運(yùn)行狀態(tài)作為基礎(chǔ)數(shù)據(jù),將1—11月逐日運(yùn)行參數(shù)作為訓(xùn)練數(shù)據(jù)集,并將12月上半月數(shù)據(jù)作為校驗(yàn)數(shù)據(jù)集,下半月數(shù)據(jù)作為測試數(shù)據(jù)集。
采用文獻(xiàn)[4]所提出的運(yùn)行斷面生成方法,對(duì)全年數(shù)據(jù)分析共得到運(yùn)行斷面5項(xiàng),分別為:①線路12→13雙回+線路11→6雙回;②線路12→13雙回+線路6→7雙回;③線路13→14+線路6→7雙回+線路13→15;④線路16→15雙回+線路16→7+線路16→8;⑤線路16→15雙回+線路16→7+線路8→7。
按照表1中介紹的電網(wǎng)運(yùn)行斷面生成中所需要考慮的運(yùn)行狀態(tài)參數(shù)類型,該算例中所涉及的初始因素集共142項(xiàng)。
以運(yùn)行斷面①為例,提出的運(yùn)行斷面特征選擇各階段所選擇的因素?cái)?shù)量變化如圖5所示。經(jīng)過第一層過濾式特征選擇,基礎(chǔ)因素集共有14項(xiàng)因素。其中,經(jīng)過Fisher分過濾后剩余20項(xiàng),信息增益過濾后剩余19項(xiàng),兩者取交集后剩余14項(xiàng)。在此基礎(chǔ)上進(jìn)一步利用包裹式特征選擇對(duì)14項(xiàng)因素甄別,經(jīng)過5輪逐次后向搜索剩余7項(xiàng)特征因素。
圖5 特征因素?cái)?shù)量變化Fig.5 The changes of numbers of characteristic factors
進(jìn)一步觀察各階段所篩選出來的因素集,表2中分別給出了特征因素集、基礎(chǔ)因素集獨(dú)有、H獨(dú)有、K獨(dú)有四個(gè)類型集合中的因素??梢园l(fā)現(xiàn)所選擇的因素均與該運(yùn)行斷面所形成的封閉分區(qū)有關(guān),包括該分區(qū)內(nèi)發(fā)電廠發(fā)電功率、變電站負(fù)荷和線路運(yùn)行狀態(tài)。最后所得的特征因素集為該分區(qū)與主網(wǎng)相連的線路運(yùn)行狀態(tài)和分區(qū)內(nèi)的發(fā)電廠有功功率,與傳統(tǒng)調(diào)度經(jīng)驗(yàn)所得的直觀結(jié)論相一致。
表2 各環(huán)節(jié)特征選擇結(jié)果
進(jìn)一步利用所生成的運(yùn)行斷面在線生成智能體對(duì)測試數(shù)據(jù)集計(jì)算分析。統(tǒng)計(jì)逐日各時(shí)段測試分析結(jié)果,并計(jì)算當(dāng)日均值。如圖6所示,當(dāng)月準(zhǔn)確性評(píng)價(jià)指標(biāo)達(dá)95%,最低準(zhǔn)確率為80%,也即最多存在1個(gè)運(yùn)行斷面判定不準(zhǔn);而每次計(jì)算耗時(shí)不超過10 s,完全能夠滿足調(diào)度運(yùn)行在線分析決策要求。
圖6 測試情況分析Fig.6 Test analysis
提出了一種基于兩層結(jié)構(gòu)的電網(wǎng)運(yùn)行斷面特征選擇與在線生成方法,能夠通過對(duì)歷史數(shù)據(jù)的挖掘分析,在線生成電網(wǎng)運(yùn)行斷面,對(duì)支撐電力市場改革不斷深化下系統(tǒng)運(yùn)行控制具有重要作用。展望后期還有如下研究內(nèi)容有待進(jìn)一步研究。
(1)研究基礎(chǔ)數(shù)據(jù)高效修正方法,解決智能體訓(xùn)練過程中由于基礎(chǔ)數(shù)據(jù)質(zhì)量不足導(dǎo)致訓(xùn)練失敗的問題。
(2)研究適應(yīng)規(guī)模小樣本的智能體訓(xùn)練算法,以提升智能體的訓(xùn)練效果。
(3)研究特征選擇中的專家?guī)焖惴?,在特征選擇過程中引入專家經(jīng)驗(yàn),提高訓(xùn)練效果。