喻尋,劉寧,嚴奉軍,蒙雷,李義
(貴州電網(wǎng)有限責任公司畢節(jié)供電局, 貴州, 畢節(jié) 551700)
在生活水平以及工業(yè)生產(chǎn)越來越離不開電力的現(xiàn)代社會中,電網(wǎng)早已經(jīng)成為了國民經(jīng)濟發(fā)展的命脈,社會各階層都對電網(wǎng)的性能提出了更高的要求。電網(wǎng)運行狀態(tài)下如果發(fā)生事故,會直接導致整片區(qū)域的電力系統(tǒng)受到影響,進而造成巨大的經(jīng)濟損失,因此,保障電網(wǎng)的供電安全,避免大規(guī)模電網(wǎng)事故的發(fā)生成為了電力系統(tǒng)的主要任務(wù)。相關(guān)的研究人員為此設(shè)計了若干面對電網(wǎng)運行狀態(tài)下事故發(fā)生概率預(yù)測的算法。
在現(xiàn)有事故發(fā)生概率預(yù)測方法研究中,有學者利用一個單調(diào)函數(shù)將所有數(shù)據(jù)特征權(quán)重串聯(lián)起來,但是由于各類權(quán)重差異化較大,導致線性回歸的預(yù)測模型所得到的結(jié)果數(shù)值準確性不高。有學者使用各項數(shù)據(jù)特征權(quán)重建立了多個數(shù)據(jù)樹,并以此構(gòu)建概率數(shù)據(jù)集,但是一旦權(quán)重發(fā)生變化,就會導致整個概率預(yù)測算法需要重新運算,不僅降低了預(yù)測效率,而且預(yù)測結(jié)果準確率無法得到保障。除此之外,還有學者利用回歸分析的方式解釋變量與概率之間的因果關(guān)系,一旦事件過于復(fù)雜就無法實現(xiàn)特征權(quán)重的量化分析[1-3]。文獻[4]提出了一種基于溯因推理網(wǎng)絡(luò)的電網(wǎng)故障預(yù)測方法,通過溯因推理網(wǎng)絡(luò)對電網(wǎng)故障進行預(yù)測,將電網(wǎng)無故障運行時的數(shù)據(jù)與故障狀態(tài)下運行時的數(shù)據(jù)進行對比,計算二者差值,實現(xiàn)故障預(yù)測。實驗結(jié)果表明,該方法可以實現(xiàn)對故障的快速檢測,但是存在檢測結(jié)果準確性不高的問題。文獻[5]提出一種基于歷史故障信息的配電網(wǎng)設(shè)備故障概率建模方法,以實際歷史故障記錄信息為基礎(chǔ),分析設(shè)備故障機理。分析設(shè)備故障影響因素,分析各個故障因素之間的耦合關(guān)系,根據(jù)分析結(jié)果構(gòu)建故障概率模型。實驗結(jié)果表明,該方法同樣存在預(yù)測結(jié)果誤差較大的問題。
上述算法在高維數(shù)據(jù)融合后,在構(gòu)建數(shù)據(jù)集的過程中都會出現(xiàn)較大的誤差,導致電網(wǎng)事故發(fā)生概率預(yù)測算法精度較差。為解決以上問題,對數(shù)據(jù)特征提取以及融合的過程進行優(yōu)化,并設(shè)計一種新的電網(wǎng)運行狀態(tài)下的事故發(fā)生概率預(yù)測算法。該算法為了保證預(yù)測結(jié)果的準確性,在事故發(fā)生概率預(yù)測中充分考慮隨機數(shù)的問題,避免模型產(chǎn)生過度擬合,從而實現(xiàn)提高預(yù)測結(jié)果準確性的目的。同時,在預(yù)測中通過放棄部分復(fù)雜數(shù)據(jù)的方式降低算法的復(fù)雜性,加快算法的響應(yīng)速度,實現(xiàn)算法優(yōu)化。
電網(wǎng)運行狀態(tài)的數(shù)據(jù)中通常存在著較多無用以及冗余信息,因此想要得到能夠代入的信息就需要對其進行篩選與提取。在表格處理工具中將原始數(shù)據(jù)按照一定的規(guī)則合并成一張大表,然后以一定的規(guī)則對數(shù)據(jù)進行過濾篩選。為了保證特征提取的準確性,所有數(shù)據(jù)必須完全從電網(wǎng)運行狀態(tài)中復(fù)制下來,并經(jīng)過噪音處理和異常值排查兩個步驟。通常情況下,只有數(shù)值型的數(shù)據(jù)才可以作為能夠直接進行特征提取的數(shù)據(jù),因此需要對其中的一些文字型、符號型數(shù)據(jù)進行轉(zhuǎn)換處理,然后將這些數(shù)據(jù)統(tǒng)一量化。量化時需要將這些數(shù)據(jù)的均值編碼作為先驗概率和后驗概率的一個目標組合,將所有數(shù)據(jù)編制為一個訓練集,并在其中使用以下計算公式計算先驗概率。
(1)
(2)
得到了先驗概率和后驗概率的計算方法后,就可以將這兩項指標作為權(quán)重參數(shù)帶入到訓練集中。其后驗概率越高,該概率的可信度就越高。權(quán)重參數(shù)可以通過式(3)計算:
(3)
式中,λ表示數(shù)據(jù)集的權(quán)重參數(shù),n表示該特征值在數(shù)據(jù)訓練中出現(xiàn)的次數(shù),f表示該權(quán)重計算函數(shù)的參數(shù),f越大,權(quán)重值隨n變化的速度就越慢,e表示權(quán)重參數(shù)推導的量化差。如此就能夠提取到電網(wǎng)運行狀態(tài)下數(shù)據(jù)的融合特征,并計算其權(quán)重值。
根據(jù)上述分析可知,所提算法通過計算得到電網(wǎng)運行狀態(tài)下數(shù)據(jù)融合特征的先驗概率和后驗概率,并將這兩項指標作為權(quán)重參數(shù)帶入到訓練集中,得到數(shù)據(jù)融合特征的權(quán)重值。解決了傳統(tǒng)方法由于不能準確計算各類差異化較大的事故權(quán)重數(shù)值,導致事故概率預(yù)測的精度較差的問題。
通過上文中的先驗概率、后驗概率以及權(quán)重值的計算,能夠得到從原因到結(jié)果的預(yù)測推理,此時應(yīng)從近似推理的角度,通過一定的算法得到電網(wǎng)事故發(fā)生的概率,其計算的流程如圖1所示。
圖1 概率計算流程圖
如圖1所示,概率計算過程中的首要步驟是進行數(shù)據(jù)集的初始化,即構(gòu)建一個聯(lián)合數(shù)據(jù)集,根據(jù)高維數(shù)據(jù)融合原理,設(shè)置CPT的分配參數(shù),將G組織中的每一個團結(jié)點Xi作為一個覆蓋家族的基團,然后將P(Xi|π(Xi))存儲在團結(jié)點處,此時聯(lián)合數(shù)據(jù)的觀測值可以表示為xe:XE=xe。然后通過上文中的公式進行節(jié)點的數(shù)據(jù)傳遞與計算,每一個父節(jié)點都會與子節(jié)點兩兩相連,再經(jīng)由子節(jié)點作為父節(jié)點向其他方向傳遞,從而形成一個樹形的網(wǎng)絡(luò)結(jié)構(gòu)。信息傳遞主要可以分為兩個主要階段,分別是數(shù)據(jù)收集和數(shù)據(jù)分發(fā)階段,通過選定一個包含父節(jié)點的團結(jié)點作為樞紐,從距離父節(jié)點最遠處開始向父節(jié)點傳遞數(shù)據(jù),直到將該條線路上的所有數(shù)據(jù)全部測定即可視為信息收集成功。而信息分發(fā)則正好相反,從父節(jié)點開始,向更遠處傳遞數(shù)據(jù),直至傳遞到最后一個子節(jié)點,如此將該數(shù)據(jù)集中的每一個節(jié)點遍歷。在這個數(shù)據(jù)樹中,由三角形的環(huán)是構(gòu)成電網(wǎng)事故的節(jié)點,每一個節(jié)點包含四個或四個以上的子節(jié)點,通過以下公式可以使其三角化。
(4)
式中,P(Xf|XA)表示電網(wǎng)中事故概率的計算結(jié)果,Xf表示父節(jié)點,XA表示子節(jié)點,xa表示該子節(jié)點所在的節(jié)點數(shù)。每當有新的數(shù)據(jù)信息時,就需要重新初始化數(shù)據(jù)集,并再一次計算事故概率,直至所有數(shù)據(jù)計算完畢。
根據(jù)上文中得到的概率數(shù)據(jù),可以在設(shè)計電網(wǎng)事故發(fā)生概率預(yù)測算法的過程中首先構(gòu)建一個基于概率數(shù)據(jù)集的訓練樣本X={(xa,ya)},且a=1,2,3,…,n。上文中由樹狀節(jié)點預(yù)測集成函數(shù)相加所得的模型可以表示為
(5)
式中,M表示訓練集數(shù)據(jù)樹的分支數(shù)量,α表示最終預(yù)測值,fk(β)表示第k個分支樣本的計算分值,且fk∈H,H表示一個由數(shù)據(jù)所組成的函數(shù)空間[6]。想要保證預(yù)測結(jié)果的準確性,就需要在該概率預(yù)測算法中考慮到隨機數(shù)的問題,為了避免模型過度擬合,可以在數(shù)據(jù)中加入代數(shù)公式作為預(yù)測模型復(fù)雜度的控制公式:
(6)
式中,?表示各概率數(shù)值的權(quán)重,λ、μ均為預(yù)測模型的參數(shù),σ(fk)表示該數(shù)據(jù)集所得到的計算公式的復(fù)雜度,若σ(fk)>0.5,則可以放棄該部分數(shù)值,若σ(fk)<0.5,則可以將該數(shù)值作為預(yù)測算法的底層數(shù)據(jù)。通過放棄一部分復(fù)雜數(shù)據(jù)的方式降低算法的復(fù)雜性,加快算法的響應(yīng)速度,對算法進行優(yōu)化[7]。得到所有復(fù)雜度在0.5以下的所有數(shù)據(jù)以后,可以通過將目標函數(shù)展開為二階泰勒公式的方式,移除常數(shù)項,并進一步提高實際預(yù)測值的精度。
(7)
式中,π(t)表示第t次迭代時的實際預(yù)測值,fi表示損失函數(shù)的一階導數(shù),gt表示預(yù)測算法中子節(jié)點的數(shù)目,yi表示預(yù)測遍歷的次數(shù),ti表示損失函數(shù)的二階導數(shù)[8]。通過該公式,能夠得到所有事故發(fā)生概率的預(yù)測集合,然后可以通過式(8)和式(9)選出各子空間中的最優(yōu)函數(shù)值。
(8)
(9)
式中,?j表示第j個數(shù)據(jù)集的最優(yōu)權(quán)重,Ο表示所有預(yù)測數(shù)據(jù)中的最優(yōu)函數(shù)值,J表示衡量該算法精確度的函數(shù),函數(shù)的數(shù)值越低,表示該算法預(yù)測的準確度越高[9]。如此就可以通過對觀測數(shù)據(jù)預(yù)警的方式比較算法中各數(shù)據(jù)的準確度,最后選擇一個數(shù)值最高的概率預(yù)測結(jié)果,作為最后的輸出值,該輸出值就是電網(wǎng)事故發(fā)生概率預(yù)測函數(shù)。
本文通過實驗驗證高維數(shù)據(jù)特征提取與融合的方法建立的概率預(yù)測算法,是否具備實效性和實時預(yù)測的準確性。在該實驗中所使用的測試平臺為一臺具備Windows 10操作系統(tǒng)的計算機,其運行環(huán)境如表1所示。
表1 測試環(huán)境
將某電網(wǎng)系統(tǒng)一年內(nèi)的電網(wǎng)運行數(shù)據(jù)作為原始資料,表2為具體的電網(wǎng)運行數(shù)據(jù)。
表2 電網(wǎng)運行數(shù)據(jù)
分別使用表格工具統(tǒng)計出詳細的正負樣本信息和特征分布結(jié)果,然后建立能夠應(yīng)用在函數(shù)模型中的數(shù)據(jù)集,對比基于單調(diào)函數(shù)的事故發(fā)生概率預(yù)測算法、基于數(shù)據(jù)特征權(quán)重的事故發(fā)生概率預(yù)測算法和基于回歸分析的事故發(fā)生概率預(yù)測算法與所提算法的應(yīng)用效果。
所提算法主要通過構(gòu)建能夠平衡各高維數(shù)據(jù)特征屬性的數(shù)據(jù)集來對概率預(yù)測算法作出優(yōu)化,因此可以通過對比數(shù)據(jù)集的方式判斷不同算法的性能。為了保證實驗結(jié)果的準確性,在數(shù)據(jù)集的構(gòu)建中有兩項必不可少的指標,分別是權(quán)重與編碼,以下實驗主要以這兩項參數(shù)作為評價指標。權(quán)重衰減因數(shù)通常表示各項事件權(quán)重的影響參數(shù),衰減因數(shù)越大,則該數(shù)據(jù)集的準確性越強。對編碼因數(shù)的測試,則是因為通過數(shù)據(jù)子樹節(jié)點可以將所有整條路徑進行編碼,進而實現(xiàn)對所有遍歷路徑的整理,因此編碼因數(shù)越小,其所需要經(jīng)歷的概率數(shù)值就越小,計算結(jié)果越準確。在計算權(quán)重與編碼因數(shù)時,將默認參數(shù)設(shè)置為0.063 3,得到的對比結(jié)果如表3和表4所示。
如表3所示,四種算法的權(quán)重衰減因數(shù)存在一定的差異,所提算法的權(quán)重衰減因數(shù)明顯高于其他三種算法,其權(quán)重衰減因數(shù)最高值達到了0.87。表4中所提算法的編碼因數(shù)均小于其他三種算法,其編碼因數(shù)最低值僅為0.14。因此
表3 權(quán)重衰減因數(shù)對比
表4 編碼因數(shù)對比
可以得知,所提算法建立的數(shù)據(jù)集準確度高于其他三種算法。
根據(jù)以上數(shù)據(jù)集,可以得到概率預(yù)測的函數(shù)模型,將該函數(shù)模型帶入到原始數(shù)據(jù)中進行測試,通過前一刻的電網(wǎng)運行狀態(tài)預(yù)測下一刻的電網(wǎng)事故發(fā)生概率。與當前的三種算法對比,以電網(wǎng)規(guī)模為橫坐標,以預(yù)測的誤差為縱坐標,得到如圖2所示的實驗圖像。
如圖2所示,曲線所代表的誤差均在0以上,表示算法得到的概率預(yù)測數(shù)值均大于樣本數(shù)據(jù)。而傳統(tǒng)算法在概率預(yù)測中的誤差大于所提算法,說明所提算法的預(yù)測精確度更高,誤差最小。
圖2 不同算法預(yù)測準確度對比
上文基于電網(wǎng)運行狀態(tài)下事故發(fā)生概率預(yù)測精度較低的問題構(gòu)建了一個新的概率預(yù)測算法,并通過實驗驗證了該算法的準確性,相較于當前算法預(yù)測誤差更小,能夠為電網(wǎng)運維人員提供一定的支持。所提算法可以有效避免大規(guī)模電網(wǎng)事故的發(fā)生,對于電網(wǎng)供電安全保障領(lǐng)域具有一定的實際應(yīng)用價值。