饒歡 陳鳳超 何毅鵬
摘 要:針對配電網(wǎng)配變不匹配的問題,本文提出基于分類決策樹對電網(wǎng)配變不匹配問題的故障診斷算法,通過獲取省海量平臺計量數(shù)據(jù)和營銷數(shù)據(jù),從數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)真實性校驗、數(shù)據(jù)修正和數(shù)據(jù)駁回四個步驟對數(shù)據(jù)進(jìn)行分析,從而達(dá)到提高數(shù)據(jù)質(zhì)量的目的,分類決策樹算法的應(yīng)用可以輔助調(diào)度人員迅速識別故障,保證配電網(wǎng)的安全穩(wěn)定運(yùn)行。
關(guān)鍵詞:配電變壓器;決策樹算法;數(shù)據(jù)質(zhì)量;故障診斷
0 引言
配電變壓器數(shù)據(jù)中電壓或電流超限后報警,配網(wǎng)調(diào)度員從數(shù)據(jù)庫中核查報警位置處理數(shù)據(jù),調(diào)取臺賬數(shù)據(jù)與原始報文,逐一排查配變匹配問題。這種利用手工排查故障過程十分繁瑣,需要大量人力而且容易出錯,自動化數(shù)據(jù)校驗水平較低。為提高故障診斷的準(zhǔn)確性和快速性,一些學(xué)者提出了基于專家系統(tǒng)[1]、人工神經(jīng)網(wǎng)絡(luò)[2]、遺傳算法[3]和Petri網(wǎng)絡(luò)[4]的等多種排查方法,上述方法均存在一定的局限性,基于分類決策樹對電網(wǎng)配變不匹配問題的算法應(yīng)用適應(yīng)各種不利情況的配電網(wǎng)故障診斷方法,輔助調(diào)度人員迅速識別故障,保證配電網(wǎng)的安全穩(wěn)定運(yùn)行。
1 決策樹算法
1.1 決策樹算法原理
決策樹[5-7]是在已知情況發(fā)生概率的基礎(chǔ)上,通過構(gòu)成決策樹來計算凈現(xiàn)值的期望值是否大于等于零的概率,判斷發(fā)生問題可行性的決策分析方法。在機(jī)器學(xué)習(xí)中,決策樹是一個預(yù)測計算模型,它代表的是對象屬性與對象值之間的相互映射關(guān)系。決策樹是一種樹形結(jié)構(gòu),其中決策樹每個內(nèi)部節(jié)點(diǎn)表示一個屬性上的測試,決策樹每個分支代表一個測試輸出,決策樹每個葉節(jié)點(diǎn)表示一種類別。
1.2 分類決策樹算法原理
分類樹是一種比較常用的分類方法,屬于一種有監(jiān)督機(jī)器學(xué)習(xí)算法,從一堆待測試樣本中選取樣本,每個樣本都有一組相應(yīng)的屬性和類別,屬性和類別是提前確定的,那么通過有監(jiān)督學(xué)習(xí)得到一個分類器,分類器可以新的樣本給出正確的分類。分類決策樹模型表示一種對實例進(jìn)行樣本分類的樹形結(jié)構(gòu),決策樹通常由有向邊和結(jié)點(diǎn)兩部分組成,樣本中的每個結(jié)點(diǎn)由內(nèi)部節(jié)點(diǎn)和葉子節(jié)點(diǎn)組成。內(nèi)部節(jié)點(diǎn)通常表示的是特征或者屬性,葉子節(jié)點(diǎn)表示單個獨(dú)立的個體,屬于不能再細(xì)分的類別。當(dāng)樣本的節(jié)點(diǎn)進(jìn)行分類劃分時,從一個根節(jié)點(diǎn)開始,針對實例的某一特征向量進(jìn)行測試,依據(jù)樣本的測試結(jié)果,將樣本實例分配到其子結(jié)點(diǎn),每一個樣本子結(jié)點(diǎn)和特征的取值相對應(yīng)。設(shè)置相應(yīng)閾值,不斷遞歸向下移動,到達(dá)葉結(jié)點(diǎn)為止,這時將樣本實例分配到葉子結(jié)點(diǎn)的種類。
1.3 分類決策樹的建立
分類決策樹剪枝是針對決策樹過早擬合問題而提出來的。分類決策樹剪枝一般分先剪枝和后剪枝。通過提前停止樹的構(gòu)造方法屬于先剪枝,假如決定在某個關(guān)鍵節(jié)點(diǎn)不再進(jìn)行分裂,對樹節(jié)點(diǎn)進(jìn)行剪枝,如果剪枝停止,那么該節(jié)點(diǎn)就變成樣本中的葉子節(jié)點(diǎn)。對該葉子節(jié)點(diǎn)選取包含樣本子集中類別最多的一個類,作為樣本節(jié)點(diǎn)的一個類別。后剪枝是針對完全成長的樹進(jìn)行剪枝,通過去掉節(jié)點(diǎn)的分枝,用葉子節(jié)點(diǎn)代替,葉子節(jié)點(diǎn)用子集中類別中出現(xiàn)頻率最高的類別進(jìn)行標(biāo)記。本文基于分類決策樹對電網(wǎng)配變不匹配問題的故障診斷算法采用后剪枝的策略。
2 整體實現(xiàn)
本文從數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)真實性校驗、數(shù)據(jù)修正和數(shù)據(jù)駁回四個步驟實現(xiàn)了解決電網(wǎng)配變不匹配問題,在同一個用戶同時擁有高供高計和高供低計兩個測量點(diǎn),電壓數(shù)據(jù)經(jīng)常在高壓側(cè)和低壓側(cè)切換,造成電壓越限。用戶側(cè)設(shè)備更新,而計量系統(tǒng)或營銷系統(tǒng)中的變比數(shù)據(jù)未及時同步或填寫不規(guī)范,或由于計費(fèi)原因不能同步更新,直接影響PQIU等量測數(shù)據(jù)計算。本文數(shù)據(jù)來源于某省海量平臺計量數(shù)據(jù)和省海量平臺營銷數(shù)據(jù),先匹配臺帳營銷數(shù)據(jù),獲取導(dǎo)致錯誤異常報數(shù)據(jù)警,系統(tǒng)中對UI設(shè)定上下限的閾值。獲取某省海量平臺計量數(shù)據(jù)和省海量平臺營銷數(shù)據(jù)。檢查電壓電流,匹配臺帳營銷數(shù)據(jù),提取異常報警數(shù)據(jù),檢查異常數(shù)據(jù)確實、重復(fù)情況,如果沒有重復(fù),提取異常超限數(shù)據(jù),提取數(shù)據(jù)相關(guān)匹配、變比、電壓、電流信息,利用變比關(guān)系對比量測數(shù)據(jù),高供高記變比計算和高供低記變比計算,利用變比關(guān)系對比量測數(shù)據(jù),如果匹配,錄入缺失數(shù)據(jù)計量點(diǎn)位,如果不匹配。利用專家系統(tǒng)分析具體原因[8,9],建立數(shù)據(jù)規(guī)則,利用決策樹皮判別,訓(xùn)練決策樹參數(shù),載入后續(xù)參數(shù),分析電壓電流報警原因,建立數(shù)據(jù)集規(guī)則,判斷是否誤報警,如果沒有報警輸出真實報警信息,并重新檢查線路功率,如果報警,恢復(fù)變比數(shù)據(jù),包含匹配信息、變比信息、電壓計量數(shù)據(jù)和電流計量數(shù)據(jù)。
2.1 數(shù)據(jù)質(zhì)量檢查
首先由計量系統(tǒng)得到越限警告,核查越限處數(shù)據(jù)是否有缺失、重復(fù)、格式錯誤,如果數(shù)據(jù)有問題,結(jié)束質(zhì)量檢查;再判斷數(shù)據(jù)有問題的次數(shù),生成錯誤報告,結(jié)束質(zhì)量檢查,如果數(shù)據(jù)多次沒有問題,從省海量平臺重新下載數(shù)據(jù)。提取報警數(shù)據(jù),校驗警報信息的完整性,包括報警數(shù)據(jù)的時間、地點(diǎn)、設(shè)備編號、報警類型與嚴(yán)重程度,并且需要檢查報警時間是否缺失。報警地點(diǎn)與報警設(shè)備線路需要相匹配,報警設(shè)備編號與臺賬數(shù)據(jù)信息需要匹配等。等待報警類型提取確認(rèn),查看是否存在明顯誤報信息如圖1所示。
2.2 數(shù)據(jù)真實性校驗
使用基于決策樹的專家系統(tǒng)判別錯誤原因,判別規(guī)則流程如圖2所示,越線比例安裝大、中、小三個維度來劃分,持續(xù)時間按長、短兩個維度來劃分,其中規(guī)則中的“大”、“中”、“小”、“長”和“短”等詞語使用明確的閾值替代。排查工作集從越線比例大小、持續(xù)發(fā)生時間長短、是否斷續(xù)出現(xiàn)、是否有高供高計和高供低計混亂。
擬使用分類和回歸書(CART)模型來訓(xùn)練閾值。CART描述如:用s表示閾值,t表示節(jié)點(diǎn)位置,則s的優(yōu)劣衡量為:其中tL,tR為t的左/右子節(jié)點(diǎn),其中,PL代表左子節(jié)點(diǎn)的記錄數(shù)占訓(xùn)練集的記錄數(shù)比例,PR代表右子節(jié)點(diǎn)的記錄數(shù)占訓(xùn)練集的記錄數(shù)比例,P(j|tL)表示在tL處,j類的記錄數(shù)占節(jié)點(diǎn)的記錄數(shù)的比例,P(j|tR)表示在tR處,j類的記錄數(shù)占節(jié)點(diǎn)的記錄數(shù)的比例,使用Φ(s|t)取得最大值的劃分閾值作為本條規(guī)則的閾值。
2.3 數(shù)據(jù)修正
當(dāng)配電變壓器重過載報警,負(fù)載超限60%,持續(xù)發(fā)生30分鐘閾值大于12h,時常出現(xiàn)斷續(xù),利用分類決策樹算法進(jìn)行數(shù)據(jù)分析和過濾,如果沒有超限,將數(shù)據(jù)寫入修正工單如圖3所示。
2.4 數(shù)據(jù)駁回
當(dāng)越限比例閾值大于130%,持續(xù)時間大于16h,采用分類決策樹算法,如果沒有斷續(xù)出現(xiàn),變比未及時更新,將數(shù)據(jù)駁回進(jìn)行手工排查如圖4所示。
3 結(jié)語
本文提出基于分類決策樹對電網(wǎng)配變不匹配問題的故障診斷算法,從數(shù)據(jù)質(zhì)量檢查、數(shù)據(jù)真實性校驗、數(shù)據(jù)修正和數(shù)據(jù)駁回四個步驟實現(xiàn)了電網(wǎng)配變不匹配問題的快速診斷和定位。該故障診斷流程包括分類決策樹的建立、剪枝與測試。與其他分類算法相比,分類決策樹不需要參數(shù)假設(shè),且準(zhǔn)確率較。
參考文獻(xiàn)
[1] 劉少宇,郭宗軍,董明,等.專家系統(tǒng)在變電站設(shè)備診斷中的應(yīng)用[J].高電壓技術(shù),2001(5):17-19.
[2] 陳長征,勾軼,王毅,等.基于遺傳神經(jīng)網(wǎng)絡(luò)的汽輪發(fā)電機(jī)組故障診斷研究[J].高電壓技術(shù),2003(8):1-2+25.
[3] 顏景斌,夏賽,王飛,等.基于改進(jìn)遺傳算法的有源配電網(wǎng)故障定位分析[J].電力系統(tǒng)及其自動化學(xué)報,2019(6):107-112.
[4] 劉棟,陳允平,沈廣,等.基于UML和Petri網(wǎng)的電力系統(tǒng)恢復(fù)模型[J].高電壓技術(shù),2006(6):90-93+121.
[5] 焦亞男,馬杰.一種改進(jìn)的MEP決策樹剪枝算法[J].河北工業(yè)大學(xué)學(xué)報,2019(6):24-29.
[6] 王英英,羅毅,涂光瑜.基于粗糙集與決策樹的配電網(wǎng)故障診斷方法[J].高電壓技術(shù),2008(4):794-798.
[7] 中國電力科學(xué)研究院,國家電網(wǎng)公司,國網(wǎng)遼寧省電力有限公司沈陽供電公司.基于復(fù)雜事件處理技術(shù)和決策樹的配電網(wǎng)態(tài)勢感知方法:CN201610237515.2[P].2016-09-07.
[8] 馬春雷,丁健,陳宣林,等.基于決策樹自標(biāo)識的主動配電網(wǎng)狀態(tài)估計算法[J].電力大數(shù)據(jù),2019(5):26-32.
[9] 陳思翰.試析智能配電網(wǎng)技術(shù)在配電網(wǎng)中的應(yīng)用[J].大科技,2019(35):101.