摘? 要:為了實(shí)現(xiàn)變電器穩(wěn)定安全的運(yùn)行,解決設(shè)備預(yù)警的時效性差、精準(zhǔn)度低、故障后搶修成本高等問題,文章基于配電設(shè)備歷史運(yùn)行數(shù)據(jù)和機(jī)器學(xué)習(xí)等相關(guān)知識,采用梯度提升樹(GBDT)算法,對設(shè)備重過載情況進(jìn)行預(yù)測。研究結(jié)果表明,建立設(shè)備運(yùn)行狀態(tài)智能感知模型和設(shè)備重過載預(yù)測模型,能夠精準(zhǔn)預(yù)測設(shè)備重過載現(xiàn)象,優(yōu)化設(shè)備檢修維護(hù)策略,降低設(shè)備檢修維護(hù)成本,可實(shí)現(xiàn)保障電網(wǎng)經(jīng)濟(jì)運(yùn)行的目的。
關(guān)鍵詞:變電器;重過載;GBDT算法
中圖分類號:TP39;TM715? ? 文獻(xiàn)標(biāo)識碼:A? 文章編號:2096-4706(2023)07-0144-03
Abstract: In order to realize the stable and safe operation of the transformer and solve the problems of poor timeliness, low accuracy and high cost of emergency repair after failure of the equipment early warning, this paper uses the gradient lifting tree (GBDT) algorithm to predict the equipment overload based on the historical operation data of the distribution equipment and machine learning and other relevant knowledge. The research results show that the establishment of intelligent perception model of equipment operation status and equipment heavy overload prediction model can accurately predict the phenomenon of equipment heavy overload, optimize equipment maintenance strategies, reduce equipment maintenance costs, and can achieve the purpose of ensuring the economic operation of the power grid.
Keywords: transformer; heavy overload; GBDT algorithm
0? 引? 言
隨著科學(xué)技術(shù)的進(jìn)步和人們生活水平的提高,我國的電力系統(tǒng)得到了極大的發(fā)展,在促進(jìn)經(jīng)濟(jì)發(fā)展和便利人民生活方面起到了至關(guān)重要的作用,但不容忽視的是,電力系統(tǒng)在實(shí)際運(yùn)行過程中存在各種各樣的問題,其中,作為電網(wǎng)的核心組成部分,電力變電器在電網(wǎng)運(yùn)行中發(fā)揮著無可替代的作用,其故障檢修和維護(hù)事關(guān)整個電力系統(tǒng)運(yùn)行的安全穩(wěn)定與高效。但是由于受到運(yùn)行原理和自身構(gòu)造的限制,電力變電器的重過載事故時有發(fā)生,對電力系統(tǒng)的安全運(yùn)行造成嚴(yán)重威脅,需要進(jìn)行有效的設(shè)備運(yùn)行檢修和日常維護(hù),及時發(fā)現(xiàn)并處理設(shè)備故障,保證輸電工作的正常運(yùn)行。因此,根據(jù)變電器日常運(yùn)行狀態(tài)大數(shù)據(jù),有效分析與深度挖掘變電器運(yùn)行狀態(tài)及重過載事故特征數(shù)據(jù),提煉變電器日常運(yùn)行狀態(tài)特征及狀態(tài)指標(biāo),以此構(gòu)建變電器重過載精準(zhǔn)預(yù)測模型,對保障電力系統(tǒng)的正常運(yùn)行愈發(fā)重要。
本文以變電器設(shè)備的精準(zhǔn)故障預(yù)測研究為基礎(chǔ),基于現(xiàn)有配電設(shè)備歷史中的設(shè)備運(yùn)行狀態(tài)數(shù)據(jù)積累和機(jī)器學(xué)習(xí)方法等大數(shù)據(jù)方面相關(guān)基礎(chǔ)理論知識,一方面深刻分析當(dāng)前各類供電系統(tǒng)設(shè)備故障所存在的潛在問題成因,另一方面應(yīng)用機(jī)器學(xué)習(xí)技術(shù)建立供電設(shè)備的重負(fù)荷過載故障預(yù)測分析模型,從而全面掌握電網(wǎng)設(shè)備日常運(yùn)行檢修狀態(tài),優(yōu)化用電設(shè)備運(yùn)行檢修的維護(hù)服務(wù)策略,提升主配電網(wǎng)用戶的穩(wěn)定供電可靠率,降低電力設(shè)備檢修與維護(hù)成本,保障電網(wǎng)經(jīng)濟(jì)運(yùn)行。
1? 梯度提升決策樹(GBDT)算法
梯度提升決策樹(Gradient Boosting Decision Tree, GBDT)是一種決策樹的迭代算法。GBDT模型的應(yīng)用范圍特別廣,是一個強(qiáng)有力的模型,可以同時應(yīng)用于重歸、二分類和多歸類問題。它應(yīng)用的是多方位遍布優(yōu)化算法,作為弱學(xué)習(xí)者,第一次決策樹練習(xí)是給樹配方差。因而,第一輪的強(qiáng)學(xué)習(xí)者等同于前輪的強(qiáng)學(xué)習(xí)者和新的弱學(xué)習(xí)者。根據(jù)這些方法反復(fù)升級,可以不斷降低全部模型的偏差。
在GBDT的迭代中,假設(shè)我們前一輪迭代得到的強(qiáng)學(xué)習(xí)器為fm-1(X ),損失函數(shù)為L( y,fm-1(X )),本輪迭代的目標(biāo)是找到一個弱學(xué)習(xí)器hm(X ),使損失L( y,fm(X ))=L( y,fm-1(X )+hm(X ))最小。GBDT分類的損失函數(shù)一般為:
L( y1,fm(Xi))=-( yilog pi+(1-yi)log(1-pi))
其中:pi=1/(1+ )表示預(yù)測概率值,xi表示第i個樣本特征,yi表示xi的觀測類別概率值。
GBDT算法具有以下優(yōu)點(diǎn):
1)相較于其他模型算法,GBDT算法具有在預(yù)測階段集上計算速度快,樹群之間的可并行化和計算簡單性。
2)由于采用決策樹模型作為最優(yōu)弱的分類器而使得GBDT模型同樣也保持著較高可重復(fù)解釋的性能和較高的魯棒性。
3)數(shù)據(jù)不需要?dú)w一化,特征的作用只是用來分裂結(jié)點(diǎn),葉結(jié)點(diǎn)的值與特征值的大小無關(guān),是否歸一化并不影響葉結(jié)點(diǎn)值的大小,也不影響梯度下降的進(jìn)程。
2? 變電器重過載預(yù)測模型構(gòu)建
2.1? 建模思路
針對變電器日常運(yùn)行的狀態(tài)指標(biāo),基于AI技術(shù)分析變電器的基本數(shù)據(jù)(如出廠年限、投運(yùn)年限等)、運(yùn)行數(shù)據(jù)(如近一年運(yùn)行數(shù)據(jù)、近幾月運(yùn)行數(shù)據(jù)等)、設(shè)備運(yùn)行智能感知數(shù)據(jù)等,尋找影響因素,對是否為重過載設(shè)備進(jìn)行預(yù)測和分析,進(jìn)而進(jìn)行設(shè)備維護(hù)。建模思路如圖1所示。
2.2? 數(shù)據(jù)說明
本文提取變電器設(shè)備基本數(shù)據(jù)、運(yùn)行數(shù)據(jù),包括配變編號、運(yùn)行年限、額定容量、是否為節(jié)假日、上個月重過載數(shù)據(jù)、上兩個月重過載數(shù)據(jù)、上三個月重過載數(shù)據(jù)、氣象數(shù)據(jù)、去年同期運(yùn)行數(shù)據(jù)等特征,共32個自變量,是否為重過載設(shè)備設(shè)為因變量,每一個樣本為每一臺設(shè)備的相關(guān)信息,共146 590個樣本。設(shè)備重過載變量說明如表1所示。
2.3? 數(shù)據(jù)處理
首先對數(shù)據(jù)進(jìn)行過濾,設(shè)立條件為將數(shù)據(jù)中數(shù)值為0的數(shù)據(jù)過濾掉。根據(jù)所設(shè)的條件完成行數(shù)據(jù)的過濾,滿足條件的記錄將被保留,不滿足條件的記錄將被過濾刪除。其次再對缺失值進(jìn)行處理,這里我們將數(shù)值型屬性的缺失值用平均值填充,字符型屬性的缺失值用最多次數(shù)項(xiàng)填充:
1)對數(shù)據(jù)的重復(fù)值、缺失值和空格值進(jìn)行處理,同時進(jìn)行字段抽取、字段拆分和記錄抽取。由于數(shù)據(jù)集中包含許多會對預(yù)測結(jié)果產(chǎn)生誤差的值,因此在加工處理數(shù)據(jù)之前有必要對原始數(shù)據(jù)進(jìn)行初步的清洗,刪除對研究無影響的數(shù)據(jù)內(nèi)容。例如,對數(shù)據(jù)集中包含的缺失值進(jìn)行加工處理,找到缺失值所在的行將其刪除得到最后所需的數(shù)據(jù)集。
2)一階特征組合。通過對現(xiàn)有特征數(shù)據(jù)的一階運(yùn)算,得到新的一階特征數(shù)據(jù)。如利用數(shù)據(jù)日期和月份,計算出運(yùn)行設(shè)備的正常運(yùn)行天數(shù),表達(dá)式為:
負(fù)載率(20_50)次數(shù)+負(fù)載率(50_80)次數(shù)
3)二階特征組合。在現(xiàn)有特征數(shù)據(jù)的基礎(chǔ)上進(jìn)行二階特征組合,產(chǎn)生新特征。如在原始特征“重過載點(diǎn)數(shù)”的基礎(chǔ)上進(jìn)行二階特征組合,得到“上個月重過載次數(shù)”“上兩個月重過載次數(shù)”“上三個月重過載次數(shù)”。
4)數(shù)據(jù)拆分是將原始樣本集按照2個(訓(xùn)練集和測試集)或者3個(訓(xùn)練集、測試集和驗(yàn)證集)的方式,拆分為2或3的子集個數(shù)。拆分后各個子集的比例總和小于等于100%。數(shù)據(jù)拆分經(jīng)常作為回歸或者分類算法節(jié)點(diǎn)的前置節(jié)點(diǎn)。重過載精準(zhǔn)預(yù)測模型是將原始樣本拆分為2個數(shù)據(jù)集(訓(xùn)練集和測試集),用60%的數(shù)據(jù)作為訓(xùn)練集,進(jìn)行建模,尋找影響因素和是否為重過載設(shè)備之間的關(guān)系模型;用40%的數(shù)據(jù)作為測試集,驗(yàn)證該模型的準(zhǔn)確率。
2.4? 模型建立
重過載精準(zhǔn)預(yù)測模型是將設(shè)備基本信息(如投運(yùn)年限、出廠年限等)、運(yùn)行信息(如近一年運(yùn)行數(shù)據(jù)、近幾月運(yùn)行數(shù)據(jù)等)、設(shè)備運(yùn)行智能感知數(shù)據(jù)等作為影響因素,通過數(shù)據(jù)處理,用60%的數(shù)據(jù)作為訓(xùn)練集,用40%的數(shù)據(jù)作為測試集。通過梯度提升決策樹分類算法對訓(xùn)練集進(jìn)行建模,尋找影響因素和是否為重過載設(shè)備之間的數(shù)學(xué)模型,然后通過測試集來驗(yàn)證該數(shù)學(xué)模型的準(zhǔn)確率。如果誤差能夠控制在一定的范圍內(nèi),則認(rèn)為該模型很好地反映了影響因素和是否為重過載設(shè)備之間的關(guān)系,可以用來進(jìn)行預(yù)測和分析。本文采取的分析軟件為Tempodata機(jī)器學(xué)習(xí)平臺。
GBDT模型中重要參數(shù)信息配置如下:
迭代步長:設(shè)置每次迭代的步長,浮點(diǎn)型,取值范圍(0,1),取值為0.1。
決策樹個數(shù):設(shè)置決策樹個數(shù),整型,取值范圍[1,∞],取值為20。
最大深度:樹的最大深度,整型,取值范圍[1,30],取值為5。
最大份數(shù):數(shù)值型屬性分割份數(shù)設(shè)置,整型,取值范圍[2,10 000],取值為32。
收斂容差:設(shè)置終止樹生長的誤差界,浮點(diǎn)型,取值范圍[0,1),取值為0.01。
2.5? 模型評估
模型評估一方面能夠?qū)δP偷谋憩F(xiàn)進(jìn)行評估,另一方面能夠根據(jù)指定的評價指標(biāo)進(jìn)行模型比較,推薦出最佳模型。
經(jīng)過特征指標(biāo)重要度計算,得出判斷變電器是否重過載最重要的因素是上個月重載點(diǎn)數(shù)和溫度相關(guān)特征,其次是時間相關(guān)的變量。
檢測模型的準(zhǔn)確度,以60%的數(shù)據(jù)作為訓(xùn)練集,以40%的數(shù)據(jù)作為測試集。訓(xùn)練集和測試集結(jié)果如表2、表3所示。
從整體正確率來看,訓(xùn)練集平均正確率為95.89%,測試集平均正確率為95.58%。為了盡可能監(jiān)測設(shè)備檢修工作,更希望預(yù)測設(shè)備是故障設(shè)備,因此分類準(zhǔn)確率更為重要。通過對測試集上的混淆矩陣結(jié)果的分析,可以得到預(yù)測為0的準(zhǔn)確率為96.06%,預(yù)測為1的準(zhǔn)確率為90.71%,分類效果較好,預(yù)測精度較高。
模型的ROC曲線如圖2所示。
由ROC曲線可知,ROC曲線下面積AUC為0.959 2,接近于1,說明模型的診斷效能很好。
3? 變電器重過載預(yù)測模型應(yīng)用效果
針對傳統(tǒng)設(shè)備檢修面臨的工作量大和檢修不及時等問題,基于歷史設(shè)備運(yùn)行數(shù)據(jù),建立設(shè)備狀態(tài)和重過載預(yù)測模型進(jìn)行精準(zhǔn)檢修管控,制定有針對性的檢修策略,并提供高概率重過載的設(shè)備清單,切實(shí)降低檢修人員的工作量,提高用電服務(wù)效率。歷經(jīng)2個月的業(yè)務(wù)驗(yàn)證,對200多臺設(shè)備進(jìn)行精準(zhǔn)維護(hù),避免了3次大范圍停電,減少大約300多個檢修人天,驗(yàn)證期間整體效果保持相對穩(wěn)定。實(shí)際業(yè)務(wù)驗(yàn)證效果同模型評價結(jié)果基本一致,符合模型的預(yù)期目標(biāo)。
4? 結(jié)? 論
本文對設(shè)備歷史運(yùn)行相關(guān)數(shù)據(jù)進(jìn)行挖掘建模及應(yīng)用,達(dá)到對設(shè)備進(jìn)行精準(zhǔn)管控的目的。通過對所建立模型的部署和應(yīng)用,實(shí)現(xiàn)模型的工程化應(yīng)用。基于設(shè)備重過載精準(zhǔn)預(yù)測是將設(shè)備基本信息、運(yùn)行信息作為影響因素,構(gòu)建設(shè)備重過載精準(zhǔn)預(yù)測模型,基于該模型,可以預(yù)測高概率發(fā)生重過載故障的潛在設(shè)備,為檢修人員提供精準(zhǔn)設(shè)備清單,提升檢修維護(hù)效率,降低檢修成本,保障電網(wǎng)運(yùn)行效率。
綜上所述,變電器的安全、穩(wěn)定運(yùn)行為我國的經(jīng)濟(jì)建設(shè)提供了充足的動力,在配電變電器的運(yùn)行和故障維護(hù)方面要給予高度的重視,因此,變電器運(yùn)行故障處理中維護(hù)技術(shù)的應(yīng)用也愈來愈重要,特別是要加強(qiáng)對變壓器重過載的實(shí)時監(jiān)督與檢測。為保障電力系統(tǒng)的正常運(yùn)行,供電企業(yè)要全方位地掌握設(shè)備的運(yùn)行狀態(tài),優(yōu)化設(shè)備檢修維護(hù)策略,提升配電網(wǎng)的供電可靠率,降低設(shè)備檢修維護(hù)成本,保障電網(wǎng)經(jīng)濟(jì)運(yùn)行,提高人民生活質(zhì)量,為我國的經(jīng)濟(jì)建設(shè)保駕護(hù)航。
參考文獻(xiàn):
[1] 倪益民,楊宇,樊陳,等.智能變電站二次設(shè)備集成方案討論 [J].電力系統(tǒng)自動化,2014,38(3):194-199.
[2] 蔣益強(qiáng).二次系統(tǒng)基礎(chǔ)上的狀態(tài)檢修技術(shù)在智能變電站中的實(shí)踐分析 [J].中國新技術(shù)新產(chǎn)品,2014(8):2-3.
[3] 李方震.淺析電力系統(tǒng)變電運(yùn)行中常見的故障類型及解決措施 [J].中國戰(zhàn)略新興產(chǎn)業(yè),2017(12):176+178.
[4] 高吉普,徐長寶,戴宇,等.智能變電站 IEEE1588 以太網(wǎng)交換機(jī)故障案例復(fù)現(xiàn)測試及分析 [J].電力系統(tǒng)保護(hù)與控制,2014,42(14):146-150.
[5] 曹琪娜,張?jiān)娊?配電變壓器輕重過載治理方法探討 [J].大眾用電,2018,32(4):25-26.
[6] 賀建章,王海波,季知祥,等.基于隨機(jī)森林理論的配電變壓器重過載預(yù)測 [J].電網(wǎng)技術(shù),2017,41(8):2593-2597.
作者簡介:李淑玲(1976.10—),女,漢族,河南鄭州人,副教授,碩士,主要研究方向:計算機(jī)應(yīng)用、數(shù)據(jù)挖掘與分析、應(yīng)用統(tǒng)計。