陳霍興 張俊 海龍
摘 要:本文對輸電線路故障的影響因素進行分析,用相關性系數(shù)描述輸電故障和氣象數(shù)據(jù)之間關系。通過分析得出了氣象數(shù)據(jù)中的溫度、濕度、風速、氣壓和故障之間的相關性強度。通過對數(shù)據(jù)特征展開研究,以及對機器學習相關算法模型、關鍵算法組件的應用及驗證,為輸電線路故障分析提供有力的技術支撐。
關鍵詞:機器學習 線路故障 分析應用
中圖分類號:R196 文獻標識碼:A 文章編號:1672-3791(2018)12(a)-00-02
Abstract:In this paper, the influencing factors of transmission line faults are analyzed, and the correlation coefficient is used to describe the relationship between transmission faults and meteorological data. The correlation strength between temperature, humidity, wind speed, air pressure and fault is obtained through analysis. Through the research of data characteristics, and the application and verification of the machine learning algorithm model and key algorithm components, it provides a powerful technical support for the transmission line fault analysis.
Key words:machine learning; line fault; Analysis and Application
隨著電網(wǎng)規(guī)模的擴大,輸電線路運行安全對電網(wǎng)安全可靠運行的影響更為突出。本文分析了大量的輸電故障數(shù)據(jù),通過對故障數(shù)據(jù)的統(tǒng)計發(fā)現(xiàn)由外部氣象環(huán)境造成的故障占了總故障約45%,包括大風、高溫、雷電、污穢等故障原因。這幾類故障會影響導地線、桿塔、金具、絕緣子等幾大類設備,同時,會引起如安全距離不足、劣化自爆、缺損、傘群裂紋或電蝕、松脫位移、銹蝕損傷等類型的缺陷。
通過對輸電線路的運行狀態(tài)進行監(jiān)測、故障診斷、狀態(tài)評價,對提高輸變電設備的運行可靠性與利用率,實現(xiàn)設備的優(yōu)化管理具有重要科學意義和應用價值。輸電線路狀態(tài)參數(shù)對進行故障分析有較大的影響,如何合理地選擇參數(shù),保證線路故障評價的準確性,需要重點研究。
1 故障分析步驟
通過研究應用機器學習技術,挖掘電力數(shù)據(jù)中潛在的規(guī)律和價值,深入探索輸電線路故障分析的應用價值,促進電網(wǎng)向數(shù)字化、智能化、精益化方向發(fā)展。
1.1 業(yè)務理解(business understanding)
理解項目的業(yè)務目標和應用需求,以及把業(yè)務目標轉(zhuǎn)化為相對應的數(shù)據(jù)挖掘的問題,確定目標、明確分析需求。
1.2 數(shù)據(jù)探索(data understanding)
完成對源數(shù)據(jù)的收集,實現(xiàn)多源數(shù)據(jù)的融合,提取數(shù)據(jù)的特征,發(fā)現(xiàn)質(zhì)量問題、從數(shù)據(jù)中發(fā)現(xiàn)隱藏的信息或探測臆想的數(shù)據(jù)子集,并進行數(shù)據(jù)清洗。
1.3 算法模型(modeling)
建立模型階段,主要進行算法的選擇和參數(shù)的調(diào)整。有些算法可以解決一類相同的數(shù)據(jù)挖掘問題,有些算法在數(shù)據(jù)類型上有特殊的要求,因此需要根據(jù)業(yè)務目標和數(shù)據(jù)情況選擇合適的算法進行訓練。
1.4 模型評估(evaluation)
為了建立一個高質(zhì)量的模型,需要對訓練結果進行評估,檢查構造模型的步驟,確保模型可以完成業(yè)務目標。對模型進行較為全面的評價,并重審過程。
2 業(yè)務理解
2.1 業(yè)務調(diào)研
輸電線路故障分析:故障分析是電網(wǎng)運行中的一項重要工作。影響線路故障的因素較多,不僅受到線路臺賬、運行參數(shù)、廠家等因素影響,同時受到天氣狀況、季節(jié)性、地域等因素的影響,目前針對故障的分析涉及到多個維度、多個層次。
2.2 問題定位
輸電線路故障分析:目前線路的故障分析以南網(wǎng)導則為主,重點線路維護為輔開展,以人工方式進行統(tǒng)計和分析,沒有輸電線路故障的預測性。另外,電網(wǎng)中大量的監(jiān)測數(shù)據(jù)未得到有效應用
3 數(shù)據(jù)探索
為了建立一個高質(zhì)量的模型,需要充足的數(shù)據(jù)來支撐建模。本次數(shù)據(jù)分析涉及到的數(shù)據(jù)主要包括以下幾個方面。
(1)設備臺賬:設備名稱、設備類型、設備經(jīng)緯度。
(2)故障數(shù)據(jù):故障類型、故障緊急程度、故障部位、故障發(fā)生日期、故障描述。
(3)巡檢數(shù)據(jù):巡檢異常數(shù)、巡檢異常率、巡檢異常占比。
(4)氣象數(shù)據(jù):溫度、濕度、降雨量、氣壓。
4 算法模型
氣象環(huán)境與線路故障相關性分析:從氣象對電網(wǎng)影響的周期性特征出發(fā),由于氣象環(huán)境相關的線路故障率在不同年份和月份有差異,首先按照時間維度,統(tǒng)計線路不同時段的故障情況,包括故障次數(shù)、故障率、跳閘次數(shù)、跳閘率等,采用歐幾里得距離、余弦相似度、Pearson相關系數(shù)、Spearman秩相關系數(shù)、Kendall's tau-b等級相關系數(shù)計算分析。
以某一線路故障分析為例,特征量關聯(lián)關系列表如表1所示。
通過對線路故障在不同環(huán)境溫度下的各種特征量的兩兩分析,找出線路故障與環(huán)境溫度和其他特征量的關聯(lián)關系,從而得到線路故障的分析標準,進而實現(xiàn)通過數(shù)據(jù)本身的狀態(tài)評價,這種通過大數(shù)據(jù)平臺不斷的對特征量進行兩兩分析、多項分析,找出彼此的關聯(lián)關系的方法可以靈活的對不同設備的數(shù)據(jù)進行分析評價,在不斷分析中不斷自我完善、自我校準,實現(xiàn)靈活、可靠、精細化的數(shù)據(jù)分析及評價。
5 故障分析結論
通過對數(shù)據(jù)進行清洗、探索、統(tǒng)計分析、建模等一系列分析的過程,得出故障和氣象的強關聯(lián)性的分析結論,并在此基礎上通過多遠回歸算法對確立的氣象因數(shù)進行綜合的模型診斷和對比分析,最終確定線路故障分析預測模型以及相關的氣象因數(shù)變量。
線性回歸模型:故障總量=-55.4310+1.6587×平均氣溫(年)-2.9155×平均濕度(年)+5.4750×濕度≤40%的天數(shù)(年)-2.4079×濕度≥80%的天數(shù)(年)-62.5923×風速> 17M/S的天數(shù)(年)+30.6300×降雨量為[10,50)天數(shù)(年)-552.1602×降雨量為[50,100)天數(shù)(年)。
為了確認模型的質(zhì)量是否足夠準確,用已得到的自變量觀測數(shù)據(jù)帶入模型中,把得到的因變量預測數(shù)據(jù)與因變量觀測數(shù)據(jù)做畫圖對比,如圖1為故障總量多元線性回歸——最終模型的預測數(shù)據(jù)圖。
從圖1中可以看到,預測數(shù)據(jù)與觀測數(shù)據(jù)排列接近于一條45°的直線,可以判定預測是準確的。
6 結語
本文為了進一步對輸電線路故障的影響因素進行分析,用相關性系數(shù)描述輸電故障和氣象數(shù)據(jù)之間關系。通過分析得出了氣象數(shù)據(jù)中的溫度、濕度、風速、氣壓和故障之間的相關性強度。
通過對數(shù)據(jù)特征展開研究,以及對機器學習相關算法模型、關鍵算法組件的應用及驗證,為輸電線路故障分析提供有力的技術支撐。
參考文獻
[1] 張永強,劉琦,周經(jīng)倫.基于Bayes性能退化模型的可靠性評定[J].電子產(chǎn)品可靠性與環(huán)境試驗,2006(4):46-49.
[2] 孫志征,侯戈,吳全初.輸電線路運行中常見故障及檢修方法[J].低碳世界,2016(22):99-100.
[3] 柳雅騰.架空輸電線路中的常見故障以及預防檢修方法[J].山東工業(yè)技術,2016(15):156.
[4] 嚴鳳,許海梅.基于神經(jīng)網(wǎng)絡的配電線路綜合故障定位方法[J].電力系統(tǒng)及其自動化學報,2015(5):86-91.
[5] 葉浩明.高壓輸電線路故障類型與防范對策[J].企業(yè)技術開發(fā),2014(21):81-82.