張洋瑞,楊 鵬,申洪濤,馮 波,趙俊鵬,陶 鵬
(國網(wǎng)河北省電力公司電力科學(xué)研究院,石家莊 050021)
基于聚類算法的低壓臺區(qū)線損分析方法研究
張洋瑞,楊 鵬,申洪濤,馮 波,趙俊鵬,陶 鵬
(國網(wǎng)河北省電力公司電力科學(xué)研究院,石家莊 050021)
針對低壓臺區(qū)損耗在電網(wǎng)總損耗中所占比重比較大的現(xiàn)狀,提出一種基于聚類算法的低壓臺區(qū)線損分析方法。介紹線損分析流程,根據(jù)臺區(qū)日均線損率、線損率變異系數(shù)、三相不平衡、功率因數(shù)異常等4個維度特征值構(gòu)建線損分析模型,并通過實際算例驗證了該方法的可行性。
聚類算法;低壓臺區(qū);線損分析方法;線損分析模型
電網(wǎng)企業(yè)在電能輸送和營銷過程中,自發(fā)電廠出線起至客戶電能表止,所產(chǎn)生的電能損耗和損失稱為電力網(wǎng)電能損耗,簡稱線損。線損率是反映電網(wǎng)規(guī)劃設(shè)計、技術(shù)裝備水平和經(jīng)濟(jì)運行水平的重要指標(biāo)[1]。按照理論線損計算,各電壓等級電網(wǎng)中,380 V電網(wǎng)(即低壓臺區(qū))線損率最高,約為6%~10%;按照統(tǒng)計線損計算,低壓臺區(qū)損耗約占電網(wǎng)總損耗的20%[2]。因此,研究低壓臺區(qū)線損情況具有重要意義。
聚類分析是一種根據(jù)數(shù)據(jù)本身結(jié)構(gòu)特征對數(shù)據(jù)進(jìn)行分類的方法,通過聚類分析,可以把數(shù)據(jù)分成若干個類別,使得類別內(nèi)部的差異盡可能的小,類別間的差異盡可能的大。聚類分析按照研究對象的不同,一般分為樣本聚類和變量聚類;按照分析方法不同,一般分為分層聚類、快速聚類和兩步聚類[3]
層次聚類法又稱系統(tǒng)聚類,主要思想是對相近程度最高的兩類進(jìn)行合并組成一個新類,不斷重復(fù)這一過程直至歸為一類?;蛘卟捎孟喾吹倪^程,先把所有樣本歸為一類,再逐次分類,直至分為n類。
快速聚類法又稱K-均值聚類,主要思想是將數(shù)據(jù)視為K維空間上的點,以距離為標(biāo)準(zhǔn)進(jìn)行聚類分析,將樣本分為指定的K類。其中K-means最為常用,改進(jìn)型算法K-Medoids也有較為廣泛的應(yīng)用。
兩步聚類又稱兩階段聚類,主要思想是先以距離為依據(jù)形成相應(yīng)的聚類特征樹節(jié)點,構(gòu)建聚類特征樹,然后通過信息準(zhǔn)則確定最優(yōu)分組個數(shù)對各個節(jié)點進(jìn)行分組。
依托用電信息采集系統(tǒng),對海量數(shù)據(jù)進(jìn)行深入挖掘,以低壓臺區(qū)線損率與計量在線監(jiān)測異常事件為分析對象,提出了一種基于聚類算法的低壓臺區(qū)線損分析方法,該方法的分析流程如圖1所示。
圖1 低壓臺區(qū)線損分析方法流程
2.1 基礎(chǔ)數(shù)據(jù)抽取
低壓臺區(qū)線損分析的目的在于確定臺區(qū)配電系統(tǒng)結(jié)構(gòu)運行的合理性,找出配電系統(tǒng)運行、計量裝置運行以及線損管理等方面存在的薄弱環(huán)節(jié)。
為實現(xiàn)對臺區(qū)線損的深入分析,依托用電信息采集系統(tǒng),以一定范圍(市、縣供電公司)的低壓臺區(qū)為研究對象,抽取統(tǒng)計周期內(nèi)的臺區(qū)日線損率及計量在線監(jiān)測異常事件作為分析數(shù)據(jù),構(gòu)建原始數(shù)據(jù)矩陣。其中,臺區(qū)日線損率由用電信息采集系統(tǒng)每天采集的供、售電量自動計算得出,計量異常事件選取對線損影響顯著的三相不平衡和功率因數(shù)異常兩類。
2.2 數(shù)據(jù)甄別處理
臺區(qū)日線損率受基礎(chǔ)檔案正確率、采集成功率、采集數(shù)據(jù)完整率等影響較大,因此需要對原始數(shù)據(jù)進(jìn)行甄別處理,篩除明顯異常的線損數(shù)據(jù)??紤]到線損率的大小和波動情況能較好反映臺區(qū)線損水平,定義變量日均線損率和線損率變異系數(shù)。
其中,臺區(qū)日均線損率能夠反映線損率的平均水平;線損率變異系數(shù)能夠反映臺區(qū)線損率的離散情況,消除日均線損率差異較大的影響,其計算公式為:
2.3 特征值生成
三相不平衡及功率因數(shù)異常作為反映臺區(qū)統(tǒng)計周期內(nèi)是否發(fā)生計量異常事件的特征值,定義為離散變量,發(fā)生記為1,未發(fā)生記為0。
日均線損率雖然能反映臺區(qū)線損水平,但如果直接作為特征值使用K-means算法[4]進(jìn)行聚類分析,所得分組結(jié)果與當(dāng)前線損管理工作指標(biāo)不能完全吻合。將某市公司所轄臺區(qū)日均線損率作為特征值使用K-means算法進(jìn)行聚類分析,所得分組結(jié)果見表1和圖2。
表1 聚類分組結(jié)果
分組組內(nèi)數(shù)量中位數(shù)最小值最大值所占比例1 8729 2.46%0.00%4.69%35.83% 2 8698 6.90%4.70%9.59%35.71% 3 6016 12.12%9.60%16.99%24.70% 4 293 21.42%17.07%27.90%1.20% 5 173 34.03%28.19%41.77%0.71% 6 326 50.00%41.90%55.39%1.34% 7 49 61.77%56.14%66.32%0.20% 8 36 72.03%66.76%76.30%0.15% 9 16 82.63%79.02%86.41%0.07% 10 23 92.31%88.18%99.47%0.09%
圖2 聚類分組結(jié)果
從聚類結(jié)果可以看出,線損率分布呈階梯型,高于20%的臺區(qū)占總體比例較小。參考國家電網(wǎng)公司關(guān)于臺區(qū)月度同期線損的相關(guān)規(guī)定,將日均線損率定義為離散變量。線損率介于0~10%的臺區(qū)定義為“良”,線損率介于10%~20%的臺區(qū)定義為“中”,線損率大于20%的臺區(qū)定義為“差”。
將線損率變異系數(shù)定義為連續(xù)變量,與日均線損率、三相不平衡、功率因數(shù)異常以及臺區(qū)編號共同構(gòu)建特征值矩陣。
2.4 聚類分析
由于選取的特征值既有連續(xù)變量又有離散變量,且數(shù)據(jù)規(guī)模較大,故選取兩步聚類法作為聚類分析算法。同時,兩步聚類法利用統(tǒng)計量作為距離指標(biāo)進(jìn)行聚類,并根據(jù)一定的統(tǒng)計標(biāo)準(zhǔn)來“自動地”建議甚至于確定最佳的類別數(shù),結(jié)果的正確性更有保障。
聚類分析過程中選取施瓦茲貝葉斯準(zhǔn)則作為聚類準(zhǔn)則,并對連續(xù)變量進(jìn)行標(biāo)準(zhǔn)化處理,以達(dá)到更為精確的聚類分組結(jié)果。
從某供電公司分析區(qū)域抽取1個月的線損相關(guān)數(shù)據(jù)作為研究對象,經(jīng)過數(shù)據(jù)篩查和預(yù)處理后,得到反映線損管理水平的4個變量:日均線損率、線損率變異系數(shù)、三相不平衡和功率因數(shù)異常,以此作為聚類分析的特征值,如表2所示。
表2 聚類分析特征值
選取施瓦茲貝葉斯準(zhǔn)則作為判斷聚類效果的統(tǒng)計指標(biāo),進(jìn)行聚類分析,得到的聚類結(jié)果見表3。
表3 聚類分析結(jié)果
由表3聚類結(jié)果可以看出:
a.第1、2組日均線損率為良,變異系數(shù)均值較小,說明線損率正常但略有波動,線路運行水平和線損管理水平較好。但第2組有三相不平衡事件發(fā)生,說明臺區(qū)內(nèi)存在負(fù)荷分配不均的情況,線損管理水平可進(jìn)一步提升。
b.第3組日均線損率為良,變異系數(shù)極大,且有功率因數(shù)異常事件發(fā)生,說明統(tǒng)計周期內(nèi)線損率波動劇烈,說明可能存在計量裝置故障或配電設(shè)備老化等方面的問題。
c.第5、7組日均線損率為中,變異系數(shù)均值很小,說明線損率較高且波動很小,線路運行和線損管理水平一般。其中,第7組有三相不平衡發(fā)生,應(yīng)首先排查、處理臺區(qū)負(fù)荷分配不均問題。
d.第4、6組日均線損率為差,變異系數(shù)均值很小,說明線損率很高且波動很小,線路運行和線損管理水平較差。其中,第6組有三相不平衡發(fā)生,應(yīng)首先排查、處理臺區(qū)負(fù)荷分配不均問題。
在臺區(qū)線損分析中,一般對月度線損較為重視,僅對月度線損率較高的臺區(qū)重點分析研究;而影響臺區(qū)線損的管理、技術(shù)因素有很多,需要逐一排查。以上提出了一種基于聚類算法的臺區(qū)線損分析方法,通過對臺區(qū)日均線損率、線損率變異系數(shù)、三相不平衡、功率因數(shù)異常等4個維度特征值的聚類分群,不僅清晰的展示了線損的平均水平和波動情況,而且與三相不平衡和功率因數(shù)異常等技術(shù)線損因素密切聯(lián)系,對于臺區(qū)線損管理工作有一定的輔助決策作用。
[1] 趙全樂.線損管理手冊[M].北京:中國電力出版社,2007.
[2] 余衛(wèi)國,熊幼京,周新風(fēng),等.電力網(wǎng)技術(shù)線損分析及降損對策[J].電網(wǎng)技術(shù),2006,30(18):54-57.
[3] 陳勝可.spss統(tǒng)計分析從入門到精通[M].北京:清華大學(xué)出版社,2010.
[4] 張良均,陳俊德,劉名軍,等.數(shù)據(jù)挖掘:實用案例分析[M].北京:機(jī)械工業(yè)出版社,2013.
本文責(zé)任編輯:楊秀敏
Research of Low-voltage Distribution Network Loss Based on Cluster Analysis
Zhang Yangrui,Yang Peng,Shen Hongtao,Feng Bo,Zhao Junpeng,Tao Peng
(State Grid Hebei Electric Power Research Institute,Shijiazhuang 050021,China)
Aiming at low-voltage distribution network loss occupy larger proportion of total loss in the power grid,a low-voltage distribution network loss analysis method based on cluster analysis is proposed.Introduce process of loss analysis,according to the low-voltage distribution network average daily loss,coefficient of variation,three phase unbalance,power factor abnormal total of four-dimension characteristic value to construct the line loss analysis model,and the feasibility of the method is verified by practical example.
cluster analysis;low-voltage distribution network;line loss analysis method;line loss analysis model.
TM764.1
B
10019898(2017)02000803
20170109
張洋瑞(1985-),男,工程師,主要從事電力計量方面的工作。