摘" 要: 在智能電網(wǎng)時代,大部分用電異常行為都會伴隨用電負荷的變化,研究用戶用電行為對于電力系統(tǒng)的運行和管理都至關重要。為此,提出一種直接利用負荷數(shù)據(jù)進行計算,通過計算特征用電負荷曲線與日用電負荷曲線之間的相關度來判斷用戶是否存在異常用電行為的方法。在相關度計算過程中,將歐氏距離與皮爾遜相關系數(shù)相結合,以更準確地判斷用戶的用電負荷是否發(fā)生重大變化。此外,為提高判斷的準確性和靈活性,采用自適應閾值策略對500組數(shù)據(jù)進行實驗研究。相關度計算的結果表明,其中122組被判斷為負荷變化過大,99組數(shù)據(jù)存在負荷異常事件,該方法的判斷準確率達到了81.1%。
關鍵詞: 異常用電行為; 負荷檢測; 日用電負荷曲線; 特征負荷曲線; 相關度; 皮爾遜相關系數(shù); 歐氏距離; 閾值判斷
中圖分類號: TN915.12?34" " " " " " " " " " " " " 文獻標識碼: A" " " " " " " " " " "文章編號: 1004?373X(2024)10?0001?05
Abnormal detection and identification of changes in user electricity load
Abstract: In the era of smart grids, most abnormal electricity consumption behaviors will be accompanied by the changes in electricity load. The research on user electricity consumption behavior is crucial for the operation and management of the power system. On this basis, a method of directly using load data for calculation is proposed to determine whether users have abnormal electricity consumption behavior, which can be realized by the correlation between the characteristic electricity consumption load curve and the daily electricity consumption load curve. In the process of correlation calculation, the Euclidean distance is combined with the Pearson correlation coefficient to more accurately determine whether the user's electricity load has undergone significant changes. An adaptive threshold strategy is adopted for the experimental research on 500 sets of data to improve the accuracy and flexibility of judgment. The correlation calculation results show that 122 groups’ data have excessive load changes, and 99 groups’ data have abnormal load events. The accuracy of this method can reach 81.1%.
Keywords: abnormal electricity consumption behavior; load detection; daily electricity load curve; characteristic load curve; correlation; Pearson correlation coefficient; Euclidean distance; threshold judgment
0" 引" 言
21世紀以來,隨著智能電網(wǎng)的迅猛發(fā)展,電力系統(tǒng)成為了人們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧V悄茈娋W(wǎng)不僅直接關聯(lián)著人們的用電需求,還對經(jīng)濟發(fā)展和國家安全具有重要影響。在智能電網(wǎng)中,大量涉及用戶用電數(shù)據(jù)的信息可以通過數(shù)據(jù)分析方法得以挖掘,這對于理解用戶用電行為規(guī)律、用電負荷預測和防竊電檢測等具有重要意義[1]。
研究用戶用電行為規(guī)律對于電力系統(tǒng)運行和管理至關重要。通過深入分析用戶用電數(shù)據(jù),可以揭示出不同時間段的用電負荷特征、高負荷時段以及用電行為的異常變化等信息。這些分析結果為電力系統(tǒng)規(guī)劃、電力調(diào)度和資源優(yōu)化提供了寶貴的參考,有助于優(yōu)化電力供應和提高電網(wǎng)運行的效率和穩(wěn)定性[2]。此外,利用用戶用電數(shù)據(jù)進行負荷預測可以幫助電力系統(tǒng)工作人員做出準確的負荷調(diào)度安排,提前預測和應對高負荷時段的能源需求。這對于實現(xiàn)電力系統(tǒng)的高效運行、優(yōu)化能源資源利用以及提升供電質(zhì)量都具有重要意義[3]。因此,對用戶用電行為規(guī)律的研究以及利用數(shù)據(jù)分析方法來挖掘和分析用戶用電數(shù)據(jù),在智能電網(wǎng)中具有重要的研究意義和實際應用價值。這將為電力系統(tǒng)的可持續(xù)發(fā)展和高效運行提供有力支持,同時也有助于推動能源領域的創(chuàng)新和進步[4]。
目前對用戶異常用電行為檢測主要采用機器學習的方法。其中,聚類方法[5?8]和深度學習方法[9?10]運用最為廣泛。但是這些利用機器學習的檢測方法一般都需要大量的人工標記數(shù)據(jù),且離散型數(shù)據(jù)需要進行類型轉(zhuǎn)換,因而容易導致重要信息的丟失。本文提出一種直接利用負荷數(shù)據(jù)進行計算,從而判斷用戶是否存在異常用電行為的方法。
1" 異常用電行為
目前電力部門所記錄的異常事件為26類,并將導致異常的原因分為6類,其中與用電負荷變化有關的異常事件有10類,導致發(fā)生負荷變化的異常原因[11]有5類。某省某縣一年所有異常事件的統(tǒng)計結果如表1所示。
負荷類異常分為用電負荷異常和用電量異常兩種類型。在實際情況中,當用電負荷增加時,即單位時間內(nèi)消耗電能的能力或需求增加,將導致用電量增加;同樣,當用電負荷減少時,即單位時間內(nèi)消耗電能的能力或需求減少,將導致用電量減少。由表1可見,低壓非居民和低壓居民類型的用戶負荷異常事件占比超過95%。因此,研究低壓用戶的用電負荷是否發(fā)生重大變化具有非常重要的意義。該研究有助于更好地了解和識別用戶用電負荷的異常情況,從而提供有效的異常檢測和監(jiān)測手段,確保電力系統(tǒng)的穩(wěn)定運行和資源的合理利用。
2" 研究方法
本文提出了一種組合模型,旨在通過計算特征用電負荷曲線與日用電負荷曲線之間的相關度來判斷用戶用電負荷是否發(fā)生重大變化。該模型綜合運用了皮爾遜相關系數(shù)和歐氏距離兩種方法,以便更全面地評估用戶用電負荷的變化情況。
首先,使用皮爾遜相關系數(shù)計算特征用電負荷曲線與日用電負荷曲線之間的線性相關程度。皮爾遜相關系數(shù)是一種常用的統(tǒng)計指標,用于衡量兩個變量之間的線性關系程度。通過計算這一系數(shù)可以獲取兩條曲線之間的相關性程度。
然而,當2天的負荷變化曲線相似性較高,但總量變化較大時,僅通過皮爾遜相關系數(shù)可能無法準確地反映出這種變化。為了解決這個問題,本文引入了歐氏距離,通過計算特征用電負荷曲線與日用電負荷曲線之間的歐氏距離,綜合考慮線性關系和總量變化,衡量兩者的整體差異。將皮爾遜相關系數(shù)和歐氏距離相結合,得到的相關度指標更全面。再通過自適應閾值的確定方法獲得相關度大小的判斷閾值,從而識別用戶是否發(fā)生了重大用電負荷變化。該組合模型算法思路如圖1所示。
2.1" 歐氏距離
歐氏距離[12]是一種常用的度量方法,用于計算兩個向量或數(shù)據(jù)點之間的距離。它是基于向量空間的概念,通過計算兩個向量中對應元素差值的平方和的平方根來衡量它們之間的距離。歐氏距離的計算方法簡單直觀,可以用于度量數(shù)值型特征或數(shù)據(jù)之間的差異性或相似性。其計算結果是一個非負實數(shù),數(shù)值越小表示兩個向量越相似,數(shù)值越大表示兩個向量越不相似。歐氏距離在數(shù)據(jù)挖掘、模式識別、聚類分析等領域中得到廣泛應用,可以幫助大家比較和理解不同數(shù)據(jù)點之間的距離關系,從而進行數(shù)據(jù)分析和決策。對于兩個向量[x]和[y],它們的歐氏距離可以通過公式(1)計算得到。
式中:[x1,x2,…,xn]和[y1,y2,…,yn]是向量中對應的元素。
2.2" 皮爾遜相關系數(shù)
皮爾遜相關系數(shù)[13]是一種用于衡量兩組數(shù)據(jù)之間線性相關程度的統(tǒng)計量,衡量的是兩組數(shù)據(jù)之間的線性關系的強度和方向,取值范圍在-1~1之間。皮爾遜相關系數(shù)通過計算兩組數(shù)據(jù)之間的協(xié)方差和它們各自標準差的乘積來計算,體現(xiàn)的是兩個變量的變化趨勢是否一致,以及變化的幅度是否相似。皮爾遜相關系數(shù)計算公式如下:
為了減少皮爾遜相關系數(shù)的誤差,采用滑動窗口取值法對兩組數(shù)據(jù)計算的皮爾遜相關系數(shù)取均值,計算公式如下:
式中:[s]為每組數(shù)據(jù)個數(shù);[n]為窗口大小。
2.3" 相關度組合模型
結合式(1)和式(3)建立相關度計算的組合模型。將用滑動窗口取值法計算得到的皮爾遜相關系數(shù)與歐氏距離相除,最后對結果進行處理,得到相關度[c]的計算模型,計算公式為:
由于皮爾遜相關系數(shù)的取值范圍為[-1,1],為了確保得到的相關度為正值,因此將[ρ]的取值范圍通過[ρ+1]的操作平移至[0,2]。為了放大皮爾遜相關系數(shù)的影響,將其乘以放大系數(shù)k,從而保證其在最終的相關度[c]中具有足夠的權重,以便在后續(xù)的分析和比較中更為直觀。
2.4" 自適應閾值計算方法
為了準確評估不同用戶的相關性,需要設定一種適用于各個用戶的自適應閾值。自適應閾值的計算包括以下3個步驟。
1) 通過分析用戶歷史日用電負荷曲線與特征用電負荷曲線的皮爾遜相關系數(shù)得到,當涵蓋超過300個數(shù)據(jù)點,確定大約90%以上的相關系數(shù)小于某一特定值[ρx]時,將[ρx]作為皮爾遜相關系數(shù)的閾值系數(shù)。
2) 基于電力部門專家經(jīng)驗,當用戶的日用電負荷總和與特征用電負荷總和之間的差距超過特征用電負荷總和的[15]時,將此視為潛在的負荷變化異常情況。
3) 將皮爾遜相關系數(shù)的閾值[ρx]與負荷差值的[15]相除,同樣為了放大皮爾遜相關系數(shù)的作用,乘以一個放大因子[k](同式(4)),得到最終的自適應閾值。具體的計算公式如下:
式中:[cx]為自適應閾值;[sa]為特征用電總負荷;[sx]為日用電總負荷。
3" 算例分析
3.1" 數(shù)據(jù)預處理
本文針對某省某低壓工廠一年期間的瞬時有功功率數(shù)據(jù)缺失問題進行研究,數(shù)據(jù)包括每天96個時刻的數(shù)據(jù)點。為了填補缺失的瞬時有功功率值,本文采用均值法進行補齊,并引入了月均值法來填充特定時刻的缺失數(shù)據(jù)。此外,由于在瞬時有功功率數(shù)據(jù)分析中,完整性是非常關鍵的,缺失太多的數(shù)據(jù)點可能會導致那一天的數(shù)據(jù)失去代表性,而當缺失點超過3個時刻,這種失真可能會對整體分析產(chǎn)生不良影響。因此當某一天的用電負荷數(shù)據(jù)中缺失超過3個時刻點時,將該天的數(shù)據(jù)從數(shù)據(jù)集中移除。
3.2" 負荷曲線提取
用電日負荷曲線是根據(jù)處理后的數(shù)據(jù)按每日96個時刻繪制的曲線,用來表示該用戶在不同時刻的瞬時有功功率。該曲線展示了用戶在一天內(nèi)不同時間點的能量需求情況。通過觀察用電日負荷曲線,可以獲得用戶用電行為的一些關鍵信息,例如高負荷時段、低負荷時段以及負荷的峰值和谷值。這些信息對于電力系統(tǒng)規(guī)劃、能源管理和負荷優(yōu)化等方面具有重要的參考價值。通過繪制用電日負荷曲線,能夠直觀地了解用戶在不同時間點的用電需求,從而更好地進行用電行為分析。
從每日用電負荷曲線中提取出特征用電負荷曲線,提取的方法為將日用電負荷曲線前面正常的10日對應時刻負荷取平均值,構成特征用電負荷曲線[14]。圖2和圖3分別為該工廠5月24日和5月25日的特征用電負荷曲線與該日的日用電負荷曲線。
由圖2可知,5月24日的特征用電負荷曲線與日負荷曲線的趨勢相似,且在每個時間段內(nèi)功率差異較小,反映了該日期的正常用電情況。由圖3可知,5月25日的特征用電負荷曲線與日負荷曲線存在明顯的差異。經(jīng)證實該日發(fā)生了工廠竊電事件,導致用電負荷出現(xiàn)了明顯的下降趨勢。
3.3" 相關度計算
按上述方法,將每天的日用電負荷曲線與對應的特征用電負荷曲線利用式(1)~式(4)進行相關度計算。式(3)中的[n]取值為10,式(4)中的系數(shù)[k]取值為50。部分計算結果如表2所示。
由表2可得,5月17日—24日平均相關度為0.889,與5月25日和5月26日差異較大。這是由于該廠在5月25日和5月26日發(fā)生了竊電事件,導致這兩日的用電負荷曲線與特征用電負荷曲線的相關度遠遠小于之前正常時期的相關度。
3.4" 閾值確定及判定結果
根據(jù)上述相關度計算流程,將包括正常用電用戶、設備故障、疑似竊電等可能導致負荷發(fā)生不正常變化的用戶共計1 000組日用電負荷曲線與特征用電負荷曲線作為訓練組,對其進行了相關度計算。通過分析這些數(shù)據(jù),并結合第2.4節(jié)的自適應閾值計算方法,確定判斷閾值。首先取這1 000組數(shù)據(jù)中231組異常事件取正后的皮爾遜相關系數(shù),超過90%的負荷異常事件皮爾遜相關系數(shù)小于0.2,因此皮爾遜相關系數(shù)取0.2;然后,將皮爾遜相關系數(shù)取0.2與負荷差值的[15]相除,并對結果取相同的放大系數(shù)[k],即[k]=50,代入式(5),得到最后的閾值。
通過這個計算方法確定自適應變化的閾值,對上述1 000組訓練組數(shù)據(jù)用戶是否發(fā)生負荷變化過大的情況進行判斷,其中256組被判斷為負荷變化過大情況,實際情況下在這256組中有231組存在負荷異常事件,判斷準確率達到90.2%。取500組測試組數(shù)據(jù)進行測試,122組被判斷為負荷變化過大,其中99組為存在負荷異常事件,判斷準確率達到81.1%;但有兩組存在負荷異常事件未被判斷為負荷變化過大,召回率為98%。判定結果如表3所示。
4" 結" 語
本文提出了一種用于判斷用戶每日用電負荷是否存在變化過大的方法。通過對用戶的日用電負荷曲線與特征用電負荷曲線的相關度計算,能夠獲得一個量化指標,用于判斷負荷變化的程度。通過引入自適應閾值的判斷機制,能夠根據(jù)具體情況動態(tài)調(diào)整閾值,提高判斷的準確性和靈活性。
本文利用實際數(shù)據(jù)對所提方法進行了實驗驗證,判斷準確率可以達到80%以上??梢姂迷摲椒軌蚣皶r發(fā)現(xiàn)負荷變化異常的用戶,為后續(xù)的異常事件研究提供有力支持。同時,該方法具有一定的實用性和可操作性,在智能電網(wǎng)時代,準確判斷用戶用電負荷是否發(fā)生重大變化對于能源管理、竊電檢測以及設備故障預警等方面都具有重要意義。
然而,本文所提方法仍存在一定的局限性和待改進之處。例如,自適應閾值確定中仍存在一定的主觀性,需要進一步探索更客觀和可靠的確定方法。此外,本文僅針對特定領域的數(shù)據(jù)進行了分析,未考慮其他因素的影響,因此在應用到其他領域時需要進一步的驗證和調(diào)整。
參考文獻
[1] 穆晨宇,薛文斌,穆羨瑛,等.基于VMD?LSTM?Attention模型的短期負荷預測研究[J].現(xiàn)代電子技術,2023,46(17):174?178.
[2] 萬偉,劉紅旗,杜單單,等.考慮負荷季節(jié)特性的電力用戶用電行為畫像[J].哈爾濱理工大學學報,2023,28(3):45?55.
[3] 李坤奇,孟潤泉,李鳳蓮.融合聚類?卷積?門循環(huán)的居民用電短期負荷預測方法[J].太原理工大學學報,2023,54(1):203?210.
[4] 何宗澤.基于數(shù)據(jù)挖掘的用戶用電行為分析研究[D].長春:吉林大學,2022.
[5] 王瑩,項雯,張群,等.泛在電力物聯(lián)網(wǎng)下基于DPSO?Kmeans的客戶用電行為分析[J].哈爾濱理工大學學報,2022,27(2):106?113.
[6] 武靈耀,郭賀宏,趙慶生,等.基于MACD指標與聚類算法的電力用戶用電行為分析[J].上海電力大學學報,2023,39(2):105?111.
[7] 鄭思達,梁琪琳,彭鑫霞,等.基于模糊聚類的異常用電行為識別研究[J].電測與儀表,2020,57(19):40?44.
[8] 毛源軍,陳超強,舒一飛,等.基于居民用戶用電行為分析的室內(nèi)大麻種植檢測[J].電力科學與技術學報,2022,37(4):198?208.
[9] 鄒念,張穎,蘇盛,等.基于小時尺度周期特征LSTM?Transformer的用戶竊電識別方法[J/OL].電網(wǎng)技術:1?11[2023?01?06].https://doi.org/ 10.13335/j.1000?3673.pst.2022.1531.
[10] 夏睿,高云鵬,朱彥卿,等.基于SE?CNN模型的竊電檢測方法研究[J].電力系統(tǒng)保護與控制,2022,50(20):117?126.
[11] 楊培.用電信息采集系統(tǒng)中計量異常事件分析方法與應用研究[D].杭州:中國計量大學,2019.
[12] 孫林,張一曼,張辰珂,等.基于改進粒子群和K?means聚類的優(yōu)化算法[J].江蘇科技大學學報(自然科學版),2023,37(3):81?90.
[13] 趙源上,林偉芳.基于皮爾遜相關系數(shù)融合密度峰值和熵權法的典型新能 源出力場景研究[J/OL].中國電力:1?10[2023?02?27].http://kns. cnki.net/kcms/detail/11.3265.TM.20230227.0856.006.html.
[14] 于小青.基于Storm流數(shù)據(jù)聚類算法的用電異常行為在線監(jiān)測研究[D].北京:華北電力大學(北京),2021.