鄭應(yīng)俊,楊藝寧,舒一飛,薛陽(yáng),劉愛(ài)國(guó),蘇盛
(1.長(zhǎng)沙理工大學(xué)電氣與信息工程學(xué)院,湖南省長(zhǎng)沙市 410004;2.中國(guó)電力科學(xué)研究院有限公司,北京市 100192;3.國(guó)網(wǎng)寧夏電力有限公司營(yíng)銷服務(wù)中心(計(jì)量中心),寧夏回族自治區(qū)銀川市 750001)
低壓用戶竊電是長(zhǎng)期存在的痼疾,除直接導(dǎo)致供電企業(yè)利潤(rùn)流失外,竊電用戶私拉亂接還是造成觸電等人身傷亡事故的重要誘因[1-3]。因?yàn)閿?shù)量龐大且用電行為模式多元,低壓用戶的竊電檢測(cè)一直沒(méi)有得到很好的突破[4]。
智能電表的普及應(yīng)用為開(kāi)展數(shù)據(jù)驅(qū)動(dòng)的竊電檢測(cè)奠定了堅(jiān)實(shí)基礎(chǔ)。文獻(xiàn)[5]結(jié)合最大信息系數(shù)與密度峰值快速聚類算法來(lái)檢測(cè)竊電。文獻(xiàn)[6-7]基于每個(gè)用戶前后多日負(fù)荷標(biāo)準(zhǔn)差的波動(dòng)性指標(biāo)、負(fù)荷序列升降的趨勢(shì)性指標(biāo)以及用戶多日的負(fù)荷均值差值和變化斜率的變動(dòng)性指標(biāo),采用改進(jìn)后的離群因子算法來(lái)檢測(cè)異常用戶。針對(duì)特征提取影響異常檢測(cè)準(zhǔn)確率的問(wèn)題,還可采用堆疊去相關(guān)自編碼器提取高度凝練的獨(dú)立特征,再利用支持向量機(jī)判斷用戶異常[8]。供電企業(yè)稽查人員有限,誤報(bào)率是評(píng)價(jià)竊電檢測(cè)算法實(shí)用性的核心指標(biāo)[9]。工程應(yīng)用中為避免誤報(bào),往往面向高損臺(tái)區(qū)進(jìn)行用電檢查,以提高稽查靶向性。文獻(xiàn)[10]利用多數(shù)竊電手段下異常用戶竊電量與計(jì)量電量相關(guān)的特點(diǎn),采用Granger因果分析檢測(cè)造成線損異常波動(dòng)的用戶。此外,利用臺(tái)區(qū)高損與用戶計(jì)量異常具有關(guān)聯(lián)性的特點(diǎn),也可以通過(guò)其他信息的關(guān)聯(lián)分析來(lái)實(shí)現(xiàn)低誤報(bào)率的竊電檢測(cè)[11]。
需要指出的是,臺(tái)區(qū)低壓用戶通信異常多發(fā),通信失敗后常延遲幾天后一次報(bào)送多日電量。根據(jù)主站數(shù)據(jù)統(tǒng)計(jì)臺(tái)區(qū)線損電量時(shí),用戶數(shù)據(jù)報(bào)送失敗當(dāng)日會(huì)造成臺(tái)區(qū)異常高損,而補(bǔ)報(bào)電量時(shí)又會(huì)造成臺(tái)區(qū)低損甚至負(fù)損?,F(xiàn)有竊電檢測(cè)方法以數(shù)據(jù)完整準(zhǔn)確為前提,采用失真數(shù)據(jù)進(jìn)行竊電檢測(cè)易導(dǎo)致錯(cuò)誤結(jié)果,阻礙低壓用戶竊電檢測(cè)工作的開(kāi)展。
針對(duì)因臺(tái)區(qū)數(shù)據(jù)缺失而無(wú)法進(jìn)行準(zhǔn)確竊電檢測(cè)的問(wèn)題,提出一種基于邊緣計(jì)算的低壓用戶竊電檢測(cè)方法。首先,比較分析了缺失數(shù)據(jù)的補(bǔ)全方法;然后,在通信正常和異常的條件下,分析臺(tái)區(qū)竊電用戶用電量與線損電量的關(guān)聯(lián)關(guān)系,并利用臺(tái)區(qū)智能終端(intelligent terminal of distribution substation,ITDS)可完整準(zhǔn)確地就地采集用戶數(shù)據(jù)的特點(diǎn),提出基于邊緣計(jì)算的低壓用戶竊電檢測(cè)框架;最后,基于實(shí)際含竊電用戶臺(tái)區(qū)數(shù)據(jù),驗(yàn)證了所提方法相比于在主站側(cè)采用異常數(shù)據(jù)以及采用不同缺失數(shù)據(jù)填補(bǔ)算法修復(fù)后的數(shù)據(jù)進(jìn)行竊電檢測(cè)時(shí)的優(yōu)勢(shì)。
由于量測(cè)數(shù)據(jù)在測(cè)量與采集、傳輸與轉(zhuǎn)換等各個(gè)環(huán)節(jié)均有可能受到干擾甚至發(fā)生故障,因此數(shù)據(jù)缺失錯(cuò)漏是電力系統(tǒng)長(zhǎng)期存在的問(wèn)題。傳統(tǒng)上,對(duì)于電網(wǎng)冗余配置量測(cè)的狀態(tài)量,可以在實(shí)現(xiàn)狀態(tài)估計(jì)可觀性的條件下采用偽量測(cè)的方式代替少數(shù)缺失數(shù)據(jù)。智能配用電系統(tǒng)中,用戶用電數(shù)據(jù)同樣存在數(shù)據(jù)缺失錯(cuò)漏的情況。此類數(shù)據(jù)難以用狀態(tài)估計(jì)填補(bǔ)[12],傳統(tǒng)方法主要采用均值填補(bǔ)、最近距離填補(bǔ)、多重插補(bǔ)、回歸模型和基于最大期望算法等補(bǔ)全模型[13],這些處理方法多基于數(shù)理統(tǒng)計(jì)和機(jī)理分析構(gòu)造數(shù)學(xué)模型,對(duì)用戶側(cè)缺失數(shù)據(jù)的重建效果并不理想,忽視了電力系統(tǒng)中量測(cè)的相關(guān)性和時(shí)序特性[14-15],影響了基于重建數(shù)據(jù)進(jìn)行決策分析的合理性。
由于缺失數(shù)據(jù)填補(bǔ)在很多科學(xué)和工程領(lǐng)域都有廣泛的應(yīng)用,近年來(lái)科研人員圍繞該問(wèn)題開(kāi)展了大量研究并取得了較大進(jìn)展[16-17]。在Netflix 推薦系統(tǒng)運(yùn)用的矩陣填充方法建立在數(shù)據(jù)矩陣具有低秩性和稀疏性的前提下,可以在原始數(shù)據(jù)部分丟失的異常情況下,準(zhǔn)確重構(gòu)原始矩陣。低秩矩陣補(bǔ)全理論是基于數(shù)據(jù)本身的低秩性恢復(fù)缺失數(shù)據(jù),它將矩陣秩最小化作為目標(biāo)函數(shù),經(jīng)典的數(shù)據(jù)恢復(fù)數(shù)學(xué)模型為:
式中:‖ · ‖*表示矩陣核范數(shù);K為恢復(fù)后的低秩矩陣;M為只觀測(cè)到部分元素的待修復(fù)矩陣;Ω為M中非空元素位置集合,若矩陣M的元素Mi,j被觀測(cè)到,則有(i,j)∈Ω;PΩ(·)為算子。由于實(shí)際系統(tǒng)一般存在高斯噪聲和尖峰等形式噪聲,考慮含噪聲的實(shí)際數(shù)據(jù)的數(shù)據(jù)恢復(fù)模型如式(3)所示。
式中:E為尖峰異常值矩陣;G為高斯噪聲矩陣;ρ和δ為相應(yīng)的權(quán)重系數(shù);‖ ·‖F(xiàn)表示F范數(shù);N為輔助矩陣。求出式(3)中的增廣拉格朗日函數(shù)并將其轉(zhuǎn)化為無(wú)約束優(yōu)化問(wèn)題后,可根據(jù)文獻(xiàn)[18]采用交替方向乘子法(alternating direction method of multipliers,ADMM)求解,不再贅述。
建立在矩陣填補(bǔ)基礎(chǔ)上的張量填補(bǔ),實(shí)際上是一種高維矩陣填補(bǔ)。由于多個(gè)用戶在不同日的用電數(shù)據(jù)可能具有潛在的多維內(nèi)在相關(guān)性,采用張量填補(bǔ)可利用更寬維度上的信息提高缺失數(shù)據(jù)填補(bǔ)效果,并已在低壓臺(tái)區(qū)缺失數(shù)據(jù)上得到成功應(yīng)用[19]。張量填補(bǔ)的基本原理與矩陣填補(bǔ)類似,詳見(jiàn)文獻(xiàn)[19]。
與矩陣填補(bǔ)和張量填補(bǔ)利用數(shù)據(jù)本身的低秩性恢復(fù)缺失數(shù)據(jù)不同,生成對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)方法采用數(shù)據(jù)驅(qū)動(dòng)的方式,通過(guò)GAN 的對(duì)抗博弈對(duì)大量無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行特征提取訓(xùn)練,獲得能夠準(zhǔn)確識(shí)別數(shù)據(jù)真假性的判別模型和捕獲數(shù)據(jù)潛在特征與時(shí)空分布特性的生成模型。然后,采用雙重語(yǔ)義感知約束重新訓(xùn)練模型,找到與含缺失值的待重構(gòu)數(shù)據(jù)擁有最大相似性的備選數(shù)據(jù),即可將其對(duì)應(yīng)位置數(shù)據(jù)填補(bǔ)缺失部分?jǐn)?shù)據(jù)[20]。需要指出的是,GAN 方法需要從大量數(shù)據(jù)樣本中抽取數(shù)據(jù)的分布特性才能保證填補(bǔ)效果,對(duì)于單個(gè)臺(tái)區(qū)用戶缺失計(jì)量數(shù)據(jù)填補(bǔ)的適用性不強(qiáng),本文采用矩陣填補(bǔ)和張量填補(bǔ)進(jìn)行失真數(shù)據(jù)的填補(bǔ)。
配電臺(tái)區(qū)非技術(shù)線損主要由竊電所致,非零電量竊電用戶的竊電量與電表計(jì)量電量大多呈正相關(guān),這會(huì)使得線損電量與竊電用戶計(jì)量電量之間存在潛在的因果關(guān)聯(lián)。因此,可用歸因分析識(shí)別臺(tái)區(qū)線損與接入用戶計(jì)量電量的相關(guān)性,以識(shí)別嫌疑用戶,提高竊電稽查的靶向性。
采用某實(shí)際高損臺(tái)區(qū)數(shù)據(jù)分析用戶電量與線損電量間的關(guān)聯(lián)性。該高損臺(tái)區(qū)62 天的實(shí)際線損電量如圖1 所示,臺(tái)區(qū)日均供電量約為1 200 kW·h,接入6 個(gè)工商業(yè)用戶和33 個(gè)低壓居民用戶。2020 年1 月至2 月間,日均線損電量約為100 kW·h,線損率達(dá)到9.6%,不屬于正常范圍,可認(rèn)定存在異常用電行為。因接入的工商業(yè)用戶竊電影響和用電量顯著高于居民用戶,采集2019 年12 月30 日至2020 年2月29 日間日線損電量G及工商業(yè)用戶1 至6 的日電量H1至H6進(jìn)行分析。
圖1 高損臺(tái)區(qū)接入用戶用電量及線損電量Fig.1 Electricity consumption of users and line loss power in high-loss distribution area
由圖1 可見(jiàn),整體上高損臺(tái)區(qū)線損電量曲線與接入用戶電量的趨勢(shì)相似,均呈先升后降的形態(tài)。如果能找出用電量與線損電量因果關(guān)聯(lián)性最高的用戶,那么就可將其識(shí)別為竊電嫌疑最大的用戶。
ITDS 一般安裝于配電房二次側(cè)[21],在臺(tái)區(qū)內(nèi)采用RS485 或載波通信,系統(tǒng)主站采用無(wú)線專網(wǎng)或光纖通信,將采集的配變自身和臺(tái)區(qū)低壓用戶計(jì)量數(shù)據(jù)向主站報(bào)送[22-23]。臺(tái)區(qū)通信架構(gòu)如圖2 所示。
圖2 配電臺(tái)區(qū)通信架構(gòu)Fig.2 Communication architecture of distribution area
實(shí)際系統(tǒng)中,用戶通信失敗延后1 至2 天上報(bào)數(shù)據(jù)的情況多發(fā)。為呈現(xiàn)通信異常對(duì)主站數(shù)據(jù)的影響,隨機(jī)選取1.1 節(jié)高損臺(tái)區(qū)的任一工商業(yè)用戶(如用戶1)在某一天(如2020 年1 月29 日)報(bào)送電量異常并在次日補(bǔ)報(bào),實(shí)驗(yàn)結(jié)果如圖3 所示。在通信異常日,線損電量和線損率會(huì)因?yàn)樯賵?bào)電量而突增,而在次日又會(huì)因?yàn)橐淮螆?bào)送異常用戶2 天的電量而驟降甚至出現(xiàn)負(fù)線損。通信異常使得主站側(cè)線損電量發(fā)生畸變失真。采用主站側(cè)失真數(shù)據(jù)進(jìn)行竊電檢測(cè),可能打破竊電用戶計(jì)量電量與線損電量之間的因果聯(lián)系,使竊電檢測(cè)產(chǎn)生錯(cuò)誤的結(jié)果,難以準(zhǔn)確識(shí)別竊電用戶。
圖3 通信異常時(shí)用戶用電量及線損電量Fig.3 Electricity consumption and line loss power with communication anomaly
經(jīng)濟(jì)學(xué)中常用協(xié)整檢驗(yàn)與Granger 檢驗(yàn)來(lái)分析時(shí)間序列間的相關(guān)性。一般先采用協(xié)整檢驗(yàn)檢測(cè)序列間是否存在長(zhǎng)期的均衡關(guān)系,然后采用Granger檢驗(yàn)判斷一個(gè)變量能否對(duì)另一變量產(chǎn)生影響[24-26]??紤]到多數(shù)竊電方式下異常用戶竊電量與計(jì)量電量呈正相關(guān),異常用戶竊電引起的臺(tái)區(qū)損耗波動(dòng)與經(jīng)濟(jì)變量類的時(shí)間序列在受到其他因素干擾時(shí)的變化具有相似性。因此,可利用臺(tái)區(qū)線損電量與用戶電量?jī)烧唛g的均衡關(guān)系及因果聯(lián)系,檢測(cè)引起臺(tái)區(qū)線損異常的用戶。
傳統(tǒng)上,受現(xiàn)場(chǎng)終端計(jì)算資源約束,只能將業(yè)務(wù)功能集中部署于中心主站等核心節(jié)點(diǎn),系統(tǒng)性能取決于通信網(wǎng)絡(luò)和主站的性能水平[27]。近年來(lái),物聯(lián)網(wǎng)終端的爆炸性增長(zhǎng)和應(yīng)用多元化帶來(lái)了海量數(shù)據(jù),在傳輸帶寬和時(shí)效性上對(duì)中心化的數(shù)據(jù)處理方式提出了嚴(yán)峻挑戰(zhàn)。計(jì)算機(jī)技術(shù)的發(fā)展使得邊緣側(cè)終端具備較強(qiáng)的計(jì)算處理能力,在靠近物聯(lián)網(wǎng)終端以邊緣計(jì)算的方式就近提供服務(wù),可減少數(shù)據(jù)傳輸量,降低服務(wù)響應(yīng)時(shí)延,增強(qiáng)網(wǎng)絡(luò)效能[28-29]。
ITDS 是邊緣計(jì)算技術(shù)在配用電系統(tǒng)應(yīng)用的典范。它作為服務(wù)臺(tái)區(qū)的綜合平臺(tái),可以在邊緣側(cè)基于臺(tái)區(qū)基礎(chǔ)數(shù)據(jù)提供線損分析、電能質(zhì)量監(jiān)控、拓?fù)浞治龊蛻糇冴P(guān)系分析等業(yè)務(wù)。因?yàn)椴煌瑯I(yè)務(wù)功能模塊可能由各廠家按存在差異的系統(tǒng)環(huán)境設(shè)計(jì)實(shí)現(xiàn),需要采用容器技術(shù)支撐軟、硬件解耦,從而在同一平臺(tái)上實(shí)現(xiàn)不同廠家的業(yè)務(wù)系統(tǒng)功能[30]?;谌萜骷夹g(shù)的ITDS 包含系統(tǒng)層和應(yīng)用程序(APP)層。APP 層分為采集APP 和業(yè)務(wù)APP,相互間可通過(guò)消息總線交互。采集APP 可采集臺(tái)賬數(shù)據(jù)、實(shí)時(shí)運(yùn)行數(shù)據(jù)和負(fù)荷數(shù)據(jù);業(yè)務(wù)APP 通過(guò)設(shè)備總線訪問(wèn)數(shù)據(jù)中心,提取所需數(shù)據(jù)進(jìn)行計(jì)算分析,實(shí)現(xiàn)業(yè)務(wù)功能的邊緣計(jì)算[31]。
結(jié)合2.1 節(jié)的低壓竊電用戶與臺(tái)區(qū)線損關(guān)聯(lián)分析與2.2 節(jié)的配用電物聯(lián)網(wǎng)邊緣計(jì)算架構(gòu),提出基于邊緣計(jì)算的低壓用戶竊電檢測(cè)方法。該方法的核心是利用ITDS 的集中器APP 就地獲得臺(tái)區(qū)用戶計(jì)量數(shù)據(jù),然后線損APP 根據(jù)臺(tái)區(qū)供電量和用戶電量分析線損電量,最后在竊電檢測(cè)APP 中對(duì)臺(tái)區(qū)線損和用戶電量采用Granger 歸因分析或其他算法來(lái)識(shí)別竊電用戶,并將檢測(cè)結(jié)果上傳至云端,實(shí)現(xiàn)流程如圖4 所示。本文所提方法將竊電檢測(cè)從主站系統(tǒng)遷移至邊緣側(cè)進(jìn)行,能夠釜底抽薪地規(guī)避通信異常引起的數(shù)據(jù)失真問(wèn)題,從而充分發(fā)揮竊電檢測(cè)算法準(zhǔn)確識(shí)別低壓臺(tái)區(qū)異常竊電用戶的效能。
圖4 基于邊緣計(jì)算的竊電檢測(cè)框架Fig.4 Electricity theft detection framework based on edge computing
首先根據(jù)1.1 節(jié)中高損臺(tái)區(qū)實(shí)際數(shù)據(jù),采用Granger 歸因分析方法進(jìn)行竊電檢測(cè)測(cè)試分析,然后將主站側(cè)失真數(shù)據(jù)和失真后經(jīng)矩陣填補(bǔ)和張量填補(bǔ)的數(shù)據(jù)進(jìn)行對(duì)比測(cè)試。
在邊緣側(cè)對(duì)G、H1至H6及其差分序列分別完成單位根(ADF)檢驗(yàn)。以5%的置信度為標(biāo)準(zhǔn),序列均為一階單整序列,檢驗(yàn)結(jié)果見(jiàn)附錄A 表A1。
分別對(duì)G、H1至H6采用Engle-Granger 協(xié)整檢驗(yàn),再通過(guò)ADF 檢驗(yàn)對(duì)殘差序列完成平穩(wěn)檢測(cè),殘差序列平穩(wěn)性檢測(cè)結(jié)果如表1 所示,表中紅色數(shù)字表示檢驗(yàn)值小于檢驗(yàn)閾值-3.436 3。
表1 用戶與線損電量的殘差序列平穩(wěn)性檢驗(yàn)結(jié)果Table 1 Residual sequence smoothness test results of user and line loss power
殘差序列平穩(wěn)時(shí)對(duì)應(yīng)變量間的回歸方程為:
式中:T1和T2為相應(yīng)參數(shù)的t檢驗(yàn)值;R2為可決系數(shù);為調(diào)整后的可決系數(shù);Ftest為模型F檢驗(yàn)值;D為杜賓沃森統(tǒng)計(jì)量。若F檢驗(yàn)值和t檢驗(yàn)值表現(xiàn)顯著,則方程回歸效果較好。
對(duì)H1至H6和G分別構(gòu)建最小二乘回歸模型,協(xié)整檢驗(yàn)結(jié)果顯示,H1至H3與G的殘差序列平穩(wěn)性檢驗(yàn)中檢驗(yàn)值大于檢驗(yàn)閾值,而H4至H6與G的殘差序列平穩(wěn)性檢驗(yàn)中檢驗(yàn)值小于檢驗(yàn)閾值,說(shuō)明只有H4至H6與G存在協(xié)整關(guān)系,可繼續(xù)完成后續(xù)的Granger 檢驗(yàn),檢驗(yàn)閾值參考麥金農(nóng)協(xié)整檢驗(yàn)臨界值[32]。為進(jìn)一步明確H4至H6與G間的動(dòng)態(tài)關(guān)系,需建立H4至H6與G間的誤差修正模型:
式中:ΔH6為H6的一階差分;et-1=G(t-1)-17.019 7 -1.322 5H6(t-1),其中H6(t-1)為H6的滯后1 期序列。
當(dāng)H4至H6在短期內(nèi)波動(dòng)(增加)1%時(shí),H4至H6將在原基礎(chǔ)上分別增加0.704 0%、1.230 2% 和1.101 9%。從誤差修正項(xiàng)的系數(shù)來(lái)看,當(dāng)H4至H6與G短期波動(dòng)偏離二者間的長(zhǎng)期均衡關(guān)系時(shí),將分別 以-0.570 0、-0.445 7、-0.440 9 的調(diào)整力度將H4至H6與G間的非均衡狀態(tài)修正至均衡狀態(tài)。
分析H4至H6與G間的協(xié)整關(guān)系及誤差修正模型發(fā)現(xiàn),H4至H6與G的3 個(gè)誤差修正模型中的誤差修正項(xiàng)系數(shù)均符合反向調(diào)整機(jī)制。基于上述分析進(jìn)一步厘清了存在協(xié)整關(guān)系的H4至H6與G之間長(zhǎng)期穩(wěn)定的特征以及在短期波動(dòng)上的動(dòng)態(tài)關(guān)系。在H4至H6與G之間均存在協(xié)整關(guān)系的基礎(chǔ)上,進(jìn)一步通過(guò)Granger 檢驗(yàn)分析它們之間影響的因果聯(lián)系,表2為邊緣側(cè)Granger 檢驗(yàn)結(jié)果。由表2 可見(jiàn),在5%的臨界水平下,假設(shè)“H4不是G的Granger 原因”的顯著性水平小于0.05,說(shuō)明拒絕了原假設(shè),所以H4是引起G變化的原因,可將H4視為臺(tái)區(qū)中具有竊電嫌疑的用戶。經(jīng)現(xiàn)場(chǎng)稽查確證用戶4 存在私接線路竊電。
表2 邊緣側(cè)Granger 檢驗(yàn)結(jié)果Table 2 Granger test results at edge side
低壓用戶通信失敗后推遲上報(bào)數(shù)據(jù),此時(shí)主站端數(shù)據(jù)將失真地表現(xiàn)為臺(tái)區(qū)高損或負(fù)損,誤導(dǎo)竊電檢測(cè)結(jié)果。為驗(yàn)證本文所提方法的優(yōu)勢(shì),挑選該臺(tái)區(qū)的任一工商業(yè)用戶在某一天如第31 天(2020 年1 月29 日)報(bào)送電量數(shù)據(jù)失敗,并在次日補(bǔ)報(bào)。此時(shí),線損電量和線損率在當(dāng)天會(huì)因?yàn)樯賵?bào)電量而增大,而在次日又會(huì)因?yàn)橐淮螆?bào)送異常用戶2 天的電量而明顯減少。用戶H1至H6電量缺失后的用電量與線損電量結(jié)果見(jiàn)附錄A 表A2。繼續(xù)采用Granger因果檢測(cè)法基于失真數(shù)據(jù)檢驗(yàn)各用戶與變化后的線損電量是否存在相關(guān)性。主站側(cè)的Granger 檢驗(yàn)總結(jié)果如表3 所示,用戶H1至H6的電量缺失時(shí)的各部分檢驗(yàn)結(jié)果見(jiàn)附錄A 表A3 至表A5。由表3 和表A3 至表A5 可得出以下結(jié)論。
表3 主站側(cè)Granger 檢驗(yàn)結(jié)果Table 3 Granger test results in main station
1)用戶報(bào)送數(shù)據(jù)失敗時(shí),異常用戶用電量與臺(tái)區(qū)線損電量間不存在協(xié)整關(guān)系,無(wú)法繼續(xù)使用Granger 因果檢驗(yàn);其余用戶用電量與線損電量仍存在協(xié)整關(guān)系,可繼續(xù)使用Granger 因果檢驗(yàn)。
2)除報(bào)送數(shù)據(jù)異常用戶外,其余用戶均可被認(rèn)定為竊電嫌疑用戶。因用戶4 是稽查確認(rèn)的竊電用戶,低壓用戶報(bào)送電量失敗再補(bǔ)報(bào)時(shí),根據(jù)主站數(shù)據(jù)檢測(cè)竊電用戶的誤報(bào)率上升到80%。
缺失數(shù)據(jù)填補(bǔ)是目前國(guó)內(nèi)外研究的熱點(diǎn)問(wèn)題。文獻(xiàn)[18]提出了一種基于低秩矩陣?yán)碚摰碾娔苜|(zhì)量缺失數(shù)據(jù)填補(bǔ)方法。該方法設(shè)計(jì)多范數(shù)聯(lián)合的低秩優(yōu)化模型,并采用ADMM 求解模型。文獻(xiàn)[19]提出一種基于張量的多用戶缺失電力數(shù)據(jù)的補(bǔ)全方法,在配電網(wǎng)低壓臺(tái)區(qū)缺失數(shù)據(jù)補(bǔ)全中采用了低秩張量補(bǔ)全模型。該方法通過(guò)對(duì)低壓臺(tái)區(qū)數(shù)據(jù)的特征進(jìn)行分析,構(gòu)建了該臺(tái)區(qū)的標(biāo)準(zhǔn)缺失張量。然后在考慮用戶數(shù)據(jù)自身特性和多用戶數(shù)據(jù)多維內(nèi)在相關(guān)性的基礎(chǔ)上,利用補(bǔ)全張量的低秩性來(lái)建立模型,采用ADMM 迭代求解。
采用主站側(cè)逐個(gè)用戶數(shù)據(jù)傳輸失真時(shí)的算例數(shù)據(jù),對(duì)通信異常未報(bào)送電量的用戶數(shù)據(jù)按矩陣填充和張量補(bǔ)全2 種方式填補(bǔ)缺失的用戶電量。出現(xiàn)數(shù)據(jù)傳輸異常用戶在2020-01-29 和2020-01-30 的實(shí)際電量和2 種方式填補(bǔ)后的電量如表4 所示。2020-01-29 和2020-01-30 的實(shí)際線損電量分別為115.30 kW·h 和118.13 kW·h。根據(jù)填補(bǔ)校正的用戶電量,可以計(jì)算校正后的線損電量及對(duì)應(yīng)誤差百分比,計(jì)算結(jié)果如表5 所示。
表4 填補(bǔ)電量缺失后的日用電量Table 4 Daily electricity consumption after recovery of missing power data
由表4 和表5 可見(jiàn),盡管現(xiàn)有研究一般認(rèn)為矩陣填補(bǔ)和張量填補(bǔ)能較好地填補(bǔ)缺失數(shù)據(jù),但這種有效性是建立在數(shù)據(jù)具有低秩性的前提下的,當(dāng)臺(tái)區(qū)中用戶數(shù)據(jù)相互間不具有較強(qiáng)的關(guān)聯(lián)性時(shí),也并不一定能準(zhǔn)確恢復(fù)缺失數(shù)據(jù)。采用填補(bǔ)后的數(shù)據(jù)測(cè)試Granger 因果檢測(cè)法能否準(zhǔn)確識(shí)別竊電用戶。2 種方法填補(bǔ)后的Granger 檢驗(yàn)結(jié)果如表6 所示,矩陣填補(bǔ)后用戶H1至H6的電量數(shù)據(jù)的各部分檢驗(yàn)結(jié)果見(jiàn)附錄A 表A6 至表A8。對(duì)比表4 至表6 和表A6 至表A8 可得以下結(jié)論。
表6 主站數(shù)據(jù)填補(bǔ)后的Granger 檢驗(yàn)結(jié)果Table 6 Results of Granger test after data recovery in main station
1)由矩陣填補(bǔ)后的數(shù)據(jù)分析可知,用戶H1至H3、H6通信異常并填補(bǔ)恢復(fù)時(shí),Granger 分析無(wú)法判斷哪個(gè)用戶的竊電嫌疑最大;用戶H4通信異常并填補(bǔ)恢復(fù)后,會(huì)將用戶H4判斷為竊電嫌疑最大的用戶,檢測(cè)正確;用戶H5通信異常并填補(bǔ)恢復(fù)后,會(huì)將用戶H5誤判為竊電嫌疑最大的用戶,根據(jù)矩陣填補(bǔ)的主站數(shù)據(jù)檢測(cè)竊電用戶的正確率顯著下降到16.6%。
2)由張量補(bǔ)全后的數(shù)據(jù)分析可知,用戶H1、H3通信異常并填補(bǔ)恢復(fù)后,Granger 分析方法無(wú)法判斷哪個(gè)用戶的竊電嫌疑最大;用戶H2、H4、H5通信異常并填補(bǔ)恢復(fù)后,會(huì)將用戶H4判斷為竊電嫌疑最大的用戶,檢測(cè)正確;用戶H6通信異常并填補(bǔ)恢復(fù)后,會(huì)將用戶H6誤判為竊電嫌疑最大的用戶,根據(jù)張量補(bǔ)全的主站數(shù)據(jù)來(lái)檢測(cè)竊電用戶的正確率下降至50%。
3)矩陣填補(bǔ)和張量填補(bǔ)的目標(biāo)是得到范數(shù)最小的低秩矩陣/張量,為得到低秩的補(bǔ)全數(shù)據(jù),使得補(bǔ)全后的數(shù)據(jù)在一定誤差范圍內(nèi)具有更高的線性相關(guān)性,在一定程度上改變用戶與線損電量的相關(guān)性。從表4 和表5 可知,2 種補(bǔ)償算法均有誤差。由文獻(xiàn)[10]中Granger 檢驗(yàn)關(guān)系式可知,同一時(shí)間點(diǎn)被檢測(cè)用戶用電量和線損電量的一一對(duì)應(yīng)關(guān)系對(duì)最終檢驗(yàn)結(jié)果影響很大,而補(bǔ)全算法在一定誤差范圍內(nèi)改變了此種相關(guān)關(guān)系,從而導(dǎo)致Granger 檢驗(yàn)無(wú)法準(zhǔn)確識(shí)別竊電用戶。
表5 填補(bǔ)電量缺失后的損失電量Table 5 Loss power after recovery of missing power data
綜上,采用相同方法進(jìn)行竊電檢測(cè),不管是矩陣填充還是張量填充恢復(fù)失真數(shù)據(jù),都會(huì)造成準(zhǔn)確率明顯下降。本文所提方法只需要將計(jì)算模式切換到邊緣側(cè)執(zhí)行,即可消除數(shù)據(jù)失真引起誤報(bào)的問(wèn)題,顯著降低誤報(bào)率,提高低壓用戶竊電檢測(cè)的準(zhǔn)確性。
某供電企業(yè)營(yíng)銷服務(wù)中心采用本文所提出的基于邊緣計(jì)算的低壓用戶竊電檢測(cè)方法進(jìn)行驗(yàn)證。該地區(qū)線損率在5%以上的高損臺(tái)區(qū)共計(jì)2 130 個(gè),其中配置有智能融合終端、可執(zhí)行邊緣計(jì)算的臺(tái)區(qū)為124 個(gè),配置的智能融合終端如圖5 所示。
圖5 典型臺(tái)區(qū)的智能融合終端Fig.5 Intelligent fusion terminal in typical distribution area
采用本文所提方法進(jìn)行邊緣側(cè)竊電檢測(cè)。從配變?nèi)诤辖K端上抽取50 個(gè)實(shí)際高損臺(tái)區(qū)在邊緣側(cè)匯聚的2021 年8 月至11 月間臺(tái)區(qū)和用戶計(jì)量數(shù)據(jù)進(jìn)行竊電檢測(cè)。
由于Granger 歸因分析有數(shù)據(jù)序列同階的要求,有18 個(gè)臺(tái)區(qū)無(wú)法檢測(cè)。在滿足同階要求的32 個(gè)臺(tái)區(qū)中,檢出38 個(gè)疑似竊電用戶,其中7 個(gè)臺(tái)區(qū)未檢出異常用戶。對(duì)38 個(gè)用戶下發(fā)竊電檢測(cè)工單,經(jīng)現(xiàn)場(chǎng)查實(shí)竊電用戶有29 戶,準(zhǔn)確率為76%。其中,存在一個(gè)竊電用戶的臺(tái)區(qū)有11 個(gè),存在2 個(gè)竊電用戶的臺(tái)區(qū)有9 個(gè),不存在3 個(gè)及以上竊電用戶的臺(tái)區(qū)。
對(duì)于查實(shí)有異常用戶的20 個(gè)臺(tái)區(qū),根據(jù)主站側(cè)計(jì)量數(shù)據(jù)采用效果較好的張量補(bǔ)全缺失數(shù)據(jù)后,再用Granger 歸因分析進(jìn)行竊電檢測(cè)。其中,6 個(gè)臺(tái)區(qū)能準(zhǔn)確檢出查實(shí)的竊電用戶而無(wú)誤判,共檢出7 個(gè)竊電用戶;4 個(gè)臺(tái)區(qū)既檢出竊電用戶,又存在誤判用戶,共檢出4 個(gè)竊電用戶;5 個(gè)臺(tái)區(qū)檢出的用戶均為誤判用戶;5 個(gè)臺(tái)區(qū)既沒(méi)有檢出也沒(méi)有誤判竊電用戶。準(zhǔn)確檢出率為37.9%,明顯低于采用邊緣側(cè)準(zhǔn)確數(shù)據(jù)的識(shí)別準(zhǔn)確率。
針對(duì)用電信息采集系統(tǒng)主站低壓計(jì)量數(shù)據(jù)失真影響竊電檢測(cè)的問(wèn)題,提出了基于邊緣計(jì)算的低壓用戶竊電檢測(cè)方法,主要結(jié)論如下。
1)分析指出低壓用戶通信異常導(dǎo)致主站計(jì)量數(shù)據(jù)失真,采用失真的計(jì)量數(shù)據(jù)進(jìn)行高損臺(tái)區(qū)竊電檢測(cè)易造成誤報(bào),是阻礙低壓用戶竊電檢測(cè)的重要因素。
2)針對(duì)難以根據(jù)失真的低壓臺(tái)區(qū)數(shù)據(jù)準(zhǔn)確檢測(cè)高損臺(tái)區(qū)竊電用戶的問(wèn)題,提出以邊緣計(jì)算方式在ITDS 上進(jìn)行竊電檢測(cè)的新模式,因?yàn)椴捎帽镜財(cái)?shù)據(jù),可以釜底抽薪地消除低壓用戶通信異常導(dǎo)致主站數(shù)據(jù)失真對(duì)竊電檢測(cè)的干擾和影響。
3)基于高損臺(tái)區(qū)實(shí)際數(shù)據(jù),產(chǎn)生了通信異常數(shù)據(jù)、矩陣填補(bǔ)和張量填補(bǔ)失真數(shù)據(jù)。
4)基于以上4 種模式下的數(shù)據(jù)應(yīng)用Granger 歸因分析進(jìn)行用電異常檢測(cè)。測(cè)試結(jié)果表明,主站數(shù)據(jù)失真可導(dǎo)致線損歸因分析方法將所有用戶均判別為異常,導(dǎo)致竊電檢測(cè)完全失效。采用矩陣填充失真數(shù)據(jù)時(shí),檢測(cè)準(zhǔn)確率降低到16%;采用張量補(bǔ)全失真數(shù)據(jù)時(shí),檢測(cè)準(zhǔn)確率降低到50%;而采用本文所提邊緣計(jì)算方式進(jìn)行竊電檢測(cè),不受通信異常影響,可準(zhǔn)確檢出竊電用戶。
本文僅以Granger 歸因分析方法為例,驗(yàn)證所提方法的有效性,其他時(shí)間序列分析方法也可用于識(shí)別對(duì)線損異常有貢獻(xiàn)的異常用戶,但數(shù)據(jù)失真對(duì)檢測(cè)效果的影響也是相似的。此外,因?yàn)榱汶娏康蛪河脩艨捎眯畔⒉蛔?,本文所提方法不能用于檢測(cè)零電量竊電用戶。如何突破信息缺失的影響,是后續(xù)竊電檢測(cè)的重點(diǎn)研究方向。
附錄見(jiàn)本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。