程淑亞,蔡慧,沈海泓,陳含琪,謝岳,王穎
( 1.中國(guó)計(jì)量大學(xué) 機(jī)電工程學(xué)院,杭州 310018; 2.浙江華云信息科技有公司,杭州 310000)
隨著國(guó)民經(jīng)濟(jì)發(fā)展,人民生活水平提高,用電需求量不斷增加[1],線損管理問題也越來(lái)越突出。臺(tái)區(qū)線損異?,F(xiàn)象頻發(fā),不同負(fù)荷水平下線損情況有所不同,且各地區(qū)情況很不平衡[2]。因此,現(xiàn)有模式下采用一刀切式的合格線損區(qū)間定義以及傳統(tǒng)依靠人工排查異常的方式給降損工作帶來(lái)了很大的難度[3]。
用戶竊電將直接影響臺(tái)區(qū)的管理線損,但對(duì)于技術(shù)線損(即固定線損與可變線損)沒有影響,因此應(yīng)剝離技術(shù)線損。傳統(tǒng)技術(shù)線損計(jì)算的方法主要有:電壓損失法、等值電阻法等[4]。基于智能算法計(jì)算技術(shù)線損的方法有:人工神經(jīng)元網(wǎng)絡(luò)、遺傳算法等[5]。以上算法實(shí)際應(yīng)用難度較大,多數(shù)參數(shù)實(shí)際無(wú)法得到。例如線路長(zhǎng)度因線路的實(shí)際情況錯(cuò)綜復(fù)雜無(wú)法準(zhǔn)確測(cè)量,且人力成本高。但隨著電網(wǎng)建設(shè)和計(jì)量裝置采集技術(shù)的發(fā)展,已經(jīng)能夠得到比以前更多、更精確的數(shù)據(jù)[6],基于此提出一種盡可能利用全面數(shù)據(jù)計(jì)算技術(shù)線損的方法。
竊電行為會(huì)導(dǎo)致配電網(wǎng)線損率居高不下,使電力企業(yè)蒙受巨大的直接經(jīng)濟(jì)損失,同時(shí)容易危害電網(wǎng)的安全運(yùn)行,損害正常用戶的利益;另一方面,不少工商業(yè)用戶采用竊電手段降低成本維持企業(yè)運(yùn)營(yíng),構(gòu)成不正當(dāng)競(jìng)爭(zhēng),擾亂正常的經(jīng)濟(jì)秩序[7]。依法查處竊電案件并嚴(yán)厲打擊竊電行為有助于建立良好的用電秩序、維護(hù)電網(wǎng)正常運(yùn)營(yíng)、防止國(guó)家財(cái)產(chǎn)流失,具有重要的現(xiàn)實(shí)意義。因此如何快速有效地查找竊電成為當(dāng)前亟待解決的一個(gè)問題[8]。
文獻(xiàn)[9-10]介紹了支持向量機(jī)在竊電檢測(cè)方面的應(yīng)用并與其它算法作了對(duì)比。文獻(xiàn)[11-12]提出采用離群點(diǎn)算法對(duì)電壓電流值的變化規(guī)律進(jìn)行檢測(cè),甄別出竊電用戶。文獻(xiàn)[13]介紹了基于改進(jìn)遺傳優(yōu)化神經(jīng)網(wǎng)絡(luò)算法的反竊電系統(tǒng)為電力行業(yè)的竊電問題提供了一個(gè)方法。文獻(xiàn)[14]提出了基于廣度和深度的卷積神經(jīng)網(wǎng)絡(luò)模型,通過(guò)用電周期性特征來(lái)區(qū)分正常用戶與竊電用戶。文獻(xiàn)[15]介紹了借助日漸完善的電力用戶用電信息采集系統(tǒng),對(duì)地區(qū)內(nèi)的用戶用電情況進(jìn)行全面監(jiān)測(cè)分析,開展異常數(shù)據(jù)的比對(duì),尋找竊電用戶。文獻(xiàn)[16]通過(guò)對(duì)配電網(wǎng)進(jìn)行狀態(tài)估計(jì)的方法對(duì)用戶竊電進(jìn)行檢測(cè),以概率模型假設(shè)為基礎(chǔ),利用歷史數(shù)據(jù)來(lái)預(yù)測(cè)電力用戶消費(fèi)異常的概率。但上述文獻(xiàn)都只將用戶自身的負(fù)荷、地理位置、季節(jié)、用戶類型等狀態(tài)量作為研究對(duì)象,分析方法與考慮的因素不夠全面,也沒有形成一個(gè)整體的竊電識(shí)別流程,局限性較大。
采用了技術(shù)線損剝離方法、聚類算法、離群點(diǎn)算法、以及相關(guān)性分析等手段對(duì)低壓用戶的歷史用電數(shù)據(jù)與用戶所在臺(tái)區(qū)的歷史線損率數(shù)據(jù)進(jìn)行考察,建立了分析模型,提出了一種將臺(tái)區(qū)線損率波動(dòng)與竊電嫌疑相關(guān)聯(lián)的多角度識(shí)別方法,設(shè)計(jì)了總體識(shí)別流程,并利用某地供電公司采集的用戶歷史數(shù)據(jù)驗(yàn)證了所提方法的合理性、有效性和實(shí)用性。
在對(duì)用戶自身進(jìn)行分析的同時(shí)關(guān)注其與所在臺(tái)區(qū)線損之間存在的關(guān)聯(lián)性,并基于此設(shè)計(jì)了一套識(shí)別流程。該方法的研究思路如圖1所示。
圖1 研究思路Fig.1 Research route
提出一種簡(jiǎn)單易行的技術(shù)線損計(jì)算算法剝離臺(tái)區(qū)技術(shù)線損,然后對(duì)管理線損率進(jìn)行二次K-means聚類,尋找管理線損率異常波動(dòng)的臺(tái)區(qū),并給出異常程度評(píng)價(jià)指標(biāo)。
在存在異常波動(dòng)的臺(tái)區(qū)中,通過(guò)對(duì)用戶的歷史用電數(shù)據(jù)進(jìn)行聚類或離群點(diǎn)算法分析竊電嫌疑并進(jìn)行參數(shù)修正,給出竊電行為。同時(shí),分析竊電用戶用電量與用戶所在臺(tái)區(qū)的線損數(shù)據(jù)同步關(guān)聯(lián)性,采用皮爾遜相關(guān)系數(shù)作為關(guān)聯(lián)性評(píng)價(jià)指標(biāo)。
最后,建立臺(tái)區(qū)異常程度、臺(tái)區(qū)與用戶關(guān)聯(lián)性指標(biāo)以及用戶的竊電嫌疑加權(quán)模型,得到最終的綜合疑似度。
臺(tái)區(qū)線損按成因分為技術(shù)線損和管理線損(也稱非技術(shù)線損)。技術(shù)線損主要包括不變損耗(也稱固定線損)和可變損耗,大小基本上與電流的平方成正比;管理線損等同于不明損耗,由竊電、計(jì)量設(shè)備誤差和失誤等產(chǎn)生[17]。用戶竊電將會(huì)增加管理線損從而影響臺(tái)區(qū)總線損。所以需要首先剝離技術(shù)線損,獲得管理線損,使分析更準(zhǔn)確。
用戶竊電導(dǎo)致的臺(tái)區(qū)線損異常波動(dòng)的特征為:
(1)區(qū)別于計(jì)量設(shè)備的偶然性誤差和采集數(shù)據(jù)出錯(cuò),竊電導(dǎo)致線損率異常上升一段時(shí)間后回落到正常水平或一直保持高線損率狀態(tài);
(2)線損率異常上升的同時(shí),終端采集計(jì)入的用電量減小,兩者之間存在負(fù)相關(guān)的關(guān)系,違背電網(wǎng)運(yùn)行規(guī)律,且兩者發(fā)生的時(shí)間具有一致性。
因此,可通過(guò)識(shí)別非技術(shù)線損率異常波動(dòng)的臺(tái)區(qū)來(lái)初步劃定嫌疑用戶范圍,再通過(guò)線損率與用戶用電量的相關(guān)性分析提升識(shí)別可靠性。
2.1.1 剝離技術(shù)線損的方法
基于“I2Rt”的方法和負(fù)荷曲線方法,計(jì)算技術(shù)線損一天的損耗[18],公式如下:
(1)
(2)
式中U和I為公變負(fù)荷的電壓和電流;U0為用戶負(fù)荷的電壓;W單位為kW·h。
具體技術(shù)線損的計(jì)算步驟為:
(1)對(duì)于信息采集系統(tǒng)中一天96個(gè)電流點(diǎn)先擬合曲線,再對(duì)擬合曲線的平方進(jìn)行積分;
(2)對(duì)于信息采集系統(tǒng)中一天的96個(gè)電壓點(diǎn),分別計(jì)算對(duì)應(yīng)時(shí)間點(diǎn)的公變負(fù)荷和用戶負(fù)荷的三相電壓的差。然后與對(duì)應(yīng)公變負(fù)荷三相中每一相每一個(gè)時(shí)間點(diǎn)的電流相除,最終得到對(duì)應(yīng)的96個(gè)電阻點(diǎn)求其平均值得到電阻。
圖2(a)為浙江某臺(tái)區(qū)在2017年1月1日~2月24日的日供電量數(shù)據(jù),圖2(b)為用該方法計(jì)算技術(shù)線損并剝離后的線損率。
圖2 兩種線損率的對(duì)比Fig.2 Comparison of two kinds of line loss ratio
由圖2(a)供電量和圖2(b)兩種線損率相對(duì)比可知,供電量越高,技術(shù)線損占比越高,符合實(shí)際情況,說(shuō)明該方法具有合理性。
2.1.2 臺(tái)區(qū)線損率異常波動(dòng)識(shí)別方法
針對(duì)上述線損率波動(dòng)特征采用對(duì)臺(tái)區(qū)線損率進(jìn)行二次聚類的方法來(lái)檢測(cè)低壓臺(tái)區(qū)的線損率波動(dòng)。常見的聚類算法有KNN、K-means、DBSCAN、GMM、SOM、FCM等,其中K-means算法[19]適合處理低維數(shù)據(jù),且在運(yùn)行時(shí)間上有一定優(yōu)勢(shì),缺點(diǎn)是需預(yù)設(shè)K值且容易陷入局部最優(yōu)。由于本文處理的數(shù)據(jù)對(duì)象是線損率和電量數(shù)據(jù),每次處理的數(shù)據(jù)量有限,且分類數(shù)目已經(jīng)確定,因此選擇K-means算法進(jìn)行聚類。聚類結(jié)果如圖3所示。
圖3 某臺(tái)區(qū)歷史線損率數(shù)據(jù)K-means聚類分析結(jié)果Fig.3 K-means clustering analysis results of historical lineloss rate data in a station area
圖3(a)所示為某臺(tái)區(qū)六個(gè)月歷史線損率數(shù)據(jù)在預(yù)處理后進(jìn)行第一次K-means聚類的結(jié)果。一般,預(yù)處理后的數(shù)據(jù)中很可能存在少量粗大數(shù)據(jù)。如圖3(a)中標(biāo)簽為Table B的數(shù)據(jù),其只包含游離在其它數(shù)據(jù)之外的三個(gè)點(diǎn),會(huì)導(dǎo)致線損率數(shù)據(jù)分類不完全。為了克服該缺陷,有必要舍棄此次聚類標(biāo)簽為Table B的粗大數(shù)據(jù),對(duì)剩余數(shù)據(jù)標(biāo)簽為Table A、Table C的數(shù)據(jù)再次分類,得到圖3(b)所示的聚類結(jié)果。對(duì)于得到的三個(gè)聚類中心,采用最高類中心與最低類中心之間的距離D作為臺(tái)區(qū)線損率波動(dòng)的評(píng)價(jià)指標(biāo),定義SC為指標(biāo)閾值。若D>SC,則認(rèn)為該臺(tái)區(qū)線損率波動(dòng)較大,臺(tái)區(qū)下用戶存在竊電嫌疑。反之,則認(rèn)為該臺(tái)區(qū)為正常臺(tái)區(qū)。經(jīng)過(guò)大量實(shí)際數(shù)據(jù)檢驗(yàn),本文設(shè)置SC=3%較為可靠。
2.1.3 時(shí)間離散度的定義
一般意義上講,連續(xù)時(shí)間上的高損比斷續(xù)時(shí)間上的高損更加存在竊電風(fēng)險(xiǎn)。因此,將線損率聚類結(jié)果中最高類的時(shí)間序列離散程度進(jìn)行分析。
由于時(shí)間狀態(tài)量的特殊性,無(wú)法采用極差、平均差、標(biāo)準(zhǔn)差等統(tǒng)計(jì)量作為離散程度的測(cè)度指標(biāo),因此定義時(shí)間離散度TD作為臺(tái)區(qū)竊電風(fēng)險(xiǎn)評(píng)判標(biāo)準(zhǔn),假設(shè)嫌疑臺(tái)區(qū)的線損率最高類對(duì)應(yīng)的時(shí)間坐標(biāo)序列T=[T1,T2,…,TM],則時(shí)間離散度TD的表達(dá)式如下:
(3)
式中T為異常線損率對(duì)應(yīng)的時(shí)間點(diǎn);i為時(shí)間點(diǎn)T的序號(hào);M為異常線損率的數(shù)據(jù)長(zhǎng)度,TD≥1。當(dāng)TD=1時(shí),表示時(shí)間完全連續(xù);TD越大表示時(shí)間離散程度越大。
作為云南省交易團(tuán)唯一的金融合作伙伴,云南中行為做好此次進(jìn)博會(huì)金融服務(wù)工作,從組織籌備、方案制定、企業(yè)對(duì)接等方面精心籌劃、全面部署,積極配合,全方位開展中國(guó)國(guó)際進(jìn)口博覽會(huì)前期各項(xiàng)工作,為參會(huì)企業(yè)提供全面的綜合性金融服務(wù),贏得了企業(yè)和云南交易團(tuán)的高度評(píng)價(jià)。
對(duì)平均線損率超過(guò)10%以及節(jié)2.1中檢測(cè)出線損率波動(dòng)異常的臺(tái)區(qū)下所有用戶進(jìn)行分析,將竊電風(fēng)險(xiǎn)評(píng)價(jià)細(xì)化到單個(gè)用戶。
對(duì)于用電信息采集系統(tǒng)日采集的低壓用戶電量數(shù)據(jù),當(dāng)數(shù)據(jù)波動(dòng)較大時(shí),數(shù)據(jù)中的離群點(diǎn)不明顯,而采用K-means聚類可以對(duì)電量數(shù)據(jù)進(jìn)行較準(zhǔn)確的分類。當(dāng)用戶的電量數(shù)據(jù)波動(dòng)較小時(shí),K-means聚類中心較為接近,易對(duì)電量數(shù)據(jù)進(jìn)行錯(cuò)誤分類,而離群點(diǎn)算法[11-12]可以避免這一點(diǎn)。因此,兩種算法可以互為補(bǔ)充,采用變異系數(shù)CV作為衡量電量數(shù)據(jù)波動(dòng)大小的指標(biāo),作為選擇算法的依據(jù)。
(4)
經(jīng)過(guò)實(shí)際數(shù)據(jù)檢驗(yàn),CV>0.3時(shí),采用聚類算法對(duì)樣本進(jìn)行分析,CV≤0.3時(shí),采用離群點(diǎn)算法進(jìn)行分析。
采用聚類算法對(duì)用戶歷史用電量數(shù)據(jù)進(jìn)行分析,按照聚類中心大小分為三類:最高類、中間類、最低類。計(jì)算聚類中心距離,將中間類劃分入聚類中心距離較近的類,變?yōu)檩^高類與較低類。此時(shí),用戶竊電疑似度Q1由兩類中的較低類包含的數(shù)據(jù)量與總數(shù)據(jù)量的比值表示,如式(5)所示:
(5)
式中Nlow表示聚類算法中較低類的數(shù)據(jù)量。
采用基于距離的離群點(diǎn)算法對(duì)用戶的用電量數(shù)據(jù)進(jìn)行分析可檢測(cè)出一系列的離群點(diǎn),并檢測(cè)連續(xù)的離群點(diǎn)數(shù)量NO用以定義嫌疑系數(shù)O,連續(xù)離群點(diǎn)數(shù)量越多認(rèn)為其嫌疑越大。如式(6)、式(7)所示,此時(shí)用戶竊電疑似度Q1由嫌疑系數(shù)O與離群點(diǎn)中的參數(shù)pct[11]表示:
(6)
(7)
式中Pct代表基于距離的離群點(diǎn)算法中的參數(shù)pct。
為了輔助現(xiàn)場(chǎng)人員核查竊電用戶,提高模型的實(shí)用價(jià)值,對(duì)上述兩種竊電嫌疑分析方法通過(guò)電量數(shù)據(jù)定位用戶疑似竊電的時(shí)間點(diǎn),進(jìn)而通過(guò)識(shí)別竊電前后的用電特征,判斷用戶的具體竊電行為。
此處以低壓?jiǎn)蜗嚯娔鼙頌槔M(jìn)行說(shuō)明。低壓?jiǎn)蜗嚯娔鼙淼墓β使綖椋?/p>
P=UIcosφ
(8)
式中U為相電壓;I為表示相電流;cosφ為功率因數(shù)。
用戶竊電造成電能表計(jì)入的功率發(fā)生變化,幾種竊電行為造成的功率變化情況見表1。雖然這只是根據(jù)數(shù)據(jù)信息判斷的三大類,具體的竊電行為由現(xiàn)場(chǎng)判斷,但是為竊電行為查證提供了一個(gè)有效的方向,節(jié)省工作人員查證時(shí)間,提高竊電行為查詢效率?,F(xiàn)場(chǎng)判斷的具體竊電行為多種多樣,例如:竊電行為類別1具體竊電行為有:弄斷熔絲管內(nèi)的熔絲、松開電壓回路的接線端子、弄斷電壓回路導(dǎo)線的線芯、松開電能表的電壓連片、擰松電能表的電壓連片等;竊電行為類別2具體竊電行為有:電流采樣回路并聯(lián)、串接電阻、更換電壓采樣回路分級(jí)采樣電阻、電壓線圈串聯(lián)電阻等電子元件分壓等。不一一列舉,只判斷竊電行為的三種類別。
表1 低壓?jiǎn)蜗喔`電功率變化表Tab.1 Power variation in low voltage single-phase electricity theft
根據(jù)表中所示的竊電行為造成的功率變化特征,假設(shè)同一用戶竊電前后用電水平基本不變,則同一用戶的用電量變化規(guī)律與功率變化一致,可根據(jù)竊電時(shí)間前后的平均用電量變化特征識(shí)別竊電行為。若竊電用戶竊電前后用電情況變化,可能出現(xiàn)竊電用戶平均用電量在竊電后反而升高的情況,則此方法無(wú)法識(shí)別。
臺(tái)區(qū)線損率作為反映整個(gè)臺(tái)區(qū)線損情況的指標(biāo),對(duì)臺(tái)區(qū)下用戶的竊電嫌疑評(píng)估同樣具備參考價(jià)值。竊電用戶日用電量數(shù)據(jù)變小的同時(shí),會(huì)引起臺(tái)區(qū)線損率升高。所以采用皮爾遜相關(guān)系數(shù)對(duì)剝離技術(shù)線損后的臺(tái)區(qū)線損率與單個(gè)用戶的用電量作關(guān)聯(lián)性分析。
假設(shè)單個(gè)用戶的單日用電量序列X=[X1,X2,…,XN],該用戶所在臺(tái)區(qū)的歷史線損率序列Y=[Y1,Y2,…,YN],X與Y是一一對(duì)應(yīng)的N維向量,N代表統(tǒng)計(jì)的天數(shù)。用戶的日用電量X與臺(tái)區(qū)線損率Y之間的相關(guān)性系數(shù)用ρ(X,Y)表示:
(9)
式中μ代表樣本平均值;σ代表樣本標(biāo)準(zhǔn)差。
由于用戶竊電和線損率波動(dòng)存在負(fù)相關(guān)的關(guān)系,故此處根據(jù)相關(guān)性系數(shù),定義用戶與臺(tái)區(qū)存在關(guān)聯(lián)趨勢(shì)的嫌疑指標(biāo)c。
c=-ρ(X,Y)
(10)
由于相關(guān)性系數(shù)ρ(X,Y)≤0才有對(duì)應(yīng)的物理意義,需限定c≥0,c的取值范圍為[0, 1]。
低壓用戶竊電嫌疑分析分為異常臺(tái)區(qū)分析流程和臺(tái)區(qū)下用戶竊電嫌疑分析流程。
異常臺(tái)區(qū)分析流程如圖4所示,步驟如下:
圖4 異常臺(tái)區(qū)評(píng)估流程圖Fig.4 Flow chart of abnormal substation area evaluation
(1)提取待評(píng)估臺(tái)區(qū)的歷史線損率數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;
(2)提取臺(tái)區(qū)歷史平均線損率大于10%的臺(tái)區(qū),直接列為異常臺(tái)區(qū),設(shè)定異常系數(shù)a=1;
(3)對(duì)其余臺(tái)區(qū)歷史線損率數(shù)據(jù)進(jìn)行聚類,聚類個(gè)數(shù)K=3;
(4)聚類后判斷是否有樣本數(shù)目小于總體樣本數(shù)目1/10的類,若有,舍棄掉后進(jìn)行二次聚類,若無(wú)則跳過(guò)二次聚類;
(5)計(jì)算聚類所得的最高類中心與最低類中心之間的距離D,若存在D>Sc則將該臺(tái)區(qū)列為異常臺(tái)區(qū);
(6)提取異常臺(tái)區(qū)聚類結(jié)果中線損率最高類的時(shí)間坐標(biāo)序列T,進(jìn)行時(shí)間離散度分析,并根據(jù)分析結(jié)果計(jì)算嫌疑臺(tái)區(qū)的異常系數(shù)a。
對(duì)待檢測(cè)地區(qū)進(jìn)行異常臺(tái)區(qū)分析后,得到P個(gè)異常臺(tái)區(qū)的時(shí)間離散度序列TD:
TD=[TD1,TD2,TD3,…,TDP]
(11)
(12)
根據(jù)上述結(jié)果設(shè)定異常系數(shù)a如下:
(13)
(14)
對(duì)待評(píng)估地區(qū)進(jìn)行臺(tái)區(qū)線損波動(dòng)分析后,提取嫌疑臺(tái)區(qū)的所有用戶進(jìn)行后續(xù)的嫌疑評(píng)估,具體流程如圖5所示。
圖5 用戶綜合竊電嫌疑評(píng)估流程圖Fig.5 Flow chart of comprehensive suspicion electricity theft evaluation for users
(1)根據(jù)電量波動(dòng)指標(biāo)CV選擇對(duì)用戶進(jìn)行離群點(diǎn)或聚類算法繼續(xù)分析,根據(jù)算法結(jié)果獲取用戶竊電疑似度指標(biāo)Q1;
(2)比較用戶疑似竊電前后用電量是否有異常減小,若有,Q′1=Q1;若無(wú),Q′1=0.8Q1,并作竊電行為分析;
(3)對(duì)用戶單日用電量與臺(tái)區(qū)線損率變化進(jìn)行關(guān)聯(lián)分析,獲取關(guān)聯(lián)嫌疑指標(biāo)c;
(4)將用戶疑似度Q′1作為基本嫌疑,用戶與臺(tái)區(qū)關(guān)聯(lián)的趨勢(shì)嫌疑c與臺(tái)區(qū)的異常程度a相乘后作為輔助嫌疑,得到用戶的綜合疑似度Q=Q′1+a×c。根據(jù)上文分析,Q的取值范圍為[0, 2]。
第(3)步驟中Q′1=0.8Q1,這里系數(shù)選擇0.8的依據(jù)分析如下。首先,在已知竊電的258個(gè)竊電用戶隨機(jī)抽取10%,即26個(gè)用戶,分析竊電后10天用電量的平均值是否比竊電前10天平均值異常減小,分析結(jié)果:有20戶異常減小,即76.9%竊電用戶異常減小。基于此加入修正系數(shù),比較用戶疑似竊電前后用電量是否有異常減小,若無(wú),疑似度減小。這樣做的目的是排除正常用戶,一般用電量不變或變大的用戶是正常用戶的可能性非常大,但是有時(shí)候計(jì)算出來(lái)的疑似度也有可能偏高。接著對(duì)于計(jì)算出疑似度指標(biāo)的用戶,疑似度分別乘以系數(shù)0.65~0.9(間隔0.5),對(duì)比分析竊電用戶排名情況,系數(shù)0.8的時(shí)候結(jié)果比較合理,最終選用系數(shù)0.8。
為了驗(yàn)證該算法在實(shí)際反竊電工作中的準(zhǔn)確性和可靠性,選取由用電信息采集系統(tǒng)采集的某地區(qū)2017年6月~9月的相關(guān)用電數(shù)據(jù)與統(tǒng)計(jì)數(shù)據(jù)進(jìn)行算法驗(yàn)證。
對(duì)待檢測(cè)地區(qū)包含的316個(gè)臺(tái)區(qū)提取歷史線損率數(shù)據(jù),并進(jìn)行臺(tái)區(qū)線損率波動(dòng)分析,得到結(jié)果為204個(gè)臺(tái)區(qū)存在線損率異常波動(dòng)現(xiàn)象。
圖6 ST取不同值時(shí)臺(tái)區(qū)異常系數(shù)a的取值Fig.6 Values of anomaly coefficient a when STtakes different values
表2 ST取不同值時(shí)臺(tái)區(qū)異常系數(shù)a的情況Tab.2 Situation of anomaly coefficient a when ST takes different values
從中選取4個(gè)臺(tái)區(qū)共249戶用戶,其中竊電用戶有6戶,進(jìn)行竊電嫌疑評(píng)估并獲取其綜合疑似度Q,排列劃分用戶類別結(jié)果為:4個(gè)臺(tái)區(qū)中共計(jì)存在正常用戶125戶,輕微嫌疑用戶(Q<0.5)52戶,中度嫌疑用戶(0.5≤Q<0.7)58戶,高度嫌疑用戶(Q≥0.7)14戶。實(shí)地查證高度嫌疑和中度嫌疑用戶,即嫌疑臺(tái)區(qū)排名總數(shù)的前28.91%,查詢到其中5個(gè)竊電用戶,出現(xiàn)了改動(dòng)電能表采樣回路、繞越電能表接線的竊電手法。
表3所示為嫌疑度排名靠前的15個(gè)用戶的具體嫌疑指標(biāo),用戶7 969、8 937、6 689為竊電用戶。表中竊電行為的含義見表1所示。
表3的15個(gè)用戶中有9個(gè)用戶的綜合疑似度通過(guò)臺(tái)區(qū)波動(dòng)分析和臺(tái)區(qū)與用戶的關(guān)聯(lián)性分析得到的嫌疑指標(biāo)a和c對(duì)其用戶疑似度有了一定程度的修正。由表3中綜合疑似度和未剝離技術(shù)線損綜合疑似度的對(duì)比,可見15個(gè)用戶中有10個(gè)用戶通過(guò)剝離技術(shù)線損對(duì)綜合疑似度有了一定程度的修正。其余臺(tái)區(qū)情況亦類似。
表3 高度嫌疑用戶竊電嫌疑分析詳細(xì)指標(biāo)Tab.3 Detailed electricity theft analysis indicators of high suspicion users
采用更多數(shù)據(jù)進(jìn)一步分析,以便修正實(shí)例一中算法的不足。具體修正環(huán)節(jié)如下:
(1)考慮到季節(jié)性和大量實(shí)際數(shù)據(jù)分析的情況,且不影響模型分析結(jié)果,確定選用三個(gè)月的數(shù)據(jù)為一個(gè)單位進(jìn)行嫌疑臺(tái)區(qū)的篩選,找出管理線損實(shí)時(shí)偏高或異常波動(dòng)的臺(tái)區(qū);
(2)因?qū)嶋H上超過(guò)70%的臺(tái)區(qū)都有上百戶用戶,所以采用單個(gè)臺(tái)區(qū)疑似度為一個(gè)整體進(jìn)行分析;
(3)由于竊電用戶很有可能長(zhǎng)期處于竊電中,加入與歷年同月用電量平均值對(duì)比的環(huán)節(jié),修正綜合疑似度。具體為每個(gè)用戶上一年三個(gè)月平均值與這一年三個(gè)月平均值對(duì)比,若增高,綜合疑似度減半;若減小,綜合疑似度不變;
(4)因臺(tái)區(qū)數(shù)量大,需考慮查證的效率和成本,去掉劃分用戶類別步驟,直接查詢嫌疑臺(tái)區(qū)用戶排名總數(shù)的前25%。
選取由用電信息采集系統(tǒng)中某地區(qū)2019年1月~3月的相關(guān)用電數(shù)據(jù)進(jìn)行分析。首先在竊電頻發(fā)地區(qū)初步篩選得到44個(gè)臺(tái)區(qū),已實(shí)際查證有25個(gè)竊電用戶。
首先提取歷史線損率數(shù)據(jù),按照?qǐng)D4異常臺(tái)區(qū)評(píng)估流程和修正環(huán)節(jié)分析,得到24個(gè)臺(tái)區(qū)存在線損率異常波動(dòng)現(xiàn)象。實(shí)際驗(yàn)證結(jié)果為:24個(gè)臺(tái)區(qū)中嫌疑臺(tái)區(qū)為18個(gè),有6個(gè)臺(tái)區(qū)被誤判,正確率為75%;判斷為正常臺(tái)區(qū)有20個(gè),其中嫌疑臺(tái)區(qū)誤判為正常臺(tái)區(qū)有7個(gè),誤判率35%。44個(gè)臺(tái)區(qū)的綜合正確率為70.5%。
接著,確定24個(gè)臺(tái)區(qū)的時(shí)間離散度TDi的閾值ST為2.4。提取24個(gè)嫌疑臺(tái)區(qū)的所有用戶的相關(guān)數(shù)據(jù)按照?qǐng)D5用戶嫌疑評(píng)估步驟和修正環(huán)節(jié)進(jìn)行分析,得到綜合疑似度排名,具體數(shù)據(jù)詳情見表4。加入修正環(huán)節(jié)后,18個(gè)竊電用戶中有15個(gè)竊電用戶排名上升或不變,很多竊電用戶的嫌疑度排名大幅度上升,證明對(duì)算法進(jìn)行了有效地修正。
表4 竊電用戶實(shí)際查詢結(jié)果Tab.4 Results of actual query of electricity theft users
確定嫌疑排名后應(yīng)結(jié)合實(shí)地查證,以25%作為閾值進(jìn)行查證,修正后算法的查證結(jié)果為:13個(gè)竊電用戶排名在臺(tái)區(qū)用戶總數(shù)25%之內(nèi)可查到,5個(gè)竊電用戶排名超出25%未查到,正確率為72.2%。按照整體竊電識(shí)別方法驗(yàn)證,25個(gè)竊電用戶中最終查到13個(gè),正確率為52%。
提出了一種新的低壓用戶竊電識(shí)別方法,并在真實(shí)數(shù)據(jù)案例的基礎(chǔ)上對(duì)該方法進(jìn)行驗(yàn)證,結(jié)合人工查證可成功抓取竊電用戶。研究結(jié)果表明,該方法通過(guò)剝離技術(shù)線損、二次K-means聚類、離群點(diǎn)算法、關(guān)聯(lián)性分析等多重分析,突破了單個(gè)算法的缺陷與單一角度的局限,能夠更加有效地抓取竊電用戶。此外,未來(lái)工作需同時(shí)從更多的角度,發(fā)掘更多的基本算法融入于整體識(shí)別方法,提高該方法的有效性和穩(wěn)定性。