蔡嘉榮,王順意,吳廣財(cái)
(廣東電網(wǎng)有限責(zé)任公司,廣東廣州,510080)
2014年,南方某縣級(jí)供電公司統(tǒng)計(jì)該地區(qū)非正常技術(shù)損耗電量5163萬(wàn)度。其中,居民和農(nóng)村地區(qū)理論上被盜竊電量達(dá)4290萬(wàn)度,占理論總被盜竊電量的83%,按居民用電0.61元/度計(jì)算,損失電費(fèi)超2600萬(wàn)元。由此可見(jiàn),每年因竊電對(duì)國(guó)家資產(chǎn)造成了巨大損失。
目前供電企業(yè)反竊電工作主要存在查證難、取證難、定量難的問(wèn)題,用檢人員在查證上往往無(wú)從入手。一方面電力營(yíng)銷中總供電量和總售電量之差稱為線損,往往與用戶竊電很容易混雜,另一方面竊電用戶越加狡猾,竊電手法更加隱蔽,不再局限于傳統(tǒng)的改接線路等方法,同時(shí)普通用檢人員由于理論與實(shí)踐上的約束,增加了反竊電管理難度。
本文主要通過(guò)選取歷史用戶用電行為數(shù)據(jù)(包括竊電數(shù)據(jù)實(shí)例),運(yùn)用機(jī)器學(xué)習(xí)算法對(duì)用戶竊電行為進(jìn)行有監(jiān)督學(xué)習(xí),形成用戶竊電分類模型,同時(shí)使用當(dāng)年用電檢查實(shí)際數(shù)據(jù)對(duì)模型進(jìn)行檢驗(yàn),分析模型識(shí)別準(zhǔn)確率,為實(shí)際用檢工作提供參考。
為了維護(hù)正常供用電秩序和公共安全,保護(hù)供用電雙方的合法權(quán)益,供電企業(yè)按照《電力供應(yīng)與使用條例》等法規(guī)履行用電檢查職責(zé),其中周期檢查和專項(xiàng)檢查是供電企業(yè)用電檢查的兩大手段,供電企業(yè)應(yīng)在每年第四季度編制出下一年度周期檢查計(jì)劃,在每月末要及時(shí)編制下月周期檢查計(jì)劃。對(duì)于0.4千伏及以下的居民客戶每年按不低于1%的比例進(jìn)行抽查,其他客戶每年按不低于5%的比例進(jìn)行抽查。對(duì)于客戶安全風(fēng)險(xiǎn)等級(jí)較高客戶應(yīng)縮短檢查周期。
供電企業(yè)用電檢查業(yè)務(wù)指導(dǎo)說(shuō)明書中明確指出:對(duì)于客戶線損異常、抄表異常、計(jì)量異常、業(yè)擴(kuò)變更異常、舉報(bào)、投訴、無(wú)檔案戶(黑戶)違竊電等情況,應(yīng)開(kāi)展專項(xiàng)檢查。歸納起來(lái),營(yíng)銷線損、電費(fèi)、計(jì)量、業(yè)擴(kuò)、客服、稽查等專業(yè)數(shù)據(jù)可作為用戶竊電預(yù)測(cè)信息來(lái)源。
將上述業(yè)務(wù)數(shù)據(jù)從時(shí)間維度上劃分,可分為靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)兩大類,靜態(tài)數(shù)據(jù)主要包括用戶編號(hào)、用戶名稱、用戶類別、電壓等級(jí)、信用等級(jí)、地區(qū)類型、行業(yè)類別、用電類型、用電性質(zhì)、用電容量、用電地址、計(jì)量點(diǎn)與用戶關(guān)聯(lián)關(guān)系、平均月電能量、平均月電費(fèi)、欠費(fèi)記錄、違約記錄、客戶投訴舉報(bào)記錄、現(xiàn)場(chǎng)檢查記錄等;動(dòng)態(tài)數(shù)據(jù)包括電表表碼數(shù)據(jù)、電壓數(shù)據(jù)、電流數(shù)據(jù)、相位角、臺(tái)區(qū)線損、線路線損、電能量差動(dòng)異常、電能表開(kāi)蓋、電能表停走、三相不平衡、電流過(guò)流、電壓斷相、電能表失壓、電能表失流、用電負(fù)荷、各行業(yè)類別平均用電情況等。
用戶竊電預(yù)測(cè)本質(zhì)上為分類問(wèn)題,即通過(guò)適當(dāng)?shù)哪P涂梢詫?shí)際的、未知的用戶用電行為數(shù)據(jù)進(jìn)行自動(dòng)分類(如正常、竊電兩類),同時(shí)分類過(guò)程要求可解釋性強(qiáng),便于用檢人員調(diào)查取證。
基于上述考慮,本文采用決策樹方法,其構(gòu)建思路如下:(1)給一個(gè)帶有類標(biāo)簽(正常/竊電)的樣本數(shù)據(jù)集;(2)選擇信息量大的屬性作為根結(jié)點(diǎn);(3)根據(jù)根結(jié)點(diǎn)屬性的取值對(duì)數(shù)據(jù)集進(jìn)行劃分,形成一個(gè)二叉(或多叉)樹;(4)根據(jù)分叉將數(shù)據(jù)又分成幾個(gè)數(shù)據(jù)集;(5)再遞歸用其余屬性對(duì)幾個(gè)數(shù)據(jù)集進(jìn)行劃分,直到分類屬性為止。
決策樹方法難點(diǎn)在于如何選擇屬性進(jìn)行分枝。決策樹中越靠近根節(jié)點(diǎn)的屬性,該屬性對(duì)分類的決定越重要,信息增益是屬性選擇的一個(gè)重要指標(biāo)(信息增益=信息熵-條件熵),屬性越重要,信息增益越大。
信息熵的計(jì)算公式如下:
其中的n代表有n個(gè)分類類別(本文n取2,即只有正常、竊電兩種情況)。分別計(jì)算這2類樣本在總樣本中出現(xiàn)的概率p1和p2,這樣就可以計(jì)算出未選中屬性分枝前的信息熵。
現(xiàn)在選中一個(gè)屬性xj(假定是電壓等級(jí)) 用來(lái)進(jìn)行分枝,此時(shí)分枝規(guī)則是:如果xj=vx(假定vx=0.4kV)的話,將樣本分到樹的一個(gè)分支;如果不相等則進(jìn)入另一個(gè)分支。很顯然,分支中的樣本很有可能包括2個(gè)類別(即0.4kV用戶中同時(shí)有正常和竊電兩種分類),分別計(jì)算這2個(gè)分支的熵H1和H2,計(jì)算出知道屬性xj之后的條件熵H’=p1*H1+p2*H2(此時(shí)p1表示0.4kV用戶在樣本中出現(xiàn)的概率,p2表示其他用戶出現(xiàn)的概率)。則此時(shí)的信息增益ΔH=H-H’。以信息增益為原則,把所有的屬性都計(jì)算一遍,選擇信息增益最大的屬性根節(jié)點(diǎn),以此類推直至分類屬性為止。
首先,通過(guò)帶有類別標(biāo)記的樣本集進(jìn)行機(jī)器學(xué)習(xí),由于樣本的標(biāo)記是人給定的,也稱有指導(dǎo)的學(xué)習(xí)。這個(gè)樣本集稱訓(xùn)練樣本集。訓(xùn)練樣本集的樣本典型(有代表性)量越多,學(xué)到的模型就會(huì)好。
為了測(cè)試模型的準(zhǔn)確性,可用一個(gè)測(cè)試樣本集測(cè)試分類器的準(zhǔn)確性,實(shí)際過(guò)程中可由用檢部門設(shè)定模型準(zhǔn)確度閥值,當(dāng)沒(méi)有達(dá)到閥值時(shí),可增加訓(xùn)練樣本集重新訓(xùn)練模型直至滿足要求為止。
對(duì)于實(shí)際用電檢查過(guò)程中,任意給定一個(gè)沒(méi)有標(biāo)記的實(shí)際數(shù)據(jù),用學(xué)到的模型對(duì)其進(jìn)行分類,即可給出其分類標(biāo)記。
用電檢查計(jì)劃制定過(guò)程中首要風(fēng)險(xiǎn)點(diǎn)在于遺漏檢查客戶,對(duì)于大客戶和重要客戶,目前只能采取定期檢查的手段(每半年至每?jī)赡隀z查一次);而對(duì)于數(shù)量龐大的0.4千伏及以下的居民客戶,只能按照1%的比例去抽取檢查對(duì)象,檢查的盲目性太大。
圖1 機(jī)器學(xué)習(xí)示意圖
運(yùn)用本文方法對(duì)用電客戶的竊電潛在行為進(jìn)行預(yù)測(cè),有針對(duì)性地根據(jù)概率安排用戶用檢順序,優(yōu)化班組工作計(jì)劃性,幫助供電用檢人員有針對(duì)性地開(kāi)展用戶檢查工作,提升用檢查處效率,同時(shí)也解決過(guò)去用檢工作查證難的問(wèn)題。
本文通過(guò)分析用戶用電相關(guān)特征及數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)決策樹方法,對(duì)竊電行為進(jìn)行科學(xué)的數(shù)學(xué)判斷,幫助工作人員及時(shí)發(fā)現(xiàn)用戶是否存在竊電行為,有效減少竊電行為給供電企業(yè)所帶來(lái)的經(jīng)濟(jì)損失,同時(shí)也能很好地避免因竊電、破壞電力設(shè)備行為造成的人身傷亡和電氣火災(zāi)事故,保障人民生命財(cái)產(chǎn)安全,減少用電糾紛。
[1]周瑾.國(guó)網(wǎng)江蘇電力應(yīng)用大數(shù)據(jù)分析精準(zhǔn)反竊電[J].國(guó)家電網(wǎng)報(bào),2017,5(第003版).
[2]鳳凰資訊.一年被竊電3000萬(wàn)元,2016年01月07日,http://news.ifeng.com/a/20160107/46971190_0.shtm l.
[3]吳毅良,基于Hadoop的竊電預(yù)測(cè)平臺(tái)研究[J].電氣工程與自動(dòng)化,2017(6).