侯昝宇,周良柱
(國網(wǎng)遼寧省電力有限公司, 遼寧, 沈陽 110006)
電價(jià)遠(yuǎn)程下裝是智能電表實(shí)現(xiàn)實(shí)時(shí)費(fèi)控的重要技術(shù)途徑,且在2010年開始在國內(nèi)部分城市實(shí)現(xiàn)智能電表實(shí)時(shí)費(fèi)控試點(diǎn)工作以來,至今國內(nèi)絕大部分城市的城鄉(xiāng)家用電表均實(shí)現(xiàn)了電價(jià)下裝工作。但是,因?yàn)殡妰r(jià)下裝增加了抄核收系統(tǒng)的復(fù)雜性,容易帶來諸多計(jì)費(fèi)偏差,如故障計(jì)費(fèi)產(chǎn)生零電費(fèi)、疊加計(jì)費(fèi)導(dǎo)致電費(fèi)重復(fù)計(jì)算等。但絕大多數(shù)地市級供電公司均需要提供數(shù)十萬甚至上百萬家用電表計(jì)費(fèi)服務(wù),如果采用人工審計(jì)排查,很難在有效時(shí)間發(fā)現(xiàn)故障個(gè)案問題,所以在全面電價(jià)遠(yuǎn)程下裝環(huán)境下,通過人工智能實(shí)現(xiàn)對電價(jià)遠(yuǎn)程下裝后的計(jì)費(fèi)問題進(jìn)行時(shí)效性預(yù)警,成為當(dāng)前電力大營銷中抄核收大數(shù)據(jù)審計(jì)技術(shù)提升的重要研究創(chuàng)新點(diǎn)。
因?yàn)殡妰r(jià)下裝可采用費(fèi)率下裝和階梯下裝等不同技術(shù)路徑,且多數(shù)供電公司在早期實(shí)驗(yàn)性操作中在不同階段嘗試了不同的技術(shù)路徑,在并網(wǎng)運(yùn)行過程中,如果存在個(gè)別區(qū)域未能做出及時(shí)技術(shù)調(diào)整的問題,則可能產(chǎn)生系統(tǒng)兼容性問題。系統(tǒng)兼容性問題容易造成電價(jià)下裝的大面積故障,但也合并個(gè)別電表重置或其他故障、遠(yuǎn)程抄表數(shù)據(jù)干擾等個(gè)別故障問題。所以,該研究的核心創(chuàng)新點(diǎn)是采用同一套電費(fèi)大數(shù)據(jù)審計(jì)系統(tǒng)實(shí)現(xiàn)對電價(jià)下裝問題的全面審計(jì)并作出預(yù)警。
基于“電費(fèi)=費(fèi)率×當(dāng)期電量”的基本電費(fèi)計(jì)算規(guī)則,如果費(fèi)率一致,則當(dāng)期電量與電費(fèi)之間是嚴(yán)格的正比關(guān)系。電價(jià)下裝后,因?yàn)橐?jì)算尖時(shí)、峰時(shí)、平時(shí)、谷時(shí)的不同費(fèi)率條件下的分時(shí)電價(jià),且供電公司轄區(qū)內(nèi)的城市用電、鄉(xiāng)村用電、重點(diǎn)區(qū)域用電、小規(guī)模工業(yè)用電、商業(yè)用電、特殊行業(yè)商戶用電等均有不同的分時(shí)電價(jià)費(fèi)率,所以采用傳統(tǒng)差值離群分析算法時(shí),需要將所有用戶根據(jù)其執(zhí)行費(fèi)率不同而進(jìn)行嚴(yán)格劃分。這一審計(jì)方案反而進(jìn)一步增加了電費(fèi)管理的復(fù)雜度,帶來額外計(jì)費(fèi)問題隱患。
此時(shí)對差值離群算法的工作流進(jìn)行分析,見圖1。
圖1中,分別對不同用戶類型的所有用戶分別重新驗(yàn)算其計(jì)費(fèi)情況,將不同分時(shí)分段的電費(fèi)量與用電量求取比值,得到費(fèi)率,考察費(fèi)率是否與該用戶所屬的費(fèi)率相符。該算法在理論上只要計(jì)算機(jī)系統(tǒng)算力可以達(dá)到要求,即可在規(guī)定時(shí)間內(nèi)精準(zhǔn)選擇出問題用戶。但此算法有諸多問題無法解決:
圖1 差值離群審計(jì)算法工作流圖
1) 用電用戶的類型需要手動(dòng)歸類,或從客戶信息管理系統(tǒng)中讀取用戶類型,該類型在客戶信息管理系統(tǒng)中也為手動(dòng)輸入,其用戶類型的信度存疑;
2) 用戶的計(jì)費(fèi)分時(shí)策略并非一成不變,部分城市的尖時(shí)計(jì)量區(qū)間僅在夏季和冬季用電高峰期有效,其他時(shí)間并入峰時(shí)管理。在用電策略變更過程中,是電費(fèi)下裝問題出現(xiàn)的高峰期。
綜上,該電費(fèi)審計(jì)方案的可靠性與電費(fèi)下裝工作的可靠性存在同步性,問題是存在同源性,對電費(fèi)下裝過程可能出現(xiàn)的問題發(fā)現(xiàn)能力受到工作流的先天不足影響,較難發(fā)揮電費(fèi)大數(shù)據(jù)審計(jì)的效能。
在電費(fèi)大數(shù)據(jù)審計(jì)過程中建立一種脫離電費(fèi)下裝基礎(chǔ)數(shù)據(jù)的工作模式,此時(shí)引入卷積神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)技術(shù),實(shí)現(xiàn)無視下裝基礎(chǔ)數(shù)據(jù)的電費(fèi)大數(shù)據(jù)審計(jì)工作模式,是該研究的創(chuàng)新點(diǎn)。
電費(fèi)大數(shù)據(jù)審計(jì)的核心數(shù)據(jù)資源,為各電能表的各期電量數(shù)據(jù)和各期電費(fèi)計(jì)量結(jié)果數(shù)據(jù),通過此兩項(xiàng)數(shù)據(jù),可以計(jì)算出特定用戶的分時(shí)電價(jià)計(jì)費(fèi)標(biāo)準(zhǔn),傳統(tǒng)模式下,直接使用k-means算法可以提取離群數(shù)據(jù)進(jìn)行分析,但在機(jī)器學(xué)習(xí)視角下,可以直接跳過k-means分析階段,直接對此兩項(xiàng)數(shù)據(jù)進(jìn)行卷積,將問題數(shù)據(jù)進(jìn)行分類。
該輸入輸出模式如圖2。
圖2 機(jī)器學(xué)習(xí)模塊輸入輸出模式示意圖
圖2中對特定用戶(以電表號(hào)計(jì))當(dāng)月分時(shí)電量數(shù)據(jù)和分時(shí)電費(fèi)數(shù)據(jù)作為輸入數(shù)據(jù),最終輸出4個(gè)二值化數(shù)據(jù)。輸出數(shù)據(jù)包括電費(fèi)下裝問題標(biāo)志(接近0.000時(shí)認(rèn)為正常,接近1.000時(shí)發(fā)出預(yù)警),計(jì)量兼容下裝問題標(biāo)志、電表設(shè)備故障問題標(biāo)志、其他問題標(biāo)志(以上3種標(biāo)志均為接近0.000時(shí)認(rèn)為正常,接近1.000時(shí)發(fā)出預(yù)警),此時(shí),后3個(gè)預(yù)警標(biāo)志需要在第1個(gè)預(yù)警標(biāo)志為真值時(shí)有效,且第1個(gè)預(yù)警標(biāo)志出現(xiàn)時(shí),后3個(gè)預(yù)警標(biāo)志需要有且只有1個(gè)為真時(shí)有效。其輸出結(jié)構(gòu)如表1。
表1 預(yù)警輸出結(jié)果含義表
表1中,4個(gè)二值化輸出變量共有4種有效表達(dá),而其可能輸出結(jié)果包括16種,包括下裝問題標(biāo)志為1時(shí)的1000、1110、1011、1101表達(dá)均為無效表達(dá),下裝問題表達(dá)為0時(shí),所有不為0000的表達(dá)均為無效表達(dá)。數(shù)據(jù)訓(xùn)練過程中,可通過判斷無效表達(dá)出現(xiàn)概率對神經(jīng)網(wǎng)絡(luò)的收斂程度進(jìn)行判斷。
數(shù)據(jù)輸入過程中,因?yàn)殡娰M(fèi)數(shù)據(jù)和電量數(shù)據(jù)存在量綱異構(gòu)特征,所以需要對其進(jìn)行重投影去量綱計(jì)算,采用Z-score法進(jìn)行數(shù)據(jù)整理,整理數(shù)據(jù)集為該月輸入的4個(gè)電量數(shù)據(jù)和4個(gè)電費(fèi)數(shù)據(jù)分別進(jìn)行Z-score計(jì)算,計(jì)算函數(shù)如式(1):
(1)
(2)
式中,N為該列輸入量最大下標(biāo),此處N=4。σ為4個(gè)輸入量的標(biāo)準(zhǔn)偏差率,如式(3):
(3)
經(jīng)過Z-score初步處理的2組各4個(gè)輸入項(xiàng),組成8個(gè)輸入項(xiàng)輸入到多列卷積神經(jīng)網(wǎng)絡(luò)中,形成相對獨(dú)立的4個(gè)卷積+二值化模塊,最終通過輸出模塊將二值化數(shù)據(jù)治理成邏輯數(shù)據(jù),該數(shù)據(jù)流詳見圖3。
圖3中,每個(gè)卷積模塊均等價(jià)讀入8個(gè)輸入變量,輸出1個(gè)雙精度浮點(diǎn)型變量進(jìn)入二值化模塊,經(jīng)過二值化輸出的1個(gè)雙精度浮點(diǎn)變量經(jīng)過輸出模塊治理后形成預(yù)警標(biāo)志,4個(gè)預(yù)警標(biāo)志按照前文的解釋方式進(jìn)行解釋形成最終預(yù)警結(jié)果。
4個(gè)卷積模塊結(jié)構(gòu)相同,但在訓(xùn)練中的收斂方向不同。其統(tǒng)計(jì)學(xué)意義在于將8個(gè)雙精度浮點(diǎn)變量卷積為1個(gè)雙精度浮點(diǎn)變量,其間的數(shù)據(jù)信息量損失較小,所以可以采用3層隱藏層(7節(jié)點(diǎn)、5節(jié)點(diǎn)、3節(jié)點(diǎn))進(jìn)行節(jié)點(diǎn)設(shè)計(jì),節(jié)點(diǎn)函數(shù)采用細(xì)節(jié)放大率較高的對數(shù)回歸函數(shù)進(jìn)行節(jié)點(diǎn)設(shè)計(jì)。其基函數(shù)可寫作式(4):
圖3 多列卷積神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)流圖
(4)
式中,Xi為第i個(gè)輸入項(xiàng),Y為節(jié)點(diǎn)輸出項(xiàng),e為自然常數(shù),A、B為待回歸系數(shù);
4個(gè)二值化模塊結(jié)構(gòu)相同,但在訓(xùn)練中的收斂方向不同。其統(tǒng)計(jì)學(xué)意義是將卷積模塊輸出的1個(gè)雙精度浮點(diǎn)變量進(jìn)行二值化處理,使其投影位置更貼近1.000或0.000。所以用經(jīng)典二值化函數(shù)作為節(jié)點(diǎn)函數(shù),隱藏層3層,分別為3節(jié)點(diǎn)、7節(jié)點(diǎn)、3節(jié)點(diǎn)。其基函數(shù)可寫作式(5):
(5)
4個(gè)輸出模塊結(jié)構(gòu)相同,且不含有神經(jīng)網(wǎng)絡(luò)計(jì)算,其本質(zhì)是根據(jù)二值化輸出模塊的輸出數(shù)據(jù)進(jìn)行數(shù)據(jù)強(qiáng)制轉(zhuǎn)化,形成邏輯輸出變量。其邏輯轉(zhuǎn)化過程可寫作式(6):
(6)
輸出模塊僅在輸出結(jié)果大于0.950和小于0.050時(shí)輸出邏輯型結(jié)果,當(dāng)其落點(diǎn)在0.050和0.950之間時(shí),系統(tǒng)報(bào)錯(cuò)。與上述輸出解釋模塊的報(bào)錯(cuò)機(jī)制相同,該報(bào)錯(cuò)也可以作為神經(jīng)網(wǎng)絡(luò)充分訓(xùn)練收斂的標(biāo)志。
在電力CAE(computer aided engineering,CAE)系統(tǒng)中加載SimuWorks組件,構(gòu)建2組隨機(jī)電費(fèi)數(shù)據(jù),每組數(shù)據(jù)共設(shè)計(jì)20萬組,其中A組設(shè)置1 000組問題數(shù)據(jù),并將問題原因進(jìn)行標(biāo)注,作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù),B組設(shè)置200組問題數(shù)據(jù),并將問題原因進(jìn)行標(biāo)注,作為神經(jīng)網(wǎng)絡(luò)的驗(yàn)證數(shù)據(jù)。在上述試驗(yàn)平臺(tái)和試驗(yàn)數(shù)據(jù)支持下,對該預(yù)警系統(tǒng)進(jìn)行訓(xùn)練,測試其數(shù)據(jù)訓(xùn)練量與收斂程度的關(guān)系。收斂程度按照每萬次系統(tǒng)報(bào)錯(cuò)次數(shù)進(jìn)行標(biāo)定,當(dāng)萬次測試數(shù)據(jù)運(yùn)行報(bào)錯(cuò)次數(shù)為0時(shí),認(rèn)為神經(jīng)網(wǎng)絡(luò)充分收斂。其實(shí)際訓(xùn)練過程如圖4所示。
圖4 神經(jīng)網(wǎng)絡(luò)訓(xùn)練收斂效率
圖4中,當(dāng)訓(xùn)練量達(dá)到10萬次之前,系統(tǒng)迅速收斂,訓(xùn)練至17萬次之后,萬次驗(yàn)證報(bào)錯(cuò)率穩(wěn)定到0,標(biāo)志著該系統(tǒng)針對電價(jià)下裝的評價(jià)任務(wù),具有較強(qiáng)的收斂特性,可以進(jìn)行后續(xù)評價(jià)效率驗(yàn)證試驗(yàn)。
在上述驗(yàn)證用B組數(shù)據(jù)下,使用傳統(tǒng)的差值離群分析算法和該研究革新的神經(jīng)網(wǎng)絡(luò)算法進(jìn)行比較分析,驗(yàn)證其敏感性和特異性,分析其綜合準(zhǔn)確率,可以得到表2。
表2 算法效能比較結(jié)果表
表2中,真陽性指下裝問題電表中被判斷為問題電表的數(shù)量,假陽性為無問題電表被判斷為問題電表的數(shù)量,真陰性為無問題電表被認(rèn)定為無問題電表的數(shù)量,假陰性為問題電表中被認(rèn)定為無問題電表的數(shù)量,敏感性為判斷為問題電表的總量中確實(shí)為問題電表的比例,特異性為判斷為無問題電表中確實(shí)為無問題電表的比例,準(zhǔn)確率為問題電表中被判斷為問題電表的比例。對上述7個(gè)判斷結(jié)果使用SPSS24.0進(jìn)行雙樣本t校驗(yàn),當(dāng)t<10.000時(shí)認(rèn)為數(shù)據(jù)存在統(tǒng)計(jì)學(xué)差異,同時(shí)讀取其log值,作為信度標(biāo)志P值,當(dāng)P<0.05時(shí)認(rèn)為結(jié)果在信度空間內(nèi),當(dāng)P<0.01時(shí)認(rèn)為結(jié)果存在顯著的統(tǒng)計(jì)學(xué)意義。
表2數(shù)據(jù)表明,受到樣本中陰性數(shù)據(jù)總量與陽性數(shù)據(jù)總量的比值影響,該結(jié)果數(shù)據(jù)的特異性并無統(tǒng)計(jì)學(xué)差異(t>10.000,P<0.05),但革新方法敏感性達(dá)到傳統(tǒng)方法的1.86倍,且具有顯著的統(tǒng)計(jì)學(xué)差異(t<10.000,P<0.01),革新方法準(zhǔn)確率也顯著超過傳統(tǒng)方法(t<10.000,P<0.01)。所以可以認(rèn)為,采用多列卷積神經(jīng)網(wǎng)絡(luò)對電價(jià)下裝成功率進(jìn)行評價(jià),其算法效能顯著超過傳統(tǒng)大數(shù)據(jù)審計(jì)方法。
另外,革新技術(shù)還存在以下優(yōu)勢:
第一,革新技術(shù)條件下,完全排除了傳統(tǒng)方法下因?yàn)閿?shù)據(jù)同源性導(dǎo)致大數(shù)據(jù)審計(jì)過程和電費(fèi)核算過程出現(xiàn)相同錯(cuò)誤的可能性,這是其敏感性大幅度提升的重要原因;
第二,革新技術(shù)可以直接精確給出電價(jià)下裝的常見問題類型,該研究中已經(jīng)給出最常見的電表故障問題和電價(jià)下裝設(shè)置問題,且將其他問題也給出標(biāo)記,在傳統(tǒng)方案下僅可發(fā)現(xiàn)電價(jià)下裝問題,而無法在審計(jì)過程中給出下裝問題原因;
第三,本技術(shù)通過基于多列卷積神經(jīng)網(wǎng)絡(luò)的電費(fèi)審計(jì)方法,較傳統(tǒng)電費(fèi)審計(jì)方法,復(fù)雜度顯著降低,算法更加精準(zhǔn)。
綜上分析,電價(jià)下裝問題一般為系統(tǒng)兼容性問題,在進(jìn)行電費(fèi)大數(shù)據(jù)審計(jì)師,也可能因?yàn)閷徲?jì)工作的數(shù)據(jù)來源兼容性問題導(dǎo)致無法發(fā)現(xiàn)電價(jià)下裝的相應(yīng)問題,該研究產(chǎn)生的革新成果,拋開原始配置數(shù)據(jù),直接對電費(fèi)計(jì)量結(jié)果數(shù)據(jù)進(jìn)行大數(shù)據(jù)審計(jì),從而實(shí)現(xiàn)更高的判斷敏感性和更高的判斷準(zhǔn)確率,同時(shí)給出電價(jià)下裝問題的常見原因判斷結(jié)果。當(dāng)然,該研究成果雖然準(zhǔn)確率達(dá)到了99.9%,但其實(shí)際敏感度僅有95.7%,說明其在特異性方面仍有提升空間,即其存在一定比例的假陰性結(jié)果。所以,在后續(xù)研究中,應(yīng)從增加神經(jīng)網(wǎng)絡(luò)復(fù)雜度和卷積程度等方面進(jìn)行持續(xù)革新研究,以提供更高敏感度的電費(fèi)大數(shù)據(jù)審計(jì)算法。