萬(wàn) 龍,康徑竟,黃河滔
(云南電網(wǎng)有限責(zé)任公司 昭通供電局,云南 昭通 657100)
能源與電力發(fā)展事關(guān)國(guó)計(jì)民生,與經(jīng)濟(jì)社會(huì)存在廣泛緊密的聯(lián)系。推動(dòng)深度學(xué)習(xí)和實(shí)體經(jīng)濟(jì)深度融合,挖掘改進(jìn)深度學(xué)習(xí)的價(jià)值,對(duì)于助力新時(shí)代能源電力事業(yè)更好地服務(wù)經(jīng)濟(jì)社會(huì)發(fā)展具有重大意義。在我國(guó)經(jīng)濟(jì)發(fā)展水平日益向好、國(guó)民生活質(zhì)量日益改善的背景下,我國(guó)電力用戶的數(shù)量也在持續(xù)增加,與此同時(shí)用電量也出現(xiàn)明顯提升,在電力系統(tǒng)中電力業(yè)務(wù)所具有的重要意義和作用也逐漸突出,因此針對(duì)電力營(yíng)銷管理工作中所涉及到的電量管理工作的要求也愈發(fā)嚴(yán)格[1]。對(duì)電量管理工作而言,電費(fèi)以及電價(jià)的統(tǒng)計(jì)分析工作極為關(guān)鍵,在進(jìn)行電量管理工作時(shí)經(jīng)常會(huì)遇到電量異常等問題,借助優(yōu)化后的改進(jìn)深度學(xué)習(xí)方法,對(duì)于電力營(yíng)銷工作中所涉及到的異常數(shù)據(jù)加以識(shí)別判斷,可改善電力營(yíng)銷數(shù)據(jù)的準(zhǔn)確性和可靠度。
深度學(xué)習(xí)理論描述了學(xué)習(xí)樣本數(shù)據(jù)的表示層次及其內(nèi)在作用規(guī)律,在學(xué)習(xí)過(guò)程中所獲得的一切文字、聲音、圖像等信息參量,都具備較強(qiáng)的應(yīng)用處理能力。該項(xiàng)理論算法的最終實(shí)踐目標(biāo)是使機(jī)器人具備像人一樣的學(xué)習(xí)與分析能力,在準(zhǔn)確識(shí)別文字、聲音、圖像等數(shù)據(jù)信息的同時(shí),為各項(xiàng)理論參量賦予較強(qiáng)的計(jì)算與處理能力??傮w而言,深度學(xué)習(xí)是一種極為復(fù)雜的機(jī)器學(xué)習(xí)類應(yīng)用算法,在圖像及語(yǔ)音識(shí)別方面具有較為廣闊的應(yīng)用前景,遠(yuǎn)超數(shù)據(jù)挖掘、機(jī)器翻譯等其他類型的信息處理技術(shù)[2]。
深度學(xué)習(xí)在異常檢測(cè)方面展現(xiàn)出良好的性能,遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)常用于分析序列信息,長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)是RNN的一個(gè)分支,在自然語(yǔ)言處理等序列信息分析應(yīng)用中表現(xiàn)良好。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)為當(dāng)前應(yīng)用較多的深度學(xué)習(xí)理論中的研究模型之一,其標(biāo)準(zhǔn)結(jié)構(gòu)包括輸出層、全連接層、輸入層以及交替的卷積層、池化層等部分。為了保障民生,提高電網(wǎng)可靠性,有些學(xué)者已將深度學(xué)習(xí)引入電力行業(yè)進(jìn)行研究、探索[3]。
自動(dòng)編碼器(Auto Encoder,AE)在創(chuàng)建之初實(shí)際上是用于壓縮數(shù)據(jù),主要具有下述特點(diǎn):(1)與數(shù)據(jù)間具有密切聯(lián)系,即代表自動(dòng)編碼器,僅能夠?qū)陀?xùn)練數(shù)據(jù)較為類似的數(shù)據(jù)進(jìn)行壓縮處理;(2)通過(guò)該方法對(duì)數(shù)據(jù)進(jìn)行壓縮處理以后,會(huì)在一定程度上對(duì)數(shù)據(jù)產(chǎn)生損傷,這主要是由于在進(jìn)行降維處理時(shí)必然會(huì)丟失部分信息。
通過(guò)自動(dòng)編碼器能夠?qū)斎朐紨?shù)據(jù)所具有的一些隱蔽性特征進(jìn)行學(xué)習(xí),也就是編碼(Coding)。在對(duì)新特征進(jìn)行學(xué)習(xí)后,即可重新獲得原始輸入信息,這一過(guò)程也被稱之為解碼(Decoding)[4]。對(duì)自動(dòng)編碼器的工作情況進(jìn)行分析,其實(shí)際上和主成分分析(Principal Component Analysis,PCA)具有相似之處,但是性能卻得到顯著優(yōu)化,這主要是由于神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)的對(duì)一些新的數(shù)據(jù)和能力進(jìn)行學(xué)習(xí),因此能夠使得企業(yè)數(shù)據(jù)處理效率和質(zhì)量均得到顯著提高。在對(duì)自動(dòng)編碼器的工作原理和整體情況進(jìn)行深入分析后,能夠發(fā)現(xiàn)其實(shí)際上屬于無(wú)監(jiān)督式的深度學(xué)習(xí)模型,通過(guò)其能夠獲得多種多樣的訓(xùn)練樣本的新數(shù)據(jù)信息,所以從這一層面而言,其實(shí)際上也可以被劃分到生成算法模型的范疇中[5]。
對(duì)于RNN結(jié)構(gòu)進(jìn)行分析,該算法能夠?qū)Υ饲八斎氲母黜?xiàng)信息加以記憶,并在現(xiàn)有輸出信息中進(jìn)行應(yīng)用,所以對(duì)于數(shù)據(jù)序列類型的數(shù)據(jù)信息進(jìn)行計(jì)算時(shí)極為適用,而且將CNN算法和RNN算法聯(lián)合應(yīng)用可以很好地解決數(shù)據(jù)間的相關(guān)性問題。
基于改進(jìn)深度學(xué)習(xí)的電力營(yíng)銷異常數(shù)據(jù)檢測(cè)包含Caffe 深度學(xué)習(xí)框架構(gòu)建、電力營(yíng)銷數(shù)據(jù)清洗、異常檢測(cè)標(biāo)簽編碼3個(gè)處理步驟,具體執(zhí)行方法如下[6]。
Caffe深度學(xué)習(xí)框架是電力系統(tǒng)硬件執(zhí)行環(huán)境的搭建基礎(chǔ),由學(xué)習(xí)網(wǎng)絡(luò)本體、電網(wǎng)監(jiān)測(cè)主機(jī)、學(xué)習(xí)節(jié)點(diǎn)、異常數(shù)據(jù)集合等多個(gè)結(jié)構(gòu)共同組成。其中,學(xué)習(xí)網(wǎng)絡(luò)本體可提供電力系統(tǒng)運(yùn)行所需的電子量信息,并可借助數(shù)據(jù)傳輸通道反饋至下級(jí)應(yīng)用結(jié)構(gòu)之中。電網(wǎng)監(jiān)測(cè)主機(jī)起到承上啟下的物理連接作用,可在電量數(shù)據(jù)傳輸流的作用下,將異常數(shù)據(jù)平均分配至各級(jí)學(xué)習(xí)節(jié)點(diǎn)之中,從而較好地滿足電信息捕獲需求。異常數(shù)據(jù)集合位于Caffe深度學(xué)習(xí)框架底部,可有效整合各學(xué)習(xí)節(jié)點(diǎn)中的電力系統(tǒng)異常數(shù)據(jù),并將其轉(zhuǎn)換為既定格式的存儲(chǔ)應(yīng)用參量。Caffe深度學(xué)習(xí)框架結(jié)構(gòu)如圖1所示。
圖1 Caffe深度學(xué)習(xí)框架結(jié)構(gòu)
數(shù)據(jù)清洗轉(zhuǎn)換實(shí)際上就是對(duì)數(shù)據(jù)中存在的異常問題進(jìn)行處理解決,并對(duì)對(duì)象識(shí)別工作中所涉及到的不足之處進(jìn)行解決應(yīng)對(duì)的過(guò)程,通過(guò)傳統(tǒng)的人工數(shù)據(jù)處理方法僅能夠?qū)ι倭康臄?shù)據(jù)信息進(jìn)行處理,而且還存在費(fèi)時(shí)費(fèi)力、效率較低等問題,同時(shí)對(duì)專業(yè)水平要求高,本身還會(huì)出錯(cuò),不能滿足海量調(diào)度管理類及實(shí)時(shí)類數(shù)據(jù)清洗要求[7]?;诖耍_發(fā)出一種便捷高效快速的數(shù)據(jù)清理轉(zhuǎn)換方法,并且借助一定的設(shè)備或者儀器實(shí)現(xiàn)自動(dòng)化或者半自動(dòng)化的數(shù)據(jù)清洗工作具有重要意義,對(duì)于控制數(shù)據(jù)質(zhì)量也具有顯著積極影響。
一般情況下,在Caffe深度學(xué)習(xí)框架中,電力數(shù)據(jù)清洗結(jié)果受到常性化捕獲指標(biāo)χ的直接影響,若不考慮其他干預(yù)條件對(duì)最終計(jì)算結(jié)果的影響,常性化捕獲指標(biāo)數(shù)值越大,電力數(shù)據(jù)的清洗能力也就越強(qiáng),反之則越弱。圖2為電力數(shù)據(jù)清洗的過(guò)程。
圖2 電力數(shù)據(jù)清洗過(guò)程
異常檢測(cè)主要分為以下兩類。
(1)數(shù)據(jù)有標(biāo)簽。對(duì)于這樣的數(shù)據(jù),期望訓(xùn)練一個(gè)分類器,這個(gè)分類器除了要能告知正常數(shù)據(jù)的類別外,還要對(duì)于異常數(shù)據(jù)輸出其屬于“unknown”類,這個(gè)任務(wù)叫做Open-set Recognition[8]。
(2)數(shù)據(jù)無(wú)標(biāo)簽。這類數(shù)據(jù)分為兩種,一種是數(shù)據(jù)是干凈的(clean),也就是說(shuō)數(shù)據(jù)集中不包含異常數(shù)據(jù);另一種是數(shù)據(jù)是受污染的(polluted),數(shù)據(jù)集中包含少量的異常數(shù)據(jù)。其中,受污染的數(shù)據(jù)是更常見的情況。
通常情況下,電力系統(tǒng)異常數(shù)據(jù)中始終包含大量的類別特征參量,這些特征同時(shí)具備較強(qiáng)的標(biāo)簽編碼能力,然而仍有一部分捕獲節(jié)點(diǎn)需要對(duì)電力系統(tǒng)異常數(shù)據(jù)設(shè)置必要的判別條件,也就是異常檢測(cè)標(biāo)簽的編碼處理行為[7,8]。異常檢測(cè)標(biāo)簽編碼所能接收的電力系統(tǒng)數(shù)據(jù)必須保持有序存在狀態(tài),并要求其輸出行為必須為連續(xù)且規(guī)范的。按照既定表示形式,待編碼的數(shù)值并不能持續(xù)保持為有序狀態(tài),也就是Caffe 深度學(xué)習(xí)框架為其分配了一個(gè)數(shù)量值而已[9]。
自動(dòng)化協(xié)議棧能夠提供電力營(yíng)銷異常數(shù)據(jù)自動(dòng)捕獲所需的一切連接協(xié)議信息,應(yīng)用層、傳輸層、網(wǎng)絡(luò)層、鏈路層以及物理層結(jié)構(gòu)體同時(shí)位于電力系統(tǒng)以太網(wǎng)絡(luò)外端,能夠?yàn)镃affe深度學(xué)習(xí)框架提供良好的捕獲節(jié)點(diǎn)條件。一方面可提防異常數(shù)據(jù)對(duì)于電力營(yíng)銷主機(jī)的打擊與干擾行為;另一方面也可將異常數(shù)據(jù)信息整合成獨(dú)立的傳輸主體,大幅節(jié)省改進(jìn)深度學(xué)習(xí)網(wǎng)絡(luò)中的數(shù)據(jù)存儲(chǔ)空間。
異常數(shù)據(jù)拷貝可耗費(fèi)大量的CPU存儲(chǔ)空間,在自動(dòng)化協(xié)議棧多層架構(gòu)體系的作用下,該項(xiàng)處理行為可將電力系統(tǒng)異常數(shù)據(jù)的自動(dòng)捕獲時(shí)間縮短近50%。在電力系統(tǒng)異常數(shù)據(jù)傳輸速率水平保持為l0 Mb/s 的情況下,檢測(cè)標(biāo)簽編碼執(zhí)行速率可達(dá)到原有捕獲速率的一倍或幾倍。在此情況下,異常數(shù)據(jù)的拷貝與封裝行為都會(huì)對(duì)最終信息捕獲結(jié)果造成直接影響,數(shù)據(jù)傳輸量過(guò)大或過(guò)小,都會(huì)導(dǎo)致捕獲結(jié)果出現(xiàn)偏頗,從而影響改進(jìn)深度學(xué)習(xí)網(wǎng)絡(luò)的實(shí)際作用能力。
電力營(yíng)銷的內(nèi)核訪問用戶空間一般不會(huì)直接對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)開放,且在實(shí)際操作時(shí)也極易受捕獲節(jié)點(diǎn)所處位置的影響。因此,應(yīng)以電力營(yíng)銷異常數(shù)據(jù)的原始存在節(jié)點(diǎn)作為捕獲映射條件的初級(jí)建立依據(jù),以自動(dòng)化捕獲節(jié)點(diǎn)的終止存在位置作為捕獲映射條件的終極建立依據(jù),兩相結(jié)合在深度學(xué)習(xí)網(wǎng)絡(luò)中實(shí)現(xiàn)電力系統(tǒng)異常數(shù)據(jù)捕獲映射條件的順利應(yīng)用。
營(yíng)銷數(shù)據(jù)審核過(guò)程中,核算員需要依據(jù)電力營(yíng)銷應(yīng)用系統(tǒng)中電量電費(fèi)審核條件篩選出來(lái)的異常用戶進(jìn)行審核過(guò)濾。作為電量電費(fèi)審核的輔助工具,審核條件的完善及準(zhǔn)確性對(duì)審核工作質(zhì)量起著十分重要的作用。改進(jìn)深度學(xué)習(xí)模型需要進(jìn)行實(shí)際的訓(xùn)練,通過(guò)大量數(shù)據(jù)來(lái)提高它的準(zhǔn)確性和智能性。深度學(xué)習(xí)實(shí)際上就是借助建立涉及到多個(gè)隱藏層的機(jī)器學(xué)習(xí)模型,通過(guò)大量的訓(xùn)練數(shù)據(jù)進(jìn)行反復(fù)的學(xué)習(xí),從中提取到數(shù)據(jù)的有用特征,進(jìn)而使得預(yù)測(cè)或者分類工作準(zhǔn)確性得到有效提升的一種方法。深度模型實(shí)際上是一種方式、一種手段,而特征學(xué)習(xí)才是其目的。在深度學(xué)習(xí)算法中,對(duì)于模型結(jié)構(gòu)的深度極為重視,同時(shí)對(duì)于特征學(xué)習(xí)所具有的重要意義進(jìn)行了著重表現(xiàn),借助逐層的特征變化使得樣本在原本空間中所具有的特征進(jìn)行處理,以一個(gè)新的空間特征加以表示,進(jìn)而降低預(yù)測(cè)或者分類工作的難度[10]。相較于人工規(guī)則構(gòu)造特征算法而言,借助大數(shù)據(jù)進(jìn)行課程學(xué)習(xí),可以對(duì)數(shù)據(jù)所蘊(yùn)含的大量?jī)?nèi)在信息進(jìn)行更加準(zhǔn)確可靠的體現(xiàn)。
在僅能夠提供有限的數(shù)據(jù)的情況下,深度學(xué)習(xí)算法無(wú)法實(shí)現(xiàn)對(duì)數(shù)據(jù)中所包含規(guī)律的無(wú)偏差估計(jì),所以為顯著提高算法的精度,必須給予充足的數(shù)據(jù)支持。因?yàn)樯疃葘W(xué)習(xí)中圖模型的復(fù)雜化,所以使得算法的時(shí)間和復(fù)雜程度大大提高,想要切實(shí)保證算法的實(shí)時(shí)性,還需要進(jìn)一步優(yōu)化改善硬件設(shè)備和編程技能。
在改進(jìn)深度學(xué)習(xí)網(wǎng)絡(luò)的作用下,電力營(yíng)銷異常數(shù)據(jù)自動(dòng)捕獲方法可聯(lián)合Caffe框架,在清洗電力數(shù)據(jù)信息的同時(shí),對(duì)異常檢測(cè)標(biāo)簽節(jié)點(diǎn)進(jìn)行編碼處理,且由于自動(dòng)化協(xié)議棧多層架構(gòu)體系的存在,待拷貝異常數(shù)據(jù)能夠與最終信息捕獲結(jié)果建立一一對(duì)應(yīng)的捕獲映射條件,不僅能夠較好穩(wěn)定已連接的電網(wǎng)應(yīng)用環(huán)境,也可實(shí)現(xiàn)對(duì)異常傳輸電子量的精確化處理,具備較強(qiáng)的應(yīng)用可行性。