張艷麗,牛任愷,張鑫磊,孫志杰,王利賽
(國網(wǎng)冀北電力有限公司營銷服務(wù)中心(資金集約中心、計量中心),北京 100032)
營銷稽查中心對供電局的深入開發(fā)與創(chuàng)新,已從傳統(tǒng)的智能化稽查、預(yù)檢預(yù)防、過程控制等工作,向市場稽查提出了更高的工作要求[1]。營銷系統(tǒng)聯(lián)機審計主要依靠省級企業(yè)的審計系統(tǒng),對整個銷售領(lǐng)域的數(shù)據(jù)進行核實,由于稽查規(guī)則更新滯后,導(dǎo)致稽查結(jié)果不夠準(zhǔn)確,并且對異常工單中存在的問題難易進行有效查找,影響被稽查單位異常問題的糾正效率,造成異常數(shù)據(jù)積壓過多[2]。以往,在市場推廣工作開展前,由計量專員下達紙質(zhì)工作單,現(xiàn)場人員將紙質(zhì)工單送到現(xiàn)場實施,儀器設(shè)備的資產(chǎn)號碼和邏輯地址被復(fù)制回現(xiàn)場,然后返回給儀器設(shè)備組的內(nèi)部人員,由工作人員輸入并調(diào)試終端信息[3]。這一營銷模式耗費大量人力物力,且效率極低。針對這一問題,提出基于序列標(biāo)注的業(yè)務(wù)異常工單判別方法。
使用注意力機制作為業(yè)務(wù)管控規(guī)則,其核心目標(biāo)是從大量的信息中選擇對于當(dāng)前任務(wù)目標(biāo)來說更重要的信息。注意力機制可應(yīng)用于數(shù)據(jù)(圖像、文本)處理,并對特定任務(wù)進行處理[4]。遠程監(jiān)測方法引入了噪聲數(shù)據(jù),在實體關(guān)系提取任務(wù)中,越來越多的實體關(guān)系提取模型中加入了注意力機制,以表征營銷業(yè)務(wù)情況[5]。在營銷業(yè)務(wù)實體關(guān)系抽取中使用的注意力機制層結(jié)構(gòu)如圖1 所示。
圖1 注意力機制層結(jié)構(gòu)圖
如圖1 所示,句子層次注意機制對句子集中的每一句都設(shè)定不同的權(quán)重,根據(jù)權(quán)重順序生成句子特征向量。在注意力層次上,句子被組織成為一組句子特征,由此完成注意力機制業(yè)務(wù)管控規(guī)則的設(shè)定[6]。
在業(yè)務(wù)管控規(guī)則注意力機制下,存在營銷業(yè)務(wù)工單存儲十分混亂、存儲規(guī)模龐大的問題,為了避免該問題產(chǎn)生,使用語義消歧中的柱狀搜索方法進行解碼[7-9]。觀察工單數(shù)據(jù)ot所對應(yīng)的狀態(tài)集合,在柱狀搜索解碼過程中,每一步都需要搜索狀態(tài)集合,該過程可描述為:
式(1)中,aij表示狀態(tài)轉(zhuǎn)移概率矩陣;bj表示狀態(tài)觀察概率矩陣。
該方法不僅有效解決了營銷業(yè)務(wù)工單存儲混亂問題,而且降低了解碼的復(fù)雜程度,有效地完成了知識融合[10-12]。
三元組是知識圖解的普遍表示,其基本形式主要是<實體1、關(guān)系、實體2>,可以使用這些屬性值描述實體內(nèi)部屬性[13]。知識圖譜中的實體稱為節(jié)點,節(jié)點之間的邊代表實體之間的關(guān)系,圖2 中描述了實體之間的聯(lián)系。
圖2 知識圖譜
由圖2 可知,在知識圖譜數(shù)據(jù)庫中輸入“Match(n:Marketing operations)where n.name=′Abnormal work order′ return n”這條語句,數(shù)據(jù)庫中收集了所有相關(guān)業(yè)務(wù)異常工單的信息[14]。返回結(jié)果中包含A1~An正常業(yè)務(wù)和B1~Bn異常業(yè)務(wù)相關(guān)的信息,實體圓之間通過實線連接,說明不同信息之間具有一定關(guān)聯(lián)關(guān)系[15]。
結(jié)合異常營銷業(yè)務(wù)中的每一信息屬性,通過注意力機制設(shè)定的業(yè)務(wù)管控規(guī)則,確定不同信息之間的原始關(guān)系,再借助融合后的知識,在營銷業(yè)務(wù)管控規(guī)則知識圖譜支持下,解析新增的稽查目標(biāo),快速輸出與稽查目標(biāo)相匹配的稽查主體和業(yè)務(wù)管控規(guī)則,提升稽查主體的創(chuàng)建維護管理效率[16]。稽查主體確定過程如圖3 所示。
圖3 稽查主體確定過程
在圖3 所示的稽查主體確定后,智能推薦稽查規(guī)則,如下所示:
根據(jù)不同的專業(yè)和業(yè)務(wù)類型,在建立問題庫關(guān)聯(lián)規(guī)則之前,應(yīng)該編寫審計規(guī)則。舉例來說,定義“業(yè)務(wù)擴展與報裝”專業(yè)為A,定義“業(yè)務(wù)擴展與報裝”下的“業(yè)務(wù)接受”專業(yè)為A1,定義“復(fù)制、檢查和抄核”專業(yè)為B,依此類推。在大數(shù)據(jù)審計中,關(guān)聯(lián)規(guī)則審計是主要形式之一,也是無監(jiān)督學(xué)習(xí)系統(tǒng)中最常見的知識發(fā)現(xiàn)方式之一。通過對審計中發(fā)現(xiàn)的問題進行收集、整理,利用關(guān)聯(lián)規(guī)則挖掘算法進行挖掘,找到問題之間隱藏的相關(guān)性。關(guān)聯(lián)規(guī)則挖掘相應(yīng)結(jié)果如下:
上述稽查規(guī)則關(guān)聯(lián)含義:在第1 條規(guī)則中,如果A11-01 出現(xiàn)異常問題,那么A13-01 也可能出現(xiàn)問題,該規(guī)則下的置信度為0.8;在第2 條規(guī)則中,如果A12-02 出現(xiàn)異常問題,那么A12-03、A21-01 都有可能出現(xiàn)問題,該規(guī)則下的置信度為0.6;在第3 條規(guī)則中,如果A12-02 出現(xiàn)異常問題,那么A21-01、A12-03 都有可能出現(xiàn)問題,該規(guī)則下的置信度為0.88。
在稽查次數(shù)多且發(fā)現(xiàn)問題較多的情況下,關(guān)聯(lián)挖掘規(guī)則的準(zhǔn)確性和判別結(jié)果的準(zhǔn)確性較高。因此,在一般情況下,選擇信任度和興趣度較高的規(guī)則作為異常工單判別方案的參考,以提高下一步的準(zhǔn)確性。
針對不同的稽查工單,提出稽查核實步驟和整改措施指引,輔助業(yè)務(wù)人員開展工作,從而實現(xiàn)業(yè)務(wù)管控支撐的智能化。
用電企業(yè)在新開電表時,應(yīng)對用戶電源線的接線情況進行詳細檢查,確保接線正確,還要注意儀表上是否有顯示數(shù)據(jù),數(shù)據(jù)是否合理,以消除卡滯和無顯示故障,確保新用戶安裝電表的合理性,進而保證用電的安全性與可控性。
對低電量用戶而言,企業(yè)應(yīng)著重審核、比較和測試實際用電量與低電量用戶的用電數(shù)據(jù),核對用戶用電量記錄,與此同時,也要檢查是否有作弊、改裝等偷電行為。對違反規(guī)定的現(xiàn)象,將責(zé)令其改正,并對其進行監(jiān)督。所以使用者一定要仔細檢查低功耗情況,以免違規(guī)。
契約審查是電力市場審計的重要內(nèi)容,在稽查監(jiān)督過程中,一定要仔細審查合同,核對合同資料,注意合同期限,為了有效地檢查用電時間,還要做好各部門的任務(wù)分配,做好電力銷售方式和銷售時間的檢查,因此,可確保電力市場監(jiān)測與監(jiān)管的有效開展。
基于深度學(xué)習(xí)技術(shù),智能解析稽查工單的原始信息和核實后的原因說明以及整改措施等反饋信息,判斷導(dǎo)致異常的原因類型,并標(biāo)記工單的問題原因標(biāo)簽,實現(xiàn)稽查工單智能研判。
構(gòu)建如圖4 所示的深度學(xué)習(xí)層次。
圖4 深度學(xué)習(xí)層次
從圖4 可以看出,利用5×5 卷積核生成斷層特征圖,計算了斷層特征圖的鄰域平均像素值,從而減小了特征圖的尺寸。下層采樣層的圖像特征由函數(shù)激活,神經(jīng)網(wǎng)絡(luò)的閾值函數(shù)為單遞增函數(shù)。采樣層中的一個圖作為一維向量輸入到連接層的神經(jīng)元中,利用軟件Softmax 函數(shù)對矢量進行標(biāo)準(zhǔn)化處理,突出最大值,抑制遠小于最大值的分量,從而完成正常和異常分類輸出。圖5 為稽工單智能研判過程。
圖5 稽查工單智能研判過程
由圖5 可知,異常工單判別結(jié)果比發(fā)現(xiàn)的問題更隱蔽,以往由于工作人員缺乏相關(guān)性分析、難以發(fā)現(xiàn)和驗證稽查過程存在的問題,常常成為稽查盲點。因此,需優(yōu)化稽查過程,對系統(tǒng)中的變更進行分析、審核,選擇關(guān)鍵變更并分發(fā)到業(yè)務(wù)部門。該工作指令將在部門的工作指令回應(yīng)后得到反饋和評估。基于上述假設(shè),在變更分析和篩選過程中,添加了關(guān)聯(lián)視圖環(huán)節(jié),有效提高了判別工作的效率和質(zhì)量。
為了驗證基于序列標(biāo)注的業(yè)務(wù)異常工單判別方法的合理性,進行實驗驗證分析。
實際用戶用電數(shù)據(jù)如圖6 所示。
圖6 實際用戶用電數(shù)據(jù)
由圖6 可知,在不同業(yè)務(wù)序列下,用電數(shù)據(jù)幅值呈3 個小周期波動,第一個周期的波動范圍是-0.2~2.0 Vpp,第二個周期的波動范圍是-0.2~0.5 Vpp,第三個周期的波動范圍是-0.2~0.25 Vpp。
根據(jù)實際數(shù)據(jù)集統(tǒng)計結(jié)果,利用人工稽查方法與基于序列標(biāo)注稽查方法對用戶用電數(shù)據(jù)稽查結(jié)果進行判別,并與實際數(shù)據(jù)對比,結(jié)果如圖7 所示。
圖7 不同方法用戶用電數(shù)據(jù)對比分析
由圖7 可知,使用基于序列標(biāo)注稽查方法在不同業(yè)務(wù)序列下,用電數(shù)據(jù)幅值呈3 個小周期波動,8個序列業(yè)務(wù)下的幅值波動范圍都為-0.2~2.0 Vpp。
為了進一步驗證基于序列標(biāo)注稽查方法判別業(yè)務(wù)異常工單更加精準(zhǔn),需對比不同方法異常工單判別結(jié)果,如表1 所示。
表1 不同方法異常工單判別準(zhǔn)確度對比分析
由表1 可知,使用人工稽查方法異常工單判別結(jié)果最高為0.65,基于序列標(biāo)注稽查方法判別結(jié)果最高為0.99,具有更高的判別準(zhǔn)確度。
使用基于序列標(biāo)注的業(yè)務(wù)異常工單判別方法規(guī)范現(xiàn)場作業(yè)流程,完善內(nèi)部服務(wù)信息管理,全面提升業(yè)務(wù)異常工單識別水平。使用該方法不僅提高了測量隊伍的工作效率和整體素質(zhì),而且工單作業(yè)誤差率明顯降低,工單作業(yè)處理時間縮短。該方法對于快速、準(zhǔn)確地定位故障用戶,縮短維修時間,避免經(jīng)濟損失具有重要意義。