鄒賢求
(國網(wǎng)湖南省電力有限公司婁底供電分公司)
利用用電信息采集系統(tǒng)可以通過遠(yuǎn)程方式對相關(guān)計(jì)量點(diǎn)的數(shù)據(jù)信息進(jìn)行采集[1],截至目前已經(jīng)在我國幾億只電能計(jì)量器上得到應(yīng)用。對于采集得到的電壓、功率、電流等數(shù)據(jù)信息可以上傳至系統(tǒng)站中,利用大數(shù)據(jù)分析技術(shù)進(jìn)行處理,以便及時掌握電表的運(yùn)行狀態(tài),發(fā)現(xiàn)存在的問題[2]。由于大量的電表在應(yīng)用過程中,受到各類環(huán)境因素影響,難免出現(xiàn)故障問題,通過數(shù)據(jù)分析可以及時發(fā)現(xiàn)計(jì)量異?,F(xiàn)象,不需要利用傳統(tǒng)的人工方式進(jìn)行排查,能顯著提升工作質(zhì)量和效率,為電力企業(yè)的經(jīng)濟(jì)效益提供堅(jiān)實(shí)的保障[3]。本研究利用長短期記憶網(wǎng)絡(luò)(LSTM)模型,對用電信息系統(tǒng)采集的數(shù)據(jù)信息進(jìn)行深度挖掘分析,可以及時發(fā)現(xiàn)計(jì)量異?,F(xiàn)象。通過實(shí)踐測試發(fā)現(xiàn)其具有良好的效果,值得進(jìn)一步推廣應(yīng)用。
我國當(dāng)前使用的電表通常為智能電表,電表采集得到的電壓、電流、功率,包括有功功率和無功功率,及其隨時間的演變情況等信息,能夠很好地反映出智能電表的實(shí)際工作狀態(tài)[4]。利用用電信息采集系統(tǒng)對智能電表的上述信息進(jìn)行采集,基于先進(jìn)的數(shù)據(jù)分析技術(shù)進(jìn)行處理,可以及時發(fā)現(xiàn)電表計(jì)量過程中存在的異常問題。一般情況下表計(jì)異常點(diǎn)比較隱蔽,且會持續(xù)比較長的時間,實(shí)踐過程中發(fā)現(xiàn)表計(jì)異常點(diǎn)主要表現(xiàn)為三種形式,分別為數(shù)據(jù)偏大、數(shù)據(jù)偏小、數(shù)據(jù)持續(xù)缺失。如果存在數(shù)據(jù)缺失問題,在數(shù)據(jù)預(yù)處理階段就可以發(fā)現(xiàn)。針對其他問題則需要進(jìn)行深入的數(shù)據(jù)挖掘分析,不同用戶的用電行為特征與大小存在很大差異,所以需要基于系統(tǒng)采集的數(shù)據(jù)信息進(jìn)行深度的數(shù)據(jù)挖掘與甄別,才能發(fā)現(xiàn)用戶的用電行為異?,F(xiàn)象。
如果表計(jì)數(shù)據(jù)信息出現(xiàn)持續(xù)性的數(shù)據(jù)偏小或者偏大,而沒有按照正常的規(guī)律變化,那么可以根據(jù)數(shù)據(jù)庫中存儲的此類異常點(diǎn)之前的數(shù)據(jù)信息進(jìn)行數(shù)據(jù)分析,很快就可以確定異常點(diǎn)的開始時間[5]。如果數(shù)據(jù)庫中沒有存儲足夠的數(shù)據(jù)信息,那么將很難查找到異常點(diǎn)開始時間,此時就需要利用電力模型確定異常點(diǎn)開始時間,比如對線損率進(jìn)行排查計(jì)算,但這類方法需要依賴很多的數(shù)據(jù)信息,計(jì)算量和工作量很大,工作質(zhì)量和效率不高。本文基于長短期記憶網(wǎng)絡(luò)(LSTM)模型進(jìn)行數(shù)據(jù)挖掘分析,能夠快速的確定表計(jì)數(shù)據(jù)的異常情況,效率較高。
本研究利用深度學(xué)習(xí)算法對用電信息采集系統(tǒng)收集得到的數(shù)據(jù)信息進(jìn)行挖掘分析,判斷存在的電表計(jì)量異常問題,具體為長短期記憶網(wǎng)絡(luò)(LSTM)模型。利用深度學(xué)習(xí)算法時需要利用已有的數(shù)據(jù)信息對模型進(jìn)行訓(xùn)練與驗(yàn)證,然后可以利用該模型對電力用戶未來的電流、電壓以及功率等數(shù)據(jù)進(jìn)行準(zhǔn)確預(yù)測,基于預(yù)測結(jié)果設(shè)置一個置信區(qū)間。如果實(shí)際結(jié)果正好處在置信區(qū)間范圍以內(nèi),則認(rèn)為不存在異常問題。相反的,如果實(shí)際結(jié)果不處在置信區(qū)間范圍以內(nèi),則認(rèn)為實(shí)際結(jié)果與預(yù)測結(jié)果之間存在明顯的偏差,可以認(rèn)定對應(yīng)的采集點(diǎn)存在數(shù)據(jù)計(jì)量異常問題。下文將對LSTM模型進(jìn)行深入介紹,基于該模型可以對電壓、電流、功率等常見的電參數(shù)的異常點(diǎn)進(jìn)行有效甄別。模型需要輸入的是電流、電壓或者功率的歷史數(shù)據(jù)信息,模型輸出的是下一個采集點(diǎn)的置信區(qū)間,并將實(shí)際結(jié)果與置信區(qū)間進(jìn)行對比,判斷是否存在異常問題。
整個LSTM模型可以劃分成為不同的結(jié)構(gòu),每個結(jié)構(gòu)均具有對應(yīng)的功能,所有功能結(jié)合起來就可以實(shí)現(xiàn)電流、電壓、功率結(jié)果的預(yù)測與分析。具體包括遺忘門結(jié)構(gòu)、輸入門結(jié)構(gòu)、當(dāng)前輸入單元狀態(tài)、當(dāng)前時刻單元狀態(tài)、輸出門的計(jì)算結(jié)構(gòu)等。以下對各結(jié)構(gòu)或狀態(tài)的情況進(jìn)行簡要介紹。
對于遺忘門結(jié)構(gòu)的計(jì)算過程可以利用式(1)表示:
式中,Wf為遺忘門結(jié)構(gòu)的權(quán)重矩陣;bf為遺忘門結(jié)構(gòu)的偏置矩陣;[ht-1,xt]表示將括號內(nèi)的兩個量進(jìn)行拼接,ht-1、xt分別表示LSTM模型前一時刻的輸出以及當(dāng)前時刻的輸入情況;σf表示遺忘門激活函數(shù)。
對于輸入門結(jié)構(gòu)的計(jì)算過程可以利用式(2)表示:
式中,σi表示輸入門的激活函數(shù);Wi為輸入門結(jié)構(gòu)的權(quán)重矩陣;bi為輸入門結(jié)構(gòu)的偏置矩陣。
利用c′表示當(dāng)前時刻輸入的單元狀態(tài),具體操作時可以利用式(3)進(jìn)行計(jì)算:
式中,Wc為該單元的權(quán)重矩陣;bc為該單元的偏置矩陣。
利用ct表示當(dāng)前時刻的單元狀態(tài),該狀態(tài)主要由兩部分構(gòu)成:第一是基于前一時刻的單元狀態(tài)ct-1獲得,具體是ct-1與遺忘門ft相乘;第二是基于當(dāng)前輸入單元的狀態(tài)獲得,具體是c′t與輸入門it相乘。具體計(jì)算過程可按式(4)進(jìn)行:
式中,符號“?”表示根據(jù)元素進(jìn)行相乘。根據(jù)以上公式,LSTM模型可以把當(dāng)前記憶c′t和長期記憶ct-1進(jìn)行有效結(jié)合,最終構(gòu)建出新單元狀態(tài)ct。
輸出門的計(jì)算過程可以按式(5)進(jìn)行處理:
式中,σo表示輸出門的激活函數(shù);Wo表示輸出門的權(quán)重矩陣;bo表示輸出門的偏執(zhí)矩陣。
利用LSTM模型對功率大小實(shí)施預(yù)測,可以得到待測時間點(diǎn)功率大小的概率預(yù)測置信區(qū)間范圍。主要的網(wǎng)絡(luò)模型結(jié)構(gòu)參數(shù)如下:循環(huán)神經(jīng)網(wǎng)絡(luò)為4層,包括輸入層、LSTM層、普通隱含層、輸出層,其中輸入層為96×1序列輸入,LSTM層和隱含層分別設(shè)置有8個節(jié)點(diǎn)和4個節(jié)點(diǎn),輸出層的節(jié)點(diǎn)數(shù)量只有1個。系統(tǒng)每間隔15min采集一次數(shù)據(jù)信息,利用該模型可以利用96個點(diǎn)的歷史數(shù)據(jù)信息對未來一個時刻的數(shù)據(jù)進(jìn)行預(yù)測。使用模型之前需要利用歷史數(shù)據(jù)信息對LSTM模型進(jìn)行訓(xùn)練,本案例中準(zhǔn)備的訓(xùn)練樣本信息為5856個,共完成了400次迭代訓(xùn)練,訓(xùn)練批數(shù)為512次,每次迭代運(yùn)算需要使用4~5批數(shù)據(jù)信息。其中訓(xùn)練的數(shù)據(jù)可以分為兩種類型,分別為訓(xùn)練集和驗(yàn)證集,其中驗(yàn)證集占所有數(shù)據(jù)信息比例的5%。利用歷史數(shù)據(jù)信息對模型進(jìn)行訓(xùn)練和驗(yàn)證以后,發(fā)現(xiàn)利用模型得到的數(shù)據(jù)信息基本在100%置信區(qū)間范圍以內(nèi),并且整個置信區(qū)間的范圍非常窄,意味著LSTM模型對功率進(jìn)行預(yù)測的置信區(qū)間具有很好的效果,且區(qū)間范圍對于異常數(shù)據(jù)信息的分析識別具有非常好的參考意義。如果實(shí)際的參數(shù)信息超過了模型預(yù)測的置信區(qū)間范圍,那么說明實(shí)際參數(shù)信息與歷史數(shù)據(jù)樣本信息的時序規(guī)律不相符,屬于異常數(shù)據(jù)點(diǎn)。
對于本研究所述的異常數(shù)據(jù)信息分析模型,可以采用兩個重要的指標(biāo)進(jìn)行評價(jià),分別為檢出率和誤檢率,以上兩個指標(biāo)分別用kacc、kerr符號表示,其計(jì)算公式如下:
式中,Nb表示實(shí)際所有的異常點(diǎn)數(shù)目;Nt表示利用模型正確檢測出來的異常點(diǎn)數(shù)目;Nf表示錯誤檢測的異常點(diǎn)數(shù)目。
使用不同大小的噪聲方差對不同類型的參數(shù)信息進(jìn)行預(yù)測,對兩個關(guān)鍵指標(biāo)進(jìn)行了統(tǒng)計(jì)計(jì)算。對于電壓參數(shù)信息,當(dāng)噪聲方差為0.5V2時,kacc和kerr分別為79.66%和16.94%;當(dāng)噪聲方差為0.7V2時,kacc和kerr分別為83.05%和13.55%。對于電流參數(shù)信息,當(dāng)噪聲方差為0.01A2時,kacc和kerr分別為72.88%和25.42%;當(dāng)噪聲方差為0.05A2時,kacc和kerr分別為77.97%和18.64%。對于功率參數(shù)信息,當(dāng)噪聲方差為7kW2時,kacc和kerr分別為67.8%和15.25%,當(dāng)噪聲方差為13kW2時,kacc和kerr分別為76.27%和13.55%。上述所有參數(shù)中,kacc和kerr的平均數(shù)分別為76.27%和17.23%。
為了驗(yàn)證LSTM模型在用電信息系統(tǒng)數(shù)據(jù)計(jì)量異常分析中的應(yīng)用效果,結(jié)合實(shí)際情況選取了三只存在異常數(shù)據(jù)的智能電表為對象進(jìn)行分析,電表分別用Ⅰ、Ⅱ、Ⅲ序號表示。選取的是2023年3月6日~5月7日的數(shù)據(jù)信息,每間隔15min采集一次數(shù)據(jù)信息,在兩個月時間里共測量得到了5952個點(diǎn)的數(shù)據(jù)信息,主要是功率值、電壓值和電流值等,利用上文提出的LSTM模型對計(jì)量異常數(shù)據(jù)信息進(jìn)行識別,以達(dá)到檢驗(yàn)LSTM模型的目的。下面對具體的測試過程以及結(jié)果進(jìn)行分析。
在普通電力用戶一天的用電過程中,其電流值通常不會出現(xiàn)明顯的變化,如果通過分析發(fā)現(xiàn)用戶的電流存在明顯突變現(xiàn)象,大概率是存在計(jì)量異常問題。如圖1所示為電表Ⅰ的電流大小以及電流變化情況,圖中顯示的是電表Ⅰ在3月6日的電流數(shù)據(jù)及其變化情況,從圖中可以看出,第37個采集點(diǎn)的電流及其電流變化值存在異常現(xiàn)象,利用LSTM模型判定為異常點(diǎn)數(shù)據(jù),異常的根據(jù)是電流變化率過大,與實(shí)際數(shù)據(jù)進(jìn)行對比分析,發(fā)現(xiàn)異常點(diǎn)的甄別判斷是有效的。
圖1 電表Ⅰ的電流大小以及電流變化情況
普通電力用戶的用電功率不會出現(xiàn)明顯的變化,如果用電功率存在突變問題,則很可能是存在計(jì)量異常問題。如圖2所示為電表Ⅱ的功率大小以及功率變化情況,圖中顯示的主要是4月25日電表Ⅱ的數(shù)據(jù)信息。
圖2 電表Ⅱ的功率大小以及功率變化情況
從圖中可以看出,在第57個采集點(diǎn)的功率以及功率變化值出現(xiàn)了顯著的變化現(xiàn)象。利用LSTM模型進(jìn)行分析判斷后,認(rèn)為第57個采集點(diǎn)屬于異常點(diǎn)數(shù)據(jù)信息,判斷的根據(jù)是該采集點(diǎn)的功率存在突變現(xiàn)象。通過與實(shí)際情況進(jìn)行對比,認(rèn)定該異常點(diǎn)的甄別是有效的。
根據(jù)相關(guān)的理論可知,對電力用戶而言,其用電功率與電流的平方是成正比的,意味著電力用戶的電流越大,對應(yīng)的功率也越大。如果通過用電信息采集系統(tǒng)采集得到的電流和功率數(shù)據(jù)信息之間不匹配,則大概率是存在計(jì)量異常問題。如圖3所示為電表Ⅲ的電流大小以及功率變化情況,圖中顯示的是5月7日電表Ⅲ的數(shù)據(jù)信息。利用LSTM模型對相關(guān)的數(shù)據(jù)進(jìn)行深入挖掘分析以后,認(rèn)為第75個采集點(diǎn)的數(shù)據(jù)信息存在異?,F(xiàn)象,主要的根據(jù)是第75個采集點(diǎn)的電流值相對較小,但是功率值卻相比較大。這與基本的電力常識相沖突,因?yàn)樵陔妷罕3植蛔兊那闆r下,功率應(yīng)該與電流的平方成正比。通過與實(shí)際情況進(jìn)行對比,發(fā)現(xiàn)該采集點(diǎn)確實(shí)存在數(shù)據(jù)異?,F(xiàn)象,驗(yàn)證了LSTM模型甄別判斷過程的有效性。
圖3 電表Ⅲ的電流大小以及功率變化情況
利用LSTM模型對智能電表的異常數(shù)據(jù)進(jìn)行分析時,可以結(jié)合實(shí)際情況決定是否將相關(guān)結(jié)果反饋給有關(guān)部門。如果某一個智能電表在一段時間內(nèi)只是出現(xiàn)個別異常數(shù)據(jù)信息,則需要對該異常點(diǎn)的前后數(shù)據(jù)信息進(jìn)行更加細(xì)致地排查,確定是否出現(xiàn)了數(shù)值偏小或者數(shù)值偏大的更加隱蔽的數(shù)據(jù)計(jì)量異常問題,如果不存在上述問題,可以認(rèn)定為是偶然現(xiàn)象,無需向有關(guān)部門進(jìn)行反饋;如果某一個智能電表在很短的時間內(nèi)出現(xiàn)了很多次異常數(shù)據(jù)點(diǎn),可以認(rèn)定該電表存在計(jì)量異常現(xiàn)象,需要及時將結(jié)果反饋給有關(guān)部門。
綜上所述,針對用電信息采集系統(tǒng)收集得到的數(shù)據(jù)信息,利用LSTM模型進(jìn)行深入地挖掘分析,可以及時發(fā)現(xiàn)智能電表計(jì)量過程中存在的問題,該模型是可行有效的。通過與實(shí)際的數(shù)據(jù)信息對比,發(fā)現(xiàn)平均檢出率和平均誤檢率分別為76.27%和17.23%。能夠大幅縮小故障問題的排查范圍,為電力企業(yè)提供很好的現(xiàn)實(shí)參考價(jià)值。
在人工智能的發(fā)展歷程中,LSTM模型以其卓越的數(shù)據(jù)建模和推理能力,得到了全球?qū)W術(shù)界和業(yè)界的廣泛關(guān)注和推崇。針對用電信息采集系統(tǒng)采集的電壓、電流、功率等大量數(shù)據(jù)信息,通過運(yùn)用LSTM模型進(jìn)行深度挖掘和分析,能夠快速準(zhǔn)確地發(fā)現(xiàn)電表計(jì)量過程中存在的異常問題。通過實(shí)踐測驗(yàn)發(fā)現(xiàn)LSTM模型的平均檢出率和平均誤檢率分別為76.27%和17.23%。這些測試結(jié)果有力地證明了LSTM模型的實(shí)用性和有效性,這對于進(jìn)一步推廣LSTM模型在用電信息采集系統(tǒng)數(shù)據(jù)計(jì)量異常分析中的應(yīng)用具有重要的現(xiàn)實(shí)意義。