習(xí)?偉,蔡田田,張?鎮(zhèn),于?浩,李?鵬
融合多元影響因素的配電臺區(qū)BiLSTM負荷預(yù)測方法
習(xí)?偉1,蔡田田2,張?鎮(zhèn)1,于?浩1,李?鵬1
(1. 智能電網(wǎng)教育部重點實驗室(天津大學(xué)),天津 300072;2.南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司,廣州 510700)
配電臺區(qū)負荷預(yù)測是保障電力供需平衡的關(guān)鍵,對電力系統(tǒng)的安全預(yù)警、應(yīng)急維護和經(jīng)濟運行具有重要的指導(dǎo)作用.受多種耦合因素影響,面向臺區(qū)負荷的中短期常規(guī)預(yù)測方法存在較大的局限性.為提高臺區(qū)負荷預(yù)測方法的泛化能力,提出一種基于雙向長短期記憶網(wǎng)絡(luò)(bidirectional long short-term memory,BiLSTM),并引入要素主成分分析(principal component analysis,PCA)和用電行為分析的中短期日負荷預(yù)測模型.首先,基于PCA方法提取預(yù)選的影響用電負荷外在因素的主成分,實現(xiàn)對包含冗余、缺失和異常信息的輸入變量的降維和修正;其次,依據(jù)歷史負荷數(shù)據(jù),利用基于遺傳算法(genetic algorithm,GA)的模糊C均值(fuzzy C-means,F(xiàn)CM)聚類提取臺區(qū)內(nèi)不同用戶的用電行為特征并依此劃分臺區(qū)內(nèi)的用戶集合,降低用電行為差異對預(yù)測結(jié)果的影響;然后,搭建每類用戶的BiLSTM預(yù)測模型,并應(yīng)用隨機權(quán)重平均(stochastic weight averaging,SWA)算法提升預(yù)測模型的泛化能力,以年為單位預(yù)測日負荷電量;最后,將每類用戶的負荷預(yù)測數(shù)據(jù)進行線性疊加,得到配電臺區(qū)負荷預(yù)測結(jié)果.選取中國某低壓臺區(qū)近4年來的負荷數(shù)據(jù)作為算例,與其他基于LSTM的常規(guī)預(yù)測模型相比,基于PCA-BiLSTM模型預(yù)測得到的各類用戶的年度用電負荷曲線更貼合真實數(shù)據(jù)曲線,更符合用戶的實際生活需求,且基于主成分分析和用電行為分析的分類預(yù)測方法可有效提升預(yù)測結(jié)果的準確率.
負荷預(yù)測;特征聚類;主成分分析;雙向長短期記憶網(wǎng)絡(luò)
隨著我國社會經(jīng)濟的高速發(fā)展,社會用電需求急劇增加.配電網(wǎng)作為電力系統(tǒng)中直接面向用戶的環(huán)節(jié),其規(guī)模龐大、結(jié)構(gòu)復(fù)雜;分布式可再生能源和電動汽車等新要素在中低壓配網(wǎng)層面大量接入,各種不確定性因素相互耦合,顯著改變了配電系統(tǒng)的源、荷特征,給系統(tǒng)的安全高效運行帶來了巨大挑戰(zhàn)[1],對更加有效的新型配電系統(tǒng)行為特征分析與預(yù)測方法提出了迫切需求.
負荷預(yù)測旨在基于配電系統(tǒng)本身,綜合考慮多種因素(地區(qū)、氣象等)變化對用電負荷產(chǎn)生的影響,從歷史負荷數(shù)據(jù)中挖掘負荷變化的內(nèi)在規(guī)律,并做出預(yù)先估計和推測[2].準確的負荷預(yù)測是優(yōu)化配電系統(tǒng)控制策略、保障系統(tǒng)安全高效運行和用戶可靠供電的必要前提[3-4].負荷預(yù)測可分為系統(tǒng)級和配電臺區(qū)級,其中系統(tǒng)級負荷預(yù)測的目標是為各級電力部門安排調(diào)度計劃提供依據(jù),而配電臺區(qū)級負荷預(yù)測的目標是指導(dǎo)安排檢修計劃、實現(xiàn)事前預(yù)警、調(diào)配搶修資源、調(diào)整運行方式等配網(wǎng)工作.同時,從系統(tǒng)層面來看,其涵蓋的負荷類型眾多、相互之間存在互補特性,整體規(guī)律性更為顯著;而配電臺區(qū)的地域規(guī)模更小,整體負荷變化規(guī)律性弱,系統(tǒng)級預(yù)測方法無法直接適用.此外,長期以來,受制于配電系統(tǒng)的量測通信水平、數(shù)據(jù)條件和計算能力,實現(xiàn)臺區(qū)級別的準確負荷預(yù)測一直面臨挑戰(zhàn).邊緣計算等先進信息技術(shù)的應(yīng)用提升了配電系統(tǒng)邊緣側(cè)的數(shù)據(jù)采集和利用能力,使配電網(wǎng)業(yè)務(wù)從主站向邊緣側(cè)轉(zhuǎn)移[5],為更加準確的臺區(qū)負荷預(yù)測提供了基礎(chǔ)條件,同時對多要素融合影響下的臺區(qū)負荷預(yù)測新方法提出了要求.從負荷預(yù)測研究的時間尺度分析,中、短期負荷預(yù)測有助于指導(dǎo)配電網(wǎng)的日常生產(chǎn);與此同時,用戶用電特性由用戶日負荷曲線體現(xiàn),從海量用戶的日負荷數(shù)據(jù)中提取出有價值的信息,有助于構(gòu)建精準用戶畫像,保障需求側(cè)響應(yīng)策略有效實施.因此,精確的中、短期日負荷預(yù)測結(jié)果對配電系統(tǒng)的正常運行具有重要意義.
關(guān)于用電負荷預(yù)測的研究已取得諸多成果,早期研究大多采用線性方法,如回歸分析法[6]、時間序列法[7-8]、基于灰色理論的改進算法[9-10]和卡爾曼濾波算法[11-12]等.由于負荷預(yù)測本身是一個復(fù)雜的過程,影響因素較多,傳統(tǒng)的線性方法往往無法有效發(fā)掘用電負荷數(shù)據(jù)的內(nèi)在特征,難以實現(xiàn)精確預(yù)測.隨著非線性理論的逐步完善和人工智能技術(shù)的推廣應(yīng)用,面向負荷預(yù)測及相關(guān)技術(shù)領(lǐng)域的研究中,已涌現(xiàn)大量基于傳統(tǒng)機器學(xué)習(xí)及其改進算法的應(yīng)用成果.其中,文獻[13-14]對傳統(tǒng)貝葉斯預(yù)測模型進行改進,提高模型的泛化能力,獲得較高的預(yù)測精度,但此類方法面對影響因素復(fù)雜的情況時,存在因計算量大導(dǎo)致預(yù)測效率低的問題;文獻[15-17]通過改良支持向量機回歸(SVR)算法,提升了用電負荷預(yù)測精度,SVR算法較為成熟,能夠快速求得全局最優(yōu)解,但對歷史數(shù)據(jù)依賴大,當負荷波動較大時,預(yù)測效果變差.
傳統(tǒng)機器學(xué)習(xí)及其改進算法在負荷預(yù)測應(yīng)用中存在以下兩點問題:①模型結(jié)構(gòu)相對簡單,不能充分表達配電系統(tǒng)所包含的信息;②時序數(shù)據(jù)問題的處理能力較弱.深度學(xué)習(xí)是近年來興起的一種機器學(xué)習(xí)算法,其核心是通過模仿人腦的機制對數(shù)據(jù)進行表征學(xué)習(xí)[18].基于深度學(xué)習(xí)的模型復(fù)雜度高,具有較強的非線性映射能力,能充分發(fā)掘數(shù)據(jù)特征,很好地表達海量電力數(shù)據(jù)所包含的內(nèi)在規(guī)律[19].文獻[20-21]提出利用遺傳算法優(yōu)化反向傳播(BP)神經(jīng)網(wǎng)絡(luò)對進行負荷預(yù)測;文獻[22]應(yīng)用預(yù)先訓(xùn)練權(quán)重值的受限玻耳茲曼機提高負荷預(yù)測精度.該類基于前向神經(jīng)網(wǎng)絡(luò)模型的方法預(yù)測精度較高,但其具有收斂速度慢、模型可解釋性差及易發(fā)生過擬合等缺點.以長短期記憶網(wǎng)絡(luò)(LSTM)為代表的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,在神經(jīng)元串行的基礎(chǔ)上,加入時序信息表達模塊,實現(xiàn)對負荷數(shù)據(jù)的有效處理[23].用電負荷改變由多種因素共同造成,其內(nèi)在聯(lián)系復(fù)雜,單一模型往往很難全面反映這種關(guān)系.為了解決這個問題,組合模型預(yù)測的方法應(yīng)運而生.依托多個模型各自的優(yōu)點,可更充分地發(fā)掘和利用負荷數(shù)據(jù)特征,使模型更具有表現(xiàn)力,從而實現(xiàn)提高負荷預(yù)測精度的目標.文獻[24]通過Stacking模型將負荷影響因素降維,并利用LSTM網(wǎng)絡(luò)實現(xiàn)短期負荷的快速準確預(yù)測;文獻[25]提出基于特征篩選的卷積神經(jīng)網(wǎng)絡(luò)-雙向長短期記憶網(wǎng)絡(luò)(CNN-BiLSTM)組合模型的短期用電負荷預(yù)測方法,提升了多維用電負荷數(shù)據(jù)的短期預(yù)測精度.
用電負荷值受多種因素影響,而表征這些因素的數(shù)據(jù)集成后會包含大量的冗余信息,模型訓(xùn)練過程中易產(chǎn)生過擬合現(xiàn)象,降低了預(yù)測結(jié)果的準確性.此外,現(xiàn)階段多數(shù)研究關(guān)注負荷本身,單純基于負荷電氣特性建模,并未充分考慮用戶差異化的用電行為對電力系統(tǒng)的影響,勢必會在某種程度上導(dǎo)致預(yù)測精度下降.針對以上問題,本文選取低壓臺區(qū)中短期負荷作為研究對象,通過分析用電負荷影響因素(包括外在因素和用電行為),構(gòu)建BiLSTM模型,以年為單位進行臺區(qū)日負荷預(yù)測.其具體過程為:首先,利用PCA方法計算各類外在因素的相關(guān)性,并依據(jù)相關(guān)性進行特征降維;其次,基于日負荷歷史數(shù)據(jù),提取臺區(qū)用戶的用電行為特征,并應(yīng)用GA-FCM算法對用戶進行特征聚類;然后,結(jié)合外在因素的特征降維結(jié)果,基于BiLSTM模型預(yù)測不同特征用戶每日的負荷電量;最后,按比例疊加得到臺區(qū)負荷預(yù)測模型.相比于一般混合預(yù)測模型和其他機器學(xué)習(xí)方法,文中方法將系統(tǒng)的影響因素劃分為外在因素和用電行為因素,能夠更充分地發(fā)掘負荷影響因素的特征,在保證預(yù)測效率的同時提升準確率.此外,本文結(jié)合某電力公司低壓臺區(qū)數(shù)據(jù)搭建系統(tǒng)仿真模型,借助仿真結(jié)果驗證本文所提出融合多元影響因素特征分析的雙向長短記憶網(wǎng)絡(luò)負荷預(yù)測方法的有效性.
用電負荷預(yù)測屬于多指標變量的預(yù)測問題,輸入特征變量增多會大大提升問題復(fù)雜度,增加運算時間.PCA用于發(fā)掘用電負荷不同影響因素之間的相關(guān)性,去除重疊的特征信息、降低數(shù)據(jù)維度.
PCA的基本思想是用少數(shù)具有代表性的變量描述整個變量系統(tǒng)的相關(guān)關(guān)系,屬于多元統(tǒng)計分析方?法[26].該方法基于線性變換,將原變量轉(zhuǎn)化為互不相關(guān)的新變量,同時盡可能多地包含原變量的信息;即通過求解原變量的正交矩陣,滿足以下條件:①每個原變量系數(shù)的平方和為1;②每個新變量之間的協(xié)方差為0.此外,分析過程中用變量的方差反映所包含的信息量,并通過計算累計貢獻率對變量進行評價.
為識別臺區(qū)用戶用電行為,將模糊C-均值(FCM)聚類算法與遺傳算法(GA)相結(jié)合進行聚類分析.FCM是一種應(yīng)用較為廣泛的局部搜索模糊聚類算法[27],通過計算數(shù)據(jù)與各聚類中心的隸屬度實現(xiàn)樣本數(shù)據(jù)的聚類劃分,可定義為一個樣本容量為最優(yōu)化問題,即
式中:表示聚類中心個數(shù);表示模糊加權(quán)指數(shù);為第個樣本;為第個聚類中心;u為樣本x屬于對類別的隸屬度系數(shù).聚類中心和隸屬度系數(shù)的迭代計算公式分別為
FCM算法收斂速度快,但因其基于梯度下降法進行尋優(yōu),存在聚類結(jié)果對初始值依賴大和容易陷入局部最優(yōu)解等缺點,導(dǎo)致無法得到準確的用電特征聚類結(jié)果.為解決上述問題,引入GA算法優(yōu)化FCM的初始聚類中心[28],其基本思想是從一組隨機產(chǎn)生的種群初始解開始搜索過程,種群中的每個個體對應(yīng)問題的一個解;后代個體由前一代通過交叉、變異等運算產(chǎn)生,根據(jù)適應(yīng)值的大小選擇/淘汰部分后代,保持種群數(shù)量不變;這樣經(jīng)過若干代后,算法收斂于最優(yōu)的個體,即得到全局最優(yōu)解的近似解.進一步利用FCM算法得到最終的分類結(jié)果.
BiLSTM是一種基于時間的雙向循環(huán)神經(jīng)網(wǎng)絡(luò),通過正向時間序列和反向時間序列進行訓(xùn)練,可有效地挖掘當前數(shù)據(jù)同過去及未來時刻數(shù)據(jù)的內(nèi)在聯(lián)?系[29],進而充分利用負荷數(shù)據(jù)信息.
BiLSTM網(wǎng)絡(luò)是LSTM網(wǎng)絡(luò)基礎(chǔ)上的改進與優(yōu)化,旨在解決LSTM網(wǎng)絡(luò)因單向傳播的限制,即基于時間序列進行預(yù)測時,無法利用過去和未來的序列信息評估當前時刻的技術(shù)問題.如圖1所示,LSTM網(wǎng)絡(luò)的神經(jīng)元結(jié)構(gòu)主要由遺忘門、輸入門、輸出門和記憶單元構(gòu)成.
圖1?LSTM網(wǎng)絡(luò)神經(jīng)元結(jié)構(gòu)
LSTM網(wǎng)絡(luò)訓(xùn)練過程中,記憶單元時刻的狀態(tài)由遺忘部分狀態(tài)和保留部分狀態(tài)組成;其中,遺忘部分狀態(tài)由輸入、記憶單元(-1)時刻的狀態(tài)-1及中間輸出共同決定,保留部分狀態(tài)由分別經(jīng)過sigmoid函數(shù)()和tanh函數(shù)變換后的輸出共同決定.此外,在輸出門中和經(jīng)變換處理得到.圖1中各變量的計算公式分別為
式中:f為遺忘門的權(quán)重矩陣;i和g為輸入門的權(quán)重矩陣;o為輸出門的權(quán)重矩陣;f為遺忘門的偏置項;i和g為輸入門的偏置項;o為輸出門的偏?置項.
圖2?BiLSTM網(wǎng)絡(luò)結(jié)構(gòu)
本文應(yīng)用上述方案構(gòu)建臺區(qū)負荷預(yù)測模型架構(gòu)(如圖3所示),具體流程分為以下兩個階段.
1) 影響因素特征分析
利用PCA提取高維外在因素數(shù)據(jù)的主成分,以待輸入BiLSTM網(wǎng)絡(luò)進行訓(xùn)練;同時,采用FCM算法對用戶用電數(shù)據(jù)進行聚類,并基于GA算法獲得最優(yōu)初始聚類中心,得到不同用電行為類別的用戶數(shù)?據(jù)集.
2) BiLSTM預(yù)測模型設(shè)計
對各類用戶分別構(gòu)建BiLSTM預(yù)測模型,并運用隨機權(quán)重平均(stochastic weight averaging,SWA)算法優(yōu)化網(wǎng)絡(luò);進一步針對目標臺區(qū)不同類別的用戶,利用相應(yīng)的PCA-BiLSTM模型進行預(yù)測,并將所有用戶的預(yù)測值疊加得到臺區(qū)負荷預(yù)測結(jié)果.
2.2.1?數(shù)據(jù)特征
電力系統(tǒng)負荷影響因素眾多,以氣象因素的影響最為普遍[30];同時由于用電負荷曲線具有明顯的日周期性和星期周期性[31],因此在進行負荷預(yù)測時,需著重考慮天氣情況和日期類型.此外,歷史負荷數(shù)據(jù)中隱藏著用戶的用電行為習(xí)慣,對這些數(shù)據(jù)進行挖掘并研究用戶類型,有助于更全面地描述臺區(qū)系統(tǒng)[32].綜上分析,本文面向臺區(qū)的每日用電負荷進行預(yù)測,將系統(tǒng)的影響因素特征劃分為外在因素特征和用電行為特征.
(1) 外在因素特征.選定預(yù)測日的最高氣溫、最低氣溫、當日平均氣溫、前一日平均氣溫、濕度、降水量、天氣狀況(包含晴、多云、陰、陣雨等33種天氣類型)、日期類型(星期幾)及月份共9項特征作為模型的備選輸入;模型輸出則為未來1d的日負荷值.
圖3?臺區(qū)負荷預(yù)測模型架構(gòu)
(2) 用電行為特征.通過分析用戶用電曲線的形狀特征,描述用電行為.從波動點、均值及方差3個維度刻畫用電曲線形狀,具體過程為:首先,通過平滑處理剝離用電數(shù)據(jù)中的隨機波動成分;其次,參考用電量峰值易出現(xiàn)于夏、冬兩季[33],并考慮系統(tǒng)的運行效率,選取用電曲線斜率變化最大的2個波動點,將曲線劃分為3段;然后,計算分段之后的每段用電數(shù)據(jù)的平均值和方差;最后,將每個用戶用電曲線的2個波動點的時序坐標值、3段曲線的用電量均值和用電量方差共8項指標作為該用戶的用電行為特征.
2.2.2?缺失值
為保證預(yù)測結(jié)果的正確性和客觀性,針對時序數(shù)據(jù)的缺失值問題,本文結(jié)合電力負荷曲線的日周期性和星期周期性特點[34],同時考慮負荷數(shù)據(jù)的時間連續(xù)性,采用均值數(shù)據(jù)插補的方法進行處理,即基于缺失值當日的前后各2d、以及1周前對應(yīng)時間共計5個采樣點的日用電負荷值的平均數(shù)補全缺失值,其計算式為
2.2.3?異常值
異常值因輸入錯誤、測量誤差及實驗誤差等情況造成.這類數(shù)據(jù)參與預(yù)測模型訓(xùn)練,會導(dǎo)致預(yù)測結(jié)果產(chǎn)生較大偏差.本文應(yīng)用箱型圖分析法[35]鑒別異常數(shù)據(jù),并參考配電網(wǎng)電氣量的正常波動范圍對其進行校驗;當確認為異常值后,將該數(shù)據(jù)視為缺失值,并且依照缺失值的補全方法進行處理.
2.3.1?外在因素特征降維
針對數(shù)據(jù)預(yù)處理環(huán)節(jié)中選取的9項外在因素特征,利用PCA方法進行數(shù)據(jù)降維,具體步驟如下.
其中
2.3.2?用電行為特征聚類
為充分反映用戶的用電行為特征,得到客觀的分類結(jié)果,在進行特征聚類分析時,數(shù)據(jù)需包含用戶近若干年的日用電負荷值.在此基礎(chǔ)上,針對每個用戶的負荷數(shù)據(jù),以年為區(qū)間進行疊加,并求取每日的用電負荷均值.同時考慮用電行為具有明顯的星期周期性,采用采樣頻率為7d/次的分段聚合近似方法對數(shù)據(jù)進行平滑處理,采樣數(shù)值表示用戶前一周的用電量.進一步應(yīng)用GA-FCM方法進行特征聚類,步驟如下.
2.4.1?預(yù)測模型結(jié)構(gòu)
本文基于Keras框架下的內(nèi)置神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搭建BiLSTM預(yù)測模型,編程環(huán)境為Python3.7,并使用Numpy、Pandas、Matplotlib、Keras和Sklearn等第三方擴展庫.考慮時序預(yù)測中隨機性波動帶來的預(yù)測精度損失問題,在試驗中構(gòu)建兩層BiLSTM網(wǎng)絡(luò),并將BiLSTM與Dense(全連接層)連接,從而提取更深層特征.
在此基礎(chǔ)上,選取平均絕對百分比誤差(mean absolute percentage error,MAPE)作為損失函數(shù)(計算公式見式(17)),對每個類別用戶的用電負荷進行預(yù)測;進一步通過添加Dropout層,解決過擬合問題.模型網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示.
圖4?BiLSTM預(yù)測模型結(jié)構(gòu)
模型第1層和第2層均為BiLSTM層,初始神經(jīng)元個數(shù)均設(shè)置為128,并選用ReLu激活函數(shù).模型第3層為全連接層,用于綜合隱藏層提取的特征數(shù)據(jù),神經(jīng)元個數(shù)設(shè)置為64,并選用ReLu激活函數(shù).模型第4層引入Dropout機制,通過丟棄神經(jīng)元節(jié)點,降低模型對局部特征的依賴度,設(shè)置概率參數(shù)為0.3.模型第5層為輸出層,輸出信息的維度為1,選用ReLu激活函數(shù).
2.4.2?SWA優(yōu)化算法
典型的深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練過程是使用優(yōu)化器對損失函數(shù)進行優(yōu)化,使用一個衰減的學(xué)習(xí)率,直到模型收斂.在基于隨機梯度下降(stochastic gradient descent,SGD)優(yōu)化器的模型訓(xùn)練過程中,每輪更新參數(shù)時,隨機抽取一個樣本或子成分函數(shù)計算梯度,并以此梯度為全局梯度的估計值.但由于實際數(shù)據(jù)存在噪聲,使用SGD優(yōu)化器常難以沿著最佳的更新方向逼近最優(yōu)參數(shù),存在參數(shù)更新比較頻繁,損失函數(shù)易產(chǎn)生振蕩現(xiàn)象,影響負荷預(yù)測的準確性.
針對上述問題,本文應(yīng)用SWA算法對SGD優(yōu)化器進行改進,進一步提升模型的泛化能力.SWA算法在SGD優(yōu)化器的基礎(chǔ)上,通過加入周期性的滑動平均操作限制權(quán)重的變化(即對SGD優(yōu)化器遍歷的網(wǎng)絡(luò)權(quán)值進行平均),限制了參數(shù)更新頻率,更容易找到最優(yōu)值域[38].具體優(yōu)化步驟如下:
本文以中國某低壓臺區(qū)(227個用戶)2017—2020年期間用電負荷信息為研究對象,其中居民、商業(yè)等不同用戶以及不同建筑類型的用電行為存在差異,應(yīng)用基于用電特征聚類和PCA-BiLSTM的方法進行預(yù)測分析.臺區(qū)每年的日最大功率和最小功率如表1所示,可以看出,相比與2017—2020年期間的負荷功率數(shù)據(jù)均在正常波動范圍內(nèi).據(jù)此推斷,2020年該臺區(qū)的整體用電負荷未受到新冠疫情影響.
表1?臺區(qū)負荷功率
Tab.1?Load power of the transformer district kW
實驗過程中,設(shè)定每年1月1日—12月31日為一個周期,選取2017—2019年的歷史負荷數(shù)據(jù)作為訓(xùn)練集,用于建立臺區(qū)負荷預(yù)測模型;選取2020年的歷史負荷數(shù)據(jù)作為測試集,用于檢驗負荷預(yù)測效果.進一步采用MAPE和均方根百分比誤差(root mean square percentage error,RMSPE)作為評價指標,對比LSTM模型、BiLSTM模型及PCA-BiLSTM模型的預(yù)測精度,以驗證本文預(yù)測方法的有效性. RMSPE的計算公式為
基于PCA方法提取4個臺區(qū)負荷影響因素主成分后的結(jié)果如表2所示.主成分1~4的累計方差貢獻率達到87.097%,已基本包含負荷影響因素的全部信息;同時,4個主成分中權(quán)重系數(shù)最大的外在因素特征依次為預(yù)測日的平均溫度、日期類型、天氣狀況、月份.因此,可代替原有9個特征作為輸入變量對BiLSTM預(yù)測模型進行訓(xùn)練,實現(xiàn)特征降維,進而提升算法的效率.
表2?主成分提取結(jié)果
Tab.2?Principal component extraction results
基于2017—2019年的歷史負荷數(shù)據(jù),計算每個用戶3a用電的日負荷均值;進一步通過降采樣處理得到周用電量數(shù)據(jù).考慮不同用戶用電負荷在量級上存在較大差異,對周用電量數(shù)據(jù)進行歸一化處理得
應(yīng)用GA-FCM方法對歸一化后的數(shù)據(jù)進行特征聚類,得到3類典型用戶.圖5為各類用戶的周用電均值曲線,可以看到3類用戶的用電特征差異較為明顯,且呈現(xiàn)出季節(jié)性波動的特點.
實驗過程,選取2017—2019年期間每類用戶下所有用戶每日的累加負荷作為各自預(yù)測模型的訓(xùn)練集;進一步應(yīng)用預(yù)測模型,對2020年每類用戶下所有用戶的每日累加負荷進行預(yù)測.
3.3.1?BiLSTM預(yù)測模型分析
為分析兩層BiLSTM網(wǎng)絡(luò)的有效性,應(yīng)用訓(xùn)練集分別訓(xùn)練單層BiLSTM網(wǎng)絡(luò)和兩層BiLSTM網(wǎng)絡(luò)的負荷預(yù)測模型,并采用SGD進行優(yōu)化;進一步對比訓(xùn)練過程中每次迭代后的訓(xùn)練集的損失情況,如圖6所示.可以看到,兩種網(wǎng)絡(luò)結(jié)構(gòu)均在模型迭代至100次時損失值大幅減小;迭代至700次時,損失值均已趨于平穩(wěn),同時基于雙層BiLSTM網(wǎng)絡(luò)模型的損失值更小,表現(xiàn)出更好的預(yù)測效果.
圖5?用電行為特征聚類結(jié)果
圖6?預(yù)測模型訓(xùn)練集損失
此外,進一步應(yīng)用SWA算法對基于雙層BiLSTM網(wǎng)絡(luò)的預(yù)測模型進行優(yōu)化.訓(xùn)練過程中,迭代至500次時,損失值趨向平穩(wěn),表現(xiàn)出更好的泛化能力.
3.3.2?用戶負荷預(yù)測結(jié)果
面向3類用戶,分別構(gòu)建LSTM預(yù)測模型、BiLSTM預(yù)測模型及PCA-BiLSTM預(yù)測模型,每種模型均采用5層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),各層參數(shù)設(shè)置相同,迭代500次.各類用戶的負荷預(yù)測結(jié)果及3種模型的性能指標對比如圖7~圖9所示.
由圖7~圖9可知,相比于LSTM模型,BiLSTM模型和PCA-BiLSTM模型的負荷預(yù)測曲線更加貼近實際值,能夠準確反映3類用戶全年的日用電情況.同時,通過對比分析誤差分析數(shù)據(jù)及BiLSTM模型的預(yù)測結(jié)果,3類用戶的PCA-BiLSTM模型預(yù)測結(jié)果的MAPE和RMSPE指標均明顯下降.因此,進一步說明PCA方法對于模型預(yù)測性能具有明顯改善作用,在降低數(shù)據(jù)維度的同時,能夠有效提升負荷預(yù)測精度.
進一步分析3類用戶的用電負荷曲線,得到相應(yīng)的用電行為特征如下.
(1) 第1類用戶的用電負荷曲線呈夏季單峰型(如圖7所示),即用電量在7—8月出現(xiàn)顯著峰值,其他時段的用電情況較為平穩(wěn).結(jié)合地區(qū)氣候特點,推斷此類用戶在夏季大面積使用空調(diào)等電器設(shè)備,用電制冷需求較高;而冬季用電制熱的需求較小.此群體可對應(yīng)臺區(qū)內(nèi)冬季供暖效果較好的居民用戶.
圖7?第1類用戶負荷預(yù)測結(jié)果
圖8?第2類用戶負荷預(yù)測結(jié)果
圖9?第3類用戶負荷預(yù)測結(jié)果
(2) 第2類用戶的用電負荷曲線呈冬春交替季單峰型(如圖8所示),即用電量在2—3月達到高峰,其他季節(jié)用電量波動較?。畵?jù)此推斷,在冬季集中供暖期結(jié)束后,該類群體因房屋保溫性差,導(dǎo)致用電制熱消耗激增.
(3) 第3類用戶的用電負荷曲線呈雙峰型(如圖9所示),即在冬春交替季和夏季月份分別出現(xiàn)一個高峰,且夏季用電需求高峰期的時段更為集中.據(jù)此推斷,該類用戶的夏季制冷和冬季制熱的用電需求都較大.
3.3.3?臺區(qū)負荷預(yù)測結(jié)果
將以上3類用戶的PCA-BiLSTM模型預(yù)測結(jié)果進行線性疊加,得到所選臺區(qū)的2020年負荷預(yù)測數(shù)據(jù).進一步與不區(qū)分用電特征類別情況的PCA-BiLSTM模型預(yù)測結(jié)果進行對比(如圖10所示).其中,根據(jù)式(17)和式(18)計算可得,所選臺區(qū)360d內(nèi)區(qū)分用電類別情況預(yù)測結(jié)果的MAPE指標為4.29%,RMSPE指標為5.09%;不區(qū)分用電類別情況預(yù)測結(jié)果的MAPE指標為5.49%,RMSPE指標為10.04%.可以看出根據(jù)用電行為特征將臺區(qū)全體用戶區(qū)別開,再分類構(gòu)建PCA-BiLSTM模型,最后通過疊加得到的負荷預(yù)測結(jié)果具有更高的精度.因此,分析臺區(qū)不同類型的用電行為,有助于更加有針對性地制定電力運行和檢修等計劃.
圖10?臺區(qū)負荷預(yù)測結(jié)果
本文應(yīng)用GA-FCM算法對4類典型低壓臺區(qū)中用戶的用電行為進行分類,并利用PCA方法提取出5個用電負荷影響因素作為預(yù)測模型的特征輸入;在此基礎(chǔ)上,通過構(gòu)建BiLSTM模型預(yù)測各類用戶的中短期用電負荷情況,進而得到各臺區(qū)的整體負荷曲線.經(jīng)分析驗證得到以下結(jié)論.
(1) 低壓臺區(qū)用電負荷的各影響因素之間存在一定的相關(guān)性,通過重新組合,可形成4項作為主成分的特征變量,描述整個影響用電負荷的外在因素?系統(tǒng).
(2) 低壓臺區(qū)中用戶的用電行為存在明顯差異,依據(jù)各類用戶的周用電負荷曲線,可分為夏季單峰、冬春交替季單峰和雙峰3種類型.
(3) 相比于LSTM模型、BiLSTM模型,PCA-BiLSTM模型負荷預(yù)測精度較高,能夠精確地反映低壓臺區(qū)各類用戶的用電行為;基于用電行為分析的分類預(yù)測方法可有效提升預(yù)測結(jié)果的準確率,具有一定的應(yīng)用價值.
本文所分析的負荷數(shù)據(jù)來源于單一地區(qū)的用電信息采集系統(tǒng),未考慮臺區(qū)網(wǎng)損及地域因素對負荷產(chǎn)生的影響.后續(xù)工作將結(jié)合不同地區(qū)的負荷數(shù)據(jù),進一步結(jié)合臺區(qū)網(wǎng)損,開展用電行為特征和外在因素特征的分析工作,實現(xiàn)更為精準的負荷預(yù)測,進一步提升預(yù)測結(jié)果助力電網(wǎng)的高效運行.
[1]李坤,周來,張勇軍,等. 基于量測數(shù)據(jù)質(zhì)量的低壓臺區(qū)拓撲識別結(jié)果可信度評價[J]. 電力系統(tǒng)自動化,2021,45(17):99-107.
Li Kun,Zhou Lai,Zhang Yongjun,et al. Credibility evaluation of topology identification results in low-voltage distribution network based on quality of measured data[J]. Automation of Electric Power Systems,2021,45(17):99-107(in Chinese).
[2]康重慶,夏清,張伯明. 電力系統(tǒng)負荷預(yù)測研究綜述與發(fā)展方向的探討[J]. 電力系統(tǒng)自動化,2004,28(17):1-11.
Kang Chongqing,Xia Qing,Zhang Boming. Review of power system load forecasting and its development [J]. Automation of Electric Power Systems,2004,28(17):1-11(in Chinese).
[3]Chen B J,Chang M W. Load forecasting using support vector machines:A study on EUNITE competition 2001 [J]. IEEE Transactions on Power Systems,2004,19(4):1821-1830.
[4]陳振宇,劉金波,李晨,等. 基于LSTM與XGBoost組合模型的超短期電力負荷預(yù)測[J]. 電網(wǎng)技術(shù),2020,44(2):614-620.
Chen Zhenyu,Liu Jinbo,Li Chen,et al. Ultra short-term power load forecasting based on combined LSTM-XGBoost model[J]. Power System Technology,2020,44(2):614-620(in Chinese).
[5]李鵬,習(xí)偉,蔡田田,等. 數(shù)字電網(wǎng)的理念、架構(gòu)與關(guān)鍵技術(shù)[J]. 中國電機工程學(xué)報,2022,42(14):5002-5016.
Li Peng,Xi Wei,Cai Tiantian,et al. Concept,architecture and key technologies of digital power grids [J]. Proceedings of the CSEE,2022,42(14):5002-5016(in Chinese).
[6]徐東升,楊巍,魏哲,等. 基于SPSS的短期負荷特性分析及其預(yù)測研究[J]. 電力系統(tǒng)保護與控制,2009,37(21):147-151.
Xu Dongsheng,Yang Wei,Wei Zhe,et al. Application of SPSS in characteristic of short load and its forecasting[J]. Power System Protection and Control,2009,37(21):147-151(in Chinese).
[7]Wang B,Tai N,Zhai H,et al. A new ARMAX model based on evolutionary algorithm and particle swarm optimization for short-term load forecasting[J]. Electric Power Systems Research,2008,78(10):1679-1685.
[8]喬占俊. 基于Census X12-SARIMA模型的中長期負荷預(yù)測[J]. 電力系統(tǒng)及其自動化學(xué)報,2014,26(1):34-38.
Qiao Zhanjun. Medium and long-term load forecasting based on Census X12-SARIMA model[J]. Proceedings of the CSU-EPSA,2014,26(1):34-38(in Chinese).
[9]Wu Y C,Cheng Z Y,Li M. Med-long term system structure forecasting of power consumption based on grey derived model[C]//Proceedings of 2013 IEEE International Conference on Grey Systems and Intelligent Services(GSIS). Macao,China,2013:142-146.
[10]孫曉璐,肖先勇,尹星露,等. 基于模型有效度的地區(qū)電網(wǎng)母線負荷組合預(yù)測與系統(tǒng)實現(xiàn)[J]. 電力自動化設(shè)備,2014,34(12):106-110.
Sun Xiaolu,Xiao Xianyong,Yin Xinglu,et al. Combination forecasting based on model availability for district network bus loads and its system implementation [J]. Electric Power Automation Equipment,2014,34(12):106-110(in Chinese).
[11]趙峰,孫波,張承慧. 基于多變量相空間重構(gòu)和卡爾曼濾波的冷熱電聯(lián)供系統(tǒng)負荷預(yù)測方法[J]. 中國電機工程學(xué)報,2016,36(2):399-406.
Zhao Feng,Sun Bo,Zhang Chenghuui. Cooling,heating and electrical load forecasting method for CCHP system based on multivariate phase space reconstruction and Kalman filter[J]. Proceedings of the CSEE,2016,36(2):399-406(in Chinese).
[12]Sharma S,Majumdar A,Elvira V,et al. Blind Kalman filtering for short-term load forecasting[J]. IEEE Transactions on Power Systems,2020,35(6):4916-4919.
[13]Chapagain K,Kittipiyakul S. Short-term electricity load forecasting model and Bayesian estimation for Thailand data[C]//MATEC Web of Conferences. EDP Sciences,2016,55:06003.
[14]蔣瑋,黃麗麗,祁暉,等. 基于分布式圖計算的臺區(qū)負荷預(yù)測技術(shù)研究[J]. 中國電機工程學(xué)報,2018,38(12):3419-3430.
Jiang Wei,Huang Lili,Qi Hui,et al. Research on load forecasting technology of transformer areas based on distributed graph computing[J]. Proceedings of the CSEE,2018,38(12):3419-3430(in Chinese).
[15]吳倩紅,高軍,侯廣松,等. 實現(xiàn)影響因素多源異構(gòu)融合的短期負荷預(yù)測支持向量機算法[J]. 電力系統(tǒng)自動化,2016,40(15):67-72,92.
Wu Qianhong,Gao Jun,Hou Guangsong,et al. Short-term load forecasting support vector machine algorithm based on multi-source heterogeneous fusion of load factors[J]. Automation of Electric Power Systems,2016,40(15):67-72,92(in Chinese).
[16]席雅雯,吳俊勇,石琛,等. 融合歷史數(shù)據(jù)和實時影響因素的精細化負荷預(yù)測[J]. 電力系統(tǒng)保護與控制,2019,47(1):80-87.
Xi Yawen,Wu Junyong,Shi Chen,et al. A refined load forecasting based on historical data and real-time influencing factors[J]. Power System Protection and Control,2019,47(1):80-87(in Chinese).
[17]Zhang Z,Hong W C. Application of variational mode decomposition and chaotic grey wolf optimizer with support vector regression for forecasting electric loads[J]. Knowledge-Based Systems,2021,228:107297.
[18]呂海燦,王偉峰,趙兵,等. 基于Wide&Deep-LSTM模型的短期臺區(qū)負荷預(yù)測[J]. 電網(wǎng)技術(shù),2020,44(2):428-436.
Lü Haican,Wang Weifeng,Zhao Bing,et al. Short-term substation load forecast based on Wide&Deep-LSTM model[J]. Power System Technology,2020,44(2):428-436(in Chinese).
[19]朱繼忠,董瀚江,李盛林,等. 數(shù)據(jù)驅(qū)動的綜合能源系統(tǒng)負荷預(yù)測綜述[J]. 中國電機工程學(xué)報,2021,41(23):7905-7924.
Zhu Jizhong,Dong Hanjiang,Li Shenglin,et al. Review of data-driven load forecasting for integrated energy system[J]. Proceedings of the CSEE,2021,41(23):7905-7924(in Chinese).
[20]韋琦,楊明. 改進神經(jīng)網(wǎng)絡(luò)算法的智能電網(wǎng)短期負荷預(yù)測[J]. 哈爾濱理工大學(xué)學(xué)報,2017,22(4):65-69.
Wei Qi,Yang Ming. Short term load forecasting based on improved neural network algorithm[J]. Journal of Harbin University of Science and Technology,2017,22(4):65-69(in Chinese).
[21]張海,李士心,石軍,等. 基于串行式GA-BP的短期負荷預(yù)測方法[J]. 電力系統(tǒng)及其自動化學(xué)報,2021,33(4):97-101,107.
Zhang Hai,Li Shixin,Shi Jun,et al. Short-term load forecasting method based on serial GA-BP[J]. Proceedings of the CSU-EPSA,2021,33(4):97-101,107(in Chinese).
[22]Dong Y,Dong Z,Zhao T,et al. Short term load forecasting with markovian switching distributed deep belief networks[J]. International Journal of Electrical Power & Energy Systems,2021,130(1):106942.
[23]楊甲甲,劉國龍,趙俊華,等. 采用長短期記憶深度學(xué)習(xí)模型的工業(yè)負荷短期預(yù)測方法[J]. 電力建設(shè),2018,39(10):20-27.
Yang Jiajia,Liu Guolong,Zhao Junhua,et al. A long short term memory based deep learning method for industrial load forecasting[J]. Electric Power Construction,2018,39(10):20-27(in Chinese).
[24]丁斌,邢志坤,王帆,等. 基于Stacking模型集成的LSTM網(wǎng)絡(luò)短期負荷預(yù)測研究[J]. 中國測試,2020,46(7):40-45.
Ding Bin,Xing Zhikun,Wang Fan,et al. Short-term load forecasting of LSTM network based on Stacking model integration[J]. China Measurement & Test,2020,46(7):40-45(in Chinese).
[25]Wu K,Wu J,F(xiàn)eng L,et al. An attention-based CNN-LSTM-BiLSTM model for short-term electric load forecasting in integrated energy system[J]. International Transactions on Electrical Energy Systems,2021,31(1):e12637.
[26]張智晟,于道林. 考慮需求響應(yīng)綜合影響因素的RBF-NN短期負荷預(yù)測模型[J]. 中國電機工程學(xué)報,2018,38(6):1631-1638,1899.
Zhang Zhisheng,Yu Daolin. RBF-NN based short-term load forecasting model considering comprehensive factors affecting demand response[J]. Proceedings of the CSEE,2018,38(6):1631-1638,1899(in Chinese).
[27]Ruspini E H. Numerical methods for fuzzy clustering[J]. Information Sciences,1970,2(3):319-350.
[28]Zhang L,Lu W,Liu X,et al. A global clustering approach using hybrid optimization for incomplete data based on interval reconstruction of missing value[J]. International Journal of Intelligent Systems,2016,31(4):297-313.
[29]Varadharajan S K,Nallasamy V. P-SCADA—A novel area and energy efficient FPGA architectures for LSTM prediction of heart arrthymias in biot applications[J]. Expert Systems: The International Journal of Knowledge Engineering,2022,39(3):e12687-1-16.
[30]李濱,陸明珍. 考慮實時氣象耦合作用的地區(qū)電網(wǎng)短期負荷預(yù)測建模[J]. 電力系統(tǒng)自動化,2020,44(17):60-68.
Li Bin,Lu Mingzhen. Short-term load forecasting modeling of regional power grid considering real-time meteorological coupling effect[J]. Automation of Electric Power Systems,2020,44(17):60-68(in Chinese).
[31]Mandal P,Senjyu T,Urasaki N,et al. A novel approach to forecast electricity price for PJM using neural network and similar days method[J]. IEEE Transactions on Power Systems,2007,22(4):2058-2065.
[32]王毅,張寧,康重慶,等. 電力用戶行為模型:基本概念與研究框架[J]. 電工技術(shù)學(xué)報,2019,34(10):2056-2068.
Wang Yi,Zhang Ning,Kang Chongqing,et al. Electrical consumer behavior model:Basic concept and research framework[J]. Transactions of China Electro-technical Society,2019,34(10):2056-2068(in Chinese).
[33]王成亮,鄭海雁. 基于模糊聚類的電力客戶用電行為模式畫像[J]. 電測與儀表,2018,55(18):77-81.
Wang Chengliang,Zheng Haiyan. A portrait of electricity consumption behavior mode of power users based on fuzzy clustering[J]. Electrical Measurement & Instrumentation,2018,55(18):77-81(in Chinese).
[34]Mandal P,Senjyu T,Urasaki N,et al. A novel approach to forecast electricity price for PJM using neural network and similar days method[J]. IEEE Trans Power Systems,2007,22(4):2058-2065.
[35]徐敏,劉中財,嚴曉,等. 容量增量內(nèi)阻一致性在線檢測方法[J]. 儲能科學(xué)與技術(shù),2019,8(6):1197-1203.
Xu Min,Liu Zhongcai,Yan Xiao,et al. Online detection method for incremental capacity internal resistance consistency[J]. Energy Storage Science and Technology,2019,8(6):1197-1203(in Chinese).
[36]崔芮華,李澤,佟德栓. 基于相空間重構(gòu)和PCA的航空電弧故障檢測[J]. 中國電機工程學(xué)報,2021,41(14):5054-5065.
Cui Ruihua,Li Ze,Tong Deshuan. Arc fault detection based on phase space reconstruction and principal component analysis in aviation power system[J]. Proceedings of the CSEE,2021,41(14):5054-5065 (in Chinese).
[37]李澤文,胡讓,劉湘,等. 基于PCA-DBILSTM的多因素短期負荷預(yù)測模型[J]. 電力系統(tǒng)及其自動化學(xué)報,2020,32(12):32-39.
Li Zewen,Hu Rang,Liu Xiang,et al. Multi-factor short-term load prediction model based on PCA-DBILSTM[J]. Proceedings of the CSU-EPSA,2020,32(12):32-39(in Chinese).
[38]江知航,王艷霞,顏家均,等. 基于BILSTM的棉花價格預(yù)測建模與分析[J]. 中國農(nóng)機化學(xué)報,2021,42(8):151-160.
Jiang Zhihang,Wang Yanxia,Yan Jiajun,et al. Modeling and analysis of cotton price forecast based on BILSTM[J]. Journal of Chinese Agricultural Mechani-zation,2021,42(8):151-160(in Chinese).
BiLSTM Load Forecasting Method for Transformer Districts Integrated with Multiple Influencing Factors
Xi Wei1,Cai Tiantian2,Zhang Zhen1,Yu Hao1,Li Peng1
(1. Key Laboratory of Smart Grid of Ministry of Education,Tianjin University,Tianjin 300072,China;2. Digital Grid Research Institute of China Southern Power Grid,Guangzhou 510700,China)
Load forecasting for transformer districts is the key to meeting the power supply-demand balance and hence plays a significant role in guiding the early warning,emergency response,and economic operation of power systems. However,satisfactory short- and medium-term forecasted results for transformer districts are unavailable using conventional methods since the daily load forecasting is affected by various coupling factors. To improve the generalization capability of load forecasting for transformer districts,a bidirectional long short-term memory (BiLSTM)load forecasting model is proposed,which introduces principal component analysis(PCA)and electricity consumption behavior analysis. First,to achieve the dimensionality reduction and information correction of input variables containing redundant,missing,and error components,the PCA method is used to analyze the principal components of preselected external factors that affect the power load. Second,to eliminate the effects of behavior differences,the electricity consumption behavior of different categories of consumers is extracted and grouped using the fuzzy C-means(FCM) method based on genetic algorithm(GA),according to historical data. Third,to improve the generalization capability,BiLSTM forecasting models,which are optimized by the stochastic weight averaging (SWA)algorithm,are established for each category of consumers to forecast the daily load of the entire year. Finally,the load forecasted results for transformer districts are obtained using a linear superposition of load forecasted data from all categories of consumers. Based on the historical data of a low-voltage transformer district in China in the last four years,the forecasted annual electricity consumption of the PCA-BiLSTM model is closer to the real data and better reflects the electricity demand of consumers,compared with those obtained from other conventional LSTM models. Moreover,the classified forecasting method based on PCA and electricity consumption behavior analysis can effectively improve the accuracy of the forecasted results.
load forecasting;feature clustering;principal component analysis;bidirectional long short-term memory network
10.11784/tdxbz202208020
TM715
A
0493-2137(2023)11-1205-12
2022-08-15;
2023-02-20.
習(xí)?偉(1980—??),男,博士研究生,xiwei@csg.cn.Email:m_bigm@tju.edu.cn
張?鎮(zhèn),zhangz@tju.edu.cn.
國家重點研發(fā)計劃資助項目(2020YFB0906000,2020YFB0906001).
the National Key Research and Development Program of China(No. 2020YFB0906000,No. 2020YFB0906001).
(責(zé)任編輯:孫立華)