孫旺青,劉曉峰,何沁蔓
(南京師范大學 南瑞電氣與自動化學院,南京 210023)
近年來,我國電力事業(yè)快速發(fā)展,對電力系統(tǒng)的決策與規(guī)劃的要求不斷提高。作為電力系統(tǒng)的基礎環(huán)節(jié),提高售電量預測精度對電力系統(tǒng)平穩(wěn)運行有著重要意義[1]:一方面,準確的售電量預測可以幫助電力企業(yè)合理規(guī)劃發(fā)展計劃、優(yōu)化網(wǎng)絡布局并提高電力系統(tǒng)運行的安全性;另一方面,售電量直接反映了地區(qū)經(jīng)濟發(fā)展水平,準確的預測結果可以為當?shù)卣峁﹨⒖?,進而制定相應的政策適應地區(qū)發(fā)展。
為了深層挖掘用電量的變化規(guī)律,提高電力預測精度,精細化區(qū)分用電負荷是一個研究重點。文獻[2]從電力市場的角度出發(fā),分析了紡織業(yè)的容量變化特征及業(yè)擴報裝容量特征,根據(jù)影響紡織業(yè)變化的各項指標完成了對紡織業(yè)用電量的預測,但是該預測方法對預測對象的概率信息的準確度有較高要求,難以大面積推廣。而文獻[3]在預測過程中,使用的歷史數(shù)據(jù)跨度為24 年,對于早期歷史數(shù)據(jù)的有效性未作分析。文獻[4]對陜西售電公司的海量數(shù)據(jù)進行分析,建立了一套統(tǒng)計各行業(yè)同期售電量數(shù)據(jù)的方法,對各行業(yè)的同期售電量進行預測,但是該方法對行業(yè)劃分過于細致,不同行業(yè)之間存在交集,因此分類方法的針對性較低。文獻[5]結合不同行業(yè)的用電特性,對日負荷曲線進行建模,提出了分級預測的方法,可以對居民、商業(yè)、市政、文娛等行業(yè)完成精準預測。
對大量歷史數(shù)據(jù)進行分析處理,合理確定預測對象的影響因素可以顯著提高預測精度[6—7]。文獻[8]提出一種基于相似日的新型熱氣候指數(shù)矩陣與涵蓋多特征因素的最大信息系數(shù)熱環(huán)境評估方法,其中特征因素包括氣象、地理區(qū)位等,有效提高了負荷預測的精度。文獻[9]以海量數(shù)據(jù)為基礎,提出一種并行局部加權線性回歸模型,對大量數(shù)據(jù)進行處理,以15 min 為周期,考慮了各周期內(nèi)最高溫度與最低溫度,該模型運算時間短,精度符合預測要求。文獻[10]采用動態(tài)權值優(yōu)化,增強了相似日選取算法的適應性和有效性,在選取相似日時,充分考慮了環(huán)境因素,如溫度、濕度、降雨量,最后結合灰色模型完成了短期預測。文獻[11]結合經(jīng)驗模態(tài)分解與特征相關分析,量化分解后的負荷分量和特征信息之間的相關性時,考慮了天氣因素及電價變動對負荷量的影響,最后運用最小二乘支持向量機模型完成預測。文獻[12]重點分析了重大事件因素對售電量預測的影響,包括異常高溫、政治事件和超強臺風,這些因素使實際售電量嚴重偏離預測曲線,但文中所提解決方法較為繁瑣,需要根據(jù)不同事件逐個完成修正。
現(xiàn)有研究主要有如下一些不足:①由于售電對象包含各類用戶,不同類別用戶的用電規(guī)律都有所不同[13],因此有必要對各類用戶合理分類后單獨完成預測,上述關于行業(yè)預測電量的文獻[2]—文獻[6]大多采用回歸分析法,無法詳細描述各種影響電量的因素,且模型初始化難度大;②售電量容易受GDP、地區(qū)經(jīng)濟發(fā)展狀況、人口和氣候等多種因素的影響[14],有必要對影響售電量的眾多因素做分析,上述分析電量影響因素的文獻[8]—文獻[12]以天氣因素為主,較為單一。
針對上述問題,本文提出歷史相似月和Elman神經(jīng)網(wǎng)絡相結合的月度售電量組合預測算法,并通過灰色關聯(lián)度分析法[15]量化每個影響因素對預測結果的影響,對各類用戶的售電量進行分類預測,挖掘不同用戶的售電規(guī)律,最后利用MATLAB軟件對某公司的歷史售電數(shù)據(jù)進行分析并完成預測,驗證本文所提出的組合預測方法的有效性。預測流程如圖1所示。
圖1 預測流程Fig.1 Prediction flow
歷史樣本和待預測月份之間各類信息的相關程度直接影響了預測結果的準確度,因此本文在相似日的基礎上提出了相似月的概念。選取相似日時,由于時間跨度短,影響因素一般為氣溫、星期類型和節(jié)假日因素[16],用戶數(shù)量視為不變。但在選取相似月時,隨著時間跨度的增加,用戶數(shù)量的變化對售電量的影響也無法忽略。此外,由于不同月份之間時間跨度較大,氣溫的變化程度也更大,且不同類別的用戶對氣溫的敏感程度不同,因此各類用戶受氣溫變化的影響需要分類討論。綜上,本文將相似月影響因素定為氣溫-季節(jié)因素、日期差距因素、節(jié)假日因素、重大事件因素、售電對象數(shù)量5 個因素。依據(jù)這些因素得到月度售電量預測的相似度特征矩陣,用來表征歷史月與待預測月的相似程度,本文將相似度特征矩陣Η表示如下
式中:α為氣溫-季節(jié)因子;β為日期差因子;δ為節(jié)假日因子;θ為重大事件因子;ε為售電對象數(shù)量因子。
1.1.1 氣溫-季節(jié)因子
為了分析氣溫-季節(jié)類型對售電量造成的影響,需要通過氣溫-季節(jié)因子α來衡量歷史月和待預測月的相似程度。由于氣溫、季節(jié)因素對售電量的影響難以直接衡量,不同月份的氣溫、季節(jié)因素均有所不同,因此本文借助聚類的思想將月份分類。以農(nóng)業(yè)售電量為例,首先將每年各月份的農(nóng)業(yè)售電量完成歸一化處理,再求出每個月份的均值,最后通過K-means算法將各月份分為低售電量、中售電量、高售電量月份3組后,用0.3、0.5、0.7依次標記作為氣溫-季節(jié)參數(shù)。該方法的具體流程如圖2所示。
圖2 氣溫-季節(jié)參數(shù)計算流程(以農(nóng)業(yè)售電量為例)Fig.2 Calculation process of temperature-seasonal parameters(take agriculture for example)
氣溫-季節(jié)因子α表示如下
1.1.2 日期差因子
隨著時間的推移,月度售電量會因為經(jīng)濟的發(fā)展而呈上升趨勢。因此,如果樣本數(shù)據(jù)的日期與待預測月的日期差距過遠,那么樣本數(shù)據(jù)的參考價值將會大大減弱,所以本文引入了日期差因子β來衡量歷史月和待預測月之間日期的相似程度,日期差因子β表示如下
式中:fh和fp分別為歷史月和待預測月節(jié)假日信息。當歷史月和待預測月包含同一個節(jié)假日時,fh=fp,此時節(jié)假日因子δ=1,否則δ=0。
1.1.4 重大事件因子
各類用戶的購電行為會因為重大事件出現(xiàn)波動,如持續(xù)高溫、持續(xù)低寒、各類持續(xù)性突發(fā)事件等都會讓該月的售電量高于或低于同期,因此需要通過重大事件因子θ來判斷歷史月與待預測月是否具有類似的重大事件,重大事件因子θ表示如下
式中:ch和cp分別為歷史月和待預測月的重大事件信息。當歷史月和待預測月有相同的重大事件時,cp=ch,此時重大事件因子θ=1,否則θ=0。
1.1.5 售電對象數(shù)量因子
售電總量與用戶的數(shù)量有著密切的關系。對于每一類用戶,采用售電對象數(shù)量因子ε來衡量這一相似性,售電對象數(shù)量因子ε表示如下
式中:μh和μp分別為歷史月和待預測月該類售電對象的數(shù)量。
由于相似度向量5 個因子存在數(shù)量級上的差距,為了平衡各因子之間的權重,有必要對各影響因子進行歸一化處理,本文采用極值歸一化方法對各相似度因子進行處理,即
由于相似度特征矩陣中的5個影響因子對月售電總量的影響程度各不相同,本文利用灰色關聯(lián)度分析法,計算各影響因子與售電量的關聯(lián)度,并將結果作為該影響因素的權重,關聯(lián)度越大則權重越大。此外,考慮到售電量在長時間尺度上處于長升的趨勢,而影響因子中氣溫-季節(jié)因子、節(jié)假日因子和重大事件因子是處于以12 個月為周期的變化狀態(tài),本文在分析這3 個因子的關聯(lián)度時,以12 個月為周期,分多次計算上述因子與售電量的關聯(lián)度后取均值作為最終的結果,灰色關聯(lián)度分析法具體過程如下:
式中:ρ為分辨系數(shù),ρ越小,分辨能力越大,此處取ρ=0.5。
根據(jù)式(16),可獲得相似度因子集合S=[s1,s2,…,sN],從集合S中選取出若干與待預測月份相似度最高的歷史月,即可作為待預測月的歷史相似月。
Elman 神經(jīng)網(wǎng)絡屬于動態(tài)遞歸神經(jīng)網(wǎng)絡,相比于BP神經(jīng)網(wǎng)絡,Elman神經(jīng)網(wǎng)絡在隱含層增加一個承接層,通過存儲內(nèi)部狀態(tài)使其具備映射動態(tài)特征功能,系統(tǒng)因此具有時變特性,增強了網(wǎng)絡的全局穩(wěn)定性,在計算能力及網(wǎng)絡穩(wěn)定性方面都比BP神經(jīng)網(wǎng)絡更勝一籌。Elman神經(jīng)網(wǎng)絡為4層結構,包括輸入層、隱含層、承接層和輸出層,其中承接層可以存儲隱含層的狀態(tài)信息,因此網(wǎng)絡處理動態(tài)信息能力較優(yōu)。Elman 神經(jīng)網(wǎng)絡的輸入層、隱含層和輸出層表示形式分別如下
建立Elman神經(jīng)網(wǎng)絡,其中網(wǎng)絡的輸入層共有5個節(jié)點,輸入量為篩選出的目標類別用戶歷史相似月的各參數(shù),包括氣溫-季節(jié)因子、日期差因子、節(jié)假日因子、重大事件因子和售電對象數(shù)量因子;輸出層有一個節(jié)點,輸出的目標值為目標類別用戶當月的預測電量;隱含層的節(jié)點數(shù)量難以直接獲得,因此本文針對不同種類的售電對象,用多組隱含層節(jié)點數(shù)量來測試網(wǎng)絡的精確性,對比測試結果,選取精度最高的隱含層節(jié)點數(shù)量,見3.1節(jié)。在Elman神經(jīng)網(wǎng)絡的訓練學習過程中,歷史月的售電量數(shù)據(jù)作為目標輸出值,網(wǎng)絡內(nèi)部完成權值的修正來提高訓練精度。
為了驗證本文提出的組合預測方法的準確性和有效性,根據(jù)某省公司2016 年1 月至2019 年10月的數(shù)據(jù)作為樣本數(shù)據(jù),預測2019 年11 月和12 月的售電量數(shù)據(jù)。模型參數(shù)取值如下:衰減系數(shù)λ1=λ2=0.95,Y=12,N=46,分辨系數(shù)ρ=0.5。本算例采用的是Inteli5-8265U1.6GHz CPU 和8GB RAM的PC平臺進行分析。
為了尋找合適的歷史數(shù)據(jù)作為Elman神經(jīng)網(wǎng)絡的訓練集,以2019 年11 月的居民售電量的相似月為例。該類別的歷史相似月選取結果如表1所示。
表1 2019年11月的居民售電的相似月選取Table 1 Similar month choose of residential electricity sales of November 2019
Elman神經(jīng)網(wǎng)絡中隱含層節(jié)點數(shù)量沒有準確的計算公式,依賴于經(jīng)驗,因此本文在預測時,選取多組節(jié)點數(shù)量對比預測結果。以2019 年11 月居民售電量預測為例,圖3 給出了不同隱含層節(jié)點數(shù)時得到的不同的預測結果。從圖4 可以看出,當隱含層節(jié)點數(shù)量為7時,預測精度最高。所以2019年11月居民售電量預測時隱含層節(jié)點數(shù)取值為7,全部取值結果如表2所示。
表2 隱含層節(jié)點數(shù)Table 2 Number of hidden layer node個
圖3 隱含層節(jié)點數(shù)對預測結果的影響Fig.3 Effects of hidden layer node number on prediction results
圖4 兩種模型的誤差對比Fig.4 Error comparison between two models
將尋找到的相似度較高的月份信息作為訓練樣本,選取各自的隱含層節(jié)點數(shù)后,分別完成對2019 年11 月和12 月各類用戶的售電量預測,預測結果如表3 所示。從表3 可以看出,各類預測結果都有較高精確度,最大誤不超過3%,滿足工程應用要求。
表3 預測結果Table 3 The predicted results MWh
為了驗證本文提出的組合預測模型的實用性,圖4給出了不考慮相似月信息的單一Elman 神經(jīng)網(wǎng)絡的預測誤差對比。從圖4 可以看出,組合預測模型在選取合適的訓練集后,預測精度相比于單一的Elman神經(jīng)網(wǎng)絡有著顯著的提高。
對兩種模型的性能分析采用均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)來衡量,指標表示如下
表4 模型誤差分析Table 4 Model error analysis
本文提出歷史相似月和Elman神經(jīng)網(wǎng)絡相結合的月度售電量組合預測算法,并通過灰色關聯(lián)度分析法量化每一個影響因素對預測結果的影響。歷史相似月模型可以在海量數(shù)據(jù)中快速提取出與預測對象具有相似條件的歷史數(shù)據(jù),大大提高預測精度。Elman 神經(jīng)網(wǎng)絡可以任意精度逼近任意函數(shù),降低了模型復雜程度。相比于BP 神經(jīng)網(wǎng)絡,Elman神經(jīng)網(wǎng)絡具有動態(tài)特性好、逼近速度快、精度高的優(yōu)點。結合這兩種方法得到組合預測模型具有以下優(yōu)點:
(1)充分考慮地區(qū)經(jīng)濟狀況、人口和氣候等因素的影響,可以對影響月度售電量的眾多因素分析。
(2)對不同種類的用戶分類進行了月度售電量預測,充分考慮了不同用戶的售電規(guī)律。
本文提出的組合預測模型在收斂速度、預測精度等方面比單一預測模型都有較大提高,具有較強的實用價值。D