姜山,周秋鵬,董弘川,馬旭,趙振宇
(1.國網(wǎng)湖北省電力有限公司經(jīng)濟技術(shù)研究院,武漢 430077;2.華北電力大學工程建設(shè)管理研究所,北京 102206)
長期電力負荷的準確預測對電網(wǎng)規(guī)劃及電力基礎(chǔ)設(shè)施建設(shè)具有重要戰(zhàn)略意義。近年來,長期電力負荷預測多以年度負荷值的總體趨勢預測為主[1],較少考慮預測中數(shù)據(jù)慣性增長、周期性變化以及數(shù)值的累積效應(yīng),進而影響了負荷預測的準確性。因此,模型建模需要考慮年度負荷增長應(yīng)基于月度負荷累積的情況,以提高模型區(qū)間預測的分段精度,確保預測的準確性,將基于此項工作開展數(shù)據(jù)趨勢性和周期性預測的組合方法研究。
電力負荷預測方法包括參數(shù)化預測方法及非參數(shù)化預測方法。基于數(shù)據(jù)參數(shù)化特性的分析算法主要有機械學習算法及時間序列算法,機械學習如神經(jīng)網(wǎng)絡(luò)學習[2]、SVM支持向量機[3]、決策樹等. 該類方法采用迭代思維進行數(shù)據(jù)尋優(yōu)從而求得數(shù)據(jù)最優(yōu)解;時間序列ARIMA等方法通過人工參數(shù)設(shè)置實現(xiàn)數(shù)據(jù)自身發(fā)展趨勢規(guī)律的分析預測。為提高時間序列數(shù)據(jù)的預測精度,可將多種機械學習算法與ARIMA方法復合,實現(xiàn)數(shù)據(jù)的耦合修正[4]。非參數(shù)方法是一類直接或間接地從實際系統(tǒng)的實驗分析中得到的響應(yīng)分析方法. 如通過實驗記錄得到的系統(tǒng)脈沖響應(yīng)或階躍響應(yīng)[5],該類算法可充分挖掘數(shù)據(jù)自身規(guī)律的周期特性,基于數(shù)據(jù)的周期性通過數(shù)據(jù)的降維處理以預測區(qū)間單元內(nèi)數(shù)據(jù)走勢。為進一步提高長期電力負荷趨勢預測的準確度,將電力負荷數(shù)據(jù)進行年度及月度分解,把用以研究數(shù)據(jù)自身發(fā)展規(guī)律的ARIMA[6]方法融入BP神經(jīng)網(wǎng)絡(luò)算法內(nèi),提出改進的BP-ARIMA負荷趨勢預測模型,實現(xiàn)在多因素綜合影響下的年度電力負荷預測功能;引入函數(shù)型非參數(shù)方法對歷年月度數(shù)據(jù)進行數(shù)據(jù)分析,通過函數(shù)型時間序列預測模型對未來數(shù)據(jù)進行周期性預測,將趨勢性預測及周期性預測進行分量融合以得到新型組合預測模型,從而提升長期電力負荷預測的精確性。
為研究負荷數(shù)據(jù)發(fā)展特性,提出的新型組合預測模型是基于BP-ARIMA趨勢性預測及函數(shù)型非參數(shù)化周期性預測的綜合預測模型。BP-ARIMA模型是基于BP神經(jīng)網(wǎng)絡(luò)及ARIMA模型進行影響因素耦合獲取趨勢線而形成的改良方法,函數(shù)型非參數(shù)化方法通過引入適宜核函數(shù)對月度負荷開展周期性預測工作。
BP人工神經(jīng)網(wǎng)絡(luò)可實現(xiàn)輸入端與輸出端非線性函數(shù)的函數(shù)映射問題[7],具體算法可通過如下步驟實現(xiàn)。確定輸入向量X=[x1,x2,…,xn]T,輸出向量Y=[y1.y2. ….yn]T。設(shè)置初始化輸入層至隱含層連接權(quán)值ωij,隱含層至輸出層連接權(quán)值ωjk;具體過程函數(shù)為:
(1)
式中f1()、f2()分別為輸入層至隱含層、隱含層至輸出層神經(jīng)網(wǎng)絡(luò)激活函數(shù),以上為輸入模式的順向傳導過程,利用順向傳導過程所得輸出值求得輸出層校正誤差,再將輸出層誤差經(jīng)由隱含層逆向傳導至輸入層,循環(huán)往復直至訓練穩(wěn)定。
ARIMA(p,d,q)模型[8],是一種根據(jù)數(shù)據(jù)自身規(guī)律揭示系統(tǒng)動態(tài)結(jié)構(gòu)及發(fā)展規(guī)律的時間序列模型。文中該模型應(yīng)用于影響因素趨勢預測及趨勢線提取校核,ARIMA模型須將序列數(shù)據(jù)進行一次或多次差分以得到平穩(wěn)時間序列,基于數(shù)據(jù)的復雜程度對數(shù)據(jù)進行分析建模,模型表達式為:
(2)
式中?d=(1-A)d為數(shù)據(jù)的d階差分項;Φ(A)=1-φ1A-φ2A2-…-φpAp為模型的自回歸相關(guān)系數(shù)多項式;Θ(A)=1-θ1A-θ2A2-…-θqAq為滑動平均系數(shù)多項式。
函數(shù)型非參數(shù)回歸模型[9]可對周期性數(shù)據(jù)進行函數(shù)性質(zhì)的數(shù)據(jù)統(tǒng)計及預測,將觀測區(qū)間內(nèi)一次觀測到的數(shù)據(jù)視為整體,利用函數(shù)型數(shù)據(jù)分析方法對無限維中具有函數(shù)性質(zhì)的數(shù)據(jù)進行結(jié)構(gòu)分析,降低數(shù)據(jù)整體維度,提高數(shù)據(jù)推斷的準確度。函數(shù)模型表達式為:
(3)
式中Xi為函數(shù)型變量;響應(yīng)變量Yi為實值變量;εi為誤差項,構(gòu)成(Xi,Yi)數(shù)據(jù)對。通過Nadaraya-Watson(N-W)核估計方法對函數(shù)型非參數(shù)模型進行回歸函數(shù)估計. 具體估計模型表達式為:
(4)
式中K為對稱核函數(shù);窗寬h=hn為正實數(shù)序列;φ(h)為小球概率。
相關(guān)系數(shù)大小決定自變量與因變量間的相關(guān)性強弱. 檢查自變量與因變量間的共線性程度。通過分析數(shù)據(jù)之間的相互依存關(guān)系,為數(shù)據(jù)的遠期預測提供趨勢框架. 防止預測效果失真。采用皮爾森相關(guān)性系數(shù)對影響因素與年度負荷數(shù)據(jù)進行相關(guān)性檢驗,相關(guān)性系數(shù)表達式為:
(5)
式中Cov(X,Y)為X、Y序列數(shù)據(jù)協(xié)方差;σx,σy為X、Y序列數(shù)據(jù)標準差。
所研究的基于函數(shù)型非參數(shù)方法的BP-ARIMA預測模型將時間序列數(shù)據(jù)進行分解,在采用相關(guān)性檢驗對影響因素進行初步篩選的情況下,利用BP-ARIMA模型對時序性數(shù)據(jù)的年度負荷數(shù)據(jù)進行趨勢預測,利用函數(shù)型非參數(shù)方法對周期性月度負荷數(shù)據(jù)進行回歸估計。通過兩類數(shù)據(jù)的分量組合,提高模型長期預測的穩(wěn)定性及準確性,流程見圖1。
圖1 負荷預測流程圖
模型將區(qū)域電力負荷與區(qū)域生產(chǎn)總值、工業(yè)增加值、可支配收入等經(jīng)濟性、社會性指標相關(guān)聯(lián)[10]。提取各項因素數(shù)據(jù)的預測值,基于各影響因素耦合特點,對數(shù)據(jù)采取擬合分析,明確影響因素數(shù)據(jù)的精確走勢,并依據(jù)各個影響因素走勢及年度負荷數(shù)據(jù)進行BP神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)訓練,獲得年度電力負荷趨勢預測值。
采用MATLAB數(shù)據(jù)分析軟件[11],編制BP-ARIMA年度負荷預測模型,建模步驟如下:
(1)通過相關(guān)性檢驗方法初步檢驗影響因素與年度負荷值的相關(guān)性程度;
(2)電力負荷通過BP神經(jīng)網(wǎng)絡(luò)對各影響因素數(shù)據(jù)進行神經(jīng)網(wǎng)絡(luò)訓練?;谛:撕蟮囊蛩仡A測數(shù)據(jù). 提取影響因素趨勢數(shù)據(jù),趨勢線可精確判斷數(shù)據(jù)走勢及數(shù)值范圍;
(3)ARIMA模型進行各個影響因素的趨勢預測,采用已校核的趨勢線置換影響因素原始趨勢線。該過程可通過趨勢線預測進行進一步相關(guān)性檢驗,剔除呈弱相關(guān)性影響因素,利用多項式擬合方法輸出因素預測值;
(4)將各校核之后的影響因素數(shù)據(jù)與年度負荷數(shù)據(jù)耦合,開展年度負荷趨勢預測。
從已有研究看,學者普遍采用經(jīng)濟與社會指標分析對電力負荷的影響。由于區(qū)域GDP、區(qū)域財政投資、區(qū)域人口增長等對區(qū)域電力負荷增長起到正向促進作用,因此區(qū)域電力負荷增長及電力基礎(chǔ)設(shè)施建設(shè)與區(qū)域經(jīng)濟、社會指標增長存在必然聯(lián)系[12]。綜合現(xiàn)有研究,從經(jīng)濟發(fā)展、社會發(fā)展和工業(yè)生產(chǎn)角度進行相關(guān)數(shù)據(jù)的收集、整理與分析,相關(guān)影響因素如表1所示。
表1 1995年~2018年度用電量及相關(guān)因素統(tǒng)計數(shù)據(jù)
區(qū)域月度負荷數(shù)據(jù)存在周期性遞增特性,針對該類時間序列數(shù)據(jù),以整年(周期T=12)為單位生成函數(shù)型數(shù)據(jù),設(shè)生成隨機變量F,F(xiàn)在t=a到時間t=a+nT上的觀測值構(gòu)成一個連續(xù)的時間序列F(t)。月度負荷數(shù)據(jù)可看成是按周期T重復統(tǒng)計得到的。函數(shù)型數(shù)據(jù)[13]表達式為:
(6)
式中fi為第i年負荷函數(shù)型數(shù)據(jù),依據(jù)式(6)第三項可將觀測區(qū)間的[a,a+nT]上的連續(xù)時間序列F(t)轉(zhuǎn)化為{f1,f2,…fn},依據(jù){f1,f2,…fn}即可預測fn+1等遠期月度負荷數(shù)據(jù)。本預測模型通過{f1,f2,…fn}構(gòu)建函數(shù)型數(shù)據(jù)對。選取的核函數(shù)及半度量參數(shù)公式如下:
(7)
半度量參數(shù)的選取基于周期曲線導數(shù),d(xi,yi)中q值影響曲線的擬合程度。函數(shù)型非參數(shù)法還通過核函數(shù)中的窗寬(h)影響曲線擬合程度,通過交叉驗證的形式自動獲取窗寬。即:
(8)
從觀測到的(Xi,Yi)數(shù)據(jù)對中剔除最后第n項,基于前n-1項對數(shù)據(jù)進行函數(shù)型回歸分析。通過CV(h)取最小值時確定h的取值。將預測的第n項數(shù)據(jù)與負荷真實值進行比較,確定周期性函數(shù)預測的準確性。
綜合預測模型將年度趨勢性負荷預測與月度周期性負荷預測進行分量組合,可通過平均絕對百分誤差(MAPE)權(quán)重法[14]對月度負荷及年度負荷分配權(quán)重. 提高模型預測可靠性、準確性。負荷預測權(quán)重分配函數(shù)為:
(9)
式中Pload為負荷分量組合預測值;pm,py分別為月度負荷值、年度負荷值;ωm,ωy為月度、年度負荷值權(quán)重。
引入我國中部某省區(qū)域生產(chǎn)總值、固定資產(chǎn)投資額、年度區(qū)域用電量等指標,數(shù)據(jù)見表1,為提高負荷預測準確率,引入2006年~2018年間月度負荷指標,如表2所示。
表2 2006年~2018年間月度用電量統(tǒng)計數(shù)據(jù)
注:月度負荷單位為:億千瓦時
研究采用BP-ARIMA模型的相關(guān)通用參數(shù)及改進的ARIMA算法差異性參數(shù)見表3。其中n值為采用多項式擬合方法中多項式的最高次冪[15]。
表3 BP-ARIMA模型通用及差異性參數(shù)
將各影響因素分別與年度負荷值進行相關(guān)性檢驗,區(qū)域常住人口數(shù)量相關(guān)性系數(shù)較低,呈弱相關(guān)性. 各影響因素相關(guān)系數(shù)如表4所示。
表4 相關(guān)性檢驗
采用年度電力負荷值對各影響因素值進行神經(jīng)網(wǎng)絡(luò)訓練,校核各影響因素趨勢線。以城鎮(zhèn)居民人均可支配收入因素為例,如圖2所示,“菱形”標趨勢線從“圓形”標校核值序列中被提取出,并且將該校核的趨勢線植入原始數(shù)據(jù)中,形成“星形”標改良值,該法可對影響因素趨勢線進行一定程度的修正。依據(jù)ADF及AIC準則對各影響因素進行p、q、d判斷,采取最優(yōu)數(shù)組組合模擬,數(shù)據(jù)如表3所示。
圖2 城鎮(zhèn)居民人均可支配收入趨勢線分解及優(yōu)化圖
通過模型校核過程中的影響因素趨勢預測發(fā)現(xiàn),區(qū)域常住人口數(shù)量的模型走勢吻合程度較差,再次驗證了該因素與年度負荷值的弱相關(guān)性,數(shù)據(jù)模擬失真,效果如圖3所示。
圖3 常住人口數(shù)模擬結(jié)果
經(jīng)校核的ARIMA模型可基于數(shù)據(jù)結(jié)構(gòu)特性對其余強相關(guān)性的影響因素開展目標年預測,研究將1995年~2015年數(shù)據(jù)作為模擬樣本數(shù)據(jù),對2016年~2018年三年進行預測,部分影響因素預測效果對比見圖4和圖5。
圖4 固定資產(chǎn)投資額模擬結(jié)果
圖5 工業(yè)增加值額模擬結(jié)果
將經(jīng)過篩選及校核的影響因素與年度電力負荷通過BP-ARIMA預測模型進行多因素耦合預測,該模型為基于影響因素及負荷序列數(shù)據(jù)趨勢性發(fā)展的一類預測,年度區(qū)域用電量預測數(shù)據(jù)如圖6,圖中2019年~2021年為電力負荷模型預測值,未來三年電力負荷仍為增長趨勢,但增長速度有所放緩。
圖6 BP-ARIMA預測模型年度電力負荷預測值
研究基于函數(shù)型非參數(shù)化方法對月度電力負荷數(shù)據(jù)開展周期性預測,算法模型采用2006年~2015年間月度負荷數(shù)據(jù)進行非參數(shù)化算法學習,預測2016年~2021年間月度負荷數(shù)據(jù),比對2016年~2018年間月度真實數(shù)據(jù),真實值與預測值吻合程度較好,預測及對比結(jié)果如圖7所示。
圖7 函數(shù)型非參數(shù)方法月度電力負荷預測值
將BP-ARIMA模型與函數(shù)型非參數(shù)方法進行組合預測,2016年~2018年趨勢性預測值與周期性預測值進行MAPE權(quán)重方法組合。函數(shù)型非參數(shù)預測方法MAPE值1.17%小于BP-ARIMA的1.93%,經(jīng)兩種方法的分量融合,新型組合模型的MAPE值為1.59%,誤差結(jié)果相對理想,負荷預測數(shù)據(jù)如表5所示。
表5 研究模型預測結(jié)果
為體現(xiàn)該新型組合模型的預測優(yōu)勢,研究分別采用灰色預測模型GM(1,1)、GM(1,N)、BP神經(jīng)網(wǎng)絡(luò)模型、ARIMA模型等與該組合模型進行比較,誤差結(jié)果見表6,新型組合預測模型預測精度最高,MAPE值僅為1.59%,具有明顯的預測優(yōu)勢。
表6 模型誤差對比分析
同時,為驗證文中函數(shù)型非參數(shù)方法對周期性月度負荷的預測優(yōu)勢,研究采用隨機森林預測方法進行周期性預測比對,2016年~2018年間兩種方法的月度負荷預測對比結(jié)果見圖8,隨機森林預測方法MAPE誤差值為1.78%,誤差累計比非參數(shù)方法增加11.95%。從結(jié)果看,所采用的函數(shù)型非參數(shù)方法預測精度較高,適合于周期性數(shù)據(jù)預測。
圖8 非參數(shù)法與隨機森林方法的預測值比較
提出了一種新型的組合預測模型,該模型將年度負荷的趨勢性與月度負荷的周期性進行分量融合,模型既考慮了數(shù)據(jù)自身結(jié)構(gòu)的趨勢性、周期性特點,又通過影響因素耦合的特點增加了數(shù)據(jù)趨勢預測的合理性,數(shù)據(jù)的預測精度得到大幅提升。BP-ARIMA負荷預測模型將BP的非線性處理能力與ARIMA的線性預測能力相結(jié)合,通過趨勢線校核提高影響因素的預測精度及數(shù)據(jù)穩(wěn)定性,模型還可篩除相關(guān)性較差影響因素,利用因素之間的耦合特性提高年度電力負荷趨勢性預測的穩(wěn)定性。函數(shù)型非參數(shù)方法通過降維的處理手段實現(xiàn)數(shù)據(jù)的周期性預測,該法可通過選用合適的核函數(shù)達到良好的月度負荷預測精度。該組合預測模型可為長期電力負荷預測提供更為符合客觀事實依據(jù)的負荷預測方法。