劉 侃 ,何家峰 ,蔡高琰
(1.廣東工業(yè)大學(xué) 信息工程學(xué)院,廣東 廣州 510006;2.廣東浩迪創(chuàng)新科技有限公司,廣東 佛山 528200)
電力能源是與人們?nèi)粘I钕⑾⑾嚓P(guān)的,然而由于電力能源的調(diào)度存在延時(shí)性,導(dǎo)致電力資源沒有進(jìn)行合理分配,電力浪費(fèi)與短缺的兩極化現(xiàn)象依然存在。 針對這些問題,發(fā)展改革委[1]在2016 年提出電力企業(yè)應(yīng)總結(jié)2016 年電力生產(chǎn)運(yùn)行情況,分析預(yù)測2017 年電力供需形勢,提出政策建議,形成分析預(yù)測報(bào)告以達(dá)到合理調(diào)配電力資源,提高電力資源的利用率的目的。 國家在《中共中央關(guān)于制定國民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議》[2]中提出建設(shè)智慧能源系統(tǒng),優(yōu)化電力生產(chǎn)和輸送通道布局,提升新能源消納和存儲(chǔ)能力,因此基于歷史的用電量數(shù)據(jù)對未來的用電趨勢進(jìn)行預(yù)測是十分必要的。區(qū)域用電量預(yù)測是指通過該地區(qū)產(chǎn)生的歷史用電數(shù)據(jù)時(shí)間序列,預(yù)測未來該地區(qū)的用電量,據(jù)相關(guān)研究表明,預(yù)測誤差增加,將會(huì)提高電力預(yù)測的成本,因此提升用電量預(yù)測的精確度是十分必要的。
目前應(yīng)用于電量預(yù)測的方法主要分為三類,第一類為時(shí)間序列分析方法,包括指數(shù)平滑法[3]、加權(quán)法[4]等,這類方法可以有效地處理線性數(shù)據(jù),但是對于非線性數(shù)據(jù)的擬合效果不佳。 第二類為智能算法,智能算法可分為機(jī)器學(xué)習(xí)方法與深度學(xué)習(xí)方法,其中應(yīng)用于預(yù)測的機(jī)器學(xué)習(xí)方法有支持向量機(jī)算法[5]、隨機(jī)森林算法[6]、集成算法[7];深度學(xué)習(xí)方法有 BP 神經(jīng)網(wǎng)絡(luò)[8]、人工神經(jīng)網(wǎng)絡(luò)[9-11]、卷積神經(jīng)網(wǎng)絡(luò)[12-13]、循環(huán)神經(jīng)網(wǎng)絡(luò)[14-15]和遞歸神經(jīng)網(wǎng)絡(luò)[16-19]等。 智能算法能較好地處理非線性問題,但是在計(jì)算速度與魯棒性方面仍需進(jìn)一步改進(jìn)。 第三類為組合方法,組合方法是指將第一類與第二類方法結(jié)合的新方法,組合方法結(jié)合了兩類方法的優(yōu)點(diǎn),能較好處理非線性問題又能同時(shí)提高智能算法的計(jì)算速度與魯棒性。
LSTM 是一種循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的改進(jìn)方法,它有效避免了神經(jīng)網(wǎng)絡(luò)在運(yùn)算過程中出現(xiàn)的梯度消失與爆炸問題。LSTM 對于非線性、非平穩(wěn)的用電數(shù)據(jù)具有良好的擬合能力。ARIMA 是傳統(tǒng)的時(shí)間序列模型,廣泛地應(yīng)用于各種預(yù)測中,取得了較好的效果。 鑒于 LSTM 與ARIMA 在用電量預(yù)測領(lǐng)域展現(xiàn)出較強(qiáng)的預(yù)測能力,本文提出一種基于LSTM-ARIMA的區(qū)域用電量組合預(yù)測模型。 LSTM-ARIMA 組合模型較LSTM 模型的 RMSE、MAPE 分別提高了 16.17%、7.56%,比 ARIMA 模型的 RMSE、MAPE 分別提高了67.13%、44.19%。
ARIMA 模型由三個(gè)部分組成:自回歸模型AR(Auto Regression)、差分模型 I(Integrated)以及移動(dòng)平均模型 MA(Moving Average)。 ARIMA 模型是描述時(shí)間序列數(shù)據(jù)隨機(jī)過程的一個(gè)重要模型,差分模型可以去除數(shù)據(jù)中趨勢向,使得序列形成平穩(wěn)狀態(tài)以便于后續(xù)分析,自回歸模型用于擬合平穩(wěn)序列的數(shù)據(jù),移動(dòng)平均模型可以構(gòu)建出系統(tǒng)噪聲的回歸方程。 輸入時(shí)間序列數(shù)據(jù)集后,先進(jìn)行單位根檢驗(yàn)(Augmented Dickey-Fuller,ADF)以判別序列平穩(wěn)性,如果平穩(wěn)就進(jìn)行下一步建模,不平穩(wěn)則通過差分運(yùn)算至平穩(wěn)后再進(jìn)行建模分析, 通過序列的自相關(guān)函數(shù)(Autocorrelation Function,ACF)與偏自相關(guān)函數(shù)(Partial Autocorrelation Function,PACF)構(gòu)建 ARIMA(p,d,q)模 型 ,通過德賓瓦特遜檢驗(yàn)(Durbin Watson,DW)檢驗(yàn)殘差是否滿足正態(tài)分布, 再通過赤池信息準(zhǔn)則 (AIC)與貝葉斯信息量(BIC)值確定最優(yōu)模型,ARIMA 模型的數(shù)學(xué)表達(dá)式如下所示:
其中,▽代表差分,d 代表差分次數(shù),Φ(B)為 p 階自回歸系數(shù)多項(xiàng)式,Θ(B)為q 階移動(dòng)平均系數(shù)多項(xiàng)式,L 為該模型下的最大似然數(shù),n 是數(shù)據(jù)數(shù)量大小,k是模型變量的個(gè)數(shù)。
LSTM 模型又稱長短期記憶網(wǎng)絡(luò),它具有將上一個(gè)狀態(tài)的信息進(jìn)行添加或者刪除并傳送給下一個(gè)狀態(tài)的能力,其網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1 所示,數(shù)學(xué)表達(dá)式如式(7)~式(14)所示。 LSTM 模型由遺忘門、記憶門與輸出門組成。 遺忘門用于減少冗余信息,加快數(shù)據(jù)處理速度,σ 為 sigmoid 函數(shù),遺忘門的輸入信號(hào) 為 ht-1、xt, 其 中 ,ht-1為 LSTM 上 一 期 的 輸 出 信號(hào),xt為當(dāng)期的輸入值。 Ct-1為上一期 LSTM 的狀態(tài)信號(hào),bf是閾值矩陣,wf為權(quán)重矩陣,通過 sigmoid 函數(shù)后若輸出為 0,表示刪除信息。ft與 Ct-1行列值相同,ft與 Ct-1相乘是對于 Ct-1狀態(tài)信息的重新整合。 記憶門的作用是確定信息是否保留,與遺忘門不同的是增加了tanh 網(wǎng)絡(luò)層,它的作用是將數(shù)值規(guī)范到-1~1,通過 sigmoid 函數(shù)后若輸出為 1,表示保存信息,記憶門將信息與遺忘門的信息結(jié)合作為下一個(gè)狀態(tài)值 Ct。 輸出門的作用是輸出當(dāng)前狀態(tài)值Ct、隱藏狀態(tài) ht。
圖1 LSTM 網(wǎng)絡(luò)結(jié)構(gòu)圖
LSTM-ARIMA 預(yù)測模型的預(yù)測流程如圖2 所示,具體如下:
圖2 LSTM-ARIMA 組合模型預(yù)測流程圖
(1)對用電數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,將用電數(shù)據(jù)集的前82 個(gè)數(shù)據(jù)作為訓(xùn)練集,后 20 個(gè)數(shù)據(jù)作為測試集數(shù)據(jù)。 (2)用電量數(shù)據(jù)通過LSTM 模型進(jìn)行預(yù)測分析得到預(yù)測模型f1,殘差部分用ARIMA 模型進(jìn)行預(yù)測分析得到預(yù)測模型f2,將兩部分相加得到預(yù)測模型f。(3)將得到的組合預(yù)測模型 f 對測試集預(yù)測,得到預(yù)測結(jié)果并進(jìn)行模型精度判別分析。
用電量預(yù)測值為y^i,用電量真實(shí)值為 yi,將分析結(jié)果進(jìn)行對比。 模型預(yù)測的評判標(biāo)準(zhǔn)分為平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)。 平均絕對百分比誤差是數(shù)據(jù)集的真實(shí)值與預(yù)測值之間絕對值之和的平均值,反映的是模型的偏差水平,百分比值越小,模型預(yù)測越準(zhǔn)確。 均方根誤差反映的是數(shù)據(jù)點(diǎn)的離散程度,均方根值越小,證明數(shù)據(jù)點(diǎn)越密集,預(yù)測結(jié)果越穩(wěn)定。 本文基于這兩個(gè)標(biāo)準(zhǔn)對模型的準(zhǔn)確度進(jìn)行評判。
數(shù)據(jù)集是廣東省佛山市某工業(yè)園區(qū)自2018 年1 月 4 日至 2019 年 12 月 31 日的周度用電量數(shù)據(jù)集,數(shù)據(jù)樣本一共102 條數(shù)據(jù),每個(gè)數(shù)據(jù)樣本是一周7 天的用電量之和,用電量數(shù)據(jù)曲線如圖3 所示。實(shí)驗(yàn)平臺(tái)為裝有NVIDIA Tesla P100 GPU 的服務(wù)器,本文的編程由 Python 實(shí)現(xiàn),LSTM 模型采用的是Keras 框架,ARIMA 模型采用的是 Py-ARIMA 框架。
圖3 用電量曲線圖
某工業(yè)園區(qū)的入駐企業(yè)共122 家,其中以從事信息技術(shù)服務(wù)以及產(chǎn)品深加工企業(yè)為主,大部分企業(yè)的員工上班時(shí)間為8 小時(shí)。 智能電表在電量數(shù)據(jù)采集中存在無法避免的系統(tǒng)誤差,但誤差影響控制在極小范圍以內(nèi),所以認(rèn)為數(shù)據(jù)集中的用電量數(shù)據(jù)是真實(shí)可靠的,是可以反映出真實(shí)用電規(guī)律的。 從圖3 兩年的周用電數(shù)據(jù)曲線中可以觀察到,2018 年的周用電數(shù)據(jù)與2019 年的周用電數(shù)據(jù)的用電規(guī)律基本相似,夏季的用電量比其他月份用電量多。
將用電數(shù)據(jù)集中前82 個(gè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),預(yù)測后 20 個(gè)數(shù)據(jù)。 LSTM 模型設(shè)置為雙隱層結(jié)構(gòu),確定輸入層為 1,第一個(gè)隱含層為 10 層,第二個(gè)隱含層為 10 層,輸出層為 1 層。 經(jīng)過試驗(yàn)分析,確定最佳迭代次數(shù)為2 000 次。 用殘差數(shù)據(jù)擬合 ARIMA模型,ADF 檢測結(jié)果為0.032 67,此值小于顯著值5%,根據(jù)檢測標(biāo)準(zhǔn)認(rèn)為該序列平穩(wěn)。根據(jù)序列的ACF 與PACF 模型確定模型參數(shù) p、q,當(dāng) p=2、q=1 時(shí),AIC=-8.236 5,BIC=14.225,根據(jù) AIC 與 BIC 最小原則,認(rèn)為擬合模型為 ARIMA(2,0,1)。 ARIMA 模型預(yù)測曲線如圖 4 所示。
圖4 ARIMA 模型殘差預(yù)測曲線
ARIMA、LSTM 和 LSTM-ARIMA 組 合 模 型 對 于用電量序列預(yù)測曲線如圖5 所示。 可以觀察到LSTM 對于用電量序列的用電趨勢有很好的預(yù)測效果;ARIMA 無法準(zhǔn)確地預(yù)測到用電量序列的用電規(guī)律,預(yù)測精度與預(yù)測穩(wěn)定性低,這是由于用電量序列中包含大量的非線性數(shù)據(jù)影響了ARIMA 模型的預(yù)測效果;LSTM-ARIMA 模型在 LSTM 模型的基礎(chǔ)上增強(qiáng)了預(yù)測精度與預(yù)測穩(wěn)定性。
圖5 模型預(yù)測曲線
由表1 可以得到,LSTM-ARIMA 組合模型較LSTM模型的RMSE、MAPE 提高了 16.17%、7.56%,比 ARIMA模型的 RMSE、MAPE 提高了 67.13%、44.19%。
表1 模型預(yù)測精度與穩(wěn)定度
LSTM 與ARIMA 等機(jī)器學(xué)習(xí)與時(shí)間序列模型已經(jīng)廣泛地應(yīng)用于電力、水利、航天等多個(gè)領(lǐng)域的學(xué)術(shù)研究中。 本文采用LSTM-ARIMA 組合預(yù)測模型,選擇佛山市某工業(yè)園區(qū)近兩年的周用電數(shù)據(jù),通過實(shí)驗(yàn)對用電量數(shù)據(jù)進(jìn)行分析預(yù)測得到以下結(jié)論:
(1)本文基于“序列預(yù)測+殘差修正”思想提出的LSTM 與ARIMA 組合模型,經(jīng)實(shí)驗(yàn)表明組合模型的預(yù)測穩(wěn)定性與預(yù)測精度均優(yōu)于單一模型,因此組合模型相較于單一模型提高了短期用電量預(yù)測能力;
(2)本文中ARIMA 模型擬合非線性數(shù)據(jù)效果不佳;
(3)本文所提出的組合模型將對于區(qū)域短期用電量預(yù)測有一定的參考意義,也對于電力部門進(jìn)行優(yōu)化電力資源配置、減少電力資源浪費(fèi)具有一定價(jià)值。
如何改進(jìn)組合模型擬合效果提升其預(yù)測能力是后續(xù)研究內(nèi)容之一;本模型未將氣候因素納入到考察范圍,只考慮了歷史用電量因素,后續(xù)研究中將氣候變化納入到影響用電量變化的因素之一進(jìn)行預(yù)測分析,也是未來優(yōu)化模型的一個(gè)研究方向。