谷學(xué)靜,陳洪磊,孫澤賢,張 怡
(1. 華北理工大學(xué)電氣工程學(xué)院,河北 唐山 063210;2. 唐山市數(shù)字媒體工程技術(shù)研究中心,河北 唐山 063000)
風(fēng)能作為一種清潔的可再生能源,具有無污染、清潔性、資源充足的特點,在世界能源領(lǐng)域占有越來越多重要的比例[1]。精確的風(fēng)功率預(yù)測可以降低電網(wǎng)的旋轉(zhuǎn)備用容量,有利于降低其運行成本及風(fēng)電對電網(wǎng)的負面影響[4]。
風(fēng)功率預(yù)測的方法主要包括三大類:物理方法、統(tǒng)計方法及兩種方法組合的方法[5],數(shù)值天氣預(yù)報模型(NWP)是物理方法之一,此方法利用氣象實況條件來進行預(yù)測,但是因為天氣預(yù)報數(shù)據(jù)更新頻率低、數(shù)值氣象模型復(fù)雜,一般不用于短期風(fēng)功率預(yù)測[6]。研究歷史風(fēng)電功率數(shù)據(jù)的規(guī)律一般使用統(tǒng)計方法,建立非線性間映射關(guān)系,從而使時間序列預(yù)測歷史風(fēng)力數(shù)據(jù)得到實現(xiàn)。由于機器學(xué)習(xí)、強化學(xué)習(xí)和深度學(xué)習(xí)近年來的快速發(fā)展,機器學(xué)習(xí)、強化學(xué)習(xí)和深度學(xué)習(xí)[9]模型比以前的模型得到了更精確的結(jié)果。支持向量機(SVM)[11]和人工神經(jīng)網(wǎng)絡(luò)(ANN)[14]這兩者都有非線性的特點,成為常用的機器學(xué)習(xí)預(yù)測模型。強化學(xué)習(xí)可以通過“試錯”的外部環(huán)境找到最佳的實施策略[18],并加強學(xué)習(xí)將其應(yīng)用于需求響應(yīng),形成一個完整的決策感知系統(tǒng),能夠有效地幫助確保問題的答案以可靠性和準確性為導(dǎo)向。隨著深度學(xué)習(xí)的發(fā)展,長短期記憶網(wǎng)絡(luò)(LSTM)不僅可以挖掘輸出變量與相關(guān)輸入變量之間的時空相關(guān)性,而且在復(fù)雜時間序列預(yù)測領(lǐng)域也得到了極大的發(fā)展[19]。目前,結(jié)合機器學(xué)習(xí)/深度學(xué)習(xí)技術(shù)的混合模型已經(jīng)被證明是更為可靠的預(yù)測模型。
張東英等[20]對風(fēng)電功率概率預(yù)測的定義預(yù)測方法和控制策略進行了綜述;Wang等提出了將經(jīng)驗?zāi)B(tài)分解(EMD)算法應(yīng)用于風(fēng)速預(yù)測模型[21];當一個單一的模型預(yù)測風(fēng)速時,它往往存在精度差的問題,越來越多的研究者開始研究組合模型。文獻[22]通過構(gòu)建CEEMDAN、VMD和AdaBoost的RT-ELM混合模型,能夠有效解決風(fēng)速時間序列的非線性問題,從而提高預(yù)測的準確性。王靜等提出了基于CEEMD和GWO的超短期風(fēng)速預(yù)測,兩種方法的結(jié)合能夠有效改變支持向量回歸機參數(shù)的預(yù)測模型,進而得到優(yōu)化[23]。文獻[24]推薦了一種利用LSTM網(wǎng)絡(luò)進行超短期風(fēng)功率預(yù)測,考慮多個不同NWP數(shù)據(jù)的輸入,預(yù)測精度高于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)。為了改進LSTM存在泛化能力差、容易造成過擬合等問題,李艷等提出了一種CNN-LSTM網(wǎng)絡(luò)模型進行風(fēng)電功率預(yù)測[25],利用CNN提取序列特征的能力有效提取子集,在刪除干擾內(nèi)存的數(shù)據(jù)后在LSTM上輸入數(shù)據(jù),進而較長的記憶信息能夠得到保留,解決梯度彌散問題。
通過對文獻的分析得出以下結(jié)論。分析表明,數(shù)據(jù)分解技術(shù)的應(yīng)用有效降低樣本噪聲干擾并顯著提高模型的預(yù)測性能。總體而言,在風(fēng)功率預(yù)測方面,混合模型比單一模型預(yù)測更加可靠、有效。
本文提出了一種基于變分模態(tài)分解(VMD)、強化學(xué)習(xí)(RL)參數(shù)尋優(yōu)和長短時記憶網(wǎng)絡(luò)(LSTM)的短期風(fēng)功率預(yù)測方法。變分模態(tài)分解不僅能夠消噪,還可以將原始信號的核心成分進行保留,分解后的效果較好。強化學(xué)習(xí)方法可以從實際系統(tǒng)的學(xué)習(xí)體會和經(jīng)驗中進行調(diào)整策略,這是一個慢慢地逼近最優(yōu)策略的過程。它在進行學(xué)習(xí)的過程中無需導(dǎo)師進行監(jiān)督。參數(shù)優(yōu)化可以優(yōu)化LSTM模型的參數(shù),使模型預(yù)測精度更加精確。LSTM神經(jīng)網(wǎng)絡(luò)是傳統(tǒng)RNN的改進版本,它在處理短期和長期依賴關(guān)系的問題時更加健壯。實例分析表明,混合模型可以有效提高短期風(fēng)電功率精度。
K.Dragomiretskiy和D.Zosso提出了一種新型復(fù)雜信號分解時頻分析方法,即變分模態(tài)分解。它可以將原始時間序列s(t)分解為有限帶寬的不同分量uk(t),根據(jù)預(yù)設(shè)的模態(tài)數(shù),對應(yīng)的中心頻率為ωk,通過交替迭代更新找到約束變分模型的最優(yōu)解,避免在迭代過程中遇到的端點效應(yīng)等問題。利用變分模態(tài)分解,能夠?qū)⒎蔷€性和非平穩(wěn)信號得到有效的處理。對比于EMD,解決了其端點效應(yīng)和模態(tài)分量混疊的問題,該算法可表示為[26]
1)對每一個uk(t)進行Hilbert變換得到單側(cè)頻譜
(1)
2)將模式的各個分析信號與估計的中心頻率e-jωkt相乘,頻譜移到基帶
(2)
3)利用高斯平滑估計對解調(diào)信號梯度L2進行正則化,可得出模態(tài)函數(shù)的各個帶寬,約束變分模型如下表示
(3)
4)隨著二次罰因子α和拉格朗日乘子λ的引入,原始時間序列在高斯噪聲影響下的信號重構(gòu)精度s(t)得到了保證,并將抑制變分問題轉(zhuǎn)化為無抑制變分問題
(4)
5)使用交替方向乘子法(ADMM),將分量uk(t)、中心頻率ωk和拉格朗日乘子λ進行求解更新,擴展拉格朗日函數(shù)表達式的最低點,更新過程如下
(5)
(6)
(7)
(8)
強化學(xué)習(xí)(reinforcement learning,RL)在機器學(xué)習(xí)領(lǐng)域中是被用來解決連續(xù)性的決策問題,它是指通過與環(huán)境的交互和學(xué)習(xí)而獲得的知識,自主進行的動作和選擇,通過不斷的試錯獲得最優(yōu)策略[27]。強化學(xué)習(xí)的重要特征是:通過強化學(xué)習(xí)來解決和處理這個問題的各種可能性目標都被簡單地作為一個標量來進行獎勵,強化學(xué)習(xí)的主要目標就是通過外部環(huán)境產(chǎn)生的獎勵,而不是Agent本身。所有強化學(xué)習(xí)都涉及映射學(xué)習(xí),該學(xué)習(xí)將環(huán)境的狀態(tài)或姿勢映射到適當?shù)膭幼骰騽幼鞯囊话惴峙?這種映射稱為策略。它指示在當前學(xué)習(xí)期間每個狀態(tài)代理應(yīng)采取的行為。
在強化學(xué)習(xí)的情況下,Agent的某種行為策略會帶來環(huán)境獎勵,模型如圖1所示。
圖1 強化學(xué)習(xí)基本模型
LSTM神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的一種,由于梯度爆炸或梯度消失的問題,RNN不適合長期依賴的任務(wù)[28]。它們只能解決短期依賴性任務(wù),而LSTM可以有效地學(xué)習(xí)長期依賴性任務(wù)。
LSTM是一種適合于時間序列預(yù)測問題的深度學(xué)習(xí)體系結(jié)構(gòu)。LSTM單元的內(nèi)部狀態(tài)存儲器提供了先前相關(guān)信息的內(nèi)部存儲。細胞的輸入、輸出和遺忘門負責(zé)通過細胞的信息流動。LSTM在這些門的幫助下處理和存儲相關(guān)信息。圖2顯示了LSTM細胞的內(nèi)部布局。LSTM單元的數(shù)學(xué)是使用等式(9)-(14)定義的。
圖2 LSTM單元結(jié)構(gòu)
ot=σ(Woht-1+Uoxt+bo)
(9)
it=σ(Wiht-1+Uixt+bi)
(10)
ft=σ(Wfht-1+Ufxt+bf)
(11)
st=tanh(Wht-1+Uxt+b)
由此可以看出SCADA系統(tǒng)的局限性:SCADA系統(tǒng)提供的數(shù)據(jù)只能作為參考值,并不能直接應(yīng)用于電力運行的參數(shù)設(shè)值;SCADA系統(tǒng)提供的數(shù)據(jù)有部分干擾值,需要人工進行正確的判斷;SCADA系統(tǒng)只能實現(xiàn)有限數(shù)據(jù)的采集與監(jiān)測。
(12)
st=ft⊙st-1+it⊙st
(13)
ht=ot⊙tanh(st)
(14)
式中,xt,st,st,ht分別表示時間步長t時的網(wǎng)絡(luò)輸入狀態(tài)、網(wǎng)絡(luò)狀態(tài)、暫態(tài)狀態(tài)和輸出狀態(tài)。it表示輸入門,ot表示輸出門,ft表示遺忘門。參數(shù)W、U、V分別為隱含層、輸入層、輸出層對應(yīng)的權(quán)值,b為偏差。操作符⊙表示元素級的乘法。σ和tanh分別表示sigmoid和tanh的激活函數(shù),它們是用方程(15)-(16)定義的。
(15)
(16)
與LSTM網(wǎng)絡(luò)結(jié)構(gòu)類似,深度門控循環(huán)單元(gated recurrent unit,GRU)相比于LSTM網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)減少了門單元和隱藏狀態(tài),并由重置門和更新門取代,內(nèi)部結(jié)構(gòu)比較簡單,但處理大量數(shù)據(jù)的效果不如LSTM網(wǎng)絡(luò)[29]。
基于VMD-RL-LSTM的短期風(fēng)功率預(yù)測模型如圖3所示。主要分為4個步驟。
圖3 基于VMD-RL-LSTM的短期風(fēng)功率預(yù)測模型
1)利用VMD方法將原始風(fēng)功率數(shù)據(jù)分解,由此獲得K個分量。
2)使用中心頻率法將分量的個數(shù)進行確定,把中心頻率值近似的分量確定為相似模態(tài),得到VMD各分量的中心頻率。
3)對分解后的分量分別構(gòu)建LSTM預(yù)測模型,然后利用RL學(xué)習(xí)模塊對其輸出進行評價,隨后反饋給預(yù)測系統(tǒng),對其進行參數(shù)調(diào)整和優(yōu)化。
4)將不同分量預(yù)測后的結(jié)果進行組合疊加,得到一個總的預(yù)測輸出,并通過誤差指標與其方法的比較分析模型的預(yù)測性能。
預(yù)測結(jié)果的準確性取決于數(shù)據(jù)集的質(zhì)量和數(shù)量。本文采用選用河北省某風(fēng)電場實際采集數(shù)據(jù),樣本的采樣周期為5min,選取6月1日-6月8日共2304個點作為樣本數(shù)據(jù)。原始風(fēng)功率數(shù)據(jù)如圖4所示,其中前2016個點(6月1日-6月7日)的數(shù)據(jù)作為訓(xùn)練樣本,后288個點(6月8日)的數(shù)據(jù)作為測試樣本。
圖4 原始風(fēng)功率數(shù)據(jù)
在本文中,K值用中心頻率確定,并且將其預(yù)設(shè)模式編號值K由小到大排列,當最后一層IMF分量的中心頻率保持相對穩(wěn)定時,此時可以考慮K作為最優(yōu)模式編號值。利用VMD方法分解不同K值的原始風(fēng)功率序列,獲得對應(yīng)的中心頻率,如表1所示。由此可以得到,最后一層分量的中心頻率在K>5后保持相對穩(wěn)定,故最優(yōu)值為K=6。通過多次反復(fù)試驗:α=1000;τ=0.3,為確保分解結(jié)果的精確度,分解結(jié)果如圖5所示。
表1 不同K值下各IMF分量中心頻率
圖5 VMD分解波形
建立LSTM短期風(fēng)功率預(yù)測模型,應(yīng)考慮樣本訓(xùn)練步長、輸入層維數(shù)、隱含層維數(shù)、輸出層維數(shù)等參數(shù)。通過強化學(xué)習(xí)選擇參數(shù)尋優(yōu),如表2所示。依據(jù)實踐的經(jīng)驗LSTM層數(shù)取L=2,考慮到模型訓(xùn)練的精度準確性和耗時性,時間步長設(shè)置為4,輸入層維數(shù)設(shè)置為1,隱含層層數(shù)設(shè)置為1,隱含層神經(jīng)元的數(shù)量可以設(shè)置為200,迭代的次數(shù)可以設(shè)置為300。初始化的學(xué)習(xí)速率一般設(shè)置在0.01,為了有效防止模型的來回振蕩,采用迭代速度衰減法進行動態(tài)地調(diào)整學(xué)習(xí)速度,每50次替換迭代地學(xué)習(xí)速度衰減50%。
表2 LSTM網(wǎng)絡(luò)參數(shù)選擇情況
通過VMD-RL-LSTM短期風(fēng)功率模型的預(yù)測,疊加各分量的預(yù)測值,將最終預(yù)測值與真實值進行比較,如圖6所示,該模型的預(yù)測值與真實值相吻合,預(yù)測精度較高。因此,本文建立的模型可進行短期風(fēng)功率預(yù)測。
圖6 模型預(yù)測結(jié)果
為了驗證VMD-RL-LSTM模型的預(yù)測性能,本文采用LSTM、EMD-LSTM、VMD-LSTM 3種風(fēng)功率預(yù)測方法進行對比分析,如圖7所示。以上預(yù)測模型利用均方根誤差RMSE、絕對平均誤差MAE、平均絕對百分誤差MAPE進行評價,模型預(yù)測誤差對比見表3。
表3 不同模型預(yù)測誤差
圖7 不同模型的預(yù)測結(jié)果
由表3可以看出, VMD-RL-LSTM模型的預(yù)測精度要比其模型更加精確。其均方根誤差RMSE、絕對平均誤差MAE、平均絕對百分誤差MAPE分別為135.10W、0.03%、83.09W,均方根誤差RMSE、絕對平均誤差MAE、平均絕對百分誤差MAPE與單一模型LSTM神經(jīng)網(wǎng)絡(luò)相比降低了2997.82W、1.81%、2153.56W;同時相比于EMD-LSTM、VMD-LSTM模型的預(yù)測精度有較大提高。說明VMD-RL-LSTM模型可以將短期風(fēng)功率預(yù)測的準確度進行有效提高。
本文在風(fēng)功率序列中采用變分模態(tài)分解進行穩(wěn)定化處理,通過強化學(xué)習(xí)參數(shù)尋優(yōu),建立各分量的LSTM預(yù)測子模型,最終把各子模型預(yù)測的數(shù)據(jù)進行疊加,從而獲得短期風(fēng)功率預(yù)測結(jié)果。通過實例分析與討論,得出以下結(jié)論:
1) VMD分解可以將不均勻、隨機的風(fēng)功率序列劃分為相對穩(wěn)定的IMF成分,增加了時間序列的可預(yù)測性。
2)在VMD-LSTM神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中采用強化學(xué)習(xí)算法,并對LSTM網(wǎng)絡(luò)參數(shù)進行尋優(yōu),實現(xiàn)了對VMD-LSTM網(wǎng)絡(luò)模型訓(xùn)練效率的提高,并能有效減輕過擬合現(xiàn)象。
3)VMD-RL-LSTM模型可以將短期風(fēng)功率進行有效的預(yù)測,與其典型短期風(fēng)功率預(yù)測模型比較而言,預(yù)測效果更佳。