宋江濤, 崔雙喜, 劉洪廣
(新疆大學(xué)電氣工程學(xué)院, 烏魯木齊 830047)
近年來,隨著人們生活質(zhì)量不斷提高,使得能源消耗也逐日增加,同時生態(tài)環(huán)境也受到了嚴重的破壞,所以必須尋找新的清潔能源代替化石能源去緩解這一現(xiàn)象[1]。風(fēng)能為一種環(huán)境友好型的綠色能源,其豐富的儲能讓它在各國得到了快速的發(fā)展。然而,風(fēng)能受氣象和環(huán)境等因素的制約,使得風(fēng)力發(fā)電呈現(xiàn)出波動與隨機等特點[2],這影響了電網(wǎng)對風(fēng)電的調(diào)度,阻礙了風(fēng)能的發(fā)展。目前,對風(fēng)電功率的精準預(yù)測是幫助運行人員實現(xiàn)合理的風(fēng)功率規(guī)劃和實時調(diào)度,保證電力系統(tǒng)可靠運行的重要方向[3-4]。現(xiàn)如今,超短期風(fēng)功率預(yù)測方法大致可以分為物理方法、時間序列方法、人工智能方法三大類[5-6]。物理方法主要是利用氣象數(shù)據(jù)和地面物理信息計算風(fēng)電機組輪轂高度的風(fēng)速大小與風(fēng)向等信息。通過物理方法預(yù)測風(fēng)功率不需要風(fēng)電場的歷史數(shù)據(jù),但其預(yù)測精度高度依賴氣象數(shù)據(jù)[7],由于氣象數(shù)據(jù)往往更新較慢,這導(dǎo)致物理方法預(yù)測精度較低。
時間序列法指只采用歷史功率數(shù)據(jù)來預(yù)測未來的功率數(shù)據(jù)的方法。時間序列法有:持續(xù)法、自回歸滑動平均法[8]等。時間序列方法雖然簡單,但其未考慮氣象因素,當(dāng)氣象變化劇烈時,其預(yù)測精度會隨時間的增加而降低。
人工智能是目前研究的熱門領(lǐng)域,其通過不同的人工智能方法找出功率影響變量和輸出功率之間的非線性映射關(guān)系。人工智能法主要包括極限學(xué)習(xí)機(extreme learning machines, ELM)[9]、支持向量機(support vector machine, SVM)[10]、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)[11]等。文獻[12]為解決風(fēng)功率預(yù)測過程存在過學(xué)習(xí)等問題,提出將支持向量機(SVM)應(yīng)用于風(fēng)功率預(yù)測,取得了較好的結(jié)果,但該方法應(yīng)用于大規(guī)模數(shù)據(jù)時結(jié)果并不理想。文獻[13-14]采用長短時記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory, LSTM)和其他機器學(xué)習(xí)模型作對比,結(jié)果表明LSTM預(yù)測精度更高,但如果輸入LSTM的數(shù)據(jù)質(zhì)量參差不齊時,其預(yù)測精度明顯下降,需要組合其他相關(guān)技術(shù)進行改善。文獻[15]提出了一種基于經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition, EMD)與LSTM組合預(yù)測方法,先用EMD對原始序列進行分解,將其再作為LSTM的輸入進行預(yù)測,該方法有效提高了LSTM的預(yù)測精度,但EMD容易產(chǎn)生模態(tài)混淆的現(xiàn)象。文獻[16]提出了變分模態(tài)分解(variational mode decomposition, VMD),該分解方式能夠有效解決EMD模態(tài)混淆的問題,但其效果與參數(shù)設(shè)置密切相關(guān)。文獻[17]采用麻雀搜索算法對VMD的參數(shù)進行尋優(yōu),并對各子模態(tài)采用不同LSTM參數(shù)分別進行預(yù)測,取得良好的預(yù)測效果。
為了充分挖掘數(shù)據(jù)信息,提高預(yù)測精度,許多學(xué)者嘗試研究二次分解技術(shù)。文獻[18]先采用快速集合經(jīng)驗?zāi)B(tài)分解(fast ensemble empirical mode decomposition, FEEMD)[19]將風(fēng)功率分解后,對其分解后的高頻模態(tài)采用VMD進行二次分解,有效提高了預(yù)測精度。文獻[20-21]均對分解后復(fù)雜程度較高的前幾個模態(tài)分量進行VMD二次分解。試驗表明二次分解技術(shù)的組合預(yù)測模型的預(yù)測精度較EMD、VMD等一次分解模型得到了很大提升。但目前使用變分模態(tài)分解(VMD)搭建的單次分解組合預(yù)測模型中,大多均直接忽略了風(fēng)功率經(jīng)VMD分解后殘差項,在二次分解風(fēng)功率組合預(yù)測模型中都未對分解后的殘差項進行二次分解,其都忽略了殘差項所包含的豐富信息。
鑒于以上問題和結(jié)論,現(xiàn)提出一種基于二次分解NGO-VMD殘差項與LSTM的超短期風(fēng)功率組合預(yù)測模型;首先,使用北方蒼鷹優(yōu)化算法(northern goshawk optimization,NGO)[22]對VMD的參數(shù)進行尋優(yōu),以選出最佳VMD參數(shù)組合;其次,采用NGO-VMD模型對VMD殘差項進行二次分解,利用K均值聚類算法解決VMD分解模態(tài)分量個數(shù)多,計算量繁冗的問題;最后,建立LSTM模型對各子模態(tài)分別預(yù)測并疊加各子模態(tài)的預(yù)測值得到超短期風(fēng)功率預(yù)測結(jié)果。通過對新疆某風(fēng)電場的實際發(fā)電功率的預(yù)測結(jié)果分析來驗證該組合模型可行性和優(yōu)越性。
變分模態(tài)分解是一種時頻分析方法,其能夠自適應(yīng)分解非平穩(wěn)信號,將原始多分量信號分解為多個調(diào)幅調(diào)頻單分量信號,有效避免了在迭代的過程中遇到的端點效應(yīng)等問題。
VMD分解的每個模態(tài)uk(t)具有不同的有限帶寬,而VMD的目標是使其分解的各子模態(tài)的估計帶寬的和最小,其變分模型表達式為
(1)
為了求解式(1),先構(gòu)建一個的增廣拉格朗日函數(shù),即
(2)
式(2)中:α>0;λ為乘法算子。
(3)
再更新中心頻率,方法為
(4)
最后更新λ(t)的傅里葉變換,即
(5)
式(5)中:τ為步長,τ>0。
VMD分解的具體流程如表1所示。
表1 VMD具體流程Table 1 VMD-specific process
北方蒼鷹優(yōu)化算法(northern goshawk optimiz-ation, NGO)是一種群體的優(yōu)化算法,該算法模擬了北方蒼鷹捕殺獵物時的行為,具有卓越的優(yōu)化性能,其尋優(yōu)準確度及穩(wěn)定性[22]。其規(guī)則如下。
步驟1初始化種群。種群成員在搜索空間中隨機初始化。在北方蒼鷹優(yōu)化算法中,北方蒼鷹種群用種群矩陣X為
(6)
式(6)中:Xi為第i個北方蒼鷹的位置;N為北方蒼鷹的種群數(shù)量;m為求解的維度;xi,j為第i個北方蒼鷹的第j維的位置。
進行北方蒼鷹優(yōu)化算法時,北方蒼鷹種群的目標函數(shù)值可以用向量表示,即
(7)
式(7)中:F為北方蒼鷹種群的目標函數(shù)向量;Fi為第i個北方蒼鷹的目標函數(shù)值。
步驟2獵物的識別和攻擊。獵物識別是北方蒼鷹在狩獵的第一階段,北方蒼鷹隨機選擇一個獵物,然后快速攻擊它。此階段為搜索空間的全局搜索,目的是識別最優(yōu)區(qū)域。數(shù)學(xué)模型為
Pi=Xk,i=1,2,…,N,k=1,2,…,i-1,
i+1,…,N
(8)
(9)
(10)
步驟3追逐和逃生。北方蒼鷹攻擊獵物后,獵物會試圖逃跑,北方蒼鷹需要繼續(xù)追逐獵物。北方蒼鷹的速度很快,所以它們幾乎可以在任何情況下追逐獵物并最終捕獲獵物。這種行為的模擬增加了算法對搜索空間的局部搜索的利用能力。在北方蒼鷹優(yōu)化算法中,假設(shè)這次狩獵范圍的半徑約為R。北方蒼鷹與獵物之間的追逐過程的數(shù)學(xué)模型為
(11)
(12)
(13)
表2 NGO具體流程Table 2 NGO-specific process
K-means算法是最為常用的一種經(jīng)典的聚類算法[23],基于數(shù)據(jù)之間的距離將相似特征的樣本自動歸到一個類別中,具有執(zhí)行過程簡單、收斂速度快的優(yōu)點。K-means算法的基本過程如下。
步驟1隨機選取K個點作為初始聚類的簇心。
步驟2分別計算其他每個樣本點到K個簇心的歐式距離,將其余所有樣本點歸屬到離該點最近的簇。
步驟3將所有樣本點都歸屬到對應(yīng)的K個簇后,更新簇心。
步驟4反復(fù)迭代步驟2~步驟3,直至簇心不再發(fā)生明顯的變化,即收斂。
長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)是為解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在信息傳遞時出現(xiàn)的梯度消失、爆炸等問題而提出的一種改進RNN神經(jīng)網(wǎng)絡(luò),其用記憶單元代替RNN的隱含節(jié)點,能夠有效可靠地處理長時間序列數(shù)據(jù)。
LSTM的核心是它的“細胞狀態(tài)”以及“門”結(jié)構(gòu)。細胞狀態(tài)是信息傳輸?shù)穆窂?相當(dāng)于網(wǎng)絡(luò)的“記憶”;“門”結(jié)構(gòu)的功能是實現(xiàn)信息的添加和丟棄。LSTM由多個重復(fù)的記憶塊結(jié)構(gòu)組成,每個記憶塊結(jié)構(gòu)都包含3個“門”結(jié)構(gòu),分別是遺忘門、輸入門及輸出門。LSTM利用激活函數(shù)σ來控制其3個“門”結(jié)構(gòu)。單個LSTM的結(jié)構(gòu)示意圖如圖1所示。
圖1 LSTM結(jié)構(gòu)示意圖Fig.1 Schematic diagram of LSTM structure
LSTM3個“門”變量運算公式如下。
(1)遺忘門層ft由sigmoid層決定信息的更新。
ft=σ(Wf[ht-1,xt]+bf)
(14)
(15)
(3)輸出門層有選擇性地輸出細胞狀態(tài)信息。
(16)
式中:xt為細胞輸入值;σ為sigmoid激活函數(shù);Wf、Wi、WC、Wo分別為遺忘門、 輸入門、細胞狀態(tài)、 輸出門sigmoid 激活函數(shù)的權(quán)重;bf、bi、bC、bo分別為遺忘門、 輸入門、細胞狀態(tài)、 輸出門sigmoid 激活函數(shù)偏置;ht為時刻t的隱藏層向量。
VMD可將原始風(fēng)電功率分解成不同頻率、具有較強規(guī)律性的風(fēng)功率子序列,降低了風(fēng)電功率序列的復(fù)雜度,但VMD必須需要預(yù)先人工設(shè)置其參數(shù),在一定程度上影響了VMD分解的精度和效果,具有一定局限性。由于VMD分解效果與參數(shù)懲罰因子α和分解層數(shù)K密切相關(guān),故本文采用北方蒼鷹優(yōu)化算法(NGO)對VMD的分解層數(shù)K和懲罰因子α進行尋優(yōu),將局部最小包絡(luò)熵作為參數(shù)尋優(yōu)的適應(yīng)度函數(shù)。
包絡(luò)熵可以反映原始風(fēng)電信號的稀疏特性,當(dāng)分解的子分量中包含較多的特征信息且噪聲較少時,則包絡(luò)熵值較小,反之,則包絡(luò)熵值較大。包絡(luò)熵Ep運算公式為
(17)
式(17)中:ej為a(j)歸一化得到的結(jié)果;a(j)為VMD分解的K個子分量經(jīng)過希爾伯特解調(diào)后的包絡(luò)信號。
NGO-VMD算法的流圖如圖2所示。
為了解決VMD分解出的模態(tài)分量個數(shù)過多,計算量繁冗的問題,通常需要對模態(tài)分量進行重構(gòu),已有文獻大多將熵值相似的分量分為一類完成重構(gòu),如使用樣本熵、排列熵[24]等。但使用熵值相似度進行各模態(tài)分量的重構(gòu)的方法并為考慮到各模態(tài)分量數(shù)據(jù)本身的相似性,存在一定缺陷,因此本文研究中使用K-means算法完成對模態(tài)分量的重構(gòu)。
K-means聚類算法基于數(shù)據(jù)之間的距離將相似特征的樣本自動歸到一個類別中,具有執(zhí)行過程簡單、收斂速度快的優(yōu)點,但其需要人工確定聚類個數(shù),具有一定局限性,為了更加合理地從不同角度地確定K-means的聚類個數(shù),使用輪廓系數(shù)法與Davies-Boundin(DB)值對各聚類個數(shù)進行得分評價。
輪廓系數(shù)s越接近1表示該聚類效果越好,其計算公式為
(18)
圖2 NGO-VMD算法流程Fig.2 Flow of NGO-VMD algorithm
式(18)中:disMeanout為該點與樣本中非本類點的平均距離;disMeanin為該點與樣本中本類點的平均距離。
DB值越小表示該分類效果越好。其計算公式為
(19)
式(19)中:K為分類數(shù)目;Si與Sj分別為樣本i和樣本j的類內(nèi)平均距離;Mij為i類與j類中心的距離。
為了解決在風(fēng)電功率預(yù)測領(lǐng)域VMD人工設(shè)置難度大、分解效果差、分解模態(tài)分量個數(shù)多,計算量繁冗,以及未深度挖掘VMD殘差項所包含的豐富信息導(dǎo)致超短期風(fēng)功率預(yù)測精度受限的問題,提出了一種基于NGO-VMD二次分解其殘差項、K-means重構(gòu)與長短期記憶網(wǎng)絡(luò)相結(jié)合的組合預(yù)測模型以提升超短期風(fēng)電功率預(yù)測精度。具體流程如圖3所示。
圖3 組合預(yù)測模型流程Fig.3 Combined predictive model process
為進一步驗證模型預(yù)測性能及其有效性,選用均方根誤差(RMSE)、平均絕對百分誤差(MAPE)、平均絕對誤差(MAE)、決定系數(shù)(R)對模型預(yù)測結(jié)果進行對比評估,其運算公式為
(20)
(21)
(22)
(23)
通過對新疆某風(fēng)電場的2019年實測風(fēng)電功率數(shù)據(jù)的預(yù)測分析和比較來驗證該組合模型的有效性和優(yōu)越性。研究對象為6月1日—7月1日的實際風(fēng)電功率數(shù)據(jù),同時采樣了風(fēng)速、風(fēng)向、溫度、氣壓、濕度等數(shù)據(jù),采樣的間隔為15 min,即每日采樣96個采樣點。將6月1—30日的2 880個數(shù)據(jù)集作為模型的訓(xùn)練集,將7月1日的96個數(shù)據(jù)集作為測試集。
采用2.1節(jié)方法對VMD的分解層數(shù)K和懲罰因子α進行尋優(yōu)。設(shè)置北方蒼鷹種群數(shù)為20、最大迭代次數(shù)為30;設(shè)置分解層數(shù)K的尋優(yōu)范圍為[3,15],懲罰因子α的尋優(yōu)范圍為[100,3 000]。VMD其他參數(shù)均取默認值。經(jīng)過北方蒼鷹優(yōu)化算法尋優(yōu)的VMD最優(yōu)參數(shù)組合[K,α]為[8,2 700]。NGO-VMD分解如圖4所示,最后一個分量為殘差項R,其大小為原始風(fēng)電數(shù)據(jù)減去NGO-VMD分解的8個分量。
圖4 NGO-VMD分解結(jié)果Fig.4 NGO-VMD decomposition results
將NGO-VMD分解的殘差項R進行二次VMD分解,使用北方蒼鷹優(yōu)化算法對殘差項R二次VMD分解的參數(shù)再次進行尋優(yōu),得到其最優(yōu)參數(shù)組合[K1,α1]為[6,2 300]。NGO-VMD二次分解R如圖5所示,最后一個分量為殘差項R1,其大小為殘差項R減去NGO-VMD二次分解的6個分量。
圖5 NGO-VMD二次分解結(jié)果Fig.5 NGO-VMD quadratic decomposition results
使用輪廓系數(shù)法與Davies-Boundin(DB)值將原始風(fēng)電數(shù)據(jù)NGO-VMD分解后的8個分量以及殘差項R二次分解后的6個分量進行聚類數(shù)目得分評價,以確定各分量最佳重構(gòu)個數(shù)。輪廓系數(shù)越接近1表示該聚類數(shù)目效果越好。DB值越小表示該聚類數(shù)目效果越好。
對首次原始風(fēng)電數(shù)據(jù)NGO-VMD分解的8個分量進行K-means聚類,其聚類數(shù)目設(shè)置范圍為[2,7]。由圖6可知其IMF最佳聚類數(shù)目K為4,此時輪廓系數(shù)值最接近1,為0.935 9;DB值最小,為0.160 5。
圖6 首次NGO-VMD分解聚類個數(shù)Fig.6 Number of first NGO-VMD decomposition clusters
對殘差項R二次NGO-VMD分解的6個分量進行K-means聚類,其聚類數(shù)目設(shè)置范圍為[2,5]。由圖7可知其IMF最佳聚類數(shù)目K為3,此時輪廓系數(shù)值最接近1,為0.715 6;DB值最小,為0.423 8。
圖7 二次NGO-VMD分解聚類個數(shù)Fig.7 Number of quadratic NGO-VMD decomposition clusters
LSTM輸入變量維數(shù)為6,包括風(fēng)電功率、風(fēng)速、風(fēng)向、溫度、氣壓、濕度;輸出變量維數(shù)為1,為風(fēng)電功率。將LSTM的迭代次數(shù)設(shè)為100次,初始學(xué)習(xí)率為0.005。由于Adam算法能計算不同參數(shù)下的學(xué)習(xí)率且運算速度快、內(nèi)存小,因此本文研究中LSTM求解器選擇為Adam。隨著LSTM隱藏層數(shù)的增加,雖然預(yù)測模型的擬合能力會進一步得到改善,但如果不加限制,會出現(xiàn)模型預(yù)測時間過長、過擬合等問題,因此本文設(shè)置LSTM隱藏層數(shù)為兩層,層數(shù)分別為100、50,為了避免出現(xiàn)過擬合現(xiàn)象,給LSTM每一層加入元素失活概率為20%的隨機失活(Dropout)層。
將NGO-VMD二次分解R-Kmeans-LSTM模型各部分的參數(shù)確定好后,用該模型預(yù)測首次及二次分解后重構(gòu)后的各子模態(tài)分量,并疊加各子模態(tài)分量的預(yù)測結(jié)果作為超短期風(fēng)功率預(yù)測的最終結(jié)果。為了驗證本文模型的有效性,構(gòu)建LSTM、未經(jīng)二次分解的NGO-VMD-LSTM、子模態(tài)未重構(gòu)的NGO-VMD二次分解R-LSTM 等模型與本文方法做對比,試驗結(jié)果如圖8及表3所示。
表3 不同方法誤差比較Table 3 Error comparison between different methods
從上述試驗結(jié)果可知本文方法可有效提升超短期風(fēng)電功率預(yù)測的準確度。為了進一步證明本文方法性能,選取其他文獻方法搭建組合預(yù)測模型進行對比,試驗結(jié)果如表4所示。
為改善超短期風(fēng)電功率預(yù)測精度,提出了NGO-VMD二次分解R-Kmeans-LSTM的組合預(yù)測模型。經(jīng)過多次試驗算例分析,得出以下結(jié)論。
表4 其他文獻不同方法誤差比較Table 4 Other literature different methods error comparison
(1)針對已有風(fēng)功率組合預(yù)測模型中大多均直接忽略了風(fēng)功率經(jīng)VMD分解后殘差項所包含的豐富信息的缺陷,通過二次分解組合預(yù)測方法,深度挖掘了VMD殘差項所包含的有效信息,提高了超短期風(fēng)電功率預(yù)測精度。
(2)首次將北方蒼鷹優(yōu)化算法用于對VMD的分解層數(shù)K和懲罰因子α尋優(yōu),得到NGO-VMD比EEMD等分解方法有更好的分解效果。
(3)考慮了VMD分解后各子模態(tài)分量數(shù)據(jù)本身的相似性,采用K-means算法進行聚類重構(gòu),解決了VMD分解模態(tài)分量個數(shù)多,計算量繁冗的問題,有效提升了超短期風(fēng)電功率預(yù)測時長和精度。