梁曦文,肖 峰,閔昊凌,王世杰
(華北電力大學水利與水電工程學院,北京 102206)
水力發(fā)電是我國發(fā)展清潔能源的一種重要形式,在電力系統(tǒng)中占有舉足輕重的地位,隨著國家“雙碳”目標的提出,將來會需要更多水電能源的支持,準確預測水電站發(fā)電量對電網(wǎng)調(diào)度及參與市場競爭具有重要意義[1,2]。徑流式水電站發(fā)電直接受河流變化影響[3],同時也受水力損失、水輪機組效率、工作流量等引水系統(tǒng)中的不確定因素的影響。王現(xiàn)勛等[4]分析了下游尾水頂托對水電綜合出力系數(shù)的影響,發(fā)現(xiàn)出力系數(shù)呈動態(tài)變化的特點,且發(fā)電流量是主要的影響因素。羅鑫燃等[5]提出了出力加權(quán)聚合法計算水電站綜合出力系數(shù),提高了計算結(jié)果的可靠性。王渤權(quán)等[6]基于最大熵和Couple函數(shù)構(gòu)建了來水預報值大小、預報誤差及出力誤差三者間的聯(lián)合分布模型,分析了不同預報情況下出力誤差的特點。整體來說,水能與電能之間是一個復雜的非線性轉(zhuǎn)化過程,因此建立準確的水電站出力數(shù)學預測模型更是十分困難,目前沒有統(tǒng)一的預測方法。
近年來ARMA 模型、神經(jīng)網(wǎng)絡及支持向量機等基于數(shù)據(jù)驅(qū)動的機器學習方法由于計算精度較高并且不受機理認知的局限性影響而在各個行業(yè)引起了廣泛關(guān)注[7-9],并且已逐漸應用到電力預測研究中。虞耀君[10]采用LSSVM 模型對小水電站的年發(fā)電量進行了預測,模型以前4年發(fā)電量作為特征向量輸入,以第5年發(fā)電量作為預測輸出進行滾動預測,結(jié)果表明,預測誤差較小,可以較好地反映整體的年發(fā)電量變化趨勢;MONTEIRO 等人[11]提出了一種區(qū)域水電發(fā)電量短期預測模型,模型以前一天的發(fā)電量和次日的預報降水量作為模型輸入,預測了水電站次日的發(fā)電量,取得了較好的結(jié)果;胡百林等人[12]基于ARMA 模型預測了水電站的年發(fā)電量,所得預測結(jié)果與實際較吻合。目前對水電預測的研究多用一種方法建立模型進行分析預測,未能充分挖掘時間序列中的隱含信息,不能反映發(fā)電序列中的變化機制。因此,進一步對時間序列進行分析,充分挖掘、提取反映序列變化規(guī)律的成分,再利用機器學習方法進行預測,是提高預測精度的關(guān)鍵。
小波分析[13,14]、經(jīng)驗模態(tài)分解EMD[15,16]和完備總體經(jīng)驗模態(tài)分解CEEMDAN[17,18]是用于分解復雜信號的方法,并已廣泛應用于時間序列的預處理階段[19,20]。小波分析法以其時頻局域化特性較好的特點被廣泛應用在時間序列的處理中,但存在小波基較難確定的弊端[21];EMD方法的優(yōu)勢是可以對時間序列自適應分解降噪,但由于分解方法的不穩(wěn)定性容易產(chǎn)生模態(tài)混疊問題,將對后續(xù)分析產(chǎn)生影響;CEEMDAN 方法通過在序列中加入白噪聲的方法減小模態(tài)混疊的影響,但分解后產(chǎn)生的虛假模態(tài)會影響算法的精確度。為了解決以上問題,王金良等人[22]提出了一種新的極點對稱模態(tài)分解法ESMD,采用內(nèi)部極點對稱插值,并通過引入最優(yōu)自適應全局均線來確定最佳篩選次數(shù),可實現(xiàn)信號自適應分解,可在不加入白噪聲的情況下,有效緩解了模態(tài)混疊問題。
本研究以西北某省徑流式水電站為研究對象,采用可有效分解復雜時間序列的ESMD 方法,以及結(jié)合了神經(jīng)網(wǎng)絡和最小二乘尋優(yōu)能力的最小二乘支持向量機(LSSVM)模型,建立了基于ESMD-LSSVM 的組合預測模型對水電站日出力進行預測分析,并與其他模型預測結(jié)果進行對比分析,驗證了該組合模型的有效性。
ESMD 模型是EMD 模型的改進和創(chuàng)新,該方法在保留了EMD 方法優(yōu)點的同時也解決了其中存在的“模態(tài)混疊問題”。ESMD分解時間序列的具體步驟如下[23]:
(1) 標記時間序列X(t)的所有極值點,用線段連接相鄰極值點,并將各線段的中點標記為Fj(j=1,2,…,n-1),并在序列的兩端補增邊界中點F0和Fn。
(2) 通過所獲取的F0到Fn個中點構(gòu)造T條插值線,并計算得到均值曲線L*:
(3) 對序列X(t)-L*重新進行上述,當|L*|≤ε,(ε為允許誤差),可得到第一個模態(tài)分量IMF1。
(4) 計算余下序列X(t)-IMF1,同樣進行以上步驟,得到各個模態(tài)分量IMF2,IMF3,…,以及最后剩余一定極點數(shù)的趨勢序列R。
(5) 將最大篩選次數(shù)K的范圍設置為[Kmin,Kmax],重復以上過程,確定方差比率δ/δ0最小時的K的取值,記為K0。
(6) 重復步驟(1)到步驟(4),計算當K=K0時分解得到的各模態(tài)分量及趨勢項R。原始序列等于分解結(jié)果之和。
偏自相關(guān)函數(shù)(PACF)是描述隨機過程結(jié)構(gòu)特征的一種方法。時間序列中滯后k階觀測值的PACF值表示在去除中間k-1 個滯后項觀測值之后,滯后k階觀測值與當前值之間的相關(guān)性。例如在時間序列y中,滯后3 階的PACF值,表示在去除了yt-1,yt-2的影響后,yt與yt-3之間的相關(guān)性。
滯后k階的偏向相關(guān)函數(shù)值PACF(k,k)的計算公式如下:
式中:ACF(k)為滯后k階的自相關(guān)函數(shù)值。
LSSVM 方法通過將最小二乘線性系統(tǒng)引入到支持向量機中解決函數(shù)估計問題,簡化了計算。模型步驟如下[24]:
(1) 應用核函數(shù)將訓練樣本集{(xi,yi),i=1,2,…,n}轉(zhuǎn)換到高維空間中,則有以下等式成立:
式中:xi為輸入向量;yi為預測值;T為核函數(shù);b為偏置量。
(2) 將回歸問題轉(zhuǎn)化成等式約束的優(yōu)化問題求解:
式中:c為懲罰參數(shù);ei為誤差。
(3) 建立拉格朗日等式:
式中:ξ為拉格朗日乘子。
(4) 依據(jù)KKT 原則及最小二乘法,消除w和e,求得b和ξi,最終得到LSSVM的回歸函數(shù):
式中:K(x,x)i為核函數(shù)。
本研究選取徑向基核函數(shù)RBF,表達式為:
式中:δ為核函數(shù)的寬度因子。
本研究建立ESMD-LSSVM 組合預測模型以提高徑流式水電站出力預測的精度,如圖1所示。組合模型步驟如下:
圖1 ESMD-LSSVM 組合預測模型Fig.1 ESMD-LSSVM combined prediction model
(1)對原始出力時間序列進行ESMD分解,可得到一組具有單一頻率的時間序列IMF及趨勢項序列R。
(3)分別計算各子序列IMF的PACF值,超出95%置信區(qū)間的部分,作為LSSVM的輸入向量。
(4)采用LSSVM 模型得到各子序列IMF及趨勢項R對應的輸出值序列。
(5)重構(gòu)各子序列IMF的輸出值,得到最終的徑流式水電站出力預測序列。
本研究采用確定性系數(shù)(R2),平均相對誤差(MAPE)和均方根誤差(RMSE)來評估預測的準確度。計算公式如下:
式中:N為預測次數(shù);x0(i)為出力觀測值;x(ci)為出力預測值。
本研究選取西北某省徑流式水電站2020 年日歸一化出力數(shù)據(jù),進行分析預測。
將原時間序列采用ESMD 方法進行分解,得到5 個子序列分別為模態(tài)分量IMF1、IMF2、IMF3、IMF4及趨勢項R,如圖2 所示。在圖2 中可以看到,水電站日出力序列的子序列IMF1的隨機性較強,趨勢項R的趨勢較平穩(wěn),反映了徑流式水電站日出力在一年中的非線性變化,日出力值在一年中的前3 個季度呈逐步上升趨勢,在9月末達到峰值后呈下降趨勢。
圖2 2020年徑流式水電站歸一化出力ESMD分解結(jié)果Fig.2 Normalized power ESMD decomposition results of hydropower station in 2020
徑流式水電站屬于無調(diào)節(jié)性能水電站,其出力的波動情況是多種不確定性自然因素影響作用的結(jié)果。徑流式水電站的出力雖然在短期內(nèi)表現(xiàn)出較大的隨機性和不確定性,但在長時間尺度上來看又具有某種規(guī)律。因此,徑流式水電站出力序列本身存在某種內(nèi)在規(guī)律,可通過分析時間序列內(nèi)在關(guān)系對未來出力進行預測[10]。本研究采用PACF 函數(shù)分析時間序列并提取潛在特征指標,將其作為LSSVM 預測模型中的輸入向量。輸入向量的選取遵循以下原則:①選出力序列中PACF值超出95%置信區(qū)間的出力值作為輸入向量。②當出力序列的PACF值均不在95%的置信區(qū)間內(nèi)時,將滯后1 天的出力作為輸入向量。
圖3 中第一個子圖為原始徑流時間序列的PACF值,其他子圖為ESMD 分解后的子序列的PACF值。分別對經(jīng)過ESMD分解得到的各子序列進行PACF 分析,如圖3子序列IMF1中,僅滯后階數(shù)為2、3、4 時的PACF值超出藍色陰影,即超出了95%的置信區(qū)間,故選xt-2,xt-3,xt-4為后續(xù)模型預測子序列IMF1時的輸入向量。預測各序列時的輸入向量如表1 所示??梢钥吹剑髯有蛄械妮斎胂蛄坎⒉幌嗤?,反映了徑流式水電站日出力的復雜性和多變性的特征。
表1 根據(jù)PACF值確定各序列的輸入向量Tab.1 Input vector for different data series based on PACF values and other information
整理子序列的輸入和輸出變量,共325組數(shù)據(jù),其80%作為訓練集,剩余20%作為驗證集進行模型預測。采用LSSVM模型分別對各子序列進行預測,并疊加各子序列的預測結(jié)果,從而得到最終的出力預測序列。如圖4 和表2 所示,子序列IMF1波長最短、振幅最小的特點,表明該序列的隨機性較強,采用LSSVM 模型進行預測,其訓練集和測試集的R2值均小于0.2,表明模型沒有學習到數(shù)據(jù)中的規(guī)律,IMF1為原始序列中分解出的無意義隨機序列。組合模型對子序列IMF2,IMF3,IMF4及R的預測達到了比較好的效果,R2值均在0.97 以上,RMSE值均小于0.01,MAPE均小于0.8%,表明經(jīng)過ESMD 模型分解后的序列,PACF函數(shù)可有效地識別時間序列內(nèi)在關(guān)系,確定模型的輸入向量。最后重構(gòu)各子序列的預測值,得到最終的出力預測序列,驗證集的R2值為0.979,RMSE值為0.022,MAPE值為0.558%,表明ESMD-LSSVM方法具有較好的預測效果。
圖4 ESMD- LSSVM 模型預測結(jié)果Fig.4 Prediction results of ESMD-LSSVM model
表2 ESMD-LSSVM 模型日出力預測結(jié)果Tab.2 Daily power prediction results of ESMD-LSSVM model
為比較ESMD-LSSVM組合模型的預測效果,本研究將預測效果與傳統(tǒng)的單一模型SVM、LSSVM、BP 及組合模型ESMDSVM、ESMD-BP進行對比,結(jié)果如圖5和表3所示。
圖5 機器學習模型預測結(jié)果對比Fig.5 Comparison of machine learning model predictions
表3 各模型測試集日出力預測結(jié)果Tab.3 Predicted results of daily power for each model's test set
可以看到,單一模型的預測結(jié)果相近,R2均在0.940 左右,RMSE均在0.037 左右,MAPE均小于1%,3 個模型相比之下,LSSVM 模型預測結(jié)果略好。但3 種單一模型在出力發(fā)生突變時(相鄰2 天出力相差過大或相鄰3 天的出力趨勢變化較大),這類點的預測值與觀測值之間的誤差較大,如圖4 中的紅框所示。3種組合模型的預測效果相近,R2均在0.978左右,RMSE均為0.022左右,MAPE均小于0.8%。組合模型的3個評價指標均優(yōu)于單一模型,與LSSVM 模型相比,ESMD-LSSVM 組合模型的R2提高4%,RMSE降低了39%,MAPE降低了20%。相比于單一模型,組合模型的泛化能力更好,對于時間序列中的出力突變點數(shù)據(jù)的預測效果較好,說明ESMD 分解有效地提取了時間序列的特征,可使機器學習模型達到更好的預測效果。由表3 可知,3種組合模型中,ESMD-LSSVM模型預測效果最好。本研究提出的ESMD-LSSVM 組合模型預測的R2值可到0.979,但對于像隨機性較強的子序列IMF1的預測效果欠佳,未來可通過更多的數(shù)據(jù)挖掘方法增加模型中此類子序列的輸入向量,以提升模型的預測效果。
由上述預測效果對比分析可知,徑流式水電站出力是非平穩(wěn)序列,采用單一的機器學習方法不能準確的學習到復雜的出力特征,ESMD-LSSVM 神經(jīng)網(wǎng)絡組合模型,可以克服EMD 模態(tài)混疊問題,實現(xiàn)了對復雜的出力時間序列的有效分解,利于后續(xù)PACF函數(shù)提取潛在特征指標及LSSVM 模型的學習和預測,可有效地提高了徑流式水電站日出力的預測精度。
針對徑流式水電站出力時間序列的隨機性和復雜性的特征,建立了ESMD-LSSVM組合模型進行日出力預測。首先采用ESMD 分解方法,無需選擇基函數(shù)及分解層數(shù),可以自適應地分解出力序列,易于后續(xù)分析;再通過PACF 函數(shù)分析各子序列內(nèi)在規(guī)律,得到各子序列的特征向量;最后采用LSSVM 模型對各子序列進行預測,并通過對所有的預測結(jié)果進行重構(gòu),得到最終的日出力預測結(jié)果。并與單一模型SVM、LSSVM、BP 及組合模型ESMD-SVM、ESMD-BP的預測結(jié)果對比,得到以下結(jié)論。
(1)采用ESMD 方法分解出力序列,并采用PACF 分析得到的各子序列的輸入變量,發(fā)現(xiàn)各子序列的輸入變量不同,反映了徑流式水電站日出力的復雜性和多變性的特征。
(2)PACF 函數(shù)可用于分析徑流式水電站日出力序列中間的內(nèi)在關(guān)系,確定序列中的特征向量。
(3)與單一預測模型相比,組合模型中的ESMD方法可有效提取時間序列中的特征,提高了組合模型的泛化能力,使對時間序列中出力突變點數(shù)據(jù)的預測更準確。
(4)ESMD-LSSVM 組合模型在西北某省的徑流式水電站日出力預測中取得了良好效果,為徑流式水電站短時出力預測提供了一種新方法。