常雨芳,朱自銘,唐 楊,黃文聰
(湖北工業(yè)大學(xué) 電氣與電子工程學(xué)院,湖北 武漢 430068)
風(fēng)能作為潔凈高效的綠色新能源,有極大的隨機(jī)性與波動(dòng)性。所以對(duì)短期風(fēng)電功率預(yù)測(cè)成為風(fēng)電行業(yè)熱點(diǎn)問(wèn)題[1~4]。風(fēng)電功率預(yù)測(cè)方法分為基于物理學(xué)、統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)三類方法[5~10]。物理方法需要現(xiàn)實(shí)數(shù)據(jù),計(jì)算復(fù)雜。統(tǒng)計(jì)學(xué)方法通過(guò)分類法對(duì)不同時(shí)間序列分類,對(duì)其所屬類型匹配預(yù)測(cè)模型預(yù)測(cè)。在基于統(tǒng)計(jì)學(xué)預(yù)測(cè)模型中,常見(jiàn)分類方法包括模糊聚類法[11]和基于空間相關(guān)性的分類方法[12],預(yù)測(cè)方法有移動(dòng)平均法、自回歸法和自回歸差分移動(dòng)平均法[13]。為了提高預(yù)測(cè)精度,引入機(jī)器學(xué)習(xí)模型,包括支持向量機(jī)(support vector machines,SVM)[14]、極限學(xué)習(xí)機(jī)[15]和神經(jīng)網(wǎng)絡(luò)[16]等。采取智能優(yōu)化算法對(duì)機(jī)器學(xué)習(xí)模型參數(shù)尋優(yōu)[17,18]是一大研究熱點(diǎn)。最小二乘支持向量機(jī)(least square support vector machine,LSSVM)因其擁有優(yōu)秀的回歸預(yù)測(cè)性、易實(shí)現(xiàn)從而廣泛應(yīng)用,但該法的核函數(shù)參數(shù)σ和懲戒參數(shù)γ主要依靠人為經(jīng)驗(yàn)選取,精度不能滿足實(shí)際需求[19]。
本文提出一種基于完備總體經(jīng)驗(yàn)?zāi)B(tài)分解(complementary ensemble empirical mode decomposition,CEEMD)改進(jìn)麻雀搜索算法(sparrow search algorithm,SSA)優(yōu)化LSSVM(SSA-LSSVM)算法的預(yù)測(cè)方法,并通過(guò)某實(shí)測(cè)風(fēng)電場(chǎng)數(shù)據(jù)進(jìn)行仿真驗(yàn)證,證明上述改進(jìn)算法在某種情況下具有更加準(zhǔn)確可靠的預(yù)測(cè)性能。
CEEMD向待分解數(shù)據(jù)信號(hào)中加入大小相等符號(hào)相反的輔助噪聲信號(hào)[20]。CEEMD 有較好的自適應(yīng)性和完備性,既減輕了經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)算法的模態(tài)混疊現(xiàn)象,又不會(huì)對(duì)原始信號(hào)產(chǎn)生較大影響;因LSSVM 預(yù)測(cè)模型時(shí)間序列存在自相關(guān)性,上述CEEMD方法可以降低自相關(guān)性影響,最終表現(xiàn)在減少預(yù)測(cè)曲線滯后性。其主要步驟如下:
1)在原始時(shí)間序列Z(t)中,添加符號(hào)相反的輔助噪聲信號(hào)εi(t)
式中 cij為第i次添加輔助白噪聲,再分解的第j個(gè)模態(tài)分量,正負(fù)號(hào)分別為添加正負(fù)輔助噪聲信號(hào),重復(fù)步驟n 次,得n組本征模態(tài)分量,最后一組命名為趨勢(shì)項(xiàng)(Res)。計(jì)算集合平均值,得最終模態(tài)分量組ci(t)
LSSVM 將SVM 中非等式約束條件轉(zhuǎn)化為等式約束[21]。對(duì)于樣本集{(xi,yi)},其中,xi∈Rn為訓(xùn)練樣本的輸入向量,yi∈R為對(duì)應(yīng)預(yù)測(cè)輸出,N為樣本個(gè)數(shù),n為向量維數(shù),利用非線性函數(shù)φ(x),將樣本映射到高維特征空間,得出其回歸預(yù)測(cè)模型
式中 wT為特征空間內(nèi)權(quán)重向量,b為偏差,b∈R。
當(dāng)LSSVM用于回歸任務(wù)時(shí),依據(jù)最小化結(jié)構(gòu)風(fēng)險(xiǎn)原則,優(yōu)化模型可表示如下
式中 γ為懲戒參數(shù),ξi為松弛變量,?(xi)為原始數(shù)據(jù)映射之后的值,s.t.為約束條件,其他變量參考式(4),然后利用拉格朗日乘子法與KKT條件求解,可以獲得回歸函數(shù)如下所示
式中 αi為拉格朗日乘子,K(x,xi)為核函數(shù)。用RBF 為核函數(shù),得表達(dá)式為
式中 σ為核寬度值,為自由參數(shù),其中x與xi為原始序列值,對(duì)LSSVM預(yù)測(cè)精度與收斂速度影響較大的核函數(shù)參數(shù)σ和懲戒參數(shù)γ,本文用SSA對(duì)σ和γ尋優(yōu)。
1.3.1 SSA
SSA是依據(jù)麻雀覓食與逃避捕食者提出的群智能優(yōu)化算法。麻雀分為發(fā)現(xiàn)者與追隨者,發(fā)現(xiàn)者提供覓食區(qū)域與方向,追隨者追隨發(fā)現(xiàn)者[22]。發(fā)現(xiàn)者會(huì)較快找到食物,職責(zé)是引導(dǎo)追隨者尋食方向,所以發(fā)現(xiàn)者搜索范圍比追隨者大。
每一次迭代過(guò)程中,更新發(fā)現(xiàn)者位置為
式中 t為當(dāng)前迭代次數(shù),itermax為最大迭代次數(shù)。為第i個(gè)麻雀于第j維里的位置信息,為發(fā)現(xiàn)者更新之后位置。其中,α∈(0,1]為一個(gè)隨機(jī)數(shù)。R2∈(0,1]與ST∈[0.5,1]分別為預(yù)警值與安全值。Q 為服從正態(tài)分布隨機(jī)數(shù)。L為1 ×d矩陣,每個(gè)元素為1。
追隨者位置更新為
式中 Xp為目前發(fā)現(xiàn)者所占據(jù)的最優(yōu)位置;Xworst則為當(dāng)前全局最差的位置;t 和t +1 則分別為原始時(shí)刻和更新之后時(shí)刻;A為一個(gè)1 ×d矩陣,其中每個(gè)元素都被隨機(jī)賦值為1或-1,并且A+=AT(AAT)-1,其中,A+是偽逆矩陣。
當(dāng)意識(shí)到危險(xiǎn)時(shí),種群做出反捕食行為,其數(shù)學(xué)表達(dá)式如下
式中 Xbest為全局最優(yōu)位置;β為服從方差為1 正態(tài)分布隨機(jī)數(shù)的步長(zhǎng)控制參數(shù);K∈[-1,1]為一個(gè)隨機(jī)數(shù),表示麻雀移動(dòng)的方向,同時(shí)它也是步長(zhǎng)控制參數(shù);fi為目前該麻雀?jìng)€(gè)體適應(yīng)度值;當(dāng)前全局最佳與最差的適應(yīng)度值為fg和fw;ε為最小的常數(shù),以避免分母出現(xiàn)零的現(xiàn)象。當(dāng)fi>fg時(shí)為麻雀容易受到攻擊;當(dāng)fi=fg時(shí)為麻雀向其他個(gè)體靠近。
1.3.2 改進(jìn)SSA
針對(duì)傳統(tǒng)SSA在迭代后期種群多樣性減少,容易陷入局部最優(yōu)等難題,提出加入混沌序列與交換學(xué)習(xí)策略的改進(jìn)SSA。通過(guò)引入混沌序列,提高了初始解質(zhì)量,使初始麻雀位置分布更加均勻,增加了種群多樣性,通過(guò)交換學(xué)習(xí)策略增強(qiáng)了全局搜索能力。
混沌映射表達(dá)式如下
式中 NT為混沌序列中的粒子個(gè)數(shù),rand(0,1)為[0,1]之間的隨機(jī)數(shù),zi和zi+1分別為原始的種群和更新之后的種群,mod指取模運(yùn)算。據(jù)混沌映射特性,于域中產(chǎn)生混沌序列步驟如下:1)隨機(jī)產(chǎn)生(0,1)內(nèi)的初值z(mì)0,記i =0。2)利用上述式子進(jìn)行迭代,產(chǎn)生Z序列,同時(shí)i自增1。3)如果迭代的次數(shù)滿足最大次數(shù),則程序停止運(yùn)行,同時(shí)保存產(chǎn)生的Z序列,并將之作為麻雀算法的初始種群。
交換學(xué)習(xí)策略操作具體是在不同種群的相同維度中進(jìn)行相互交叉運(yùn)算,提高數(shù)據(jù)交互性[23]。針對(duì)SSA全局搜索能力不強(qiáng)問(wèn)題,采用交換學(xué)習(xí)策略對(duì)警戒者位置更新。第一步將父代個(gè)體進(jìn)行隨機(jī)的配對(duì),于第d 維進(jìn)行交換學(xué)習(xí)操作,公式如下
本文采用數(shù)值天氣預(yù)報(bào)(numerical weather prediction,NWP)數(shù)據(jù)輸入為4維,有風(fēng)速、風(fēng)向、溫度、濕度;輸出為風(fēng)機(jī)功率。
本文采用CEEMD對(duì)風(fēng)功率時(shí)間序列進(jìn)行分解,可降低預(yù)測(cè)模型中自相關(guān)性,避免預(yù)測(cè)值滯后于實(shí)際值,再采取預(yù)測(cè)性能強(qiáng)的LSSVM作為模型主體進(jìn)行風(fēng)功率預(yù)測(cè)。同時(shí),采用改進(jìn)SSA對(duì)LSSVM的核函數(shù)參數(shù)和懲戒參數(shù)優(yōu)化,可改善LSSVM預(yù)測(cè)精準(zhǔn)性?;贑EEMD和改進(jìn)SSA-LSSVM的超短期風(fēng)功率預(yù)測(cè)模型基本流程,如圖1所示。
圖1 風(fēng)功率聯(lián)合預(yù)測(cè)模型
基本流程如下:1)CEEMD 分解,得IMF 分量;2)利用SSA-LSSVM預(yù)測(cè)模型對(duì)多個(gè)IMF分量分別進(jìn)行預(yù)測(cè),對(duì)結(jié)果進(jìn)行求和,得到CEEMD-SSA-LSSVM預(yù)測(cè)結(jié)果;3)結(jié)果分為測(cè)試集訓(xùn)練結(jié)果與訓(xùn)練集預(yù)測(cè)結(jié)果,將訓(xùn)練集的預(yù)測(cè)結(jié)果輸入到改進(jìn)SSA參數(shù)尋優(yōu)中,可以獲得最優(yōu)核函數(shù)參數(shù)和懲戒參數(shù),最后將最優(yōu)值輸入模型得到最優(yōu)SSA-LSSVM預(yù)測(cè)模型,再將測(cè)試集代入得到預(yù)測(cè)結(jié)果。
本文采取中國(guó)西北部某風(fēng)電場(chǎng)實(shí)際數(shù)據(jù)進(jìn)行預(yù)測(cè),其中風(fēng)機(jī)負(fù)荷時(shí)序如圖2(a)。10 min一次采樣,取2173組數(shù)據(jù),其中1 522 組為模型訓(xùn)練集,余下為測(cè)試集。風(fēng)功率NWP數(shù)據(jù)是輸入,輸出為風(fēng)功率,同時(shí)將預(yù)處理之后數(shù)據(jù)進(jìn)行分解之后的負(fù)荷時(shí)序如圖2(b)所示。
圖2 風(fēng)電場(chǎng)功率時(shí)序與風(fēng)速數(shù)據(jù)CEEMD
平均絕對(duì)誤差(mean absolute error,MAE)、平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)和均方根誤差(root mean square error,RMSE)為評(píng)價(jià)指標(biāo)[24]。為增加可靠性,將仿真程序運(yùn)行時(shí)間和自相關(guān)函數(shù)(autocorrelation function,ACF)新增為評(píng)價(jià)指標(biāo),ACF 是用來(lái)計(jì)算時(shí)間序列自相關(guān)性。ACF描述的是一組時(shí)間序列和其前面間隔n個(gè)時(shí)刻的一組時(shí)間序列相關(guān)性[25]
式中 et為t時(shí)預(yù)測(cè)絕對(duì)誤差值;Rt為t 時(shí)真實(shí)值;m 為預(yù)測(cè)時(shí)間點(diǎn)數(shù)。式(17)中,ρ(t1,t2)是同一時(shí)間序列不同時(shí)間的相關(guān)性,βt1和βt2分別為t1和t2時(shí)間序列的方差,α(t1,t2)為上述兩時(shí)間序列協(xié)方差。
3.3.1 預(yù)測(cè)模型滯后性分析
為了驗(yàn)證本文中所提到的CEEMD方法可以改善預(yù)測(cè)算法自相關(guān)性,減少預(yù)測(cè)曲線滯后性,本文將單一預(yù)測(cè)模型LSSVM,單一預(yù)測(cè)模型SVM,SSA-LSSVM,CEEMD-LSSVM,CEEMD-SVM,CEEMD-SSA-LSSVM聯(lián)合預(yù)測(cè)模型645 組預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,并且將部分?jǐn)?shù)據(jù)局部放大,突出不同預(yù)測(cè)模型預(yù)測(cè)效果。在MATLAB 2020b 實(shí)驗(yàn)平臺(tái)進(jìn)行仿真,預(yù)測(cè)結(jié)果與局部放大如圖3、圖4所示。
圖3 預(yù)測(cè)模型結(jié)果
圖4 CEEMD分解預(yù)測(cè)模型結(jié)果
圖3(b)和圖4(b)均為選取的430 ~460 數(shù)據(jù)段,仿真結(jié)果表明:該段數(shù)據(jù)的分離性好,可以充分論證結(jié)論。綜合實(shí)驗(yàn)數(shù)據(jù)和圖像可得:
1)從圖3(b)和表1 中可知,SSA-LSSVM 預(yù)測(cè)模型的MAPE值是10.0894%,優(yōu)于單一LSSVM和SVM預(yù)測(cè)模型的11.5454%與11.6632%,分別提升了10.6732%和13.4937%,同時(shí)其平均預(yù)測(cè)準(zhǔn)確度提高了5.7496%與6.9583%,說(shuō)明聯(lián)合預(yù)測(cè)模型預(yù)測(cè)精度比單一高,也減少運(yùn)行時(shí)間。
表1 不同模型的誤差指標(biāo)對(duì)比
2)由圖3(b)和圖4(b)對(duì)比可知,圖中的LSSVM 與CEEMD-LSSVM模型的預(yù)測(cè)曲線與實(shí)際值滯后性降低,證明CEEMD分解可以極大改善預(yù)測(cè)數(shù)據(jù)的自相關(guān)性,表現(xiàn)在可以將部分預(yù)測(cè)曲線的滯后性大大降低,使預(yù)測(cè)值更加貼近實(shí)際值,提高了預(yù)測(cè)模型的應(yīng)用價(jià)值,實(shí)驗(yàn)結(jié)果表明上述方法可以將LSSVM單一預(yù)測(cè)模型的自相關(guān)性減少13.6%。通過(guò)進(jìn)一步觀察圖3(b),證明了CEEMD 分解對(duì)SSA-LSSVM聯(lián)合預(yù)測(cè)模型比單一預(yù)測(cè)模型改善效果更好。
3.3.2 基于改進(jìn)SSA的聯(lián)合預(yù)測(cè)模型
本文將改進(jìn)SSA-SVM,原始SSA-SVM 預(yù)測(cè)模型,改進(jìn)SSA-LSSVM 預(yù)測(cè)模型,原始SSA-LSSVM 和鯨魚(yú)優(yōu)化算法(whale optimization algorithm,WOA)優(yōu)化的LSSVM 模型5種模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,并且將它們的局部放大顯示,以便更加方便直觀地觀察出實(shí)際區(qū)別。仿真實(shí)驗(yàn)均在MATLAB 2020b實(shí)驗(yàn)平臺(tái)進(jìn)行,其預(yù)測(cè)結(jié)果與局部放大如圖5所示。誤差指標(biāo)對(duì)比如表2。
表2 不同模型的誤差指標(biāo)對(duì)比
圖5 不同模型預(yù)測(cè)結(jié)果
圖5(b)為選取545~595 數(shù)據(jù)段,通過(guò)仿真可得:該段數(shù)據(jù)分離性好,可以充分論證結(jié)論。綜合實(shí)驗(yàn)數(shù)據(jù)和圖像可得:圖5中改進(jìn)SSA提升了LSSVM預(yù)測(cè)模型精度。本文提出的引入混沌序列和交換學(xué)習(xí)策略的改進(jìn)SSA具有優(yōu)越性,通過(guò)引入混沌序列,提升初始解質(zhì)量,讓初始麻雀位置分布更均勻,增加了種群多樣性;引入交換學(xué)習(xí)策略增強(qiáng)算法全局搜索能力。結(jié)果顯示,上述方法較SSA-LSSVM 預(yù)測(cè)精度提高26.73%,即改進(jìn)后SSA對(duì)LSSVM 預(yù)測(cè)模型核函數(shù)和懲戒參數(shù)有較高尋優(yōu)精度,提高了預(yù)測(cè)模型應(yīng)用價(jià)值。
從表2中可知,CEEMD—改進(jìn)SSA-LSSVM 預(yù)測(cè)模型的MAPE值是9.073 4 %,優(yōu)于原始SSA-LSSVM 預(yù)測(cè)模型的11.123 6%,提升了18.4310%;優(yōu)于原始CEEMD-SSA-SVM模型的11.545 4%,提升了10.759 5%;優(yōu)于CEEMD-WOALSSVM的10.369 4%,提升了12.498 3%。實(shí)驗(yàn)結(jié)果證明:提出的聯(lián)合預(yù)測(cè)模型相較于上述預(yù)測(cè)模型有更好預(yù)測(cè)精度,其運(yùn)行時(shí)間較其他模型略微增加。
通過(guò)實(shí)例仿真得到以下結(jié)論:
1)CEEMD對(duì)數(shù)據(jù)分解,得到穩(wěn)定分量,強(qiáng)化模型對(duì)時(shí)間序列的學(xué)習(xí)捕捉能力,極大解決了非線性原始數(shù)據(jù)不平穩(wěn)導(dǎo)致誤差較大的問(wèn)題,同時(shí)改善了數(shù)據(jù)自相關(guān)性,最終表現(xiàn)在降低了預(yù)測(cè)曲線滯后性上,提高預(yù)測(cè)模型使用范圍。
2)本文通過(guò)組建聯(lián)合預(yù)測(cè)模型,運(yùn)用仿真平臺(tái)對(duì)比可以得到改進(jìn)后的SSA 對(duì)LSSVM 預(yù)測(cè)模型的核函數(shù)和懲戒參數(shù)優(yōu)化有較大提升,通過(guò)引入混沌序列,提升初始解質(zhì)量,讓初始麻雀位置分布更均勻,增加了種群多樣性;引入交換學(xué)習(xí)策略增強(qiáng)算法全局搜索能力。測(cè)試結(jié)果表明,改進(jìn)后的SSA優(yōu)化了傳統(tǒng)SSA 在迭代后期種群多樣性減少,容易陷入局部最優(yōu)等難題,具有較好應(yīng)用價(jià)值。