徐蓓蓓 蔣鐵錚 易 宏
(長(zhǎng)沙理工大學(xué)電氣與信息學(xué)院,長(zhǎng)沙 410114)
風(fēng)能作為一種無(wú)污染、可再生能源,已得到世界各國(guó)的高度重視[1]。目前,國(guó)內(nèi)外對(duì)于風(fēng)力發(fā)電各種課題的研究越來(lái)越深入,但其中關(guān)于風(fēng)電場(chǎng)風(fēng)速和功率預(yù)測(cè)的研究還達(dá)不到令人滿意的程度[2]。準(zhǔn)確預(yù)測(cè)風(fēng)速可以減少電力系統(tǒng)運(yùn)行成本,對(duì)于電網(wǎng)調(diào)度和資源配置有重要意義[3]。
目前,風(fēng)速預(yù)測(cè)的方法主要有持續(xù)預(yù)測(cè)法、卡爾曼濾波法(Kalman filters)[3]、隨機(jī)時(shí)間序列法(ARMA)[4]、人工神經(jīng)網(wǎng)絡(luò)法(ANN)[5]、模糊邏輯法(Fuzzy Logic)[6]、空間相關(guān)性法等(Spatial Correlation)[7]。人工神經(jīng)網(wǎng)絡(luò)法曾一度成為預(yù)測(cè)領(lǐng)域的研究熱點(diǎn),但也存在著許多至今無(wú)法解決的問(wèn)題。支持向量機(jī)是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的預(yù)測(cè)模型,其泛化能力要好于神經(jīng)網(wǎng)絡(luò)和自回歸模型,近些年來(lái)也被一些專家學(xué)者用于風(fēng)速預(yù)測(cè)[8]。最小二乘支持向量機(jī)、遺傳最小二乘支持向量機(jī)和經(jīng)驗(yàn)?zāi)J椒纸饨Y(jié)合最小二乘支持向量機(jī)三種方法是支持向量機(jī)模型的優(yōu)化延伸。
最小二乘支持向量機(jī)(LS_SVM)
用支持向量機(jī)(SVM)來(lái)估計(jì)回歸函數(shù)的基本思想就是通過(guò)一個(gè)非線性映射,把輸入空間的數(shù)據(jù)映射到一個(gè)高維特征空間中去,然后在此特征空間做線性回歸。SVM 模型采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則,不僅使樣本訓(xùn)練誤差最小化,而且縮小了模型泛化誤差的上界,從而提高了模型的泛化能力。通過(guò)將求解的機(jī)器學(xué)習(xí)問(wèn)題轉(zhuǎn)化為二次規(guī)劃問(wèn)題,SVM 可以得到惟一的全局最優(yōu)解[4]。最小二乘支持向量機(jī)(LS-SVM)是標(biāo)準(zhǔn)支持向量機(jī)的一種擴(kuò)展,它是支持向量機(jī)在二次損失函數(shù)下的一種形式。最小二乘支持向量機(jī)只求解線性方程,其求解速度快,在函數(shù)估計(jì)和逼近中得到了廣泛的應(yīng)用。算法的具體過(guò)程見文獻(xiàn)[9-10],最后得到的用于函數(shù)回歸估計(jì)的最小二乘支持向量機(jī)為
式中,K(xi,xj)稱為核函數(shù),K(xi,xj)=φ(xi)φ(xj),即等于2個(gè)向量xi和xj在其特征空間φ(xi)和φ(xj)的內(nèi)積。
常用的核函數(shù)有多項(xiàng)式核函數(shù)、(RBF)徑向基核函數(shù)和 Sigmoid核函數(shù)。本文選擇徑向基核函數(shù),原因是該核函數(shù)的應(yīng)用范圍是最廣的,且它直觀反映了兩個(gè)數(shù)的距離,其表達(dá)式為
遺傳算法是由美國(guó)密執(zhí)安(Michigan)大學(xué)J.H.Holland教授在1975提出的,是一種建立在自然選擇原理和自然遺傳機(jī)制上的迭代式自適應(yīng)概率性搜索方法。它模擬生物進(jìn)化的步驟,將繁殖、變異、雜交、選擇和競(jìng)爭(zhēng)等概念引入到算法中。該方法克服了傳統(tǒng)優(yōu)化方法較易陷入局部極值的弱點(diǎn),是一種全局優(yōu)化算法,其基本步驟如下:
步驟 1:設(shè)置算法的初始種群規(guī)模、最大遺傳代數(shù)、交叉概率、變異概率等初始值;
步驟 2:對(duì)染色體進(jìn)行編碼,隨機(jī)產(chǎn)生初始種群。本文采用實(shí)數(shù)編碼;
步驟3:計(jì)算群體中每個(gè)個(gè)體的適應(yīng)度函數(shù)值;
步驟 4:應(yīng)用選擇、交叉和變異算子產(chǎn)生新一代群體;
步驟 5:判斷是否符合停止準(zhǔn)則,如果滿足,則執(zhí)行下一步,否則返回步驟2,繼續(xù)計(jì)算;
步驟 6:把當(dāng)前代中出現(xiàn)的最好個(gè)體指定為計(jì)算結(jié)果,這個(gè)結(jié)果就是原優(yōu)化問(wèn)題的最優(yōu)解。
經(jīng)驗(yàn)?zāi)J椒纸夥ǎ╡mpirical mode decomposition EMD)是美籍華人Huang提出的一種適用于非平穩(wěn)信號(hào)的信號(hào)處理方法。從本質(zhì)上講,經(jīng)驗(yàn)?zāi)J椒纸夥ㄊ菍?duì)時(shí)間序列進(jìn)行平穩(wěn)化處理,其結(jié)果是將信號(hào)中不同尺度的波動(dòng)或趨勢(shì)逐級(jí)分解開來(lái),產(chǎn)生一系列具有不同特征尺度的數(shù)據(jù)序列,每一個(gè)序列稱為一個(gè)本征模式函數(shù)(intrinsic mode function,IMF),最低頻率的IMF分量通常情況下代表原始信號(hào)的趨勢(shì)或均值。
經(jīng)驗(yàn)?zāi)J椒纸獾倪^(guò)程主要如下:
1)對(duì)任一給定信號(hào)x(t),確定其所有極值點(diǎn),利用三次樣條函數(shù)分別把他們擬合為該信號(hào)的上下包絡(luò)線,計(jì)算出兩包絡(luò)線的均值,進(jìn)而求出待分解信號(hào)和均值的差值h。
2)若h不滿足IMF的要求,則重復(fù)上述過(guò)程若干次,直到得新的h滿足IMF的條件;若h滿足IMF的要求,則令h為原信號(hào)的第1個(gè)IMF,并求出原信號(hào)與該IMF的差值r。
3)將r作為待分解信號(hào),重復(fù)以上過(guò)程,直到剩余信號(hào)rn滿足預(yù)先給定的終止準(zhǔn)則,則終止整個(gè)分解過(guò)程。經(jīng)驗(yàn)?zāi)J椒纸獾淖罱K結(jié)果可以表示為
式中,ci(t)為第i個(gè)IMF分量,代表了原始信號(hào)x(t)中不同特征尺度的信號(hào)分量;rn為剩余分量,反映了原始信號(hào)x(t)的變化趨勢(shì)。
對(duì)于給定的風(fēng)速時(shí)間序列{X(t), t=1,2,···,n} ,支持向量機(jī)在選擇輸入輸出變量前需對(duì)數(shù)據(jù)序列進(jìn)行相空間重構(gòu),即將時(shí)間序列組轉(zhuǎn)化為矩陣來(lái)尋找數(shù)據(jù)間的關(guān)系。假設(shè)t時(shí)刻的風(fēng)速X(t)可由(t-1,t-2,···,t-m)時(shí)刻的歷史風(fēng)速值X(t-1),X(t-2),···,X (t-m)進(jìn)行預(yù)測(cè),則預(yù)測(cè)模型可表示為
式中,m為嵌入維數(shù)。m的確定采用以均方根誤差最小化為原則的增長(zhǎng)法。
由式(3)可以構(gòu)造出一個(gè)多輸入單輸出的最小二乘支持向量機(jī)預(yù)測(cè)模型。根據(jù)以上方法建立最小二乘支持向量機(jī)模型訓(xùn)練樣本的輸入和輸出矩陣。采用LS-SVMlab工具箱1.5b版編程,用數(shù)據(jù)滾動(dòng)的方法對(duì)模型進(jìn)行訓(xùn)練和預(yù)測(cè),即將當(dāng)下預(yù)測(cè)的風(fēng)速數(shù)據(jù)值視為已知數(shù)據(jù)滾入訓(xùn)練樣本集,于此同時(shí)將距離目前時(shí)間最遠(yuǎn)的數(shù)據(jù)刪除,并重新對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,對(duì)下一個(gè)小時(shí)的風(fēng)速數(shù)據(jù)進(jìn)行預(yù)測(cè),以此類推,直到完成全部的風(fēng)速預(yù)測(cè)。
利用遺傳算法優(yōu)化選擇最小二乘支持向量機(jī)參數(shù)的算法具體流程如圖1所示。
圖1 遺傳最小二乘支持向量機(jī)算法步驟
由于EMD技術(shù)在非平穩(wěn)數(shù)據(jù)處理中的突出優(yōu)勢(shì),將EMD與GA-LSSVM做結(jié)合,對(duì)風(fēng)電場(chǎng)風(fēng)速進(jìn)行預(yù)測(cè),起模型預(yù)測(cè)步驟如下:
1)將風(fēng)速時(shí)間序列進(jìn)行經(jīng)驗(yàn)?zāi)J椒纸猓瑢⒎瞧椒€(wěn)性時(shí)間序列分解成不同頻帶的高頻和低頻平穩(wěn)時(shí)間序列。
2)建立相應(yīng)的高頻和低頻時(shí)間序列GA-LSSVM預(yù)測(cè)模型。
3)將不同頻帶預(yù)測(cè)值等權(quán)求和集成得到最終預(yù)測(cè)結(jié)果。
原始數(shù)據(jù)為我國(guó)內(nèi)蒙古某風(fēng)電場(chǎng)的小時(shí)風(fēng)速序列,共采用了3組數(shù)據(jù),分別對(duì)未來(lái)24h、50h和120h風(fēng)速數(shù)據(jù)進(jìn)行預(yù)測(cè)。第一組數(shù)據(jù)為120個(gè),前96個(gè)數(shù)據(jù)用于建模和訓(xùn)練,后24數(shù)據(jù)用于預(yù)測(cè)結(jié)果分析;第二組數(shù)據(jù)為410個(gè),前360個(gè)數(shù)據(jù)用于建模和訓(xùn)練,后50個(gè)數(shù)據(jù)用于預(yù)測(cè)結(jié)果分析;第三組數(shù)據(jù)為600個(gè),前480個(gè)數(shù)據(jù)用于建模和訓(xùn)練,后120個(gè)數(shù)據(jù)用于預(yù)測(cè)結(jié)果分析。為了提高最小二乘支持向量機(jī)的泛化能力,對(duì)數(shù)據(jù)進(jìn)行歸一化處理,使數(shù)據(jù)歸一到[0,1]區(qū)間。
將三組數(shù)據(jù)分別代入3種預(yù)測(cè)模型,24h預(yù)測(cè)結(jié)果如圖1所示,50h預(yù)測(cè)結(jié)果如圖二所示,120h預(yù)測(cè)結(jié)果如圖3所示。
圖1 24h預(yù)測(cè)結(jié)果
圖2 50h預(yù)測(cè)結(jié)果
圖3 120h預(yù)測(cè)結(jié)果
為了評(píng)價(jià)模型的預(yù)測(cè)性能,采用以下統(tǒng)計(jì)量對(duì)模型的預(yù)測(cè)結(jié)果進(jìn)行評(píng)估。
平均絕對(duì)百分比誤差(MAPE):
式中,WR為實(shí)際風(fēng)速;WF為預(yù)測(cè)風(fēng)速;N為樣本數(shù)。
3種方法對(duì) 3個(gè)不同時(shí)間段的預(yù)測(cè)結(jié)果平均誤差百分比情況如表1所示。由預(yù)測(cè)結(jié)果可知,對(duì)于較短的時(shí)間周期 24h的預(yù)測(cè),3種方法的預(yù)測(cè)誤差差別并不大,直接使用 LSSVM模型也能得到較好的預(yù)測(cè)結(jié)果,遺傳算法并沒有體現(xiàn)出其優(yōu)勢(shì),那是因?yàn)?LSSVM對(duì)于小樣本的參數(shù)選擇有著較高的精度。結(jié)合 EMD后模型預(yù)測(cè)精度反而變差,這主要是由于 EMD分解一定程度上破壞了原始信號(hào)的吸引子形狀,但在較長(zhǎng)時(shí)間段的預(yù)測(cè)中表現(xiàn)出了明顯的優(yōu)勢(shì)。從50h和120h的預(yù)測(cè)結(jié)果中可以看出,遺傳算法對(duì)于 LSSVM參數(shù)的選擇開始起到了明顯的作用,樣本數(shù)越大,遺傳算法的優(yōu)勢(shì)就越明顯,在對(duì)未來(lái) 120h的預(yù)測(cè)中,GALSSVM 模型的誤差比LSSVM要小3.14%。同樣,在樣本數(shù)較大時(shí),結(jié)合EMD的預(yù)測(cè)模型得到了更高的預(yù)測(cè)精度,而在50h的預(yù)測(cè)中達(dá)到最好的優(yōu)化效果,比GALSSVM模型精度高1.93%,在120h的預(yù)測(cè)中也比GALSSVM高1.12%。由圖 1,圖 2,圖 3可以看出,結(jié)合 EMD的預(yù)測(cè)波形與實(shí)際波形在趨勢(shì)上比較相近,波形變化比較平穩(wěn),且在極值點(diǎn)有著較好的效果,而GALSSVM的波形在與實(shí)際波形趨勢(shì)相近的同時(shí),小范圍的波動(dòng)性會(huì)比較明顯,也更能體現(xiàn)風(fēng)的波動(dòng)的特性。
表1 3種方法預(yù)測(cè)結(jié)果
本文對(duì)3種基于最小二乘支持向量機(jī)的風(fēng)速預(yù)測(cè)模型進(jìn)行了討論,分別用這3種方法對(duì)短、中、長(zhǎng)3個(gè)時(shí)間段進(jìn)行了預(yù)測(cè)。對(duì)于短期的預(yù)測(cè),3種方法都有著較好的預(yù)測(cè)精度,且差別不大,對(duì)于中期和長(zhǎng)期的預(yù)測(cè),LSSVM模型開始體現(xiàn)出自身的弱點(diǎn),而結(jié)合了遺傳算法以及EMD的方法得到了更好的效果。在中長(zhǎng)期的預(yù)測(cè)中,結(jié)合EMD的預(yù)測(cè)模型在預(yù)測(cè)精度上較GALSSVM模型要高,在極值點(diǎn)也有著較好的效果,但GALSSVM模型在小范圍內(nèi)的波動(dòng)性更能體現(xiàn)風(fēng)的特性,因此,不能說(shuō)某個(gè)方法優(yōu)于另外一個(gè)方法,而應(yīng)該根據(jù)具體情況進(jìn)行分析和判斷,選擇合適的模型種類。
[1]王曉蘭,李輝.風(fēng)電場(chǎng)輸出功率年度預(yù)測(cè)中有效風(fēng)速預(yù)測(cè)研究[J]. 中國(guó)電機(jī)工程學(xué)報(bào),2010,30(8):117-122.
[2]丁明,張立軍,吳義純. 基于時(shí)間序列分析的風(fēng)電場(chǎng)風(fēng)速預(yù)測(cè)模型[J].電力系統(tǒng)自動(dòng)化設(shè)備,2005,25(8):32-34.
[3]楊秀媛,肖洋,陳樹勇.風(fēng)電場(chǎng)風(fēng)速和發(fā)電功率預(yù)測(cè)研究[J].中國(guó)電機(jī)工程學(xué)報(bào),2005,25(11):1-5.25(11):1-5.
[4]陳樹勇,戴慧珠,白曉民,等.風(fēng)電場(chǎng)的發(fā)電可靠性模型及其應(yīng)用[J].中國(guó)電機(jī)工程學(xué)報(bào),2000,20(3):26-29.
[5]王承煦,張?jiān)?風(fēng)力發(fā)電[M].北京:中國(guó)電力出版社.2003.
[6]杜穎,盧繼平,李青,等.基于最小二乘支持向量機(jī)的風(fēng)電場(chǎng)短期風(fēng)速預(yù)測(cè)[J].電網(wǎng)技術(shù),2008,32(15):62-66.
[7]WANG X, SIDERATOS G, HATZIARGYRIOU N, et al.Wind speed forecasting for power system operational planning[C]. Proceedings of the 8th International Conference on Probablitistic Methods Applied to Power System,2004.
[8]周同旭,基于遺傳算法的支持向量機(jī)短期風(fēng)速預(yù)測(cè)[J].皖西學(xué)院報(bào),2010,26(5):106-109.
[9]張寧,許承權(quán),薛小鈴,鄭宗華,基于最小二乘支持向量機(jī)的短期負(fù)荷預(yù)測(cè)模型[J].現(xiàn)代電子技術(shù),2010,(18):131-133.
[10]鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法–支持向量機(jī)[M].第 2版. 北京:科學(xué)出版社,2004:25-30.
[11]王克奇,楊少春,戴天虹,白雪冰,采用遺傳算法優(yōu)化最小二乘支持向量機(jī)參數(shù)的方法[J].計(jì)算機(jī)應(yīng)用與軟件,2009,26(7):109-111.
[12]朱小梅,楊先風(fēng),張群燕.LS-SVM-GA算法在油田產(chǎn)量預(yù)測(cè)中的應(yīng)用研究[J].煤炭技術(shù),2010,29(11):197-198.
[13]王曉蘭,李輝.基于EMD與LS-SVM的風(fēng)電場(chǎng)短期風(fēng)速預(yù)測(cè)[J]. LS-SVM 的風(fēng)電場(chǎng)短計(jì)算機(jī)工程與設(shè)計(jì),2010,31(10):2303-2307.
[14]劉興杰,米增強(qiáng),楊奇遜,樊小偉.一種基于 EMD 的短期風(fēng)速多步預(yù)測(cè)方法[J].電工技術(shù)學(xué)報(bào),2010,25(4): 165-170.