張寧
摘 要:準(zhǔn)確預(yù)測(cè)電價(jià)有助于電力市場(chǎng)參與者進(jìn)行風(fēng)險(xiǎn)規(guī)避并達(dá)到經(jīng)濟(jì)收益最大化。針對(duì)短期電價(jià)序列具有非平穩(wěn)性與非線性的特點(diǎn),提出了一種新型混合預(yù)測(cè)模型CEEMD-SSA-ELM。采用互補(bǔ)集成經(jīng)驗(yàn)?zāi)B(tài)分解(complementary ensemble empirical mode decomposition,CEEMD)方法對(duì)電價(jià)序列進(jìn)行有效分解;針對(duì)分解后的最高頻分量具有較大隨機(jī)性的特征,采用奇異譜分析(singular spectrum analysis,SSA)對(duì)其進(jìn)行降噪并提取趨勢(shì)項(xiàng);最后,對(duì)最高頻分量的趨勢(shì)項(xiàng)及其余分量分別使用極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)模型進(jìn)行獨(dú)立預(yù)測(cè),并將其預(yù)測(cè)結(jié)果進(jìn)行重構(gòu)集成以得到最終預(yù)測(cè)結(jié)果。對(duì)2種實(shí)際電價(jià)數(shù)據(jù)的預(yù)測(cè)分析結(jié)果表明:CEEMD-SSA-ELM模型和CEEMD-ELM、ELM模型相比,具有更高的預(yù)測(cè)精度。
關(guān)鍵詞:互補(bǔ)集成經(jīng)驗(yàn)?zāi)B(tài)分解;奇異譜分析;極限學(xué)習(xí)機(jī);短期電價(jià)預(yù)測(cè)
中圖分類號(hào):TP391
文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào)?1000-5269(2020)05-0082-07???DOI:10.15958/j.cnki.gdxbzrb.2020.05.13
電價(jià)能夠有效體現(xiàn)電能的供需變化,并可具體反映電力市場(chǎng)運(yùn)營(yíng)情況。對(duì)電價(jià)數(shù)據(jù)進(jìn)行精準(zhǔn)的預(yù)測(cè)將有助于售電企業(yè)決定市場(chǎng)報(bào)價(jià),并能及時(shí)地規(guī)避市場(chǎng)風(fēng)險(xiǎn)。然而,由于短期電價(jià)受到天氣、日常活動(dòng)、商務(wù)交易、供給側(cè)報(bào)價(jià)等多種因素的綜合影響,導(dǎo)致其具有典型的非平穩(wěn)性與非線性的特點(diǎn)。由于很難準(zhǔn)確擬定顧及諸多影響因素的數(shù)學(xué)模型,采用經(jīng)典的因果關(guān)系回歸模型進(jìn)行短期電價(jià)預(yù)測(cè)往往精度較低。近年來,另一種將歷史電價(jià)作為時(shí)間序列進(jìn)行建模預(yù)測(cè)的方式得到了廣泛的研究。常用的時(shí)間序列預(yù)測(cè)方法有自回歸滑動(dòng)平均模型(autoregressive moving-average model,ARMA模型)[1] ,廣義自回歸條件異方差模型(generalized autoregressive conditional heteroskedasticity model,GARCH模型)[2]等,但這些方法都是基于線性序列進(jìn)行建模分析,其對(duì)于捕捉電價(jià)序列中的非線性特征能力有限,這也導(dǎo)致其預(yù)測(cè)結(jié)果的精度并不高。隨著人工智能技術(shù)的飛速發(fā)展,人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、支持向量機(jī)(support vector machine,SVM)等非線性方法在電價(jià)預(yù)測(cè)領(lǐng)域中已取得了較為成功的應(yīng)用[3-5]。
為了進(jìn)一步提高電價(jià)時(shí)間序列預(yù)測(cè)的精度,目前一種基于“分解-預(yù)測(cè)-集成”思想的混合預(yù)測(cè)方法被廣泛的關(guān)注和研究[6-8]。其預(yù)測(cè)思路為:首先采用小波變換(wavelet transform,WT)、經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)等信號(hào)分解方法將電價(jià)序列分解為多個(gè)分量,進(jìn)而對(duì)每個(gè)分量采用ANN、SVM等非線性方法進(jìn)行獨(dú)立預(yù)測(cè),最后將所有分量預(yù)測(cè)進(jìn)行重構(gòu)集成。該類方法已經(jīng)證實(shí)可以有效提高預(yù)測(cè)精度[8];但是,小波變換需要對(duì)小波基函數(shù)、分解層數(shù)進(jìn)行預(yù)先設(shè)置,所以小波變換并不是一種自適應(yīng)的分解方法,而EMD方法也難以避免模態(tài)混疊現(xiàn)象的發(fā)生。另外,ANN方法存在有訓(xùn)練速度慢、易陷入局部極小等問題;SVM方法也存在難以合理選擇模型參數(shù)的缺點(diǎn)。特別地,對(duì)于該類混合預(yù)測(cè)方法,由于分解后的最高頻分量的隨機(jī)性最強(qiáng),其獨(dú)立預(yù)測(cè)的難度也最大。文獻(xiàn)[7]提出將最高頻分量舍去后對(duì)其余分量進(jìn)行預(yù)測(cè)集成,但是這種舍去方式顯然也會(huì)影響最終的預(yù)測(cè)精度。
為了有效解決上述問題,本文提出CEEMD-SSA-ELM模型,并以澳大利亞昆士南州和新南威爾士州的電力市場(chǎng)某月的電價(jià)數(shù)據(jù)作為研究對(duì)象,進(jìn)行了電價(jià)預(yù)測(cè)。實(shí)驗(yàn)取得了較高的預(yù)測(cè)精度,也驗(yàn)證了所提方法的有效性。
1?理論背景
1.1?CEEMD的基本原理
由于應(yīng)用EMD方法對(duì)信號(hào)分解所獲得的固有模態(tài)函數(shù)(instrinsic mode function,IMF)會(huì)存在模態(tài)混疊問題,WU等[9]基于輔助白噪聲分析提出了一種集成經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)方法以避免該現(xiàn)象的發(fā)生,但是,EEMD方法也存在有難以消除重構(gòu)信號(hào)中的殘余輔助白噪聲的缺陷。YEH等[10]在EEMD的基礎(chǔ)上,以采用正、負(fù)成對(duì)的形式加入輔助白噪聲,提出了CEEMD方法。該方法的計(jì)算效率較高,并可在重構(gòu)信號(hào)時(shí)完全消除殘余輔助噪聲,其計(jì)算流程為:
本文對(duì)矩陣XI1應(yīng)用式(7)重建時(shí)間序列,以實(shí)現(xiàn)將噪聲從原始序列中分離。
1.3?ELM的基本原理
ELM是HUANG等在2006年提出的一種進(jìn)化神經(jīng)網(wǎng)絡(luò)方法[14],可以避免傳統(tǒng)ANN方法存在的訓(xùn)練速度慢、易陷入局部極小等缺陷。ELM數(shù)學(xué)模型為
2?短期電價(jià)預(yù)測(cè)的CEEMD-SSA-ELM方法
2.1?基于CEEMD的短期電價(jià)序列分解
2.2?基于SSA的最高頻分量趨勢(shì)提取
由于第1個(gè)最高頻分量IMF1變化劇烈、隨機(jī)性強(qiáng),直接建模預(yù)測(cè)的效果較差,且將會(huì)影響整體的預(yù)測(cè)精度,因此,利用SSA對(duì)其去噪處理并提取趨勢(shì)項(xiàng),記為IMF1′。
2.3?基于ELM預(yù)測(cè)模型結(jié)構(gòu)的確定
2.4?CEEMD-SSA-ELM方法流程圖
綜上,將CEEMD-SSA-ELM應(yīng)用于某地區(qū)電價(jià)預(yù)測(cè)中,可得到CEEMD-SSA-ELM模型的流程圖,如圖1所示。
2.5?預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)
為了定量評(píng)價(jià)電價(jià)預(yù)測(cè)模型的精度,本文選取2種評(píng)價(jià)指標(biāo):
3?實(shí)例分析
3.1?實(shí)例1
本文以澳大利亞昆士蘭州2016年6月1日00:30:00至2016年7月1日00:00:00共30 d的電價(jià)數(shù)據(jù)為研究對(duì)象,每半小時(shí)采集一次,共計(jì)1 440個(gè)短期電價(jià)時(shí)間序列。澳大利亞昆士蘭州原始電價(jià)數(shù)據(jù)序列如圖2所示。
為了減少數(shù)據(jù)量綱對(duì)建模的影響,采用下式將原始電價(jià)序列數(shù)據(jù)歸一到[-1,1]區(qū)間:
式中:X′(t)為歸一化后的電價(jià)序列;Xmin、Xmax分別為原序列中的最小值、最大值。在建模計(jì)算結(jié)束后,對(duì)輸出的訓(xùn)練與預(yù)測(cè)數(shù)據(jù)進(jìn)行反歸一化處理,可將其還原至原始區(qū)間。
成次數(shù)N=100,噪聲標(biāo)準(zhǔn)差設(shè)為0.2。分解后可得到10個(gè)IMF分量以及1個(gè)殘余分量。
對(duì)IMF1使用SSA方法進(jìn)行去噪處理。在此過程中需確定其窗口長(zhǎng)度L和重構(gòu)選取的特征值個(gè)數(shù)k。文獻(xiàn)[12]建議L不大于N/2,且如果原序列總存在整數(shù)周期的分量,L應(yīng)取與該周期成正比的數(shù)值。在本例中,采樣周期為1 d(48個(gè)采樣點(diǎn)),故經(jīng)測(cè)試后設(shè)置L=12。圖3給出了最高頻分量IMF1的奇異譜圖。
從圖3可以看出:將SSA方法中的矩陣XXT特征值由大到小排列,自第7個(gè)特征值開始,下降速率增大,且前7個(gè)的貢獻(xiàn)率為81.7%;根據(jù)設(shè)置的貢獻(xiàn)率閾值(80%),即可將k選為7。圖4給出了經(jīng)SSA處理前后的最高頻分量,其中,紅色虛線即為提取的趨勢(shì)項(xiàng)。
對(duì)經(jīng)CEEMD-SSA處理后的第一分量和其余分量序列設(shè)置嵌入維數(shù),構(gòu)建樣本數(shù)據(jù)集。本文嵌入維數(shù)都設(shè)置為8,即由前8個(gè)數(shù)據(jù)預(yù)測(cè)第9個(gè)數(shù)據(jù)。由此,總樣本數(shù)目可構(gòu)建為1 432個(gè),統(tǒng)一以最后240個(gè)電價(jià)為預(yù)測(cè)對(duì)象,則訓(xùn)練樣本數(shù)目設(shè)置為1 192個(gè)。在此基礎(chǔ)上,對(duì)每個(gè)分量序列分別建立ELM模型,其中,隱層神經(jīng)元節(jié)點(diǎn)數(shù)均設(shè)置為14,激活函數(shù)均選擇為“Sig”函數(shù)。由于ELM采用了隨機(jī)權(quán)值和偏置的獲取方式,將會(huì)使模型預(yù)測(cè)單次結(jié)果出現(xiàn)不穩(wěn)定現(xiàn)象。為此,在進(jìn)行預(yù)測(cè)時(shí),各循環(huán)操作了100次,并取其預(yù)測(cè)均值作為最終預(yù)測(cè)結(jié)果。
為了與本文方法進(jìn)行對(duì)比,還建立了另外2種預(yù)測(cè)模型:(1)不使用SSA處理最高頻分量的CEEMD-ELM模型;(2)直接對(duì)電價(jià)數(shù)據(jù)進(jìn)行預(yù)測(cè)的ELM模型。為了對(duì)比的公平性,這2種模型的參數(shù)均與本文所提模型設(shè)置完全一致。各種模型的預(yù)測(cè)結(jié)果如圖5所示。
從圖5可以看出:CEEMD-SSA-ELM模型的預(yù)測(cè)結(jié)果曲線與真實(shí)電價(jià)曲線的吻合度較高,充分表明了該模型具有良好的預(yù)測(cè)精度;CEEMD-ELM模型和ELM模型的預(yù)測(cè)曲線明顯偏離真值。3種模型精度指標(biāo)統(tǒng)計(jì)結(jié)果見表1。
從表1可以發(fā)現(xiàn):CEEMD-SSA-ELM模型的預(yù)測(cè)精度最優(yōu),ELM模型預(yù)測(cè)性能最差;與CEEMD-ELM模型相比,CEEMD-SSA-ELM模型僅增加使用SSA對(duì)最高頻分量處理并提取趨勢(shì)項(xiàng)進(jìn)行預(yù)測(cè),但是,均方根誤差與平均絕對(duì)百分誤差分別減少了46.3%和44.8%,說明了SSA處理的必要性和有效性。
3.2?實(shí)例2
為了進(jìn)一步驗(yàn)證本文方法的有效性,第2個(gè)實(shí)例是以澳大利亞新南威爾士州在相同的時(shí)間段的電價(jià)數(shù)據(jù)為研究對(duì)象,即2016年6月1日00:30:00至2016年7月1日00:00:00共30 d,每半小時(shí)采集一次,共計(jì)1 440個(gè)短期電價(jià)時(shí)間序列。澳大利亞新南威爾士州原始電價(jià)數(shù)據(jù)序列如圖6所示。
應(yīng)用CEEMD方法對(duì)上述數(shù)據(jù)進(jìn)行自適應(yīng)分解,對(duì)最高頻分量進(jìn)行SSA處理。圖7給出了最高頻分量IMF1的奇異譜圖。從圖7可以看出:矩陣XXT的特征值從第8個(gè)開始,下降速率明顯增大,且前8個(gè)的貢獻(xiàn)率已超過80%,因此將k選為8。
在本例中,各種預(yù)測(cè)模型的數(shù)據(jù)集構(gòu)造、參數(shù)設(shè)置與實(shí)例1完全一致。3種模型的預(yù)測(cè)結(jié)果如圖8所示。從圖8可以看出:CEEMD-SSA-ELM模型的預(yù)測(cè)結(jié)果曲線與真實(shí)電價(jià)曲線的吻合度較高,CEEMD-ELM模型和ELM模型的預(yù)測(cè)曲線明顯偏離真值。這與實(shí)例1的預(yù)測(cè)分析結(jié)果完全一致。精度指標(biāo)統(tǒng)計(jì)結(jié)果見表2。
從表2可以看出: CEEMD-SSA-ELM模型的預(yù)測(cè)精度最高,CEEMD-ELM模型的預(yù)測(cè)精度次之,而ELM模型的預(yù)測(cè)精度最低。這與實(shí)例1的預(yù)測(cè)分析結(jié)果完全一致。
4?結(jié)論
(1)本文提出將一種CEEMD-SSA-ELM模型應(yīng)用于短期電價(jià)序列預(yù)測(cè)中,取得了較高的預(yù)測(cè)精度,2個(gè)實(shí)例的分析結(jié)果充分表明該模型在短期電價(jià)預(yù)測(cè)中應(yīng)用的可行性。
(2)與不加入SSA處理的CEEMD-ELM模型相對(duì)比,本文所提模型的均方根誤差與平均絕對(duì)百分誤差分別減少了40%與30%以上,充分說明了SSA對(duì)最高頻分量處理的必要性和有效性。
(3)本文對(duì)各分量建模采用ELM方法,而其輸入權(quán)值和偏置為隨機(jī)給定,并非最優(yōu)。為此,下一步的研究計(jì)劃是采用優(yōu)化算法、優(yōu)化參數(shù)以進(jìn)一步提高預(yù)測(cè)精度。
參考文獻(xiàn):
[1]MACIEJOWSKA K, NOWOTARSKIJ, WERON R. Probabilistic forecasting of electricity spot prices using factor quantile regression averaging[J]. International Journal of Forecasting, 2016, 32: 957-965.
[2]CIFTER A. Forecasting electricity price volatility with the Markov-switching GARCH model: evidence from the Nordic electric power market[J]. Electric Power Systems Research, 2013, 102: 61-67.
[3]IOANNIS P, ATHANASIOS S. Day-ahead electricity price forecasting via the application of artificial neural network based models[J]. Applied Energy, 2016, 172: 132-151.
[4]SINGHAL D, SWARUP K. Electricity price forecasting using artificial neural networks[J]. International Journal of Electrical Power & Energy Systems, 2011, 33(3): 550-555.
[5]劉慶彪, 張步涵, 王凱, 等. 電價(jià)預(yù)測(cè)的自適應(yīng)支持向量機(jī)方法研究[J]. 電力系統(tǒng)保護(hù)與控制, 2008, 36(22): 34-39.
[6]蔣鋒, 何佳琪, 曾志剛, 等. 基于分解-優(yōu)化-集成學(xué)習(xí)方法的電價(jià)預(yù)測(cè)[J]. 中國(guó)科學(xué): 信息科學(xué), 2018, 48(10): 1300-1315.
[7]WANG D, LUO H, GRUNDER O, et al. Multi-step ahead electricity price forecasting using a hybrid model based on two-layer decomposition technique and BP neural network optimized by firefly algorithm[J]. Applied Energy, 2017, 190: 390-407.
[8]LIAN C, ZENG Z G, YAO W, et al. Displacement prediction model of landslide based on a modified ensemble empirical mode decomposition and extreme learning machine[J]. Natural Hazards, 2013, 66: 759-771.
[9]WU Z H, HUANG N E. Ensemble empirical mode decomposition: a noise assisted data analysis method [J]. Advances in Adaptive Data Analysis, 2009 (1): 1-41.
[10]YEH J R, SHIEH J S, HUANG N E. Complementary ensemble empirical mode decomposition: a novel noise enhanced data analysis method[J]. Advances in Adaptive Data Analysis, 2010, 2(2): 135-156.
[11]殷豪, 曾云, 孟安波, 等. 基于奇異譜分析的短期電價(jià)預(yù)測(cè)[J]. 電力系統(tǒng)保護(hù)與控制, 2019, 47(1): 115-122.
[12]HASSANI H . Singular spectrum analysis: methodology and comparison[J]. Journal of Data Science, 2007, 5(2): 239-257.
[13]王鑫, 吳際, 劉超, 等. 奇異譜分析在故障時(shí)間序列分析中的應(yīng)用[J]. 北京航空航天大學(xué)學(xué)報(bào), 2016, 42(11): 2321-2331.
[14]HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications [J]. Neurocomputing, 2006, 70(1/3): 489-501.
[15]YU C J, LI Y L, ZHANG M J. An improved wavelet transform using singular spectrum anaylsis for wind speed forecasting based on Elman neural network[J]. Energy Conversion and Management, 2017, 148: 895-904.
(責(zé)任編輯:周曉南)