趙會(huì)茹,張士營(yíng),趙一航,劉紅雨,邱寶紅
(華北電力大學(xué) 經(jīng)濟(jì)與管理學(xué)院,北京市 昌平區(qū) 102206)
準(zhǔn)確的短期負(fù)荷預(yù)測(cè)對(duì)于保證電力系統(tǒng)安全和可靠運(yùn)行至關(guān)重要。隨著我國(guó)居民生活質(zhì)量的提高和用電方式的多樣化,電力負(fù)荷近年來(lái)增長(zhǎng)明顯,同時(shí)由于溫濕度等氣象因素的影響,電力負(fù)荷特性也呈現(xiàn)出新的特征和趨勢(shì)[1]。此外,新能源裝機(jī)容量的提高以及分布式電源的發(fā)展,給短期負(fù)荷預(yù)測(cè)帶來(lái)了新的挑戰(zhàn)。因此,如何進(jìn)一步降低預(yù)測(cè)誤差,進(jìn)而確保電力系統(tǒng)的安全可靠性是目前的重要研究方向之一[2]。
以往的短期負(fù)荷預(yù)測(cè)大多數(shù)都是確定性預(yù)測(cè),其中根據(jù)預(yù)測(cè)原理不同可以分為基于統(tǒng)計(jì)學(xué)的預(yù)測(cè)方法以及基于機(jī)器學(xué)習(xí)的智能預(yù)測(cè)方法[3-5]。統(tǒng)計(jì)學(xué)預(yù)測(cè)方法包括自回歸差分移動(dòng)平均模型、自回歸條件異方差模型以及動(dòng)態(tài)回歸模型等,通常是在分析數(shù)據(jù)的時(shí)間序列本身規(guī)律的基礎(chǔ)上進(jìn)行建模和預(yù)測(cè),模型結(jié)構(gòu)較為簡(jiǎn)單,對(duì)于非線性序列的適用性較差;智能預(yù)測(cè)方法包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,這類方法能夠較好地對(duì)非線性數(shù)據(jù)序列進(jìn)行擬合,很大程度上提高預(yù)測(cè)模型的預(yù)測(cè)效果和泛化能力[6-7]。
近年來(lái)電力市場(chǎng)日趨成熟,負(fù)荷影響因素更加多元化,負(fù)荷特性趨于復(fù)雜,其不確定性更為明顯,相比之下確定性的負(fù)荷預(yù)測(cè)能夠提供的信息具有很大局限性,無(wú)法提供未來(lái)短期負(fù)荷可能的波動(dòng)范圍。因此許多學(xué)者已經(jīng)將負(fù)荷預(yù)測(cè)擴(kuò)展到區(qū)間預(yù)測(cè),其預(yù)測(cè)結(jié)果能夠提供負(fù)荷在給定置信水平下的置信區(qū)間,因此能夠提供更多的不確定信息。文獻(xiàn)[8]使用兩個(gè)節(jié)點(diǎn)的輸出層前饋神經(jīng)網(wǎng)絡(luò)直接獲得預(yù)測(cè)區(qū)間的上下界,同時(shí)結(jié)合粒子群優(yōu)化進(jìn)一步提高預(yù)測(cè)區(qū)間質(zhì)量;文獻(xiàn)[9]構(gòu)建了基于改進(jìn)粒子群優(yōu)化和高斯過(guò)程回歸的短期負(fù)荷區(qū)間預(yù)測(cè)模型;文獻(xiàn)[10]提出了一種基于分位數(shù)回歸神經(jīng)網(wǎng)絡(luò)和三角核函數(shù)的負(fù)荷概率密度預(yù)測(cè)模型,基于加拿大和中國(guó)實(shí)際電力負(fù)荷樣本的實(shí)證結(jié)果表明該模型能提高預(yù)測(cè)效果。深度學(xué)習(xí)技術(shù)的發(fā)展改善了以往淺層學(xué)習(xí)中不能適應(yīng)大量樣本的情形,文獻(xiàn)[11]首先基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)負(fù)荷的點(diǎn)預(yù)測(cè),進(jìn)而利用啟發(fā)式區(qū)間預(yù)測(cè)算法得到區(qū)間系數(shù);文獻(xiàn)[12]構(gòu)建了基于卷積-長(zhǎng)短期基于網(wǎng)絡(luò)分位數(shù)回歸的區(qū)間預(yù)測(cè)模型,并引入核密度估計(jì)方法對(duì)負(fù)荷的波動(dòng)性進(jìn)行了分析。
考慮到負(fù)荷序列本身的周期性、隨機(jī)性等特征,亦有學(xué)者采用混合模型的思路對(duì)負(fù)荷序列進(jìn)行建模。文獻(xiàn)[13]基于變分模態(tài)分解和長(zhǎng)短期記憶網(wǎng)絡(luò)進(jìn)行了短期負(fù)荷預(yù)測(cè)建模,同時(shí)利用改進(jìn)粒子群算法對(duì)參數(shù)進(jìn)行了尋優(yōu);文獻(xiàn)[14]構(gòu)建了基于集合經(jīng)驗(yàn)?zāi)B(tài)分解和最小二乘支持向量機(jī)的混合預(yù)測(cè)模型,并驗(yàn)證了混合模型相對(duì)于單一模型能夠提高預(yù)測(cè)效果;文獻(xiàn)[15]利用長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)和互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解方法構(gòu)建了短期負(fù)荷預(yù)測(cè)模型,仿真結(jié)果驗(yàn)證了組合方法能夠提升預(yù)測(cè)效果。
本文在前人研究的基礎(chǔ)上,構(gòu)建短期負(fù)荷區(qū)間預(yù)測(cè)混合模型。通過(guò)對(duì)比不同預(yù)測(cè)模型,進(jìn)一步驗(yàn)證本文模型的有效性和實(shí)用性。
針對(duì)模態(tài)混疊問(wèn)題,自適應(yīng)噪聲完備經(jīng)驗(yàn)?zāi)B(tài)分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)算法被提出,CEEMDAN 算法的基本原理是在固有模態(tài)函數(shù)分量(intrinsic mode function,IMF)分解的過(guò)程中自適應(yīng)地添加白噪聲,通過(guò)最后的余量信號(hào)計(jì)算出各個(gè)IMF 分量,能夠達(dá)到幾乎為零的重構(gòu)誤差,具有很好的完備性,并減少了集成次數(shù),解決了模態(tài)混疊的問(wèn)題[16],其分解過(guò)程如下。
1)在原始序列x(t)中添加一系列自適應(yīng)的白噪聲:
式中:xi(t)為第i次 添加白噪聲的時(shí)間序列; ω0為噪聲系數(shù); εi(t)為第i次 添加的白噪聲;I為集成次數(shù)。
2)利用經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)對(duì)xi(t)進(jìn)行分解,并對(duì)第1 個(gè)IMF 分量ci1取均值:
從原始序列x(t)中移除c1(t)可得第1個(gè)余量序列
3)對(duì)r1(t)+ω1E1[εi(t)]繼續(xù)進(jìn)行EMD分解,得到第2個(gè)IMF分量。
式中:Ej(·)為EMD 分解得到的第j個(gè)IMF 分量。
4)重復(fù)以下過(guò)程,計(jì)算其余的IMF 分量:
式中:K為模態(tài)總個(gè)數(shù)。
當(dāng)余量序列不能繼續(xù)分解時(shí),算法結(jié)束。最終的余量表示為:
樣本熵SE是一種對(duì)非穩(wěn)定時(shí)間序列的復(fù)雜性的度量方法[17]。與一般方法相比,其優(yōu)勢(shì)主要體現(xiàn)在具有不依賴數(shù)據(jù)長(zhǎng)度、一致性更好兩個(gè)方面。樣本熵的值與序列自我相似程度成正相關(guān)性。對(duì)于樣本容量為N的時(shí)間序列
該算法的計(jì)算步驟如下:
1)按序列號(hào)組成一組維數(shù)為m的向量序列Xm(1),···,Xm(N-m+1),其中:
這些向量序列表示從第i個(gè)點(diǎn)開(kāi)始的m個(gè)連續(xù)的x的值。
2)定義向量Xm(i)與Xm(j)之間的距離
3)對(duì) 于 某 一Xm(i),統(tǒng) 計(jì)Xm(i)與Xm(j)之 間 的距離小于等于r的j(1 ≤j≤N-m,j≠i)數(shù) 量,記為Bi。對(duì)于1 ≤i≤N-m,定義:
在此基礎(chǔ)上,定義
4)將維數(shù)增加到m+1, 統(tǒng)計(jì)Xm+1(i)與Xm+1(j)距離小于等于r的數(shù)量,記為Ai,并定義
在此基礎(chǔ)上,定義
Bm(r)是兩個(gè)序列在相似容限r(nóng)下匹配m個(gè)點(diǎn)的概率;Am(r)是兩個(gè)序列匹配m+1 個(gè)點(diǎn)的概率。樣本熵
當(dāng)N有限時(shí),樣本熵估計(jì)為
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long and short-term memory,LSTM),是在循環(huán)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上延伸而來(lái),其重點(diǎn)是為了解決循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)在處理長(zhǎng)時(shí)間的序列中產(chǎn)生的梯度消失和梯度爆炸的缺陷。該方法通過(guò)特殊處理的不同門(mén)的機(jī)制的設(shè)計(jì),避免了RNN 結(jié)構(gòu)對(duì)歷史長(zhǎng)期數(shù)據(jù)序列的依賴問(wèn)題,不僅能夠提高大量時(shí)間序列的處理能力,也能夠更充分地利用現(xiàn)有信息,適應(yīng)能力更強(qiáng)[18],其單元結(jié)構(gòu)示意圖如圖1 所示。
圖1 長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 1 Structure of long- and short-term memory network
如圖1 所示,LSTM 結(jié)構(gòu)的重點(diǎn)是在于其特有的單元的狀態(tài)及其貫穿各單元之間的水平線。在數(shù)據(jù)傳輸過(guò)程中,大部分信息直接傳送到下一單元,少量信息進(jìn)行線性交互。在這一過(guò)程中,基于一種門(mén)的控制單元實(shí)現(xiàn)數(shù)據(jù)的添加和刪除,LSTM 結(jié)構(gòu)中共包含3 種門(mén)機(jī)制,分別叫作輸入門(mén)、遺忘門(mén)和輸出門(mén),基于此實(shí)現(xiàn)了時(shí)間序列的數(shù)據(jù)處理,并避免了所需信息的流失。
輸入門(mén)的信息由兩部分構(gòu)成,包括t時(shí)刻輸入值xt以及T-1時(shí)刻隱藏層輸 出值ht-1,通 過(guò)t時(shí)刻輸 入xt和T-1時(shí)刻 隱 藏 層 輸 出ht-1計(jì) 算 得 到。輸 入門(mén)it和 記憶單元的候選狀態(tài)通過(guò)以下公式計(jì)算:
式中:wi為輸入門(mén)在t時(shí)刻的權(quán)值矩陣;wc為候選狀態(tài)在T時(shí)刻的權(quán)值矩陣;bi、bc表示偏置值;σ表示Sigmoid 激活函數(shù); tanh表示 tanh激活函數(shù)。
遺忘門(mén)由t時(shí)刻輸入值xt和T-1時(shí)刻隱藏層輸出ht-1共同決定:
式中:wf為遺忘門(mén)在t時(shí)刻的權(quán)值矩陣;bf表示偏置值。
基于輸入門(mén)和遺忘門(mén)的作用,記憶單元Ct完成自身狀態(tài)的更新:
式中:Ct-1表示記憶單元上一時(shí)刻狀態(tài)。
輸出門(mén)由t時(shí)刻輸入值xt和T-1時(shí)刻隱藏層輸出ht-1共同決定:
式中:wo為輸出門(mén)ot在t時(shí)刻的權(quán)值矩陣;bo表示偏置值。
隱藏層的輸出值通過(guò)t時(shí)刻輸出值以及記憶單元狀態(tài)值計(jì)算得到:
通過(guò)以上3 種門(mén)機(jī)制的復(fù)合運(yùn)算,LSTM 確定最終的單元狀態(tài),并確定最終的輸出值。
由于LSTM 網(wǎng)絡(luò)中采用的是梯度下降算法進(jìn)行網(wǎng)絡(luò)權(quán)值和偏置值的更新,容易陷入局部最優(yōu)從而降低模型的泛化能力,因此在模型訓(xùn)練過(guò)程中通過(guò)Adam 算法為不同參數(shù)設(shè)定獨(dú)立的學(xué)習(xí)率,從而提高運(yùn)算效率和精度[19]。
在確定性預(yù)測(cè)的基礎(chǔ)上,對(duì)其相對(duì)誤差分布進(jìn)行統(tǒng)計(jì)分析,得到各時(shí)段的誤差分布,然后估計(jì)誤差的分布特征[20]。與參數(shù)估計(jì)相比,非參數(shù)估計(jì)方法不需要提前假設(shè)誤差分布,因此估計(jì)結(jié)果更接近實(shí)際值。其中,直方圖密度估計(jì)和核密度估計(jì)(kernel density estimation,KDE)是最常用的兩類估計(jì)方法,其中KDE 在實(shí)際應(yīng)用中更為簡(jiǎn)單有效。因此,本文基于KDE 方法來(lái)確定誤差的密度函數(shù)的估計(jì)以及置信區(qū)間的計(jì)算。X的 密 度 函 數(shù)為f(x), 經(jīng) 驗(yàn) 分 布 函 數(shù)為F(x),則f(x)的簡(jiǎn)單估計(jì)為:
KDE 是基于樣本本身估計(jì)的。如果隨機(jī)變量
式中:h是 非負(fù)常數(shù)。當(dāng)h→0時(shí),我們可以得到的近似估計(jì)為:
式中:N為樣本個(gè)數(shù);h為 窗寬;k(x)為核函數(shù)。本文采用高斯核函數(shù),其表達(dá)式為:
在此基礎(chǔ)上,可以計(jì)算一定置信水平下的置信區(qū)間。也就是說(shuō),在給定的置信水平為1 -α的情況下,如果負(fù)荷值滿足:
本文采用“點(diǎn)預(yù)測(cè)+誤差區(qū)間估計(jì)”的思路,構(gòu)建短期負(fù)荷區(qū)間預(yù)測(cè)模型,模型中考慮溫度、濕度、降水量、風(fēng)速對(duì)負(fù)荷的影響,同時(shí)考慮工作日和非工作日負(fù)荷曲線存在較大差異性,將日類型因素考慮到模型中。在此基礎(chǔ)上,考慮用電特性在相近的時(shí)間段具有一定的相似性,在模型的輸入因素中加入待預(yù)測(cè)日前兩天同一時(shí)刻的負(fù)荷值。圖2 為本文模型流程圖。
模型具體預(yù)測(cè)流程如下:
1)數(shù)據(jù)收集和預(yù)處理。搜集負(fù)荷及影響因素?cái)?shù)據(jù),各數(shù)據(jù)均采用下述公式實(shí)現(xiàn)標(biāo)準(zhǔn)化:
式 中:xi′j為標(biāo)準(zhǔn)化后的數(shù)據(jù);xmaxj和xminj分 別為第i個(gè)指標(biāo)的最大值和最小值。
2) 負(fù)荷數(shù)據(jù)分解和重構(gòu)。 首先采用CEEMDAN 方法得到原始負(fù)荷序列的若干本征模態(tài)分量。在此基礎(chǔ)上,計(jì)算每個(gè)分量的樣本熵,基于計(jì)算結(jié)果將所有本征模態(tài)分量進(jìn)行重構(gòu)。
3)確定性負(fù)荷預(yù)測(cè)。采用LSTM 模型分別對(duì)以上不同分量進(jìn)行建模,得到各預(yù)測(cè)序列,將所有序列預(yù)測(cè)結(jié)果匯總得到確定性負(fù)荷預(yù)測(cè)結(jié)果。在此過(guò)程中,引入Adam 優(yōu)化器來(lái)提升LSTM 結(jié)構(gòu)的處理和預(yù)測(cè)性能。
圖2 預(yù)測(cè)模型結(jié)構(gòu)及計(jì)算流程圖Fig. 2 Architecture and computation flowchart of the prediction model of the model
4)誤差區(qū)間估計(jì)。對(duì)上一步預(yù)測(cè)誤差進(jìn)行統(tǒng)計(jì),基于核密度估計(jì)方法對(duì)給定置信度下的誤差置信區(qū)間進(jìn)行估計(jì)。
5)疊加前2 步的預(yù)測(cè)和統(tǒng)計(jì)結(jié)果,得到最終的負(fù)荷預(yù)測(cè)區(qū)間。
4.2.1 點(diǎn)預(yù)測(cè)結(jié)果評(píng)估指標(biāo)
為了評(píng)估本文模型的點(diǎn)預(yù)測(cè)結(jié)果的優(yōu)劣,引入平均絕對(duì)百分誤差(MAPE),其公式如下。
式中:N為預(yù) 測(cè)樣本數(shù)量;yi為負(fù)荷實(shí)際值;為負(fù)荷點(diǎn)預(yù)測(cè)值。
4.2.2 區(qū)間預(yù)測(cè)結(jié)果評(píng)估指標(biāo)
為了評(píng)估區(qū)間預(yù)測(cè)結(jié)果,引入?yún)^(qū)間覆蓋率(PICP)和區(qū)間平均寬度(PINAW)指標(biāo)。其中,在同一置信水平下,PICP值越高,PINAW值越小,表明模型的性能更好,其公式如下:
式中: εi為布爾變量,點(diǎn)預(yù)測(cè)值在區(qū)間內(nèi)時(shí)值為1,否則為0;R表示測(cè)試集的范圍,用于對(duì)評(píng)價(jià)指標(biāo)進(jìn)行規(guī)范化。
由于PICP和PINAW只反映了單方面的評(píng)價(jià)標(biāo)準(zhǔn),不能體現(xiàn)出預(yù)測(cè)結(jié)果的綜合表現(xiàn)。因此,引入基于PICP和PINAW的綜合指標(biāo)CWC作為綜合評(píng)價(jià)指標(biāo),其計(jì)算公式如下:
式中: η為大于零的參數(shù),本文中取1; μ為給定的置信水平。當(dāng)覆蓋率低于給定置信度時(shí),給予指數(shù)級(jí)懲罰,當(dāng)覆蓋率達(dá)到給定置信度時(shí),PICP將是唯一考慮的因素。
本文采用中國(guó)北方某城市2018 年9 月1 日至2018 年11 月24 日共85 天、2040 個(gè)數(shù)據(jù)進(jìn)行實(shí)證分析,考慮到工作日和非工作日負(fù)荷規(guī)律的差異性,本文分別對(duì)工作日和非工作日進(jìn)行建模。同時(shí),考慮到不同時(shí)間維度的負(fù)荷之間存在一定的相似性,在模型的輸入中加入了待預(yù)測(cè)日前兩天同一時(shí)刻的負(fù)荷值。對(duì)于不同日類型,均按照6:3:1 的比例將樣本集分為3 個(gè)子集。子集1 作為訓(xùn)練樣本,用于LSTM 結(jié)構(gòu)和參數(shù)的訓(xùn)練;子集2 用于統(tǒng)計(jì)預(yù)測(cè)誤差以及對(duì)誤差進(jìn)行區(qū)間估計(jì);子集3 是待預(yù)測(cè)集,用于對(duì)點(diǎn)預(yù)測(cè)結(jié)果以及區(qū)間預(yù)測(cè)結(jié)果進(jìn)行驗(yàn)證。建模過(guò)程中所用計(jì)算機(jī)配置為i5-8300H 處理器,8 GB 的內(nèi)存,訓(xùn)練環(huán)境為GPU,所有過(guò)程在Matlab2016b 中進(jìn)行。
本文利用CEEMDAN 方法對(duì)不同類型日負(fù)荷分別進(jìn)行分解,得到分解后的若干模態(tài)分量。以非工作日為例,分解結(jié)果見(jiàn)圖3。其中,IMF1 至IMF5 波動(dòng)性較大,IMF6 至IMF8 以及殘差序列相對(duì)較為平滑。
考慮到將分解后的序列直接作為樣本進(jìn)行模型訓(xùn)練和預(yù)測(cè),工作量較大,數(shù)據(jù)處理更為繁瑣。因此只計(jì)算各個(gè)子序列的樣本熵,其中,取m=2,r=0.2×std(IMFi)。計(jì)算結(jié)果見(jiàn)圖4。
圖3 非工作日CEEMDAN 分解結(jié)果Fig. 3 Decomposition result of CEEMDAN in nonworkdays
由以上計(jì)算結(jié)果可以發(fā)現(xiàn),IMF4、IMF5、IMF6、IMF74 個(gè)分量的樣本熵相近,IMF8、IMF92個(gè)分量的樣本熵相近,因此將其整合成新的IMF分量。以重構(gòu)后的分量序列作為新的樣本。
圖4 各子序列樣本熵Fig. 4 Sample entropy of each sequence
為了驗(yàn)證本文模型點(diǎn)預(yù)測(cè)結(jié)果精度,選取了一些對(duì)比模型,包括集合經(jīng)驗(yàn)?zāi)B(tài)分解-樣本熵-長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(ensemble empirical mode decomposition-sample entropy-long and short-term memory,EEMD-SE-LSTM)、LSTM、自回歸移動(dòng)平均(autoregressive integrated moving average mode,ARIMA)、自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)(adaptive network-based fuzzy inference system,ANFIS)模型。將子集1 和2 用作模型訓(xùn)練,子集3 用作模型測(cè)試,利用上述模型分別進(jìn)行預(yù)測(cè)。通過(guò)公式(27)計(jì)算模型預(yù)測(cè)的MAPE,將預(yù)測(cè)效果與本文模型進(jìn)行對(duì)比。表1 是對(duì)比結(jié)果,工作日和非工作日的預(yù)測(cè)結(jié)果見(jiàn)圖5 和圖6。
表1 各模型實(shí)驗(yàn)誤差Table 1 Mean absolute percentage error of different models
圖5 工作日點(diǎn)預(yù)測(cè)結(jié)果對(duì)比Fig. 5 Comparison of point prediction results of workdays
圖6 非工作日點(diǎn)預(yù)測(cè)結(jié)果對(duì)比Fig. 6 Comparison of point prediction results of nonworkdays
結(jié)果顯示,LSTM 能夠?qū)崿F(xiàn)比ARIMA 模型和ANFIS 模型更高的預(yù)測(cè)精度,3 種模型中ANFIS 的預(yù)測(cè)精度最低,LSTM 預(yù)測(cè)精度最高,且工作日和非工作日的預(yù)測(cè)結(jié)果表明LSTM 具有較好的穩(wěn)定性。此外,從分解組合預(yù)測(cè)的結(jié)果來(lái)看,在原有LSTM 模型的基礎(chǔ)上,CEEMDAN 和EEMD 的數(shù)據(jù)處理過(guò)程均能夠進(jìn)一步提高預(yù)測(cè)精度,并且本文中的分解方法的實(shí)用性更好。
本文基于“點(diǎn)預(yù)測(cè)+區(qū)間估計(jì)”的思路,通過(guò)統(tǒng)計(jì)點(diǎn)預(yù)測(cè)模型預(yù)測(cè)誤差,基于KDE 方法估計(jì)一定置信水平下誤差的置信區(qū)間。其中,具體思路為以子集1 作為訓(xùn)練集,對(duì)子集2 中的各時(shí)刻負(fù)荷進(jìn)行預(yù)測(cè)。通過(guò)統(tǒng)計(jì)子集2 預(yù)測(cè)的誤差,得到工作日和非工作日的誤差統(tǒng)計(jì)結(jié)果。此外,考慮到一天之內(nèi)各時(shí)刻負(fù)荷具有較強(qiáng)的波動(dòng)性,不同時(shí)段的負(fù)荷預(yù)測(cè)誤差存在一定的差異性,因此在區(qū)間估計(jì)的時(shí)候,首先將24 h 劃分為不同時(shí)間段,在此基礎(chǔ)上對(duì)每一時(shí)間段內(nèi)的預(yù)測(cè)誤差進(jìn)行重復(fù)抽樣,進(jìn)而得到不同時(shí)間段中的預(yù)測(cè)誤差置信區(qū)間。具體的時(shí)間段劃分參見(jiàn)文獻(xiàn)[21]。
為了驗(yàn)證KDE 估計(jì)方法在區(qū)間估計(jì)中的有效性,同時(shí),由于本文中的區(qū)間估計(jì)方法是一種非參數(shù)估計(jì),設(shè)置了不同對(duì)比模型,包括參數(shù)估計(jì)方法,假設(shè)誤差分布服從正態(tài)分布[22],以及Bootstrap 抽樣方法[23]。采用上述方法分別對(duì)各時(shí)段誤差分布進(jìn)行統(tǒng)計(jì)和區(qū)間估計(jì),將估計(jì)結(jié)果疊加到工作日和非工作日的點(diǎn)預(yù)測(cè)結(jié)果中,進(jìn)而得到各時(shí)刻負(fù)荷的預(yù)測(cè)區(qū)間,通過(guò)公式(28)和(29)計(jì)算各模型的PICP和PINAW,進(jìn)而計(jì)算各模型的CWC值。詳細(xì)對(duì)比結(jié)果見(jiàn)表2 和表3,圖7 和圖8給出了不同置信水平下工作日和非工作日本文模型的區(qū)間預(yù)測(cè)結(jié)果。
表2 各模型區(qū)間預(yù)測(cè)效果(90%置信水平)Table 2 Interval prediction effects of different models(90% confidence level)
相對(duì)于其他方法,相同的置信水平下,核密度估計(jì)的結(jié)果中,PICP指標(biāo)更大,表明能夠覆蓋更多的負(fù)荷實(shí)際值,但PINAW指標(biāo)不能保證小于Bootstrap 估計(jì)核正態(tài)分布估計(jì)的結(jié)果,表明其區(qū)間寬度并不能達(dá)到最小。但綜合指標(biāo)CWC值顯示,核密度估計(jì)的結(jié)果最小,反映出本文中所使用的核密度估計(jì)方法能夠表現(xiàn)出更好的綜合性能。
表3 各模型區(qū)間預(yù)測(cè)效果(95%置信水平)Table 3 Intervalprediction effects of different models interval (95% confidence level)
圖7 工作日區(qū)間預(yù)測(cè)結(jié)果Fig. 7 Interval prediction results of workdays
圖8 非工作日區(qū)間預(yù)測(cè)結(jié)果Fig. 8 Interval prediction results of nonworkdays
本文基于CEEMDAN 分解的負(fù)荷點(diǎn)預(yù)測(cè)能夠有效提高預(yù)測(cè)精度,其預(yù)測(cè)效果略高于EEMD 分解方法,同時(shí),也驗(yàn)證了組合預(yù)測(cè)方法能夠明顯地提高預(yù)測(cè)效果,降低點(diǎn)預(yù)測(cè)誤差。
基于KDE 的區(qū)間估計(jì)方法,可以進(jìn)一步提高預(yù)測(cè)區(qū)間覆蓋率,并降低區(qū)間平均寬度,其估計(jì)結(jié)果在CWC指標(biāo)上表現(xiàn)出較好的性能。
本文的預(yù)測(cè)是基于“點(diǎn)預(yù)測(cè)+區(qū)間估計(jì)”的思路,因此整體預(yù)測(cè)包含兩個(gè)重要環(huán)節(jié),一是要保證點(diǎn)預(yù)測(cè)的精度,二是在區(qū)間估計(jì)時(shí)要提高估計(jì)的準(zhǔn)確性。本文采用的區(qū)間預(yù)測(cè)方法能夠有效地提升預(yù)測(cè)效果,未來(lái)可考慮結(jié)合深度學(xué)習(xí)技術(shù),在更多的大樣本環(huán)境下,進(jìn)一步提高模型的預(yù)測(cè)精度,同時(shí)也可以將預(yù)測(cè)拓展到可再生能源的出力預(yù)測(cè)等領(lǐng)域。