王 森,孫永輝,周 衍,王建喜,侯棟宸,張林闖
(河海大學(xué) 能源與電氣學(xué)院,江蘇 南京 210098)
隨著傳統(tǒng)化石能源的日益枯竭,環(huán)境污染問題日趨嚴(yán)重。在我國明確提出“3060”碳排放目標(biāo)后,以風(fēng)電、光伏為代表的可再生能源發(fā)電快速增長。其中,風(fēng)電由于無污染、取之不竭等優(yōu)勢受到廣泛關(guān)注[1]。近年來,風(fēng)電開發(fā)利用進(jìn)入快速發(fā)展階段,但是由于受天氣因素的影響較大,風(fēng)電具有很強的隨機性和波動性[2],同時,風(fēng)電在電力系統(tǒng)中的滲透率不斷提升,給電力系統(tǒng)的安全穩(wěn)定運行帶來了極大挑戰(zhàn)。準(zhǔn)確的風(fēng)電功率預(yù)測是解決上述問題的關(guān)鍵,這對于電力系統(tǒng)穩(wěn)定運行、電力市場競價、備用容量優(yōu)化、儲能容量優(yōu)化均有重要意義[3-5]。
深度學(xué)習(xí)是對人工神經(jīng)網(wǎng)絡(luò)的深度拓展,可通過多層算法使模型獲得更好的特征表達(dá)[6]。文獻(xiàn)[7]提出深度置信網(wǎng)絡(luò)DBN(Deep Belief Network)可從原始數(shù)據(jù)中構(gòu)造出新的數(shù)據(jù)特征并可以將其應(yīng)用于電力系統(tǒng)的研究中。文獻(xiàn)[8]將原始高維特征輸入DBN,充分利用深層架構(gòu)的提取優(yōu)勢,提高暫態(tài)穩(wěn)定評估的準(zhǔn)確率。文獻(xiàn)[9]將DBN 用于故障數(shù)據(jù)的特征提取,提高故障診斷的準(zhǔn)確率。DBN 由于強大的特征篩選能力,被廣泛應(yīng)用于電力系統(tǒng)的設(shè)備故障診斷、配電網(wǎng)無功優(yōu)化、模式識別和竊電行為檢測等領(lǐng)域中。
目前,風(fēng)電功率預(yù)測的方法主要分為兩大類:一類對風(fēng)電功率進(jìn)行確定性預(yù)測,即點預(yù)測,電力調(diào)度、發(fā)電廠、場站運維等部門除了需要點預(yù)測結(jié)果之外,還需要風(fēng)電可能出力范圍,僅給出點預(yù)測值不能完全滿足其需要;另一類考慮風(fēng)電出力的隨機性與波動性,基于風(fēng)電功率的概率密度函數(shù)刻畫風(fēng)電功率范圍,即概率預(yù)測。由于點預(yù)測不可避免地存在誤差,而概率預(yù)測能提供更多信息,因此,概率預(yù)測逐漸成為國內(nèi)外研究的熱點。
國內(nèi)外學(xué)者對風(fēng)電功率預(yù)測、誤差修正和參數(shù)化概率預(yù)測建模進(jìn)行了深入研究,取得了較豐富的成果。文獻(xiàn)[10]提出基于波動的誤差修正方法,考慮風(fēng)電功率的波動性過程,建立誤差與氣象指標(biāo)之間的關(guān)系。文獻(xiàn)[11]提出一種考慮風(fēng)電功率爬坡事件的超短期功率預(yù)測和校正模型,利用旋轉(zhuǎn)門算法識別功率爬坡事件,實現(xiàn)風(fēng)電功率預(yù)測結(jié)果的修正。文獻(xiàn)[12]分析物理擬合誤差對預(yù)測誤差的影響,準(zhǔn)確描述各風(fēng)速段的不同誤差分布。文獻(xiàn)[13]研究預(yù)測誤差的概率分布情況,建立不同預(yù)測值范圍內(nèi)多誤差分布模型。文獻(xiàn)[14]將回歸模型不確定性方差與殘差噪聲的方差相結(jié)合,準(zhǔn)確計算出概率預(yù)測區(qū)間。需要指出的是,上述文獻(xiàn)主要是對誤差修正和概率預(yù)測分別進(jìn)行研究,未能有效地將誤差修正和概率預(yù)測相結(jié)合。
綜上,本文提出計及誤差時間相依性的風(fēng)電功率超短期條件概率預(yù)測模型。首先,基于風(fēng)電功率歷史特征進(jìn)行建模,利用DBN 和粒子群優(yōu)化PSO(Particle Swarm Optimization)算法進(jìn)行風(fēng)電功率點預(yù)測;其次,基于預(yù)測誤差的時間相依性特點,建立誤差修正模型,對預(yù)測結(jié)果進(jìn)行修正;然后,對修正后的預(yù)測誤差進(jìn)行條件建模,建立誤差集優(yōu)化模型,實現(xiàn)風(fēng)電功率超短期條件概率預(yù)測;最后,通過實際算例驗證本文所提模型可有效提高風(fēng)電功率超短期概率預(yù)測質(zhì)量。
2006 年,Hilton 利用逐層學(xué)習(xí)策略對樣本數(shù)據(jù)進(jìn)行訓(xùn)練,獲得了一個效果較好的深層神經(jīng)網(wǎng)絡(luò),即DBN,打破了深層網(wǎng)絡(luò)難以被訓(xùn)練的局面。
1.1.1 受限玻爾茲曼機
受限玻爾茲曼機RBM(Restricted Boltzmann Machine)嵌套疊加組成DBN,RBM 層內(nèi)神經(jīng)元之間沒有連接,即圖論中描述的二部圖,如附錄A 圖A1 所示,可見層和隱含層之間的能量[15]定義為:
式中:E(v,h)為RBM的能量函數(shù),v為可見層狀態(tài)向量,h為隱含層狀態(tài)向量;m、n分別為可見層和隱含層神經(jīng)元個數(shù);ai、vi分別為可見層第i個神經(jīng)元的偏置和狀態(tài),第1 個可見層的輸入為風(fēng)電功率歷史數(shù)據(jù)向量;bj、hj分別為隱含層第j個神經(jīng)元的偏置和狀態(tài),該層輸入為可見層輸出;wij為第i個可見層和第j個隱含層之間的連接權(quán)重。
可見層和隱含層的聯(lián)合概率p(v,h)定義為:
根據(jù)給定的可見層狀態(tài)以及模型訓(xùn)練后的參數(shù),可計算出隱含層狀態(tài)的條件概率p(h|v)為:
式中:p(v)為可見層的邊際概率。
對于給定的風(fēng)電功率歷史時間序列,下一層隱含層的數(shù)值取決于上一層可見層的數(shù)值特征,通過該過程可建立相鄰2 層之間的數(shù)值關(guān)系,以便完成后續(xù)數(shù)值特征篩選。將式(2)代入式(3)可得:
同理,根據(jù)給定的隱含層狀態(tài),可計算可見層狀態(tài)的條件概率p(vi=1|h)為:
式中:σ(·)為激活函數(shù),本文模型采用Sigmoid 函數(shù)。根據(jù)相鄰2 層之間的條件概率,結(jié)合訓(xùn)練過程,完成數(shù)值關(guān)系的特征篩選。
1.1.2 DBN訓(xùn)練
當(dāng)反向傳播BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)為單隱含層時,效率較高,而當(dāng)堆積到多層隱含層時,效率就會大幅降低,因此,BP 神經(jīng)網(wǎng)絡(luò)在淺層神經(jīng)網(wǎng)絡(luò)中應(yīng)用較廣,多用于解決一些比較簡單的映射建模問題,但由于其隱含層數(shù)較少,所以映射能力十分有限,并且容易產(chǎn)生局部最優(yōu)問題。為了克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間長和局部最優(yōu)等缺點,DBN訓(xùn)練可以分為正向預(yù)訓(xùn)練和反向微調(diào)2 個過程,對RBM進(jìn)行無監(jiān)督逐層訓(xùn)練,再進(jìn)行反向微調(diào)。
采用對比散度CD(Contrastive Divergence)算法進(jìn)行正向預(yù)訓(xùn)練[16],通過最大化似然函數(shù)求得網(wǎng)絡(luò)參數(shù),對RBM 進(jìn)行無監(jiān)督預(yù)訓(xùn)練,根據(jù)上下層間的參數(shù)誤差更新各參數(shù):
式中:λ為學(xué)習(xí)率;·data表示數(shù)據(jù)分布的期望;·model表示RBM 定義的期望,由吉布斯采樣的數(shù)據(jù)分布決定。
反向微調(diào)是通過監(jiān)督學(xué)習(xí)對網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào),一般采用梯度下降算法,但考慮到該算法容易陷入局部最優(yōu),本文采用Wake-Sleep 算法進(jìn)行反向微調(diào)[16]。Wake過程又被稱為認(rèn)知過程,對于輸入的風(fēng)電功率歷史數(shù)據(jù),通過式(5)計算條件概率,重新采樣得到新樣本,新樣本雖不具有物理意義,但通過微調(diào)下層參數(shù)可以使得重建數(shù)據(jù)特征與原始風(fēng)電功率歷史數(shù)據(jù)特征盡可能相似。Sleep 過程又被稱為生成過程,對于Wake過程得到的新樣本,通過式(6)計算條件概率,通過微調(diào)上層參數(shù)使得重建數(shù)據(jù)特征與上層數(shù)據(jù)特征盡可能相似。2 個過程不斷交替進(jìn)行,直到收斂,完成對風(fēng)電功率歷史數(shù)據(jù)數(shù)值特征的提取和預(yù)測。DBN結(jié)構(gòu)如圖1所示。
圖1 DBN結(jié)構(gòu)Fig.1 Structure of DBN
高分辨率氣象實測數(shù)據(jù)有利于模型預(yù)測精度的提升[17],由于數(shù)值天氣預(yù)報不可避免地存在誤差,而風(fēng)電功率歷史數(shù)據(jù)采樣穩(wěn)定且能準(zhǔn)確反映風(fēng)機本身物理特性,因此在進(jìn)行超短期預(yù)測時可僅采用風(fēng)電功率歷史數(shù)據(jù)作為模型輸入[18]。
對風(fēng)電功率歷史數(shù)據(jù)時間序列進(jìn)行窗口滾動以提取數(shù)據(jù)并構(gòu)建模型輸入矩陣X,本文所選擇的輸入輸出模型如附錄A圖A2所示。
式中:J(·)為DBN模型輸入與輸出之間的映射函數(shù)。
在實際工程應(yīng)用中,待預(yù)測時刻真值為未知值,即預(yù)測誤差未知,因此,將訓(xùn)練集輸入DBN 模型中進(jìn)行訓(xùn)練,根據(jù)訓(xùn)練集再預(yù)測的誤差值,PSO 算法優(yōu)化約束為該誤差Etrain最?。?/p>
式中:為訓(xùn)練集預(yù)測功率值;Ptrain為訓(xùn)練集實際功率值。
經(jīng)過DBN-PSO 算法訓(xùn)練和優(yōu)化后的模型可表示為:
式中:w、a、b分別為預(yù)測模型權(quán)重以及可見層和隱含層偏置的最優(yōu)參數(shù)。
由于現(xiàn)有研究致力于提高預(yù)測模型的精確度,因此,更加關(guān)注模型預(yù)測對象的準(zhǔn)確性,對預(yù)測誤差矯正聚焦于縱向誤差,即模型輸出的預(yù)測值與實際值之間的差值,忽略了誤差在時間上的相依性。由于天氣具有很強的慣性,不會在極短的時間內(nèi)發(fā)生突變,因此采樣點之間存在很強的時間相依性,可通過相關(guān)性分析得到?;诖?,本文通過不同時刻的功率對當(dāng)前時刻的功率進(jìn)行修正,即從誤差時間相依性的角度確定一個時間修正系數(shù),實現(xiàn)預(yù)測誤差的修正。對預(yù)測誤差在時間相依性上的矯正,也可達(dá)到預(yù)測對象矯正的目的,將在水平方向上的時間誤差定義為橫向誤差[21],如附錄A圖A3所示。
以數(shù)據(jù)分辨率為15 min 為例,即超短期預(yù)測可分為16 個時間尺度預(yù)測模型。不同時間尺度的預(yù)測造成不同的時間相依性,為準(zhǔn)確獲得時間修正系數(shù),同時考慮工程的可操作性,將整個數(shù)據(jù)集中80%~90%的數(shù)據(jù)組成交叉驗證集,計算誤差修正系數(shù)。文獻(xiàn)[21]提出一種橫向誤差修正方法,但是該方法需要進(jìn)行功率爬坡識別。本文利用交叉驗證集的已知數(shù)據(jù)進(jìn)行誤差修正系數(shù)搜索的步驟如下。
1)平滑數(shù)據(jù)集,計算平滑后各采樣點之間的導(dǎo)數(shù),確定功率上爬坡和下爬坡轉(zhuǎn)折點。
2)選取爬坡中間時刻Γ,計算預(yù)測值和該預(yù)測時刻之前實際值的差值EΓ:
3)選取EΓ中最小值所對應(yīng)實際功率值的時刻作為待修正時刻,并計算時間差:
式中:Δτ為時間修正系數(shù);為EΓ中最小值對應(yīng)預(yù)測時刻;τ為EΓ中最小值對應(yīng)實際功率值的時刻。
4)功率上爬坡和下爬坡的轉(zhuǎn)折時間可能導(dǎo)致產(chǎn)生多個時間修正系數(shù),本文將時間修正系數(shù)集ΔT中出現(xiàn)頻次最高的時間修正系數(shù)作為最終系數(shù)。
參數(shù)化建模由于具有速度快、易實現(xiàn)的優(yōu)勢,成為實際工程中一種常用的建模方式。根據(jù)中心極限定理可知,在一定的樣本下,風(fēng)電功率點預(yù)測誤差服從高斯分布。
利用常規(guī)參數(shù)化概率預(yù)測模型構(gòu)建的預(yù)測區(qū)間寬度相等,所得預(yù)測結(jié)果較為粗糙,因此,本文在常規(guī)參數(shù)化概率預(yù)測模型的基礎(chǔ)上,提出以篩選條件對誤差集進(jìn)行優(yōu)化,對滿足條件的數(shù)據(jù)構(gòu)建概率預(yù)測模型,達(dá)到提高區(qū)間質(zhì)量的目的。本文條件概率預(yù)測模型的構(gòu)建過程如下。
1)考慮到實際工程應(yīng)用中待預(yù)測時刻實際功率值未知,為避免數(shù)據(jù)泄露,計算測試集中功率預(yù)測值與訓(xùn)練集中功率預(yù)測值的差值e:
2)按照一定比例(該比例以滿足置信度為約束,通過優(yōu)化算法確定)取出差值中前ζ個最小的預(yù)測差值及相應(yīng)預(yù)測誤差,構(gòu)成新數(shù)據(jù)集。
3)計算新數(shù)據(jù)集對應(yīng)的實際功率值和預(yù)測功率值之間的誤差。
4)計算新數(shù)據(jù)集的方差和標(biāo)準(zhǔn)差,分別根據(jù)式(14)和式(15)計算待預(yù)測時刻風(fēng)電功率預(yù)測區(qū)間的上限值以及下限值,即為該點區(qū)間的上限值和下限值。
式中:z1-α/2為置信度為α的分位數(shù);σb為新數(shù)據(jù)集的標(biāo)準(zhǔn)差。
5)重復(fù)步驟4),計算測試集中每個點的上限值和下限值,將所有點順序連接,構(gòu)成整個預(yù)測區(qū)間的上限和下限。
計及誤差時間相依性的風(fēng)電功率超短期條件概率預(yù)測流程圖如圖2 所示。本文建立計及誤差時間相依性的風(fēng)電功率超短期條件概率預(yù)測模型,利用DBN 對風(fēng)電功率歷史時間序列進(jìn)行特征篩選,為避免參數(shù)設(shè)置的偶然性,采用PSO 算法進(jìn)行網(wǎng)絡(luò)參數(shù)尋優(yōu),建立超短期點預(yù)測模型。與文獻(xiàn)[21]中模型相比,本文模型結(jié)構(gòu)簡單,且顯著提高了點預(yù)測質(zhì)量。與文獻(xiàn)[14]中方法相比,本文方法通過對誤差集進(jìn)行優(yōu)化有效提高了概率預(yù)測的區(qū)間質(zhì)量。
圖2 風(fēng)電功率超短期條件概率預(yù)測流程圖Fig.2 Flowchart of ultra-short term conditional probability prediction of wind power
為了從不同方面評價所提模型的性能,采用不同評價指標(biāo)對預(yù)測結(jié)果進(jìn)行分析。對于點預(yù)測,采用平均絕對百分比誤差MAPE(Mean Absolute Percent Error)和均方根誤差RMSE(Root Mean Square Error)指標(biāo)[22];對于概率預(yù)測,采用預(yù)測區(qū)間覆蓋度PICP(Prediction Interval Coverage Probability)、平均區(qū)間寬度MIW(Mean Interval Width)和綜合得分指標(biāo)。
MAPE表達(dá)式為:
式中:eMAPE為MAPE;pt為t時刻風(fēng)電功率實際值;C為風(fēng)機裝機容量。
RMSE表達(dá)式為:
式中:eRMSE為RMSE。
MIW表達(dá)式為:
式中:M為MIW;ut、lt分別為t時刻風(fēng)電功率預(yù)測區(qū)間的上限值和下限值。
PICP表達(dá)式為:
式中:F為PICP。
綜合得分表達(dá)式為:
綜合得分是對概率預(yù)測區(qū)間整體性能的評價,其值越接近0,說明概率預(yù)測整體質(zhì)量越高。
本文基于我國吉林省某風(fēng)電場實際數(shù)據(jù)進(jìn)行算例分析,該風(fēng)電場裝機容量為49.5 MW,選取該風(fēng)電場2019年1月數(shù)據(jù)對本文模型進(jìn)行驗證。采樣點間隔,即時間分辨率為15 min。本文以2 h時間尺度為例進(jìn)行超短期預(yù)測測試。
本文模型采用滾動預(yù)測方式,同時為避免累積誤差,每15 min 更新一次現(xiàn)場數(shù)據(jù)。將數(shù)據(jù)集按照8∶1∶1 的比例分別劃分為訓(xùn)練集、交叉驗證集和測試集。交叉驗證集用于確定誤差修正系數(shù)以及優(yōu)化預(yù)測模型參數(shù)。本文對數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行預(yù)處理,首先對歷史功率時間序列進(jìn)行窗口滑動以提取數(shù)據(jù)形成數(shù)據(jù)集,選取特征數(shù)r=10,然后將數(shù)據(jù)進(jìn)行歸一化處理以提高模型訓(xùn)練性能和效率,本文選擇線性函數(shù)進(jìn)行歸一化,即進(jìn)行最大最小處理[14],歸一化之后的數(shù)據(jù)被壓縮到[0,1]區(qū)間,為了直觀分析預(yù)測的性能,最終的預(yù)測結(jié)果需要進(jìn)行反歸一化處理。
為了體現(xiàn)本文所提算法的優(yōu)勢,將本文DBN、BP 及文獻(xiàn)[14]的極限學(xué)習(xí)機ELM(Extreme Learning Machine)進(jìn)行點預(yù)測結(jié)果的對比。不同預(yù)測算法的點預(yù)測結(jié)果如圖3所示,評價指標(biāo)結(jié)果如表1所示。
圖3 不同預(yù)測算法的點預(yù)測結(jié)果Fig.3 Results of point prediction for different prediction algorithms
表1 不同預(yù)測算法的評價指標(biāo)結(jié)果Table 1 Results of evaluation indexes for different prediction algorithms
由圖3 和表1 可知,本文DBN 在風(fēng)電功率出現(xiàn)爬坡時有較好的預(yù)測性能,尤其是在采樣點81—121,而在該采樣點范圍內(nèi),BP和ELM 雖然可以有效地跟蹤功率的爬坡,但是由于魯棒性較差,當(dāng)風(fēng)電功率連續(xù)上下爬坡交替時預(yù)測性能不佳,這說明DBN可有效提取特征以及改善模型的預(yù)測性能。
首先,根據(jù)實際參數(shù)選取經(jīng)驗和算法運算情況確定隱含層層數(shù),通過實驗分別計算不同層數(shù)的預(yù)測結(jié)果,綜合考慮計算效率和預(yù)測效果,本文模型隱含層設(shè)置為2 層最佳。然后,通過PSO 算法優(yōu)化確定每層神經(jīng)元個數(shù),優(yōu)化過程如圖4 所示。由圖可知,在尋優(yōu)迭代過程中,第1層神經(jīng)元個數(shù)在20附近收斂,第2 層神經(jīng)元個數(shù)在30 附近收斂,因此,DBN中2層RBM神經(jīng)元個數(shù)尋優(yōu)結(jié)果分別為20與28。
圖4 PSO算法尋優(yōu)結(jié)果Fig.4 Optimization results of PSO algorithm
根據(jù)式(14)、(15),基于點預(yù)測的結(jié)果,計算點預(yù)測誤差分布的密度函數(shù),建立概率預(yù)測區(qū)間,因此,點預(yù)測的準(zhǔn)確性是影響概率預(yù)測性能的關(guān)鍵。誤差修正前后的預(yù)測結(jié)果對比如圖5 所示,評價指標(biāo)對比如表2 所示。通過對比分析可知,考慮誤差時間相依性的誤差修正模型可以顯著提高模型的預(yù)測性能。
圖5 修正前后預(yù)測結(jié)果對比Fig.5 Comparison of prediction results between before and after correction
表2 誤差修正前、后評價指標(biāo)比較Table 2 Comparison of evaluation indexes between before and after error correction
為了驗證所提條件概率預(yù)測模型的可行性,將條件概率預(yù)測和普通概率預(yù)測進(jìn)行對比,概率預(yù)測結(jié)果如圖6 所示(以85%置信度為例),評價指標(biāo)如表3 所示。不同置信度下的條件概率預(yù)測結(jié)果如附錄A 圖A4所示。由結(jié)果可知,本文所提條件概率預(yù)測模型在滿足置信區(qū)間的同時可有效減小區(qū)間寬度。
表3 概率預(yù)測評價指標(biāo)對比Table 3 Comparison of evaluation indexes of probability prediction
圖6 概率預(yù)測結(jié)果Fig.6 Results of probability prediction
本文基于風(fēng)電功率歷史實測功率數(shù)據(jù),將DBN與PSO算法尋優(yōu)結(jié)合,考慮點預(yù)測誤差時間相依性,提出以篩選條件對誤差集進(jìn)行優(yōu)化,建立計及誤差時間相依性的風(fēng)電功率超短期條件概率預(yù)測模型,提高概率預(yù)測質(zhì)量。基于我國吉林省某風(fēng)電場的實際數(shù)據(jù)進(jìn)行仿真測試,驗證了所提模型的有效性。
附錄見本刊網(wǎng)絡(luò)版(http://www.epae.cn)。