竇麗霞 周其龍
(河南師范大學新聯(lián)學院 河南 鄭州 450000)
由于風電本身的隨機性,風電的大規(guī)模并入對電力系統(tǒng)[1]和電力市場[2]都提出了挑戰(zhàn)。因此,高比例風接入下的電力系統(tǒng)的可靠和經(jīng)濟運行較大程度取決于風電預測值,尤其是在分布式和高度互聯(lián)發(fā)電的智能電網(wǎng)模式中。短期預測的應用包括功率平衡和最佳備用以及風電場控制[3]。此外,風能的隨機性和問題的復雜性要求進行時空概率處理,以便做出最優(yōu)決策。
文獻[4]和文獻[5]對短期風電預測進行了回顧,其中對于小于約6 h的預測水平,通常使用位置信息的統(tǒng)計方法優(yōu)于物理模型,它需要數(shù)小時的計算時間,并通過空間插值而引入不確定性。這些統(tǒng)計方法通常是非空間的,例如,自回歸建模[6]、馬爾可夫鏈[7]、數(shù)據(jù)挖掘[8],以及各種混合方法[9]。超短期預測的方法包括馬爾可夫切換[10]和參數(shù)概率預測[11],兩者都屬于自回歸技術(shù)。目前已有研究提出了空間預測方法來探索小區(qū)域中幾個風電場的出力之間的時空關(guān)系。文獻[12]通過風向?qū)Σ煌目臻g信息進行回歸模擬。文獻[13]通過擬合向量自回歸模型,分析風速和風向之間的空間相關(guān)性,并利用多個風力發(fā)電場作為空間傳感器提高對風電的預測能力。近期的研究則試圖建立具有稀疏高斯隨機場的有效概率空間模型,但僅限于適度的空間維度[14-15]。隨著當今許多電力系統(tǒng)中風力發(fā)電場的豐富,人們期望為數(shù)十個或數(shù)百個風力發(fā)電場建立一個空間預測因子,從而使得計算成本和自動化模型更契合現(xiàn)實。
本文提出一種預測方法,用于在以前難以處理的大型空間尺度上進行超短期的概率預測。模型擬合程序完全是由數(shù)據(jù)驅(qū)動的,因此非常適用于智能電網(wǎng)。多個發(fā)電機共享一個高度互聯(lián)的電力系統(tǒng),并且需要捕獲空間依賴性。本文基于logit-normal分布的參數(shù)概率框架以及將該分布的位置參數(shù)建模為稀疏向量自回歸過程(sVAR),并提出一種具有動態(tài)遺忘因子的指數(shù)平滑方案來跟蹤尺度參數(shù),將其與邊界加權(quán)(Boundary Weighted,BW)方法進行比較。實驗結(jié)果顯示了本文算法的優(yōu)越性。
本文數(shù)據(jù)通過相應的標稱功率進行歸一化,使其分布于區(qū)間[0,1]。假設風電遵循logit-normal分布。相應的變換由式(1)給出。
(1)
其逆變換為:
x=γ-1(y)=(1+e-y)-1y∈R
(2)
式中:X服從logit-normal分布,則變換后的變量Y=γ(X)為正態(tài)分布,其中X、Y分別表示x、y的集合。logit-normal分布的密度函數(shù)如下:
(3)
式中:參數(shù)μ和σ2為Y~N(μ,σ2)的均值和方差。 現(xiàn)在分別采用{xt}和{yt}來考慮隨機過程{Xt}及其轉(zhuǎn)換{Yt}。其表述如下:
(4)
(5)
為了計算未來某時刻風力密度預測{Xt+k},需要預測分布的位置和比例參數(shù),即{Yt+k}變換過程的均值和方差。因此,通過將{Yt+k}建模為自回歸過程(Autoregressive Process, AR)或向量自回歸過程(Vector Autoregressive Process,VAR)來進行。將來自多個風電場的測量值進行對數(shù)正態(tài)變換并嵌入向量值時間序列中,并且由每個向量元素的未來值提供對應位置參數(shù)的預測。由此,可以近似地對比例參數(shù)建模。為了簡單起見,假定它是緩慢變化的,并由指數(shù)平滑方案逐點跟蹤。對于向量賦值過程,例如在多個位置進行的一系列測量,向量元素之間的依賴關(guān)系可能存在于一個范圍的尺度上。VAR模型可以捕獲這種時空依賴性,并且比獨立的AR模型產(chǎn)生更優(yōu)的預測。然而,隨著空間維度變大,參數(shù)數(shù)量隨著維數(shù)的平方增加,VAR模型會變得難以估計,并且有用的空間信息越來越少。因此需追求VAR模型的稀疏參數(shù)化,即在模型中保留了連接具有空間相關(guān)性的站點的系數(shù),而不忽略那些站點的系數(shù)。由此得到的sVAR是完整VAR模型的一種精確參數(shù)化,且與完整的VAR等價相比,所需訓練數(shù)據(jù)更少。
首先考慮單個風電場風力發(fā)電預測密度問題。時間序列xt為t時刻風電場出力。{xt}的logit-normal轉(zhuǎn)換為{yt},并且將其建模為AR(p)。將未來觀測值yt+k與先前測量值相關(guān)的表達式寫為:
(6)
式中:aτ是第τ次滯后的自回歸系數(shù);εt+k是具有有限方差σ2的加性高斯噪聲。yt+k的期望值如下:
(7)
與σ2一起參數(shù)化{Yt+k}~N(μt+k,σ2)的預測分布。接下來考慮在M個空間分離的風電場計算風電的預測密度。序列{xt}為t時刻在每個風電場測量的功率,其中每個xt∈[0,1]M。{xt}的logit-normal變換和預測分布都是通過式(1)-式(5)來計算。然后就可以使用變換所得的時間序列{yt},其中yt∈RM。
VAR(p)為p階段新時間序列,其自回歸過程可表示為:
(8)
式中:矩陣Aτ∈RM×M包含VAR系數(shù)。零均值高斯噪聲t∈RM具有非奇異協(xié)方差矩陣Σε。yt+k的期望值由式(9)給出。
(9)
通常,VAR系數(shù)和噪聲協(xié)方差矩陣由最大似然估計(Maximum Likelihood Estimation, MLE)確定,當VAR(p)為高斯過程且對參數(shù)沒有約束時,生成Yule-Walker方程。然而對于大空間維度的模型,快速估計所有pM2VAR系數(shù)不切實際,并且可能產(chǎn)生噪聲和不確定預測(特別是當可用的訓練數(shù)據(jù)不足時)。因此本文提出稀疏估計方法克服這些缺點。
擬合稀疏向量自回歸模型的兩階段程序中,第一階段基于對應的時間序列對條件依賴性選擇要包括在稀疏模型中的對稱系數(shù)對。第二階段通過其t統(tǒng)計量對各個系數(shù)進行排序來細化初始選擇。在每個階段,所選擇的系數(shù)集合是最小化貝葉斯信息準則(Bayesian Information Criterion,BIC)的系數(shù)。先對兩個階段進行展開如下。
(1) 階段1:該階段目標是確定時間回歸的階數(shù)p,并選擇要在稀疏模型中保留的N對非對角線系數(shù)。這是通過消除被確定為條件不相關(guān)的系列對并將相應的VAR系數(shù)設置為零來實現(xiàn)的。 所有對角線系數(shù),即包含自動協(xié)變量信息的系數(shù),都保留在階段1中。設{yt,i}表示過程{yt}的第i個邊緣序列。 如果兩個不同的時間序列{yt,i}和{yt,j}(i≠j)有條件地不相關(guān),則它們的部分光譜相干性PSCij(ω)=0表示ω∈(-π,π)。PSC為從過程{yt}的譜密度矩陣fY(ω)有效地計算得出,其中fY(ω)的第(i,j)個元素為{yt,i}和{yt,j}之間的常用頻譜。PSC是譜密度矩陣的負重新縮放逆。讓gY(ω)=fY(ω)-1,然后有:
(10)
(11)
(12)
式中:[Aτ]ij的標準誤差s.e.(·)是根據(jù)第1階段模型的最大似然估計值的漸近分布來進行計算的。
BIC是參數(shù)估計數(shù)的光滑凸函數(shù),它可以有效地實現(xiàn)sVAR過程:一旦找到了函數(shù)的轉(zhuǎn)折點,就可以獲得最小值,從而改進擬合算法。有充分證據(jù)表明,隨著季節(jié)和氣候的變化,氣象時間序列的特性(包括風速)會隨著時間的推移而緩慢變化。因此,如果未直接建模,則允許時間序列模型的參數(shù)跟蹤此變化是適當?shù)摹oL力作為依賴天氣的過程也是如此。實施遞歸更新AR參數(shù),并且可以容易地擴展到VAR模型, 但通常不可能以簡單的方式修改所提出sVAR模型的稀疏性結(jié)構(gòu)。實際上,緩慢變化參數(shù)的方法與突然選擇納入或移除系數(shù)是沖突的。
為了捕捉這些緩慢的變化,將sVAR在最近測量的一個時間窗上進行訓練,然后以同樣的方式定期進行再訓練,即在任何時間t,模型是根據(jù)t-L和t-1之間的觀察值進行訓練的,其中L是訓練窗口長度。為了進行比較,AR和VAR以相同的方式進行訓練。其中sVAR的參數(shù)可以在遞歸框架中以與傳統(tǒng)AR或VAR模型相同的方式進行更新。此外,尺度參數(shù)也應該能夠跟蹤動態(tài)變化導致的氣象變化。
(13)
(14)
(15)
將本文方法在澳大利亞能源市場運營商提供的5分鐘平均風力發(fā)電數(shù)據(jù)上進行了測試,該數(shù)據(jù)包括澳大利亞東南部22個風力發(fā)電場的風力發(fā)電記錄。2012年和2013年的數(shù)據(jù)可在每個現(xiàn)場獲得,包括210 528次測量。所有數(shù)據(jù)都歸一化至區(qū)間[0,1]。風電場位置如圖1所示。以2012年數(shù)據(jù)為訓練集,通過交叉驗證優(yōu)化擬合過程的實現(xiàn),并選擇指數(shù)平滑方案的參數(shù)。然后,利用2013年的數(shù)據(jù)評估預測值的性能。優(yōu)化結(jié)果包括對230多萬個單獨預測的分析。
圖1 風電場位置
通過使用訓練數(shù)據(jù)集進行交叉驗證,以啟發(fā)式方法確定用于訓練AR、VAR和sVAR的數(shù)據(jù)窗口L的大小。選擇的窗口長度是最小化點預測的均方根誤差(Root-Mean-Squared Error,RMSE)的窗口長度。新的模型適合每月進行預測,以跟蹤時間序列動態(tài)變化。窗口長度選擇程序的結(jié)果如圖2所示。AR模型的最佳窗口長度為90天,sVAR的最佳窗口長度為150天。如前所述,傳統(tǒng)的VAR模型極度依賴于數(shù)據(jù),而且計算成本非常高,因此VAR模型不能適用于超過270天的訓練數(shù)據(jù)。
圖2 AR、VAR和sVAR模型RMSE值 隨訓練窗長度的變化
最佳窗口長度與三個模型中每個模型的參數(shù)估計數(shù)直接相關(guān)。AR具有pM參數(shù),因此只需要少量的訓練數(shù)據(jù),而VAR具有pM2參數(shù),因此需要更多的訓練數(shù)據(jù)來生成可靠的參數(shù)估計。sVAR則提供了一個折衷方案:增加參數(shù)數(shù)量以利用空間信息,但只包括部分重要的參數(shù)。此外,另選擇兩種指數(shù)平滑方案的基本遺忘因子,使有效內(nèi)存為2 000個樣本(λ=0.999 5)。
圖3 sVAR系數(shù)矩陣疊加
(a) 點和概率預測值
(b) 動態(tài)遺忘因子圖4 概率預測和動態(tài)遺忘因子值
分布預測的技巧由連續(xù)秩概率分數(shù)(Continuous Rank Probability Score,CRPS)和對數(shù)分數(shù)來進行量化。CRPS由式(16)給出。
(16)
式中:F是預測分布的累積形式;l(·)是指標函數(shù)。點概率預測情況見表1,預測每月情況見表2。點預測分數(shù)表明,sVAR在RMSE方面比所有基準都有所改善。而對于MAE,除了持久性以外,其他都有所改善。持久性不提供概率信息,這是在不確定性條件下進行最優(yōu)決策所必需的,因此,轉(zhuǎn)向采用更復雜的方法。
表1 點概率預測情況
表2 每月預測情況
通過對尺度參數(shù)的BW跟蹤,sVAR在CRPS方面表現(xiàn)得很好,但與其他模型相比評分很低。較高的評分是一個非常關(guān)鍵的預測分布影響因素,其通常會接近上限和下限,在分布的尾部更有可能發(fā)現(xiàn)測量值。AR和VAR模型則具有更高的方差和更廣泛的預測分布,一般不經(jīng)常受到這種因素影響。
當采用所提出的動態(tài)遺忘因子方案跟蹤尺度參數(shù)時,三個模型的CRPS和評分均較BW方案有顯著改善。值得注意的是,預測分布接近邊界的改進為使sVAR的評分與AR和VAR模型一致。在這種情況下,sVAR的效果略好于兩個基準。此外,概率預測的可靠性(或校準)是至關(guān)重要的,可以用如圖5所示的可靠性圖進行評估。sVAR采用BW比例因子平滑法進行預測是可靠的,是六種預測中最準確的,其次是sVAR采用動態(tài)平滑法。對于sVAR和AR模型,BW平滑方案的校正效果比動態(tài)平滑方案好,但是對于傳統(tǒng)的VAR,情況恰恰相反。由AR模型生成的預測與動態(tài)平滑的校正效果特別差。
圖5 AR、VAR和sVAR模型可靠性評估
綜上,本文方法在多個評分和可靠性方面對兩個基準進行了明顯的改進,同時通過稀疏參數(shù)化提供了具有吸引力的數(shù)值特性。sVAR使得用傳統(tǒng)的VAR方法對高維度空間的數(shù)據(jù)統(tǒng)計建模成為可能。此外,數(shù)據(jù)驅(qū)動的依賴結(jié)構(gòu)檢測意味著空間處理可以在不知道精確位置的情況下實現(xiàn),或者在許多發(fā)電機位于小區(qū)域的情況下實現(xiàn)。該技術(shù)同樣適用于已使用VAR的其他預測問題。
此外,保持完全的協(xié)方差信息可能為未來的發(fā)展提供機會。本文所描述的預測方法的確定性部分利用了空間信息,而尺度參數(shù)和擴展的預測分布是獨立計算的。更一般的概率預測可以考慮觀測的完全協(xié)方差結(jié)構(gòu)的全聯(lián)合預測分布。
本文提出一種空間預測技術(shù),能夠?qū)Χ鄠€地點的風力發(fā)電進行短期概率預測。將基于logit-normal變換和分布預測參數(shù)框架與分布位置參數(shù)的時空模型相結(jié)合,提出兩種尺度參數(shù)的競爭平滑方案。將位置參數(shù)建模為VAR,并進一步改進為sVAR,大大減少了所需系數(shù)的數(shù)量,并通過擴展模型擬合的計算費用和所需的體積訓練數(shù)據(jù)算例將sVAR的性能與傳統(tǒng)的VAR和AR模型進行比較,在確定性和概率性技能得分方面以及分布預測的可靠性方面都有改進。