李嘉宇,王東風(fēng),張 妍
(華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,河北 保定 071003)
近年來(lái),風(fēng)能作為一種清潔的可再生能源,引起了全世界的廣泛關(guān)注,風(fēng)力發(fā)電已成為最具發(fā)展前景的新能源發(fā)電方式之一。隨著風(fēng)力發(fā)電技術(shù)的發(fā)展,風(fēng)速自身的隨機(jī)性和間歇性對(duì)電網(wǎng)調(diào)度的影響越來(lái)越大。準(zhǔn)確的風(fēng)速預(yù)測(cè)結(jié)果可有效降低風(fēng)電功率的不確定性,保障電網(wǎng)的經(jīng)濟(jì)、安全、穩(wěn)定運(yùn)行。
現(xiàn)有的風(fēng)速預(yù)測(cè)方法主要分為物理方法和統(tǒng)計(jì)方法。物理方法是基于天氣預(yù)報(bào)數(shù)據(jù),考慮風(fēng)場(chǎng)地形起伏程度等因素進(jìn)行預(yù)測(cè)的方法[1]。物理方法無(wú)需大量的歷史數(shù)據(jù)即可獲得較高精度的預(yù)測(cè)結(jié)果,但建模和求解的過(guò)程復(fù)雜,通常被用于新建風(fēng)電場(chǎng)的中長(zhǎng)期風(fēng)速預(yù)測(cè)。統(tǒng)計(jì)方法則利用歷史數(shù)據(jù)進(jìn)行建模,通過(guò)分析輸入和輸出的映射關(guān)系來(lái)獲取預(yù)測(cè)結(jié)果[2]。相比于物理方法,雖然統(tǒng)計(jì)方法應(yīng)用于中長(zhǎng)期風(fēng)速預(yù)測(cè)時(shí)的精度較低,但其在建立模型時(shí)無(wú)須考慮復(fù)雜的地形及氣候條件,結(jié)構(gòu)簡(jiǎn)單、容易建模。在現(xiàn)有的風(fēng)速預(yù)測(cè)方法中,大部分方法集中于統(tǒng)計(jì)方法。統(tǒng)計(jì)方法還可進(jìn)一步分為時(shí)間序列法[3]和人工智能法[4],這兩種方法在短期風(fēng)速預(yù)測(cè)中均得到了廣泛的應(yīng)用。文獻(xiàn)[5]構(gòu)建了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和雙向門(mén)控循環(huán)單元(Bidirectional Gated Recurrent Unit,BGRU)結(jié)合的預(yù)測(cè)模型,其預(yù)測(cè)精度優(yōu)于傳統(tǒng)的預(yù)測(cè)模型。文獻(xiàn)[6]提出了一種新型的混合預(yù)測(cè)模型,通過(guò)多目標(biāo)優(yōu)化算法對(duì)回聲狀態(tài)網(wǎng)絡(luò)(Echo State Network,ESN)模型進(jìn)行優(yōu)化,保證了預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確性,具有很大的應(yīng)用潛力。文獻(xiàn)[7]提出了一種基于長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)的超短期風(fēng)速預(yù)測(cè)模型,針對(duì)不同情況下的風(fēng)速具有較好的適應(yīng)性?,F(xiàn)有研究在建立風(fēng)速預(yù)測(cè)的統(tǒng)計(jì)模型時(shí)均未對(duì)所構(gòu)建模型的輸入變量進(jìn)行詳細(xì)研究。由于輸入變量在類型上的差異會(huì)影響到風(fēng)速預(yù)測(cè)的精度[8],并且針對(duì)大多數(shù)統(tǒng)計(jì)模型而言,如果將具有相似特征和變化趨勢(shì)的數(shù)據(jù)作為變量輸入,統(tǒng)計(jì)模型的訓(xùn)練難度將會(huì)明顯降低[6]。
為此,提出一種基于灰色關(guān)聯(lián)分析(Grey Relation Analysis,GRA)的短期風(fēng)速預(yù)測(cè)方法。該方法以風(fēng)速序列為基準(zhǔn),對(duì)采集到的氣象數(shù)據(jù)進(jìn)行灰色關(guān)聯(lián)分析,并根據(jù)所得到的關(guān)聯(lián)分析結(jié)果,選擇構(gòu)建LSTM 模型的輸入變量進(jìn)行訓(xùn)練,計(jì)算得出風(fēng)速的預(yù)測(cè)結(jié)果。
GRA 是一種多因素統(tǒng)計(jì)的算法,其基本思想是通過(guò)確定參考數(shù)據(jù)列和若干個(gè)比較數(shù)據(jù)列之間幾何曲線的相似程度來(lái)判斷其聯(lián)系程度是否緊密。通過(guò)GRA,可分析系統(tǒng)中各因素間的聯(lián)系,確定各因素之間相對(duì)關(guān)聯(lián)性的強(qiáng)弱,其具體計(jì)算步驟如下:
1)確定分析數(shù)列。
確定反映系統(tǒng)行為特征的參考數(shù)列Y 及對(duì)應(yīng)的比較數(shù)列矩陣X 為:
式中:Y(k)為數(shù)列Y在第k個(gè)時(shí)刻的值;n 為系統(tǒng)總采集點(diǎn)數(shù);Xik為數(shù)列矩陣X 的第i 個(gè)特征在第k 個(gè)時(shí)刻的值。
2)變量無(wú)量綱化。
由于系統(tǒng)中各特征數(shù)列中數(shù)據(jù)的量綱通常是不同的,一般在計(jì)算關(guān)聯(lián)度之前,先將步驟1)參考數(shù)列與比較數(shù)列矩陣X 中各元素進(jìn)行無(wú)量綱化處理,得到無(wú)量綱的參考數(shù)列Y′與比較數(shù)列矩陣X′。
3)計(jì)算關(guān)聯(lián)系數(shù)ξi,計(jì)算公式為:
式中:ξi(k)為對(duì)數(shù)列Y′(k)在第k 個(gè)時(shí)刻的關(guān)聯(lián)系數(shù);P 為分辨系數(shù),通常情況下取0.5。
4)計(jì)算關(guān)聯(lián)度ri。
LSTM 模型是Hochreiter 和Schmidhuber 提出的一種時(shí)間周期網(wǎng)絡(luò),已在預(yù)測(cè)領(lǐng)域得到了廣泛的應(yīng)用。LSTM 有著類似遞歸神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network,RNN)的鏈?zhǔn)浇Y(jié)構(gòu),利用給定的輸入和輸出數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,可以在有限樣本的條件下得到風(fēng)速預(yù)測(cè)的結(jié)果。LSTM 模型的結(jié)構(gòu)如圖1 所示。
圖1 LSTM 結(jié)構(gòu)
圖1 中,最左側(cè)的遺忘門(mén)用來(lái)查看模型的當(dāng)前輸入和當(dāng)前輸出,然后為單元格的每個(gè)數(shù)字輸出0~1 的數(shù)字,其中1 表示完全保留,0 表示完全刪除,具體公式為
式中:ft為t 時(shí)刻模型通過(guò)遺忘門(mén)后所得到的輸出;Wf、bf分別為遺忘門(mén)對(duì)應(yīng)的權(quán)重和偏置;ht-1為上一個(gè)細(xì)胞的輸出;xt為當(dāng)前細(xì)胞的輸入;σ 為通過(guò)將細(xì)胞的當(dāng)前輸入值xt收斂到[0,1],從而加強(qiáng)LSTM 網(wǎng)絡(luò)對(duì)xt特征識(shí)別度的Sigmoid 函數(shù),該函數(shù)的具體表達(dá)式為
隨后需要決定有多少新的信息加入細(xì)胞中,這一部分的工作由輸入門(mén)和狀態(tài)單元來(lái)完成,具體公式為:
式中:it為t 時(shí)刻模型通過(guò)輸入門(mén)后所得到的輸出;Wg、bg分別為輸入門(mén)對(duì)應(yīng)的權(quán)重和偏置;為t 時(shí)刻需要更新的備選內(nèi)容;Wc、bc分別為狀態(tài)單元對(duì)應(yīng)的權(quán)重和偏置。此時(shí)可通過(guò)式(12)來(lái)更新?tīng)顟B(tài)單元Ct的值,并通過(guò)輸出門(mén)確定模型的最終輸出ht。
式中:ot為t 時(shí)刻模型通過(guò)輸出門(mén)后所得到的輸出;Wo、bo分別為輸出門(mén)對(duì)應(yīng)的權(quán)重和偏置。
LSTM 模型具有較強(qiáng)的非線性擬合能力,但針對(duì)風(fēng)速預(yù)測(cè)而言,LSTM 模型不能完全分析出風(fēng)速與其他氣象影響因素之間的非線性和趨勢(shì)相關(guān)性。此外,在可再生能源行業(yè)長(zhǎng)期數(shù)據(jù)有限的情況下,需要合理選擇模型的輸入變量,以保證LSTM 模型的訓(xùn)練效果。
為此,構(gòu)建GRA-LSTM 模型,該模型基于風(fēng)速的歷史數(shù)據(jù)以及GRA 算法確定最優(yōu)輸入變量,模型可具體描述為
式中:W(t+1),W(t+2),…,W(t+m)分別為t+1,t+2,…,t+m 時(shí)刻的預(yù)測(cè)風(fēng)速;W(t),W(t-1),…,W(t-n)為t 時(shí)刻及其前n 個(gè)時(shí)刻的風(fēng)速序列;x(t),x(t-1),…,x(t-n)為t 時(shí)刻及其前n 個(gè)時(shí)刻通過(guò)GRA 模型確定的對(duì)風(fēng)速影響較大的其他氣象影響因素序列;F(x)為L(zhǎng)STM 模型。GRA-LSTM 詳細(xì)流程如圖2所示。
圖2 GRA-LSTM 方法流程
以美國(guó)能源部太陽(yáng)能輻射研究實(shí)驗(yàn)室Golden站點(diǎn)2019 年1—3 月的實(shí)測(cè)數(shù)據(jù)為例,對(duì)算法的有效性進(jìn)行驗(yàn)證。數(shù)據(jù)包含種風(fēng)速、溫度、壓強(qiáng)、云層厚度、相對(duì)濕度、風(fēng)向及露點(diǎn)7 種數(shù)值天氣預(yù)報(bào)的信息,數(shù)據(jù)采樣間隔為10 min。
為研究不同輸入變量對(duì)風(fēng)速預(yù)測(cè)模型預(yù)測(cè)結(jié)果的影響,選擇風(fēng)速序列作為基準(zhǔn)序列,并對(duì)其他6 項(xiàng)氣象影響因素進(jìn)行灰色關(guān)聯(lián)分析,所得到的結(jié)果如表1 所示。
表1 風(fēng)速序列影響因子關(guān)聯(lián)度
由表1 可以看出,影響因子與風(fēng)速序列的關(guān)聯(lián)程度從高到低依次為風(fēng)向、相對(duì)濕度、溫度、露點(diǎn)、壓強(qiáng)和云層厚度。其中,風(fēng)向和相對(duì)濕度的關(guān)聯(lián)度明顯高于其他氣象因子,且兩者的關(guān)聯(lián)度數(shù)值十分相近,分別為0.649 和0.648。其他氣象因子的關(guān)聯(lián)度相比于風(fēng)向和相對(duì)濕度二者有明顯降低,且除云層厚度的關(guān)聯(lián)度為0.367 外,其他氣象因子之間的關(guān)聯(lián)度相差較小。
此外,在樣本數(shù)據(jù)有限的前提條件下,輸入變量維度的增加會(huì)導(dǎo)致LSTM 模型的訓(xùn)練不夠充分,進(jìn)而降低最終的預(yù)測(cè)精度;而輸入變量的維度過(guò)低又會(huì)導(dǎo)致模型對(duì)數(shù)據(jù)特征的提取不夠充分而使預(yù)測(cè)結(jié)果出現(xiàn)欠擬合的狀態(tài)。因此,在綜合考慮上述因素和試驗(yàn)結(jié)果的條件下,選定風(fēng)速、風(fēng)向和相對(duì)濕度3 種因素為輸入變量的LSTM 模型作為本文所提出算法的對(duì)應(yīng)模型,用于驗(yàn)證其預(yù)測(cè)性能。
為了確保試驗(yàn)變量的唯一性,除所提出的算法模型之外,將氣象因素兩兩組合并加上風(fēng)速序列作為各LSTM 模型的輸入變量,以確保所有模型輸入變量的數(shù)量均為3。隨后分別訓(xùn)練LSTM 模型,并與風(fēng)速、風(fēng)向和相對(duì)濕度作為輸入變量的LSTM 模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比。選擇2019-03-31 作為預(yù)測(cè)日,通過(guò)當(dāng)日的實(shí)際風(fēng)速與不同輸入變量情況下模型的預(yù)測(cè)風(fēng)速進(jìn)行對(duì)比,以驗(yàn)證所提算法的有效性,預(yù)測(cè)的時(shí)間間隔為10 min。
在得到風(fēng)速預(yù)測(cè)的結(jié)果后,常用均方根誤差RMSE、誤差平方和SSE來(lái)估計(jì)風(fēng)速預(yù)測(cè)模型的性能,定義為:
式中:yi為i 時(shí)刻風(fēng)速實(shí)際值;為i 時(shí)刻風(fēng)速預(yù)測(cè)值;m 為系統(tǒng)總采集點(diǎn)數(shù)。
其中,RMSE對(duì)數(shù)值較大的誤差更為敏感,SSE則是不同風(fēng)速序列預(yù)測(cè)點(diǎn)的絕對(duì)誤差之和[9],通過(guò)這兩種指標(biāo)可綜合評(píng)價(jià)模型的預(yù)測(cè)性能,各模型的試驗(yàn)結(jié)果如表2 和圖3 所示。
表2 同風(fēng)速下不同其他輸入變量模型的誤差指標(biāo)值
圖3 同風(fēng)速下不同其他輸入變量模型的誤差曲線分布
由表2 和圖3 可知,所提算法確定的輸入變量所構(gòu)建的模型兩種誤差指標(biāo)RMSE和SSE均為最小值,分別為1.023 和150.698,并且在誤差曲線圖中每點(diǎn)的縱坐標(biāo)更靠近0,說(shuō)明該預(yù)測(cè)模型具有更小的誤差和更高的預(yù)測(cè)精度,證明了本文所提出算法的有效性。
在構(gòu)建LSTM 模型時(shí),輸入變量類型的差異會(huì)影響到最終的預(yù)測(cè)結(jié)果。試驗(yàn)結(jié)果表明,以風(fēng)速參考數(shù)據(jù)序列,對(duì)風(fēng)向、相對(duì)濕度等氣象因素進(jìn)行灰色關(guān)聯(lián)分析,可確定模型最優(yōu)輸入變量的類型,并有效提高模型的預(yù)測(cè)精度。
在試驗(yàn)數(shù)據(jù)充足且各氣象因素的關(guān)聯(lián)度相差不大時(shí),難以確定作為模型輸入變量的氣象因素的數(shù)量,這是本文所提出方法的不足之處。
在之后的研究中,將基于此方法進(jìn)行更加深入的研究,尋找同時(shí)確定模型最優(yōu)輸入變量的類型和數(shù)量的方法,以最大限度地提高風(fēng)速預(yù)測(cè)的精度。