杜寶祥,李永利,馬志強(qiáng),3,王洪彬,張 立
(1.內(nèi)蒙古工業(yè)大學(xué) 數(shù)據(jù)科學(xué)與應(yīng)用學(xué)院,內(nèi)蒙古 呼和浩特 010080;2.內(nèi)蒙古自治區(qū)氣象局 內(nèi)蒙古自治區(qū)氣象信息中心,內(nèi)蒙古 呼和浩特 010051;3.內(nèi)蒙古工業(yè)大學(xué) 內(nèi)蒙古自治區(qū) 基于大數(shù)據(jù)的軟件服務(wù)工程技術(shù)研究中心,內(nèi)蒙古 呼和浩特 010080)
風(fēng)速是氣象預(yù)報(bào)的一項(xiàng)重要屬性,在氣象預(yù)報(bào)中通常以風(fēng)力等級(jí)的形式表示。風(fēng)速預(yù)測是風(fēng)速預(yù)報(bào)的一種重要補(bǔ)充手段,指對(duì)未來一段時(shí)間內(nèi)風(fēng)速值的預(yù)測,根據(jù)時(shí)間間隔的長短可劃分為短期預(yù)測(未來數(shù)分鐘)、中期預(yù)測(未來數(shù)小時(shí))和長期預(yù)測(未來數(shù)天以上)。由于風(fēng)速的不可調(diào)節(jié)和控制,容易對(duì)人類的生活和生產(chǎn)造成不利影響,甚至產(chǎn)生災(zāi)難性后果,若能夠較為準(zhǔn)確地預(yù)測未來一段時(shí)間的風(fēng)速變化情況,將為人類社會(huì)贏得寶貴的時(shí)間,使得人們能夠提前做好防范措施,降低風(fēng)速變化帶來的負(fù)面影響。然而風(fēng)速的變化會(huì)受到氣壓、溫度、濕度、緯度、海拔和地形等諸多因素的影響[1],導(dǎo)致風(fēng)速很不穩(wěn)定,且會(huì)不間斷地、隨機(jī)性地發(fā)生變化,給風(fēng)速預(yù)測帶來很大困難,且現(xiàn)有的基于機(jī)器學(xué)習(xí)的方法很少將除風(fēng)速以外的因素結(jié)合進(jìn)來,缺乏對(duì)更多特征變化規(guī)律的分析建模研究。本文以內(nèi)蒙古地區(qū)某站點(diǎn)的氣象觀測數(shù)據(jù)為基礎(chǔ),對(duì)未來數(shù)小時(shí)內(nèi)不同時(shí)刻的風(fēng)速進(jìn)行預(yù)測,屬于中期預(yù)測。針對(duì)風(fēng)速形成因素復(fù)雜的特點(diǎn),本文提出了風(fēng)速多特征嵌入編碼方法及基于序列到序列(sequence to sequence,Seq2Seq)的風(fēng)速預(yù)測模型,不僅對(duì)風(fēng)速的時(shí)間序列進(jìn)行分析建模,還結(jié)合大量風(fēng)速影響因素的多特征數(shù)據(jù)進(jìn)行風(fēng)速多特征嵌入編碼,進(jìn)而學(xué)習(xí)風(fēng)速的多特征與變化規(guī)律,提高風(fēng)速預(yù)測模型的預(yù)測效果。
目前,風(fēng)速預(yù)測研究主要以風(fēng)電場的短期風(fēng)速預(yù)測為主,對(duì)于氣象領(lǐng)域的中長期風(fēng)速預(yù)測研究較少。文獻(xiàn)[1-3]基于長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)分別開展了風(fēng)電場短期和鐵路附近超短期風(fēng)速預(yù)測研究,取得了良好的預(yù)測精度。文獻(xiàn)[4,5]基于時(shí)間序列分析對(duì)風(fēng)能研究中心進(jìn)行了非線性短期風(fēng)速預(yù)測研究,驗(yàn)證了時(shí)間序列分析方法的有效性。文獻(xiàn)[6]基于季節(jié)調(diào)整和時(shí)間序列相混合方法進(jìn)行了長期風(fēng)速預(yù)測研究,準(zhǔn)確有效地實(shí)現(xiàn)了月平均風(fēng)速的預(yù)測。在以上研究中,時(shí)間序列是風(fēng)速預(yù)測分析建模的一種常用方法。時(shí)間序列分析建模只需有限的樣本序列,依據(jù)序列本身的時(shí)序性和自相關(guān)性的信息,即可建立起相當(dāng)高精度的預(yù)測模型,但存在著低階模型預(yù)測精度低和高階模型參數(shù)估計(jì)難度大的不足,而使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行時(shí)間序列分析建模是比較理想的方法。
LSTM是一種典型的時(shí)間序列建模方法,已經(jīng)被應(yīng)用到短期風(fēng)速預(yù)測中[1],實(shí)驗(yàn)結(jié)果表明其效果優(yōu)于BPNN(BP神經(jīng)網(wǎng)絡(luò))、SVM(支持向量機(jī))、LSSVM(最小二乘支持向量機(jī))和ARIMA(自回歸滑動(dòng)平均模型),但并未結(jié)合其它影響風(fēng)速的多因素特征數(shù)據(jù),效果仍有待提升。
Seq2Seq模型分別由Google Brain和Yoshua Bengio兩個(gè)團(tuán)隊(duì)獨(dú)立提出,在自然語言處理領(lǐng)域得到廣泛應(yīng)用,尤其在機(jī)器翻譯中取得顯著的效果。此外,Seq2Seq模型在電力負(fù)荷預(yù)測[7]、加油站時(shí)序數(shù)據(jù)異常檢測[8]及云資源負(fù)載預(yù)測[9]等時(shí)間序列任務(wù)中也取得了良好的效果。
Seq2Seq模型由編碼器和解碼器構(gòu)成,模型結(jié)構(gòu)如圖1所示。編碼器將輸入序列 [A,B,C,
圖1 Seq2Seq模型結(jié)構(gòu)
編碼器和解碼器通常使用循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)或LSTM。LSTM是RNN的一種優(yōu)秀變體,包含輸入門、輸出門和遺忘門3個(gè)門控單元和記憶細(xì)胞。LSTM解決了RNN的梯度消失和梯度爆炸的問題,并且適合處理長距離依賴的問題,能夠進(jìn)一步提升Seq2Seq模型性能。另外,LSTM對(duì)氣溫預(yù)測的良好性能表現(xiàn)[10]也為其它氣象預(yù)測研究提供了很好的借鑒。
注意力機(jī)制由Yoshua Bengio團(tuán)隊(duì)提出,用于對(duì)Seq2Seq模型進(jìn)行改進(jìn),大大提高了基于Seq2Seq模型的機(jī)器翻譯的效果,使機(jī)器翻譯全面進(jìn)入了神經(jīng)機(jī)器翻譯的時(shí)代,此外,基于注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)還被廣泛應(yīng)用到圖像識(shí)別、語音識(shí)別及自然語言處理等各種任務(wù)中[11]。注意力機(jī)制本質(zhì)是在解碼階段通過對(duì)源序列中的每個(gè)元素分配不同的權(quán)重(注意力),使得解碼器能夠更有效地利用源序列的重要信息,以獲得更好的解碼效果。
注意力機(jī)制如圖2所示,在解碼生成第t個(gè)元素yt時(shí),模型會(huì)根據(jù)不同的權(quán)重at,i, 對(duì)源序列的元素Xi對(duì)應(yīng)的隱藏狀態(tài)向量hi進(jìn)行加權(quán)求和,作為此時(shí)的上下文向量。注意力機(jī)制能夠避免Seq2Seq模型對(duì)源序列編碼所造成的信息壓縮問題,使得解碼器在解碼的每一步都能夠回顧整個(gè)源序列,進(jìn)而提升Seq2Seq模型的預(yù)測效果。
圖2 注意力機(jī)制結(jié)構(gòu)
2.1.1 嵌入單元結(jié)構(gòu)
由于風(fēng)速的變化會(huì)受到多個(gè)因素的影響,因此進(jìn)行風(fēng)速預(yù)測時(shí)結(jié)合影響風(fēng)速的其它多個(gè)因素的特征(本文中簡稱為:風(fēng)速多特征)會(huì)提高預(yù)測效果,且文獻(xiàn)[12]也驗(yàn)證了多特征結(jié)合分析方法的有效性。因此,本文提出風(fēng)速多特征嵌入編碼方法,利用多層深度神經(jīng)網(wǎng)絡(luò)對(duì)風(fēng)速多特征進(jìn)行嵌入編碼,使風(fēng)速在模型中能夠得到更加合理的特征向量表示,進(jìn)而提升預(yù)測效果。風(fēng)速多特征嵌入編碼方法通過基于深度神經(jīng)網(wǎng)絡(luò)的嵌入單元實(shí)現(xiàn),結(jié)構(gòu)如圖3所示,其中嵌入層由多層非線性神經(jīng)網(wǎng)絡(luò)進(jìn)行全連接得到。
圖3 風(fēng)速多特征嵌入單元結(jié)構(gòu)
風(fēng)速多特征嵌入編碼方法是一種可擴(kuò)展的方法,允許研究者根據(jù)支撐數(shù)據(jù)的豐富程度和重要程度增加或調(diào)整多特征的數(shù)量以及不同特征的權(quán)重,使得模型有更好的預(yù)測效果。該模型也是一種可移植的方法,允許其作為單獨(dú)模塊加入到各種風(fēng)速序列預(yù)測的神經(jīng)網(wǎng)絡(luò)模型中,以增強(qiáng)模型的整體性能。該方法將影響風(fēng)速的其它因素結(jié)合到時(shí)間序列建模中,使得模型不僅依賴于單一的風(fēng)速時(shí)間序列,還能根據(jù)其它的氣象信息,對(duì)未來的風(fēng)速進(jìn)行更加準(zhǔn)確合理的預(yù)測。
2.1.2 嵌入編碼原理
風(fēng)速多特征嵌入編碼方法使用深度神經(jīng)網(wǎng)絡(luò)對(duì)風(fēng)速多特征進(jìn)行嵌入及維度轉(zhuǎn)換。由于不同特征數(shù)據(jù)有不同的單位和量級(jí),所以,為了平衡不同因素特征的作用以及減小誤差,編碼過程中增加了特征數(shù)據(jù)歸一化和標(biāo)準(zhǔn)化操作。
其工作原理是首先將某一時(shí)刻的風(fēng)速值作為一個(gè)風(fēng)速(wind speed,WS)標(biāo)簽,然后將該時(shí)刻的多個(gè)特征值 [ft,1,ft,2,…,ft,N] 進(jìn)行線性函數(shù)歸一化(min-max norma-lization),并按不同權(quán)重進(jìn)行加權(quán)標(biāo)準(zhǔn)化(如式(1)所示),再將處理后的特征值fst進(jìn)行神經(jīng)網(wǎng)絡(luò)嵌入編碼(如式(2)所示),最終得到該時(shí)刻WS Embedding中M個(gè)維度的值 [et,1,et,2,…,et,M]
fst=Fnorm([ft,1,ft,2,…,ft,N])·[a1,a2,…,aN]
(1)
et=[et,1,et,2,…,et,M]=FCno_linear(fst)
(2)
以上各式中各個(gè)參數(shù)含義如下:fst:t時(shí)刻標(biāo)準(zhǔn)化后的多特征數(shù)據(jù);Fnorm:歸一化函數(shù);N:特征個(gè)數(shù);ft,N:t時(shí)刻多特征數(shù)據(jù)第N個(gè)特征的值;aN:第N個(gè)特征所占權(quán)重;et:t時(shí)刻的風(fēng)速嵌入向量;M:嵌入維度;et,M:t時(shí)刻風(fēng)速嵌入向量第M維的值;FCno_linear:神經(jīng)網(wǎng)絡(luò)非線性全連接層。其中FCno_linear的網(wǎng)絡(luò)深度可在訓(xùn)練過程中進(jìn)行調(diào)整優(yōu)化。
2.1.3 嵌入單元學(xué)習(xí)算法
風(fēng)速多特征嵌入編碼方法不需要復(fù)雜的人工干預(yù),僅需要對(duì)各項(xiàng)特征進(jìn)行簡單的權(quán)重分配,模型將在訓(xùn)練時(shí)自動(dòng)優(yōu)化嵌入層參數(shù)。其中,各項(xiàng)特征根據(jù)重要程度分配不同的權(quán)值,以提高重要特征的數(shù)值波動(dòng)對(duì)預(yù)測結(jié)果的影響,降低非重要特征對(duì)模型的過度影響。同深度神經(jīng)網(wǎng)絡(luò)的其它超參數(shù)類似,多特征權(quán)重在模型訓(xùn)練前進(jìn)行配置,無需后續(xù)的調(diào)整。各項(xiàng)特征的權(quán)值默認(rèn)是相等的,可根據(jù)實(shí)驗(yàn)數(shù)據(jù)的豐富程度對(duì)不同特征的權(quán)值進(jìn)行個(gè)性化的配置。風(fēng)速多特征嵌入單元學(xué)習(xí)算法見表1。
表1 風(fēng)速多特征嵌入編碼單元學(xué)習(xí)算法
2.2.1 模型架構(gòu)
根據(jù)內(nèi)蒙古氣象信息中心的研究需要,本文的中期風(fēng)速預(yù)測任務(wù)為:當(dāng)給定當(dāng)前時(shí)刻之前24個(gè)小時(shí)的真實(shí)風(fēng)速數(shù)據(jù)時(shí),通過風(fēng)速預(yù)測模型,生成未來9個(gè)小時(shí)的預(yù)測風(fēng)速值。本文以帶有注意力機(jī)制的Seq2Seq模型為基礎(chǔ),結(jié)合風(fēng)速多特征嵌入編碼方法,設(shè)計(jì)了包括風(fēng)速多特征嵌入單元、編碼器、注意力機(jī)制以及解碼器的風(fēng)速預(yù)測模型,架構(gòu)如圖4所示。
圖4 多特征嵌入的Seq2Seq風(fēng)速預(yù)測模型架構(gòu)
多特征嵌入的Seq2Seq風(fēng)速預(yù)測模型在Seq2Seq的基礎(chǔ)上,結(jié)合多個(gè)影響風(fēng)速的特征因素,對(duì)風(fēng)速的時(shí)間序列進(jìn)行建模,并進(jìn)行多特征嵌入編碼,最終逐步進(jìn)行未來風(fēng)速值的解碼預(yù)測,生成未來若干小時(shí)的預(yù)測風(fēng)速值序列。本文的方法不僅從技術(shù)方面采用更適合處理時(shí)間序列問題的Seq2Seq作為建模主體,還從理論角度嵌入影響風(fēng)速的多特征氣象數(shù)據(jù)作為信息補(bǔ)充,從而得到更準(zhǔn)確合理的風(fēng)速預(yù)測模型。
2.2.2 模型原理
多特征嵌入的Seq2Seq風(fēng)速預(yù)測模型將風(fēng)速的多特征數(shù)據(jù)作為輸入,通過風(fēng)速多特征嵌入單元得到相應(yīng)的風(fēng)速多特征向量序列E={e1,e2,…,em}。 風(fēng)速多特征向量依次通過編碼器單元的編碼得到對(duì)應(yīng)的隱藏向量hj(如式(3)所示),經(jīng)過注意力機(jī)制的計(jì)算(如式(4)~式(6)所示)和解碼器單元的逐步解碼(如式(7)所示),輸出最終的預(yù)測風(fēng)速值序列W={w1,…,wn} (如式(8),式(9)所示)
hj=LSTM(ej,hj-1)
(3)
rtj=fno_linear(wt-1,hj)
(4)
(5)
(6)
st=LSTM(wt-1,st-1,ct)
(7)
p(wt|{w1,…,wt-1},E)=Fout(wt-1,ct-1,st)
(8)
(9)
以上各式中各個(gè)參數(shù)含義如下:hj:源序列第j個(gè)元素對(duì)應(yīng)的隱藏向量;LSTM:編碼器和解碼器的基本單元;ej:源序列第j個(gè)元素對(duì)應(yīng)的WS Embedding;rtj:t時(shí)刻輸出與源序列第j個(gè)元素的匹配得分;fno_linear:神經(jīng)網(wǎng)絡(luò)非線性層;αtj:t時(shí)刻對(duì)應(yīng)源序列第j個(gè)元素的權(quán)重;ct:t時(shí)刻的上文信息向量;wt:t時(shí)刻風(fēng)速的預(yù)測值;st:t時(shí)刻解碼器隱藏向量;Fout:神經(jīng)網(wǎng)絡(luò)輸出層。
2.2.3 風(fēng)速預(yù)測算法
多特征嵌入的Seq2Seq風(fēng)速預(yù)測模型需要經(jīng)過大量風(fēng)速多特征數(shù)據(jù)訓(xùn)練后,才能對(duì)未來的風(fēng)速進(jìn)行預(yù)測。在每一次模型迭代訓(xùn)練時(shí),將給定的一段連續(xù)風(fēng)速多特征數(shù)據(jù),根據(jù)需要的序列長度分成前后兩段:前段風(fēng)速值以WS Embedding的形式作為輸入序列,后段的風(fēng)速值作為目標(biāo)序列。通過大量數(shù)據(jù)的不斷迭代訓(xùn)練,深度神經(jīng)網(wǎng)絡(luò)模型將逐漸擬合真實(shí)的風(fēng)速分布,最終得到最優(yōu)的風(fēng)速預(yù)測模型。通過當(dāng)前時(shí)刻之前的風(fēng)速多特征數(shù)據(jù)和訓(xùn)練好的模型即可預(yù)測未來的風(fēng)速。
多特征嵌入的Seq2Seq風(fēng)速預(yù)測模型的詳細(xì)預(yù)測算法過程見表2。
表2 多特征嵌入的Seq2Seq風(fēng)速預(yù)測模型預(yù)測算法
表2(續(xù))
本文實(shí)驗(yàn)數(shù)據(jù)由內(nèi)蒙古氣象信息中心提供。研究抽取了內(nèi)蒙古某氣象觀測站點(diǎn)2018年1月1日0時(shí)到2019年1月1日0時(shí)的實(shí)時(shí)風(fēng)速數(shù)據(jù)作為原始數(shù)據(jù)集。表3展示了原始?xì)庀笥^測數(shù)據(jù)情況。
表3 原始?xì)庀笥^測數(shù)據(jù)示例
由表3可知,原始數(shù)據(jù)采樣間隔為1小時(shí),數(shù)據(jù)內(nèi)容包括影響風(fēng)速的多項(xiàng)數(shù)據(jù)(氣壓、變壓、溫度、濕度)和風(fēng)速。全年的風(fēng)速情況如圖5所示,其中,橫坐標(biāo)為時(shí)刻(單位:h),縱坐標(biāo)為風(fēng)速值(單位:m/s)。本文將原始數(shù)據(jù)處理為包含源序列和目標(biāo)序列的樣本集,并按照8∶2劃分訓(xùn)練集和測試集。
圖5 原始數(shù)據(jù)的全年風(fēng)速序列
根據(jù)內(nèi)蒙古氣象信息中心的研究需要,各模型數(shù)據(jù)的源序列長度設(shè)置為24,目標(biāo)序列長度設(shè)置為9,以實(shí)現(xiàn)通過過去24小時(shí)的數(shù)據(jù)對(duì)未來9小時(shí)的風(fēng)速進(jìn)行預(yù)測。實(shí)驗(yàn)中的Seq2Seq模型采用2層雙向LSTM作為編碼器,2層單向LSTM作為解碼器,均包含32個(gè)隱藏單元。Embedding維度為5,表示影響風(fēng)速的5個(gè)特征。模型訓(xùn)練的batch size=8,使用Adam優(yōu)化算法,學(xué)習(xí)率為0.01,模型最終經(jīng)過65輪訓(xùn)練后收斂。
本文使用Seq2Seq模型和多特征嵌入編碼方法,分別與基于LSTM、GRU和BP神經(jīng)網(wǎng)絡(luò)的風(fēng)速預(yù)測模型進(jìn)行對(duì)比,并使用風(fēng)速多特征數(shù)據(jù),通過準(zhǔn)確性和穩(wěn)定性兩個(gè)方面的實(shí)驗(yàn),驗(yàn)證Seq2Seq模型和風(fēng)速多特征嵌入方法對(duì)中期風(fēng)速預(yù)測的有效性。
本文使用準(zhǔn)確率和預(yù)測評(píng)分來評(píng)價(jià)模型預(yù)測的準(zhǔn)確性,并使用平均絕對(duì)誤差評(píng)價(jià)模型預(yù)測的穩(wěn)定性。
準(zhǔn)確率(acc):計(jì)算各個(gè)序列中預(yù)測準(zhǔn)確的次數(shù)占預(yù)測總次數(shù)的比例(比較各個(gè)風(fēng)速值對(duì)應(yīng)的風(fēng)力等級(jí),風(fēng)力等級(jí)相同即認(rèn)為預(yù)測準(zhǔn)確),準(zhǔn)確率的計(jì)算如式(10)所示
(10)
上式中各個(gè)參數(shù)含義如下:acc:準(zhǔn)確率;total_count:預(yù)測總次數(shù);ac_count:預(yù)測準(zhǔn)確次數(shù)。
預(yù)測評(píng)分(score):對(duì)每次預(yù)測結(jié)果進(jìn)行評(píng)分,將風(fēng)速值轉(zhuǎn)換為相應(yīng)的風(fēng)力等級(jí),風(fēng)力等級(jí)預(yù)測正確得1分,相差1級(jí)得0.6分,相差2級(jí)得0.4分,其它情況不得分。預(yù)測評(píng)分的計(jì)算如式(11)~式(13)所示
(11)
(12)
(13)
以上各式中各個(gè)參數(shù)含義如下:t_scorei:第j個(gè)序列中第i個(gè)時(shí)刻的得分;predict_leveli:第j個(gè)序列中第i個(gè)時(shí)刻的預(yù)測等級(jí);real_leveli:第j個(gè)序列中i第個(gè)時(shí)刻的真實(shí)等級(jí);seq_scorej:第j個(gè)序列的得分;L:第j個(gè)序列的長度;score:得分;N:序列個(gè)數(shù)。
平均絕對(duì)誤差(mean absolute error,MAE):計(jì)算預(yù)測值與真實(shí)值的絕對(duì)誤差,進(jìn)而評(píng)價(jià)預(yù)測值與真實(shí)值的波動(dòng)程度,值越小表示模型預(yù)測越穩(wěn)定。平均絕對(duì)誤差的計(jì)算如式(14)、式(15)所示
(14)
(15)
以上各式中各個(gè)參數(shù)含義如下:seq_MAEj:第j個(gè)序列的平均絕對(duì)誤差;L:第j個(gè)序列的長度;predict_va-luei:第j個(gè)序列中第i個(gè)時(shí)刻的預(yù)測值;real_valuei:第j個(gè)序列中第i個(gè)時(shí)刻的真實(shí)值;MAE:平均絕對(duì)誤差;N:序列個(gè)數(shù)。
本文分別對(duì)未來3小時(shí)、6小時(shí)、9個(gè)小時(shí)的風(fēng)速進(jìn)行了預(yù)測實(shí)驗(yàn),平均絕對(duì)誤差分別表示為MAE-3、MAE-6和MAE-9。各模型最終的風(fēng)速預(yù)測準(zhǔn)確性實(shí)驗(yàn)結(jié)果見表4,穩(wěn)定性實(shí)驗(yàn)結(jié)果見表5。
表4 風(fēng)速預(yù)測準(zhǔn)確性實(shí)驗(yàn)結(jié)果對(duì)比
表5 風(fēng)速預(yù)測穩(wěn)定性實(shí)驗(yàn)結(jié)果對(duì)比
表4從風(fēng)速預(yù)測的準(zhǔn)確性方面,分別對(duì)比了Seq2Seq模型和其它幾種常見的神經(jīng)網(wǎng)絡(luò)模型在準(zhǔn)確率及預(yù)測評(píng)分指標(biāo)下的效果,并進(jìn)行了是否使用風(fēng)速多特征嵌入編碼方法的對(duì)比實(shí)驗(yàn)。分析表4的實(shí)驗(yàn)結(jié)果可知:①在不使用風(fēng)速多特征嵌入編碼方法時(shí),Seq2Seq模型已經(jīng)取得了高于其它模型的準(zhǔn)確率和預(yù)測評(píng)分,序列的整體準(zhǔn)確率達(dá)到0.5以上,表明了Seq2Seq模型對(duì)于風(fēng)速預(yù)測任務(wù)的優(yōu)越性;②使用風(fēng)速多特征嵌入編碼方法后,準(zhǔn)確率提升了8.1%,預(yù)測評(píng)分突破0.8,顯著提升了預(yù)測效果,表明了風(fēng)速多特征嵌入編碼方法對(duì)于預(yù)測準(zhǔn)確性方面的有效性。
表5從風(fēng)速預(yù)測的穩(wěn)定性方面,使用MAE評(píng)價(jià)指標(biāo)分別對(duì)比了不同模型和使用風(fēng)速多特征嵌入編碼方法的效果。表5的實(shí)驗(yàn)結(jié)果表明:①Seq2Seq模型在未來3小時(shí)、6小時(shí)、9小時(shí)均取得了最優(yōu)的MAE結(jié)果,驗(yàn)證了Seq2Seq模型在風(fēng)速預(yù)測的穩(wěn)定性方面也具有相當(dāng)?shù)膬?yōu)勢(shì);②使用風(fēng)速多特征嵌入編碼方法后,雖導(dǎo)致未來3小時(shí)、6小時(shí)的MAE值上升,但顯著降低了未來9小時(shí)的MAE值,且表現(xiàn)出預(yù)測時(shí)間越長MAE值越低的趨勢(shì),表明風(fēng)速多特征嵌入編碼方法雖然對(duì)較短期風(fēng)速預(yù)測的穩(wěn)定性沒有明顯幫助,但可顯著提升較長期風(fēng)速預(yù)測的穩(wěn)定性。
為評(píng)估多特征嵌入的Seq2Seq風(fēng)速預(yù)測模型的實(shí)際應(yīng)用效果,除表4和表5的實(shí)驗(yàn)結(jié)果外,本文還從測試集中隨機(jī)抽取了4組該模型的預(yù)測樣例,從而直觀地展示一段時(shí)間內(nèi)各個(gè)時(shí)刻風(fēng)速的真實(shí)值與預(yù)測值情況。
圖6描繪了4組根據(jù)過去24小時(shí)的真實(shí)風(fēng)速數(shù)據(jù)預(yù)測未來9小時(shí)風(fēng)速值的結(jié)果。其中,橫坐標(biāo)為時(shí)刻(單位:h),縱坐標(biāo)為風(fēng)速值(單位:m/s),菱形實(shí)線為過去風(fēng)速的真實(shí)值,三角形實(shí)線為未來風(fēng)速的真實(shí)值,圓形虛線為模型對(duì)未來風(fēng)速的預(yù)測值。每幅圖上方分別標(biāo)注了預(yù)測評(píng)分、準(zhǔn)確率和平均絕對(duì)誤差的值,并按照預(yù)測評(píng)分值的降序進(jìn)行了展示。
圖6(a)和圖6(b)為預(yù)測效果相對(duì)較好的樣例,預(yù)測評(píng)分達(dá)到0.8以上,準(zhǔn)確率達(dá)到0.6以上,平均絕對(duì)誤差低于0.6,預(yù)測曲線的擬合程度也比較高,可見模型能夠較為準(zhǔn)確地預(yù)測未來的風(fēng)速情況。圖6(c)和圖6(d)則為效果相對(duì)較差的樣例,預(yù)測評(píng)分不足0.6,準(zhǔn)確率不足0.4,平均絕對(duì)誤差,高于2.0,預(yù)測曲線也幾乎完全不擬合真實(shí)曲線,表明模型對(duì)于某些情況的預(yù)測還存在著一些不足。
圖6 多特征嵌入的Seq2Seq風(fēng)速預(yù)測模型預(yù)測樣例
綜合分析不同模型的風(fēng)速預(yù)測實(shí)驗(yàn)對(duì)比結(jié)果和預(yù)測樣例,多特征嵌入的Seq2Seq風(fēng)速預(yù)測模型能夠取得比其它模型更優(yōu)秀的預(yù)測效果,但還存在一些不足。由于風(fēng)速序列的較大波動(dòng)以及預(yù)測時(shí)間的較大跨度等潛在因素的影響,不同序列的預(yù)測效果差別很大,同時(shí)存在較好和較差的兩極化預(yù)測結(jié)果,模型預(yù)測的穩(wěn)定性還需進(jìn)一步提高。
為了提高風(fēng)速預(yù)測的準(zhǔn)確性,本文提出了一種風(fēng)速多特征嵌入編碼方法及基于Seq2Seq的風(fēng)速預(yù)測模型,結(jié)合風(fēng)速影響因素的多特征數(shù)據(jù),對(duì)未來若干個(gè)小時(shí)的風(fēng)速進(jìn)行預(yù)測。
實(shí)驗(yàn)結(jié)果表明,①在預(yù)測的準(zhǔn)確性和穩(wěn)定性方面,Seq2Seq模型均比LSTM模型取得了更好的預(yù)測效果,驗(yàn)證了Seq2Seq模型對(duì)于風(fēng)速預(yù)測任務(wù)的優(yōu)越性;②使用風(fēng)速多特征嵌入編碼方法后,顯著提高了Seq2Seq模型的預(yù)測準(zhǔn)確性,驗(yàn)證了風(fēng)速多特征嵌入編碼方法的有效性。
然而,目前對(duì)于風(fēng)速預(yù)測模型的研究仍然存在很多不足。模型對(duì)不同序列的預(yù)測效果差別很大,同時(shí)存在較好和較差的兩極化的預(yù)測結(jié)果,如何避免較差預(yù)測結(jié)果的出現(xiàn)仍是目前研究的難點(diǎn)。未來將使用更大規(guī)模和更多特征的數(shù)據(jù),對(duì)風(fēng)速預(yù)測的穩(wěn)定性進(jìn)行進(jìn)一步的研究,使得風(fēng)速預(yù)測模型能夠在生活和生產(chǎn)中得到真正應(yīng)用。