李亞蒙, 孫寶楠, 丁軍航, 官 晟
基于LSTM的海洋表面短期風(fēng)速預(yù)測研究
李亞蒙1, 2, 孫寶楠2, 3, 4, 5, 丁軍航1, 6, 7, 官 晟2, 3, 4, 5
(1. 青島大學(xué)自動(dòng)化學(xué)院, 山東 青島 266071; 2. 自然資源部第一海洋研究所, 山東 青島 266061; 3. 自然資源部海洋環(huán)境科學(xué)與數(shù)值模擬重點(diǎn)實(shí)驗(yàn)室, 山東 青島 266061; 4. 山東省海洋環(huán)境科學(xué)與數(shù)值模擬重點(diǎn)實(shí)驗(yàn)室, 山東 青島 266061; 5. 青島海洋科學(xué)與技術(shù)試點(diǎn)國家實(shí)驗(yàn)室區(qū)域海洋動(dòng)力學(xué)與數(shù)值模擬功能實(shí)驗(yàn)室, 山東 青島 266237; 6. 山東省工業(yè)控制技術(shù)重點(diǎn)實(shí)驗(yàn)室, 山東 青島 266071; 7. 青島大學(xué)山東省生態(tài)紡織協(xié)同創(chuàng)新中心, 山東 青島 266071)
為實(shí)現(xiàn)對(duì)海面風(fēng)速精確的短期預(yù)測, 提出了一種基于長短期記憶(LSTM, long short-term memory)神經(jīng)網(wǎng)絡(luò)的短期風(fēng)速預(yù)測模型, 選取OceanSITES數(shù)據(jù)庫中單個(gè)浮標(biāo)站點(diǎn)采集的風(fēng)速歷史數(shù)據(jù)作為模型輸入, 經(jīng)過訓(xùn)練設(shè)置最佳參數(shù)等步驟, 實(shí)現(xiàn)了以LSTM方法, 對(duì)該站點(diǎn)所在海區(qū)海面風(fēng)速在各季節(jié)性代表月份海面風(fēng)速的24 h短期預(yù)測。同時(shí)通過不同預(yù)測時(shí)長的實(shí)驗(yàn)以及與BP(back propagation)神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(radial basis function neural network, RBF)的預(yù)測效果對(duì)比實(shí)驗(yàn), 證明了LSTM預(yù)測方法相比上述兩種神經(jīng)網(wǎng)絡(luò)預(yù)測方法, 在海表面風(fēng)速預(yù)測應(yīng)用中的優(yōu)越性。最后通過多個(gè)海域?qū)?yīng)的站點(diǎn)風(fēng)速數(shù)據(jù)預(yù)測實(shí)驗(yàn), 證明了LSTM神經(jīng)網(wǎng)絡(luò)模型的普遍適用性, 由相關(guān)系數(shù)和預(yù)測誤差的分析可知該方法具備應(yīng)對(duì)急劇變化數(shù)據(jù)的預(yù)測穩(wěn)定性, 可以作為海洋表面風(fēng)速短期預(yù)測的一種可靠方法。
神經(jīng)網(wǎng)絡(luò); 長短期記憶網(wǎng)絡(luò)模型; 海面風(fēng)速; 短期預(yù)測
20世紀(jì)以來, 全球氣候變暖加劇, 世界各地的自然災(zāi)害事件頻繁發(fā)生, 其中海洋災(zāi)害造成的損失迅速增長[1]。20世紀(jì)90年代末, 中國海洋災(zāi)害年經(jīng)濟(jì)損失高達(dá)100億元, 其中由于風(fēng)暴潮災(zāi)害造成的損失占80%以上, 并且在2017年中, 風(fēng)暴潮災(zāi)害造成的直接經(jīng)濟(jì)損失在全部海洋災(zāi)害直接經(jīng)濟(jì)損失中占比突破90%[2]。此外, 隨著人類海上活動(dòng)增多, 對(duì)海洋環(huán)境及相互作用的觀測需求更為迫切。例如, 近年發(fā)展的海上航天發(fā)射活動(dòng), 對(duì)包括風(fēng)速等要素的觀測提出更高需求; 風(fēng)力發(fā)電要實(shí)現(xiàn)并網(wǎng)調(diào)配, 保障安全運(yùn)行, 也需要具備對(duì)風(fēng)速的預(yù)報(bào)、預(yù)警能力。因此針對(duì)海面10 m高度風(fēng)速(以下統(tǒng)稱海面風(fēng)速)的預(yù)測研究, 對(duì)于海上作業(yè)、海洋環(huán)境安全預(yù)警、海洋觀測環(huán)境預(yù)報(bào)等應(yīng)用領(lǐng)域有重要的意義。
目前常用的風(fēng)速預(yù)報(bào)研究方法包括: 經(jīng)驗(yàn)預(yù)報(bào)、數(shù)值預(yù)報(bào)、統(tǒng)計(jì)預(yù)報(bào)和神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)[3]等。其中, 神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)在風(fēng)速預(yù)報(bào)中的應(yīng)用成為近年研究熱點(diǎn)。包括誤差法反向傳播(back propagation, BP)神經(jīng)網(wǎng)絡(luò)、多層感知機(jī)器(multilayer perceptron, MLP)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)、自適應(yīng)神經(jīng)模糊推斷系統(tǒng)(adaptive network-based fuzzy inference system, ANFIS)、支持向量機(jī)(support vector machine, SVM)、卡爾曼濾波器等。
長短期記憶(long short-term memory, LSTM)神經(jīng)網(wǎng)絡(luò)是一種基于RNN的改進(jìn)算法, 作為非線性模型, LSTM可以用于構(gòu)造更大型的深度神經(jīng)網(wǎng)絡(luò)[4]。熊一橙等[5]基于LSTM構(gòu)建多輸入-多輸出智能網(wǎng)絡(luò), 利用SWAT(soil and water assessment tool)模型對(duì)4個(gè)水文站點(diǎn)的徑流過程進(jìn)行了模擬研究。針對(duì)河流水質(zhì)的變化趨勢[6-7]和海洋水質(zhì)預(yù)測[8]問題, 建立LSTM預(yù)測模型或基于LSTM的組合預(yù)測模型均具有良好的預(yù)測效果。武雙新[9]利用LSTM氣溫預(yù)測模型對(duì)每日最高氣溫進(jìn)行預(yù)測并與其他模型對(duì)比, 實(shí)驗(yàn)證明了該模型預(yù)測效果的優(yōu)越性。在河流水溫預(yù)測[10]以及沿海異常高水溫預(yù)測[11]方面, LSTM預(yù)測模型均體現(xiàn)出了優(yōu)質(zhì)的潛力。Liu等[12]提出了一種基于LSTM的城市內(nèi)、外河短期水位實(shí)時(shí)滾動(dòng)預(yù)測方法, 并以福州市為研究區(qū)域, 證實(shí)了LSTM在水位實(shí)時(shí)滾動(dòng)預(yù)報(bào)中的可行性。Yan等[13]設(shè)計(jì)了一種基于深度學(xué)習(xí)的海雜波信號(hào)檢測方法, 利用LSTM的優(yōu)點(diǎn)對(duì)預(yù)測誤差進(jìn)行頻域轉(zhuǎn)換, 提高了檢測性能。Jrges等[14]開發(fā)了一種基于LSTM神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)模型, 用于預(yù)測近岸海水的有效波高, 實(shí)驗(yàn)證明LSTM的性能優(yōu)于深度前饋神經(jīng)網(wǎng)絡(luò)和其他先進(jìn)的機(jī)器學(xué)習(xí)算法。
在風(fēng)速預(yù)測領(lǐng)域, LSTM模型能成功學(xué)習(xí)不同方向風(fēng)速預(yù)報(bào)特點(diǎn), 對(duì)于不同方向風(fēng)速預(yù)報(bào)誤差結(jié)果相近, 具有一定的抗干擾能力, 可以忽略掉部分相關(guān)性和質(zhì)量差的變量[15]。魏昱洲等[16]設(shè)計(jì)了一種雙層網(wǎng)絡(luò)結(jié)構(gòu)的LSTM預(yù)測模型, 通過實(shí)驗(yàn)證明了預(yù)測模型的高精度性。李冰等[17]以風(fēng)機(jī)歷史數(shù)據(jù)為輸入, 建立了基于LSTM深度神經(jīng)網(wǎng)絡(luò)的短期風(fēng)速預(yù)測模型, 預(yù)測誤差與其他預(yù)測方法相比更小。王俊等[18]提出一種基于變分模態(tài)分解(variational mode decom-po-sition, VMD)和LSTM的超短期預(yù)測算法, 對(duì)比分析證明該模型在超短期風(fēng)速預(yù)測上精度較高。
在風(fēng)速預(yù)測問題上, 目前已經(jīng)有了大量的研究, 然而大部分均聚焦在城市、風(fēng)場和鐵路附近等陸上領(lǐng)域, 對(duì)于海面風(fēng)速研究極為匱乏。原因在于海洋氣象環(huán)境多變并且風(fēng)速變化幅度強(qiáng)烈。此外由于海洋環(huán)境復(fù)雜, 對(duì)于海面風(fēng)速的數(shù)據(jù)采集相較陸地更為困難, 導(dǎo)致數(shù)據(jù)的連續(xù)性和代表性也因此降低。
本文利用浮標(biāo)測量風(fēng)速數(shù)據(jù), 將LSTM預(yù)測模型應(yīng)用到海面風(fēng)速的短期預(yù)測中。首先研究了LSTM算法對(duì)于季節(jié)性海面風(fēng)速的預(yù)測效果, 并與BP神經(jīng)網(wǎng)絡(luò)和徑向基函數(shù)(radial basis function, RBF)神經(jīng)網(wǎng)絡(luò)預(yù)測方法進(jìn)行對(duì)比, 證明了該方法的預(yù)測準(zhǔn)確性。然后通過多個(gè)浮標(biāo)站點(diǎn)采集的數(shù)據(jù)進(jìn)行預(yù)測實(shí)驗(yàn), 驗(yàn)證了LSTM預(yù)測方法對(duì)于不同海域的普遍適用性。為海面風(fēng)速的短期預(yù)測研究提供了一種思考路線。
LSTM網(wǎng)絡(luò)是一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò), 用于消除RNN在處理長期依賴問題時(shí)產(chǎn)生的梯度消失或梯度爆炸現(xiàn)象[19]。相比普通RNN的簡單重復(fù)模塊鏈結(jié)構(gòu), LSTM擁有4層以特殊形式交互的重復(fù)模塊結(jié)構(gòu), 因此在長序列訓(xùn)練過程中, LSTM表現(xiàn)更好。
LSTM具有刪除或添加信息到細(xì)胞狀態(tài)的能力, 該能力由一種名為“門”的可選式信息通過方式賦予,“門”的結(jié)構(gòu)由sigmoid神經(jīng)網(wǎng)絡(luò)層和點(diǎn)乘法運(yùn)算組成。相較于RNN的隱藏層中只有單個(gè)傳遞狀態(tài), LSTM網(wǎng)絡(luò)增加了一個(gè)狀態(tài)單元c, 并由LSTM中的3個(gè)“門”: 輸入門i、輸出門o和遺忘門f進(jìn)行保護(hù)和控制。LSTM單元在當(dāng)前時(shí)刻有3個(gè)控制輸入: 輸入值x、上一時(shí)刻輸出值h–1和上一時(shí)刻狀態(tài)值c–1, 2個(gè)輸出: 輸出值h和狀態(tài)值c。輸入門控制即時(shí)輸入信息送入狀態(tài)單元; 輸出門控制狀態(tài)單元中部分信息輸出并繼續(xù)自循環(huán)迭代; 遺忘門控制信息的刪除與保留, 并重置狀態(tài)單元。LSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖
單個(gè)LSTM主要分為以下4個(gè)步驟:
(1) 確定要從狀態(tài)單元中刪除哪些信息。這項(xiàng)工作由“遺忘門”中的sigmoid神經(jīng)網(wǎng)絡(luò)層實(shí)現(xiàn), 它基于前一時(shí)刻輸出h–1和當(dāng)前時(shí)刻輸入x, 為上個(gè)時(shí)刻狀態(tài)值c–1中每個(gè)值輸出0到1之間的數(shù)字, 1表示全部保留, 0表示徹底遺忘。
其中,f是遺忘門激活函數(shù),是sigmoid函數(shù),W是遺忘門權(quán)重矩陣,b是遺忘門偏置向量。
其中,i是輸入門激活函數(shù),W、W是輸入門、狀態(tài)單元權(quán)重矩陣,b、b是輸入門、狀態(tài)單元偏置向量。
(3) 更新上一時(shí)刻狀態(tài)值c–1, 得到當(dāng)前時(shí)刻狀態(tài)值c。
其中, “·”指按元素相乘符號(hào)。
(4) 確定輸出信息。首先運(yùn)行sigmoid 層決定要輸出哪些部分, 其次將狀態(tài)值通過tan層, 并結(jié)合sigmoid 層輸出決定信息輸出的程度。
其中,o是輸出門激活函數(shù),W是輸出門權(quán)重矩陣,b是輸出門偏置向量。
本文采用的海面風(fēng)速數(shù)據(jù)是OceanSITES數(shù)據(jù)庫(OceanSITES是一個(gè)全球范圍的, 長期、開放的海洋觀測站系統(tǒng), 每個(gè)站位可以測量獲取從海氣界面到海底, 全海深的數(shù)十個(gè)海洋環(huán)境變量。https://dods. ndbc.noaa.gov/oceansites/)中, 位于各個(gè)海域, 靠近海岸線的浮標(biāo)站點(diǎn)實(shí)時(shí)監(jiān)測的現(xiàn)場數(shù)據(jù)。包括東太平洋T8S165E站(8°S, 165°E)、西太平洋T2S95W站(2°S, 95°W)、北大西洋PIRATA站(21°N, 23°W)、南大西洋PIRATA站(14°S, 32°W)和北印度洋RAMA站(15°N, 90°E)。上述站位, 分布在主要大洋, 且位置相對(duì)較遠(yuǎn), 測試結(jié)果具有較強(qiáng)的獨(dú)立性, 因而研究結(jié)果的普適性更有說服力。
本文下載使用的NC(Net Common Data Format, NetCDF)數(shù)據(jù)包中, 包含了近年來對(duì)應(yīng)站點(diǎn)的風(fēng)速、氣溫、相對(duì)濕度和大氣壓等氣象觀測數(shù)據(jù)。浮標(biāo)風(fēng)速傳感器每10 min啟動(dòng)一次用時(shí)2 min的檢測, 共采樣240次, 以240次采樣平均值作為這10 min的風(fēng)速值。這種檢測方法將浮標(biāo)運(yùn)動(dòng)及傳感器隨機(jī)誤差對(duì)風(fēng)速測量造成的影響大大降低, 測量值基本反映了風(fēng)速本身的變化規(guī)律, 更有利于開展預(yù)測方法的研究。本文采用Matlab軟件及其機(jī)器學(xué)習(xí)工具箱進(jìn)行短期風(fēng)速預(yù)測。首先對(duì)獲取的數(shù)據(jù)進(jìn)行數(shù)據(jù)集劃分和標(biāo)準(zhǔn)化, 將處理后的數(shù)據(jù)輸入構(gòu)建的LSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練, 通過重復(fù)訓(xùn)練計(jì)算出損失函數(shù)和模型誤差, 從而調(diào)整網(wǎng)絡(luò)參數(shù)得到基于LSTM的短期風(fēng)速預(yù)測模型。
本文采用的短期風(fēng)速預(yù)測模型, 隱含層由一個(gè)LSTM層、一個(gè)Dropout層和一個(gè)Dense層構(gòu)成。Dropout方法能夠有效解決神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中, 訓(xùn)練結(jié)果較好而測試效果較差的過擬合問題。Dense層中每個(gè)神經(jīng)元與上一層全部神經(jīng)元輸出相連[20], 因此LSTM的輸出不僅包含預(yù)測所需信息, 還能反映出特征信息與預(yù)測結(jié)果之間的函數(shù)關(guān)系。
LSTM模型具體實(shí)現(xiàn)風(fēng)速預(yù)測由3個(gè)步驟構(gòu)成。首先, 對(duì)采集到的數(shù)據(jù)進(jìn)行劃分和標(biāo)準(zhǔn)化處理; 其次, 在訓(xùn)練過程中, 確定網(wǎng)絡(luò)模型訓(xùn)練和預(yù)測所需具體參數(shù)如隱藏層神經(jīng)元個(gè)數(shù)、學(xué)習(xí)率、訓(xùn)練迭代次數(shù)等, 完成模型的構(gòu)建; 最后, 通過去標(biāo)準(zhǔn)化的數(shù)據(jù)進(jìn)行測試集預(yù)測, 完成對(duì)模型的檢驗(yàn)。預(yù)測模型框架如圖2所示。
本文數(shù)據(jù)來源于實(shí)時(shí)監(jiān)測采集海面風(fēng)速的太平洋浮標(biāo)站點(diǎn), 選取其中一定序列長度的數(shù)據(jù), 按一定比例劃分訓(xùn)練集和測試集。考慮到神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的飽和特性, 以及激活函數(shù)的輸入輸出數(shù)值范圍, 數(shù)據(jù)劃分完畢后需要進(jìn)行標(biāo)準(zhǔn)化處理, 標(biāo)準(zhǔn)化公式為:
其中, st是標(biāo)準(zhǔn)化后的數(shù)值, dt是訓(xùn)練集中每個(gè)時(shí)刻的數(shù)據(jù)值, μtra是訓(xùn)練數(shù)據(jù)的均值, σtra是訓(xùn)練數(shù)據(jù)的標(biāo)準(zhǔn)差。
構(gòu)建基于LSTM網(wǎng)絡(luò)的海表短期風(fēng)速預(yù)測模型需要確定部分特征參數(shù)。本文建立的預(yù)測模型只考慮到海面風(fēng)速數(shù)據(jù), 因此輸入層維數(shù)設(shè)為1。隱藏層維數(shù)代表了隱藏層神經(jīng)元的個(gè)數(shù), 當(dāng)時(shí)間序列數(shù)據(jù)較為復(fù)雜時(shí), 神經(jīng)元個(gè)數(shù)設(shè)置越多模擬效果越好, 但同時(shí)也帶來了訓(xùn)練時(shí)間過長以及過擬合的缺點(diǎn), 在訓(xùn)練過程中需要折衷考慮模擬效果和訓(xùn)練時(shí)間長短問題, 因此在隱藏層中, 選取LSTM層神經(jīng)元個(gè)數(shù)為144, Dropout層舍棄神經(jīng)元比例為0.2, Dense layer層輸出向量為1維。同時(shí)可知輸出層維數(shù)為1。訓(xùn)練天數(shù)即訓(xùn)練數(shù)據(jù)的序列長度, 選擇時(shí)需要充分考慮模型進(jìn)行網(wǎng)絡(luò)訓(xùn)練時(shí)的實(shí)際情況, 當(dāng)序列長度太短時(shí), 模型訓(xùn)練程度不足以模擬出數(shù)據(jù)變化的規(guī)律, 預(yù)測性能較差; 當(dāng)序列長度太長時(shí), 會(huì)導(dǎo)致訓(xùn)練時(shí)間過長, 且有概率因?yàn)橥回?shù)據(jù)造成預(yù)測性能惡化, 本文在實(shí)驗(yàn)過程中, 通過設(shè)置不同的訓(xùn)練天數(shù)來確定最佳的序列長度。訓(xùn)練迭代次數(shù)epoch與訓(xùn)練天數(shù)類似, 選擇的大小會(huì)影響模型生成時(shí)間和預(yù)測準(zhǔn)確率, 因此同樣通過實(shí)驗(yàn)設(shè)置不同的迭代次數(shù)進(jìn)行對(duì)比, 從而選擇出最佳次數(shù)。
LSTM網(wǎng)絡(luò)的訓(xùn)練采用的是反向傳播算法(back-propagation through time, BPTT), 首先前向計(jì)算出每個(gè)神經(jīng)元的輸出值, 其次反向計(jì)算出每個(gè)神經(jīng)元的誤差項(xiàng), 最后通過誤差項(xiàng)計(jì)算出權(quán)重梯度值。本文實(shí)驗(yàn)中在每一步的預(yù)測完成后, 利用該時(shí)刻的風(fēng)速預(yù)測值計(jì)算誤差項(xiàng), 進(jìn)而預(yù)測出下一步的風(fēng)速值。其他的網(wǎng)絡(luò)參數(shù)設(shè)置如下: 損失函數(shù)采用均方根誤差函數(shù)、優(yōu)化算法使用學(xué)習(xí)率自適應(yīng)(adaptive moment estimation, Adam)算法、初始學(xué)習(xí)率設(shè)置為0.005。
在短期風(fēng)速預(yù)測中, 一般選取平均絕對(duì)誤差(mean absolute error,MA)和均方根誤差(root mean squared error,RMS)對(duì)預(yù)測結(jié)果進(jìn)行評(píng)價(jià), 兩者的計(jì)算公式如下:
其中,表示模型樣本數(shù),f表示時(shí)刻風(fēng)速實(shí)際值,y表示時(shí)刻風(fēng)速預(yù)測值。
同時(shí), 利用皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient)作為反映預(yù)測值與實(shí)際值之間相關(guān)性程度的統(tǒng)計(jì)指標(biāo)。計(jì)算公式為:
首先從T8S165E站提供的海洋數(shù)據(jù)中, 篩選出對(duì)應(yīng)位置2021年各季節(jié)代表月份中16 d的實(shí)時(shí)數(shù)據(jù), 進(jìn)行海面風(fēng)速的季節(jié)性預(yù)測研究討論, 分別為1月、4月、7月和10月, 每天數(shù)據(jù)的采樣周期為10 min。在實(shí)驗(yàn)過程中, 通過設(shè)定LSTM模型中不同的訓(xùn)練天數(shù)對(duì)應(yīng)的樣本數(shù)據(jù)和訓(xùn)練迭代次數(shù), 來實(shí)現(xiàn)對(duì)各月份后144個(gè)樣本數(shù)據(jù)的預(yù)測。同時(shí)與BP神經(jīng)網(wǎng)絡(luò)模型和RBF神經(jīng)網(wǎng)絡(luò)模型的各季節(jié)風(fēng)速預(yù)測結(jié)果進(jìn)行對(duì)比??紤]到缺損值和突兀點(diǎn)對(duì)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的影響, 首先需要對(duì)采集到的數(shù)據(jù)進(jìn)行預(yù)處理。剔除野點(diǎn)后, T8S165E站各月份選取的16 d海面風(fēng)速變化曲線如圖3所示。
圖3 T8S165E站各季節(jié)海面風(fēng)速變化曲線
通常情況下, 隨著訓(xùn)練天數(shù)和訓(xùn)練迭代次數(shù)的增加, LSTM模型的預(yù)測效果越理想, 但同時(shí)訓(xùn)練時(shí)間也隨之增加。當(dāng)參數(shù)選擇過小時(shí), 模型無法完成收斂, 預(yù)測精度較低; 當(dāng)參數(shù)選擇過大時(shí), 模型的誤差和損失函數(shù)等下降幅度會(huì)減弱, 此時(shí)參數(shù)中過多的無用信息以及增加的訓(xùn)練時(shí)間則拉低了預(yù)測模型的整體性能。因此綜合考慮到訓(xùn)練天數(shù)和訓(xùn)練迭代次數(shù)對(duì)模型預(yù)測精準(zhǔn)度和訓(xùn)練時(shí)間的影響, 將T8S165E站2021年各月份數(shù)據(jù)對(duì)應(yīng)的訓(xùn)練時(shí)間分別設(shè)置為15 d、10 d、5 d和3 d, 即對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)樣本個(gè)數(shù)為2 160、1 440、720和432。訓(xùn)練迭代次數(shù)分別設(shè)置為40、60和80, 形成的參數(shù)組合如表1所示。
根據(jù)不同的參數(shù)組合, 繪出對(duì)應(yīng)的模型平均絕對(duì)誤差和均方根誤差如圖4所示。
表1 訓(xùn)練時(shí)間和訓(xùn)練迭代次數(shù)參數(shù)選取
圖4 各月份不同參數(shù)組合下的MAE/RMSE
結(jié)合訓(xùn)練誤差對(duì)各季節(jié)的LSTM風(fēng)速預(yù)測模型參數(shù)進(jìn)行如下設(shè)置: 1月, 4月, 7月, 10月訓(xùn)練時(shí)間均為10 d, 迭代次數(shù)均為60。BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型輸入層維數(shù)為1, 中間層神經(jīng)元數(shù)通過訓(xùn)練得出最佳值7, 輸出層維數(shù)為1, 各月份訓(xùn)練時(shí)間通過實(shí)驗(yàn), 同樣選擇為10 d。RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型參數(shù)選擇與BP模型基本相同。利用設(shè)置的參數(shù)代入各模型對(duì)各月份后144個(gè)樣本數(shù)據(jù)進(jìn)行預(yù)測, 如圖5所示為各季節(jié)海面風(fēng)速預(yù)測效果的對(duì)比情況。
各模型預(yù)測結(jié)果的平均絕對(duì)誤差和均方根誤差如表2所示。
通過預(yù)測結(jié)果和誤差分析可知, 對(duì)于不同季節(jié)的數(shù)據(jù), 各神經(jīng)網(wǎng)絡(luò)預(yù)測模型都可以有效模擬出海面風(fēng)速的變化趨勢, 體現(xiàn)出在不同季節(jié)的海洋環(huán)境影響下, 預(yù)測模型均具備一定的適應(yīng)性, 可以全方位地預(yù)測出整年的海面風(fēng)速數(shù)據(jù)。
根據(jù)浮標(biāo)實(shí)際檢測值可知, 海面風(fēng)速的隨機(jī)性較強(qiáng), 變化幅度較大, 當(dāng)各月份出現(xiàn)急劇變化的風(fēng)速值時(shí), LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測效率更強(qiáng), 對(duì)于風(fēng)速的擬合度相較另外兩種神經(jīng)網(wǎng)絡(luò)更高。對(duì)于整體預(yù)測效果而言, LSTM的預(yù)測最小MA和RMS達(dá)到0.328和0.445, RBF預(yù)測的最小MA和RMS分別為0.334和0.463, BP預(yù)測的最小MA和RMS分別為0.373和0.476, 因此LSTM神經(jīng)網(wǎng)絡(luò)模型的預(yù)測更精準(zhǔn)有效。
各種神經(jīng)網(wǎng)絡(luò)模型對(duì)于海面風(fēng)速的預(yù)測可以進(jìn)一步討論, 通過調(diào)整不同的測試集長度, 驗(yàn)證出神經(jīng)網(wǎng)絡(luò)模型的最佳預(yù)測周期。設(shè)置預(yù)測時(shí)長為6、12、18和24 h, 利用3種神經(jīng)網(wǎng)絡(luò)模型對(duì)各季節(jié)海面風(fēng)速預(yù)測進(jìn)行對(duì)比, 選擇出預(yù)測的最佳測試集長度, 預(yù)測值的平均絕對(duì)誤差如下圖6所示。
圖5 海面風(fēng)速預(yù)測結(jié)果與實(shí)測對(duì)比
表2 各模型預(yù)測結(jié)果的MAE和RMSE
由實(shí)驗(yàn)結(jié)果可知, 隨著測試集預(yù)測時(shí)長的變化, LSTM神經(jīng)網(wǎng)絡(luò)模型的預(yù)測誤差始終低于其他神經(jīng)網(wǎng)絡(luò)模型。由于海面風(fēng)速的變化幅度較大且隨機(jī)性較強(qiáng), 因此隨著預(yù)測時(shí)長的變化, 預(yù)測的誤差變化較小。在實(shí)際工程中進(jìn)行測試集的選擇時(shí)還需綜合考慮預(yù)測成本與準(zhǔn)確性, 因此在保證風(fēng)速預(yù)測的時(shí)效性前提下, 可以選擇24 h作為測試集最佳預(yù)測周期。
基于對(duì)比實(shí)驗(yàn)的研究分析, 為了驗(yàn)證LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測模型的普遍適用性, 選擇4個(gè)站點(diǎn)的海面風(fēng)速數(shù)據(jù)進(jìn)行預(yù)測驗(yàn)證, 由于數(shù)據(jù)較多, 選取各站點(diǎn)在2021年中單季節(jié)的預(yù)測結(jié)果進(jìn)行展示, 分別為RAMA站(15°N, 90°E)1月數(shù)據(jù)、PIRATA站(14°S, 32°W)4月數(shù)據(jù)、PIRATA站(21°N, 23°W)7月份數(shù)據(jù)和T2S95W站(2°S, 95°W)10月數(shù)據(jù)。模型參數(shù)通過上述實(shí)驗(yàn)后均選取最佳值, 各站點(diǎn)數(shù)據(jù)采樣周期仍為10 min, 預(yù)測時(shí)長為24 h。通過各海域浮標(biāo)站點(diǎn)的代表性海面風(fēng)速數(shù)據(jù)驗(yàn)證LSTM神經(jīng)網(wǎng)絡(luò)模型的預(yù)測普遍適用性。預(yù)測結(jié)果如圖7所示。
利用相關(guān)系數(shù)(Pearson correlation coefficient)作為反映預(yù)測值與實(shí)際值之間相關(guān)性程度的統(tǒng)計(jì)指標(biāo),越接近1, 則預(yù)測值與實(shí)際值之間相關(guān)性程度越高。相關(guān)性曲線如圖8所示。
圖6 各季節(jié)代表月份海面風(fēng)速預(yù)測平均絕對(duì)誤差
圖7 各站點(diǎn)海面風(fēng)速預(yù)測結(jié)果
圖8 各站點(diǎn)海面風(fēng)速預(yù)測相關(guān)性曲線
預(yù)測結(jié)果指標(biāo)如表3所示。
表3 各站點(diǎn)預(yù)測性能指標(biāo)和相關(guān)系數(shù)
通過多站點(diǎn)預(yù)測實(shí)驗(yàn)結(jié)果的預(yù)測誤差分析和相關(guān)系數(shù)可知, LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)于海面風(fēng)速的預(yù)測具備多海域普遍適用性, 能夠精確擬合出各海域及各季節(jié)海洋數(shù)據(jù)的變化趨勢。當(dāng)某季節(jié)風(fēng)速變化頻率較快且幅度較大時(shí), 模型預(yù)測效果仍然可以保證一定的相關(guān)程度, 這表明盡管海面風(fēng)速等海洋數(shù)據(jù)受諸多不穩(wěn)定因素影響, 而具備隨機(jī)性、高非線性的特點(diǎn), 但使用LSTM神經(jīng)網(wǎng)絡(luò)能夠進(jìn)行高精度預(yù)測, 并且具備應(yīng)對(duì)急劇變化數(shù)據(jù)的預(yù)測穩(wěn)定性。
針對(duì)海洋領(lǐng)域中氣象環(huán)境復(fù)雜多變、海面風(fēng)速隨機(jī)性強(qiáng)而導(dǎo)致的難以精準(zhǔn)預(yù)測的問題, 本文提出了一種基于LSTM神經(jīng)網(wǎng)絡(luò)的短期風(fēng)速預(yù)測方法。在Matlab環(huán)境下搭建了基于LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測模型, 同時(shí)搭建了BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)模型用作預(yù)測性能對(duì)比。
首先考慮到海面風(fēng)速受季節(jié)性影響較大, 選取東太平洋單浮標(biāo)站點(diǎn)各季節(jié)代表月份的海面風(fēng)速歷史數(shù)據(jù)作為模型輸入, 通過訓(xùn)練選取最佳模型參數(shù), 對(duì)固定測試集海面風(fēng)速數(shù)據(jù)進(jìn)行了預(yù)測。結(jié)果證明, 3種神經(jīng)網(wǎng)絡(luò)模型均能模擬出海面風(fēng)速的變化趨勢, 對(duì)季節(jié)性變化均可進(jìn)行一定時(shí)間范圍內(nèi)有效的預(yù)測; 但相比之下, LSTM神經(jīng)網(wǎng)絡(luò)擁有更高的精準(zhǔn)性能。
其次基于3種神經(jīng)網(wǎng)絡(luò)預(yù)測模型對(duì)測試集預(yù)測時(shí)長進(jìn)行擴(kuò)展討論, 對(duì)各模型不同預(yù)測時(shí)長下的預(yù)測值平均絕對(duì)誤差進(jìn)行比較, 得出海面風(fēng)速的最佳預(yù)測周期為24 h。證明了LSTM神經(jīng)網(wǎng)絡(luò)整體預(yù)測效果始終優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)。
最后利用LSTM神經(jīng)網(wǎng)絡(luò)對(duì)不同海域中多個(gè)站點(diǎn)進(jìn)行預(yù)測驗(yàn)證, 通過選取靠近海岸線的海洋浮標(biāo)站點(diǎn), 以及各浮標(biāo)季節(jié)性相關(guān)的海面風(fēng)速進(jìn)行預(yù)測實(shí)驗(yàn), 驗(yàn)證了本文提出的LSTM神經(jīng)網(wǎng)絡(luò)模型的普遍適用性。通過相關(guān)系數(shù)的計(jì)算, 證明了當(dāng)數(shù)據(jù)波動(dòng)較為頻繁時(shí), 模型預(yù)測結(jié)果保持了較強(qiáng)的一致性。
在以后的研究方向中可以進(jìn)一步考慮優(yōu)化模型參數(shù)的設(shè)置, 如增加輸入維數(shù)(包括添加海表海溫、濕度、風(fēng)向等海洋數(shù)據(jù)作為輸入), 這些變量可以看作海面風(fēng)速影響因子。因此可以探討增加的輸入?yún)?shù)與需要預(yù)測的參數(shù)之間的相關(guān)性, 并且對(duì)比出不同程度相關(guān)性數(shù)據(jù)輸入時(shí)對(duì)于預(yù)測精度的影響, 進(jìn)而使得神經(jīng)網(wǎng)絡(luò)對(duì)于海洋數(shù)據(jù)的預(yù)測達(dá)到更高的精確度。
[1] 許飛瓊. 災(zāi)害損失評(píng)估及其系統(tǒng)結(jié)構(gòu)[J]. 災(zāi)害學(xué), 1998, 13(3): 80-83.
XU Feiqiong. Disaster loss assessment and its system structure[J]. Disaster Science, 1998, 13(3): 80-83.
[2] 肖茹水, 郭佩芳, 解曉茹. 風(fēng)暴潮災(zāi)害損失評(píng)估研究綜述[J]. 海洋湖沼通報(bào), 2021, 43(2): 67-73.
XIAO Rushui, GUO Peifang, XIE Xiaoru. Overview of the study on the assessment of storm surge disaster losses[J]. Bulletin of Oceans and Lakes, 2021, 43(2): 67-73.
[3] 耿逍懿, 郝坤, 史振威. 一種基于深度學(xué)習(xí)的熱帶氣旋路徑集成預(yù)報(bào)方法[J]. 海洋科學(xué), 2022, 46(2): 74-86.
GENG Xiaoyi, HAO Kun, SHI Zhenwei. An Integrated prediction method of tropical cyclone paths based on depth learning[J]. Marine Sciences, 2022, 46(2): 74-86.
[4] 陳亮, 王震, 王剛. 深度學(xué)習(xí)框架下LSTM網(wǎng)絡(luò)在短期電力負(fù)荷預(yù)測中的應(yīng)用[J]. 電力信息與通信技術(shù), 2017, 15(5): 8-11.
CHEN Liang, WANG Zhen, WANG Gang. Application of LSTM network in short-term power load forecasting under the framework of deep learning[J]. Power Infor-mation and Communication Technology, 2017, 15(5): 8-11.
[5] 熊一橙, 徐煒, 張銳, 等. 基于LSTM網(wǎng)絡(luò)的長江上游流域徑流模擬研究[J]. 水電能源科學(xué), 2021, 39(9): 22-24, 40.
XIONG Yicheng, XU Wei, ZHANG Rui, et al. Study on runoff simulation of the upper reaches of the Yang-tze River based on LSTM network[J]. Hydropower and Energy Science, 2021, 39(9): 22-24, 40.
[6] 張貽婷, 李天宏. 基于長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的河流水質(zhì)預(yù)測研究[J]. 環(huán)境科學(xué)與技術(shù), 2021, 44(8): 163-169.
ZHANG Yiting, LI Tianhong. Research on prediction of river water quality based on Long-term and Short- term Memory neural network[J]. Environmental Scien-ce and Technology, 2021, 44(8): 163-169.
[7] 胡衍坤, 王寧, 劉樞, 等. 時(shí)間序列模型和LSTM模型在水質(zhì)預(yù)測中的應(yīng)用研究[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2021, 42(8): 1569-1573.
HU Yankun, WANG Ning, LIU Shu, et al. Research on the application of time series model and LSTM model in water quality prediction[J]. Minicomputer System, 2021, 42(8): 1569-1573.
[8] 李彥杰, 賀鵬飛, 馮巍巍, 等. 基于LSTM模型的海洋水質(zhì)預(yù)測[J]. 計(jì)算機(jī)與數(shù)字工程, 2020, 48(2): 437- 441.
LI Yanjie, HE Pengfei, FENG Weiwei, et al. Marine water quality prediction based on LSTM model[J]. Computer and Digital Engineering, 2020, 48(2): 437- 441.
[9] 武雙新. 基于LSTM的氣溫?cái)?shù)據(jù)建模研究[J]. 數(shù)據(jù)通信, 2021(2): 47-51.
WU Shuangxin. Research on temperature data mode-ling based on LSTM[J]. Data Communication, 2021(2): 47-51.
[10] QIU R J, WANG Y K, RHOADS B, et al. River water temperature forecasting using a deep learning me-thod[J]. Journal of Hydrology, 2021, 595: 126016.
[11] CHOI H M, KIM M K, YANG H. Abnormally high water temperature prediction using LSTM deep lear-ning model[J]. Journal of Intelligent & Fuzzy Systems: Applications in Engineering and Technology, 2021, 40(4): 8013-8020.
[12] LIU Y, WANG H, FENG W W, HUANG H C, et al. Short term real-time rolling forecast of urban river water levels based on LSTM: acase study in Fuzhou city, China[J]. International Journal of Environmental Research and Public Health, 2021, 18(17): 9287.
[13] YAN Y, XING H Y. A sea clutter detection method based on LSTM error frequency domain conversion[J]. Alexandria Engineering Journal, 2022, 61(1): 883-891.
[14] JRGES C, BERKENBEINK C, STUMPE B. Prediction and reconstruction of ocean wave heights based on bathymetric data using LSTM neural networks[J]. Ocean Engineering, 2021, 232: 109046.
[15] 王國松, 王喜冬, 侯敏, 等. 基于觀測和再分析數(shù)據(jù)的LSTM深度神經(jīng)網(wǎng)絡(luò)沿海風(fēng)速預(yù)報(bào)應(yīng)用研究[J]. 海洋學(xué)報(bào), 2020, 42(1): 67-77.
WANG Guosong, WANG Xidong, HOU Min, et al. Study on the application of LSTM depth neural net-work to coastal wind speed prediction based on observation and reanalysis data[J]. Haiyang Xuebao, 2020, 42(1): 67-77.
[16] 魏昱洲, 許西寧. 基于LSTM長短期記憶網(wǎng)絡(luò)的超短期風(fēng)速預(yù)測[J]. 電子測量與儀器學(xué)報(bào), 2019, 33(2): 64-71.
WEI Yuzhou, XU Xining. Ultra short term wind speed prediction based on LSTM long-term and short-term memory network[J]. Journal of Electronic Measure-ment and Instrumentation, 2019, 33(2): 64-71.
[17] 李冰, 張妍, 劉石. 基于LSTM的短期風(fēng)速預(yù)測研究[J]. 計(jì)算機(jī)仿真, 2018, 35(11): 456-461.
LI Bing, ZHANG Yan, LIU Shi. Research on short- term wind speed prediction based on LSTM[J]. Computer Simulation, 2018, 35(11): 456-461.
[18] 王俊, 李霞, 周昔東, 等. 基于VMD和LSTM的超短期風(fēng)速預(yù)測[J]. 電力系統(tǒng)保護(hù)與控制, 2020, 48(11): 45-52.
WANG Jun, LI Xia, ZHOU Xidong, et al. Ultra short term wind speed prediction based on VMD and LSTM[J]. Power System Protection and Control, 2020, 48(11): 45-52.
[19] 張博一, 胡雄, 唐剛, 等. 基于二元LSTM神經(jīng)網(wǎng)絡(luò)的船舶運(yùn)動(dòng)預(yù)測算法研究[J]. 海洋科學(xué), 2021, 45(9): 69-74.
ZHANG Boyi, HU Xiong, TANG Gang, et al. Research on ship motion prediction algorithm based on binary LSTM neural network[J]. Marine Sciences, 2021, 45(9): 69-74.
[20] WANG Q L, GUO Y F, YU L X, et al. Earthquake prediction based on spatio-temporal data mining: an LSTM network approach[J]. IEEE Transactions on Emerging Topics in Computing, 2017, 8(1): 148-158.
Short-term wind-speed prediction of ocean surface based on LSTM
LI Ya-meng1, SUN Bao-nan2, 3, 4, 5, DING Jun-hang1, 6, 7, GUAN Sheng2, 3, 4, 5
(1. School of Automation, Qingdao University, Qingdao 266071, China; 2. First Institute of Oceanography, Ministry of Natural Resources, Qingdao 266061, China; 3. Key Laboratory of Marine Science and Numerical Modeling, Ministry of Natural Resources, Qingdao 266061, China; 4. Shandong Key Laboratory of Marine Science and Numerical Modeling, Qingdao 266061, China; 5. Laboratory for Regional Oceanography and Numerical Modeling, Pilot National Laboratory for Marine Science and Technology (Qingdao), Qingdao 266237, China; 6. Shandong Key Laboratory of Industrial Control Technology, Qingdao 266071, China; 7. Collaborative Innovation Center for Eco-Textiles of Shandong Province, Qingdao University, Qingdao 266071, China)
Sea surface wind speed plays a critical role in production and operation activities such as marine space launches and wind power deployment. However, because sea surface wind speed is highly nonlinear and stochastic, it is relatively challenging to estimate precisely. A short-term wind-speed prediction model based on long short-term memory (LSTM) neural network is suggested to accomplish reliable short-term prediction of sea surface wind speed. The historical wind speed data gathered by a single buoy station in the OceanSITES database is chosen as the model input, and the LSTM techniques are implemented by training the best parameters. Using this LSTM method, a 24-hour short-term forecast of the sea surface wind speed where the station is located in each seasonal representative month is realized. Simultaneously, through experiments involving various prediction durations and comparison experiments of prediction effects with back propagation neural network and radial basis function neural network, it is demonstrated that the LSTM prediction approach is superior to the above two neural network prediction methods in the application of sea surface wind–speed prediction. Finally, the LSTM neural network model is demonstrated to be globally applicable to wind speed prediction experiment data at stations representing diverse marine areas. The analysis of correlation coefficient and prediction error reveals that this method has the prediction stability to deal with quickly changing data and can be employed as a reliable method for short-term prediction of ocean surface wind speed.
neural network; LSTM network model; sea surface wind speed; short-term prediction
Nov. 16, 2021
P714.1
A
1000-3096(2022)11-0055-12
10.11759/hykx20211116001
2021-11-16;
2022-01-23
科技部重大科學(xué)儀器專項(xiàng)項(xiàng)目(2018YFF01014100)
[Major Scientific Instrument Project of Ministry of Science and Technology, No. 2018YFF01014100]
李亞蒙(1996—), 女, 山東煙臺(tái)人, 碩士研究生, 主要從事智能控制與數(shù)據(jù)資料預(yù)測分析研究, E-mail: 516553884@qq.com; 官晟(1972—),通信作者, 男, 山東青島人, 研究員, 博士, 主要從事海洋環(huán)境觀測技術(shù)與智能控制研究, E-mail: gsh30@163.com
(本文編輯: 叢培秀)