苗慶生, 徐珊珊, 楊錦坤, 楊 楊, 劉玉龍, 余 璇
(1.國家海洋信息中心, 天津 300171; 2.上海大學(xué), 上海 200444)
風(fēng)暴潮是指由于氣壓驟變和強風(fēng)等劇烈的大氣擾動所導(dǎo)致的潮位異常升降現(xiàn)象,是最嚴重的自然災(zāi)害之一,自上世紀50年代以來一直是本領(lǐng)域重要的研究課題[1]。而在全球變暖趨勢和沿海人口增長的影響下,預(yù)計未來風(fēng)暴潮會帶來更大風(fēng)險[2-3]。廈門島位于福建省東南沿海,瀕臨臺灣海峽,是強臺風(fēng)的頻發(fā)地區(qū)。由廈門站1959—2012年風(fēng)暴潮資料統(tǒng)計分析得出,廈門沿海因為臺風(fēng)影響引起增水超過50 cm的風(fēng)暴潮有145次,約每年出現(xiàn)2.7次[4]。風(fēng)暴潮引起的極端水位給廈門地區(qū)造成非常嚴重的影響,因此,準確預(yù)測風(fēng)暴潮就顯得尤其重要。臺風(fēng)引起的風(fēng)暴潮的主要因素包括強風(fēng)和低氣壓。強風(fēng)引起水體堆積,氣壓降低引起海面上升。除了大氣強迫外,海洋物理過程(例如與波浪的相互作用)和淺水區(qū)的地形也會進一步影響風(fēng)暴潮的規(guī)模[5]。
風(fēng)暴潮的預(yù)報類型分為三種:第一種類型為經(jīng)驗公式法[6]。該種方法根據(jù)對觀測數(shù)據(jù)統(tǒng)計分析,利用經(jīng)驗將不同的預(yù)測效果量化成一個或多個參數(shù)。這種方法可以將最大風(fēng)暴潮水位和臺風(fēng)特征例如氣壓和風(fēng)速通過經(jīng)驗公式的方式結(jié)合起來。通常這種簡單的關(guān)系能夠解釋風(fēng)暴潮60%的變化[5]。第二種類型為流體動力學(xué)模型法。利用流體動力學(xué)和大氣驅(qū)動建立直接的或者耦合的數(shù)值模式來預(yù)測風(fēng)暴潮[7]。一般采用Boussineq近似的非線性淺水方程結(jié)合深度積分的二維正交網(wǎng)格來模擬風(fēng)暴潮[8],驅(qū)動場可采用參數(shù)化的臺風(fēng)模型[9-10]。此外,流體動力學(xué)模型方法是當前最通用的方法,在過去數(shù)十年間研究人員花費了大量精力用于數(shù)值模型的發(fā)展和改進[17-19]。該方法的缺點是需要精確而詳細的流體動力學(xué)方程、地形數(shù)據(jù)、臺風(fēng)模型、邊界條件以及很大的運算量,而在實際運行中,我們通常沒有準確而詳細的地形數(shù)據(jù)、臺風(fēng)模型和邊界條件[5]。最后一種方法為人工神經(jīng)網(wǎng)絡(luò),它模仿人腦從數(shù)據(jù)中有效學(xué)習(xí)有關(guān)自然現(xiàn)象的復(fù)雜規(guī)則[20],在氣象、水文、水資源和海岸工程多個領(lǐng)域都有應(yīng)用[21-25]。人工神經(jīng)網(wǎng)絡(luò)方法不需要建立復(fù)雜數(shù)據(jù)模型,只需要輸入數(shù)據(jù)調(diào)節(jié)網(wǎng)絡(luò)內(nèi)部連接,依靠其強大的自學(xué)習(xí)、自組織和自適應(yīng)性,能夠通過對系統(tǒng)輸入輸出樣本對的學(xué)習(xí),自動提取組合其中的映射規(guī)則,自動調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)以適應(yīng)環(huán)境變化,具有強大的逼近能力和擬合能力[26]。基于此,人工神經(jīng)網(wǎng)絡(luò)能夠有效模擬風(fēng)暴潮和氣象條件之間的非線性關(guān)系并得到廣泛應(yīng)用。常用的模型包括SVR、RBF和BP神經(jīng)網(wǎng)絡(luò)等。其中,應(yīng)用最廣泛的為BP神經(jīng)網(wǎng)絡(luò)。BP 神經(jīng)網(wǎng)絡(luò)是一種常見的基于誤差反向傳播算法的多層前饋型網(wǎng)絡(luò),包括輸入層、隱藏層和輸出層。BP神經(jīng)網(wǎng)絡(luò)將輸出層誤差反方向通過隱藏層傳導(dǎo)至輸入層來調(diào)整權(quán)值,網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過程就是權(quán)值不斷調(diào)整的過程。進行風(fēng)暴潮模擬時,通過輸入臺風(fēng)因子和當?shù)貧夂蛞蜃觼淼玫斤L(fēng)暴潮增水值[27]。然而,BP神經(jīng)網(wǎng)絡(luò)的算法較為低效并且容易陷入梯度消失的陷阱,在實際預(yù)測中可能會造成訓(xùn)練失敗或者誤差無法降低的情景。基于此,本文采用LSTM模型來模擬風(fēng)暴潮。LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變體模型,它彌補了RNN的梯度消失和梯度爆炸、長期記憶能力不足等問題,使得循環(huán)神經(jīng)網(wǎng)絡(luò)能夠真正有效地利用長距離的時序信息,LSTM 網(wǎng)絡(luò)被證明比傳統(tǒng)的RNN 更加有效[28]。目前 LSTM 得到了廣泛應(yīng)用,并在數(shù)據(jù)預(yù)測領(lǐng)域中有著優(yōu)異的表現(xiàn)[29-32]。
臺風(fēng)數(shù)據(jù)來源于中國天氣臺風(fēng)網(wǎng)(http://typhoon.weather.com.cn/index.shtml),要素包括臺風(fēng)實時路徑、最大風(fēng)速、中心氣壓、七級風(fēng)圈半徑等,時間間隔1 h,選取了2005—2019年期間影響廈門市的臺風(fēng)數(shù)據(jù),共包括61個臺風(fēng)過程。其中,2005—2015年共46個臺風(fēng)過程用于訓(xùn)練,剩下15個臺風(fēng)過程用于測試驗證。
廈門潮位數(shù)據(jù)來源于國家海洋信息中心,數(shù)據(jù)時間為2005—2019年,時間間隔1 h,數(shù)據(jù)都經(jīng)過質(zhì)量控制,質(zhì)量良好。廈門海洋站位置見圖1。
圖1 廈門測站位置及代表性臺風(fēng)路徑
本文利用LSTM模型強大的長短期記憶能力預(yù)測廈門市臺風(fēng)期間的風(fēng)暴潮增水,合理選擇影響風(fēng)暴潮增水的因子,預(yù)測增水的變化趨勢,為廈門沿海防災(zāi)減災(zāi)提供支持和參考。
LSTM結(jié)構(gòu)包含輸入門、輸出門、遺忘門和記憶單元,輸入門、輸出門。遺忘門都是邏輯單元,它們不會將自己的輸出發(fā)送給其他神經(jīng)元,而是負責(zé)在神經(jīng)網(wǎng)絡(luò)的其他部分與記憶單元連接的邊緣處設(shè)定權(quán)值,用來選擇性記憶反饋的誤差函數(shù)隨梯度下降的修正參數(shù),其具體結(jié)構(gòu)如圖2。
圖2 LSTM模型結(jié)構(gòu)
輸入門、輸出門用來接收以及輸出參數(shù)和修正參數(shù),分別記為i,o。遺忘門表示是否保留當前隱藏層節(jié)點存儲的歷史信息,記為f。記憶單元(Cell)表示神經(jīng)元狀態(tài)的記憶,記為c。3個門以及獨立的Cell單元的設(shè)計,使得LSTM單元有保存、讀取、重置和更新長距離歷史信息的能力。它們的計算過程如下式:
(1)
其中:h表示隱藏狀態(tài);W和b分別為對應(yīng)的權(quán)重系數(shù)矩陣和偏置項;σ和tanh分別為sigmoid函數(shù)和雙曲正切激活函數(shù)。
不同數(shù)據(jù)由于單位和量級的差別會對模型訓(xùn)練產(chǎn)生不利影響,為消除這種影響,需將數(shù)據(jù)進行去量綱化處理。同時本LSTM模型中采用的sigmoid函數(shù)作為激活函數(shù),該函數(shù)對于較大的輸入數(shù)據(jù)變化不敏感,所以為解決數(shù)據(jù)之間的可比性,方便模型訓(xùn)練,本模型訓(xùn)練中將數(shù)據(jù)進行歸一化處理,將數(shù)據(jù)映射到[-1,1]之間。公式如下:
(2)
其中:x*為歸一化后的數(shù)值;x為原始樣本數(shù)據(jù);xmax和xmin分別為原始樣本數(shù)據(jù)的最大和最小值。
為了評估模型訓(xùn)練和預(yù)測結(jié)果,根據(jù)風(fēng)暴潮增水特性,采用平均絕對誤差、相關(guān)系數(shù)和有效系數(shù)來對模型效果進行評估。
(1)平均絕對誤差MAE。平均絕對誤差代表預(yù)測值和實際值的誤差程度,相對于常用的均方根誤差評價指標,平均絕對誤差能更好地反映預(yù)測值誤差的實際情況。
(3)
(2)相關(guān)系數(shù)CC。用以評估預(yù)測值和實際值之間的相關(guān)程度,數(shù)值越接近1,說明相關(guān)程度越大。
(4)
(3)有效系數(shù)CE。評判預(yù)測模型相對于基準模型的好壞程度。所謂基準模型是指用樣本均值代表預(yù)測值,代表預(yù)測的基本標準。如果模型結(jié)果=1,說明預(yù)測和實際完全吻合。如果等于0,說明預(yù)測模型和基準模型效果相當。如果小于0,說明預(yù)測模型還不如基準模型。
(5)
(4)極值偏差ΔH。一個臺風(fēng)過程期間的實際最大增水和預(yù)測最大增水之間的偏差值。增水極值和災(zāi)害等級密切相關(guān),對增水極值的準確預(yù)測對準確評估災(zāi)害風(fēng)險有重要作用。
ΔH=|ymax-xmax|。
(6)
臺風(fēng)期間觀測的潮位數(shù)據(jù)包括天文潮和臺風(fēng)引起的風(fēng)暴增水。在分析風(fēng)暴潮時,應(yīng)先從實際潮位中去除天文潮部分。將天文潮分離出來的方法包括kalman濾波[33-34]和最小二乘法等[35-36],本文使用了基于最小二乘法開發(fā)的t_tide程序包用于天文潮的計算[37]。
影響風(fēng)暴潮增水的因素眾多,總體分為三類。一類是臺風(fēng)相關(guān)因子,包括臺風(fēng)中心位置、臺風(fēng)中心風(fēng)速、中心最低氣壓、中心最大風(fēng)速、七級風(fēng)半徑(邊緣距測站的距離)、臺風(fēng)中心距測站的距離、臺風(fēng)移動方向、臺風(fēng)相對于測站的方位和中心氣壓等;一類是測站氣象因子,例如測站氣壓、測站風(fēng)速風(fēng)向、測站天文潮位;還有一類是測站當?shù)氐墓潭ㄓ绊懸蜃?,例如測站周邊水深、地形地貌和底摩擦系數(shù)等,這一類因子不在模型的考慮范圍內(nèi),因為訓(xùn)練數(shù)據(jù)本身已經(jīng)包含了此類影響,而這些難以量化的具體參數(shù)也是數(shù)值模式方法難以確定的,這也一定程度上體現(xiàn)了神經(jīng)網(wǎng)絡(luò)的優(yōu)勢。上述因子中,有些因子如風(fēng)和氣壓,會通過大氣擾動直接影響風(fēng)暴潮增水,有些參數(shù)如七級風(fēng)半徑、臺風(fēng)方位和移動路徑也會對臺風(fēng)產(chǎn)生影響[26,38],天文潮位也會因為和風(fēng)暴潮的非線性相互作用而對風(fēng)暴潮產(chǎn)生影響[39]。除此之外,考慮風(fēng)暴潮增水本身趨勢的影響,將增水值也作為輸入加入到預(yù)報模型中。另外,有些因子對增水的影響有重復(fù)性,例如臺風(fēng)位置和臺風(fēng)距測站的距離和角度,為了排除這種干擾,本模型僅采用距離和角度作為臺風(fēng)位置的輸入?yún)?shù)。綜上,模型共考慮中心氣壓(Pc)、最大風(fēng)速(Uc)、臺風(fēng)中心和測站的距離(L)、七級風(fēng)圈和測站的距離(R,當測站位于七級風(fēng)圈內(nèi)此值為負)、臺風(fēng)入侵角度(θc,臺風(fēng)中心和測站之間相對于正北方向的夾角,取值-180~180)、臺風(fēng)移動角度(θm,臺風(fēng)移動方向相對于正北方向的夾角,取值-180~180)、測站氣壓(Pt)、測站風(fēng)速(Ut)、天文潮位(A)和增水值H共10個因子。
確定風(fēng)暴增水影響因子一般采用相關(guān)性分析結(jié)合超前滯后相位分析來確定,但是此種方法有一定局限性,因為相關(guān)性并不能說明存在因果關(guān)系,并且對于兩個時間序列,相關(guān)分析是雙向的,無法準確判定在一個周期變化中,相位差是由滯后還是超前引起的。因此,依靠滯后相關(guān)分析無法準確表征因果關(guān)系。為了能夠表征兩個時間序列的因果關(guān)系,基于如果序列X1的發(fā)展演變獨立于序列X2,那么X2到X1的信息流為0這一信息流與因果律定理,Liang利用Liang-Kleeman信息流理論[40-41],構(gòu)建因果關(guān)系表征系數(shù),刻畫兩個序列間的因果關(guān)系。
對于兩個時間序列X1,X2,序列X2到序列X1的信息流率的最大似然估計為:
(7)
其中:Cij為樣本協(xié)方差;Ci,dj是xi和由xj導(dǎo)出的級數(shù)之間的樣本協(xié)方差,當|T2→1|≠0,表示X2是X1變化的因。在推斷因果關(guān)系時,我們只需關(guān)注信息流傳遞速率的大小的絕對值。
分別使用除了增水自身以外的9個因子和增水進行因果分析,結(jié)果見圖3。信息流速率會隨著序列長短而產(chǎn)生不同,但當序列足夠長時,將會趨于一個穩(wěn)定值。圖3(c)中,T1→2和T2→1都不等于0,說明天文潮和增水呈現(xiàn)互為因果的關(guān)系,除了圖3(i),其它均為T1→2大于0,T2→1基本等于0,說明此8個因子均是增水的因,均能對增水產(chǎn)生影響,反之不成立。
(其中T1→2表示其他因子到風(fēng)暴潮增水的信息流,T2→1則相反。這些因子分別為:(a)臺風(fēng)中心氣壓,(b)臺風(fēng)最大風(fēng)速,(c)測站氣壓,(d)測站風(fēng)速,(e)臺風(fēng)中心與測站距離,(f)臺風(fēng)七級風(fēng)圈距離,(g)臺風(fēng)入侵角度,(h)臺風(fēng)移動角度,(i)天文潮位。 T1→2 represents the information flow from other factors to the storm surge, and T2→1 is the opposite. These factors are: (a) typhoon center pressure; (b) typhoon maximum wind speed; (c) local pressure; (d) local wind speed; (e) distance between typhoon center and Xiamen station; (f) Distance between Xiamen station and force 7 wind circle; (g) typhoon intrusion angle; (h) typhoon moving angle; (i) astronomical tide level.)
為了驗證各臺風(fēng)影響因子對風(fēng)暴潮增水的具體影響,設(shè)計了如下4個模型進行分析。
模型A:僅用t時刻的增水值H(t)來預(yù)測t+1時刻的增水值H(t+1),模型表示如下:
H(t+1)=f(H(t))。
(8)
模型B:僅利用t時刻臺風(fēng)因子來預(yù)測t+1時刻的增水值H(t+1),模型表示如下:
H(t+1)=f(Pc(t),Uc(t),L(t),R(t),θc(t),θm(t))。
(9)
模型C:利用t時刻臺風(fēng)因子和增水值來預(yù)測t+1時刻的增水值H(t+1),模型表示如下:
H(t+1)=f(Pc(t),Uc(t),L(t),R(t),θc(t),θm(t),H(t))。
(10)
模型D:利用t時刻的所有因子,包括臺風(fēng)因子和測站氣象因子、天文潮和增水值來預(yù)測t+1時刻的增水值H(t+1),模型表示如下:
H(t+1)=f(Pc(t),Uc(t),L(t),R(t),θc(t),θm(t),Pt(t),Ut(t),A(t),H(t))。
(11)
利用LSTM模型對模型A~D進行風(fēng)暴潮增水模擬,其中80%的樣本用于訓(xùn)練,20%的樣本用于測試驗證。為了分析不同臺風(fēng)路徑引起的增水的模擬效果,選取了3個臺風(fēng)期間的增水作為驗證,分別為2018年8號臺風(fēng)“瑪莉亞”,2015年21號臺風(fēng)“杜鵑”和2016年14號臺風(fēng)“莫蘭蒂”。此三臺風(fēng)分別從臺灣海峽以北、臺灣海峽中部和臺灣海峽以南經(jīng)過,并對廈門市造成了巨大影響,臺風(fēng)“杜鵑”甚至造成了廈門歷史上第二高潮位。這也分別代表了三種不同的影響廈門的臺風(fēng)路徑,即北部、中部和南部路徑。為了表述方便,下文分別以臺風(fēng)N,M和S代表臺風(fēng)“瑪利亞”、“杜鵑”和“莫蘭蒂”。三種臺風(fēng)路徑引起的風(fēng)暴潮增水的變化各不相同,總體來說,北部路徑雖距離廈門較遠,但是由于臺灣海峽引起的狹管效應(yīng)會導(dǎo)致海水不斷堆積引起海峽內(nèi)高水位,海峽西岸會在臺風(fēng)登陸前較長時間內(nèi)產(chǎn)生持續(xù)較強和波動較大的風(fēng)暴潮增水;中部路徑往往會引起廈門沿海的風(fēng)暴潮增水產(chǎn)生較規(guī)律的雙增水峰或多增水峰的現(xiàn)象;南部路徑的臺風(fēng)在行進過程中,廈門沿海都處于其右半旋向岸大風(fēng)區(qū)內(nèi),增水增長較為迅速,并在登陸前幾個小時達到極值。臺風(fēng)登陸后廈門沿海處于左半旋離岸風(fēng)區(qū)內(nèi),增水迅速減小[42]。模型A~D表現(xiàn)見圖4~6及表1。
圖4 臺風(fēng)N期間不同影響因子模擬風(fēng)暴潮增水與實測對比
圖5 臺風(fēng)M期間不同影響因子模擬風(fēng)暴潮增水與實測對比
圖6 臺風(fēng)S期間不同影響因子模擬風(fēng)暴潮增水與實測對比
表1 不同影響因子下平均絕對誤差、相關(guān)系數(shù)、有效系數(shù)和極值誤差分析表
由圖4~6可知,LSTM的四種模型均能較好模擬出風(fēng)暴潮增水的變化曲線。對三種路徑臺風(fēng)的增水曲線均貼合較好,能預(yù)測出增水的不同階段和極值發(fā)生時間。對于臺風(fēng)M,增水變化最為復(fù)雜,期間高低極值交叉反復(fù)出現(xiàn),最大值出現(xiàn)在第25小時;對于臺風(fēng)S,增水值呈現(xiàn)逐漸變大的趨勢,并且在登陸前達到極值;臺風(fēng)N期間的增水分成兩個階段,增水極值分別出現(xiàn)在前期和后期,LSTM模型能較好預(yù)測出這種趨勢。
由表1可知,模型A和B的平均絕對誤差在7 cm左右,模型D最小,為4.35 cm;模型A和B的相關(guān)系數(shù)和有效系數(shù)大體一致,均小于模型C和D;模型D的極值偏差最小。模型A僅考慮增水值,模型B僅考慮臺風(fēng)因素,模型C考慮了臺風(fēng)和增水,說明臺風(fēng)和增水均能對預(yù)測精度產(chǎn)生影響,綜合考慮二者能提高預(yù)測精度,模型D在模型C的基礎(chǔ)上考慮了當?shù)貧庀笠蜃?,精度比模型C更高,說明臺風(fēng)因子、當?shù)貧庀笠蜃右约俺蔽槐旧矶寄軐υ鏊a(chǎn)生影響,將這些因子納入模型可以增加預(yù)測精度和準確率。
為了進一步說明LSTM模型在風(fēng)暴潮模擬上的表現(xiàn),我們將LSTM和常用的BP神經(jīng)網(wǎng)絡(luò)模型、SVM模型和線性回歸模型做同步對比,方案同模型D,即利用t時刻10種輸入要素模擬t+1時刻增水值,其中SVM模型為支持向量機模型,線性回歸模型是利用回歸方法來確定兩種或兩種以上變量間相互依賴關(guān)系。模型對比結(jié)果見圖7~9及表2。
圖7 臺風(fēng)N期間不同模型模擬風(fēng)暴潮增水與實測對比
圖8 臺風(fēng)M期間不同模型模擬風(fēng)暴潮增水與實測對比
圖9 臺風(fēng)S期間不同模型模擬風(fēng)暴潮增水與實測對比
表2 不同模型平均絕對誤差、相關(guān)系數(shù)、有效系數(shù)和極值誤差分析表
由圖7~9可以看出,SVM模型表現(xiàn)很差,基本無法模擬出增水趨勢,BP神經(jīng)網(wǎng)絡(luò)、線性回歸模型均能模擬出增水曲線的變化。由表2可知,BP神經(jīng)網(wǎng)絡(luò)模型和線性回歸模型表現(xiàn)大體一致,這兩個模型的平均MAE值在6 cm左右。相關(guān)系數(shù)CC值在0.9左右,有效系數(shù)CE在0.6左右,ΔH在9 cm左右。這兩個模型指標均低于LSTM模型。說明LSTM模型在風(fēng)暴潮增水預(yù)測精度和準確性上要優(yōu)于一般常用的機器學(xué)習(xí)模型。
另外,張莉等[43]利用耦合數(shù)值模型對福建沿岸風(fēng)暴潮進行后報模擬,5個站位平均絕對誤差在20 cm以上,平均最大極值誤差為20 cm,LSTM模型在這兩個指標上的表現(xiàn)均優(yōu)于傳統(tǒng)數(shù)值模型。
以上試驗僅使用一個時刻要素值預(yù)測后一個時刻,為了驗證前一個時刻的要素值是否對模型有影響,設(shè)計如下模型E:
H(t+1)=f(Pc(t-1),Uc(t-1),L(t-1),
R(t-1),θc(t-1),θm(t-1),Pt(t-1),Ut(t-1),
A(t-1),H(t-1),Pc(t),Uc(t),L(t),R(t),θc(t),
θm(t),Pt(t),Ut(t),A(t),H(t))。
(12)
即利用t-1時刻和t時刻要素值來預(yù)測t+1時刻增水值,結(jié)果見圖10~12和表3。
圖10 臺風(fēng)N期間模型D和E模擬風(fēng)暴潮增水與實測對比
圖11 臺風(fēng)M期間模型D和E模擬風(fēng)暴潮增水與實測對比
圖12 臺風(fēng)S期間模型D和E模擬風(fēng)暴潮增水與實測對比
由圖10~12和表3可以看出,模型E同樣能較好模擬風(fēng)暴潮增水曲線變化,并且相對于模型D,模型E能更貼近實測曲線。各項指標也比模型D更優(yōu),平均絕對誤差MAE的平均值僅有3 cm,極值偏差為5.4 cm,相關(guān)系數(shù)和有效系數(shù)也優(yōu)于模型D。
表3 模型E平均絕對誤差、相關(guān)系數(shù)、有效系數(shù)和極值誤差分析表
為了進一步說明模型訓(xùn)練情況,圖13給出了模型E的訓(xùn)練過程中的模型損失情況。由圖可知,訓(xùn)練集和測試集的損失值隨訓(xùn)練次數(shù)迅速收斂并趨于穩(wěn)定,說明模型學(xué)習(xí)情況良好,模型適應(yīng)性強,未出現(xiàn)過擬合等問題。具體而言,損失值訓(xùn)練次數(shù)在25次以內(nèi)迅速下降,25~100次趨于平緩下降,100次以上基本穩(wěn)定,損失值不再變化。表4給出了三個臺風(fēng)平均MAE隨訓(xùn)練次數(shù)變化情況。由表4可知,模型誤差和模型損失曲線表現(xiàn)一致,在訓(xùn)練次數(shù)100次左右誤差基本穩(wěn)定。
圖13 模型訓(xùn)練損失變化
表4 模型E的平均絕對誤差隨訓(xùn)練次數(shù)變化
為展示LSTM在模擬較長時刻的風(fēng)暴潮增水效果,分別預(yù)測t+1,t+2,t+3和t+6時刻的增水值,模型使用模型E。t+2時刻增水值的預(yù)測方式是先預(yù)測出t+1時刻增水值,利用此增水值作為輸入預(yù)測t+2時刻增水值,依次類推得到t+3和t+6時刻增水值。模擬結(jié)果見圖14~16及表5。
圖14 臺風(fēng)N期間不同時長模擬風(fēng)暴潮增水與實測對比
圖15 臺風(fēng)M期間不同時長模擬風(fēng)暴潮增水與實測對比
圖16 臺風(fēng)S期間不同時長模擬風(fēng)暴潮增水與實測對比
由圖14~16可以看出,隨著預(yù)測時長的增加,預(yù)測精度開始下降,t+3和t+6時刻出現(xiàn)了滯后現(xiàn)象,并且增水值也出現(xiàn)了較大偏差。由表5可知,平均絕對誤差由t+1時刻的3 cm增加到t+6時刻的11 cm,極值偏差由5 cm增加至15 cm,相關(guān)系數(shù)和有效系數(shù)也隨之下降??傮w而言,t+1和t+2時刻的預(yù)報結(jié)果表現(xiàn)出較高的準確率和相關(guān)度,t+3和t+6時刻的預(yù)報結(jié)果精度雖然有所下降,但是仍有較高精度,最低的臺風(fēng)N的相關(guān)系數(shù)也有0.6左右,具有較強的相關(guān)性,可描述出風(fēng)暴潮增水的變化趨勢。就三種臺風(fēng)路徑而言,t+1和t+2時刻的臺風(fēng)M期間平均絕對誤差最小,預(yù)測精度最高,t+3和t+6時刻的臺風(fēng)N期間的平均誤差最小。
表5 不同預(yù)報時長平均絕對誤差、相關(guān)系數(shù)、有效系數(shù)和極值誤差分析表
風(fēng)暴潮是一種由臺風(fēng)引起的海水水位變化,它受臺風(fēng)、當?shù)貧庀髼l件和海岸地形的影響。本文根據(jù)信息流理論,選取影響風(fēng)暴潮增水的10個因子并分析了與增水的因果關(guān)系,基于分析結(jié)果,利用長短期記憶神經(jīng)網(wǎng)絡(luò)建立廈門沿海風(fēng)暴潮增水預(yù)報模型,探討了在3種不同路徑下的各模型表現(xiàn)好壞,并和其它常用機器學(xué)習(xí)模型進行對比,結(jié)論如下。
(1)根據(jù)不同影響因子組合建立了預(yù)報模型,發(fā)現(xiàn)臺風(fēng)因子、當?shù)貧庀笠蜃雍惋L(fēng)暴潮增水都能對增水產(chǎn)生影響,將所有10個因子納入模型可以增加預(yù)測精度和準確率。
(2)將LSTM模型和常用的BP神經(jīng)網(wǎng)絡(luò)模型、SVM模型和線性回歸模型做同步對比,預(yù)報因子選用10個因子,發(fā)現(xiàn)SVM模型表現(xiàn)最差,BP神經(jīng)網(wǎng)絡(luò)模型和線性回歸模型基本一致,LSTM模型表現(xiàn)最優(yōu)。
(3)同時使用t-1和t時刻影響因子來預(yù)報t+1時刻增水值的表現(xiàn)優(yōu)于僅使用t時刻因子進行預(yù)報。利用t-1和t時刻影響因子繼續(xù)預(yù)報了t+2、t+3和t+6時刻的增水值,發(fā)現(xiàn)隨著預(yù)測時長的增加,預(yù)測精度開始下降。t+1和t+2時刻的預(yù)報結(jié)果表現(xiàn)出較高的準確率和相關(guān)度,t+3和t+6時刻的預(yù)報結(jié)果精度雖然有所下降,但是仍有較高精度。
(4)預(yù)報精度和臺風(fēng)路徑類型有關(guān),t+1和t+2時刻的臺風(fēng)M期間預(yù)報值平均絕對誤差最小,預(yù)測精度最高,t+3和t+6時刻的臺風(fēng)N期間預(yù)報值平均誤差最小。
綜上所述,本模型相對于一般機器學(xué)習(xí)預(yù)報模型能更好地預(yù)報臺風(fēng)引起的風(fēng)暴潮增水變化,不論增水值還是增水時間都具有較高精度,并且本模型訓(xùn)練簡單,收斂速度快,具有較高的可行性,可為風(fēng)暴潮業(yè)務(wù)化預(yù)報提供輔助和參考。