林琪凡,耿旭樸,謝 婷,胡利平
(1.北京大學(xué)物理學(xué)院,北京 100871;2.廈門大學(xué)海洋與地球?qū)W院,近海海洋環(huán)境科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,福建 廈門 361102;3.北京環(huán)境特性研究所電磁散射重點(diǎn)實(shí)驗(yàn)室,北京 100854)
暖池在印度洋、太平洋和大西洋均有分布,在西太平洋的部分稱為西太平洋暖池,用以區(qū)分東印度洋暖池和西半球暖池[1].由于研究問題的差異以及所用海表溫度(sea surface temperature,SST)數(shù)據(jù)的全球分布情況,西太平洋暖池的劃定有所不同.基于1981—2018年各年的全球年平均SST分布,本研究選取28 ℃等溫線作為暖池邊界,如圖1所示,黑線內(nèi)的西太平洋海域即為本研究區(qū)域.
黑色實(shí)線表示28 ℃等溫線.
西太平洋暖池廣闊的海域面積、突出的SST、豐富的熱含量[2],使這里的海氣相互作用在氣候系統(tǒng)中具備更顯著的影響力.一直以來,科學(xué)界都將西太平洋暖池與厄爾尼諾-南方濤動(dòng)(El Nio-Southern Oscillation,ENSO)事件緊密聯(lián)系在一起[3-6].西太平洋暖池作為ENSO事件的重要組成部分[3],兩者之間的關(guān)系一直是科學(xué)研究的熱點(diǎn)問題.厄爾尼諾是每隔3~7年發(fā)生在赤道中、東太平洋的大規(guī)模表層海水持續(xù)(6個(gè)月以上)異常偏暖現(xiàn)象;反之,持續(xù)異常偏冷的現(xiàn)象稱為拉尼娜(La Nia)[7].厄爾尼諾作為ENSO事件的暖現(xiàn)象,是全球氣候波動(dòng)的突出貢獻(xiàn)者,對(duì)世界生態(tài)系統(tǒng)的穩(wěn)定和人類社會(huì)的發(fā)展有著重要影響.根據(jù)Philander[8]的統(tǒng)計(jì)與分析,20世紀(jì)80年代以來,平均每隔4年發(fā)生一次厄爾尼諾,每隔10年發(fā)生一次強(qiáng)厄爾尼諾.厄爾尼諾增加了極端天氣事件發(fā)生頻率,可能給各地帶來干旱和洪澇等災(zāi)害,影響東太平洋沿岸漁業(yè),造成重大的人員和財(cái)產(chǎn)損失.因此,對(duì)ENSO事件、厄爾尼諾現(xiàn)象的預(yù)警尤為重要.然而,由于缺失對(duì)氣候擾動(dòng)源頭的了解,準(zhǔn)確預(yù)測(cè)ENSO事件的發(fā)生存在一定困難[4].
從20世紀(jì)80年代至今,研究者對(duì)暖池的定義、特征、多尺度變異進(jìn)行了深入探索.Philander[8]首次提出西太平洋暖池質(zhì)心的概念,用于研究西太平洋暖池中的海氣相互作用,發(fā)現(xiàn)了暖池質(zhì)心東向移動(dòng)與厄爾尼諾現(xiàn)象的關(guān)系.Yan等[2]和Ho等[9]使用衛(wèi)星觀測(cè)到的SST數(shù)據(jù)追蹤1982—1991年各年西太平洋暖池溫度和大小的變化情況,建立暖池面積、體積、質(zhì)心、東邊界等參數(shù),得出西太平洋暖池水平尺度遠(yuǎn)大于垂直尺度的結(jié)論.Kidwell等[5]使用集成經(jīng)驗(yàn)?zāi)J椒纸夥?EEMD)和Hilbert-Huang譜分析方法,發(fā)現(xiàn)西太平洋暖池的面積和形心具備從季節(jié)到年代際等多個(gè)時(shí)間尺度的變異特征,探究了不同類型厄爾尼諾現(xiàn)象與暖池長(zhǎng)期變化趨勢(shì)的關(guān)系.Ho等[9]和Yan等[4]計(jì)算并分析了暖池形心的運(yùn)動(dòng),探究海洋、大氣與厄爾尼諾現(xiàn)象之間的關(guān)系.方立新等[10]在此基礎(chǔ)上進(jìn)行改進(jìn),引入暖池質(zhì)心的概念.Kidwell等[6]進(jìn)一步發(fā)現(xiàn)了西太平洋暖池的三維形心、熱含量和體積在年代際尺度上與ENSO事件的相關(guān)關(guān)系.但目前關(guān)于暖池?cái)?shù)值模擬的研究進(jìn)展緩慢.胡石建[11]認(rèn)為目前的海氣耦合數(shù)值模式不能很好地模擬西太平洋暖池,原因在于對(duì)西太平洋暖池形成和維持機(jī)制的認(rèn)識(shí)不充分.對(duì)西太平洋暖池基本動(dòng)力學(xué)方面知識(shí)的缺失,使得利用數(shù)值模擬對(duì)西太平洋暖池未來的變化情況進(jìn)行預(yù)測(cè)存在一定困難.
常用的海洋數(shù)據(jù)預(yù)測(cè)方法主要分為兩類:一類是基于物理學(xué)原理的數(shù)值模型,另一類是基于數(shù)據(jù)的數(shù)據(jù)驅(qū)動(dòng)模型[12].數(shù)值模型使用一系列微分方程描述海洋中的各類水文現(xiàn)象,需要具備對(duì)特定海域、特定水文現(xiàn)象產(chǎn)生和維持機(jī)制的深刻理解,一般計(jì)算復(fù)雜且難度較高;而以深度神經(jīng)網(wǎng)絡(luò)為代表的數(shù)據(jù)驅(qū)動(dòng)模型可以從大批量原始數(shù)據(jù)中學(xué)習(xí)特征,對(duì)未來進(jìn)行預(yù)測(cè),擺脫了物理機(jī)制的限制,彌補(bǔ)了部分海洋領(lǐng)域數(shù)據(jù)缺失和理論薄弱的不足[13].在傳統(tǒng)海洋數(shù)據(jù)數(shù)量多、變化復(fù)雜、特征不突出的背景下,深度學(xué)習(xí)在海洋數(shù)據(jù)重構(gòu)、海洋圖像分類識(shí)別、海洋時(shí)間序列數(shù)據(jù)預(yù)測(cè)等方面表現(xiàn)良好[14].在深度學(xué)習(xí)領(lǐng)域,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)和長(zhǎng)短期記憶(long short-term memory,LSTM)神經(jīng)網(wǎng)絡(luò)可以滿足時(shí)間序列數(shù)據(jù)的預(yù)測(cè)需求.RNN通過建立層內(nèi)信息循環(huán)和無效數(shù)據(jù)遺忘的功能,實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)的記憶,但RNN在實(shí)際使用中存在長(zhǎng)期依賴問題,在長(zhǎng)序列訓(xùn)練中存在梯度消失或梯度爆炸的問題,因此只具有短期記憶.LSTM神經(jīng)網(wǎng)絡(luò)是特殊的RNN,通過改進(jìn)算法一定程度解決了這種長(zhǎng)期依賴問題,因此對(duì)于長(zhǎng)時(shí)間序列事件的處理和預(yù)測(cè)達(dá)到更好的效果.
本文基于LSTM神經(jīng)網(wǎng)絡(luò),利用日平均SST數(shù)據(jù)對(duì)西太平洋暖池面積、暖池強(qiáng)度、暖池質(zhì)心經(jīng)度和暖池質(zhì)心緯度4個(gè)暖池指數(shù)的時(shí)間序列進(jìn)行訓(xùn)練、測(cè)試和預(yù)測(cè),并在此基礎(chǔ)上探究暖池指數(shù)多尺度變異特征與ENSO事件之間的關(guān)系,進(jìn)而對(duì)未來10年(2019—2028年)ENSO事件的發(fā)生進(jìn)行判斷.
美國(guó)國(guó)家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)、海洋與大氣研究室(Oceanic and Atmospheric Research,OAR)、地球系統(tǒng)研究所(Earth System Research Laboratory,ESRL)、物理科學(xué)部(Physical Sciences Division,PSD)提供的高分辨率每日平均最優(yōu)插值SST(high-resolution daily optimum interpolation SST)數(shù)據(jù)和多變量ENSO指數(shù)(multivariate ENSO index,MEI).
SST數(shù)據(jù)的時(shí)間跨度從1981年9月1日—2018年12月31日,共38 a(13 627 d).數(shù)據(jù)覆蓋全球海洋(89.875° S~89.875° N,0.125° E~359.875° E),經(jīng)緯度網(wǎng)格大小為0.25°×0.25°,總計(jì)1 440×720個(gè)格點(diǎn).
ENSO事件產(chǎn)生于大氣、海洋及多種氣候系統(tǒng)的相互作用,成因多樣且復(fù)雜.MEI充分考慮大氣和海洋的雙重影響,結(jié)合多種參數(shù)進(jìn)行分析,被視為監(jiān)測(cè)和反映ENSO事件最全面的指數(shù)[15].
LSTM多用于處理和預(yù)測(cè)時(shí)間序列中間隔和延遲相對(duì)較長(zhǎng)的重要事件.當(dāng)數(shù)據(jù)輸入LSTM神經(jīng)網(wǎng)絡(luò)中,根據(jù)一定規(guī)則判斷信息是否有用,有用信息留下,無用信息則通過遺忘門丟棄.通過這種方法,LSTM神經(jīng)網(wǎng)絡(luò)一定程度上解決了RNN存在的長(zhǎng)期依賴問題.
1.2.1 數(shù)據(jù)預(yù)處理
本文對(duì)SST數(shù)據(jù)首先進(jìn)行月平均.在實(shí)際問題中,需要對(duì)模型輸入具備多個(gè)特征的樣本數(shù)據(jù),但這些特征的量級(jí)和量綱可能不一致.通過Z-score標(biāo)準(zhǔn)化處理,可以使不同特征具有相同的尺度,保證不同特征對(duì)參數(shù)的影響程度一致.數(shù)據(jù)標(biāo)準(zhǔn)化的表達(dá)式為:
(1)
其中,μ為序列的平均值,σ為序列的標(biāo)準(zhǔn)差.除此之外,LSTM對(duì)輸入數(shù)據(jù)的規(guī)模(范圍)很敏感,特別是在使用激活函數(shù)sigmoid和tanh時(shí).對(duì)未進(jìn)行標(biāo)準(zhǔn)化的原始數(shù)據(jù)進(jìn)行試驗(yàn)后發(fā)現(xiàn)程序運(yùn)行速度非常緩慢,在某些數(shù)值較大、變化范圍較大的變量訓(xùn)練時(shí)(例如暖池面積),甚至出現(xiàn)無法成功運(yùn)行的情況.因此,對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理也能夠加快神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和權(quán)重參數(shù)的收斂,否則可能阻止神經(jīng)網(wǎng)絡(luò)有效學(xué)習(xí).
此外,還需要將數(shù)據(jù)變?yōu)镻ytorch框架中LSTM模型可接受的形式.輸入數(shù)據(jù)的格式必須為3維的張量:第一維是序列(sequence)長(zhǎng)度,代表用于預(yù)測(cè)的時(shí)間長(zhǎng)度,本研究設(shè)置為50,即使用第1~50個(gè)月的數(shù)據(jù)預(yù)測(cè)第51個(gè)月;第二維是批次(batch)大小,代表每次進(jìn)入模型的數(shù)據(jù)大小,本研究采用的是批量梯度下降法,每一次迭代時(shí)使用所有樣本來進(jìn)行梯度的更新,因此批次大小為樣本集的大小;第三維是輸入數(shù)據(jù)的特征數(shù)量,本研究設(shè)置為1,即一次只進(jìn)行一種指數(shù)的訓(xùn)練和預(yù)測(cè).
1.2.2 訓(xùn)練、測(cè)試與預(yù)測(cè)
整個(gè)數(shù)據(jù)集需要?jiǎng)澐譃橛?xùn)練集(training set)和測(cè)試集(test set),在數(shù)據(jù)量有限并保證測(cè)試數(shù)據(jù)足夠的基礎(chǔ)上,為了最大化訓(xùn)練數(shù)據(jù)的數(shù)量,劃分比例為8∶2,即時(shí)間長(zhǎng)度上前80%的數(shù)據(jù)用于訓(xùn)練,后20%用于測(cè)試.訓(xùn)練集和測(cè)試集中都包含用于預(yù)測(cè)的輸入數(shù)據(jù)和預(yù)期得到的實(shí)際數(shù)據(jù).在訓(xùn)練時(shí),這兩部分?jǐn)?shù)據(jù)都放入模型;而在測(cè)試時(shí),只將用于預(yù)測(cè)的輸入數(shù)據(jù)放入模型.
訓(xùn)練集用于訓(xùn)練模型、確定模型參數(shù)[16].將訓(xùn)練集輸入一個(gè)初始化模型,按照前向傳輸?shù)姆绞竭M(jìn)行前饋運(yùn)算,然后計(jì)算模型輸出的預(yù)測(cè)值和實(shí)際值之間的均方根誤差(RMSE),將誤差在模型中通過反向傳輸?shù)姆绞竭M(jìn)行反饋運(yùn)算,對(duì)每個(gè)節(jié)點(diǎn)之間的權(quán)重進(jìn)行修改,使下一次訓(xùn)練得到更好的結(jié)果.訓(xùn)練以權(quán)重為任意值開始,訓(xùn)練的目的在于不斷調(diào)整權(quán)重,在學(xué)習(xí)完訓(xùn)練樣本后使誤差盡可能小,即神經(jīng)網(wǎng)絡(luò)模型通過訓(xùn)練而“學(xué)習(xí)”到的內(nèi)容蘊(yùn)含在“權(quán)重”這一參數(shù)中.通過訓(xùn)練得出最優(yōu)模型后,需要使用測(cè)試集對(duì)模型進(jìn)行檢驗(yàn),衡量模型的泛化能力[16].在測(cè)試時(shí),向模型輸入的數(shù)據(jù)僅包含用于預(yù)測(cè)的輸入數(shù)據(jù),人為比較模型的預(yù)測(cè)值和測(cè)試集中的實(shí)際數(shù)據(jù),以判斷模型對(duì)新鮮樣本的預(yù)測(cè)能力.
為了判斷模型是否存在超前預(yù)測(cè)的能力,對(duì)該模型輸入測(cè)試集進(jìn)行預(yù)測(cè).與測(cè)試不同的是,這一步得到的每一個(gè)預(yù)測(cè)值的輸入序列都是真實(shí)值和先前預(yù)測(cè)值的組合.例如,使用第1~50個(gè)數(shù)據(jù)預(yù)測(cè)第51個(gè)數(shù)據(jù)后,使用2~51個(gè)數(shù)據(jù)預(yù)測(cè)第52個(gè)數(shù)據(jù)時(shí),加入預(yù)測(cè)得到的第51個(gè)數(shù)據(jù).一般情況下,預(yù)測(cè)的準(zhǔn)確度會(huì)隨著預(yù)測(cè)的進(jìn)行不斷下降.最后,使用已知的時(shí)間序列對(duì)未來數(shù)據(jù)進(jìn)行預(yù)測(cè).最優(yōu)模型構(gòu)建流程見圖2.
圖2 LSTM神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測(cè)流程圖
在LSTM神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練前,需要定義3個(gè)超參數(shù):序列長(zhǎng)度、學(xué)習(xí)率(learning rate)和迭代次數(shù)(epochs).序列長(zhǎng)度代表用于預(yù)測(cè)的時(shí)間長(zhǎng)度,本研究中4個(gè)指數(shù)預(yù)測(cè)的序列長(zhǎng)度均設(shè)置為50.學(xué)習(xí)率表示每次梯度下降的步長(zhǎng),本研究既設(shè)置學(xué)習(xí)率隨迭代次數(shù)的增加而減緩,也設(shè)置固定學(xué)習(xí)率進(jìn)行訓(xùn)練.迭代次數(shù)表示整個(gè)訓(xùn)練過程的工作次數(shù),一次迭代將會(huì)使用所有數(shù)據(jù)、所有批次進(jìn)行前向和反向傳播計(jì)算來更新模型參數(shù),本研究設(shè)置的迭代次數(shù)均在104以上.
1.2.3 暖池指數(shù)的建立
本研究建立暖池面積、暖池強(qiáng)度、暖池質(zhì)心經(jīng)度和暖池質(zhì)心緯度4個(gè)指數(shù)來表征暖池的時(shí)空變化.
在西太平洋(經(jīng)度范圍為120° E~120° W),暖池面積通過暖池內(nèi)(28 ℃等溫線內(nèi))0.25°×0.25°網(wǎng)格數(shù)量乘以網(wǎng)格對(duì)應(yīng)面積得到.參考國(guó)家氣候中心監(jiān)測(cè)業(yè)務(wù)關(guān)于暖池強(qiáng)度的定義[17],暖池強(qiáng)度表達(dá)式為:
SST_Sum=∑i(SSTi-28 ℃)(SSTi≥
28 ℃),
(2)
其中,SSTi為暖池內(nèi)各格點(diǎn)的SST.將累加得到的時(shí)間序列經(jīng)過Z-Score標(biāo)準(zhǔn)化,得到暖池強(qiáng)度.
暖池質(zhì)心反映暖池的位置及其變化情況.參考非均質(zhì)物體的質(zhì)心公式[10],在計(jì)算暖池質(zhì)心時(shí)考慮SST差異的影響,引入溫度權(quán)重w,表達(dá)式為:
(3)
其中,SSTmin=28 ℃,SSTmax為每日暖池內(nèi)SST的最大值.暖池質(zhì)心經(jīng)、緯度的計(jì)算公式分別為:
(4)
其中,xi、yi分別為暖池各格點(diǎn)的經(jīng)、緯度.
通過對(duì)暖池面積、暖池強(qiáng)度、暖池質(zhì)心經(jīng)度和暖池質(zhì)心緯度4個(gè)模型進(jìn)行訓(xùn)練和測(cè)試,找到最適的超參數(shù),使模型在訓(xùn)練損失、測(cè)試損失和預(yù)測(cè)結(jié)果中均表現(xiàn)良好,成功構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)最優(yōu)模型.各暖池模型的超參數(shù)設(shè)定如表1所示,預(yù)測(cè)序列長(zhǎng)度均為50,除暖池強(qiáng)度學(xué)習(xí)率固定外,其他3個(gè)模型均采用學(xué)習(xí)率隨迭代次數(shù)增加不斷下降的方法,迭代次數(shù)均設(shè)定在104以上.下面以暖池質(zhì)心緯度、經(jīng)度模型的訓(xùn)練和測(cè)試結(jié)果為例,展示LSTM神經(jīng)網(wǎng)絡(luò)模型的合理性和適用性.
表1 各暖池模型的超參數(shù)設(shè)定
圖3(a)和(b)分別表示暖池質(zhì)心緯度和經(jīng)度模型在特定超參數(shù)下訓(xùn)練的結(jié)果,圖中實(shí)線表示實(shí)際值,虛線表示預(yù)測(cè)值,實(shí)際值與預(yù)測(cè)值基本吻合,說明通過訓(xùn)練模型能夠很好地學(xué)習(xí)輸入數(shù)據(jù).
圖3(c)和(d)為訓(xùn)練過程中使用標(biāo)準(zhǔn)化數(shù)據(jù)計(jì)算得到的RMSE.可以看出隨著迭代次數(shù)的增加,RMSE不斷減小,達(dá)到0.2以下;在迭代次數(shù)達(dá)到8 000次后能夠很好地收斂,得到穩(wěn)定的訓(xùn)練結(jié)果.最終暖池質(zhì)心緯度和經(jīng)度模型訓(xùn)練的RMSE分別為0.15和0.11.
圖3(e)和(f)是對(duì)模型進(jìn)行測(cè)試的結(jié)果.暖池質(zhì)心緯度和經(jīng)度模型測(cè)試的RMSE分別為0.55和0.89,反標(biāo)準(zhǔn)化后計(jì)算得到的RMSE分別為3.25和6.50.與訓(xùn)練的RMSE相比,測(cè)試的RMSE更大,說明模型的預(yù)測(cè)結(jié)果不能完全和實(shí)際值相吻合;但在測(cè)試時(shí),預(yù)測(cè)值在趨勢(shì)上與實(shí)際值基本吻合,說明模型的預(yù)測(cè)結(jié)果有一定的準(zhǔn)確度.
圖3(g)和(h)是對(duì)模型輸入測(cè)試集進(jìn)行預(yù)測(cè)的結(jié)果.暖池質(zhì)心緯度和經(jīng)度模型測(cè)試的RMSE分別為0.84和0.98,反標(biāo)準(zhǔn)化后計(jì)算得到的RMSE分別為5.00和7.19,稍大于測(cè)試結(jié)果,但預(yù)測(cè)結(jié)果與實(shí)際值變化趨勢(shì)基本吻合,說明模型在一定程度上存在80個(gè)月超前預(yù)測(cè)的能力.基于模型在測(cè)試集的預(yù)測(cè)結(jié)果(80個(gè)月)中表現(xiàn)良好,進(jìn)而利用LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)暖池進(jìn)行10年(120個(gè)月)的預(yù)測(cè),認(rèn)為其具有一定的合理性.
(a)、(c)、(e)和(g)為暖池質(zhì)心緯度模型,(b)、(d)、(f)和(h)為暖池質(zhì)心經(jīng)度模型.
基于最優(yōu)暖池面積模型,對(duì)未來10年暖池面積的變化進(jìn)行預(yù)測(cè).圖4中藍(lán)線是1981—2018年暖池面積的變化情況,紅線是未來10年(2019—2028年)暖池面積的預(yù)測(cè)結(jié)果.由圖4(a)和(b)可以看出預(yù)測(cè)結(jié)果震蕩頻率過快,許多年份出現(xiàn)4個(gè)峰值,不符合暖池面積的實(shí)際變化情況[10].對(duì)其進(jìn)行6個(gè)月低通濾波除去這一信號(hào)后,預(yù)測(cè)結(jié)果如圖4(c)和(d),未來10年暖池面積將在2.3×107~3.6×107km2范圍內(nèi)變化,但模型沒有學(xué)習(xí)到暖池面積不斷增長(zhǎng)的長(zhǎng)期趨勢(shì).
圖4 1981—2028年暖池面積變化(a)、未來10年(2019—2028年)暖池面積預(yù)測(cè)(b),及6個(gè)月低通濾波后1981—2028年暖池面積變化(c)和未來10年暖池面積預(yù)測(cè)(d)
為了探究暖池與ENSO事件之間的關(guān)系,將各暖池指數(shù)的原始數(shù)據(jù)減去多年平均季節(jié)變化(即年循環(huán)),得到暖池指數(shù)的距平值,再將距平值通過巴特沃斯濾波器進(jìn)行365 d低通濾波,得到各暖池指數(shù)的低頻變化,由此排除季節(jié)內(nèi)變化和季節(jié)變化的影響.通過計(jì)算暖池面積的低頻變化與MEI之間的相關(guān)系數(shù),得到暖池面積與ENSO事件的相關(guān)性.暖池面積的低頻變化和MEI之間的相關(guān)系數(shù)為0.38,p<0.05,在95%置信度下認(rèn)為暖池面積和ENSO事件存在相關(guān)性.相關(guān)系數(shù)為正值但并不接近1,表明具備較弱的正相關(guān)關(guān)系.Kidwell等[5]曾經(jīng)發(fā)現(xiàn),在1982—2011年的30年間,暖池面積增加了18%,具備不斷增長(zhǎng)的長(zhǎng)期趨勢(shì).因此,將暖池面積通過1 700 d高通濾波除去長(zhǎng)期變化趨勢(shì)的影響后,計(jì)算得到的相關(guān)系數(shù)為0.74,p<0.05,表明暖池面積在除去長(zhǎng)期趨勢(shì)的影響后與ENSO事件存在更顯著的正相關(guān)關(guān)系.圖5(a)中灰柱表示MEI,正值對(duì)應(yīng)于厄爾尼諾現(xiàn)象,負(fù)值對(duì)應(yīng)于拉尼娜現(xiàn)象,藍(lán)線為1981—2018年除去長(zhǎng)期趨勢(shì)的暖池面積低頻變化,紅線為其預(yù)測(cè)結(jié)果.2019年初,暖池面積達(dá)到極小值,之后不斷增長(zhǎng),在2019年冬季達(dá)到極大值,此次增長(zhǎng)持續(xù)時(shí)間長(zhǎng).根據(jù)暖池面積與ENSO事件之間的正相關(guān)關(guān)系,模型預(yù)測(cè)結(jié)果表明2019年冬季會(huì)出現(xiàn)厄爾尼諾現(xiàn)象并持續(xù)到2020年底.如圖5(b)所示:在2023年冬季和2027年冬季,暖池面積出現(xiàn)較明顯的極大值,可能出現(xiàn)一次較弱的厄爾尼諾現(xiàn)象;在2021年初、2024年和2028年,暖池面積出現(xiàn)極小值,可能出現(xiàn)拉尼娜現(xiàn)象.根據(jù)暖池面積的低頻變化對(duì)未來10年ENSO事件的發(fā)生進(jìn)行預(yù)測(cè)的結(jié)果符合過去“厄爾尼諾平均每隔4年發(fā)生一次,每隔10年發(fā)生一次強(qiáng)厄爾尼諾”的結(jié)論[8].
圖5 1981—2028年暖池面積的MEI與低頻變化(無長(zhǎng)期趨勢(shì))(a),以及未來10年暖池面積的低頻變化預(yù)測(cè)(無長(zhǎng)期趨勢(shì))(b)
暖池強(qiáng)度模型對(duì)未來10年暖池強(qiáng)度的預(yù)測(cè)結(jié)果表明,未來10年暖池強(qiáng)度將在-1.5~1.0范圍內(nèi)變化,與暖池面積模型類似,暖池強(qiáng)度模型沒有學(xué)習(xí)到不斷增長(zhǎng)的長(zhǎng)期趨勢(shì)(圖6).
圖6 1981—2028年暖池強(qiáng)度變化(a)和未來10年暖池強(qiáng)度預(yù)測(cè)(b)
與暖池面積變化相同,暖池強(qiáng)度具備不斷增長(zhǎng)的長(zhǎng)期變化趨勢(shì).將原始數(shù)據(jù)減去年循環(huán)、通過12個(gè)月低通濾波得到暖池強(qiáng)度的低頻變化(圖7(a)),并通過1 300 d高通濾波除去長(zhǎng)期變化趨勢(shì)的影響后,暖池強(qiáng)度和MEI之間的相關(guān)系數(shù)為0.59,p<0.05,表明暖池強(qiáng)度與ENSO事件存在正相關(guān)關(guān)系.在圖7(b)中,2019年初的暖池強(qiáng)度達(dá)到極小值,從2019年中旬開始不斷增長(zhǎng),在2020年達(dá)到極大值,增長(zhǎng)持續(xù)時(shí)間長(zhǎng).根據(jù)暖池強(qiáng)度低頻變化與ENSO事件之間的正相關(guān)關(guān)系,模型預(yù)測(cè)結(jié)果表明,2020年將出現(xiàn)厄爾尼諾現(xiàn)象,可能持續(xù)到2022年甚至2023年.在2024年,暖池強(qiáng)度出現(xiàn)極小值,可能出現(xiàn)拉尼娜現(xiàn)象.
圖7 1981—2028年暖池強(qiáng)度的MEI與低頻變化(無長(zhǎng)期趨勢(shì))(a)和未來10年暖池強(qiáng)度的低頻變化預(yù)測(cè)(無長(zhǎng)期趨勢(shì))(b)
暖池質(zhì)心緯度模型對(duì)未來10年暖池質(zhì)心緯度的預(yù)測(cè)結(jié)果表明(圖8):未來10年暖池質(zhì)心將在10° S~10° N范圍內(nèi)南北移動(dòng);在2024年前,預(yù)測(cè)結(jié)果具備明顯的周期性變化規(guī)律,但2024年后,預(yù)測(cè)結(jié)果不再符合暖池質(zhì)心緯度的變化規(guī)律,準(zhǔn)確度較低.
圖8 1981—2028年暖池質(zhì)心緯度變化(a)和未來10年暖池質(zhì)心緯度預(yù)測(cè)(b)
暖池質(zhì)心的緯度變化不具備明顯的長(zhǎng)期變化趨勢(shì),無需進(jìn)行高通濾波;同時(shí)暖池質(zhì)心緯度的季節(jié)變化規(guī)律非常明顯,但模型預(yù)測(cè)的季節(jié)變化規(guī)律與實(shí)際變化不完全一致,減去實(shí)際值年循環(huán)后不能有效除去季節(jié)變化信號(hào).因此,將預(yù)測(cè)值進(jìn)行40個(gè)月低通濾波得到低頻變化,保留與ENSO事件相同周期的信號(hào).計(jì)算得到暖池質(zhì)心緯度和MEI之間的相關(guān)系數(shù)為-0.46,p<0.05,在95%置信度下認(rèn)為暖池質(zhì)心南北方向的移動(dòng)和ENSO事件存在相關(guān)性.相關(guān)系數(shù)為負(fù)值但并不接近-1,表明負(fù)相關(guān)關(guān)系較弱.模型預(yù)測(cè)結(jié)果表明,2019年和2020年上半年將出現(xiàn)厄爾尼諾事件,2021年出現(xiàn)拉尼娜現(xiàn)象,2022年和2023年將出現(xiàn)較弱的厄爾尼諾現(xiàn)象,2024—2025年將出現(xiàn)一場(chǎng)持續(xù)時(shí)間較久的拉尼娜事件,隨后,2026年開始厄爾尼諾現(xiàn)象持續(xù)發(fā)力,在2027年達(dá)到最強(qiáng)(圖9).
圖9 1981—2028年暖池質(zhì)心緯度的MEI與低頻變化(a)和未來10年暖池質(zhì)心緯度的低頻變化預(yù)測(cè)(b)
暖池質(zhì)心經(jīng)度模型對(duì)未來10年的暖池質(zhì)心經(jīng)度進(jìn)行預(yù)測(cè)的結(jié)果表明(圖10):未來10年暖池質(zhì)心將在145° E~175° W范圍內(nèi)東西移動(dòng);2019年初,暖池質(zhì)心不斷向西移動(dòng),在2020年向東移動(dòng)且向東偏移的態(tài)勢(shì)一直持續(xù)到2022年中旬,之后暖池質(zhì)心向西移動(dòng)至最西端約145° E,并在之后的幾年呈現(xiàn)緩慢東移的趨勢(shì),于2028年達(dá)到最東端.
圖10 1981—2028年暖池質(zhì)心經(jīng)度變化(a)和未來10年暖池質(zhì)心經(jīng)度預(yù)測(cè)(b)
將預(yù)測(cè)值減去1981—2018年暖池質(zhì)心經(jīng)度的年循環(huán)、通過365 d低通濾波,得到暖池質(zhì)心經(jīng)度的低頻變化.計(jì)算得到暖池質(zhì)心經(jīng)度和MEI之間的相關(guān)系數(shù)為0.88,p<0.05,相關(guān)系數(shù)為正值且接近1,表明暖池質(zhì)心東西方向的移動(dòng)和ENSO事件具備顯著的正相關(guān)關(guān)系.圖11中可以看到,暖池質(zhì)心經(jīng)度數(shù)據(jù)的負(fù)峰值非常突出,可能會(huì)錯(cuò)誤判斷拉尼娜事件的發(fā)生和強(qiáng)度.模型預(yù)測(cè)結(jié)果表明,2020—2022年將出現(xiàn)一場(chǎng)持續(xù)時(shí)間久、強(qiáng)度大的厄爾尼諾事件,2024年可能出現(xiàn)一次較弱的拉尼娜現(xiàn)象,從2025年底開始厄爾尼諾現(xiàn)象持續(xù)發(fā)力,在2027年達(dá)到最強(qiáng).
圖11 1981—2028年暖池質(zhì)心經(jīng)度的MEI與低頻變化(a)和未來10年暖池質(zhì)心經(jīng)度的低頻變化預(yù)測(cè)(b)
本研究將深度學(xué)習(xí)技術(shù)應(yīng)用于海洋科學(xué),利用LSTM神經(jīng)網(wǎng)絡(luò)成功構(gòu)建4個(gè)用于預(yù)測(cè)暖池指數(shù)時(shí)間序列的模型,通過設(shè)定序列長(zhǎng)度、學(xué)習(xí)率和迭代次數(shù)3個(gè)超參數(shù),達(dá)到模型在訓(xùn)練、測(cè)試和預(yù)測(cè)中均表現(xiàn)良好的目的.預(yù)測(cè)結(jié)果展現(xiàn)了未來10年(2019—2028年)暖池大小、強(qiáng)度和質(zhì)心的變化情況,并通過暖池指數(shù)對(duì)ENSO事件進(jìn)行預(yù)測(cè).
從暖池面積、暖池強(qiáng)度、暖池質(zhì)心經(jīng)度和暖池質(zhì)心緯度4個(gè)LSTM神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果可以看出,4個(gè)暖池模型都很好地預(yù)測(cè)到暖池指數(shù)的多尺度變異特征,包括季節(jié)內(nèi)變化、季節(jié)變化和低頻變化,但暖池面積模型多學(xué)習(xí)了實(shí)際數(shù)據(jù)并不存在的半年尺度變異特征,暖池面積模型和暖池強(qiáng)度模型沒有學(xué)習(xí)到不斷增長(zhǎng)的長(zhǎng)期變化趨勢(shì),這說明即使是具備長(zhǎng)期記憶能力的LSTM神經(jīng)網(wǎng)絡(luò)模型,在學(xué)習(xí)和訓(xùn)練較長(zhǎng)的時(shí)間序列數(shù)據(jù)時(shí)仍然存在問題.同時(shí),根據(jù)暖池質(zhì)心緯度模型的預(yù)測(cè)結(jié)果,5年以上的預(yù)測(cè)結(jié)果準(zhǔn)確度會(huì)大大下降.
本研究還結(jié)合4個(gè)暖池指數(shù)與MEI的相關(guān)關(guān)系對(duì)未來10年ENSO事件的發(fā)生進(jìn)行了預(yù)測(cè).4個(gè)模型都認(rèn)為在2019年底到2020年會(huì)出現(xiàn)厄爾尼諾現(xiàn)象,暖池強(qiáng)度模型和暖池質(zhì)心經(jīng)度模型結(jié)果表明這場(chǎng)厄爾尼諾現(xiàn)象將持續(xù)到2023年,而暖池面積模型和暖池質(zhì)心緯度模型結(jié)果表明在2021年中會(huì)出現(xiàn)拉尼娜現(xiàn)象,之后將再出現(xiàn)較弱的厄爾尼諾現(xiàn)象.4個(gè)模型都認(rèn)為在2024年將出現(xiàn)明顯的拉尼娜現(xiàn)象,而2027年冬季將再次出現(xiàn)厄爾尼諾現(xiàn)象.4個(gè)模型在對(duì)ENSO事件是否發(fā)生的判斷上具有高度一致性,預(yù)測(cè)結(jié)果與2019年底發(fā)生的厄爾尼諾現(xiàn)象相符,證明了預(yù)測(cè)的有效性.
然而,本研究?jī)H使用LSTM神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了暖池4個(gè)指數(shù)在時(shí)間尺度上的預(yù)測(cè),無法了解它們?cè)诳臻g尺度上的變化情況.Yang等[18]在LSTM提取時(shí)間尺度信息的基礎(chǔ)上增加一個(gè)卷積層提取空間信息,實(shí)現(xiàn)了SST的時(shí)空預(yù)測(cè).除此之外,許柏寧等[19]提出使用序列到序列(sequence to sequence,Seq2Seq)模型結(jié)合卷積長(zhǎng)短期記憶(convolutional long short-term memory,ConvLSTM)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)區(qū)域SST,之后的研究證實(shí)這一方法在長(zhǎng)期預(yù)報(bào)中優(yōu)于LSTM神經(jīng)網(wǎng)絡(luò)模型[20-21].
此外,目前大部分研究?jī)H根據(jù)SST等溫線或者固定區(qū)域劃定暖池.實(shí)際上,暖池并不是二維平面的,而是一個(gè)具有三維結(jié)構(gòu)的水體[22-23].厄爾尼諾事件的發(fā)生和暖池下層水體的運(yùn)動(dòng)情況息息相關(guān).如果能夠得到海表以下的海水溫度分布情況,使用等溫面劃定暖池,增加考慮暖池深度這一參數(shù),可能更有利于了解暖池的變化情況,提高ENSO事件預(yù)測(cè)的準(zhǔn)確度.