錢奇峰 王 川 徐雅靜 周冠博 劉 達(dá) 聶高臻
1 國(guó)家氣象中心,北京 100081 2 北京郵電大學(xué),北京 100876
提 要:臺(tái)風(fēng)客觀定強(qiáng)是提高臺(tái)風(fēng)業(yè)務(wù)現(xiàn)代化水平的重要支撐技術(shù),深度學(xué)習(xí)通過機(jī)器對(duì)大量樣本的分析和學(xué)習(xí),能夠隱式提取圖像中深層抽象的復(fù)雜特征,越來越多地被應(yīng)用到氣象領(lǐng)域中。本文利用ResNet深度學(xué)習(xí)模型,采用預(yù)訓(xùn)練后遷移學(xué)習(xí)的方式,以2005—2018年西北太平洋及南海臺(tái)風(fēng)的衛(wèi)星云圖為樣本,構(gòu)建了一種自動(dòng)、客觀的臺(tái)風(fēng)強(qiáng)度估測(cè)技術(shù)。通過對(duì)2019年全年的業(yè)務(wù)臺(tái)風(fēng)云圖的檢驗(yàn)分析,結(jié)果表明利用該技術(shù)能夠?qū)崿F(xiàn)對(duì)不同強(qiáng)度、不同發(fā)展階段的臺(tái)風(fēng)客觀強(qiáng)度估測(cè),且對(duì)2019年全年獨(dú)立樣本估測(cè)的平均絕對(duì)誤差和均方根誤差分別為4.3 m·s-1和5.5 m·s-1,精度優(yōu)于傳統(tǒng)客觀定強(qiáng)方法,具有一定的業(yè)務(wù)應(yīng)用價(jià)值。
由于臺(tái)風(fēng)一般生成于開闊洋面,而海洋上觀測(cè)資料稀少,特別是在臺(tái)風(fēng)進(jìn)入雷達(dá)有效探測(cè)范圍之前,臺(tái)風(fēng)的監(jiān)測(cè)主要依靠氣象衛(wèi)星探測(cè)來完成。因此在臺(tái)風(fēng)業(yè)務(wù)預(yù)報(bào)實(shí)踐中,衛(wèi)星云圖就成為了確定臺(tái)風(fēng)強(qiáng)度的最主要的依據(jù),而如何通過衛(wèi)星云圖更準(zhǔn)確地估測(cè)臺(tái)風(fēng)強(qiáng)度也就成為了尤為重要的課題。
這方面,目前世界氣象組織(World Meteorological Organization,WMO)推薦使用的方法為20世紀(jì)70年代美國(guó)國(guó)家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)的Dvorak(1975)在統(tǒng)計(jì)經(jīng)驗(yàn)的基礎(chǔ)上建立的基于臺(tái)風(fēng)云型特征的臺(tái)風(fēng)強(qiáng)度估測(cè)技術(shù)。而經(jīng)過多年業(yè)務(wù)實(shí)踐,Dvorak方法也已成為各國(guó)官方機(jī)構(gòu)最常使用的臺(tái)風(fēng)主觀定強(qiáng)方法(許映龍等,2015)。Dvorak方法的缺點(diǎn)是在云特征指數(shù)的確定方面存在較大主觀性,準(zhǔn)確率依賴預(yù)報(bào)員的經(jīng)驗(yàn)和訓(xùn)練,因此國(guó)外一些學(xué)者提出了客觀Dvorak方法,從而減少人工操作、提高自動(dòng)化程度,如ODT(objective Dvorak technique;Velden et al,1998)和AODT(advanced objective Dvorak technique;Olander and Velden,2007)等方法,其中AODT一直在被不斷改進(jìn)并在國(guó)外進(jìn)行業(yè)務(wù)應(yīng)用。
我國(guó)早在20世紀(jì)80年代就開始探索利用衛(wèi)星云圖確定臺(tái)風(fēng)強(qiáng)度(方宗義和周連翔,1980;范蕙君等,1990),并制定了臺(tái)風(fēng)強(qiáng)度確定的技術(shù)流程,在業(yè)務(wù)中發(fā)揮了重要作用。2010年以后,中央氣象臺(tái)開始在業(yè)務(wù)中使用WMO推薦的Dvorak技術(shù)版本進(jìn)行臺(tái)風(fēng)定強(qiáng)(許映龍等,2015),進(jìn)一步提高了我國(guó)臺(tái)風(fēng)定強(qiáng)精度以及與其他業(yè)務(wù)中心的可比性。在客觀定強(qiáng)方面,也有不少國(guó)內(nèi)學(xué)者取得一定進(jìn)展,如魯小琴等(2014)利用熱帶云團(tuán)對(duì)流核的相關(guān)特征,建立了估測(cè)臺(tái)風(fēng)強(qiáng)度的方法,估算精度能與Dvorak方法接近。
近年來,隨著人工智能學(xué)科的廣泛應(yīng)用,由于其在圖像識(shí)別方面的優(yōu)勢(shì),如何將深度學(xué)習(xí)技術(shù)應(yīng)用于氣象領(lǐng)域的臺(tái)風(fēng)定強(qiáng)研究,受到越來越多的關(guān)注。美國(guó)最先開展了相關(guān)研究工作。Pradhan et al(2018)使用基于多層深度CNN(convolutional neural network)對(duì)臺(tái)風(fēng)等級(jí)進(jìn)行估計(jì),僅使用遙感云圖就取得了超過當(dāng)時(shí)公認(rèn)最好方法的準(zhǔn)確率和均方根誤差值(RMSE);在德國(guó),Zahera et al(2019)使用LSTM(long short-term memory)和DNN(deep neural network)對(duì)臺(tái)風(fēng)強(qiáng)度進(jìn)行估計(jì), 結(jié)合臺(tái)風(fēng)發(fā)生時(shí)的社會(huì)媒體信息,提升了對(duì)災(zāi)難性天氣的強(qiáng)度估計(jì)。在臺(tái)灣,Chen et al(2018)發(fā)布了一個(gè)開放數(shù)據(jù)集,提出了基于CNN強(qiáng)度回歸的多模型融合方法,證明了深度學(xué)習(xí)技術(shù)在氣象學(xué)研究中具有巨大的應(yīng)用潛力。Tian et al(2019)使用分類和回歸神經(jīng)網(wǎng)絡(luò)對(duì)臺(tái)風(fēng)強(qiáng)度進(jìn)行更加精細(xì)的劃分,證明了深度學(xué)習(xí)技術(shù)對(duì)熱帶氣旋(TC)強(qiáng)度估計(jì)能力的提升。張淼等(2017)利用FY-3C微波溫度計(jì)通道特征與臺(tái)風(fēng)強(qiáng)度建立統(tǒng)計(jì)關(guān)系估計(jì)熱帶氣旋強(qiáng)度,并開展了嘗試性的研究。越來越多的研究成果表明,運(yùn)用深度學(xué)習(xí)技術(shù)解決臺(tái)風(fēng)定強(qiáng)問題具有巨大的應(yīng)用前景(Combinido et al,2018;鄒國(guó)良等,2019)。然而,由于這些工作多為針對(duì)大西洋或東太平洋颶風(fēng),使用的強(qiáng)度標(biāo)簽(真值)也都采用美國(guó)或日本發(fā)布的最佳路徑。已有研究表明,采用不同機(jī)構(gòu)的最佳路徑作為實(shí)況參考會(huì)對(duì)臺(tái)風(fēng)強(qiáng)度誤差評(píng)定結(jié)果產(chǎn)生較大的影響(陳國(guó)民等,2019)。因此本文將基于更匹配我國(guó)臺(tái)風(fēng)業(yè)務(wù)的中國(guó)氣象局臺(tái)風(fēng)最佳路徑集,采用目前人工智能領(lǐng)域最新發(fā)展的ResNet深度學(xué)習(xí)模型,構(gòu)建一種自動(dòng)、客觀的臺(tái)風(fēng)強(qiáng)度估測(cè)技術(shù),以期為我國(guó)臺(tái)風(fēng)業(yè)務(wù)提供應(yīng)用。
2015年He et al(2016)提出了ResNet,在計(jì)算機(jī)視覺(CV)領(lǐng)域的頂級(jí)賽事ImageNet比賽中獲得第一名,之后CV領(lǐng)域的很多方法都建立在ResNet的基礎(chǔ)上完成,檢測(cè)、分割、識(shí)別等領(lǐng)域都紛紛使用ResNet。ResNet深度網(wǎng)絡(luò)的優(yōu)勢(shì)為允許原始輸入信息直接傳到后面的層中,將在一定程度上彌補(bǔ)傳統(tǒng)的卷積網(wǎng)絡(luò)或者全連接網(wǎng)絡(luò)的缺陷,比如在信息傳遞的時(shí)候或多或少會(huì)存在信息丟失、信息損耗,隨著深度增加導(dǎo)致梯度消失或者梯度爆炸等問題。具體解決的方法就是通過ResNet網(wǎng)絡(luò)的殘差結(jié)構(gòu)(圖1),直接將輸入信息旁路傳到輸出,保護(hù)信息的完整性,整個(gè)網(wǎng)絡(luò)只需要學(xué)習(xí)輸入、輸出差別的那一部分,簡(jiǎn)化學(xué)習(xí)目標(biāo)和難度。
圖1 ResNet的殘差學(xué)習(xí)模塊
圖1中:x表示輸入,F(xiàn)(x)表示殘差塊在第二層激活函數(shù)之前的輸出,即F(x)=W2σ(W1x),其中W1和W2表示第一層和第二層的權(quán)重,σ表示修正線性單元(rectified linear unit,ReLU)的激活函數(shù)。最后殘差塊的輸出是σ[F(x)+x]。
由于ResNet的這一優(yōu)點(diǎn),首先使用ResNet50深度學(xué)習(xí)模型,在ImageNet(Deng et al,2009)數(shù)據(jù)集上進(jìn)行訓(xùn)練,使其具有識(shí)別物體的基本能力,然后在最后兩個(gè)卷積層進(jìn)行遷移學(xué)習(xí),這種做法被稱為預(yù)訓(xùn)練模型(Russakovsky et al,2015;He et al,2019)。其中,模型最后一層卷積經(jīng)過平均池化生成2 048維的特征向量,代表了經(jīng)過深度學(xué)習(xí)之后與臺(tái)風(fēng)強(qiáng)度有關(guān)的云圖特征,該特征向量再通過一個(gè)softmax分類器,按照1 m·s-1的間隔輸出預(yù)測(cè)強(qiáng)度及相應(yīng)的概率(圖2)。
圖2 ResNet50深度學(xué)習(xí)模型示意圖
本文中所有試驗(yàn)均基于RedHat EL 7.6系統(tǒng),模型使用TensorFlow深度學(xué)習(xí)框架,通過CUDA與cuDNN利用NVIDIA Tesla T4 GPU加速模型訓(xùn)練。采用的集成開發(fā)環(huán)境為Anaconda,由Python語言編寫而成。
建模所用的資料包括2005—2018年西北太平洋及南海臺(tái)風(fēng)衛(wèi)星云圖(http:∥weather.is.kochi-u.ac.jp/sat/GAME),水平分辨率為0.05°,根據(jù)中國(guó)氣象局《熱帶氣旋年鑒》熱帶氣旋最佳路徑資料(http:∥tcdata.typhoon.org.cn/zjljsjj_zlhq.html),截取對(duì)應(yīng)時(shí)刻臺(tái)風(fēng)中心400×400像素的云圖(約2 000 km×2 000 km),并按照最佳路徑臺(tái)風(fēng)強(qiáng)度標(biāo)注標(biāo)簽,共計(jì)15 730張臺(tái)風(fēng)云圖,作為深度學(xué)習(xí)數(shù)據(jù)樣本集。
樣本集數(shù)據(jù)的風(fēng)速分布情況如圖3所示,可以看到各個(gè)風(fēng)速的分布并不是均勻的,其中以18、20、23和25 m·s-1等風(fēng)速樣本最多,而較小風(fēng)速(<15 m·s-1)和較高風(fēng)速(>65 m·s-1)的樣本數(shù)明顯偏少。因此,本文使用了機(jī)器學(xué)習(xí)中較常用的數(shù)據(jù)增強(qiáng)技術(shù)(Pradhan et al,2018)進(jìn)行一定程度的改善,即對(duì)云圖采用臺(tái)風(fēng)圖像進(jìn)行90°、180°和270°的旋轉(zhuǎn)處理,通過數(shù)據(jù)增強(qiáng)技術(shù)增加臺(tái)風(fēng)樣本數(shù)量。另外,個(gè)別風(fēng)速的樣本即使經(jīng)過數(shù)據(jù)增強(qiáng)后仍然較少,如21、22、27和32 m·s-1等風(fēng)速的樣本,我們將其剔除出樣本集,最終形成深度學(xué)習(xí)模型的數(shù)據(jù)集。
圖3 樣本集中各風(fēng)速的樣本數(shù)目
為了保證模型能對(duì)所有風(fēng)速的臺(tái)風(fēng)云圖特征進(jìn)行學(xué)習(xí),將每種風(fēng)速均按7∶3的比例分配形成深度學(xué)習(xí)模型訓(xùn)練集和測(cè)試集,其中訓(xùn)練集用來訓(xùn)練模型,測(cè)試集用來檢驗(yàn)?zāi)P偷膶W(xué)習(xí)效果。值得注意的是,旋轉(zhuǎn)后的圖像需和原始圖像位于同一個(gè)圖像集,即若原圖像存在于訓(xùn)練集,那么由其旋轉(zhuǎn)得到的圖像也應(yīng)存在于訓(xùn)練集。最終訓(xùn)練集共有12 550個(gè)×4=50 200個(gè)樣本,測(cè)試集共有3 138個(gè)×4=12 552個(gè)樣本。
在ResNet深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練過程中,主要是通過更新網(wǎng)絡(luò)中的每一個(gè)權(quán)重,使得最終的輸出接近于真實(shí)標(biāo)簽值,即將整個(gè)網(wǎng)絡(luò)的誤差作為一個(gè)整體進(jìn)行了最小化,從而使模型逐步擬合訓(xùn)練集。ResNet網(wǎng)絡(luò)包含大量的參數(shù),準(zhǔn)備的訓(xùn)練數(shù)據(jù)集樣本量對(duì)于有50層的ResNet深度學(xué)習(xí)網(wǎng)絡(luò)建模而言是遠(yuǎn)遠(yuǎn)不夠的,而在小數(shù)據(jù)集上訓(xùn)練會(huì)導(dǎo)致過度擬合,并極大地影響泛化能力。
因此,選擇在預(yù)訓(xùn)練模型上進(jìn)行遷移學(xué)習(xí),即使用訓(xùn)練數(shù)據(jù)集提供給最后兩個(gè)卷積層進(jìn)行針對(duì)性學(xué)習(xí),從而大大提高樣本的使用率,降低學(xué)習(xí)成本。訓(xùn)練流程為:先使用訓(xùn)練集的圖像和對(duì)應(yīng)的強(qiáng)度信息不斷地調(diào)整預(yù)訓(xùn)練網(wǎng)絡(luò)的權(quán)重,最終使得模型的輸出與真實(shí)強(qiáng)度值間的差異最小。模型訓(xùn)練的難點(diǎn)在于臺(tái)風(fēng)強(qiáng)度相近的圖像差別非常小,人眼難以辨別。而模型要通過學(xué)習(xí)相似圖像間的微小差別來判定不同的類別,需要不斷地更新模型的權(quán)重,多次微調(diào)和測(cè)試不同的模型參數(shù)。
模型的精確度通過正確率檢驗(yàn),假設(shè)在n個(gè)樣本中第i個(gè)樣本的真值標(biāo)簽為Oi,模型估測(cè)標(biāo)簽為Si,則模型分類的正確率可以表示為:
(1)
式中表示當(dāng)模型的輸出和真實(shí)風(fēng)速值完全一致時(shí)才被認(rèn)為是準(zhǔn)確的(例如真實(shí)風(fēng)速值為48 m·s-1,那么只有模型輸出也是48 m·s-1,被認(rèn)為是該樣本估測(cè)正確)。圖4給出了訓(xùn)練過程中訓(xùn)練集和測(cè)試集的準(zhǔn)確率變化情況,其中藍(lán)色代表訓(xùn)練集上的準(zhǔn)確率曲線,橙色代表測(cè)試集上的準(zhǔn)確率變化情況。可以看到,隨著網(wǎng)絡(luò)訓(xùn)練次數(shù)不斷增加,訓(xùn)練集的正確率一直在提升并趨近于1(接近1代表模型過擬合),而測(cè)試集的正確率當(dāng)訓(xùn)練次數(shù)達(dá)到300次以后就趨于穩(wěn)定,達(dá)到58%左右。因此,將訓(xùn)練300次后的ResNet模型參數(shù)確定為訓(xùn)練完成的模型。
圖4 訓(xùn)練集與測(cè)試集的準(zhǔn)確率曲線
為了檢驗(yàn)?zāi)P托Ч?,這里利用訓(xùn)練完成的模型對(duì)測(cè)試集3 138個(gè)原始云圖樣本(對(duì)比表明,旋轉(zhuǎn)后的樣本估測(cè)結(jié)果與原樣本相同)的估測(cè)結(jié)果進(jìn)行了分析。一般來講,softmax分類器輸出的最大概率對(duì)應(yīng)的強(qiáng)度即為模型估測(cè)結(jié)果,但是也注意到模型輸出除了第一猜值以外,還有其余可能值及相應(yīng)概率。經(jīng)過比較(表1),其中第一猜值(TOP1)的平均概率為75.3%,前兩位猜值(TOP2)累計(jì)平均概率為88.8%,TOP3的累計(jì)概率就達(dá)到了94.2%,其余分類值的概率占比已經(jīng)很小,可以忽略不計(jì)。
這里使用模型輸出結(jié)果進(jìn)行了三組對(duì)比分析,如式(2)所示,Ui為模型估測(cè)的第i個(gè)猜值風(fēng)速,λi為第i個(gè)猜值風(fēng)速相應(yīng)的概率。TOP1代表使用模型輸出的第一猜值作為對(duì)測(cè)試樣本的定強(qiáng)結(jié)果,TOP2代表使用前兩位猜值按概率進(jìn)行加權(quán)平均后的強(qiáng)度值作為定強(qiáng)結(jié)果,同理可算得TOP3的強(qiáng)度值,見式(2),結(jié)果如表1??梢?,使用TOP3得到的樣本估測(cè)強(qiáng)度的平均絕對(duì)誤差(MAE)和RMSE分別為2.385 m·s-1和3.523 m·s-1,相比于TOP1和TOP2都較小,反映了更好的估測(cè)效果。
表1 ResNet模型輸出結(jié)果TOP1~TOP3的累計(jì)概率及其MAE和RMSE比較
TOPi=∑(Ui·λi)/∑λi(i=1,2,3)
(2)
由于期望模型最終能在業(yè)務(wù)上應(yīng)用,但建模數(shù)據(jù)與實(shí)際業(yè)務(wù)數(shù)據(jù)總是存在一定差異,而目前業(yè)務(wù)使用的衛(wèi)星數(shù)據(jù)有我國(guó)的FY-4A衛(wèi)星和日本葵花8號(hào)衛(wèi)星,不同衛(wèi)星的臺(tái)風(fēng)云圖亮溫值也存在微小的差異??紤]到葵花8號(hào)衛(wèi)星的范圍較好覆蓋了西北太平洋所有的臺(tái)風(fēng),因此這里準(zhǔn)備了2019年西北太平洋及南海全年臺(tái)風(fēng)的云圖(數(shù)據(jù)來源于業(yè)務(wù)接收的葵花8號(hào)衛(wèi)星),經(jīng)過挑選與最佳路徑定強(qiáng)對(duì)應(yīng)時(shí)刻的云圖,共計(jì)596個(gè)樣本,包含了2019年西北太平洋和南海的29個(gè)臺(tái)風(fēng)。然后利用上文訓(xùn)練好的深度學(xué)習(xí)模型對(duì)這些樣本云圖進(jìn)行定強(qiáng),用來檢驗(yàn)?zāi)P蛯?duì)實(shí)際業(yè)務(wù)中全新未知樣本的估測(cè)能力,以此評(píng)估其業(yè)務(wù)應(yīng)用的前景。
這里將2019年的云圖樣本按照最佳路徑定強(qiáng)分成7~17級(jí)以上共12個(gè)風(fēng)速等級(jí)(表2),共包含了588個(gè)樣本(另有8個(gè)6級(jí)的風(fēng)速樣本未包含),其中8~9級(jí)(熱帶風(fēng)暴級(jí))的樣本數(shù)最多,之后隨著風(fēng)速增長(zhǎng),樣本數(shù)基本逐漸減少,這與圖3給出的建模樣本的風(fēng)速分布較為相似。
表2 模型對(duì)2019年云圖臺(tái)風(fēng)樣本的強(qiáng)度估計(jì)分析
首先,從強(qiáng)度估計(jì)的最大、最小值和中位數(shù)來看,隨著臺(tái)風(fēng)實(shí)際風(fēng)速的增長(zhǎng),這三個(gè)特征值也總體呈增長(zhǎng)趨勢(shì),表明模型對(duì)不同強(qiáng)度的臺(tái)風(fēng)云圖有一定的識(shí)別能力,但從模型估測(cè)的最小至最大強(qiáng)度跨度來看均較大,也表明模型估測(cè)中對(duì)一些樣本存在較大偏差,在實(shí)際應(yīng)用中需要加以注意。進(jìn)一步,從中位數(shù)與各級(jí)風(fēng)的風(fēng)速范圍比較來看,比如模型對(duì)7級(jí)樣本的估測(cè)值的中位數(shù)為8級(jí)(18.5 m·s-1),說明對(duì)此類樣本,模型強(qiáng)度估測(cè)略偏強(qiáng);而模型對(duì)8~11級(jí)樣本的估測(cè)則沒有明顯的偏差;對(duì)更高風(fēng)級(jí)的樣本(12級(jí)及以上),模型估測(cè)結(jié)果略有偏弱。
其次,從各風(fēng)級(jí)樣本的MAE和RMSE來看,模型對(duì)8~9級(jí)的樣本估測(cè)效果最好,其MAE和RMSE都是最小的,其中對(duì)8級(jí)樣本MAE為2.8 m·s-1、對(duì)9級(jí)樣本MAE為3.3 m·s-1,其強(qiáng)度估測(cè)能力基本達(dá)到了可以業(yè)務(wù)參考的水平。而模型對(duì)13~16級(jí)的樣本的估測(cè)效果相對(duì)較差,估測(cè)MAE在5 m·s-1以上,其中13級(jí)樣本MAE達(dá)到了6.3 m·s-1,對(duì)15級(jí)樣本MAE也達(dá)到了6.2 m·s-1,業(yè)務(wù)上對(duì)這類臺(tái)風(fēng)需要預(yù)報(bào)員加強(qiáng)主觀分析。此外,在2019年的樣本中,17級(jí)和17級(jí)以上的樣本個(gè)數(shù)均不超過10個(gè),模型對(duì)這類較強(qiáng)臺(tái)風(fēng)的強(qiáng)度估測(cè)能力,尚需要更多的實(shí)時(shí)資料驗(yàn)證。
表2最后也給出了ResNet模型對(duì)2019年全年樣本強(qiáng)度估測(cè)的MAE和RMSE,分別為4.3 m·s-1和5.5 m·s-1,對(duì)比Pradhan et al(2018)利用深度CNN模型對(duì)大西洋68個(gè)TC和太平洋30個(gè)TC共8 138張?jiān)茍D強(qiáng)度估測(cè)的結(jié)果(RMSE約為5.84 m·s-1),ResNet模型結(jié)果與之相比略有優(yōu)勢(shì)。另外,對(duì)比傳統(tǒng)的統(tǒng)計(jì)學(xué)方法對(duì)云圖進(jìn)行強(qiáng)度估測(cè)的方法(魯小琴等,2014),其獨(dú)立樣本的MAE和RMSE分別為5.9 m·s-1和7.7 m·s-1,本文的ResNet模型也有比較明顯的優(yōu)勢(shì)。
1909號(hào)臺(tái)風(fēng)利奇馬是2019年登陸我國(guó)最強(qiáng)的臺(tái)風(fēng),給華東及環(huán)渤海等地造成了嚴(yán)重風(fēng)雨影響,“利奇馬”于8月4日生成,10日在浙江省以超強(qiáng)臺(tái)風(fēng)級(jí)別登陸,隨后北上于13日前后減弱消失。
圖5給出了“利奇馬”全過程ResNet模型根據(jù)云圖估計(jì)的臺(tái)風(fēng)強(qiáng)度與最佳路徑強(qiáng)度??傮w而言,模型對(duì)臺(tái)風(fēng)各個(gè)階段強(qiáng)度的估計(jì)與實(shí)際變化均比較一致。在臺(tái)風(fēng)增強(qiáng)階段,對(duì)臺(tái)風(fēng)在8月6日12時(shí)之前的強(qiáng)度估計(jì)略有偏弱。在臺(tái)風(fēng)發(fā)展階段,能較好識(shí)別出臺(tái)風(fēng)在7日快速增強(qiáng)的過程,對(duì)臺(tái)風(fēng)峰值強(qiáng)度估計(jì)亦較為準(zhǔn)確,特別是較為準(zhǔn)確地估測(cè)出了“利奇馬”在8日和9日的兩次強(qiáng)度峰值。隨后,10日當(dāng)臺(tái)風(fēng)受陸地影響開始減弱,此時(shí)模型對(duì)臺(tái)風(fēng)強(qiáng)度變化存在一定的高估,也是整個(gè)臺(tái)風(fēng)期間模型估計(jì)偏差最大的階段,表明ResNet模型對(duì)臺(tái)風(fēng)剛登陸后的快速減弱階段強(qiáng)度估計(jì)偏強(qiáng)。最后,在臺(tái)風(fēng)深入內(nèi)陸的階段,雖然臺(tái)風(fēng)較弱,但模型對(duì)臺(tái)風(fēng)強(qiáng)度的估計(jì)與實(shí)況基本吻合。經(jīng)計(jì)算,模型對(duì)1909號(hào)臺(tái)風(fēng)利奇馬強(qiáng)度估計(jì)的MAE為3.5 m·s-1,RMSE為4.5 m·s-1。
圖5 ResNet模型對(duì)2019年8月臺(tái)風(fēng)利奇馬模型估計(jì)的強(qiáng)度(綠點(diǎn)線)與最佳路徑定強(qiáng)(彩色臺(tái)風(fēng)符號(hào))比較
圖6給出了ResNet模型對(duì)臺(tái)風(fēng)利奇馬三個(gè)不同時(shí)刻云圖的強(qiáng)度估計(jì)結(jié)果,其中圖6a為“利奇馬”達(dá)到峰值強(qiáng)度(62 m·s-1)時(shí)的云圖,模型認(rèn)為該時(shí)刻臺(tái)風(fēng)強(qiáng)度為60 m·s-1的概率為86%,65 m·s-1的概率為7%以及55 m·s-1的概率為4%(該樣本TOP3的概率已經(jīng)近似為100%),最終模型加權(quán)平均后給出60.2 m·s-1的強(qiáng)度估計(jì),與最佳路徑定強(qiáng)非常接近。圖6b為“利奇馬”達(dá)到巔峰強(qiáng)度后的維持階段,與圖6a比,云型發(fā)生較大的變化,云系從南北較為對(duì)稱變成了南少北多,臺(tái)風(fēng)眼也逐漸開始填塞,此時(shí)模型給出的強(qiáng)度估計(jì)(52.3 m·s-1)與最佳路徑強(qiáng)度(48 m·s-1)相比略有偏強(qiáng)。值得注意的是,該時(shí)刻模型TOP3的概率分別為37%、22%和22%,說明模型判斷時(shí)認(rèn)為最可能的三個(gè)估測(cè)強(qiáng)度(55、48和52 m·s-1)不相伯仲,因此這一階模型對(duì)臺(tái)風(fēng)結(jié)構(gòu)調(diào)整期間云型的變化非常敏感,強(qiáng)度估測(cè)容易出現(xiàn)波動(dòng)。圖6c是“利奇馬”深入內(nèi)陸后(8月11日00 UTC)的云圖,此時(shí)臺(tái)風(fēng)云型松散,中心空心明顯,但模型估計(jì)結(jié)果為24.4 m·s-1,與業(yè)務(wù)定強(qiáng)基本一致。
圖6 2019年8月(a)8日1200 UTC,(b)9日12 UTC,(c)11日00 UTC ResNet模型對(duì)臺(tái)風(fēng)利奇馬云圖的強(qiáng)度估計(jì)結(jié)果
本文利用ResNet50預(yù)訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò),建立了一種基于紅外衛(wèi)星云圖的臺(tái)風(fēng)定強(qiáng)模型,能夠僅根據(jù)紅外云圖估測(cè)出臺(tái)風(fēng)強(qiáng)度,主要結(jié)論如下:
(1)在深度學(xué)習(xí)模型訓(xùn)練數(shù)據(jù)準(zhǔn)備中,對(duì)臺(tái)風(fēng)圖像進(jìn)行90°、180°及270°旋轉(zhuǎn)等處理的數(shù)據(jù)增強(qiáng)技術(shù),能夠增加臺(tái)風(fēng)樣本數(shù)量,并一定程度上改善樣本數(shù)據(jù)不均衡。
(2)在模型訓(xùn)練中,隨著網(wǎng)絡(luò)訓(xùn)練次數(shù)不斷增加,訓(xùn)練集的準(zhǔn)確率一直在提升,但測(cè)試集的準(zhǔn)確率在300次以后趨于穩(wěn)定,最終測(cè)試集準(zhǔn)確率能達(dá)到58%左右。
(3)利用該模型能夠?qū)崿F(xiàn)對(duì)不同強(qiáng)度、不同發(fā)展階段的臺(tái)風(fēng)強(qiáng)度估測(cè),且對(duì)2019年獨(dú)立樣本估測(cè)的MAE和RMSE分別為4.3 m·s-1和5.5 m·s-1,精度與國(guó)際水平相當(dāng),并優(yōu)于傳統(tǒng)統(tǒng)計(jì)方法。
該模型已經(jīng)于2019年在中央氣象臺(tái)進(jìn)行了業(yè)務(wù)測(cè)試,并當(dāng)我國(guó)責(zé)任海區(qū)有編號(hào)臺(tái)風(fēng)時(shí),實(shí)時(shí)給出當(dāng)前臺(tái)風(fēng)的客觀強(qiáng)度估測(cè)供預(yù)報(bào)員作為定強(qiáng)參考。從檢驗(yàn)結(jié)果來看,模型基本能夠刻畫臺(tái)風(fēng)增強(qiáng)、維持到減弱各個(gè)階段的強(qiáng)度變化,對(duì)預(yù)報(bào)員臺(tái)風(fēng)定強(qiáng)有一定的參考價(jià)值。不足之處是由于模型在強(qiáng)度估測(cè)時(shí)僅利用了單幀臺(tái)風(fēng)云圖,同一個(gè)臺(tái)風(fēng)相鄰時(shí)刻的估測(cè)結(jié)果有時(shí)會(huì)有較大差異,這將影響業(yè)務(wù)應(yīng)用效果。因此,在下一步工作中將嘗試?yán)枚鄰堅(jiān)茍D改進(jìn)模型,繼續(xù)提高強(qiáng)度估測(cè)精度。