宋 毅,宋曉姜,高志一,張志華,李 敏
(國家海洋環(huán)境預報中心,北京 100081)
基于貝葉斯理論的中國近海網(wǎng)格化氣象要素概率預報研究
宋 毅,宋曉姜,高志一,張志華,李 敏
(國家海洋環(huán)境預報中心,北京 100081)
基于貝葉斯理論建立了一種基本概率預報模式,將歐洲中期天氣預報中心數(shù)值模式的確定性海面風場預報轉(zhuǎn)換為概率預報,并對概率化后的釋用產(chǎn)品進行了評估與檢驗。對2016年3月和4月釋用產(chǎn)品的檢驗結(jié)果表明,在中國近海1 425個漁區(qū)的全風速預報中,貝葉斯概率預報準確率均較高;對6級及以上大風的預報,貝葉斯概率預報的準確率也較高,且空報率低,無漏報。本文的研究成果為預報員進行業(yè)務預報具有指導性意義,同時將為進一步構(gòu)建海面風場的網(wǎng)格化業(yè)務預報體系奠定了技術(shù)基礎(chǔ)。
貝葉斯理論;概率預報;網(wǎng)格化;業(yè)務預報
隨著涉海項目日益頻繁,開展海洋氣象要素網(wǎng)格化預報成為當務之急。海洋預報要素網(wǎng)格化預報的主要思路是,以優(yōu)質(zhì)的數(shù)值預報產(chǎn)品及相對應的歷史實況觀測或再分析數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),利用氣象學和海洋學診斷、統(tǒng)計等客觀方法輸出釋用后的預報數(shù)據(jù),通過交互式、網(wǎng)格化預報發(fā)布平臺,結(jié)合預報員經(jīng)驗訂正方法,最終完成預報要素的網(wǎng)格化發(fā)布。因此,選取優(yōu)質(zhì)的數(shù)值預報產(chǎn)品和適當?shù)尼層梅椒?,以及預報員經(jīng)驗訂正過程構(gòu)成了網(wǎng)格化最重要的3個環(huán)節(jié)。
目前國內(nèi)外主流預報機構(gòu)已經(jīng)開展了一系列網(wǎng)格化預報工作。歐洲中期數(shù)值預報中心(European Centre for Medium-Range Weather Forecasts,ECMWF)針對溫度、氣壓要素、風要素采用高斯密度分布對預報結(jié)果進行訂正[1],針對降水量采用邏輯回歸[2]或分位數(shù)回歸方法,貝葉斯平均方法[3]也被用于集合預報釋用訂正;美國國家環(huán)境預報中心(National Centers for Environmental Prediction,NCEP)利用再預報技術(shù)[4]、貝葉斯平均方法[3]等對集合預報進行釋用訂正;中國氣象局國家氣象中心研發(fā)了以“精細化氣象要素客觀預報平臺(Meteorology Element Objective Forecast Interation System,MEOFIS)”為代表的集成多種數(shù)值預報產(chǎn)品解釋應用技術(shù)的客觀氣象要素預報系統(tǒng),初步建立了網(wǎng)格化、定量化的產(chǎn)品體系。當前,我國海洋預報機構(gòu)的網(wǎng)格化預報技術(shù)尚未建立,現(xiàn)階段主要依靠一線預報員主觀判斷對數(shù)值結(jié)果進行人工訂正,主觀影響較大且耗費大量人力,越來越無法滿足現(xiàn)代海洋預報業(yè)務的要求。因此,建立開展網(wǎng)格化預報體系成為迫切需求。
由確定性預報向概率預報轉(zhuǎn)變已成為當今天氣預報的熱點。由于數(shù)值模式輸出的單一確定性預報產(chǎn)品,否定了客觀存在的預報不確定性,據(jù)此而提供的預報信息是不完善的[5],對預報員及使用者的指導意義有局限性。而通過概率天氣預報,為預報員及使用者提供了對天氣狀況未來發(fā)展趨勢認知狀態(tài)的較完整表達,實現(xiàn)了對預報不確定性的定量化表達[6-8]。而將貝葉斯統(tǒng)計理論應用于概率預報技術(shù)成為了近年來數(shù)值預報的新趨勢[3,9-11]。
本文工作著眼于目前亟待發(fā)展的我國海洋預報要素網(wǎng)格化技術(shù),落腳于中國近海1 425個漁區(qū)(每個漁區(qū)范圍為0.5°×0.5°),選用ECMWF T1279模式,依據(jù)貝葉斯統(tǒng)計理論,實現(xiàn)海面風的確定性預報向概率預報的轉(zhuǎn)變,初步構(gòu)建海洋氣象要素的網(wǎng)格化業(yè)務預報。
2.1 數(shù)據(jù)資料
本文所用的數(shù)值預報產(chǎn)品為ECMWF T1279模式預報,水平分辨率為0.125°×0.125°,選用2014年12月—2016年4月的逐12h預報數(shù)據(jù)進行分析,其中2014年12月—2016年2月數(shù)據(jù)用于概率預報模型建立,2016年3—4月作為預報試驗的檢驗期。為了評估模式預報性能,使用了對應時期的ECMWF較高分辨率(0.125°)ERA-Interim再分析數(shù)據(jù),該數(shù)據(jù)是ECMWF第三代再分析數(shù)據(jù),使用了ECMWF的IFS(Integrated Forecast System)Cy31r2模型,其采用四維變分同化技術(shù),結(jié)合改進的衛(wèi)星數(shù)據(jù)誤差校正等技術(shù),相比前兩代(ERA-15、ERA-40)再分析數(shù)據(jù),其數(shù)據(jù)質(zhì)量有所提升??紤]到中國近海浮標數(shù)量有限、衛(wèi)星遙感數(shù)據(jù)則在時間、空間的不連續(xù),本文在評估、訂正網(wǎng)格化數(shù)值預報產(chǎn)品時,選用ERA-Interim再分析數(shù)據(jù)作為“觀測值”。此外,為了討論再分析數(shù)據(jù)的可靠性,本文還使用了2014年的中國近海22個逐小時浮標數(shù)據(jù)進行對比分析。
2.2 貝葉斯方法
貝葉斯方法描述的是兩個事件的條件概率之間的關(guān)系。條件概率通常寫為P(A|B),表示在事件B發(fā)生的條件下事件A發(fā)生的概率。貝葉斯方法用公式表示如下:
式(1)即為貝葉斯公式的密度函數(shù)形式,其中P(AB)表示事件A與B(在本文中為實況與預報)的聯(lián)合概率密度函數(shù);P(A)是事件A的邊緣或先驗概率分布函數(shù),包括了A的先驗信息;P(B|A)表示在事件A發(fā)生的條件下B發(fā)生的概率密度函數(shù);P(B)是事件B的邊緣或先驗概率分布函數(shù);P(A|B)稱為A的后驗概率分布函數(shù)。
在本文中,基于確定性預報值與觀測值之間的統(tǒng)計關(guān)系,借助于貝葉斯統(tǒng)計理論,在已知預報因子的預報值情況下,獲得預報量后驗概率分布,把一個確定性預報轉(zhuǎn)化為一個概率預報,從而實現(xiàn)對預報不確定性的定量化。
2.3 預報結(jié)果檢驗與評估
為了檢驗預報場與觀測場之間的差異,引入模式技巧評分公式(見式(2))[12-14]
式中:R是某一區(qū)域上數(shù)值預報與觀測數(shù)據(jù)時間序列相關(guān)系數(shù);SDR是某一區(qū)域上數(shù)值預報與觀測數(shù)據(jù)標準偏差的比值。上述公式綜合檢驗了數(shù)值預報與觀測數(shù)據(jù)的時間演變規(guī)律及預報偏差。根據(jù)經(jīng)驗,將模式技巧評分劃分為5檔,優(yōu)秀(0.9≤S<1)、良好(0.8≤S<0.9)、中等(0.7≤S<0.8)、及格(0.6≤S<0.7)和較差(0≤S<0.6)。
在對概率預報進行檢驗時,將實測風速值與檢驗時段下的概率預報風速區(qū)間對比。相同時刻實測風速值落在該概率預報區(qū)間內(nèi)稱為“準確預報”,小于該區(qū)間最低風速值稱為“空報”,大于該區(qū)間最高風速值為稱為“漏報”。按下列公式量化預報質(zhì)量:
預報準確率(CS):
空報率(FAR):
漏報率(PO):
式中:NA為預報時段準確預報次數(shù);NB為空報次數(shù);NC為漏報次數(shù)。在本文中對全風速概率預報的檢驗只關(guān)注預報準確率,對大風過程預報檢驗則同時關(guān)注預報準確率、空報率及漏報率。
3.1 ECMWF數(shù)值模式性能評估
在應用貝葉斯理論之前,首先對ECMWF確定性(單一)預報產(chǎn)品性能進行了客觀檢驗,本文基于ERA-Interim再分析風場數(shù)據(jù),評估了2014年12月—2016年2月ECMWF確定性預報風場在預報時效分別為24h(見圖1a)、48h(見圖1b)和72h(見圖1c)的預報性能。如圖1所示,24 h預報時效下,數(shù)值模式對黃海、東海中北部、臺灣海峽、南海、日本海及西北太平洋遠海的預報能力均較強,為優(yōu)秀檔次;對渤海、東海南部及北部灣的預報能力次之,為良好檔次;中國近海沿岸、菲律賓沿岸、日本沿岸及赤道西太平洋以中等偏上水平為主,但對個別沿岸地區(qū)的預報則相對較差。
相比24 h預報時效下模式預報能力,48 h預報能力有略微降低(見圖1b),主要表現(xiàn)在東海中北部、日本海及西北太平洋遠海的預報能力由優(yōu)秀檔次降到良好;中國近岸預報能力仍以中等偏上水平為主。72 h的預報能力則有明顯降低(見圖1c),但整體仍維持在中等以上水平,僅在個別華南沿岸、臺灣島西南沿岸、日本沿岸及菲律賓沿岸的預報相對較差。
3.2 貝葉斯概率預報實例
3.2.1 貝葉斯概率預報模型
基于貝葉斯理論,對中國近海1 425個漁區(qū)逐一進行處理,同時給出訂正后的最優(yōu)值及概率預報區(qū)間,完善預報信息。考慮到統(tǒng)計訂正方法需要大量樣本作為基礎(chǔ),訂正海域出現(xiàn)十級及以上風力事件偏少,因此本文只訂正風速≤25 m/s的過程;此外,依據(jù)2014年12月—2016年2月的再分析數(shù)據(jù)與預報數(shù)據(jù)建立的庫文件,當樣本庫中某一區(qū)間樣本數(shù)占總時次的比重低于5%時,也不對該預報值進行訂正,釋用方法不推薦。
圖1 西北太平洋不同預報時效下ECMWF模式海面風速技巧評分結(jié)果
圖2給出了本文所用的簡化貝葉斯概率預報模型流程圖。以283號漁區(qū)(位于臺灣海峽,24°~24.5°N,118.5°~119°E)24 h預報時效為例,詳細介紹簡化貝葉斯概率預報模型的建立。如圖3a,在283號漁區(qū),再分析數(shù)據(jù)與模式預報值具有顯著的線性關(guān)系,二者的聯(lián)合概率密度函數(shù)分布見圖3b。以預報值11.1 m/s為例,基于圖3b中的聯(lián)合概率密度分布,圖3c中給出了在該預報值范圍內(nèi)再分析場數(shù)據(jù)出現(xiàn)的可能分布概率及對應的發(fā)生次數(shù),當預報值為11.1 m/s時,再分析數(shù)據(jù)出現(xiàn)最大概率的確定預報為9 m/s,共出現(xiàn)次數(shù)為173次,我們將該最大概率的確定性預報值作為最優(yōu)訂正值。將該方法推廣到25 m/s界限以內(nèi)所有可能的預報值中,從而建立預報值與最優(yōu)訂正值之間一一對應關(guān)系(見圖3d)。此外,為了實現(xiàn)將確定性預報轉(zhuǎn)換為概率預報,通過設(shè)定某一出現(xiàn)概率閾值,從最大出現(xiàn)次數(shù)開始,依次累加,計算出現(xiàn)概率,當超過某一設(shè)定閾值時,得到概率預報的左右邊界值,隨后引入蒲氏風級表,同時結(jié)合預報員經(jīng)驗預報規(guī)律,將左右邊界值轉(zhuǎn)為風力等級。根據(jù)經(jīng)驗累積,在本文中概率閾值取60%,通過這種方式,將確定性預報轉(zhuǎn)化為概率預報,從而更加符合預報員及用戶的需求。3.2.2 貝葉斯概率預報產(chǎn)品
圖3 283號漁區(qū)24 h預報產(chǎn)品訂正過程
通過本文分析,最終呈現(xiàn)給一線預報員及用戶的釋用產(chǎn)品包括以下一些要素:ECMWF確定性預報,ECMWF模式評分,最優(yōu)訂正預報,概率區(qū)間預報,概率預報等級。其中,ECMWF確定性預報指ECMWF精細化預報在該漁區(qū)內(nèi)的最大風速;ECMWF模式評分分為5個檔次,見第2.3節(jié)預報結(jié)果檢驗與評估;最優(yōu)訂正值是通過概率預報得到的最優(yōu)確定性預報;概率區(qū)間預報給出了概率閾值超過60%的預報區(qū)間;根據(jù)概率預報區(qū)間的大小,來定義概率預報等級,劃分為5個檔次,一檔(interval≤1.0 m/s)、二檔(1.0 m/s<interval≤1.5 m/s)、三檔(1.5 m/s<interval≤2.0 m/s)、四檔(interval>2.0 m/s)和五檔(當模式預報值超出概率預報釋用的極大風速,如25 m/s,或者當樣本庫中該樣本數(shù)占總時次的比重低于5%時,概率預報釋用方法失效,歸為此檔;在此情況下,最優(yōu)訂正值和概率區(qū)間預報用缺測值-99.99表示)。
表1 最終產(chǎn)品示例(2016年6月19日12UTC的24 h預報)
以2016年6月19日12UTC的24 h預報時效為示例,表1給出了本文最終釋用產(chǎn)品。為進一步完善預報產(chǎn)品,圖4中分別給出了2016年6月19日12UTC的24 h預報示例中ECMWF模式預報評分(見圖4a)和概率預報等級(見圖4b)的統(tǒng)計結(jié)果,ECMWF模式預報結(jié)果約78.8%的漁區(qū)處于良好及優(yōu)秀檔次,約16.6%的漁區(qū)處于中等和及格檔次,僅有約4.6%的漁區(qū)預報較差。概率預報等級統(tǒng)計結(jié)果顯示,約83.6%的漁區(qū)概率預報區(qū)間間隔低于1.5 m/s,僅有約3.9%的漁區(qū)概率預報區(qū)間間隔高于2.0 m/s。
3.2.3 概率預報產(chǎn)品結(jié)果檢驗
采用上述產(chǎn)品釋用方法,進行準業(yè)務化運行,目前積累了兩個月(2016年3月和4月)的釋用產(chǎn)品,將同期再分析數(shù)據(jù)視為觀測數(shù)據(jù),通過計算預報準確率、空報率和漏報率來對概率預報產(chǎn)品結(jié)果進行檢驗。對全風速24 h、48 h及72 h預報準確率的統(tǒng)計如圖5所示,在中國近海大部分漁區(qū),24 h及48 h預報準確率可以達到90%以上,72 h預報準確率達到80%以上;在東海東部及臺灣島以東部分漁區(qū),預報準確率相對較低。考慮到海上漁船較為關(guān)注的是大風與大浪過程,只關(guān)注6級及以上大風過程,再次對大風概率預報進行檢驗。如圖6所示,24 h預報時效下,近海大部分漁區(qū)的大風預報準確率也能達到90%以上,且空報率低于10%,無漏報,說明該概率預報產(chǎn)品具有一定的可參考性,對預報員業(yè)務工作具有一定指導意義。
圖4 產(chǎn)品統(tǒng)計結(jié)果示例(2016年6月19日12UTC的24 h預報)
圖5 2016年3—4月的釋用產(chǎn)品中,全風速概率預報在不同時效下的預報準確率(單位:%)
圖6 2016年3—4月的釋用產(chǎn)品中,大風(6級及以上)概率預報在24 h時效下的預報產(chǎn)品
另外,我們也檢驗了釋用產(chǎn)品中最優(yōu)訂正值較ECMWF原始預報產(chǎn)品的優(yōu)劣。圖7a給出了全風速的精度檢驗結(jié)果,最優(yōu)訂正值改進效果不明顯,1 425個漁區(qū)24 h最優(yōu)訂正值評分與模式結(jié)果評分相比基本在正負0.05之間,這與訂正前ECMWF模式對全風速的預報性能已經(jīng)較好有關(guān)(見圖1a)。同樣地將小風速過程剔除后,做風速≥5.5 m/s(4級及以上)的精度檢驗(見圖7b),24 h預報時效下,在巴士海峽、南海東北部及北部灣的預報性能提高較為明顯,模式評分增值超過0.1;48 h、72 h預報時效均有類似的特征(圖略),表明該釋用方法對預報性能具有一定的改善效果。
圖7 24 h海面風最優(yōu)訂正值預報評分與ECMWF預報評分的差異
圖8 基于中國近海浮標對ERA-Interim再分析風場數(shù)據(jù)的檢驗
4.1 結(jié)論
基于貝葉斯統(tǒng)計理論,本文把ECMWF數(shù)值模式的單一確定性風場預報轉(zhuǎn)化為概率預報,并實現(xiàn)準業(yè)務化試運行,為初步構(gòu)建海洋風場網(wǎng)格化業(yè)務預報體系奠定基礎(chǔ)。通過對釋用產(chǎn)品結(jié)果的檢驗,得到如下結(jié)論:
(1)在對轉(zhuǎn)換后的概率預報釋用中,其既可作為確定性預報對外發(fā)布,也可以概率形式對外發(fā)布。因此,貝葉斯概率預報能夠提供更為全面、更高精度的預報,也更加符合預報員及用戶的需求;
(2)對概率預報釋用產(chǎn)品的檢驗表明,對全風速預報,貝葉斯概率預報準確率均較高,可以達到90%以上。對6級及以上大風的預報,貝葉斯概率預報的準確率也較高,且空報率低,無漏報;
(3)對釋用產(chǎn)品中最優(yōu)訂正值的精度檢驗表明,對4級及以上風速的精度預報,在部分漁區(qū)預報性能較ECMWF的確定性預報略有改善。
4.2 討論
本文工作是面向中國近海1 425個漁區(qū),考慮到其覆蓋范圍廣,時空分辨率高的特點,本文選用精度較高的再分析數(shù)據(jù)ERA-Interim作為觀測值進行分析。那么,再分析數(shù)據(jù)的質(zhì)量則備受關(guān)注。通過對比2014年中國近海22個浮標數(shù)據(jù),發(fā)現(xiàn)(見圖8),再分析數(shù)據(jù)對離岸風場的刻畫效果相對較好,技巧評分維持在及格及中等檔次,但對近岸風場的刻畫整體較差。因此,在后期工作中有必要基于再分析數(shù)據(jù),采用合適的方法融合浮標及衛(wèi)星數(shù)據(jù),提高“觀測值”的精度。
考慮到業(yè)務預報的時效性、穩(wěn)定性等需求,本文選用了簡化的貝葉斯統(tǒng)計理論來實現(xiàn)單一預報向概率預報的轉(zhuǎn)化。后期仍需不斷調(diào)研國內(nèi)外最新概率預報方法,改進目前的概率預報方法,完善網(wǎng)格化業(yè)務預報平臺。
目前,釋用產(chǎn)品結(jié)果累積年月較少,得出相對穩(wěn)定和可靠的檢驗結(jié)論仍需要后期進一步系統(tǒng)測試。
[1]Gneiting T,Raftery A E,Westveld III A H,et al.Calibrated probabilistic forecasting using ensemble model output statistics and minimum CRPS estimation[J].Monthly Weather Review, 2005,133(5):1098-1118.
[2]Wilks D S.Extending logistic regression to provide full-probabilitydistribution MOS forecasts[J].Meteorological Applications,2009, 16(3):361-368.
[3]Raftery A E,Gneiting T,Balabdaoui F,et al.Using Bayesian model averaging to calibrate forecast ensembles[J].Monthly Weather Review,2005,133(5):1155-1174.
[4]Hamill T M,Whitaker J S.Probabilistic quantitative precipitation forecasts based on reforecast analogs:Theory and application[J]. Monthly Weather Review,2006,134(11):3209-3229.
[5]周秀驥.大氣隨機動力學與可預報性[J].氣象學報,2005,63(5): 806-811.
[6]Kelly K S,Krzysztofowicz R.Bayesian revision of an arbitrary prior density[C]//Proceedings of the Section on Bayesian Statistical Science.Alexandria:American Statistical Association,1995:50-53.
[7]Kelly K S,Krzysztofowicz R.A bivariate meta-Gaussian density for use in hydrology[J].Stochastic Hydrology and hydraulics, 1997,11(1):17-31.
[8]俞小鼎,張藝萍.天氣預報技巧和價值的關(guān)系[J].氣象科技, 2004,32(6):393-398.
[9]陳朝平,馮漢中,陳靜.基于貝葉斯方法的四川暴雨集合概率預報產(chǎn)品釋用[J].氣象,2010,36(5):32-39.
[10]陳法敬,矯梅燕,陳靜.亞高斯貝葉斯預報處理器及其初步試驗[J].氣象學報,2011,69(5):872-882.
[11]Herr H D,Krzysztofowicz R.Generic probability distribution of rainfall in space:The bivariate model[J].Journal of Hydrology, 2005,306(1-4):234-263.
[12]Taylor K E.Summarizing multiple aspects of model performance in asingle diagram[J].JournalofGeophysicalResearch: Atmospheres,2001,106(D7):7183-7192.
[13]Hirota N,Takayabu Y N,Watanabe M,et al.Precipitation reproducibility over tropical oceans and its relationship to the double ITCZ problem in CMIP3 and MIROC5 climate models[J]. Journal of Climate,2011,24(18):4859-4873.
[14]Chen L,Yu Y Q,Sun D Z.Cloud and water vapor feedbacks to the El Ni?o warming:Are they still biased in CMIP5 models?[J]. Journal of Climate,2013,26(14):4947-4961.
Probabilistic forecast of gridding 10 meter wind over China sea based on Bayesian theory
SONG Yi,SONG Xiao-jiang,GAO Zhi-yi,ZHANG Zhi-hua,LI Min
(National Marine Environmental Forecasting Center,Beijing 100081 China)
Based on Bayesian theory,a basic model of the probabilistic forecast was established out of the deterministic forecast of European Centre of Medium-Range Weather Forecast(ECMWF).The probability forecast from March to April 2016 was evaluated by using ERA-Interim.The results show that the probability forecasts of both all wind and strong wind have better forecast values over China sea.This study not only provides a guidance forecast for forecaster and user,but also lays the foundation for building gridding operational forecast system of 10 meter wind over China sea.
Bayesian theory;probabilistic forecast;gridding;operational forecast
P732
A
1003-0239(2017)03-0001-09
10.11737/j.issn.1003-0239.2017.03.001
2016-08-15;
2016-10-24。
國家自然科學基金青年基金(41606033)。
宋毅(1988-),男,工程師,博士,主要從事海洋天氣預報及年代際氣候變率研究。E-mail:songy@mail.iap.ac.cn