摘要利用興義新一代多普勒天氣雷達CINRAD/CD復合體掃基數據及氣象產品風暴單體識別與跟蹤SCIT,對發(fā)生在黔西南地區(qū)的2007~2008年的冰雹天氣過程個例進行驗證、分析,分別從識別、跟蹤評估、位置預報3個方面進行評估分析,并進行了算法補嘗,提出了解決的辦法,在降低反射率因子識別的基礎上在時間關聯(lián)中增加一個方向性閾值,提取反射率因子水平結構ZSIGN、反射率因子空間變化率ZH、垂直累積液態(tài)含水量VIL、冰雹概率SHI 4個最能描述對流風暴特征的物理量,并對其分配權重,建立概率判別函數P,對2008年3月19日一次超級單體風暴的發(fā)展演變過程中P變化進行了分析,對2007~2008年的冰雹天氣過程重新進行評估,與算法改進前的評估效果進行對比分析,結果表明,算法改進后識別成功率有明顯上升,但對單體的跟蹤及位置預報效果不明顯。
關鍵詞冰雹云; 單體識別與跟蹤;算法評估;檢驗改進
中圖分類號S161;P412.25文獻標識碼
A文章編號0517-6611(2015)07-199-04
Hail Cell Identification and Tracking Algorithm for Assessment and Improvement
TANG Hao-peng (Meteorological Office of Southwestern Guizhou, Xingyi, Guizhou 562400)
Abstract Using the Xingyi new generation of Doppler weather radar complex scan data and storm cell identification and tracking algorithm, the hail weather courses occurring in southwest Guizhou Province in 2007 and 2008 were assessed from the three aspects: identification, tracking, location prediction. The unfavorable situation for algorithm assessment is made analysis and compensation and proposed solution. On the basis of lower the reflectivity thresholds and adding the direction thresholds in the time association, the four physical alteration were calculated including the level reflectivity gradient, the vertical reflectivity gradient, vertically integrated liquid water content, and the strong hail index, which can best describe the storm cell, then distributed the coefficient respectively. The probability distinction function P was established. Using the probability distinction function P, the supercell on March 19th, 2008, was analyzed, then the hail weather courses in 2007 and 2008 were re-assessed, and the comparative results show that the improved algorithm enhances the identification effect to some extent, but the effect of tracking and location prediction werent obvious.
Key words Hail cloud; Cell identification and tracking; Algorithm evaluation; Inspection and improvement
20世紀以來,國內外雷達氣象學者在雷達探測強對流天氣系統(tǒng)應用上做了大量的工作,特別是在如何探測強對流天氣系統(tǒng)上做了大量的努力,深入地分析了風暴發(fā)展、成熟、消亡及其移向移速的物理機制,提出了風暴的一些識別方法。如Rinchart提出應用模式來識別風暴單體及利用相關技術分析法對整幅回波圖像進行處理[1];Austin等提出了三維矩心識別方法[2],Rosefeld對這一方法進行改進,提出通過對風暴形狀的幾何推理來處理分裂和合并[3];Johnson等提出了利用7個反射率因子識別閾值來代替此前唯一的閾值及采取特征核抽取技術并對空間相距較近的多個風暴單體進行合并或刪除處理,該算法被WSR-88D的Build 9.0廣泛采用,稱為B9SI算法[4]。目前,我國的新一代天氣雷達大多使用WSR-88D的Build 9.0的風暴算法,即風暴單體識別與跟蹤算法,簡稱SCIT(Storm Cell Identification and Tracking)算法[5]。
隨著我國多普勒天氣雷達建設及業(yè)務組網的實施,用雷達來探測冰雹、暴雨等強對流天氣已經成為一種比較重要的手段,準確的風暴識別和跟蹤是雷達及強天氣預警業(yè)務的基本組成部分。雷達終端系統(tǒng)提供了反射率因子、平均徑向速度、譜寬3種基本數據產品,基本數據產品經過雷達產品生成器RPG(Radar Products Generator)處理后可生成39種產品[6],其中58號產品為風暴追蹤產品,采用的是風暴單體識別與跟蹤算法,但由于此算法設計是針對S波段的,而氣候及地理環(huán)境復雜的黔西南地區(qū)的雷達是C波段。針對 SCIT算法對CINRAD/CD雷達的應用效果如何、如何進行本地化問題,筆者在此利用興義新一代多普勒天氣雷達CINRAD/CD復合體掃基數據及氣象產品風暴單體識別與跟蹤SCIT,對發(fā)生在黔西南地區(qū)的2007~2008年的冰雹天氣過程個例進行驗證、分析。
1資料與分析
SCIT算法用于識別風暴單體并追蹤它的信息,其中包括移動方向、移動速度等。首先要在雷達徑向上找尋大的反射率因子區(qū),而后在二維錐面上找尋大的反射率因子區(qū),再給這些二維的分量尋求垂直相關。SCIT采用了多閾值識別、特征核抽取、2D單體識別和相近單體處理等多種新技術[7]。
筆者研究的區(qū)域是貴州省黔西南地區(qū)(以興義多普勒天氣雷達為圓心,半徑150 km),研究對象是發(fā)生在2007~2008年的冰雹天氣過程。由于雷達存在靜錐區(qū),距離太近探測不到風暴上層,會使探測效果降低,而受地球曲率和雷達自身探測能力的影響,超過150 km也會使探測效果降低[8],因此在此主要研究距雷達站中心10~150 km范圍內的對流單體。由于一次天氣過程中可能有多個不同類型的單體存在,故選取過程中產生冰雹或大于45 dBz的單體91個作為評估樣本。地面降雹時間、降雨量以鄉(xiāng)鎮(zhèn)雨量站記錄為準。
2算法評估
選取2007~2008年發(fā)生的20次冰雹天氣過程作統(tǒng)計分析,SCIT算法共識別出風暴單體257個,從中分離出91個對流旺盛的單體,首先選擇造成災害性天氣的風暴,其次選擇最大反射率因子超過45 dBz的風暴。這91個對流單體中有75個最終實況驗證為冰雹云,其余16個沒有降雹,用SCIT算法對這91個單體分別作識別、跟蹤、位置預報分析。
2.1單體識別的評估
為更好地量化評估效果,根據表1的列聯(lián)系數,這里引入命中率POD、誤警率FAR和臨界成功指數CSI,
其中POD=XX+Y、FAR=ZX+Z、CSI=XX+Y+Z。
表1中X代表冰雹事件發(fā)生,且SCIT算法探測到;Y代表冰雹事件發(fā)生,但SCIT算法沒有探測到;Z代表冰雹事件沒有發(fā)生,但SCIT卻探測到冰雹。命中率POD代表事件發(fā)生的總次數中SCIT探測到的次數所占的比率;誤警率FAR代表事件沒有發(fā)生的次數占SCIT探測總次數的比率;CSI代表POD和FAR的綜合效應[7]。
表1列聯(lián)系數
是否發(fā)生冰雹探測到冰雹沒有探測到冰雹
發(fā)生冰雹XY
未發(fā)生冰雹Z-
75個冰雹云單體中,SCIT探測到的個數為72個,另外,3個冰雹云沒有探測到, 16個非冰雹云單體中SCIT錯誤的探測到冰雹云10個,其余6個探測結果正確為“非冰雹云”。POD、FAR、CSI的具體評分結果分別為96.3%、11.4%、85.7%,可見SCIT算法對冰雹云識別較好,75個冰雹云中有72個被識別出來,約占96%,但存在漏報,有3個冰雹云未被識別出來;在非冰雹云的識別中,識別效果較差,16個非冰雹云單中僅有6個被正確識別,約為37.5%,相比而言誤差率較高,16個非冰雹云單體中有10個被誤報為冰雹云,誤報率為62.5%。對3個漏報的冰雹云進行分析,發(fā)現這3個冰雹云強度并不強,在45 dBz左右,單體之間間隔較小,面積較小,風場的輻合輻散及氣流的旋轉較強,且這3個漏報的冰雹云均是發(fā)生在8~9月;在誤報的這10個非冰雹云中,強度梯度較小,這10個非冰雹云強度較強,約為50 dBz,面積大,強中心面積相對小,且這誤報的10個非冰雹云均是發(fā)生在5~7月。
2.2單體跟蹤的評估
在單體跟蹤中最重要的是正確地進行時間關聯(lián),對在2個相繼體掃中識別的風暴單體進行時間相關處理以確定第一個被識別的風暴單體的路徑。先是一個體掃接一個體掃地跟蹤所有被識別單體的生命周期,再是確定不正確的時間關聯(lián)的個數并記下它們的特性,最后計算該算法正確跟蹤的單體占所有被跟蹤單體的百分比[7]。其中時間關聯(lián)的數量是單體從存在到消亡的全部體掃個數。對這91個單體樣本進行跟蹤評估,發(fā)現單體跟蹤評估(第1個正確時間關聯(lián)的百分比)較高,為92%,第2個正確時間關聯(lián)的百分比迅速下降,為80%,第3個正確時間關聯(lián)更低,僅為52%。
大多數時間關聯(lián)誤差發(fā)生在2個空間上挨得很近的單體上,特別是當這些挨得很近的單體正處于增長或衰退階段時更容易產生誤差。從2008年5月1日一次冰雹過程中的一個超級單體風暴的時間誤差的個例分析(圖1)可以看出,圖1a組合反射率因子的圖像上,風暴跟蹤信息顯示一個新的單體D0正在生成,在圖1b中,風暴跟蹤信息也顯示出了這個新的單體D0且錯誤地將它與正在消散的V0相聯(lián)系。
圖12008年5月1日18:59(a)和17:05(b)風暴跟蹤圖像個例(38號產品組合反射率因子上疊加58號產品風暴跟蹤信息)
2.3單體位置預報的評估
用選取的這91個單體(每個單體的生命史至少為2個體掃)對SCIT算法的單體位置預報精度進行分析,評估結果顯示,5 min的平均預報誤差最小,僅為2.2 km,15 min的平均預報誤差為5.8 km,而30 min的平均預報誤差較大,達9.6 km??梢?,預報時效與平均預報誤差呈正相關,預報時效愈長,則平均預報誤差愈大。
3算法改進與對比分析
3.1算法改進理論分析
SCIT算法使用反射率因子、風暴段的長度和風暴單體分量等閾值,且它要求在距雷達一定距離閾值范圍內至少相繼2個仰角的信息才能確定一個風暴單體。一個風暴段定義為一段連續(xù)的、沿著一個徑向的一系列距離庫。因此該算法不能識別以下3類單體:在徑向長度上或在面積上小的單體、最大反射率因子<30 dBz的單體、淺薄的不能通過幾個相繼仰角就消失的單體。如果風暴單體緊挨在一起,SCIT算法可能會將單體合并且將若干個緊挨著的單體識別為一個單體[7],對于識別出的風暴不能給出其內部對流情況,導致反射率因子強度較弱、但對流活躍的單體被遺漏,處理相近多單體時沒有優(yōu)勢[5]。在此在充分考慮了地理環(huán)境、氣候背景的前提下,針對識別效果不太理想的情況,提出解決的辦法,具體如下。
3.1.1降低識別閾值。將SCIT的7個反射率閾值降低一個等級(55、50、45、40、35、30、25 dBz)。
3.1.2在時間關聯(lián)中加上一個方向性閾值。當新舊單體相距很近時,由于前進方向上偏差很大,而新單體又在舊單體的距離閾值之內,所以這時很容易產生偏差,這樣這2個單體間的時間關聯(lián)是明顯不對的。這種類型的錯誤可以通過在時間關聯(lián)中加上一個方向性閾值來解決[7]。
3.1.3提取反射率因子水平梯度ZSIGN。ZSIGN提取了沿徑向上相鄰距離庫的反射率因子差的平均信息。若(Zi+1-Zi)>0,則ZSIGN=1;若(Zi+1-Zi)=0,則ZSIGN=0;若(Zi+1-Zi)<0,則ZSIGN=-1。
所以ZSIGN=Ni=1ZSIGNN。
通過統(tǒng)計設計出ZSIGN的隸屬函數,ZSIGN≥0.9的風暴對流旺盛,因此將超過0.9的ZSIGN值對應于最大匹配1,ZSIGN≤0.2的風暴隸屬函數匹配為0,0.2 F(ZSIGN)=1ZSIGN>0.9 1.11ZSIGN0.5 2.0(ZSIGN-0.2)0.2 0ZSIGN≤0.2 3.1.4提取反射率因子垂直梯度因子ZH[5]。風暴處于成熟階段時,其典型特征之一就是核區(qū)內反射率因子垂直遞減率接近于0,因此反射率因子垂直梯度接近0時,表示此時的風暴的對流性最強,相反,則表示風暴的對流性很弱。由于風暴在不同生命階段,其高度和強度是變化的,為此選擇在單體最大反射率因子上方4 km的厚度層內進行計算,若H2-H0≤4 km,ZH=-Z2-Z0H2-H0,否則,ZH=-Z1-Z0H1-H0。 當風暴處于成熟階段時,其隸屬函數對應于最大程度的匹配1,當遞減率遠大于0時,則匹配隸屬函數為0。具體數學表達式如下: F(ZH)=10≤ZH≤0.4 1-ZH-0.440.4 0ZH<0或ZH>5 3.1.5 垂直累積液態(tài)水含量[5]。在假設反射率因子是完全由液態(tài)水反射得到的前提下,垂直累積液態(tài)水表示將反射率因子數據轉換成等價的液態(tài)水值。該參數對于區(qū)分強雷暴有很好的利用價值,在此選取了風暴單體內的對流發(fā)展到成熟這一回波最強階段所對應的垂直累積液態(tài)水含量QVIL。根據歷史資料統(tǒng)計可知,當QVIL>35 g/m2產生冰雹的概率為100%,而當QVIL為15~35 g/m2不確定是否產生冰雹,而當QVIL<15時則一定不會產生冰雹。具體數學表達式如下: F(QVIL)=1QVIL>35 QVIL15-115 0QVIL≤15 43卷7期 唐浩鵬冰雹云單體識別與跟蹤算法評估及檢驗改進 3.1.6強冰雹指數SHI。強冰雹主要指冰雹尺寸>20 mm的冰雹,為了確定強冰雹的存在,主要采用類似于垂直累積液態(tài)含水量VIL算法的處理方法。首先引入強冰雹指數SHI的概念: SHI=0.1∫HTH0WTEdH,式中,WT為大氣溫度層結的權重函數,E為冰雹動能,H0為溶化層高度,HT為風暴單體頂高。由統(tǒng)計資料可知,當ZSHI>200 J/(m·s)時產生冰雹的概率為100%,而當ZSHI值為100~200 J/(m·s)時不確定是否產生冰雹,而當ZSHI<100時則一定不會產生冰雹[8]。具體數學表達式如下: F(ZSHI)=1ZSHI≥200 0.5100≤ZSHI<200 0ZSHI<100 在氣象預報中,一些預報量常分成若干級別或類別,可以利用不同因子的前期數據,尋找因子與預報量的關系,建立針對不同類型的預報時的方程式[9]:y=c1x1+c2x2+…+cpxp,此方程稱為判別方程,其中,y為新的變量,稱為判別函數,x1、x2、…、xp為前期因子,c1、c2、…、cp稱為判別系數,p為因子的數量。 在判別風暴單體識別與跟蹤時由于涉及到多個因子,因此,在降低反射率因子閾值及增加一個方向閾值的基礎上,構建反射率因子水平梯度ZSIGN、反射率因子垂直梯度因子ZH、垂直累積液態(tài)水含量、強冰雹指數SHI這4個因子為一個完備事件組,設它們概率和為1,建立判別概率函數P[10]:P=c1F(ZSIGN)+c2F(ZH)+c3F(VIL)+c4F(SHI)。 據統(tǒng)計資料可知這4個因子對風暴發(fā)展均有重要影響,因此在分配權重時,這4個因子被賦予相同的權重,即在這個公式中,c1=c2=c3=c4=0.25。根據每一個物理因子所描述的對流特征,利用隸屬函數計算該因子與其所描述的對流性特征相匹配的概率P。 選取2008年3月19日一次降雹天氣過程(18:02~21:47),對此過程中的一個降雹超級單體風暴演變過程用判別概率函數P進行計算,從其降雹前、降雹中、降雹后P變化(圖2)可以看出,概率函數P在18:21~18:40和19:11~19:23內有明顯的增長,這與雷達產品VIL、組合反射率因子、冰雹概率等產品分析出的2次增長過程相對應,在19:23~19:36對流指數最大,達100%,與之相對應的地面此時正在降冰雹;之后對流指數在維持較高一段時間后,開始減弱,雷達觀測數據顯示,對應的回波高度、VIL明顯降低,速度場氣流趨于平穩(wěn),下沉氣流逐漸占主導地位,但強度場變化不明顯,短期內仍維持一個較高的數值。 3.2算法改進前后評估結果對比分析 在SCIT算法的基礎上,增加上述提出的6個改進因子對這91個單體重新進行評估,評估結果與改進前的效果進行對比分析,結果顯示,改進后的評估效果有所提高,其中,算法改進后識別率評估效果較之其他兩項稍好,提高了9.3%,而單體跟蹤評估(第1個正確時間關聯(lián)的百分比)及15 min單體位置評估提高率分別為2%、0.1 km,效果較差[11]。單體的識別臨界成功指數雖然明顯提高,但也會產生一些空報及漏報,91個單體中有85個被準確識別,其中,75個冰雹云中有1個被漏報,這個漏報單體強中心面積小,強度梯度小,時間位于夏末秋初,速度場氣流環(huán)境結構不太穩(wěn)定。16個非冰雹云中仍有5個被誤報為冰雹云,這5個單體的強中心強度均為50 dBz以上,強中心面積較大,但強度梯度小,回波整體面積大,速度場氣流環(huán)境場結構較穩(wěn)定,時間均位于5~7月[12]。由于此次算法改進中6項中只有一項考慮了單體的移動,所以此次算法對單體的跟蹤及位置預報改進效果較差。
圖22008年3月19日一個超級單體風暴演變過程中的判別概率函數P變化
4小結
通過增加上述6個改進后,對單體二次評估可知效果有所提高,但仍有誤差,特別是對單體的跟蹤及位置預報提高效果不明顯。其誤差原因是多種原因造成的,不僅在于算法本身,還與地理環(huán)境、天氣環(huán)流背景、雷達初始基數據的精確性等有關[13]。
適當降低反射率因子閾值會導致虛報率的提高,究竟閾值多少是最合適的,是因地而異的,且因季節(jié)的不同也會導致閾值的不同,即使是同一部雷達在同一個地方探測,它的反射率因子閾值也會因季節(jié)、參數、地理、環(huán)流背景、中小尺度系統(tǒng)的不同而有所改變。究竟反射率閾值為多少才是最合適的,要依靠大量的統(tǒng)計數據來進行分析總結。另外,在時間關聯(lián)中加上一個方向性閾值,可以提高風暴跟蹤信息,
但增加方向性閾值只是其中一個方向,還有更多的方向需要深入探討,如譜寬資料、徑向速度等。判別概率函數P的建立在一定程度上給出了識別冰雹云的綜合指標,但其匹配隸屬函數及其權重如何確定是一個復雜的問題,各個因子作出的貢獻如何界定,對于不同類型的單體又如何加以細分,這些都是以后進一步研究的方向。
參考文獻
[1]
RINCHART R E.A pattern recognition technique for use with convention weather radar to detemine internal storm motion,rencent progress in radar meteorology[J].Atmospheric Tech,1981,13:119-134
[2] AUSTIN G L,BELLON.Very short-range forecast of precipitation by the objective extrapolation of radar and satelite data[M]//BRONING K.Nowcasting. Academic Press,1982:177-190.
[3] ROSEFELD D.Object method for analysis and tracking of convective cells as seen by radar[J] .J Atmos Oceanic Tech,1987,4:422-434.
[4] JOHNSON J T,MAC KEEN P L,WITT A,et al.The storm cell identification and tracking algorithm:an enhanced WSR-88D algorithm[J].Weather and Forecasting,1998,13:263-276.
[5] 胡勝,顧松山,莊旭東,等.風暴的多普勒雷達自動識別[J].氣象學報,2006,64(6):797-808.
[6] 王芬,李腹廣,李赟.新一代多普勒天氣雷達CINRAD/CD產品數據缺報原因分析[J].氣象與環(huán)境科學,2010,33(4):84-88.
[7] 俞小鼎,姚秀萍,熊廷南,等.多普勒天氣雷達原理與業(yè)務應用[M].北京:氣象出版社,2005:187-197.
[8] 王芬,李腹廣.多普勒天氣雷達冰雹探測算法評估及檢驗改進[J]. 氣象科技,2009,37(3):345-348.
[9] 黃嘉佑. 氣象統(tǒng)計分析與預報方法[M]. 北京:氣象出版社,2004.
[10] 袁蔭棠.概率論與數理統(tǒng)計[M].北京:中國人民大學出版社,2005.
[11] 王爽,呂環(huán)宇,郭志剛,等. 一次強降水超級單體風暴過程分析氣象與環(huán)境學報[J].氣象與環(huán)境學報,2007, 23(2):15-20.
[12] 張維全,李聞生,李洋. 新一代天氣雷達VIL產品修正方法初探[J].氣象與環(huán)境學報,2006,22(2):11-17.
[13] 王錫軍.大連地區(qū)一次暴雨過程雷達回波分析[J].氣象與環(huán)境學報,2001,17(2):12-13.