林奕桐, 葉駿菲, 王永前, 鐘仕全
(1.南寧市氣象局,南寧 530022; 2.邕寧區(qū)氣象局,南寧 530022; 3.成都信息工程大學(xué),成都 610225;4.廣西壯族自治區(qū)氣象減災(zāi)研究所/國家衛(wèi)星中心遙感應(yīng)用實(shí)驗(yàn)基地,南寧 530022)
大氣水汽含量及其變化是天氣和氣候的主要驅(qū)動力[1],傳統(tǒng)的水汽含量需要通過探空獲取,但對于邊遠(yuǎn)地區(qū),獲取探空資料非常困難,因此使用遙感手段獲取大氣水汽含量十分重要[2]。遙感水汽產(chǎn)品已經(jīng)獲得了廣泛的應(yīng)用,例如局地暴雨預(yù)報(bào)[3]、人工增雨指導(dǎo)[4]和天氣系統(tǒng)移動過程分析[5]等。
MODIS是搭載于美國發(fā)射的太陽同步軌道系列衛(wèi)星TERRA和AQUA上的主要傳感器,它具有36個光譜通道,分布在0.4~14 μm的電磁波譜范圍內(nèi)。常用的MODIS水汽產(chǎn)品為近紅外和熱紅外水汽產(chǎn)品。與熱紅外方法相比,近紅外方法具有較高的反演精度。但是近紅外水汽反演方法僅適用于白天,相比之下,能實(shí)現(xiàn)白天夜晚雙時段觀測的熱紅外水汽數(shù)據(jù)更適合業(yè)務(wù)應(yīng)用。因此,提高熱紅外水汽反演結(jié)果的精度,有著非常重要的意義。
傳統(tǒng)的熱紅外水汽反演方法是利用迭代回歸得到大氣濕度廓線,將其積分,得到水汽含量,在MODIS業(yè)務(wù)化水汽產(chǎn)品中,也常用到分裂窗算法[6-7]。學(xué)者對此已開展過研究。Chang等[8]對比了美國南加利福尼亞的MODIS熱紅外水汽產(chǎn)品數(shù)據(jù)和GPS水汽數(shù)據(jù),均方根誤差(root mean square error,RMSE)為4.07 mm; Liu等[9]對比了中國2012年全年的MODIS熱紅外水汽產(chǎn)品數(shù)據(jù)和探空水汽數(shù)據(jù),白天RMSE為6.02 mm,夜晚RMSE為5.81 mm。
傳統(tǒng)的熱紅外水汽反演方法很大程度上依賴于最初選擇的溫濕廓線,當(dāng)?shù)乇頊囟扰c邊界溫度比較接近時,結(jié)果會有較大的誤差[10],且該方法對區(qū)域水汽空間分布和下墊面情況的要求較為苛刻[11]。而投影尋蹤模型是一種集主成分分析、特征提取和數(shù)據(jù)壓縮為一體的綜合分析技術(shù),具有穩(wěn)健性、抗干擾性和準(zhǔn)確度高等優(yōu)點(diǎn)[12]。因此,本文嘗試通過MODIS熱紅外數(shù)據(jù)結(jié)合投影尋蹤模型進(jìn)行大氣水汽含量的反演。
本文選擇的研究區(qū)域?yàn)槊绹喜康貐^(qū)及中國山西省。美國南部地區(qū)屬亞熱帶氣候區(qū),夏季較為炎熱,冬季溫暖,全年降水充足; 山西省屬于溫帶大陸性季風(fēng)氣候,夏季南長北短,雨水集中,冬季漫長,寒冷干燥。文中采用MODIS數(shù)據(jù)進(jìn)行研究。其中使用MOD02數(shù)據(jù)進(jìn)行亮溫反演,并代入投影尋蹤模型進(jìn)行水汽反演,使用MOD05數(shù)據(jù)進(jìn)行對比。MOD02即MODIS_L1B數(shù)據(jù),是MODIS原始數(shù)據(jù)經(jīng)過輻射校正后的產(chǎn)品,MOD05是MODIS的水汽產(chǎn)品,其中包括了熱紅外和近紅外2種。
水汽反演結(jié)果的驗(yàn)證數(shù)據(jù)及投影尋蹤模型的學(xué)習(xí)數(shù)據(jù)為SuomiNet實(shí)驗(yàn)測得的全球定位系統(tǒng)(global positioning system,GPS)水汽數(shù)據(jù)和北京市城市氣象研究所提供的GPS水汽數(shù)據(jù)。SuomiNet是由美國國家科學(xué)基金會資助,通過相關(guān)高校之間的合作建立的實(shí)時GPS地基觀測網(wǎng)絡(luò),用于大氣科學(xué)研究[13]。其在北美分布有近300個監(jiān)測站點(diǎn),每個站點(diǎn)利用GPS信號進(jìn)行大氣水汽反演,時間分辨率為0.5 h,在每小時的15分和45分進(jìn)行監(jiān)測。中國華北地區(qū)建立了較為完整的地基GPS觀測網(wǎng),中國氣象局北京城市氣象研究所實(shí)現(xiàn)了華北地區(qū)地基GPS觀測資料的實(shí)時解算,數(shù)據(jù)時間分辨率為0.5 h。本文利用了山西省境內(nèi)的59個GPS站點(diǎn)觀測的水汽數(shù)據(jù)。
水汽對10.8 μm和12 μm波長輻射的吸收有差異,因此,可以利用分裂窗算法對這2個波段進(jìn)行計(jì)算,從而得出水汽含量[14]。當(dāng)?shù)乇砑按髿獍l(fā)射率為常數(shù),或空間變化較小時,輻射亮度的空間變化可以表示為[15]
(1)
對普朗克公式進(jìn)行一階泰勒展開,可以得到
(2)
結(jié)合公式(2)對公式(1)進(jìn)行化簡,并用最小二乘法分析,可得到2通道透過率的比值形式,即
(3)
式中τj和τi分別為2個熱紅外通道i和j的透過率。
投影尋蹤算法的基本思想是把高維數(shù)據(jù)通過某種組合投影到低維子空間上,對于投影到的構(gòu)形,采用投影指標(biāo)函數(shù)來衡量投影暴露某種結(jié)構(gòu)的可能性大小,尋找出使投影指標(biāo)函數(shù)達(dá)到最優(yōu)(即能反映高維數(shù)據(jù)結(jié)構(gòu)或特征)的投影值,根據(jù)該投影值分析高維數(shù)據(jù)的結(jié)構(gòu)特征[17-18]。將投影尋蹤與回歸分析相結(jié)合,則形成投影尋蹤回歸(projection pursuit regression,PPR)分析技術(shù),其實(shí)現(xiàn)方法如下[19]:
設(shè)x是p維隨機(jī)變量,y=f(x)是一維隨機(jī)變量,為了避免線性回歸不能反映實(shí)際非線性情況的矛盾,PPR用式(4)表示的一系列嶺函數(shù)Gm(Zm)的“和”去逼近回歸函數(shù)f(x),即
(4)
式(4)可以寫成矩陣表示形式,即
(5)
李祚泳等[19]采用了易于實(shí)現(xiàn)的免疫進(jìn)化算法(immune evolutionary algorithm,IEA)優(yōu)化PPR模型中的參數(shù)。因此,PPR的參數(shù)優(yōu)化問題即是在滿足目標(biāo)極小化準(zhǔn)則條件下,采用IEA優(yōu)化式(5)中的參數(shù)矩陣{βm}1×M和{βmj}M×p(m=1,2,…,M;j=1,2,…,p)的問題。
(6)
3)抽取其余的自變量作為檢驗(yàn)樣本代入訓(xùn)練后的投影尋蹤模型,得到的結(jié)果與相對應(yīng)的WGPS數(shù)據(jù)作比較,并計(jì)算其誤差。
圖及WGPS的歸一化統(tǒng)計(jì)Fig.1 Normalization and WGPS
(a)T31與WGPS的關(guān)系 (b)T32與WGPS的關(guān)系
3.1.2WGPS與亮溫的四則運(yùn)算之間的關(guān)系
圖3 部分亮溫四則運(yùn)算及WGPS的歸一化統(tǒng)計(jì)Fig.3 Normalization of arithmetie of brightness temperature and WGPS
圖4WGPS與部分亮溫四則運(yùn)算的線性關(guān)系
Fig.4LinearrelationshipbetweenarithmetieofbrightnesstemperatureandWGPS
本實(shí)驗(yàn)的目的在于測試各類代入變量,選取最優(yōu)的變量組合。變量組合應(yīng)滿足以下2個條件:
2)變量兩兩之間不能有重復(fù)因子,否則會影響模型對權(quán)重系數(shù)β的判斷。
結(jié)合SuomiNet提供的站點(diǎn)經(jīng)緯度坐標(biāo),在2015年8月6日美國南部地區(qū)的遙感影像上可以找到相應(yīng)的59個樣本點(diǎn)。從中隨機(jī)選取50組作為訓(xùn)練樣本,每組訓(xùn)練樣本均包含輸入變量和WGPS。其中輸入變量是自變量,來自于遙感影像;WGPS是因變量,來自于SuomiNet網(wǎng)站。將訓(xùn)練樣本代入投影尋蹤模型進(jìn)行學(xué)習(xí)訓(xùn)練。另外9組樣本作為反演樣本,僅將自變量代入模型,讓模型自行反演WGPS。
為了方便與傳統(tǒng)的模型相比較,實(shí)驗(yàn)下載了對應(yīng)時間的MOD05熱紅外水汽數(shù)據(jù),并從中選取了與9組反演樣本相對應(yīng)的像元點(diǎn),參與比較(圖5)。
圖5 美國南部地區(qū)水汽反演結(jié)果與WGPS對比Fig.5 Comparison between the inversion results of water vaporwith WGPS in the southern United States
由圖5可以看出,4組輸入變量代入模型后反演的水汽結(jié)果和MODIS熱紅外水汽含量數(shù)據(jù)均能將WGPS的趨勢較好地模擬出來,其中,MODIS熱紅外水汽產(chǎn)品與WGPS的RMSE為4.014 mm,W1與WGPS的RMSE為5.881 mm,W2與WGPS的RMSE為2.171 mm,W3與WGPS的RMSE為2.889 mm,W4的RMSE為2.990 mm。
根據(jù)中國山西省GPS觀測站點(diǎn)的地理坐標(biāo),在2011年7月27日的遙感影像上可以找到相應(yīng)的51個樣本點(diǎn),從中隨機(jī)選取42組作為訓(xùn)練樣本,9組作為反演樣本,采用與美國南部地區(qū)相同的方法進(jìn)行實(shí)驗(yàn),結(jié)果如圖6所示。
圖6 中國山西省水汽反演結(jié)果與WGPS對比Fig.6 Comparison between the inversion results of water vaporwith WGPS in Shanxi Province of China
山西省實(shí)驗(yàn)中MODIS熱紅外水汽產(chǎn)品與WGPS的RMSE為3.361 mm,W1,W2,W3,W4與WGPS的RMSE分別為1.480 mm,1.210 mm,1.442 mm和1.381 mm。
美國南部地區(qū)試驗(yàn)結(jié)果中,W1的誤差最大,大于MODIS熱紅外水汽數(shù)據(jù)的誤差,而W2,W3和W4誤差均小于MODIS熱紅外水汽數(shù)據(jù)的誤差。從山西省實(shí)驗(yàn)結(jié)果上看,4種變量組合反演精度總體相差不大,均小于MODIS熱紅外水汽數(shù)據(jù)的誤差。
為了驗(yàn)證投影尋蹤模型反演水汽的可推廣性,本文對美國南部地區(qū)及中國山西省分別做了水汽反演實(shí)驗(yàn)。
3.3.1 美國南部地區(qū)水汽反演實(shí)驗(yàn)
(a)WGPS與投影尋蹤模型預(yù)測水汽的相關(guān)性 (b)WGPS與MODIS熱紅外水汽的相關(guān)性 (c)WGPS與MODIS近紅外水汽的相關(guān)性
圖73組模型水汽反演結(jié)果與WGPS的相關(guān)性分析
Fig.7ComparisonbetweeninversionresultsofwatervaporinthreegroupswithWGPS
3.3.2 中國山西省水汽反演實(shí)驗(yàn)
(a)WGPS與投影尋蹤模型預(yù)測水汽相關(guān)性 (b)WGPS與MODIS熱紅外水汽相關(guān)性(c)WGPS與MODIS近紅外水汽相關(guān)性
圖8投影尋蹤模型水汽反演結(jié)果與WGPS的相關(guān)性分析
Fig.8ComparisonbetweenthePPRinversionresultsofwatervaporwithWGPS
由2次實(shí)驗(yàn)可以看出,在美國南部地區(qū),MODIS數(shù)據(jù)2種水汽產(chǎn)品的相關(guān)系數(shù)較高; 而在中國山西省,相關(guān)系數(shù)明顯降低,反演精度也有了不同程度的下降。而投影尋蹤模型反演的水汽無論在美國南部地區(qū)還是山西省均有較高的精度及相關(guān)系數(shù),在山西省的精度甚至高于美國南部地區(qū)。由此可見,本文提出的算法具有一定的實(shí)用性和可推廣性。
1)本文對MODIS熱紅外通道展開了研究,結(jié)合投影尋蹤模型,提出了一種新的遙感水汽反演算法。與傳統(tǒng)的MODIS水汽反演方法相比,該方法比熱紅外反演具有更高的精度,而比近紅外反演具有更高的時間分辨率,因此更具業(yè)務(wù)化推廣的潛力。
2)利用該算法對美國南部地區(qū)及中國山西省的大氣水汽含量進(jìn)行反演,并用GPS水汽觀測數(shù)據(jù)進(jìn)行驗(yàn)證。其中美國南部地區(qū)反演結(jié)果的RMSE為2.478 mm,中國山西省的RMSE為1.408 mm,均低于相應(yīng)熱紅外方法的RMSE,表明本文方法在2個實(shí)驗(yàn)區(qū)均能得到較好的反演結(jié)果。
4)實(shí)驗(yàn)中的數(shù)據(jù)樣本均取自大范圍晴朗無云的遙感影像。而在我國南方地區(qū)常有云覆蓋,在基于投影尋蹤模型的遙感水汽反演算法中如何減少云覆蓋的干擾還有待于做進(jìn)一步的研究。