王 佳,李 瓊,魏加華,3*
(1.青海大學水利電力學院,青海 西寧 810016;2.三江源生態(tài)與高原農(nóng)牧業(yè)國家重點實驗室,青海大學, 青海 西寧 810016;3.清華大學水沙科學與水利水電工程國家重點實驗室,北京 100084)
大氣可降水量(Precipitable Water Vapor,PWV)表示地面至大氣頂界垂直空氣柱中全部水汽凝結后在氣柱底面上形成的液態(tài)水深度[1]。PWV作為水汽含量的衡量標準,對監(jiān)測及預報全球或局地氣候變化及中小尺度惡劣天氣至關重要[2-5]。無線電探空儀、GNSS(Global Navigation Satellite System,GNSS)和遙感探測是大氣可降水量觀測的主要手段。無線電探空儀精度高,但時間分辨率較低,多用于精度的驗證;GNSS具有高精度、低費用、時間分辨率高的優(yōu)勢[6-9],但空間分辨率受地面觀測站點密度的影響較大。遙感衛(wèi)星探測數(shù)據(jù)覆蓋廣,空間分辨率較高。MODIS水汽產(chǎn)品空間分辨率可達到1 km[10-11],但其受天氣條件與搭載的傳感器性能等影響精度有限[12],需要進一步的精度校正。
結合地基探測數(shù)據(jù)對遙感水汽產(chǎn)品進行校正,以獲得更高時空分辨率、更高精度的數(shù)據(jù)是目前大氣可降水量數(shù)據(jù)獲取的一種有效方式。曹艷豐等[13]、方圣輝等[14]研究了不同區(qū)域GNSS PWV數(shù)據(jù)與MODIS PWV數(shù)據(jù)間的線性關系,并建立了回歸模型,對MODIS PWV數(shù)據(jù)進行校正并獲得了高精度的可降水量數(shù)據(jù)。但由于影響可降水量的因素較多,簡單的線性回歸模型在地形復雜區(qū)域適用性會降低。神經(jīng)網(wǎng)絡模型具有很強的容錯性以及自學習、自組織與自適應能力,可以模擬復雜的非線性映射,使得環(huán)境噪聲(氣溶膠、云等)的影響降到最低。
獲得高精度且連續(xù)的可降水量數(shù)據(jù),對研究區(qū)域氣候的變化,評估降水潛力具有非常重要的作用。本文采用線性回歸與BP(Back Propagation,BP)神經(jīng)網(wǎng)絡方法,建立利用GNSS PWV數(shù)據(jù)校正MODIS PWV數(shù)據(jù)的模型,并利用探空數(shù)據(jù)檢驗模型的校正效果。
青海省位于中國西北地區(qū)中南部,青藏高原東北部,處于氣候變化的敏感區(qū)。氣候類型復雜多樣,具有明顯的高原氣候特征,寒冷干燥,太陽輻射強,氣溫日較差較大[15]。青海省復雜的下墊面對地氣間能量和水分交換過程有重要影響,從而影響水汽的時空分布變化。
研究采用的數(shù)據(jù)包括無線電探空數(shù)據(jù)、地基GNSS反演的PWV數(shù)據(jù)和MODIS PWV數(shù)據(jù)(2016年)。無線電探空站在青海省內有玉樹、西寧、格爾木和都蘭4個站點,每日觀測兩次,數(shù)據(jù)來源于懷俄明大學(http://weather.uwyo.edu/wyoming/),用SOUNDING表示。地基GNSS站在青海省內有15個連續(xù)運行的站點,時間分辨率為1 h,數(shù)據(jù)來源于中國地震局GNSS數(shù)據(jù)產(chǎn)品服務平臺(http://www.cgps.ac.cn)。無線電探空站和GNSS站點具體信息如表1所示。
表1 地面站點信息Tab.1 Information of ground station
MODIS數(shù)據(jù)來自EOS系列衛(wèi)星中TERRA衛(wèi)星上搭載的中分辨率光譜成像儀反演得到的MOD05產(chǎn)品,數(shù)據(jù)下載地址為https://modis.gsfc.nasa.gov/。研究使用的近紅外水汽產(chǎn)品空間分辨率為1 km×1 km,每天只有1幅觀測圖像,本研究選取GNSS與MODIS時間相匹配的數(shù)據(jù)。
1.2.1 線性回歸分析法 線性回歸是利用數(shù)理統(tǒng)計中回歸分析的方法,來確定兩種或兩種以上變量間相互依賴的定量關系,被廣泛應用于氣象水文領域[16]。對MODIS PWV進行校正時,以月為尺度進行模型構建,式(1)為本研究采用的線性回歸模型表達式:
PWVGNSS=PWVMODIS×a+b
(1)
式中:PWVGNSS、PWVMODIS分別為GNSS PWV的值與MODIS PWV的值,a為模型系數(shù),b為常數(shù)。
1.2.2 BP神經(jīng)網(wǎng)絡 BP神經(jīng)網(wǎng)絡又被稱為誤差反向傳播神經(jīng)網(wǎng)絡,是一種多層的前向神經(jīng)網(wǎng)絡[17-18],具有自適應學習性,可以模擬輸入—輸出間的非線性關系,減少缺測值對模型的影響。本文以GNSS站點經(jīng)緯度為中心,篩選3×3窗口范圍內的MODIS PWV與相應的GNSS PWV進行匹配,建立數(shù)據(jù)集,并將其以7∶3的比例隨機抽取分為訓練集與測試集。如圖3所示,以對應的MODIS PWVn及其經(jīng)緯度(lonn,latn)為輸入,經(jīng)輸入層i,根據(jù)權值W(i,j)和隱藏層閾值a,計算得到隱藏層j的輸出Zq。再經(jīng)由權值V(j,k)和輸出層閾值b計算得到神經(jīng)網(wǎng)絡預期輸出,與期望輸出GNSS PWV及其經(jīng)緯度(lon′,lat′)比較并計算網(wǎng)絡預測誤差,根據(jù)計算得來的誤差更新權值和閾值,直到誤差減小到預期范圍,結束迭代,網(wǎng)絡訓練結束。另外,為了減少數(shù)據(jù)之間量級的差異對網(wǎng)絡精度的影響,在訓練前先將數(shù)據(jù)進行歸一化。
Wang等[19]利用GNSS PWV對MODIS PWV數(shù)據(jù)的精度做過驗證,表明GNSS PWV與MODIS PWV間存在良好的相關性且GNSS PWV精度更高,但GNSS PWV的空間分辨率不足;而MODIS PWV空間連續(xù)且覆蓋范圍大,但精度略差。本文利用玉樹(QHYS)、格爾木(QHGE)、西寧(XNIN)和都蘭(QHDL)4個無線電探空站點數(shù)據(jù)計算GNSS PWV與MODIS PWV數(shù)據(jù)的均方根誤差(RMSE)、平均絕對誤差(MAE)、平均相對誤差(MRE)和相關系數(shù)(r)對青海省內的GNSS PWV與MODIS PWV做簡單的精度評估。
根據(jù)表2中計算得到各個站點的誤差可以發(fā)現(xiàn),GNSS PWV數(shù)據(jù)平均偏差為1~2 mm,相關系數(shù)除都蘭站外均為0.9~1,顯示GNSS PWV數(shù)據(jù)與探空數(shù)據(jù)之間較強的相關性。而MODIS PWV數(shù)據(jù)相較GNSS PWV數(shù)據(jù)整體偏差較大,平均偏差為1~6 mm,存在校正的必要性。
表2 GNSS PWV與MODIS PWV原始數(shù)據(jù)精度評估表Tab.2 Accuracy evaluation of original data of GNSS PWV and MODIS PWV
如圖2所示,4個站點的GNSS PWV與探空數(shù)據(jù)相關性高,存在良好的線性關系,玉樹,格爾木,西寧3個站點GNSS PWV數(shù)據(jù)與探空數(shù)據(jù)在30 mm以下均保持著很強的相關性,但都蘭站GNSS PWV數(shù)據(jù)與探空數(shù)據(jù)僅在10 mm以下的相關性比較強,這與都蘭站的觀測受到氣候影響有關。而相對于GNSS PWV而言,圖3中MODIS PWV數(shù)據(jù)與探空數(shù)據(jù)的相關性整體偏弱,說明MODIS PWV數(shù)據(jù)較GNSS PWV數(shù)據(jù)偏差大,精度低。
為了檢驗GNSS PWV與MODIS PWV的相關性,從15個GNSS站點中隨機選取幾個站點研究各站點之間PWV的趨勢變化及相關性(圖4)。
在圖4a中,選取站點為德令哈、格爾木和西寧,可以看出,這些站點的MODIS PWV與GNSS PWV變化趨勢基本相同,都呈現(xiàn)中間(夏季)高,兩邊(冬季)低的特征。由圖4b至圖4d可知,德令哈、西寧和沱沱河單個站點的GNSS PWV與各自對應區(qū)域的MODIS PWV均有良好的相關性。由此得出,MODIS PWV數(shù)據(jù)與GNSS PWV數(shù)據(jù)之間整體都有比較好的相關性,為利用GNSS PWV數(shù)據(jù)校正MODIS PWV數(shù)據(jù)提供了基礎。
GNSS數(shù)據(jù)存在缺失情況,剔除缺測值后,將15個地基GNSS站2016年的數(shù)據(jù)與MODIS PWV數(shù)據(jù)按月匹配,根據(jù)式(1)中的方法,計算系數(shù),得到基于最小二乘法的各月的回歸模型(表3)。
表3 逐月回歸模型Tab.3 Monthly regression model
本文在進行BP神經(jīng)網(wǎng)絡建模時,根據(jù)MODIS PWV與GNSS PWV數(shù)據(jù)的特性,利用站點的GNSS PWV校正部分區(qū)域內的MODIS PWV。神經(jīng)網(wǎng)絡模型的構建主要有以下幾個步驟:
(1)數(shù)據(jù)的導入與劃分。根據(jù)融合數(shù)據(jù)的特性,以GNSS PWV數(shù)據(jù)的經(jīng)緯度為中心的,將需要校正的數(shù)據(jù)(MODIS PWV)與目標數(shù)據(jù)(GNSS PWV)根據(jù)經(jīng)緯度匹配,建立數(shù)據(jù)集,并按照訓練數(shù)據(jù)70%,測試數(shù)據(jù)30%的比例進行劃分。
(2)確定隱藏層個數(shù)。輸入層神經(jīng)元設定為9,輸出層神經(jīng)元為1。隱藏層神經(jīng)元個數(shù)根據(jù)經(jīng)驗公式確定取值范圍為[3,13],經(jīng)過測試并考慮到模型的復雜度且避免過擬合的需求,最終確定隱藏層神經(jīng)元個數(shù)為10。
(3)網(wǎng)絡初始化。給各連接權值分別賦值(-1,1)之間的隨機數(shù),設定激活函數(shù)為sigmod函數(shù),損失函數(shù)應用RMSE函數(shù)。最后經(jīng)過調整學習率μ為1.5,控制誤差ε在0.05范圍內。
利用玉樹、西寧、格爾木、都蘭4個探空站數(shù)據(jù)對兩組模型校正后的MODIS PWV數(shù)據(jù)進行評價,分析其校正效果。由圖5可以看出利用兩種模型得到的校正后數(shù)據(jù)的均方根誤差與平均絕對誤差皆逐漸減小。
由表4可以看出,線性回歸結果中玉樹、西寧、格爾木3個站點較都蘭效果更好,均方根誤差平均降低了1.24 mm,平均絕對誤差平均降低了1.1 mm,平均相對誤差平均降低了13%。整體校正效果較好,但在都蘭地區(qū)校正效果不太明顯,均方根誤差降低了0.6 mm,平均絕對誤差降低了0.47 mm,平均相對誤差降低了僅4%。考慮到青海地區(qū)地理面積大,但站點稀疏、站點間海拔相差較大,對線性回歸模型存在影響。所以在不同站點上對MODIS PWV數(shù)據(jù)的校正結果存在一定差異性。從計算結果來看,線性回歸校正模型在青海地區(qū)對數(shù)據(jù)的精度提升有一定的效果,但是,BP神經(jīng)網(wǎng)絡模型校正后的MODIS PWV數(shù)據(jù)精度評價效果更好,與未校正前的數(shù)據(jù)相比,均方根誤差平均降低了2.46 mm,平均絕對誤差平均降低了0.947 mm,平均相對誤差平均降低了19.25%??傊?,具有自適應性的BP神經(jīng)網(wǎng)絡模型對MODIS PWV數(shù)據(jù)的校正效果更好。
表4 MODIS數(shù)據(jù)校正前后精度評價表Tab.4 Accuracy evaluation of MODIS data before and after correction
大氣可降水量反映了區(qū)域水汽條件和降水潛力。青海省地域廣闊,地形復雜,大氣可降水量差異顯著,獲得高精度且空間連續(xù)的大氣可降水量對區(qū)域生態(tài)、農(nóng)業(yè)生產(chǎn)、水資源管理等具有重要意義。方圣輝等[14]僅根據(jù)4個地面站點對全國范圍的大氣可降水量建立了線性回歸分析模型,僅僅提高了精度并不能反映連續(xù)的空間變化。而曹艷豐等[13]、王茜雯等[20]利用地面站點數(shù)據(jù)分別對美國及香港地區(qū)GNSS站點密集區(qū)域的MODIS PWV建立了線性回歸校正模型,表明線性回歸校正模型在地面站點密集的區(qū)域有良好的校正效果,但針對青海省這種地貌復雜,站點稀疏的區(qū)域,線性回歸模型的效果尚未確定。因此本文通過對青海省GNSS的資料進行處理分析,利用不同觀測手段之間可降水量數(shù)據(jù)的相關性,分別應用線性回歸方法與BP神經(jīng)網(wǎng)絡方法結合GNSS PWV數(shù)據(jù)對MODIS PWV數(shù)據(jù)進行校正研究,依據(jù)校正后的數(shù)據(jù),分析兩種模型在站點稀疏區(qū)域的校正效果,得到以下結論:
(1)利用GNSS PWV數(shù)據(jù)校正MODIS PWV數(shù)據(jù)是行之有效的,線性回歸模型和BP神經(jīng)網(wǎng)絡模型得到的結果精度均在毫米級以內,可以應用到后續(xù)的研究中;
(2)BP神經(jīng)網(wǎng)絡模型效果好于線性回歸模型,應用四個無線探空站點數(shù)據(jù)對結果進行檢驗,平均相對誤差整體上由3.24 mm減少到2.35 mm,精度提升了27%,說明神經(jīng)網(wǎng)絡方法能更好地擬合GNSS PWV數(shù)據(jù)與MODIS PWV數(shù)據(jù)之間的關系,對MODIS PWV的校正效果更好。
本文僅對MODIS PWV的精度提升進行了研究,獲得了高精度空間連續(xù)的可降水量數(shù)據(jù)集,但水汽變化快速復雜。因此,在下一步的研究中將著重提高MODIS PWV的時間連續(xù)性,在時間尺度上分析其變化規(guī)律,為臨近預報和人工降雨等提供有力支撐。