占龍飛 , 陳佳義 , 李 婕 , 趙冠男 , 胡菊芳
1. 江西省氣候中心, 江西 南昌 360096
2. 淮安市淮陰區(qū)氣象局, 江蘇 淮安 223300
3. 江西省氣象臺(tái), 江西 南昌 360096
降水是十分重要的氣象要素,氣象站觀測(cè)的降水?dāng)?shù)據(jù)僅代表其所處位置有限范圍內(nèi)的降水狀況,受經(jīng)濟(jì)、地形、觀測(cè)技術(shù)和臺(tái)站分布等客觀條件限制,氣象臺(tái)站降水?dāng)?shù)據(jù)難以滿足科研業(yè)務(wù)需求。高空間分辨率的降水?dāng)?shù)據(jù)在氣候評(píng)估、地質(zhì)災(zāi)害預(yù)警預(yù)報(bào)、水資源管理等方面具有巨大的應(yīng)用價(jià)值。
為獲取降水量的空間分布,通常結(jié)合統(tǒng)計(jì)學(xué)和地理信息科學(xué)將已知站點(diǎn)的觀測(cè)數(shù)據(jù)進(jìn)行空間插值。近年來,一些學(xué)者圍繞降水?dāng)?shù)據(jù)插值方法的比較展開了一系列研究。一些學(xué)者(王國(guó)泰等,2018;王天華,2018;張仁平等,2018)對(duì)比了幾種常用插值方法,選出了適合研究區(qū)域的最佳降水插值方法。降水受地形條件尤其是高程的影響較大,通常高程越高降水越大(Daly et al,2008),基于地理因子的降水插值方法受到研究者們的關(guān)注。李麗娜(2009)引入地理影響因子的多元回歸插值結(jié)果能較好地反映降水的整體分布和局部細(xì)微特征。蔣育昊等(2018)對(duì)比了不同插值方法在北京西北山區(qū)的應(yīng)用效果,結(jié)果表明PRISM(Parameter-elevation Regression on Independent Slopes Model)插值模型比其他插值方法更能精確地表達(dá)降水的空間分布。
每種降水插值方法均存在局限性,同一種插值方法在不同下墊面上的插值效果可能存在很大差別(彭彬等,2011),同一地區(qū)不同時(shí)期可能適用不同降水插值方法。江西省地處季風(fēng)區(qū),東、西、南三面環(huán)山,北部為鄱陽(yáng)湖平原,中部為丘陵和河谷平原,地形復(fù)雜多樣,高程梯度大,復(fù)雜的地貌特征致使降水分布呈現(xiàn)空間不均勻、局地性強(qiáng)等特點(diǎn)。本文基于數(shù)字高程模型(DEM),對(duì)江西省的地貌特征進(jìn)行柵格化處理,提取影響降水空間分布的地理要素,建立多元線性回歸插值模型和PRISM降水插值模型,并與傳統(tǒng)的插值方法進(jìn)行比較,討論不同降水空間插值方法在江西省的適用性,以期為江西省氣候資源的定量分析與評(píng)價(jià)提供技術(shù)支持。
降水資料來源于江西省氣象信息中心,經(jīng)數(shù)據(jù)質(zhì)量控制,剔除相應(yīng)時(shí)段內(nèi)缺測(cè)、空白及異常率高于1%的站點(diǎn),最終篩選出1981—2020年江西境內(nèi)有效的83個(gè)國(guó)家氣象觀測(cè)站逐日20—20時(shí)降水?dāng)?shù)據(jù)。83個(gè)國(guó)家氣象觀測(cè)站分布江西全境,海拔介于21.1—1 164.5 m,其中位于海拔200 m以上的有15站,100 m以下的有45站。站址長(zhǎng)期穩(wěn)定且四周空曠平坦,保證了觀測(cè)數(shù)據(jù)的連續(xù)性和代表性。
DEM數(shù)據(jù)采用Albert投影,空間分辨率為500 m,包含經(jīng)度、緯度、海拔、坡度及坡向等地理信息。站點(diǎn)地理位置及江西省地形高程如圖1所示。
圖1 江西省地形高程及83個(gè)國(guó)家氣象觀測(cè)站點(diǎn)分布
空間插值方法的理論依據(jù)是Tobler地學(xué)定律,即根據(jù)已知的離散數(shù)據(jù)或分區(qū)數(shù)據(jù),按照特定的數(shù)學(xué)關(guān)系推求出其他未知點(diǎn)或未知區(qū)域的數(shù)據(jù)(馬秀霞等,2017)。實(shí)際應(yīng)用中,以傳統(tǒng)的反距離權(quán)重法(Inverse Distance Weighted,IDW)和克里金插值法最為常見(蔡迪花等,2009;王麗等,2015)。文中將以上2種傳統(tǒng)插值方法與基于DEM的多元線性回歸(Multiple Linear Regression,MLR)插值方法和PRISM插值方法進(jìn)行比較,探討4種降水空間插值方法在江西省復(fù)雜地形下的適用性。
1.2.1 反距離權(quán)重法
反距離權(quán)重法是一種基于相近相似原理的插值方法,用權(quán)重表示其影響程度,距離越大,對(duì)權(quán)重賦予權(quán)值越小,影響越小。計(jì)算式(占龍飛等,2018;黃少平等,2020)為
(1)
式中,Z為區(qū)域內(nèi)未知點(diǎn)的值;Zi為第i個(gè)已知點(diǎn)的值;di為第i個(gè)已知點(diǎn)到該未知點(diǎn)的距離;k為指定的冪;n為區(qū)域內(nèi)對(duì)未知點(diǎn)有影響(距未知點(diǎn)最近的n個(gè)站點(diǎn)均視為“有影響”)的已知點(diǎn)數(shù),默認(rèn)n為12。
1.2.2 普通克里金插值方法
普通克里金方法(Ordinary Kriging,OK)是較早被提出的克里金方法,是一個(gè)線性估計(jì)系統(tǒng),適用于任何滿足各向同性假設(shè)的固有平穩(wěn)隨機(jī)場(chǎng)。使用普通克里金插值方法時(shí),需先計(jì)算樣本變異函數(shù),再根據(jù)樣本變異函數(shù)的類型選擇合適的變異函數(shù)理論模型進(jìn)行模擬,最后根據(jù)模擬的變異函數(shù)對(duì)待估計(jì)點(diǎn)進(jìn)行線性估計(jì)并給出估計(jì)方差作為不確定性的度量指標(biāo)(彭彬等,2011)。
1.2.3 基于DEM的多元線性回歸插值方法
研究表明,影響降水的空間分布因素主要有經(jīng)度、緯度、坡度、坡向、海拔高度等(郭憶等,2013)。通過DEM各因子(經(jīng)度X1、緯度X2、海拔高度X3、坡度X4、坡向X5)的有效組合能夠更加精確地反映降水的空間分布?;贒EM的多元線性回歸插值(MLR)模型公式(蔡迪花等,2009;王麗等,2015;占龍飛等,2018)為
PRE=aX1+bX2+cX3+dX4+eX5+ε
(2)
式中,PRE為降水量,a、b、c、d、e為回歸系數(shù),ε為殘差項(xiàng)。
此外,為了應(yīng)用方便,插值模型中的變量應(yīng)盡可能少。因此,文中采用氣候分析中應(yīng)用廣泛的逐步回歸法,從一個(gè)自變量開始,按自變量對(duì)因變量作用的顯著程度從大到小逐個(gè)引入回歸方程,當(dāng)先引入的變量由于后面變量的引入而變得不顯著時(shí),則將其剔除,從而建立“最優(yōu)”多元線性回歸插值模型。
1.2.4 PRISM空間插值理論模型
PRISM最早是由美國(guó)氣象學(xué)家Daly等(1994)提出的一種基于地理空間特征和回歸統(tǒng)計(jì)方法生成氣候圖的插值模型(Daly et al,1994),該方法認(rèn)為高程是影響氣象要素分布的最重要因素(Daly et al,2002)。其中山區(qū)降水氣象要素的基本規(guī)律是,隨著海拔高度增加,降水量隨之增加,當(dāng)達(dá)到某一海拔高度后,降水量達(dá)到最大,這個(gè)高度為最大降水面,隨后海拔繼續(xù)增加,降水量隨之減少(李慧晴,等,2021)。PRISM插值模型基于DEM數(shù)據(jù),結(jié)合氣象觀測(cè)數(shù)據(jù),建立加權(quán)線性回歸方程,進(jìn)行空間插值計(jì)算:
Y=aX+b
(3)
式中,Y為降水量插值結(jié)果;X為DEM柵格點(diǎn)上的高程值;a、b為回歸方程系數(shù)。其中:
(4)
(5)
(6)
(7)
在降水量的插值回歸模型中,各觀測(cè)站點(diǎn)數(shù)據(jù)根據(jù)目標(biāo)柵格空間位置分別賦予一個(gè)權(quán)重,根據(jù)站點(diǎn)氣象觀測(cè)值與對(duì)應(yīng)的權(quán)重值計(jì)算出目標(biāo)柵格的降水量。其權(quán)重值是多種因素的綜合反映,表示為
W=f(Wd,Wz,Wc,Wl,Wf,Wp,We)
(8)
式中,Wd、Wz、Wc、Wl、Wf、Wp、We分別是距離、高程、站點(diǎn)聚類權(quán)重、垂直分層權(quán)重、地形趨勢(shì)面權(quán)重、離海岸線距離權(quán)重和有效地形權(quán)重??紤]到研究區(qū)域的地理特點(diǎn)和資料限制的因素,本研究選取空間距離和高程2個(gè)因子,因此,調(diào)整后的綜合權(quán)重計(jì)算公式如下:
(9)
(10)
(11)
式中,W表示綜合權(quán)重;W(d)和W(z)分別是空間距離函數(shù)和海拔高度權(quán)重函數(shù)。Δz是柵格與站點(diǎn)高程差的絕對(duì)值,Δzm、Δzx分別為最小、最大高程差,a、b分別是距離和高程權(quán)重指數(shù)。參數(shù)Fd、Fz、a和b分別設(shè)置為0.8、0.2、2和1(Daly et al,2002)。
采用“交叉驗(yàn)證法”對(duì)反距離權(quán)重法、普通克里金插值法、多元線性回歸插值方法和PRISM插值法進(jìn)行精度檢驗(yàn)。交叉驗(yàn)證的思路是,首先假定任一個(gè)氣象站點(diǎn)降水量未知,采用剩余站點(diǎn)的觀測(cè)值來插值估算,依次計(jì)算n次(n為站點(diǎn)數(shù)目),最后計(jì)算所有站點(diǎn)實(shí)際觀測(cè)值與估算值的誤差,以此來對(duì)各種插值方法的優(yōu)劣進(jìn)行評(píng)估。常用于評(píng)價(jià)精度的參數(shù)是均方根誤差(RMSE)。均方根誤差反映樣本數(shù)據(jù)的估值靈敏度和極值效應(yīng),值越小表明插值精度越高(蔡迪花等,2009; 王麗等,2015; 占龍飛等,2018)。RMSE的計(jì)算式:
(12)
式中,Toi和Tei分別為第i個(gè)站點(diǎn)的氣溫觀測(cè)值和氣溫預(yù)測(cè)值,n為站點(diǎn)數(shù)。
基于地理因子對(duì)江西省月和年降水量進(jìn)行多元線性回歸擬合,得到回歸插值模型(表1)。模型決定系數(shù)R2為0.320 8—0.802 5,方程p值均小于0.05,說明該模型具有較好的回歸相關(guān)性。分析表1可知,江西省月降水量和年降水量與地理因子顯著相關(guān),值得一提的是,逐步回歸方程中并未出現(xiàn)坡度(X4)和坡向(X5)項(xiàng)。經(jīng)進(jìn)一步研究發(fā)現(xiàn),坡度與海拔高度的相關(guān)系數(shù)為0.80(α=0.01),兩自變量之間存在近似線性關(guān)系,即存在復(fù)共線性關(guān)系,且坡度(X4)因子對(duì)插值模型的方差貢獻(xiàn)率小于海拔高度(X3)因子,因此,坡度(X4)因子被剔除。另外,按國(guó)家氣象站建站要求,氣象站均建于平坦空曠地面上,各月及年降水量與坡向的相關(guān)系數(shù)僅為-0.07— 0.18,無法較好地反映出降水量與坡向的相關(guān)性,因此,坡向(X5)因子也被剔除。
表1 1981—2020年江西省月和年降水量回歸插值模型
通常來說,海拔高度與降水量具有一定的正相關(guān)性,但從江西省海拔高度與降水量的回歸模型來看,僅在5月、7—10月和年降水量回歸方程中出現(xiàn)了海拔高度因子(X3),其中7月和10月出現(xiàn)了負(fù)相關(guān)性,這表明江西省降水垂直分布與海拔高度不一定呈正相關(guān)性。
文中利用交叉驗(yàn)證方法比較不同空間插值方法的精度(圖 2),誤差越小表明插值精度越高。分析可知,基于地理因子的MLR和PRISM插值模型精度在3—9月明顯高于其他2種傳統(tǒng)插值方法。傳統(tǒng)插值方法在冬半年的插值精度略高于MLR和PRISM,這是由于冬半年降水量少,地形對(duì)降水量的影響不明顯,使得MLR和PRISM插值方法的優(yōu)勢(shì)無法體現(xiàn)。從年降水量來看,4種插值方法的精度排序?yàn)镻RISM>MLR>OK>IDW,PRISM插值精度分別比MLR、OK以及IDW分別高出12.3%、41.6%和44.7%。在降水量較大的月份(年),PRISM和MLR的優(yōu)勢(shì)體現(xiàn)地更明顯。
圖2 1981—2020年江西省月、年平均降水量的4種插值方法交叉驗(yàn)證結(jié)果
為進(jìn)一步研究4種插值方法在不同海拔高度的插值精度,考慮到江西省地勢(shì)起伏變化大的特點(diǎn),選取江西境內(nèi)所有海拔高度大于300 m的國(guó)家氣象站(共4個(gè)),以及處于平均和最低海拔高度處各2個(gè)國(guó)家氣象站點(diǎn)進(jìn)行交叉驗(yàn)證,即依次從8個(gè)國(guó)家站中取出一個(gè)站,用剩余的82個(gè)國(guó)家氣象站對(duì)該站點(diǎn)處的降水進(jìn)行插值,交叉驗(yàn)證結(jié)果見圖3。4種插值方法在300 m以下地區(qū)插值精度較高,但由于IDW和OK未考慮海拔高度對(duì)降水的影響,使得在高海拔地區(qū)插值精度遠(yuǎn)低于MLR和PRISM。綜合來看,PRISM插值方法精度最高。
圖3 1981—2020年江西省年平均降水量各站點(diǎn)預(yù)測(cè)值與觀測(cè)值
分別利用4種插值方法繪制1981—2020年江西省年平均降水量(圖4),圖4a和圖4b由Arcgis軟件插值工具繪制,空間分辨率約為1.9 km,圖4c和圖4d基于DEM像元計(jì)算而成,空間分辨率為500 m。由圖4可知,4種插值結(jié)果的降水量空間分布具有一定的相似性,贛東北、贛中東部降水較多,贛南、贛北北部相對(duì)較少。IDW和OK插值方法受站點(diǎn)空間分布影響極大,站點(diǎn)周邊易出現(xiàn)降水值較周邊區(qū)域顯著大或小的奇異斑點(diǎn)(“牛眼”),相較之下,IDW插值方法“牛眼”現(xiàn)象比OK明顯;MLR和PRISM插值結(jié)果在準(zhǔn)確展現(xiàn)江西降水空間分布的基礎(chǔ)上,還能夠精細(xì)地刻畫出DEM各格點(diǎn)的降水空間分布特征,可以較好地反映出降水量與地形的關(guān)系,插值效果優(yōu)于傳統(tǒng)的IDW和OK插值方法。
圖4 基于IDW(a)、OK(b)、MLR(c)和PRISM(d)方法的1981—2020年江西省年平均降水量
基于1981—2020年江西省降水?dāng)?shù)據(jù),在月和年尺度上對(duì)比分析了傳統(tǒng)插值方法(IDW和OK)和基于DEM數(shù)據(jù)的空間插值方法(MLR和PRISM)在江西復(fù)雜地形條件下的插值精度和效果,得到以下結(jié)論:
1) 江西省5月、7—10月降水量與海拔高度存在顯著的相關(guān)性,其中7月和10月降水量與海拔高度呈負(fù)相關(guān),5、8、9月呈正相關(guān)。江西省月和年降水量與坡度、坡向無明顯相關(guān)性。
2) 從插值精度來看,3—9月MLR和PRISM空間插值精度明顯優(yōu)于IDW和OK,而冬半年IDW和OK的插值精度略高于MLR和PRISM;4種插值方法的年降水量插值精度排序?yàn)镻RISM>MLR>OK>IDW;PRISM和MLR在高海拔地區(qū)的插值精度遠(yuǎn)高于IDW和OK。
3) 從插值效果來看,4種插值結(jié)果的降水空間分布具有一致性,但I(xiàn)DW和OK方法易出現(xiàn)“牛眼”,同時(shí)無法體現(xiàn)地形對(duì)降水量的影響,總體來說,MLR和PRISM優(yōu)于IDW和OK。
文中研究結(jié)果表明,MLR和PRISM空間插值方法能更精確地把離散點(diǎn)的數(shù)據(jù)內(nèi)插到研究區(qū)域中,從而表現(xiàn)出氣象要素空間分布特征,其優(yōu)越性體現(xiàn)在氣象要素空間分布與地形有強(qiáng)相關(guān)關(guān)系的插值計(jì)算中。由于降水空間分布還受到緯度位置(氣壓帶或風(fēng)帶)、大氣環(huán)流、海陸分布、人類活動(dòng)等因素綜合作用的影響,任何一種空間插值方法都無法完全表達(dá)氣象要素的分布特征。每種空間插值方法有自身的適用性,應(yīng)根據(jù)實(shí)際情況,選擇最佳的空間插值方法。本文僅討論4種插值方法在江西的插值精度和適用性,在今后工作中還應(yīng)開展相應(yīng)的機(jī)理研究。