張 鵬
(遼寧省河庫(kù)管理服務(wù)中心(省水文局),遼寧 沈陽 110000)
降水是重要的氣候資源,精確模擬降水的空間分布對(duì)水資源開發(fā)管理、生態(tài)防洪、土地資源高效利用具有重要意義。我國(guó)國(guó)土面積廣闊、地貌形態(tài)復(fù)雜、區(qū)域氣候差異大,導(dǎo)致氣象臺(tái)站布設(shè)離散、分布密度不一,這為準(zhǔn)確預(yù)測(cè)降水空間分布帶來困難。雖然當(dāng)前有美國(guó)NASA 和歐空局基于氣象遙感衛(wèi)星聯(lián)合開發(fā)了全球STRM 氣候數(shù)據(jù),但是該數(shù)據(jù)空間分辨率粗糙,不適宜小尺度的降水表征。為此國(guó)內(nèi)外學(xué)者對(duì)降水空間可視化的方法進(jìn)行了廣泛研究,例如基于氣候環(huán)境輔助因素開發(fā)了Anuspline 插值[1]、回歸Kriging[2]、多元回歸模型[3]等,并在全球、區(qū)域等不同尺度獲得成功應(yīng)用。但在使用這些方法同時(shí),忽視了對(duì)原始臺(tái)站數(shù)據(jù)的驗(yàn)證與其他數(shù)據(jù)產(chǎn)品的比較分析。因此,本文以遼寧省為例,闡述基于隨機(jī)森林的降水量空間模擬方法,并細(xì)致分析其與已有的STRM 數(shù)據(jù)產(chǎn)品的差異性,以期為降水資料柵格化及其精度分析提供參考資料。
遼寧省地跨東部季風(fēng)氣候向內(nèi)陸干旱溫帶大陸性氣候過渡區(qū),自東向西依次為遼東丘陵、遼中平原、遼西丘陵地形,南部瀕臨黃海、渤海。區(qū)域四季分明、雨熱同期,省域年降水量多在600 mm~1100 mm 之間,年平均氣溫介于7℃~11℃之間,日照時(shí)數(shù)達(dá)2100 h~2600 h。影響區(qū)域降水的氣候因子主要是西北太平洋季風(fēng)環(huán)流與副極地、西伯利亞冷高壓。有研究顯示,近50 年來區(qū)域氣溫呈顯著增加趨勢(shì),降水呈現(xiàn)波動(dòng)減少[4]。
從中國(guó)氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)(http://cdc.cma.gov.cn)獲得遼寧省內(nèi) 69 個(gè)標(biāo)準(zhǔn)氣象站(圖1)近 10 年(2010 年 ~2019 年)來年降水量資料,采用平滑插補(bǔ)方法對(duì)部分站點(diǎn)缺失資料進(jìn)行處理。借鑒以往的研究經(jīng)驗(yàn),以DEM、坡度、坡向、經(jīng)度、緯度等5 個(gè)地理要素作為輔助環(huán)境變量,其數(shù)據(jù)源為美國(guó)地質(zhì)調(diào)查局USGS 的 GEODEM2 資料(http://www.usgs.gov/),其空間分辨率為30 m,另采用STRM降雨資料作為比較驗(yàn)證。
圖1 遼寧省氣象站空間分布
隨機(jī)森林(Random Forest,RF)是 Breiman 等[5]基于隨機(jī)子空間(random subspace)與自助聚集(Bootstrap aggregating)理論將決策樹或者分類回歸樹進(jìn)行集成的算法。其自動(dòng)放回抽樣方法對(duì)隨機(jī)向量進(jìn)行隨機(jī)選取并生成決策樹,利用樹節(jié)點(diǎn)的輸出軸的平均值作為預(yù)測(cè)結(jié)果。該算法存在ntree、mtry 兩個(gè)敏感參數(shù),分別表示決策樹數(shù)量與分裂屬性個(gè)數(shù),它們影響著模型運(yùn)行速度與泛化效能,采用網(wǎng)格搜索法進(jìn)行參數(shù)優(yōu)化,設(shè)置mtry 為5,ntree 為500。本研究中輸入變量為2.1 部分中的5 個(gè)環(huán)境協(xié)變量,輸入變量為69 個(gè)氣象站點(diǎn)的降水量,依次建模訓(xùn)練后將模型代入?yún)^(qū)域,進(jìn)而繪制遼寧省降水量空間分布圖。
利用Excel 2016 軟件將各臺(tái)站txt 格式降水資料進(jìn)行平價(jià)化處理,ArcGIS 軟件進(jìn)行空間制圖,設(shè)置其柵格分辨率為30 m,Rstudio 軟件中的Randomforest 程序包建立隨機(jī)森林降水量預(yù)測(cè)模型。
環(huán)境協(xié)變量的空間分布影響著降水量預(yù)測(cè)的空間異質(zhì)性,圖1 和圖2 為區(qū)域DEM、坡度、坡向因子分布??芍|寧省DEM 數(shù)值介于-20 m~1530 m,呈現(xiàn)東西向地帶性分異,其平均DEM 為123 m。該省屬于緩坡丘陵區(qū),坡度范圍為0°~17°,高坡度帶分布于省域東西部,呈離散分布,低坡度位于省域中部。區(qū)域坡向包含了8 個(gè)方向性(0°~360°),無明顯規(guī)律性。通過空間幾何分析,得到區(qū)域經(jīng)度分布介于119.38°~125.35°E,緯度為 38.82°~42.78°N,幾何中心位于122.44°E、41.16°N。
圖2 遼寧省坡度和坡向空間分布
基于上述數(shù)據(jù)方法繪制遼寧省降水量空間分布圖(圖3)。依圖3 可知,區(qū)域降水量介于358 mm~1152 mm,統(tǒng)計(jì)平均值為658.08 mm,空間變異系數(shù)達(dá)21.94%,在該像素水平呈中等變異。高值位于區(qū)域東部,該地區(qū)離西北太平洋暖濕氣流的行進(jìn)距離較近,加之地勢(shì)較高促進(jìn)了氣流堆積、上升運(yùn)動(dòng),利于成云至雨。低值區(qū)位于西北部?jī)?nèi)陸,由于距離海洋較遠(yuǎn),加之受陰雨效應(yīng)影響,導(dǎo)致降水分布較少。STRM數(shù)據(jù)顯示區(qū)域降水量(RF)介于392 mm~1098 mm(圖4),其空間平均值為634.26 mm,空間變異系數(shù)為15.38%,其空間分布特征與隨機(jī)森林模擬結(jié)果一致,但本研究能夠呈現(xiàn)更多的空間細(xì)節(jié)信息。
圖3 隨機(jī)森林方法模擬遼寧省降水量空間分布
圖4 STRM 顯示遼寧省降水量空間分布
采用空間提取的方法將STRM像素提取至點(diǎn),然后再提取對(duì)應(yīng)位置上隨機(jī)森林模擬值,采用1∶1(y=x)直線比較二者之間的偏離度(圖5)。結(jié)果顯示本研究與STRM產(chǎn)品具有良好的空間一致性,其R2為0.945,擬合關(guān)系為y=1.0429x-43.365。
提取69 個(gè)氣象臺(tái)站年均降水量值(RF)以及相應(yīng)位置上的隨機(jī)森林模擬值,發(fā)現(xiàn)(y=x)二者的擬合精度高達(dá)0.965,在300 mm~750 mm 的區(qū)間上本研究成果與STRM結(jié)果相比估值偏大,在750 mm~1150 mm 區(qū)間上相對(duì)于STRM 結(jié)果略微偏小。綜合而言,隨機(jī)森林模擬結(jié)果與STRM、站點(diǎn)實(shí)測(cè)值具有一致性,并且模擬精度較高,表明該方法可靠。
圖5 遼寧省降水量預(yù)測(cè)值擬合比較分析
本文采用遼寧省69 個(gè)站點(diǎn)2010 年~2019 年的降水觀測(cè)資料,以DEM、坡度、坡向、經(jīng)度、緯度等環(huán)境協(xié)變量為基礎(chǔ),基于隨機(jī)森林建立降水量空間預(yù)測(cè)模型,得出以下結(jié)論:隨機(jī)森林方法能夠擬合環(huán)境變量與降水量之間的分布規(guī)律,基于高分辨率的DEM數(shù)據(jù)生成詳細(xì)的降水量空間位圖,與站點(diǎn)統(tǒng)計(jì)值和STRM資料存在一定偏差,但在可接受范圍內(nèi)。需要指出的是,降水量空間分布模型依賴于訓(xùn)練樣本數(shù)量,本研究中僅以69 個(gè)站點(diǎn)為基礎(chǔ)資料,可能由于樣本不足產(chǎn)生局部預(yù)測(cè)誤差,在后續(xù)的研究中應(yīng)該補(bǔ)充鄰近省域的氣象臺(tái)站資料作為輔助,減弱數(shù)據(jù)對(duì)預(yù)測(cè)模型的影響。