李永和,靳全鋒
(1.浙江省縉云縣林業(yè)局,浙江 麗水 323000;2.麗水職業(yè)技術(shù)學(xué)院,浙江 麗水 323000)
林火對森林結(jié)構(gòu)和功能有重要的影響,同時,也會造成大量森林資源損失并威脅人類的生命財產(chǎn)安全,排放大量氣體污染物和顆粒物,主要包括CO2、CO、NOx、SO2、NH3、VOCS、PM、OC、EC、烴類和鹵代烴等污染物,對大氣環(huán)境及人類健康有重要影響[1-3]。全球每年森林過火面積為3.5×106hm2[4-5],有(1.324×109)~(1.615×109)t 森林可燃物被焚燒[6];可以釋放約1.35×1010t CO2、6.80×108t CO、5.3×107t CH4、2.1×107t NOx、3.8×107t PM2.5和8.20×105t EC[7-8]。污染物可破壞O3層,影響地球太陽輻射,促進(jìn)光化學(xué)反應(yīng)和陰霾形成,降低空氣能見度[9],直接或間接影響全球氣候變化[10]。林火排放的污染物對人類和動植物有顯著影響,烴類和鹵代烴等物質(zhì)排放能引起頭痛、昏迷,傷害大腦和神經(jīng)系統(tǒng);部分顆粒物可以直接進(jìn)入人類呼吸系統(tǒng),增加肺病發(fā)病率[11]。排放物中的NO2、SO2、HF、顆粒物和有機(jī)物等物質(zhì)會導(dǎo)致植被葉片受害和部分組織壞死,降低氣孔導(dǎo)度,抑制光合放氧和電子運輸、使卡爾文循環(huán)中的酶失去活性,甚至擾亂植被的生理活動,進(jìn)而抑制植物的整體生長[12]。因此,預(yù)測林火發(fā)生是科學(xué)界亟待解決的問題。
目前,關(guān)于森林火災(zāi)模型的研究已展開,從研究前期僅考慮氣象因子發(fā)展到了包括植被、地形、人為活動和社會經(jīng)濟(jì)因子等多因子的綜合分析,取得了一定的進(jìn)展,但目前的研究主要存在以下幾個問題:(1)研究主要集中在林火行為模型的研究[13-14];(2)研究區(qū)域主要集中在中國北方針葉林區(qū)[15-16];(3)研究的時間尺度較短[17];(4)缺乏定量探索林火的影響因子[18]。GUO 等研究表明,南方林火發(fā)生受地形、植被類型、氣象、人類活動及時間變化等因子的影響[19],因此,準(zhǔn)確判定林火發(fā)生因子是建立林火模型的基礎(chǔ),對林火消防管理工作至關(guān)重要,這極大地增加了探討中國南方林火影響因子的意義。邏輯斯蒂(Logistic)方法是普遍適用的方法,隨機(jī)森林是一種非參數(shù)的分類模型[20],其可以用來解決分類問題。隨機(jī)森林(Random Forest)算法不需要考慮變量之間的相互關(guān)系,且不受線性回歸模型的假設(shè)條件限制,具有預(yù)測精度高及不易過渡擬合等優(yōu)點。近年來,隨機(jī)森林方法在生物學(xué)、地理學(xué)、生態(tài)學(xué)和環(huán)境污染等領(lǐng)域得到廣泛應(yīng)用。本研究以浙江省2001—2018 年的林火為研究對象,分析林火發(fā)生的氣象、植被、地形、人類活動等因子,運用邏輯斯蒂和隨機(jī)森林模型,探索浙江林火發(fā)生影響因子,并根據(jù)模型參數(shù),建立林火時空分布,以期為林火預(yù)測及林火管理工作提供參考依據(jù)。
浙江省位于我國東部,地理坐標(biāo)為27°06′~ 31°11′N,118°01′~ 123°10′E,面積為1.02×105km2。全國第九次森林資源清查結(jié)果顯示,浙江省的森林覆蓋率為61.17%,僅次于福建省和江西省,居全國第三。全省地貌類型復(fù)雜多樣,總體呈西南向東北傾斜趨勢,南部多丘陵地帶;地處亞熱帶季風(fēng)氣候區(qū),夏季雨熱同期、冬季寒冷干燥,年均氣溫為9.5~ 20.0℃,年平均降水量在1 000~ 2 000 mm,1 月和7 月分別為全年氣溫最低和最高的月份,5—6 月為集中降雨期。該區(qū)域以亞熱帶闊葉林、針葉林和針闊混交林為主要植被類型,其中以杉木Cunninghamia lanceolata、馬尾松Pinus massoniana、青岡Quercus glauca等為主要樹種。
2.1.1 火點數(shù)據(jù) 浙江省2001—2018 年MODIS-MCD64A1 火產(chǎn)品數(shù)據(jù)來源于https://e4ftl01.cr.usgs.gov/,空間分辨率為500 m,記錄區(qū)域每次森林火的地理坐標(biāo)、起火時間等信息。該監(jiān)測火災(zāi)數(shù)據(jù)具有良好的可靠性[21-22]。
2.1.2 數(shù)字高程模型(DEM)數(shù)據(jù) DEM 數(shù)據(jù)來源于地理空間數(shù)據(jù)云(http://www.gsclo-ud.cn/sources/? cdataid=265&pdataid=10),空間分辨率為30 m。運用ArcGIS10.2 軟件對DEM 數(shù)據(jù)進(jìn)行3D 分析獲得坡度和坡向數(shù)據(jù);坡向指數(shù)(Aspect index,AI)能直觀反應(yīng)潛在太陽輻射強(qiáng)弱[23],AI由公式(1)計算得到:
式中,θ為坡向,其取值范圍為0~ 360°,AI范圍為-1~ 1,PI為π。
2.1.3 氣象數(shù)據(jù) 文中氣象數(shù)據(jù)來源于中國氣象科學(xué)數(shù)據(jù)中心網(wǎng)站(http://cdc.cma.gov.cn/),每日氣象數(shù)據(jù)包含蒸發(fā)量、降水量、濕度、溫度、風(fēng)速、光照和地表溫度等22 個氣象因子,本研究對氣象數(shù)據(jù)進(jìn)行預(yù)處理,除去由于儀器設(shè)備損壞缺失的數(shù)據(jù),剩余氣象因子包括蒸發(fā)量(mm)、日平均地表氣溫(℃)、日最高地表氣溫(℃)、日最低地表氣溫(℃)、日平均風(fēng)速(m·s-1)、日最大風(fēng)速(m·s-1)、日最大風(fēng)速的風(fēng)向(°)、日極大風(fēng)速(m·s-1)、日極大風(fēng)速的風(fēng)向(°)、日降水量(mm)、日平均氣壓(hPa)、日最高氣壓(hPa)、日最低氣壓(hPa)、日照時數(shù)(h)、日平均氣溫(℃)、日最高氣溫(℃)、日最低氣溫(℃)、日平均相對濕度(%)和日最小相對濕度(%)共19 個氣象因子。
2.1.4 植被數(shù)據(jù) 植被數(shù)據(jù)來源于地理空間數(shù)據(jù)云(http://www.gscloud.cn)MODIS 月合成產(chǎn)品歸一化植被指數(shù)(NDVI),植被覆蓋度(FVC)根據(jù)前人的研究成果,以NDVI為基礎(chǔ)采用像元二分模型求取[24],計算公式如下:
式中,NDVIsoil、NDVIveg分別為純土壤像元值、純植被像元值。
2.1.5 人類活動數(shù)據(jù) 人類活動數(shù)據(jù)主要包括鐵路密度、公路密度、河網(wǎng)密度、人口密度、居民點密度和人均GDP,其中鐵路、公路、居民點和河網(wǎng)密度數(shù)據(jù)來源于自國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(http://www.geodata.cn/Portal/index.jsp);人口密度和人均GDP 數(shù)據(jù)來源于浙江省統(tǒng)計局(http://tjj.zj.gov.cn/col/col1525563/ index.html)。
2.2.1 邏輯斯蒂模型(LR)采用二元LR 對林火發(fā)生進(jìn)行預(yù)測分析。本研究分別對林火發(fā)生與否進(jìn)行取值:著火y=1,未著火y=0,并設(shè)林火發(fā)生(y=1)的概率為P,沒有林火發(fā)生(y=0)的概率為(1-P),則可建立林火發(fā)生概率與各自變量之間的Logistic 模型,其關(guān)系式為:
式中,m為自變量個數(shù);β1、β2、β3……βm為各個自變量回歸系數(shù);x1、x2、x3……xm為影響林火發(fā)生的各個自變量。
2.2.2 隨機(jī)森林模型(RF)RF 是一種非參數(shù)算法,可用于分類和回歸,在數(shù)據(jù)集上表現(xiàn)良好,對數(shù)據(jù)具有極強(qiáng)的適應(yīng)和抗噪聲能力,對于大樣本運算速度較快,實現(xiàn)比較簡單。RF 主要通過自助法(bootstrap)重采樣技術(shù),從原始訓(xùn)練樣本集N中有放回地重復(fù)隨機(jī)抽取k個樣本生成新的訓(xùn)練樣本集合,然后根據(jù)自助樣本集生成k個分類樹組成隨機(jī)森林,新數(shù)據(jù)的分類結(jié)果按分類樹投票多少形成的分?jǐn)?shù)而定[20]。
2.3.1 多重共線性診斷 多重共線性是指方程中各自變量間存在完全或近似完全的線性關(guān)系,會導(dǎo)致顯著性檢驗失去意義及模型預(yù)測功能失效。本研究運用方差膨脹因子(VIF)對因子進(jìn)行多重共線性檢驗,以VIF=10 為標(biāo)準(zhǔn),當(dāng)VIF>10 時,表明自變量間存在多重共線性,將其剔除并以逐步回歸法得到最優(yōu)結(jié)果。
2.3.2 模型變量的選擇及運算 本研究基于前人研究成果將總樣本數(shù)據(jù)隨機(jī)的分成60%的訓(xùn)練樣本和40%的測試樣本[25],重復(fù)5 次,之后將樣本放回進(jìn)行隨機(jī)抽樣,分別得到5 組樣本,對5 組樣本組進(jìn)行二元邏輯斯蒂和隨機(jī)森林運算,建立5 個中間模型。得到各自的顯著變量大于3 次為基準(zhǔn),確定最終變量,從而進(jìn)行最終樣本的運算。通過對觀測值和預(yù)測值進(jìn)行相關(guān)系數(shù)的計算來分析其是否有顯著相關(guān)性,驗證中間模型得出模型的預(yù)測能力。在選擇好變量后,應(yīng)用完整的數(shù)據(jù)集構(gòu)建最終模型并進(jìn)行分析。
2.3.3 林火火險區(qū)劃圖 本研究運用ArcGIS 空間分析工具中克里格插值方法對該地區(qū)林火空間概率分布進(jìn)行分析,后基于生成的浙江地區(qū)林火預(yù)測圖,結(jié)合臨界值(Cut-off value),最終生成浙江森林火險區(qū)劃圖。
3.1.1 浙江林火的空間分布 以2001—2018 年MODIS-MOD64A1 森林火點數(shù)據(jù)為基礎(chǔ),運用核密度原理,進(jìn)行林火空間分析,繪制18 年的火點密度圖(圖1)。在2001—2018 年,浙江共發(fā)生森林火災(zāi)1 866 次,年均104 次,林火空間分布不均衡,多集中在浙江南部區(qū)域;浙江南部以山地丘陵地形為主,森林覆蓋率較高。
圖1 2001—2018 年浙江省林火密度空間分布Figure 1 The spatial distribution of fire density of forest fire In Zhejiang during 2001—2018
3.1.2 浙江林火的時間分布格局 圖2A 顯示,2001—2018 年,浙江省森林火災(zāi)的發(fā)生次數(shù)在年際間的波動較大,在2004、2008 和2011 年達(dá)到極大值,火災(zāi)次數(shù)分別為235、414 和267 次。曾愛聰和靳全鋒等[26-27,30]研究指出,該年份主要是防火季降雨明顯較少導(dǎo)致火災(zāi)增加。圖2B 顯示,浙江省林火次數(shù)月變化存在差異,林火主要集中在10 月到次年4 月。林火在10、11、12 月和次年1、2、3 和4 月的火災(zāi)發(fā)生比率分別為13.83%、4.13%、4.66%、6.59%、20.69%、30.65%和14.74%,其占全年總火點的95.28%以上。
圖2 2001—2018 年浙江林火火點年(A)和月(B)時間變化Figure 2 The temporal change of forest fires in Zhejiang during 2001—2018
3.2.1 LR 分析結(jié)果 本研究運用方差膨脹因子對模型自變量進(jìn)行多重共線性診斷,逐步剔除具有顯著共線性的自變量;進(jìn)一步運用樣本顯著性個數(shù)剔除日平均相對濕度、日最大風(fēng)速、日最高地表氣溫、日最低地表氣溫、日最小相對濕度、日降水量、人口密度、日平均風(fēng)速、日照時長等因子,詳見表1。由表2 可知,LR 最終由11個因子構(gòu)成,其中高程和年降水量2 因子與林火呈負(fù)相關(guān)關(guān)系,其余9 個因子對林火均有積極作用。
表1 LR 因子篩選Table 1 Screening of factors for LR
表2 最終LR 因子構(gòu)成Table 2 The final factors for LR
3.2.2 RF 分析結(jié)果 基于隨機(jī)森林方法對模型變量進(jìn)行篩選,本研究以平均準(zhǔn)確率降低度值50%作為閾值,剔除平均準(zhǔn)確率降低度小于50%的變量,其余變量進(jìn)入模型進(jìn)行擬合。各變量因子對林火的影響程度如圖3 所示。由圖3 可知,各樣本組中變量的重要性順序基本一致,經(jīng)篩選,確定其中9 個變量進(jìn)行構(gòu)建隨機(jī)森林的分類模型,最終模型中變量的重要性順序見表3。
圖3 RF 對林火影響的自變量重要性排序Figure 3 Order of independent variables importance for forest fire by random forest
表3 最終RF 變量的重要性排序Table 3 The importance of variables by random forest
由表4 顯示,采用LR 計算所得ROC 曲線下面積(AUC)值和預(yù)測準(zhǔn)確率平均值分別是0.742 和68.4%,采用RF 計算所得的AUC 值和預(yù)測準(zhǔn)確率平均值分別是0.863 和91.3%。以上結(jié)果表明,RF 模型在浙江省具有較好的林火發(fā)生預(yù)測能力。
表4 LR 與RF 評價指標(biāo)對比Table 4 Comparison of evaluation indexes between logistic regression and random forest models
由圖4 顯示,9 個重要影響因子各自對浙江省的林火發(fā)生概率產(chǎn)生影響。隨著高程、坡度和年降水量的增加,林火發(fā)生呈下降趨勢,當(dāng)高程超過1 000 m 時,高程對林火的影響基本穩(wěn)定,當(dāng)年降水量為2 000 mm 時,林火的發(fā)生概率最低;隨著月植被覆蓋度、前一年植被覆蓋度和人均國內(nèi)生產(chǎn)總值的增加,林火發(fā)生呈上升趨勢,當(dāng)植被覆蓋度超過0.8 時,林火發(fā)生頻率顯著增加;隨著年均氣溫、河流密度和道路密度的增加,林火發(fā)生總體呈先降低后增加的變化趨勢,其極小值分別是18℃、5 m·km-2和1 m·km-2。
圖4 變量局部依賴圖Figure 4 Partial dependence plots
研究表明,RF 對浙江林火發(fā)生預(yù)測模型的擬合效果優(yōu)于LR,因此,本研究運用RF 對浙江全樣本計算出林火和隨機(jī)點預(yù)測概率,并運用普通克里金插值方法對江浙林火空間概率分布進(jìn)行插值分析,如圖5A。由圖可知,高火險地區(qū)主要集中在溫州中部和東部及與麗水市交匯區(qū)域、麗水市中部和北部區(qū)域、衢州中部、臺州和寧波東部區(qū)域及金華、杭州和湖州的小面積區(qū)域。基于默認(rèn)閾值0.5 和臨界值對浙江省進(jìn)行火險等級劃分,如圖5B,則林火發(fā)生概率P<0.423 為低火險;0.423≤P<0.5 為中火險;P≥0.5 為高火險。
圖5 林火發(fā)生概率分布圖(A)和火險等級分布圖(B)Figure 5 Occurrence probability and risk level of forest fire in Zhejiang
本研究基于2001—2018 年浙江省MODIS-MOD64A1 遙感影像數(shù)據(jù),運用邏輯斯蒂、隨機(jī)森林模型和ArcGIS、SPSS 軟件對浙江省的林火時空變化及影響因子進(jìn)行探索。研究結(jié)果顯示,浙江省的林火時空分布不均勻,空間上林火多集中在浙江南部區(qū)域,時間上林火多集中在10、11、12 月和次年的1、2、3 和4 月,其占全年林火總數(shù)的95.28%以上。該研究結(jié)果得到靳全鋒等[28]研究成果的支持。
本研究運用傳統(tǒng)邏輯斯蒂模型與隨機(jī)森林方法進(jìn)一步探究浙江省林火與影響因子之間關(guān)系。研究結(jié)果表明,隨機(jī)森林模型比邏輯斯蒂模型具有更高的解釋度和更好的擬合效果,能夠充分體現(xiàn)出各因子對林火的影響。降水會影響森林中水分含量的高低,降水增加森林樹木和林分的含水量,有效降低林火發(fā)生[29];當(dāng)日最大地表氣溫增加,一方面,促進(jìn)植被蒸騰作用,降低植被含水率,促進(jìn)林火發(fā)生的可能;另一方面,增加日最大地表氣溫,加速地表草本植被和凋落物水分的流失,促使草本植物及凋落物干燥,有利于林火的發(fā)生。
有研究[15-18]表明,高程、坡度、坡向指數(shù)和植被等因子是林火的主要影響因子,浙江省的林火主要受人類活動影響較大,眾所周知,高程升高,人類活動減少,降低人為火的發(fā)生概率;坡度越大,水分停留時間越短,區(qū)域植被越干燥,林火的發(fā)生概率越高,坡向指數(shù)是衡量太陽輻射的重要指標(biāo),坡度指數(shù)越大代表太陽輻射區(qū)域能量越多,越有利于該區(qū)域植被水分蒸發(fā)和干燥,加之植被覆蓋度增加,有效增加林火風(fēng)險。
相關(guān)研究表明[15-19],經(jīng)濟(jì)和社會因素是林火發(fā)生的重要影響因子,公路密度、居民點密度、人均GDP 和河流密度與林火發(fā)生呈正相關(guān),主要由于城市化進(jìn)程加快,公路將森林碎片化,大量公路與森林交匯以及居民點密度加大,促進(jìn)人類活動增強(qiáng),增加林火的發(fā)生概率。人均GDP 可以反映整體社會經(jīng)濟(jì)活動,浙江省的工商業(yè)發(fā)展處于上升階段,加快了森林開發(fā)與碎片化,同時,與森林有關(guān)的常規(guī)人類活動加速了森林的破碎,因此,導(dǎo)致森林火災(zāi)數(shù)量的增加。事實證明,快速經(jīng)濟(jì)活動對林火發(fā)生產(chǎn)生促進(jìn)作用,這意味著未來人類活動對林火影響將繼續(xù)增長,我們?nèi)孕枰獙ξ磥砹只鸸芾矸较蚣咏o予更多關(guān)注。此外,林火發(fā)生受多因子影響,本研究沒有考慮空間異質(zhì)性問題,這將是本研究繼續(xù)探索的方向。