• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于可解釋機器學(xué)習(xí)模型的南寧市野火災(zāi)害易發(fā)性研究

      2024-02-20 01:28:54岳韋霆任超梁月吉郭玥張勝國
      科學(xué)技術(shù)與工程 2024年2期
      關(guān)鍵詞:野火易發(fā)南寧市

      岳韋霆, 任超,2*, 梁月吉,2, 郭玥, 張勝國

      (1.桂林理工大學(xué)測繪地理信息學(xué)院, 桂林 541006; 2. 廣西空間信息與測繪重點實驗室, 桂林 541006)

      野火災(zāi)害是指由自然或人為引起,在林地內(nèi)自由蔓延、擴大,并造成一定危害和損失的林火行為[1]。近年來,由于氣溫升高、降雨減少、旱期延長等異常氣候因素以及人類活動的干預(yù),導(dǎo)致野火災(zāi)害的發(fā)生頻率增加。野火不僅對環(huán)境、生態(tài)和經(jīng)濟造成重大破壞,而且對人類生命和財產(chǎn)造成嚴重威脅[2]。近年來,南寧市發(fā)生了多起野火災(zāi)害。其中,2021年11月29日,南寧市興寧區(qū)五塘鎮(zhèn)增山坡尖山嶺發(fā)生了一起重大野火災(zāi)害,過火面積約為500畝(1畝=667 m2),燒毀了周邊大量植被,嚴重威脅了周邊林場、水庫和村莊的安全,并造成了巨大的經(jīng)濟損失。因此,開展南寧市野火空間易發(fā)性評價,進而制定有效的防火和治理措施變得極其重要且迫切。

      早在20世紀20年代,中外就林火發(fā)生預(yù)測預(yù)報開展了大量的研究工作[3]。此后的研究表明,多種環(huán)境和人為因素均可能是引發(fā)野火災(zāi)害的原因[4]。由于不同地域的建模指數(shù)的權(quán)重和變量可能不同,因此為找出對該地區(qū)野火發(fā)生具有重要影響的因子,其相關(guān)研究考慮的環(huán)境和人為因素數(shù)據(jù)也不盡相同[5]。自Roger等[6]提出了“地理信息系統(tǒng)” (geographic information system,GIS)概念后,極大方便了基于數(shù)據(jù)驅(qū)動的災(zāi)害風(fēng)險評估工作的開展?,F(xiàn)常用的數(shù)據(jù)驅(qū)動模型分為頻率比[7]、證據(jù)權(quán)[8]等統(tǒng)計學(xué)模型,邏輯回歸[9]、隨機森林[10]等機器學(xué)習(xí)模型。其中,機器學(xué)習(xí)模型較統(tǒng)計學(xué)模型能更好地擬合數(shù)據(jù)樣本,更適合用于災(zāi)害易發(fā)性研究中[11]。高博等[12]基于Logistic回歸模型建立大興安嶺地區(qū)的林火預(yù)測模型,并對其影響林火發(fā)生的主要驅(qū)動因素進行評估分析。蔡霽初等[13]利用Logistic回歸和隨機森林算法對廣東省的林火發(fā)生概率進行預(yù)測,發(fā)現(xiàn)隨機森林算法的預(yù)測性能更優(yōu)。Rodrigues等[14]利用多種機器學(xué)習(xí)模型對西班牙半島的野火易發(fā)性進行研究,發(fā)現(xiàn)隨機森林模型的預(yù)測性能最佳。Rafaqat等[15]利用5種機器學(xué)習(xí)算法評價巴基斯坦的野火災(zāi)害易發(fā)性并對關(guān)鍵影響因素進行分析。

      綜上所述,現(xiàn)階段對野火易發(fā)性的研究主要集中于算法及模型的改進,以改善預(yù)測精度。雖然機器學(xué)習(xí)模型在處理非線性問題上有很大的優(yōu)勢,但它本質(zhì)上是一個黑箱模型,欠缺可解釋性,其只考慮因子間的全局相對重要性,無法對野火易發(fā)性預(yù)測結(jié)果進行全面的評價[16]。因此,需要一種客觀的可解釋方法,找出影響野火災(zāi)害發(fā)生的關(guān)鍵因子,并闡明模型的決策機制,幫助野火風(fēng)險防控工作者更好地理解野火易發(fā)性的評估結(jié)果。沙普利加和解釋(shapley additive explanations,SHAP)作為最新的可解釋性方法之一,其通過因子間的協(xié)同交互作用反映每個樣本的每個特征的影響力,具有高度的歸因一致性[17]。

      鑒于此,現(xiàn)以南寧市為研究區(qū),以2012—2022年11年內(nèi)的野火樣本為數(shù)據(jù)基礎(chǔ)。綜合考慮區(qū)域內(nèi)的野火空間分布特征,從土壤地形、植被覆蓋、水文氣象等方面選取評價因子。采用分類和回歸樹、隨機森林、輕量的梯度提升機和極致梯度提升4種具有良好預(yù)測性能的機器學(xué)習(xí)算法構(gòu)建野火易發(fā)性模型。同時,使用SHAP可解釋性方法在全局和局部維度上,對所構(gòu)建的最優(yōu)野火易發(fā)性模型進行機理解釋和特征分析,為南寧市野火災(zāi)害的急防治措施及治理工程規(guī)劃提供科學(xué)依據(jù)。

      1 研究區(qū)及數(shù)據(jù)概況

      1.1 研究區(qū)與歷史火點數(shù)據(jù)

      南寧市位于廣西壯族自治區(qū)南部偏西,地處107 °45′~108 °52′E,22 ° 13′~23 °33′N,高程為19~1 745 m(圖1)。全域總面積約為22 100 km2,占廣西總面積的9.31%。南寧市屬濕潤的亞熱帶季風(fēng)氣候,陽光充足,雨量充沛,年平均氣溫在21.6 ℃左右,年均降雨量達1 304.2 mm。其良好的水、熱條件孕育著豐富的植物資源。近年來,南寧市野火災(zāi)害頻發(fā),對當(dāng)?shù)氐纳鐣?jīng)濟和生態(tài)環(huán)境造成嚴重的威脅。

      圖1 研究區(qū)及歷史野火分布情況Fig.1 Study area and historical wildfire distribution

      地球觀測衛(wèi)星為探測和監(jiān)測活躍火災(zāi)提供了寶貴的數(shù)據(jù),目前常用的基于衛(wèi)星的主動火災(zāi)探測產(chǎn)品是全球范圍內(nèi)的消防信息資源管理系統(tǒng)(fire information for resource management system,FIRMS)火災(zāi)信息[18]。本文研究選用具有375 m的空間分辨率的VIIRS(S-NPP)火災(zāi)產(chǎn)品,其在相對較小的區(qū)域內(nèi)對火災(zāi)有更好的響應(yīng),并改善了夜間性能[19]。由于本研究對象為南寧市內(nèi)的野火災(zāi)害,因此需對所獲取的數(shù)據(jù)進行篩選。首先,在FIRMS官網(wǎng)(https://firms.modaps.eosdis. nasa. gov/)獲取2012—2022年內(nèi)的歷史火點數(shù)據(jù),并篩選除南寧市范圍內(nèi)的數(shù)據(jù);然后,依據(jù)“Type”和“Confidence”屬性字段將置信度等級為“Low”的不合格數(shù)據(jù),并只提取數(shù)據(jù)屬“假定的植被火災(zāi)”的火點數(shù)據(jù);最后,依據(jù)地表覆蓋類型數(shù)據(jù),篩除位于“人造地表”“裸地”和“水體”的非目標樣本;最終共獲取到9 988個屬單獨柵格的歷史野火樣本。

      1.2 評價因子數(shù)據(jù)概況

      地形、氣候、人文和植被等因素均可能影響野火災(zāi)害發(fā)生的概率。在全面考慮南寧市野火災(zāi)害空間分布特征的前提下,從土壤地形、氣象水文、人類活動和植被覆蓋情況方面選取18項評價因子,進行野火易發(fā)性評價研究。數(shù)據(jù)來源如下。

      (1)數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù),用于提取高程、坡度、坡向、平面曲率、剖面曲率、地形濕度指數(shù)(topographic wetness index,TWI)和水流強度指數(shù)(stream power index,SPI)。

      (2)ERA5-Land再分析數(shù)據(jù),用于提取平均氣溫、平均風(fēng)速(U分量)、平均風(fēng)速(V分量)和平均風(fēng)速。其中,風(fēng)速U分量表示東西向風(fēng)速,西風(fēng)為正;風(fēng)速V分量表示南北向風(fēng)速,南風(fēng)為正;平均風(fēng)速由風(fēng)速U分量和V分量的平方和并開根而計算得到。

      (3)全國地理信息資源目錄服務(wù)系統(tǒng)(https://www.webmap.cn/),用于獲取道路和河流矢量文件。

      (4)Landsat 8光學(xué)影像,用于提取地表歸一化植被指數(shù)(normalized difference vegetaion index,NDVI)。

      (5)CHIRPS降雨量產(chǎn)品,用于年均降雨量。

      (6)GlobeLand30 V2020產(chǎn)品(http://www.globallandcover.com/),用于提取2020年地物類型數(shù)據(jù)。

      (7)世界土壤數(shù)據(jù)庫(https://www.fao.org/soils-portal/soil-survey/),用于提取地表土壤類型數(shù)據(jù)。

      (8)WOPR產(chǎn)品(https://hub.worldpop.org/),用于提取2020年人口密度分布。為統(tǒng)一因子數(shù)據(jù)分辨率,以DEM柵格為基準,將各因子影像投影至UTM_Zone_49N坐標系,并重采樣至30 m×30 m分辨率。整個研究區(qū)可劃分為7 947×6 891,共24 566 450個柵格。研究區(qū)各評價因子信息如圖2所示。

      圖2 評價因子概況Fig.2 Overview of assessment factors

      2 研究方法

      2.1 機器學(xué)習(xí)模型

      使用4種已被證明并廣泛適用于研究二項式因變量的機器學(xué)習(xí)算法,以構(gòu)建野火易發(fā)性模型,其分別為分類和回歸樹(calssification and regression tree,CART)、隨機森林(random forest,RF)、輕量的梯度提升機(light gradient boosting machine,LGBM)和極致梯度提升算法(extreme gradient boosting,XGBoost)。

      CART是一種遞歸分區(qū)方法,它最顯著的優(yōu)勢在于可以處理異常值和缺失值的問題。CART模型更適合處理各種類型的數(shù)據(jù),因為它能夠應(yīng)對輸入和輸出參數(shù)之間相關(guān)性事先未知的問題,同時其輸出結(jié)果也更容易被理解和解釋[20]。

      RF是由許多單獨訓(xùn)練的決策樹組成的集成模型[21],其基本原則是在每棵樹的每個節(jié)點上選擇一個隨機的特征子集;使用bagging選擇用于訓(xùn)練每個組件樹的樣本,并對原始數(shù)據(jù)集進行重新采樣。RF模型中的每個分量決策樹都會做出分類決策,從而確定具有最多票數(shù)的類作為輸入數(shù)據(jù)的最終分類。該模型可用于解決回歸問題,最終輸出由每棵樹的輸出平均值來確定[22]。

      LGBM是一種新穎的基于樹的梯度提升算法,其涉及兩個過程:①基于梯度的單側(cè)采樣;②通過分組相互排斥的特征,有效地減少特征的數(shù)量[23]。在數(shù)據(jù)樣本可變維數(shù)較高、數(shù)據(jù)規(guī)模較大時,具有效率高、支持并行、占用GPU內(nèi)存小、數(shù)據(jù)處理規(guī)模大的優(yōu)點。

      XGBoost是一種基于梯度提升算法的優(yōu)化擴展算法。其通過梯度下降法以弱分類樹的提升集成的形式生成一個預(yù)測模型,以優(yōu)化損失函數(shù)[24]。XGBoost使用多個CART,并使用梯度提升方法將它們集成。該模型有三個重要的方面:正則化目標函數(shù)用于更好地泛化;梯度樹提升用于相加訓(xùn)練;收縮和列下采樣用于防止過擬合。

      2.2 性能評價指標

      對于野火易發(fā)性模型的預(yù)測性能的評價,通常由多個不同維度的指標決定。本研究使用受試者工作特征(receiver operating characteristic,ROC)曲線極其曲線下面積(area under curve,AUC),混淆矩陣以及均方根誤差(root mean square error,RMSE)評價各模型的預(yù)測性能。ROC曲線通常用于直觀地評估基于二項式因變量模型的預(yù)測性能,其AUC值越高,ROC曲線偏離對角線越多,模型分類的性能越好。當(dāng)AUC>0.9時表示模型的整體性能優(yōu)秀?;煜仃囀欠诸愋阅艿膮R總??傮w預(yù)測精度(accuracy)、靈敏性(sensitivity)、特異性(specificity)和Kappa系數(shù)(Kappa coefficient,KC)均由混淆矩陣計算得到。此外,通過計算野火樣本(1)、負樣本(0)和全部樣本(All)的預(yù)測結(jié)果與實際屬性的RMSE值,以評估模型的預(yù)測誤差。上述指標的計算公式為

      (1)

      (2)

      (3)

      (4)

      (5)

      (6)

      (7)

      式中:TP和FN分別為正樣本預(yù)測正確和預(yù)測錯誤的數(shù)量;TN和FP分別為負樣本預(yù)測正確和預(yù)測錯誤的數(shù)量;Accuracy為總體預(yù)測精度;Pe為模型隨機預(yù)測的概率;N為驗證樣本總數(shù);Yi和f(Xi)分別為第i個樣本的實際值和預(yù)測值。

      2.3 SHAP可解釋性方法

      SHAP是一種解釋機器學(xué)習(xí)模型預(yù)測結(jié)果的方法,核心是計算每個特征對于模型預(yù)測結(jié)果的貢獻度[25]。其基于博弈論中的Shapley值思想,通過計算每個特征對于模型預(yù)測結(jié)果的Shapley值,將其轉(zhuǎn)化為特征重要性。分析結(jié)果可以幫助我們了解整個數(shù)據(jù)集中每個特征對于模型預(yù)測結(jié)果的影響程度(方向和力度),并幫助我們識別出哪些特征對于模型的預(yù)測結(jié)果具有重要影響。由于其在理論上的可解釋性,SHAP方法在解釋黑盒模型中得到了廣泛的應(yīng)用。Shapley的計算公式為

      (8)

      式(8)中:xi為第i個樣本;j為其中一個特征;S為不包含特征j的特征子集;fS(xi)為去掉特征S后的模型預(yù)測輸出;fS∩j(xi)為加入特征j后的模型預(yù)測輸出;M為樣本數(shù)。

      Shapley值的含義是:特征j對于樣本xi的預(yù)測輸出的貢獻,等于將特征j加入或移除后,與不考慮特征j時的預(yù)測輸出的差異,乘以考慮j時的樣本子集的權(quán)重,最后再取平均。本文研究利用SHAP方法在全局和局部為維度分析特征對野火易發(fā)性預(yù)測結(jié)果的作用方向和貢獻程度。

      2.4 研究流程

      綜上,基于4種機器學(xué)習(xí)模型構(gòu)架南寧市野火易發(fā)性模型,并利用SHAP可解釋方法在全局和局部維度對最優(yōu)野火易發(fā)性模型的預(yù)測結(jié)果進行解釋分析。實驗流程如圖3所示。

      圖3 研究路線Fig.3 Research route

      具體步驟為:①數(shù)據(jù)集構(gòu)建,包括歷史野火樣本獲取和篩選,野火易發(fā)性評價因子的獲取和處理;②利用4種機器學(xué)習(xí)模型構(gòu)建4種南寧市野火易發(fā)性模型,并根據(jù)易發(fā)性區(qū)劃合理性和預(yù)測性能選取最優(yōu)模型;③基于SHAP可解釋方法對最優(yōu)預(yù)測模型進行特征全局性解釋、特征依賴性和典型樣本的局部性分析。

      3 野火災(zāi)害易發(fā)性評價

      3.1 野火易發(fā)性預(yù)測模型的構(gòu)建

      以南寧市歷史野火點作為正樣本,將野火散布密度較大的地區(qū)剔除獲取負樣本選取區(qū)域。運用ArcGIS 10.2的“創(chuàng)建隨機點”工具,隨機選取與歷史野火樣本數(shù)量相等的9 988個負樣本數(shù)據(jù)。將正樣本屬性賦值為“1”,表示發(fā)生野火;將負樣本賦值為“0”,表示不發(fā)生野火。整合正負樣本數(shù)據(jù)組建樣本數(shù)據(jù)集,將其樣本點所在的各個因子的屬性提取至樣本點,按照7∶3的比例隨機劃分訓(xùn)練集和測試集。選用訓(xùn)練集樣本構(gòu)建模型,將樣本的因子屬性值作為輸入,樣本屬性作為輸出。此外,選取未參與模型構(gòu)建的2 976個正樣本和3 017個負樣本,檢驗?zāi)P偷念A(yù)測穩(wěn)定性和泛化能力[26]。利用10折交叉驗證法對各模型的超參數(shù)進行調(diào)整,以獲取良好的預(yù)測結(jié)果,參數(shù)調(diào)節(jié)結(jié)果如表1所示。

      表1 參數(shù)調(diào)節(jié)結(jié)果Table 1 Parameter adjustment results

      3.2 野火易發(fā)性區(qū)劃合理性分析

      為對比不同模型間的預(yù)測結(jié)果,統(tǒng)一按照[0,0.20],(0.20,0.40],(0.40,0.60],(0.60,0.80]和(0.80,1.0]作為分級標準,將4種模型在研究區(qū)內(nèi)的野火易發(fā)性概率劃分為極低、低、中、高和極高5個易發(fā)性等級,如圖4所示??梢?基于不同模型的野火易發(fā)性區(qū)劃結(jié)果的分布規(guī)律相似,極高易發(fā)區(qū)主要分布在研究區(qū)西北部、東部及南部;極低易發(fā)區(qū)主要分布在北部、西部和西南部。各模型的區(qū)劃結(jié)果均良好地反映了南寧市野火易發(fā)地區(qū)的分布特征。

      各模型易發(fā)性區(qū)劃結(jié)果的詳細統(tǒng)計信息如表2所示。CART、RF、LGBM和XGBoost模型的極高易發(fā)區(qū)面積占比分別為42.717%、38.570%、39.426%和39.113%。其中,歷史野火數(shù)量占比分別為73.690%、70.968%、73.421%和73.690%??梢?XGBoost模型在較少的區(qū)域內(nèi)擁有更多的野火樣本。根據(jù)不同野火易發(fā)性等級區(qū)域的頻率比可知,所有模型的頻率比均隨著易發(fā)性等級的增大而增大。其中,相較于其他模型,XGBoost模型的極低易發(fā)區(qū)的頻率比更低(0.154),極高易發(fā)區(qū)的頻率比更高(1.884),說明該模型的野火易發(fā)性區(qū)劃結(jié)果對野火樣本的擬合程度更好,區(qū)劃結(jié)果更為合理。

      3.3 預(yù)測性能分析

      樣本數(shù)據(jù)在不同易發(fā)區(qū)的占比只能反映模型在特定閾值條件下的預(yù)測精度,考慮到ROC曲線不受閾值的影響,并可以清晰表示野火發(fā)生的累計百分比與野火易發(fā)性指數(shù)之間的關(guān)系[27]。因此,使用ROC曲線評價不同模型間的整體性能和泛化能力。如圖5所示,CART、RF、LGBM和XGBoost模型的ROC曲線的AUC值分別為0.925、0.954、0.956和0.959,其值均大于0.900,表明各模型均具有優(yōu)秀的預(yù)測性能。其中,XGBoost模型的AUC值最高,表明該模型的整體預(yù)測性能優(yōu)于其他模型。

      圖5 ROC曲線Fig.5 ROC curves

      在驗證模型的整體性能的前提下,使用多個指標評價各野火易發(fā)性模型對野火樣本的預(yù)測精度,如表3所示。在4種模型中,CART模型對正負樣本的預(yù)測準確率最低,總體預(yù)測精度為0.861。RF模型對正負樣本的預(yù)測準確性均較高,總體預(yù)測精度為0.902。LGBM模型對野火樣本的預(yù)測準確性最好,而對負樣本的預(yù)測準確性相對較差,總體預(yù)測精度分別為0.899。XGBoost模型在保證擁有野火樣本擁有良好的預(yù)測精度的同時,對負樣本預(yù)測準確性最高,總體分類精度為0.906,Kappa系數(shù)為0.812,說明XGBoost模型對野火樣本的區(qū)分效果更高,具有更高的可靠性。此外,XGBoost模型的RMSE-All、RMSE-1和RMSE-0值相較于其他模型更低,說明XGBoost模型對野火樣本、負樣本和所有樣本的預(yù)測誤差均最小,預(yù)測情況更貼近真實情況。

      表3 性能評價結(jié)果Table 3 Performance assessment results

      總的來說,XGBoost模型的預(yù)測性能最優(yōu),LGBM和RF模型次之,CART模型的預(yù)測性能相對最差。

      4 SHAP解釋性分析

      通過上述對CART、RF、LGBM和XGBoost模型的野火易發(fā)性區(qū)劃結(jié)果合理性和樣本的預(yù)測性能的分析結(jié)果可知,基于XGBoost模型取得的野火易發(fā)性評價結(jié)果相較于其他模型更好。因此,利用基于數(shù)據(jù)驅(qū)動的SHAP可解釋性方法對XGBoost模型的野火易發(fā)性決策機理進行解釋分析。

      4.1 特征全局性解釋

      圖6顯示了各個因子對野火易發(fā)性預(yù)測結(jié)果的作用方向和重要性程度。圖6(a)繪制了每個樣本的每個因子的Shapley值,x軸顯示了Shapley值,值越大表示因子對該樣本預(yù)測結(jié)果的影響越大,正值表示具有正向影響,負值表示具有負向影響;y軸每一行表示一個特征。每個點表示數(shù)據(jù)集中的單個樣本,點的顏色表示給定條件因子的值,紅色表示相應(yīng)因子的屬性高值,藍色表示屬性低值。例如,NDVI值較大時,Shapley值普遍較大,表示植被覆蓋率的增大有利于野火災(zāi)害的發(fā)生;風(fēng)速值較大時,Shapley值較小,表示在該地區(qū)較小的風(fēng)速會增加野火發(fā)生的可能性。對于連續(xù)型因子,NDVI、降雨、氣溫、風(fēng)速(U分量)、距道路距離和SPI等因子對野火易發(fā)性預(yù)測結(jié)果起不同程度的正向影響;風(fēng)速(V分量)、風(fēng)速、距水系距離、人口密度和TWI等因子起不同程度的負向影響。對于離散型因子,酸性土壤(Ach、Acf、Acu等)較其他土壤類型對野火有較強的促進影響;林地、草地較其他地物類型更易發(fā)生野火災(zāi)害。

      圖6 特征全局性解釋結(jié)果Fig.6 Global interpretation result of features

      對圖6(a)中每個樣本的Shapley絕對值取平均值,得到因子重要性排序結(jié)果,如圖6(b)所示。模型中對南寧市野火易發(fā)性預(yù)測影響最重要的因素有NDVI、降雨、土壤類型、氣溫、高程、地物類型、風(fēng)速(V分量)、坡度和風(fēng)速因子,其余9項影響因子對野火易發(fā)性的影響程度較小。

      4.2 特征依賴性分析

      特征依賴性分析可以顯示單個或兩個特征對模型預(yù)測結(jié)果的邊際效應(yīng)。單依賴性分析描述了單個因素對野火易發(fā)性預(yù)測結(jié)果的影響;雙依賴性分析描述兩個因子在交互作用下對預(yù)測結(jié)果的影響[28]。如圖7所示,對模型中最重要的9項因子進行單依賴性分析。圖8描述了NDVI與其余因子的交互作用對野火易發(fā)性預(yù)測結(jié)果的影響。聯(lián)合圖7和圖8進行分析可得如下結(jié)果。

      圖7 主要影響因子的單依賴性結(jié)果Fig.7 Single-dependent results of main influencing factors

      圖8 NDVI與其他主要影響因子的雙依賴性結(jié)果Fig.8 Double-dependence results of NDVI and other main influencing factors

      (1)NDVI對野火發(fā)生有積極的正向作用,當(dāng)NDVI>0.5時,Shapley>0,更易發(fā)生野火,符合客觀事實規(guī)律。NDVI與其余因子間存在較強的交互作用。

      (2)降雨量與NDVI的交互作用較強,降雨量越多,植被發(fā)育能力越強,促進了野火發(fā)生的基礎(chǔ)條件。當(dāng)年降雨量>2 000 mm時,地表及空氣濕度過大,不利于野火災(zāi)害的發(fā)生。

      (3)當(dāng)?shù)匚镱愋蜑榱值睾筒莸貢r,NDVI較大,Shapley>0,更易發(fā)生野火災(zāi)害。

      (4)氣溫對野火發(fā)生存在正向影響,氣溫越高,發(fā)生野火的可能性越高。當(dāng)氣溫>20.5 ℃時,易發(fā)生野火災(zāi)害。

      (5)高度與野火發(fā)生間存在非單調(diào)關(guān)系。高植被覆蓋地區(qū)主要分布于200 m以上海拔區(qū)域,野火發(fā)生概率大;當(dāng)高程>700 m時,野火可能性降低。

      (6)除Alh、LVh、RK、UR和WR外,其余土壤類型均存在發(fā)生野火的可能性,其中,屬Ach、Acf和Acu等土壤類型的樣本Shapley普遍大于0,野火災(zāi)害更容易發(fā)生。

      (7)平均風(fēng)速(V分量)與野火易發(fā)性預(yù)測結(jié)果間沒有明顯的區(qū)間單調(diào)關(guān)系。整體規(guī)律為,基于0 m/s的風(fēng)速為對稱,當(dāng)東西向風(fēng)速>0.1 m/s時,大部分樣本的Shapley>0,對野火發(fā)生有促進作用。

      (8)當(dāng)10 °坡度<30 °時,樣本的植被覆蓋率高,樣本Shapley普遍大于0,利于野火災(zāi)害的發(fā)生。

      (9)平均風(fēng)速對野火發(fā)生存在負向影響,Shapley>0 m/s且數(shù)值較高的樣本,普遍位于風(fēng)速值<0.5 m/s的區(qū)間,野火發(fā)生概率較大。

      4.3 典型野火災(zāi)害的局部性分析

      SHAP不僅可以在全局維度上解釋分析各因子對全域野火易發(fā)性結(jié)果的影響,還可以在局部維度上分析模型對單個樣本中不同因子對其預(yù)測結(jié)果的影響[29]。本文研究基于國內(nèi)主流媒體獲取到2012—2022年內(nèi)南寧市重大野火災(zāi)害和樣本數(shù)據(jù)信息,結(jié)合所構(gòu)建的野火易發(fā)性預(yù)測模型,對其進行局部性解釋分析。表4為檢索到的3起歷史重大野火的詳細信息,圖9為3起野火災(zāi)害對應(yīng)的樣本解釋圖,圖9中縱軸為該樣本主要影響因子的名稱及屬性值;中央紅色表示利于野火發(fā)生的正向因素的力度,藍色相反;各個因子的正負向的力度相互抵消,得到圖9上側(cè)的最終預(yù)測值f(x)。

      表4 南寧市重大野火災(zāi)害信息Table 4 Information of historical major wildfire disaster in Nanning

      圖9 歷史野火災(zāi)害的局部性解釋結(jié)果Fig.9 Local interpretation results of historical wildfire disasters

      經(jīng)過分析可得如下結(jié)果。

      (1)對于野火樣本a,NDVI、坡度、風(fēng)速、TWI、人口密度和距道路距離因子起主要的正向力度;氣溫、風(fēng)速(V分量)和高程對樣本起著負向力度;其余9項因子貢獻0.12的正向力度,最終預(yù)測的野火易發(fā)性指數(shù)為0.736,判斷為野火樣本。

      (2)對于野火樣本b,NDVI、高程、氣溫、地物類型、坡度、土壤類型和平面曲率起正向力度;降雨和風(fēng)速(V分量)起微弱的負向力度;其余9項因子貢獻0.02的正向力度,最終預(yù)測的野火易發(fā)性指數(shù)為0.957,判斷為野火樣本。

      (3)對于野火樣本c,NDVI、高程、土壤類型、風(fēng)速(V分量)、坡度、地物類型、距道路距離和SPI起正向力度;氣溫起主要的負向力度;其余9項因子貢獻0.07的正向力度,最終預(yù)測的野火易發(fā)性指數(shù)為0.897,判斷為野火樣本。

      5 結(jié)論

      以南寧市歷史野火災(zāi)害數(shù)據(jù)為樣本,選取高程、年均降雨量、平均氣溫、平均風(fēng)速、NDVI等18個因素作為評價因子。分別基于CART、RF、LGBM和XGBoost模型進行野火易發(fā)性建模,利用多維評價指標驗證各模型的預(yù)測性能,并選出最優(yōu)模型。并且,基于SHAP可解釋方法對模型進行特征全局性解釋、特征依賴性分析、典型樣本的局部性分析。研究結(jié)論如下。

      (1)基于CART、RF、LGBM和XGBoost模型的野火易發(fā)性等級區(qū)劃結(jié)果的分布規(guī)律相似,其極高易發(fā)區(qū)主要分布于研究區(qū)西北部、東部及南部。就南寧市野火易發(fā)性評價結(jié)果而言,XGBoost模型較其他模型擁有更合理的易發(fā)性區(qū)劃結(jié)果和更優(yōu)秀的預(yù)測性能,其極高易發(fā)區(qū)占區(qū)域總面積的39.113%,ROC曲線的AUC為0.959,樣本總體預(yù)測精度為0.906,預(yù)測結(jié)果更可靠且更貼近樣本的真實屬性。

      (2)對最優(yōu)模型進行特征全局解釋和特征依賴性分析,得知研究區(qū)內(nèi)各因子對野火發(fā)生的作用方向和力度,發(fā)現(xiàn)重要性較高的因子有NDVI、降雨、土壤類型、氣溫、高程、地物類型、風(fēng)速(V分量)、坡度和風(fēng)速,并分析了主要影響因子的變化對野火易發(fā)性預(yù)測結(jié)果的影響。

      (3)典型野火樣本的局部性解釋結(jié)果,與因子依賴性分析結(jié)果相符。其不僅提高了野火易發(fā)性模型分析結(jié)果的可信度,還有效驗證了模型對典型野火災(zāi)害的預(yù)測穩(wěn)定性,為南寧市野火災(zāi)害的防治提供了理論基礎(chǔ)及針對性建議。

      對區(qū)域性野火易發(fā)性的解釋均基于具有優(yōu)秀預(yù)測性能的數(shù)據(jù)驅(qū)動模型進行的,并不是客觀地解釋物理原理。當(dāng)樣本或因子的數(shù)量或?qū)傩园l(fā)生變化時,可能導(dǎo)致決策結(jié)果發(fā)生改變。因此,要想使野火易發(fā)性模型的解釋結(jié)果接近客觀現(xiàn)實,除了選擇具有優(yōu)秀性能的模型外,還應(yīng)確保樣本數(shù)據(jù)的準確性和評價因子的全面性。

      猜你喜歡
      野火易發(fā)南寧市
      野火:道是無情卻有情
      機用鎳鈦銼在乳磨牙根管治療中的應(yīng)用
      貴州省地質(zhì)災(zāi)害易發(fā)分區(qū)圖
      夏季羊易發(fā)疾病及防治方法
      Sam’s Family
      冬季雞腸炎易發(fā) 科學(xué)防治有方法
      關(guān) 公
      寶藏(2019年3期)2019-03-28 05:24:16
      基于多特征融合的早期野火煙霧檢測
      南寧市核心區(qū)舊橋景觀改造
      創(chuàng)新南寧市社會組織的管理模式
      景德镇市| 耒阳市| 麻阳| 武冈市| 介休市| 新闻| 岳阳县| 剑川县| 蓝田县| 出国| 广宗县| 苏尼特右旗| 蕉岭县| 大化| 贵定县| 拉萨市| 青河县| 宁晋县| 古浪县| 吉木乃县| 白沙| 大姚县| 永登县| 山东| 许昌市| 剑河县| 涟源市| 竹北市| 嵩明县| 万宁市| 冕宁县| 淄博市| 淮阳县| 青海省| 万盛区| 永泰县| 来安县| 前郭尔| 民权县| 浮梁县| 且末县|