王麗英 王紅梅 郭盈盈 紀(jì)丁愈
摘要:滑坡易發(fā)性分區(qū)是預(yù)測滑坡的有效方法,但目前的建模數(shù)據(jù)較為單一,而建模數(shù)據(jù)會對分區(qū)的結(jié)果造成影響,因此,需要對建模數(shù)據(jù)源進(jìn)行深入挖掘。以陜西省延安市志丹縣為研究區(qū),選擇了10種滑坡誘發(fā)因子,基于289個(gè)滑坡樣本,分別計(jì)算了各誘發(fā)因子的頻率密度(FR)和盒維數(shù),構(gòu)建了2組差異化的建模數(shù)據(jù);隨后利用核函數(shù)邏輯回歸模型(KLR)制作了研究區(qū)滑坡易發(fā)性分區(qū)圖;最后采用平均絕對誤差(MAE)和ROC曲線下的面積(AUC)對分區(qū)的結(jié)果和模型進(jìn)行了評價(jià)和對比。結(jié)果表明:利用盒維數(shù)作為建模數(shù)據(jù)可有效提升分區(qū)結(jié)果的精度和模型的分類以及泛化能力,值得在研究區(qū)推廣。
關(guān) 鍵 詞:滑坡; 易發(fā)性分區(qū); ROC曲線; 誘發(fā)因子; 頻率密度; 盒維數(shù); 志丹縣; 陜西省
中圖法分類號: P694
文獻(xiàn)標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2021.12.015
0 引 言
黃土滑坡是陜西省北部的黃土丘陵溝壑區(qū)范圍內(nèi)最具威脅的自然災(zāi)害之一,并且由于黃土本身的結(jié)構(gòu)特性以及黃土高原特殊的自然環(huán)境,滑坡發(fā)生概率較高[1]。志丹縣位于陜西省延安市西北部,地貌類型屬于典型的黃土丘陵溝壑區(qū),全縣范圍內(nèi)地質(zhì)災(zāi)害頻發(fā),根據(jù)志丹縣2019年地質(zhì)災(zāi)害防治方案顯示,2019年內(nèi)列入全縣地質(zhì)災(zāi)害群測群防數(shù)據(jù)庫的隱患點(diǎn)共39處,其中滑坡22處,在每年在汛期時(shí),都會發(fā)育大量的滑坡災(zāi)害,嚴(yán)重威脅當(dāng)?shù)鼐用竦纳a(chǎn)生活,制約著當(dāng)?shù)亟?jīng)濟(jì)的發(fā)展。并且當(dāng)?shù)厝丝诩?,加之資源和土地的需求量大,而地質(zhì)災(zāi)害發(fā)育的范圍仍在擴(kuò)張,因此開展滑坡災(zāi)害的易發(fā)性分區(qū)工作十分必要。
對于滑坡易發(fā)性分區(qū)的研究,國內(nèi)外學(xué)者不僅充分發(fā)揮了GIS技術(shù)在可視化分析、圖形編輯、數(shù)據(jù)管理、空間分析、DEM模型等功能方面的優(yōu)勢,還先后提出了信息量模型[2]、專家打分模型[3]、邏輯回歸模型[4]、判別分析模型[5]、人工神經(jīng)網(wǎng)絡(luò)模型[6]、支持向量機(jī)模型[7]、物元模型[8]等,基于不同的尺度開展了不同地區(qū)的滑坡易發(fā)性分區(qū)工作。雖然這些研究取得了豐碩的成果,但是在滑坡易發(fā)性分區(qū)建模的樣本準(zhǔn)備階段,建模數(shù)據(jù)是影響易發(fā)性分區(qū)結(jié)果的關(guān)鍵因素[9],而現(xiàn)有的研究所使用的建模數(shù)據(jù)較為單一,還未對不同類型的建模數(shù)據(jù)進(jìn)行深入的挖掘和對比。
鑒于此,本文以志丹縣作為研究區(qū),分別基于兩組差異化的建模數(shù)據(jù)集,構(gòu)建核函數(shù)邏輯回歸模型(Kernel logistic regression model,KLR),繪制研究區(qū)的滑坡易發(fā)性分區(qū)圖。在評估易發(fā)性分區(qū)精度的基礎(chǔ)上,對比評價(jià)建模數(shù)據(jù)對分區(qū)結(jié)果的影響。所得到的結(jié)果可以為當(dāng)?shù)氐刭|(zhì)災(zāi)害防治工作提供建議,同時(shí)也可以為黃土丘陵溝壑區(qū)的滑坡易發(fā)性分區(qū)研究提供一種新的方法。
1 研究區(qū)概況和數(shù)據(jù)來源
1.1 研究區(qū)概況
志丹縣位于陜西省延安市西北部的黃土丘陵溝壑地區(qū),地理坐標(biāo)位于東經(jīng)108°11′56″~109°3′48″,北緯 36°21′23″~37°11′47″之間(見圖1)。全縣東西長約70 km,南北寬約92.56 km,總面積約3 781 km2。志丹縣的氣候類型屬于典型的溫帶大陸性季風(fēng)氣候,年平均氣溫為8.1 ℃,最低氣溫為-28 ℃,最高氣溫為37.4 ℃。由于志丹縣地處黃土高原,年平均降雨量約為472.2 mm,降雨的月份在一年之中分布不均勻,6~8月為降雨相對集中的月份,降雨量約為292.9 mm,降雨通常以暴雨形式出現(xiàn),占年降雨量的56%。降雨區(qū)域分布不均勻,總體趨勢為從西北部地區(qū)到東南部地區(qū)降雨量逐漸增多,愈偏北降雨量愈少。流經(jīng)志丹縣境內(nèi)的河流主要有洛河、周河、杏子河,縣內(nèi)以洛河、周河、杏子河3條河流為主干,大小支流、沖溝極為發(fā)育,溝壑密度為1.3 km/ km2,河流比降為1.6‰。
志丹縣地貌類型屬于以梁峁為主體的黃土梁峁丘陵溝壑區(qū)地貌,在長期的侵蝕作用下形成了幾個(gè)顯著的特點(diǎn):地表破碎、梁峁密布、溝壑縱橫、河谷深切、基巖裸露。全縣范圍內(nèi)主要發(fā)育中生代-新生代地層,具體包括三疊系、侏羅系、新近系和第四系地層,其中第四系黃土覆蓋于全縣境內(nèi),其余時(shí)代的底層大多零星的出露于沖溝或者河谷兩側(cè)。根據(jù)地層年代將研究區(qū)的巖性類型劃分為4組(見表1)。志丹縣的地質(zhì)構(gòu)造類型屬于華北陸臺鄂爾多斯地臺中的陜北盆地,構(gòu)造類型是以延安地區(qū)為中心的陜北單斜翹曲構(gòu)造,整體形狀呈東高西低的趨勢。據(jù)《陜西省區(qū)域地質(zhì)志》記載[10],志丹縣境內(nèi)無4級以上地震活動發(fā)生,所以本文研究的滑坡均為降雨型滑坡。
1.2 數(shù)據(jù)來源
本文所使用的原始數(shù)據(jù)包括:① 3.24 m×3.24 m分辨率的GF-2全色多光譜遙感影像(軌道號921309,日期2018-07-29);②30 m×30 m分辨率的數(shù)字高程模型(DEM);③ 1∶100 000比例尺的研究區(qū)土地利用圖;④1∶200 000比例尺的研究區(qū)地質(zhì)圖;⑤ 基于野外實(shí)際調(diào)查的289個(gè)滑坡樣本。
1.3 樣本預(yù)處理
滑坡在遙感影像上所呈現(xiàn)出的平面形態(tài)是不規(guī)則的,由于受到研究區(qū)圖幅比例尺的影響,當(dāng)研究范圍大于1 000 km2時(shí),平面面積最大的滑坡在圖中也無法顯現(xiàn)出其全部的輪廓。并且在建模運(yùn)算時(shí),柵格圖形分辨率的高低也會對模型運(yùn)算的速度造成影響[11]。因此,對于滑坡易發(fā)性分區(qū)而言,有必要在建模前期對樣本進(jìn)行預(yù)處理。研究區(qū)內(nèi)發(fā)育的滑坡總面積為30.24 km2,約占研究區(qū)總面積的0.8%。因此,為了提高運(yùn)算效率,本文采用質(zhì)心法(Centroid method)將研究區(qū)內(nèi)289個(gè)不規(guī)則的滑坡圖斑轉(zhuǎn)換為289個(gè)滑坡點(diǎn)。
由于后續(xù)的滑坡易發(fā)性分區(qū)涉及到因子篩選和機(jī)器學(xué)習(xí)建模,而建立和評估模型的重點(diǎn)就是要將數(shù)據(jù)分別劃分為訓(xùn)練樣本集(Training dataset)和測試樣本集(Validation dataset),所以需要創(chuàng)建與正樣本(滑坡點(diǎn))同等數(shù)量的負(fù)樣本(非滑坡點(diǎn)),并按照7/3的比例對滑坡點(diǎn)和非滑坡點(diǎn)進(jìn)行隨機(jī)分割,最終得到由404個(gè)樣本(202個(gè)滑坡點(diǎn)和202個(gè)非滑坡點(diǎn))構(gòu)成的訓(xùn)練樣本集和由174個(gè)樣本(87個(gè)滑坡點(diǎn)和87個(gè)非滑坡點(diǎn))構(gòu)成的測試樣本集(見圖1)。
1.4 誘發(fā)因子提取與分級
基于研究區(qū)的地質(zhì)環(huán)境背景資料,選取了高程、平面曲率、剖面曲率、坡度、坡向、道路緩沖區(qū)、水系緩沖區(qū)、年平均降雨量、NDVI、地層巖性作為研究區(qū)滑坡誘發(fā)因子。隨后利用ArcGIS軟件,基于所選用的數(shù)據(jù)源對誘發(fā)因子進(jìn)行提取,并將因子圖層全部重采樣為30 m×30 m分辨率(見圖2)。最后對提取出的誘發(fā)因子進(jìn)行分級。
2 研究方法
2.1 FR的計(jì)算方法
利用頻率密度(Frequency ratio,F(xiàn)R)量化滑坡誘發(fā)因子是一種較為常用的方法。
通常以Sim/S表示誘發(fā)因子各分級內(nèi)的滑坡樣本數(shù)(Sim)占總樣本數(shù)(S)的百分比,以Zim/Z表示誘發(fā)因子各分級的柵格數(shù)(Zim)占總柵格數(shù)(Z)的百分比,利用公式(1) 可計(jì)算得出各誘發(fā)因子分級對應(yīng)的FR。
FR=Sim/SZim/Z(1)
隨后,基于計(jì)算得到的FR值,分別對每一種滑坡誘發(fā)因子進(jìn)行重分類,構(gòu)建出基于FR的建模數(shù)據(jù)集1。
2.2 分維數(shù)的測量方法
分維數(shù)是定量反映功能、形態(tài)、時(shí)間、信息、空間等特征在局部與局部、局部與整體之間具有統(tǒng)計(jì)意義的參數(shù),也可以定量反映滑坡的空間分布特征[12]。為了測量研究區(qū)滑坡在空間內(nèi)分布的分形維數(shù),本文采用目前應(yīng)用最廣泛的分維數(shù)測量方法,即盒維數(shù)法(Box-counting Method)。盒維數(shù)法是既可以在二維、三維空間中進(jìn)行分維數(shù)估算的經(jīng)典方法,同時(shí)也適用于點(diǎn)集[13]。
盒維數(shù)的測量原理為:首先利用邊長為γ的正方形對分割研究區(qū),統(tǒng)計(jì)包含滑坡點(diǎn)的網(wǎng)格數(shù)N(γ),不斷改變γ對研究區(qū)重新劃分,統(tǒng)計(jì)有滑坡點(diǎn)分布的網(wǎng)格數(shù)量,從而獲得點(diǎn)對序列(γ,N(γ))。按照1 m的間隔改變γ 50次,使得點(diǎn)對序列滿足或者近似滿足公式(2),則可計(jì)算出對應(yīng)的盒維數(shù)d。
Nγ=γ-d(2)
同樣的,基于測算出的盒維數(shù),分別對每一種滑坡誘發(fā)因子進(jìn)行重分類,構(gòu)建出基于盒維數(shù)的建模數(shù)據(jù)集2。
2.3 誘發(fā)因子優(yōu)選
在滑坡易發(fā)性分區(qū)建模的過程中,并不是所有的滑坡誘發(fā)因子都對模型有積極的貢獻(xiàn)[14]。因此,為了提高模型運(yùn)算的精度和效率,有必要對誘發(fā)因子進(jìn)行篩選。本文通過計(jì)算各誘發(fā)因子對應(yīng)的信息增益率(Information gain ratio,IGR)來完成因子篩選。
熵可以反映滑坡誘發(fā)因子在評價(jià)體系中的混亂程度,而信息增益率是通過構(gòu)建C4.5決策樹,定量測算各誘發(fā)因子的熵增速率,從而判斷誘發(fā)因子對滑坡易發(fā)性分區(qū)模型的貢獻(xiàn)程度。IGR的輸出范圍為[0,1],當(dāng)誘發(fā)因子的IGR為0時(shí),表明該因子對模型無貢獻(xiàn),需要排除,且不參與建模。
2.4 KLR模型簡介
KLR模型的原理是在傳統(tǒng)邏輯回歸模型的基礎(chǔ)上,利用核函數(shù)(Kernel Function)將研究區(qū)內(nèi)的滑坡點(diǎn)轉(zhuǎn)換至一個(gè)n維空間內(nèi),使得線性不可分的問題得以在高維空間中被解決。KLR模型的計(jì)算方法如下:
LogitP=w·φx+b(3)
這里災(zāi)損土地發(fā)生的可能性同樣用P表示,w和b是模型的兩個(gè)參數(shù),φ為核函數(shù),則公式(3) 的對數(shù)形式可以寫為
P=11+exp(w·φx+b)(4)
本文所使用的核函數(shù)為RBF核函數(shù),其表達(dá)式如下:
Kxi,xj=exp-δxi-xj2,δ>0(5)
這里δ控制著RBF核函數(shù)的敏感度,在計(jì)算時(shí)需要手動輸入。
2.5 模型對比和結(jié)果評估的方法
2.5.1 統(tǒng)計(jì)學(xué)指標(biāo)
滑坡易發(fā)性分區(qū)結(jié)果的精度會對后續(xù)滑坡的防治工作造成影響,因此有必要對分區(qū)的結(jié)果進(jìn)行評估。本文利用平均絕對誤差(Mean Absolute Error,MAE)來對易發(fā)性分區(qū)的精度進(jìn)行檢測[15]。MAE表示所有獨(dú)立樣本的觀測值與目標(biāo)值之間的偏差,可以定量反映實(shí)際預(yù)測誤差的大小,MAE越小,說明結(jié)果的精度越高。
MAE=1nnz=1Az-F(z)(6)
式中:n為滑坡樣本點(diǎn)的數(shù)量,z表示滑坡樣本點(diǎn),A(z)和F(z)分別表示觀測值和目標(biāo)值。
2.5.2 ROC曲線
本文利用受試者接收特征曲線(Receiver Operating Characteristic Curve,ROC)對滑坡易發(fā)性分區(qū)模型進(jìn)行比較。ROC曲線在滑坡易發(fā)性分區(qū)研究中應(yīng)用十分廣泛,同時(shí)也取得了令人滿意的效果[16]。ROC曲線的橫軸和縱軸分別為1-特異度(1-Specificity)和敏感度(Sensitivity),通常利用曲線下面積(AUC)來判定模型的優(yōu)劣[17]。AUC的計(jì)算方法如下:
Sensitivty=TPTP+FN(7)
Specificity=TNTN+FP(8)
AUC=TP+TNTP+TN+FP+FN(9)
式中:TP和TN分別表示被正確分類的滑坡點(diǎn)和非滑坡點(diǎn)的數(shù)量,F(xiàn)N和FP分別表示被錯(cuò)誤分類的滑坡點(diǎn)和非滑坡點(diǎn)的數(shù)量。一般來講,AUC越接近1,說明模型的分類能力越強(qiáng)。
3 結(jié)果與分析
3.1 因子篩選結(jié)果
基于數(shù)據(jù)集1和數(shù)據(jù)集2中的訓(xùn)練數(shù)據(jù),分別計(jì)算數(shù)據(jù)集中各滑坡誘發(fā)因子對應(yīng)的IGR。從表2可以看出,在數(shù)據(jù)集1和數(shù)據(jù)集2中,道路緩沖區(qū)因子對模型的貢獻(xiàn)度都最高,IGR值分別為0.688 3和0.635 8;數(shù)據(jù)集1中得平面曲率因子對模型的貢獻(xiàn)度最低(IGR為0.115 4),數(shù)據(jù)集2中的剖面曲率因子對模型的貢獻(xiàn)度最低(IGR為0.107 7)。此外,研究區(qū)內(nèi)所有滑坡誘發(fā)因子的IGR值均大于0,且對應(yīng)的標(biāo)準(zhǔn)差均處于合理的范圍內(nèi),表明所有的誘發(fā)因子都對模型有積極的貢獻(xiàn)。因此,保留數(shù)據(jù)集1和數(shù)據(jù)集2中的全部滑坡誘發(fā)因子。
3.2 基于差異化建模數(shù)據(jù)的滑坡易發(fā)性分區(qū)
基于表3所列出的FR以及盒維數(shù),構(gòu)建了數(shù)據(jù)集1和數(shù)據(jù)集2。分別利用數(shù)據(jù)集1和數(shù)據(jù)集2中的訓(xùn)練數(shù)據(jù)訓(xùn)練KLR模型。為了對模型中的參數(shù)進(jìn)行優(yōu)調(diào),本文采用10折交叉驗(yàn)證(10-Cross Validation)的方法分別獲得了數(shù)據(jù)集1對應(yīng)的參數(shù)(δ=0.025 2)和數(shù)據(jù)集2對應(yīng)的參數(shù)(δ=0.027 1)。
分別利用數(shù)據(jù)集1和數(shù)據(jù)集2構(gòu)建KLR模型,模型輸出的后驗(yàn)概率即為滑坡易發(fā)性指數(shù)(Landslide susceptibility index,LSI),輸出區(qū)間為[0,1]。LSI越趨近于1,說明滑坡發(fā)生的概率越高,反之亦然。隨后基于自然間斷點(diǎn)法將兩組LSI分割為5個(gè)區(qū)間,分別代表極低易發(fā)區(qū)、低易發(fā)區(qū)、中易發(fā)區(qū)、高易發(fā)區(qū)和極高易發(fā)區(qū)。最后利用ArcGIS軟件對劃分后的易發(fā)區(qū)進(jìn)行可視化,結(jié)果如圖3所示。
3.3 分區(qū)結(jié)果精度評價(jià)
本文分別利用數(shù)據(jù)集1和數(shù)據(jù)集2中的訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),計(jì)算分區(qū)結(jié)果對應(yīng)的MAE來完成精度評價(jià)。從訓(xùn)練數(shù)據(jù)檢測的結(jié)果可以看出(見圖4):基于數(shù)據(jù)集1所構(gòu)建的KLR模型的MAE=0.24,基于數(shù)據(jù)集2所構(gòu)建的KLR模型的MAE=0.18。從測試數(shù)據(jù)檢測的結(jié)果可以看出(見圖5):基于數(shù)據(jù)集1所構(gòu)建的KLR模型的MAE=0.31,基于數(shù)據(jù)集2所構(gòu)建的KLR模型的MAE=0.11。結(jié)果表明,利用數(shù)據(jù)集2作為建模數(shù)據(jù)生成的滑坡易發(fā)性分區(qū)結(jié)果的精度高于數(shù)據(jù)集1。
3.4 模型對比
本文利用ROC曲線下的面積(AUC)對比模型的分類能力和泛化性。分別基于數(shù)據(jù)集1和數(shù)據(jù)集2中的訓(xùn)練數(shù)據(jù)繪制ROC曲線,見圖6(a),結(jié)果顯示數(shù)據(jù)集2對應(yīng)的AUC值最高為0.880 6,并且95% CI和標(biāo)準(zhǔn)差均最低,表明利用數(shù)據(jù)集2構(gòu)建的KLR模型對滑坡的分類能力最強(qiáng)。
分別基于數(shù)據(jù)集1和數(shù)據(jù)集2中的測試數(shù)據(jù)繪制ROC曲線,見圖6(b),結(jié)果顯示數(shù)據(jù)集2對應(yīng)的AUC值同樣最高為0.920 3,且95% CI和標(biāo)準(zhǔn)差均最低,表明利用數(shù)據(jù)集2構(gòu)建的KLR模型的泛化性最優(yōu),值得在研究區(qū)推廣。
4 討 論
在滑坡易發(fā)性分區(qū)建模前,排除無貢獻(xiàn)程度的因子是非常必要的[18]。眾多研究結(jié)果表明:如果利用對模型無貢獻(xiàn)的誘發(fā)因子參與建模,不僅會降低運(yùn)算效率,增加過擬合的風(fēng)險(xiǎn),同時(shí)也會對分區(qū)結(jié)果的精度造成影響[19-20]。因此本文通過計(jì)算信息增益率來定量評估滑坡誘發(fā)因子對模型的貢獻(xiàn)程度,排除無貢獻(xiàn)的誘發(fā)因子,以保證分區(qū)結(jié)果的精度。
KLR模型是基于LR模型衍生出的一種高性能機(jī)器學(xué)習(xí)算法,具有結(jié)構(gòu)簡單等優(yōu)點(diǎn)。KLR模型不僅在滑坡災(zāi)害的研究中被廣泛使用,同時(shí)也在其他的研究領(lǐng)域被使用[21]。在構(gòu)建KLR模型的過程中,參數(shù)的選擇直接決定著分類的精度[22]。因此本文利用了10折交叉驗(yàn)證的方法進(jìn)行調(diào)參,目的就是為了將參數(shù)對模型的影響降至最低。另外,選擇不同的核函數(shù)也會產(chǎn)生不同的結(jié)果,鑒于此,在今后的研究中,會嘗試?yán)貌煌暮撕瘮?shù)來完成滑坡易發(fā)性分區(qū),并對結(jié)果進(jìn)行評估。
利用FR作為模型的建模數(shù)據(jù),在滑坡研究中十分常見,但是利用盒維數(shù)作為KLR模型的建模數(shù)據(jù)的研究還少之又少。從張庭瑜等[23-24]的研究可以看出,在縣域尺度下,盒維數(shù)不僅可以有效地反映出滑坡在空間中的分布狀態(tài),同時(shí)也可以揭示滑坡誘發(fā)因子與滑坡之間的內(nèi)在聯(lián)系。另外從結(jié)果可以明顯看出,利用盒維數(shù)作為模型的建模數(shù)據(jù),可以取得更高精度的分區(qū)結(jié)果,同時(shí),模型的分類能力和泛化性也優(yōu)于傳統(tǒng)建模數(shù)據(jù)。因此,認(rèn)為利用盒維數(shù)作為滑坡易發(fā)性分區(qū)的建模數(shù)據(jù)是一種高效且新穎的方法。
5 結(jié) 論
本文分別利用頻率密度和盒維數(shù)量化滑坡誘發(fā)因子,構(gòu)建了2種差異化的建模數(shù)據(jù)集(數(shù)據(jù)集1和數(shù)據(jù)集2)。以核函數(shù)邏輯回歸模型(KLR)和289個(gè)滑坡樣本為基礎(chǔ),分別利用兩種數(shù)據(jù)集構(gòu)建了KLR模型,制作了陜西省延安市志丹縣滑坡易發(fā)性分區(qū)圖。利用平均絕對誤差(MAE)和ROC曲線下的面積(AUC)對分區(qū)的結(jié)果和模型進(jìn)行了評價(jià)。結(jié)果表明:當(dāng)利用盒維數(shù)作為建模數(shù)據(jù)時(shí),滑坡易發(fā)性分區(qū)結(jié)果的平均絕對誤差最小(MAE=0.11),精度最高,且模型對滑坡的分類能力最強(qiáng),泛化性最優(yōu)。同時(shí)所得到的結(jié)果可以為當(dāng)?shù)氐幕路乐喂ぷ魈峁?shù)據(jù)基礎(chǔ),也可以為今后研究區(qū)內(nèi)的滑坡研究提供參考。
參考文獻(xiàn):
[1] 徐張建,林在貫,張茂省.中國黃土與黃土滑坡[J].巖石力學(xué)與工程學(xué)報(bào),2007,17(7):1297-1312.
[2] 張向營,張春山,孟華君,等.基于GIS和信息量模型的京張高鐵滑坡易發(fā)性評價(jià)[J].地質(zhì)力學(xué)學(xué)報(bào),2018,34(1):96-105.
[3] 張向營,張春山,孟華君,等.基于Random Forest和AHP的貴德縣北部山區(qū)滑坡危險(xiǎn)性評價(jià)[J].水文地質(zhì)工程地質(zhì),2018,45(4):142-149.
[4] TSANGARATOS P,ILIA I.Comparison of a logistic regression and Nave Bayes classifier in landslide susceptibility assessments:the influence of models complexity and training dataset size[J].Catena,2016,145(2):164-179.
[5] 李秀珍,王成華,宋剛.基于Fisher判別分析法的潛在滑坡判識模型及其應(yīng)用[J].中國地質(zhì)災(zāi)害與防治學(xué)報(bào),2009,20(4):23-26.
[6] CHEN W,POURGHASEMI H R,ZHAO Z.A GIS-based comparative study of Dempster-Shafer,logistic regression and artificial neural network models for landslide susceptibility mapping[J].Geocarto International,2017,32(4):367-385.
[7] KUMAR D,THAKUR M,DUBEY C S,et al.Landslide susceptibility mapping & prediction using Support Vector Machine for Mandakini River Basin,Garhwal Himalaya,India[J].Geomorphology,2017,295(15):115-125.
[8] 吳益平,殷坤龍,姜瑋.浙江省永嘉縣滑坡災(zāi)害風(fēng)險(xiǎn)預(yù)警研究[J].自然災(zāi)害學(xué)報(bào),2009,18(2):124-130.
[9] JUNG-HYUN L,SAMEEN M I,PRADHAN B,et al.Modeling landslide susceptibility in data-scarce environments using optimized data mining and statistical methods[J].Geomorphology,2018,303(9):284-298.
[10] 陜西省地質(zhì)礦產(chǎn)局.陜西省區(qū)域地質(zhì)志[M].北京:地質(zhì)出版社,1989.
[11] HYUN-JOO O,SARO L,SOO-MIN H.Landslide susceptibility assessment using frequency ratio technique with Iterative random sampling[J].Journal of Sensors,2017,2017(4):1-21.
[12] YANG Z Y,POURGHASEMI H R,LEE Y H,et al.Fractal analysis of rainfall-induced landslide and debris flow spread distribution in the Chenyulan Creek Basin,Taiwan[J].Journal of Earth Science,2016,27(1):151-159.
[13] LIU L,LI S,LI X,et al.An integrated approach for landslide susceptibility mapping by considering spatial correlation and fractal distribution of clustered landslide data[J].Landslides,2019,16(4):1-14.
[14] HONG H,PRADHAN B,SAMEEN M I,et al.Improving the accuracy of landslide susceptibility model using a novel region-partitioning approach[J].Landslides,2018,15(4):753-772.
[15] PHAM B T,PRAKASH I,SINGH S K,et al.Landslide susceptibility modeling using Reduced Error Pruning Trees and different ensemble techniques:hybrid machine learning approaches[J].Catena,2019,175(5):203-218.
[16] 韓玲,張庭瑜,張恒.基于IOE和SVM模型的府谷鎮(zhèn)滑坡易發(fā)性分區(qū)[J].水土保持研究,2019,26(3):373-378.
[17] 張庭瑜,韓玲,張恒,等.混合分類模型在滑坡易發(fā)性分區(qū)中的適用性研究:以延安市寶塔區(qū)為例[J].干旱區(qū)資源與環(huán)境,2020,22(1):192-201.
[18] YOUSSEF,AHMED M,AL-KATHERY,et al.Landslide susceptibility mapping at Al-Hasher area,Jizan(Saudi Arabia)using GIS-based frequency ratio and index of entropy models[J].Geoscience Journal,2015,19(1):113-134.
[19] KAVZOGLU T,KUTLUG SAHIN E,COLKESEN I.An assessment of multivariate and bivariate approaches in landslide susceptibility mapping:a case study of Duzkoy district[J].Natural Hazards,2015,76(1):471-496.
[20] YOUSSEF A M,POURGHASEMI H R,POURTAGHI Z S,et al.Landslide susceptibility mapping using random forest,boosted regression tree,classification and regression tree,and general linear models and comparison of their performance at Wadi Tayyah Basin,Asir Region,Saudi Arabia[J].Landslides,2016,13(5):839-856.
[21] CHEN W,XIE X,PENG J,et al.GIS-based landslide susceptibility modelling:a comparative assessment of kernel logistic regression,Nave-Bayes tree,and alternating decision tree models[J].Geomatics Natural Hazards & Risk,2017,8(2):950-973.
[22] WANG L J,SAWADA K,MORIGUCHI S.Landslide-susceptibility analysis using light detection and ranging-derived digital elevation models and logistic regression models:a case study in Mizunami City,Japan[J].Journal of Applied Remote Sensing,2013,7(1):35-61.
[23] ZHANG T Y,HAN L,HAN J,et al.Assessment of landslide susceptibility using integrated ensemble fractal dimension with Kernel Logistic Regression Model[J].Entropy,2019,21(2):218-234.
[24] ZHANG T Y,HAN L,ZHANG H,et al.GIS-based landslide susceptibility mapping using hybrid integration approaches of fractal dimension with index of entropy and support vector machine[J].Journal of Mountain Science,2019,16(6):1275-1288.
(編輯:劉 媛)
Landslide susceptibility mapping based on differentiated modeling data in Zhidan County,Shaanxi Province
WANG Liying1,WANG Hongmei2,GUO Yingying1,JI Dingyu3
(1.School of Intelligent Construction,Chongqing Vocational College of Civil Engineering,Chongqing 400072,China; 2.Urban Construction College,Chongqing Energy Vocational College,Chongqing 402260,China; 3.State Key Laboratory of Hydraulics and Mountain River Development and Protection,Sichuan University,Chengdu 610065,China)
Abstract:
Landslide susceptibility mapping is an effective method to predict landslides,but the current modeling data is relatively single,moreover the modeling data may affect the results of the mapping.Therefore,it is necessary to dig deeper into the modeling data sources.In view of this,we selected 10 landslide triggering factors in Zhidan County,Yanan City,Shaanxi Province.Based on 289 landslide samples,the frequency ratio and box counting dimension of each triggering factor were calculated,and two sets of differentiated modeling data were constructed.Then,the landslide susceptibility maps of the study area were made by using the kernel function logistic regression model.Finally,the average absolute error (MAE) and the area under the ROC curve (AUC) were used to evaluate and compare the results of landslide susceptibility mapping.The results show that using the box dimension as the modeling input data can effectively improve the accuracy of the partition results and the classification and generalization capabilities of the model,which is worthy of promotion in the study area.
Key words:
landslide;susceptibility mapping;ROC curve;landslide triggering factors;frequency ratio;box counting dimension;Zhidan County;Shaanxi Province