楊創(chuàng)奇 陶攀 楊正
摘要:研究合適的縣域滑坡易發(fā)性分區(qū)的方法,對于滑坡的防治有著非常重要的現(xiàn)實(shí)意義。鑒于此,基于陜西省延安市吳起縣的717個滑坡樣本,選取坡度、坡向、高程、平面曲率、剖面曲率、年平均降雨量、距道路的距離、距河流的距離、巖土體類型和NDVI作為影響因子,計(jì)算對應(yīng)的熵指數(shù),構(gòu)建了基于熵指數(shù)的建模數(shù)據(jù)集。隨后,基于建模數(shù)據(jù)集,耦合熵指數(shù)(IOE)和邏輯回歸樹模型(LMT),建立了IOE-LMT混合分類模型,并繪制了吳起縣滑坡易發(fā)性分區(qū)圖。利用多種統(tǒng)計(jì)學(xué)指標(biāo)、ROC曲線下的面積(AUROC)和平均絕對誤差(MAE)評價分區(qū)精度和模型的泛化性能。結(jié)果表明:IOE-LMT模型的泛化性能較強(qiáng)(AUROC=0.942),且滑坡易發(fā)性分區(qū)圖的精度較高;研究區(qū)內(nèi)滑坡易發(fā)于黃土溝道范圍內(nèi),并且研究區(qū)北部的滑坡易發(fā)性明顯高于南部。評價結(jié)果合理可靠,可為當(dāng)?shù)氐幕路乐魏蛧量臻g規(guī)劃提供參考。
關(guān) 鍵 詞:滑坡易發(fā)性分區(qū); 機(jī)器學(xué)習(xí); 混合分類模型; 空間分析; 延安市; 陜西省
中圖法分類號: P694
文獻(xiàn)標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2022.05.021
0 引 言
滑坡是世界上發(fā)生頻率最高、分布范圍最廣的地質(zhì)災(zāi)害之一。如何精確地預(yù)測滑坡的發(fā)生范圍是滑坡防治的關(guān)鍵問題?;乱装l(fā)性分區(qū)的原理是通過計(jì)算后驗(yàn)概率來預(yù)測滑坡發(fā)生的可能性,是一種預(yù)測滑坡的有效方法[1]?,F(xiàn)階段,滑坡易發(fā)性分區(qū)的評價方法總體分為兩大類:一類是知識驅(qū)動型方法,例如層次分析法(AHP)[2]、模糊邏輯法[3]、專家打分法[4]等。該類方法依賴人為的先驗(yàn)知識,計(jì)算結(jié)果容易受到人為因素的干擾。另一類是數(shù)據(jù)驅(qū)動型方法,主要包括統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)算法。統(tǒng)計(jì)學(xué)方法被大量應(yīng)用于滑坡易發(fā)性分區(qū)的研究中,如確定性指數(shù)模型(CF)[5]、熵指數(shù)(IOE)[6]、證據(jù)權(quán)模型(WoE)[7]等,該類模型可以明確地反映滑坡與影響因素之間的聯(lián)系,計(jì)算簡便,但過度依賴樣本的質(zhì)量,往往會造成結(jié)果錯分的現(xiàn)象出現(xiàn)。機(jī)器學(xué)習(xí)算法也被廣泛應(yīng)用于滑坡易發(fā)性分區(qū)研究中,例如邏輯回歸(LR)[8]、決策樹模型(DT)[9]、支持向量機(jī)(SVM)[10]、人工神經(jīng)網(wǎng)絡(luò)[11]等,雖然機(jī)器學(xué)習(xí)算法的計(jì)算效率高,但參數(shù)的選擇對機(jī)器學(xué)習(xí)模型的分類精度影響較大,并且大多數(shù)的機(jī)器學(xué)習(xí)算法無法直觀地展現(xiàn)分類過程,且計(jì)算量大,難以在大范圍地區(qū)開展分區(qū)建模。近年來,結(jié)合了統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)算法優(yōu)點(diǎn)的混合模型被越來越多地應(yīng)用于滑坡易發(fā)性分區(qū)中,并取得了令人滿意的效果,如IOE-LR[12]模型、ANFIS[13]模型、PSO-SVM[14]模型等。
雖然諸多學(xué)者在縣域尺度下利用統(tǒng)計(jì)學(xué)習(xí)方法、機(jī)器學(xué)習(xí)算法和混合模型進(jìn)行了滑坡易發(fā)性分區(qū)的研究,但不同區(qū)域內(nèi)的地質(zhì)條件和環(huán)境背景差異較大,并且模型的性能不僅會受到內(nèi)部參數(shù)的影響,同時也會受到由特定研究區(qū)域生成的建模數(shù)據(jù)的影響,所得到的滑坡易發(fā)性分區(qū)結(jié)果的準(zhǔn)確性以及合理性也會有所差別。目前,關(guān)于黃土高原地區(qū)縣域尺度下的滑坡易發(fā)性分區(qū)研究較少,該區(qū)域內(nèi)的各縣仍然缺乏區(qū)域性國土空間用途管制規(guī)劃必備的滑坡易發(fā)性分區(qū)圖,探索利用合適的模型開展滑坡易發(fā)性分區(qū)研究,以及如何提高分區(qū)結(jié)果的準(zhǔn)確性始終是此類地區(qū)需要研究的焦點(diǎn)。鑒于此,本文以陜西省延安市吳起縣作為研究區(qū),基于野外實(shí)際調(diào)查的滑坡樣本、地質(zhì)環(huán)境背景資料和前人的研究成果,利用混模型的優(yōu)勢,借助于耦合邏輯回歸樹模型(Logistic model tree,LMT)與熵指數(shù)模型,構(gòu)建了IOE-LMT模型,并對研究區(qū)滑坡易發(fā)性分區(qū)開展研究;最后對分區(qū)結(jié)果的精度和模型的泛化性能進(jìn)行定量評估,研究結(jié)果可為研究區(qū)的滑坡防治工作以及相關(guān)區(qū)域的地質(zhì)災(zāi)害研究提供參考。
1 研究區(qū)概況和數(shù)據(jù)源
1.1 研究區(qū)概況
吳起縣位于陜西省延安市西北部,地理坐標(biāo)為東經(jīng)107°38′57"~108°32′49",北緯36°33′33"~37°24′27",總面積為3 791.5 km2(見圖1)。境內(nèi)河流均屬黃河水系,河網(wǎng)密度約為0.86 km/km2,多年地表徑流量為1.357億m3。研究區(qū)地貌類型屬于黃土丘陵溝壑地貌,高程介于1 203~1 809 m之間,總體呈現(xiàn)出東北高、西南低的趨勢。研究區(qū)氣候類型屬于半干旱半濕潤溫帶大陸性季風(fēng)氣候,年平均溫度和年平均降水量分別為7.8 ℃和483.4 mm。降水時段主要集中于7~9月,且該時段內(nèi)的降水量約占全年降水量的62%。根據(jù)地層的出露情況,按照地層年代,可將研究區(qū)內(nèi)的巖土體類型分為4組(見表1)。此外,研究區(qū)的地層位于整體向西傾斜,傾角介于1°~3°的單斜構(gòu)造之上,區(qū)內(nèi)地震活動頻率較低,且無斷層[15]。
1.2 數(shù)據(jù)源和滑坡編錄
1.2.1 數(shù)據(jù)源和影響因子提取
數(shù)據(jù)源和滑坡影響因子的選擇會對滑坡易發(fā)性分區(qū)的結(jié)果造成影響,因此,在開展滑坡易發(fā)性分區(qū)建模之前,需要闡明研究所使用的數(shù)據(jù)源[16]。本文在詳細(xì)參考相關(guān)文獻(xiàn)以及開展野外調(diào)查的基礎(chǔ)上,選取了坡度、坡向、高程、平面曲率、剖面曲率、年平均降雨量、距道路的距離、距河流的距離、巖土體類型以及NDVI作為滑坡影響因子。其中,坡度、坡向、高程、平面曲率和剖面曲率因子是基于30 m×30 m分辨率的數(shù)字高程模型(Digital Elevation Model,DEM)提取(見圖2(a)~(e));根據(jù)研究區(qū)10 a(2009~2019年)平均降水量數(shù)據(jù)提取年平均降雨量因子(見圖2(f));NDVI因子是利用8 m分辨率的GF-1多光譜遙感影像提?。ㄒ妶D2(g));巖土體類型因子是基于研究區(qū)1∶200 000地質(zhì)圖提?。ㄒ妶D2(h));距道路的距離和距水系的距離因子是基于研究區(qū)內(nèi)的路網(wǎng)以及河網(wǎng)矢量提?。ㄒ妶D2(i)~(j))。由于因子圖層的分辨率不同會導(dǎo)致模型數(shù)據(jù)無法輸入,因此,每一種影響因子圖層的分辨率都被重采樣為30 m×30 m。
1.2.2 滑坡編錄和制備數(shù)據(jù)集
滑坡編錄是開展滑坡易發(fā)性分區(qū)研究的基礎(chǔ),滑坡編錄圖主要包括研究區(qū)內(nèi)滑坡的坐標(biāo)、類型、規(guī)模和特征屬性等[17]。根據(jù)野外詳細(xì)調(diào)查的數(shù)據(jù)和歷史滑坡資料,研究區(qū)內(nèi)共發(fā)育滑坡717處,其中包括681處堆積層滑坡和36處巖質(zhì)滑坡,滑坡的最大平面面積、最小平面面積和平均平面面積分別為2.6×103,2.7×104,7.7×103 m2。由于研究區(qū)內(nèi)的滑坡總面積僅占研究區(qū)總面積的0.04%,因此,為了提升計(jì)算效率,利用質(zhì)心法將全部717處滑坡圖斑轉(zhuǎn)換為滑坡點(diǎn),從而生成滑坡編錄圖(見圖1)。
此外,在構(gòu)建分區(qū)模型之前,首先需要制備模型的輸入數(shù)據(jù)集。本文將全部717個滑坡點(diǎn)的標(biāo)簽值設(shè)為1,作為正樣本。同時在非滑坡區(qū)域隨機(jī)地生成同等數(shù)量(717)的非滑坡點(diǎn),將標(biāo)簽值設(shè)為0,作為負(fù)樣本。最后,按照7/3的比例,將所有樣本隨機(jī)劃分為訓(xùn)練樣本(501個滑坡點(diǎn)和501個非滑坡點(diǎn))和測試樣本(216個滑坡點(diǎn)和216個非滑坡點(diǎn));其中,訓(xùn)練樣本用于構(gòu)建分區(qū)模型,測試樣本用于驗(yàn)證分區(qū)結(jié)果的精度和評估模型的泛化性能。
2 研究方法
2.1 熵指數(shù)(Index of entropy,IOE)
熵指數(shù)可以定量反映滑坡在空間中分布的混亂程度,同時也可以揭示滑坡影響因子與滑坡之間的內(nèi)在聯(lián)系[18]。假設(shè)Sij和Zij分別代表影響因子各分級所占的比例以及各分級中滑坡點(diǎn)所占的比例,則滑坡發(fā)生的頻率密度可以表示為
FRij=Sij/Zij(1)
則熵指數(shù)為
IOE=FRij/Njj=1FRij(2)
2.2 多重共線性檢測
雖然滑坡的發(fā)生是多種影響因子綜合作用的結(jié)果,但是每一種影響因子之間并不是總是完全獨(dú)立。如果影響因子之間存在高度相關(guān)的關(guān)系,則會導(dǎo)致模型失真,這就是多重共線性問題。本文通過計(jì)算分析每一種影響因子的方差膨脹系數(shù)(Variance Inflation Factor,VIF)和容忍度(Tolerances,TOL)檢測因子之間的多重共線性問題。當(dāng)VIF>10或TOL<0.1時,表明因子之間存在多重共線性問題,需要從數(shù)據(jù)集中剔除,不參與建模[19]。
2.3 邏輯回歸樹(Logistic model tree,LMT)
邏輯回歸樹模型(LMT)是在決策樹模型和邏輯回歸模型的基礎(chǔ)上衍生而來的混合模型,其原理就是在決策樹的節(jié)點(diǎn)中,使用邏輯回歸函數(shù)中的邏輯增益算法進(jìn)行決策[20]。假設(shè)在數(shù)據(jù)集中有x個向量和C種類別,則每一種類別的后驗(yàn)概率可以表示為
P(Cx)=eFc(x)Cn=1eFc(x)(3)
式中:Fc(x)表示線性回歸函數(shù)。在擬合的過程中,邏輯增益算法利用最大似然估計(jì)來尋找觀測值和預(yù)測值之間的最小偏差。
2.4 結(jié)果評估方法
滑坡易發(fā)性分區(qū)的精度直接影響著滑坡防治決策的效率,因此,對分區(qū)結(jié)果開展評估是十分必要的。本文分別利用敏感度(Sensitivity)、特異度(Specificity)、準(zhǔn)確度(Accuracy)對分區(qū)結(jié)果的精度進(jìn)行了評估,計(jì)算方法如下:
Sensitivity=TPTP+FN(4)
Specificity=TNTN+FP(5)
Accuracy=TP+TNTP+TN+FP+FN(6)
式中:TP和TN分別代表被正確分類的滑坡和非滑坡樣本,F(xiàn)P和FN分別代表被錯誤分類的滑坡和非滑坡樣本。
泛化性也是評價滑坡易發(fā)性分區(qū)方法的重要指標(biāo)[21]。本文基于受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC)下的面積(Area Under the ROC Curve,AUROC)和平均絕對誤差(Mean Absolute Error,MAE)對模型泛化性進(jìn)行定量評估。ROC曲線的橫縱坐標(biāo)分別為1-特異度和敏感度,曲線下的面積可以通過公式(7)計(jì)算。平均絕對誤差表示模型對每一個像元的分類結(jié)果與真實(shí)值之間誤差的平均值,MAE值越小,表示模型的分類結(jié)果越接近真實(shí)值。
AUROC=TP+TN717(7)
3 結(jié)果分析
3.1 因子篩選結(jié)果
基于訓(xùn)練樣本計(jì)算每一種影響因子對應(yīng)的方差膨脹系數(shù)和容忍度,結(jié)果如表2所列。從表2可以看出:NDVI因子的VIF最高(1.297),且TOL較低(0.771);距道路的距離因子的VIF最低(1.048),且TOL最高(0.954)。由于所有滑坡影響因子的VIF和TOL值都處于臨界值(VIF>10,TOL<0.1)之外,所以影響因子之間不存在多重共線性問題,因此,保留全部的影響因子,參與后續(xù)的建模。
3.2 模型耦合
本文首先計(jì)算每一種滑坡影響因子各分級對應(yīng)的熵指數(shù)(見表3)。隨后基于計(jì)算得到的熵指數(shù),對每一個影響因子圖層進(jìn)行重分類,得到基于熵指數(shù)的因子圖層。
以劃分好的樣本和因子圖層為基礎(chǔ),分別構(gòu)建基于熵指數(shù)的訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。最后將訓(xùn)練數(shù)據(jù)集輸入LMT模型中進(jìn)行模型耦合,得到各滑坡影響因子對應(yīng)的權(quán)重(見表4),并利用10折交叉驗(yàn)證完成調(diào)參,完成IOE-LMT模型的構(gòu)建。
3.3 滑坡易發(fā)性分區(qū)
基于訓(xùn)練數(shù)據(jù)集,利用IOE-LMT模型計(jì)算研究區(qū)范圍內(nèi)每一個像元的后驗(yàn)概率,輸出范圍為0~1。該后驗(yàn)概率即為滑坡易發(fā)性指數(shù)(Landslide Susceptibility Index,LSI),LSI越接近于1說明滑坡發(fā)生的可能性越高,LSI越接近于0,表明滑坡發(fā)生的可能性越低。為了更直觀地顯示易發(fā)性分區(qū)的范圍,本文利用自然間斷點(diǎn)法將LSI分割為4個區(qū)間,分別代表極低易發(fā)區(qū)(0.001~0.241)、低易發(fā)區(qū)(0.242~0.393)、中易發(fā)區(qū)(0.394~0.690)、高易發(fā)區(qū)(0.691~0.955)。最后基于ArcGIS軟件對易發(fā)區(qū)進(jìn)行了可視化,如圖3所示。研究區(qū)內(nèi)滑坡易發(fā)于黃土溝道范圍內(nèi),并且研究區(qū)北部的滑坡易發(fā)性明顯高于南部。
3.4 分區(qū)結(jié)果評估
3.4.1 分區(qū)結(jié)果精度評價
分別基于訓(xùn)練樣本和測試樣本,計(jì)算分區(qū)結(jié)果的敏感度、特異度和準(zhǔn)確度(見表5)。從表5可以看出:滑坡易發(fā)性分區(qū)的準(zhǔn)確度大于0.700,表明滑坡易發(fā)性分區(qū)結(jié)果的精度較高[22];且訓(xùn)練樣本和測試樣本的敏感度都大于特異度,說明IOE-LMT模型對滑坡的分類能力強(qiáng)于對非滑坡的分類能力。
3.4.2 滑坡易發(fā)性分區(qū)模型評估
滑坡易發(fā)性分區(qū)模型的泛化性能是評估模型是否適合在其他區(qū)域應(yīng)用的重要指標(biāo)。本文基于測試樣本繪制ROC曲線,對IOE-LMT模型的泛化性能進(jìn)行了評估。從測試樣本的計(jì)算結(jié)果可以看出:IOE-LMT模型的AUROC值為0.942,標(biāo)準(zhǔn)差為0.011,且模型輸出結(jié)果的MAE值僅為0.22,表明模型輸出的結(jié)果與真實(shí)值偏差小,泛化能力較強(qiáng),值得在其他范圍進(jìn)行推廣應(yīng)用(見圖4)。
4 討 論
本文利用熵指數(shù)量化滑坡影響因子,構(gòu)建了基于熵指數(shù)的滑坡易發(fā)性分區(qū)建模數(shù)據(jù)集,耦合熵指數(shù)與LMT模型,建立了IOE-LMT模型,完成了陜西省延安市吳起縣滑坡易發(fā)性分區(qū),并對分區(qū)的結(jié)果以及模型進(jìn)行了評價。雖然本研究得到的結(jié)果令人滿意,但仍有一些問題值得討論。
在模型建立之前,對滑坡影響因子進(jìn)行篩選十分必要。本文僅檢測了影響因子之間的多重共線性問題,而沒有估算因子對模型的貢獻(xiàn)度。但需要注意的是,在LMT模型中,葉子節(jié)點(diǎn)的判斷策略是通過計(jì)算各影響因子的信息增益率實(shí)現(xiàn)。而信息增益率本身就反映出了影響因子對模型的貢獻(xiàn)程度,如果貢獻(xiàn)程度為0,則會被排除[23]。因此,本研究沒有單獨(dú)計(jì)算影響因子的貢獻(xiàn)度。
熵指數(shù)可以反映出滑坡與影響因子之間的內(nèi)在聯(lián)系。從IOE的計(jì)算結(jié)果來看:隨著高程的升高,IOE逐漸減小,并且當(dāng)高程位于1 222.000~1 405.843 m范圍內(nèi)時,IOE最高。造成這種現(xiàn)象的原因可能是由于研究區(qū)大量修建公路,造成坡腳開挖,從而導(dǎo)致滑坡發(fā)生,而公路所在的高程較低,因而研究區(qū)內(nèi)的滑坡主要分布于低海拔范圍內(nèi)。距道路的距離因子的熵指數(shù)計(jì)算結(jié)果也印證了這一現(xiàn)象,距道路的距離越近,IOE越高。并且結(jié)合野外觀察發(fā)現(xiàn),IOE反映出的滑坡與影響因子之間的內(nèi)在聯(lián)系較為貼近事實(shí),因此,本文利用IOE量化影響因子,可以為提升滑坡易發(fā)性分區(qū)結(jié)果的精度做好基礎(chǔ)。
決策樹模型是一種經(jīng)典的機(jī)器學(xué)習(xí)模型,其優(yōu)點(diǎn)在于可以直觀地反映出分類決策的過程,容易解釋,但其處理缺失值的功能非常有限,容易出現(xiàn)過擬合[24]。而LMT模型則是以決策樹模型為基礎(chǔ),集成邏輯增益算法而構(gòu)建的,可以很好地規(guī)避決策樹模型的缺點(diǎn)。但LMT模型容易受到輸入數(shù)據(jù)質(zhì)量的影響,而熵指數(shù)可以反映出滑坡影響因子與滑坡之間的內(nèi)在聯(lián)系,并且利用熵指數(shù)量化滑坡影響因子可以統(tǒng)一數(shù)據(jù)量綱,起到數(shù)據(jù)增強(qiáng)的作用。因此,利用熵指數(shù)作為LMT模型的輸入數(shù)據(jù)構(gòu)成的IOE-LMT模型,相比于2種基礎(chǔ)模型的分類性能更加優(yōu)秀。此外,本研究中僅使用了一種模型進(jìn)行滑坡易發(fā)性分區(qū),缺乏參照。鑒于此,今后的研究將會在相同的研究區(qū)內(nèi),同時應(yīng)用多種分類模型來完成滑坡易發(fā)性分區(qū),并對結(jié)果和模型進(jìn)行詳盡的評價。
5 結(jié) 論
本文以陜西省延安市吳起縣為研究區(qū),基于717個實(shí)測滑坡數(shù)據(jù),首先選取坡度、坡向、高程、平面曲率、剖面曲率、年平均降雨量、距道路的距離、距河流的距離、巖土體類型以及NDVI作為滑坡影響因子。隨后利用熵指數(shù)量化影響因子,基于因子篩選的結(jié)果,構(gòu)建了建模數(shù)據(jù)集。耦合LMT模型和熵指數(shù),建立了IOE-LMT模型,并完成了研究區(qū)滑坡易發(fā)性分區(qū)制圖。最后,應(yīng)用多種統(tǒng)計(jì)學(xué)指標(biāo)評價結(jié)果的精度,以及采用ROC曲線來評估模型的泛化性能。所得結(jié)論如下:
(1) 滑坡影響因子的VIF和TOL值均在臨界值以外,不存在多重共線性問題,可用于滑坡易發(fā)性分區(qū)建模。
(2) 滑坡易發(fā)性分區(qū)的準(zhǔn)確度大于0.700,說明分區(qū)結(jié)果的精度較高,可以為當(dāng)?shù)氐幕路乐喂ぷ魈峁﹨⒖?,并且IOE-LMT模型對滑坡的分類能力強(qiáng)于對非滑坡的分類能力。
(3) IOE-LMT模型的AUROC值為0.942,且絕對誤差和平均絕對誤差均在合理的范圍內(nèi),表明IOE-LMT模型的泛化性能強(qiáng),值得推廣。
(4) 研究區(qū)內(nèi)滑坡易發(fā)于黃土溝道范圍內(nèi),并且研究區(qū)北部的滑坡易發(fā)性明顯高于南部。
參考文獻(xiàn):
[1] POURGHASEMI H,GAYEN A,PARK S,et al.Assessment of landslide-prone areas and their zonation using Logistic Regression,LogitBoost,and NaveBayes Machine-Learning Algorithms[J].Sustainability,2018,10(10):3694-3714.
[2] MYRONIDIS D,PAPAGEORGIOU C,THEOPHANOUS S.Landslide susceptibility mapping based on landslide history and analytic hierarchy process(AHP)[J].Natural Hazards,2016,81(1):1-19.
[3] 沈玲玲,許沖,王靜璞.基于多模型的滑坡易發(fā)性評價:以甘肅岷縣地震滑坡為例[J].工程地質(zhì)學(xué)報,2016,24(1):19-28.
[4] 張像源,周萌.基于專家評分模型和GIS的滑坡預(yù)警分析開發(fā)研究[J].中國地質(zhì)災(zāi)害與防治學(xué)報,2006,22(2):111-114.
[5] 楊光,徐佩華,曹琛,等.基于確定性系數(shù)組合模型的區(qū)域滑坡敏感性評價[J].工程地質(zhì)學(xué)報,2019,27(5):1153-1163.
[6] ZHANG T,HAN L,ZHANG H,et al.GIS-based landslide susceptibility mapping using hybrid integration approaches of fractal dimension with index of entropy and support vector machine[J].Journal of Mountain Science,2019,16(6):1275-1293.
[7] 許沖,徐錫偉,于貴華.基于證據(jù)權(quán)方法的玉樹地震滑坡危險性評價[J].地震地質(zhì),2013,35(1):151-164.
[8] SOMA A S,KUBOTA T,MIZUNO H.Optimization of causative factors using logistic regression and artificial neural network models for landslide susceptibility assessment in Ujung Loe Watershed,South Sulawesi Indonesia[J].Journal of Mountain Science,2019,16(2):144-162.
[9] HONG H,LIU J,BUI D T,et al.Landslide susceptibility mapping using J48 Decision Tree with AdaBoost,Bagging and Rotation Forest ensembles in the Guangchang area(China)[J].Catena,2018,163(7):399-413.
[10] 韓玲,張庭瑜,張恒.基于IOE和SVM模型的府谷鎮(zhèn)滑坡易發(fā)性分區(qū)[J].水土保持研究,2019,26(3):373-378.
[11] MOAYEDI H,MEHRABI M,MOSALLANEZHAD M,et al.Modification of landslide susceptibility mapping using optimized PSO-ANN technique[J].Engineering with Computers,2019,35(3):967-984.
[12] HANG T,HAN L,CHEN W,et al.Hybrid integration approach of entropy with logistic regression and support vector machine for landslide susceptibility modeling[J].Entropy,2018,20(11):884-900.
[13] CHEN W,POURGHASEMI H R,PANAHI M,et al.Spatial prediction of landslide susceptibility using an adaptive neuro-fuzzy inference system combined with frequency ratio,generalized additive model,and support vector machine techniques[J].Geomorphology,2017,297(15):69-85.
[14] 武雪玲,沈少青,牛瑞卿.GIS支持下應(yīng)用PSO-SVM模型預(yù)測滑坡易發(fā)性[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2016,41(5):665-671.
[15] 陜西省地質(zhì)礦產(chǎn)局.陜西省區(qū)域地質(zhì)志[M].武漢:地質(zhì)出版社,1989.
[16] TANGESTANI M H.Landslide susceptibility mapping using the fuzzy gamma approach in a GIS,Kakan catchment area,southwest Iran[J].Journal of the Geological Society of Australia,2015,51(3):439-450.
[17] OMID G,THOMAS B,JAGANNATH A,et al.A new GIS-based technique using an adaptive neuro-fuzzy inference system for land subsidence susceptibility mapping[J].Journal of Spatial Science,2018,35(8):1-17.
[18] LIU J,DUAN Z.Quantitative assessment of landslide susceptibility comparing statistical index,index of entropy,and weights of evidence in the Shangnan Area,China[J].Entropy,2018,20(11):868-887.
[19] PADHAN B,LEE S.Delineation of landslide hazard areas on Penang Island,Malaysia,by using frequency ratio,logistic regression,and artificial neural network models[J].Environmental Earth Sciences,2010,60(5):1037-1054.
[20] BUI D T,TUAN T A,KLEMPE H,et al.Spatial prediction models for shallow landslide hazards:a comparative assessment of the efficacy of support vector machines,artificial neural networks,kernel logistic regression,and logistic model tree[J].Landslides,2016,13(2):361-378.
[21] CHEN W,YAN X,ZHAO Z,et al.Spatial prediction of landslide susceptibility using data mining-based kernel logistic regression,naive Bayes and RBFNetwork models for the Long County area(China)[J].Bulletin of Engineering Geology and the Environment,2019,78(1):247-266.
[22] 李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012.
[23] ABEDINI M,TULABI S.Assessing LNRF,F(xiàn)R,and AHP models in landslide susceptibility mapping index:a comparative study of Nojian watershed in Lorestan province,Iran[J].Environmental Earth Sciences,2018,77(11):405.
[24] WU Y,KE Y,CHEN Z,et al.Application of Alternating Decision Tree with AdaBoost and Bagging ensembles for landslide susceptibility mapping[J].Catena,2020,187(1):104-396.
(編輯:劉 媛)
Landslide susceptibility zoning based on logistic regression tree coupled entropy index model:case of landslide in Wuqi County,Yan'an City,Shaanxi Province
YANG Chuangqi1,TAO Pan2,3,YANG Zheng3
(1.Department of Civil Engineering,Sichuan Vocational and Technical College of Architecture,Deyang 618000,China; 2.Civil Engineering and Hydraulic Engineering School,Shandong University,Jinan 250100,China; 3.School of Water Conservancy Engineering,Yellow River Conservancy Technical Institute,Kaifeng 475004,China)
Abstract:
For landslide prevention and control,it is of great practical significance to study the appropriate method of landslide susceptibility zoning in the county area.In view of this,based on 717 landslide samples collected from Wuqi County,Yan’an City,Shaanxi Province,the slope,aspect,elevation,plane curvature,profile curvature,average annual rainfall,distance from road,distance from river,rock and soil mass type and NDVI were used as an impact factors,and their corresponding entropy indices were calculated to construct a modeling dataset based on entropy indices.Subsequently,based on the modeling dataset,coupled index of entropy (IOE) and logistic regression tree model (LMT),an IOE-LMT hybrid classification model was established to draw a zonal map of landslide susceptibility in Wuqi County.A variety of statistical metrics,area under the ROC curve (AUROC) and mean absolute error (MAE) were used to evaluate the partition accuracy and the generalization performance of the model.The results showed that the generalization performance of the IOE-LMT model was strong (AUROC=0.942),and the accuracy of the landslide susceptibility zoning was high.Landslide in the study area was prone to happen in the loess gullies,and the landslide susceptibility in the north of the study area was significantly higher than that in the south.The evaluation results are reasonable and reliable,and can provide reference for local landslide prevention and land space planning.
Key words:
landslide susceptibility zoning;machine learning;mixed classification model;spatial analysis;Yan 'an City;Shaanxi Province