劉 月,王寧濤,周 超,謝家龍,李遠(yuǎn)耀
(1.中國(guó)地質(zhì)大學(xué)(武漢)地質(zhì)調(diào)查研究院,湖北 武漢 430074;2.中國(guó)地質(zhì)調(diào)查局武漢地質(zhì)調(diào)查中心(中南地質(zhì)科技創(chuàng)新中心),湖北 武漢 430205; 3.中國(guó)地質(zhì)大學(xué)(武漢)地理與信息工程學(xué)院,湖北 武漢 430074)
滑坡是我國(guó)自然災(zāi)害的主要災(zāi)種之一,對(duì)山地丘陵區(qū)的生態(tài)環(huán)境和生命財(cái)產(chǎn)安全構(gòu)成重大威脅[1]。滑坡易發(fā)性評(píng)價(jià)是區(qū)域滑坡災(zāi)害風(fēng)險(xiǎn)評(píng)估和防控的基礎(chǔ),準(zhǔn)確的滑坡易發(fā)性評(píng)價(jià)結(jié)果可為防災(zāi)減災(zāi)提供有效的技術(shù)支撐。
滑坡發(fā)育關(guān)鍵影響因素的選取是滑坡易發(fā)性建模的重要基礎(chǔ),然而至今仍未達(dá)成統(tǒng)一的共識(shí),現(xiàn)階段通常是在實(shí)際場(chǎng)地條件和資料收集的基礎(chǔ)上,結(jié)合滑坡內(nèi)部巖土體屬性和外界誘發(fā)因素來(lái)選取評(píng)價(jià)指標(biāo)。在滑坡易發(fā)性建模中,不同的評(píng)價(jià)指標(biāo)具有不同的預(yù)測(cè)能力,即其在滑坡易發(fā)性建模中的重要性不同。不重要的評(píng)價(jià)指標(biāo)會(huì)帶來(lái)噪音,這些指標(biāo)對(duì)滑坡易發(fā)性建模精度提升的貢獻(xiàn)可能會(huì)弱于其噪音帶來(lái)的誤差,導(dǎo)致模型的精度降低[2]。因此,在滑坡易發(fā)性建模之前應(yīng)先分析評(píng)價(jià)指標(biāo)的重要性,剔除不重要的評(píng)價(jià)指標(biāo)。評(píng)價(jià)指標(biāo)的重要性可通過(guò)人為主觀經(jīng)驗(yàn)判斷或概率統(tǒng)計(jì)得到,如郭子正等[3]利用邏輯回歸模型公式中的回歸系數(shù)對(duì)滑坡易發(fā)性各評(píng)價(jià)指標(biāo)的重要程度進(jìn)行了排序。受試者工作特征曲線(Receiver Operating Characteristic curve,ROC曲線)是一種有效的模型精度評(píng)價(jià)方法,可定量地分析各評(píng)價(jià)指標(biāo)對(duì)滑坡易發(fā)性建模性能的影響程度。
滑坡易發(fā)性評(píng)價(jià)模型由最初的定性評(píng)價(jià)模型[4]發(fā)展到定量物理力學(xué)評(píng)價(jià)模型[5],再到目前的概率統(tǒng)計(jì)模型,如信息量模型[6-9]、邏輯回歸模型[10]、確定性系數(shù)模型[11]等。隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的飛速發(fā)展,機(jī)器學(xué)習(xí)模型如人工神經(jīng)網(wǎng)絡(luò)模型[12-14]、支持向量機(jī)模型[12,15-17]、決策樹(shù)模型[18-19]等也得到了廣泛的應(yīng)用。雖然機(jī)器學(xué)習(xí)模型在精度上有一定的優(yōu)勢(shì),但是基于機(jī)器學(xué)習(xí)的滑坡易發(fā)性評(píng)價(jià)模型評(píng)價(jià)過(guò)程復(fù)雜,且在每次更新評(píng)價(jià)指標(biāo)時(shí)都需要對(duì)整個(gè)研究區(qū)重新進(jìn)行評(píng)價(jià)。而概率統(tǒng)計(jì)模型原理易懂、操作簡(jiǎn)單、精度較高,且在更新評(píng)價(jià)指標(biāo)時(shí)只需將指標(biāo)的統(tǒng)計(jì)系數(shù)疊加到原始評(píng)價(jià)結(jié)果中,不需再對(duì)整個(gè)研究區(qū)進(jìn)行重新評(píng)價(jià),具有較好的推廣和應(yīng)用價(jià)值。
本文以我國(guó)滑坡災(zāi)害高發(fā)的三峽庫(kù)區(qū)奉節(jié)縣為研究區(qū),首先采用頻率比方法對(duì)坡度、坡向等10個(gè)指標(biāo)與滑坡發(fā)育的關(guān)系進(jìn)行統(tǒng)計(jì)分析,通過(guò)統(tǒng)計(jì)結(jié)果對(duì)連續(xù)型指標(biāo)進(jìn)行分級(jí)并分析其對(duì)研究區(qū)滑坡發(fā)育的影響作用;然后,運(yùn)用ROC曲線定量分析各評(píng)價(jià)指標(biāo)對(duì)滑坡易發(fā)性建模精度的影響程度,剔除相對(duì)不重要的指標(biāo),構(gòu)建對(duì)研究區(qū)滑坡易發(fā)性建模影響的關(guān)鍵評(píng)價(jià)指標(biāo)體系;最后分別應(yīng)用確定性系數(shù)法和邏輯回歸模型對(duì)研究區(qū)滑坡易發(fā)性進(jìn)行建模與分區(qū)。通過(guò)本研究以期結(jié)合ROC曲線法和確定性系數(shù)法的優(yōu)點(diǎn),構(gòu)建出一套簡(jiǎn)單、準(zhǔn)確的區(qū)域滑坡易發(fā)性評(píng)價(jià)技術(shù)方法,進(jìn)一步完善滑坡災(zāi)害易發(fā)性評(píng)價(jià)理論和技術(shù)方法。
研究區(qū)奉節(jié)縣隸屬于重慶市,為長(zhǎng)江三峽庫(kù)區(qū)腹心之地,總面積約為4 000 km2,其地理位置見(jiàn)圖1??h域地貌總體為東南、東北高而中部稍平緩,南北大致對(duì)稱分布,以長(zhǎng)江為對(duì)稱軸,離長(zhǎng)江越遠(yuǎn)海拔越高,零星分布少量平緩河谷平壩。該區(qū)域?qū)僦衼啛釒瘽駯|南季風(fēng)氣候,在海拔600 m以下的長(zhǎng)江河谷兩岸及其階地,氣候溫和,雨量充沛,日照充足,晝夜溫差大。境內(nèi)河流屬長(zhǎng)江水系,其中長(zhǎng)江干流長(zhǎng)41.5 km,另有梅溪河、大溪河、石筍河、草堂河、朱衣河等主要河流。
圖1 研究區(qū)地理位置圖Fig.1 Geographical location map of the study area
由于區(qū)域地質(zhì)環(huán)境條件復(fù)雜,加上降雨充沛和受三峽庫(kù)水位動(dòng)態(tài)變化的影響,奉節(jié)縣地質(zhì)災(zāi)害頻發(fā)。據(jù)三峽庫(kù)區(qū)奉節(jié)縣地質(zhì)災(zāi)害排查資料,截止2017年奉節(jié)縣共發(fā)生地質(zhì)災(zāi)害1 600余處,其中滑坡1 424處,占總地質(zhì)災(zāi)害的89%,已嚴(yán)重影響了當(dāng)?shù)亟?jīng)濟(jì)和社會(huì)的可持續(xù)發(fā)展。本研究以奉節(jié)縣為研究區(qū),選取研究區(qū)內(nèi)2006年至2017年的937處滑坡災(zāi)害點(diǎn)為基礎(chǔ)數(shù)據(jù),開(kāi)展了研究區(qū)滑坡易發(fā)性評(píng)價(jià)研究。
確定性系數(shù)(Certainty Factor,CF)本質(zhì)上是一個(gè)概率函數(shù),主要用來(lái)計(jì)算影響地質(zhì)災(zāi)害發(fā)生的各個(gè)評(píng)價(jià)因子的敏感性。該方法根據(jù)已知的地質(zhì)災(zāi)害隱患點(diǎn),對(duì)影響地質(zhì)災(zāi)害發(fā)生的各個(gè)評(píng)價(jià)因子的不同區(qū)間進(jìn)行敏感性計(jì)算,可以實(shí)現(xiàn)對(duì)連續(xù)型因子和離散型因子的敏感性分析。其原理公式如下:
(1)
式中:PPa為影響因子分級(jí)圖層中某一特征a的條件概率,在滑坡易發(fā)性評(píng)價(jià)中表示特征a中單元存在的地質(zhì)災(zāi)害隱患點(diǎn)的柵格數(shù)與特征a的柵格數(shù)的比值;PPs為滑坡事件在整個(gè)研究區(qū)中地質(zhì)災(zāi)害發(fā)生的先驗(yàn)概率,可以表示為整個(gè)研究區(qū)滑坡地質(zhì)災(zāi)害隱患點(diǎn)柵格數(shù)與研究區(qū)總柵格數(shù)的比值;CF為確定性系數(shù),其值越大,表示滑坡災(zāi)害發(fā)生的確定性越高。
邏輯回歸(Logistic Regression,LR)模型是一種因變量滿足二項(xiàng)分布的多元統(tǒng)計(jì)分析模型,通過(guò)在一個(gè)因變量和多個(gè)自變量中建立回歸關(guān)系,預(yù)測(cè)某個(gè)區(qū)域某一事件發(fā)生的概率。在滑坡易發(fā)性評(píng)價(jià)中,LR模型可用于預(yù)測(cè)某一區(qū)域滑坡發(fā)生的概率。因變量即為是否發(fā)生滑坡(發(fā)生為1,未發(fā)生為0),自變量即為參與滑坡易發(fā)性評(píng)價(jià)的各項(xiàng)評(píng)價(jià)指標(biāo)。其原理公式如下:
Y=α0+α1X1+α2X2+…+αnXn
(2)
(3)
式中:Y為累計(jì)分布函數(shù);α0為常數(shù)項(xiàng),α1,α2,…,αn為各評(píng)價(jià)指標(biāo)的邏輯回歸系數(shù);X1,X2,…,Xn為參與滑坡易發(fā)性評(píng)價(jià)的各項(xiàng)評(píng)價(jià)指標(biāo);P為滑坡發(fā)生的概率,其值越大,表示滑坡災(zāi)害發(fā)生的概率越高。
受試者工作特征(ROC,Receiver Operating Characteristic)曲線又稱為感受性曲線,因其簡(jiǎn)單、直觀的特點(diǎn),可準(zhǔn)確地反映所用分析方法特異性與敏感性的關(guān)系,具有很好的試驗(yàn)準(zhǔn)確性,因而已被廣泛應(yīng)用于地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)中[20]。在滑坡易發(fā)性評(píng)價(jià)中,1-特異度為橫坐標(biāo),代表非滑坡預(yù)測(cè)為滑坡,敏感度為縱坐標(biāo),代表滑坡預(yù)測(cè)為滑坡,即可對(duì)比單個(gè)評(píng)價(jià)因子對(duì)滑坡發(fā)育的影響和重要性,也可比較不同模型下滑坡易發(fā)性評(píng)價(jià)結(jié)果的精度。ROC曲線法是通過(guò)ROC曲線下面積(Area Under Curve,AUC)來(lái)反映和比較模型的評(píng)價(jià)預(yù)測(cè)精度,當(dāng)AUC值小于0.7表示模型的評(píng)價(jià)精度較差,當(dāng)AUC值為0.7~0.8表示模型的評(píng)價(jià)精度中等,當(dāng)AUC值為0.8~0.9表示模型的評(píng)價(jià)精度較好,當(dāng)AUC值在0.9以上表示模型的評(píng)價(jià)精度非常好[21]。
本文以滑坡災(zāi)害高易發(fā)區(qū)三峽庫(kù)區(qū)奉節(jié)縣為研究區(qū),首先在實(shí)際場(chǎng)地條件和資料收集的基礎(chǔ)上,初步選取坡度、坡向、高程、剖面曲率、斷裂帶距離、巖土體類型、水系距離、降雨量、道路距離和植被覆蓋度10項(xiàng)基本指標(biāo),建立滑坡易發(fā)性初始評(píng)價(jià)指標(biāo)體系,并采用頻率比法對(duì)連續(xù)型指標(biāo)進(jìn)行科學(xué)分級(jí);然后,運(yùn)用ROC曲線法剔除不重要的評(píng)價(jià)指標(biāo),建立研究區(qū)滑坡易發(fā)性評(píng)價(jià)的關(guān)鍵評(píng)價(jià)指標(biāo)體系;最后,分別運(yùn)用確定性系數(shù)法和邏輯回歸模型對(duì)研究區(qū)滑坡易發(fā)性進(jìn)行評(píng)價(jià)與分區(qū),并對(duì)比分析兩種模型的滑坡易發(fā)性評(píng)價(jià)結(jié)果的精度。具體評(píng)價(jià)流程見(jiàn)圖2。
圖2 滑坡易發(fā)性評(píng)價(jià)流程圖Fig.2 Flow chart of evaluation of landslide susceptibility
評(píng)價(jià)基礎(chǔ)單元的合理劃分對(duì)滑坡易發(fā)性評(píng)價(jià)結(jié)果有著直接的影響。目前,常用的評(píng)價(jià)單元有柵格單元、地域單元、均一條件單元、斜坡單元和地形單元等。其中,地域單元、均一條件單元、斜坡單元和地形單元均較適合小范圍大比例尺的區(qū)域,而研究區(qū)面積達(dá)到4 000 km2,選用大小相同的柵格單元更適合,既能提高評(píng)價(jià)效率也能滿足評(píng)價(jià)精度的要求。確定柵格單元大小的計(jì)算公式如下[22]:
Gs=7.49+0.000 6S-2.0×10-9S2+2.9×10-15S3
(4)
式中:Gs為適宜的網(wǎng)格大小(m);S為比例尺分母。
根據(jù)計(jì)算結(jié)果可知,研究區(qū)最佳柵格單元大小為50.4 m,本文最終選取50 m×50 m柵格作為基礎(chǔ)評(píng)價(jià)單元。研究區(qū)域共劃分為1 626 035個(gè)柵格,滑坡所占柵格數(shù)為28 890個(gè)。
首先,結(jié)合研究區(qū)野外調(diào)查和以往的研究成果[2],初步選取坡度、坡向、高程、剖面曲率、斷裂帶距離、巖土體類型、水系距離、降雨量、道路距離和植被覆蓋度10項(xiàng)指標(biāo);然后,采用滑坡相對(duì)頻率比法對(duì)各評(píng)價(jià)指標(biāo)進(jìn)行等級(jí)劃分,提高評(píng)價(jià)指標(biāo)分級(jí)準(zhǔn)確性[10]?;孪鄬?duì)頻率比(FR)表示評(píng)價(jià)指標(biāo)各區(qū)間對(duì)滑坡易發(fā)性影響的重要程度,定義如下:
(5)
FR>0表示該分類區(qū)間利于滑坡發(fā)生;FR<0表示該分類區(qū)間不利于滑坡的發(fā)生。對(duì)FR值相近的區(qū)間進(jìn)行合并,將各評(píng)價(jià)指標(biāo)進(jìn)行等級(jí)劃分,見(jiàn)圖3。
圖3 滑坡易發(fā)性各評(píng)價(jià)指標(biāo)的滑坡相對(duì)頻率比圖Fig.3 Relative frequency ratio chart of each factor for landslide susceptibility evaluation
坡度、坡向、高程和剖面曲率均從DEM中直接提取,為連續(xù)型評(píng)價(jià)指標(biāo),對(duì)各評(píng)價(jià)指標(biāo)進(jìn)行等步長(zhǎng)離散化。各評(píng)價(jià)指標(biāo)的具體分級(jí)如下:
(1) 坡度:不同坡度,斜坡的應(yīng)力分布、水文條件、人類工程活動(dòng)等存在差異,從而影響滑坡的發(fā)育[23]。研究區(qū)內(nèi)坡度以中緩坡為主,主要分布在0°~30°。
采用頻率比法對(duì)研究區(qū)坡度進(jìn)行分級(jí),先以10°為間隔,劃分為8個(gè)等級(jí),由圖3(a)可見(jiàn),在坡度為10°~20°時(shí),滑坡FR值最大,利于滑坡的發(fā)生。因此,最終將研究區(qū)坡度分為4級(jí):0°~10°、10°~20°、20°~30°、>30°。
(2) 坡向:不同坡向,光照條件不同,導(dǎo)致植被覆蓋度和地表徑流等存在差異,從而影響斜坡的穩(wěn)定性。研究區(qū)內(nèi)坡向主要集中在0°~45°。采用頻率比法對(duì)研究區(qū)坡向進(jìn)行分級(jí),先以45°為間隔,劃分為8個(gè)等級(jí),由圖3(b)可見(jiàn),在坡向?yàn)?35°~270°時(shí),滑坡FR值較大,利于滑坡的發(fā)生。因此,最終將研究區(qū)坡向分為5級(jí):0°~45°、45°~135°、135°~270°、270°~315°、315°~360°。
(3) 高程:不同高程,植被類型、土壤類型、地表集水能力和人類工程活動(dòng)等存在差異,從而間接影響滑坡的發(fā)育。研究區(qū)內(nèi)高程主要集中在300~1 500 m。采用頻率比法對(duì)研究區(qū)高程進(jìn)行分級(jí),先以300 m為間隔,劃分為7個(gè)等級(jí),由圖3(c)可見(jiàn),在高程為0~900 m時(shí),滑坡FR值大于0,利于滑坡的發(fā)生。因此,最終將研究區(qū)高程分4級(jí):0~300 m、300~900 m、900~1 200 m、1 200~2 100 m。
(4) 剖面曲率:剖面曲率反映了坡面形態(tài),不同的坡面形態(tài)坡體物質(zhì)的搬運(yùn)沉積情況不同,從而影響滑坡的發(fā)育。采用頻率比法對(duì)研究區(qū)剖面曲率進(jìn)行分級(jí),先以1為間隔,劃分為11個(gè)等級(jí),由圖3(d)可見(jiàn),在剖面曲率為0~5時(shí),滑坡FR值大于0,利于滑坡的發(fā)生。因此,最終將研究區(qū)剖面曲率分為5級(jí):0~1、1~2、2~5、5~10、>10。
(5) 斷裂帶距離:研究區(qū)斷裂帶及其周邊一定范圍內(nèi)的巖土體遭受破壞,坡體的完整性降低,從而影響坡體的穩(wěn)定性。采用頻率比法對(duì)研究區(qū)斷裂帶距離進(jìn)行分級(jí),先以500 m為間隔分為7級(jí),由圖3(e)可見(jiàn),在距斷裂帶500~1 000 m的區(qū)域,滑坡FR值較大,利于滑坡的發(fā)生。因此,最終將研究區(qū)斷裂帶距離分為5級(jí):0~500 m、500~1 000 m、1 000~1 500 m、1 500~3 000m、>3 000 m。
(6) 巖土體類型:巖土體類型是孕育滑坡發(fā)生的重要內(nèi)在因素。采用頻率比法對(duì)研究區(qū)巖土體類型進(jìn)行分級(jí),分為7級(jí)。巖土體類型中,1表示以堅(jiān)硬厚層砂巖為主的巖組;2表示軟硬相間層狀砂巖、黏土巖互層巖組;3表示弱巖溶化軟硬相間層狀碎屑巖夾碳酸鹽巖巖組;4表示中等巖溶化軟硬相間層狀碳酸鹽巖碎屑巖互層巖組;5表示中強(qiáng)巖溶化軟硬相間層狀碳酸鹽巖夾碎屑巖巖組;6表示強(qiáng)巖溶化堅(jiān)硬層狀碳酸鹽巖巖組;7表示以軟弱層狀黏土巖為主的巖組。由圖3(f)可見(jiàn),研究區(qū)滑坡主要發(fā)育在軟硬相間層狀砂巖、黏土巖互層巖組之上。
(7) 水系距離:研究區(qū)庫(kù)水位的動(dòng)態(tài)變化以及水流對(duì)坡腳的沖刷、侵蝕作用破壞了斜坡的穩(wěn)定性,造成滑坡多沿水系分布。采用頻率比法對(duì)研究區(qū)水系距離進(jìn)行分級(jí),先以300 m為間隔,劃分為8級(jí),由圖3(g)可見(jiàn),在距水系距離為0~2 100 m時(shí),滑坡FR值較大,利于滑坡的發(fā)生。因此,最終將研究區(qū)水系距離分為4級(jí):0~300 m、300~900 m、900~2 100 m、>2 100 m。
(8) 降雨量:降雨是滑坡發(fā)生的重要誘發(fā)因素之一。通過(guò)全區(qū)的降雨量等值線,采用頻率比法對(duì)研究區(qū)降雨量進(jìn)行分級(jí),由圖3(h)可見(jiàn),在降雨量為1 000~1 100 mm時(shí),滑坡FR值大于0,利于滑坡的發(fā)生。因此,最終將降雨量劃分為4級(jí):950~1 000 mm、1 000~1 100 mm、1 100~1 200 mm、1 200~1 300 mm。
(9) 道路距離:在道路建設(shè)過(guò)程中不合理地開(kāi)挖坡腳等常會(huì)引起邊坡失穩(wěn),促進(jìn)滑坡的發(fā)育。采用頻率比法對(duì)研究區(qū)道路距離進(jìn)行分級(jí),先以300 m為間隔,劃分為8級(jí),由圖3(i)可見(jiàn),在距道路距離為0~2 100 m時(shí),滑坡FR值較大,利于滑坡的發(fā)生。因此,最終將研究區(qū)道路距離分為5級(jí):0~300 m、300~600 m、600~1 500 m、1 500~2 100 m、>2 100 m。
(10) 植被覆蓋度:由于植被根莖的固土作用,植被覆蓋度不同,斜坡的穩(wěn)定性存在差異。在ENVI中對(duì)下載的Landsat 8遙感影像數(shù)據(jù)進(jìn)行處理得到植被覆蓋度指數(shù),并在ArcGIS中進(jìn)行重分類,以0.01為間隔,劃分為9類,由圖3(j)可見(jiàn),在植被覆蓋度>0.08時(shí),滑坡FR值較大,利于滑坡發(fā)生。因此,最終將研究區(qū)植被覆蓋度分為3級(jí):<0.05、0.05~0.08、>0.08。
將ROC曲線法與確定性系數(shù)法相結(jié)合,在滑坡易發(fā)性評(píng)價(jià)過(guò)程中,先選取確定性系數(shù)法計(jì)算出不同評(píng)價(jià)指標(biāo)各分級(jí)狀態(tài)下的確定性系數(shù)(CF)值,并利用ROC曲線法定量確定各評(píng)價(jià)指標(biāo)的重要程度排序;然后在此基礎(chǔ)上按重要程度由小到大逐步剔除不重要的評(píng)價(jià)指標(biāo),并將剩余評(píng)價(jià)指標(biāo)按CF值疊加計(jì)算出一次滑坡易發(fā)性評(píng)價(jià)結(jié)果;最后利用ROC曲線法比較滑坡各易發(fā)性評(píng)價(jià)結(jié)果的精度。在滑坡易發(fā)性評(píng)價(jià)結(jié)果的精度達(dá)到峰值時(shí)的評(píng)價(jià)指標(biāo)體系即為關(guān)鍵評(píng)價(jià)指標(biāo)體系,關(guān)鍵評(píng)價(jià)指標(biāo)體系下的滑坡易發(fā)性評(píng)價(jià)結(jié)果為研究區(qū)最終的滑坡易發(fā)性分區(qū)。
ROC曲線法確定關(guān)鍵評(píng)價(jià)指標(biāo)體系的首要任務(wù)是確定所有評(píng)價(jià)指標(biāo)的重要程度排序。利用ROC曲線法對(duì)評(píng)價(jià)指標(biāo)進(jìn)行重要程度排序,首先是要計(jì)算各評(píng)價(jià)指標(biāo)不同分級(jí)狀態(tài)下的CF值,其計(jì)算結(jié)果見(jiàn)表1。
表1 滑坡易發(fā)性各評(píng)價(jià)指標(biāo)的確定性系數(shù)(CF)Table 1 Certainty Factor(CF) of each factor for landslide susceptibility evaluation
由表1可知,研究區(qū)滑坡主要發(fā)育在海拔低于300 m、植被覆蓋度較高以及距水系距離在300~900 m的區(qū)域,與歷史滑坡災(zāi)害點(diǎn)分布情況相符。
以全區(qū)所有滑坡點(diǎn)和等量非滑坡點(diǎn)(發(fā)生滑坡為1;未發(fā)生滑坡為0)作為狀態(tài)變量,對(duì)應(yīng)的各評(píng)價(jià)指標(biāo)不同分級(jí)狀態(tài)下的CF值作為檢驗(yàn)變量,利用ROC曲線法進(jìn)行分析,并根據(jù)AUC值的大小對(duì)各評(píng)價(jià)指標(biāo)重要程度進(jìn)行排序,見(jiàn)圖4。
圖4 研究區(qū)滑坡易發(fā)性各評(píng)價(jià)指標(biāo)ROC曲線分析圖Fig.4 Diagram of ROC curve analysis of each factor for landslide succeptibility evaluation of the study area
由圖4可見(jiàn),對(duì)研究區(qū)滑坡發(fā)育影響最大的評(píng)價(jià)指標(biāo)是高程,對(duì)研究區(qū)滑坡發(fā)育影響最小的評(píng)價(jià)指標(biāo)是斷裂帶距離。研究區(qū)滑坡易發(fā)性各評(píng)價(jià)指標(biāo)重要程度的排序?yàn)楦叱?巖土體類型>降雨量>水系距離>道路距離>坡度>剖面曲率>坡向>植被覆蓋度>斷裂帶距離。
首先對(duì)研究區(qū)滑坡易發(fā)性初始評(píng)價(jià)指標(biāo)體系中評(píng)價(jià)評(píng)價(jià)指標(biāo)按重要程度由小到大逐步剔除不重要的評(píng)價(jià)指標(biāo),并將剩余評(píng)價(jià)指標(biāo)按CF值疊加計(jì)算出一次滑坡易發(fā)性評(píng)價(jià)結(jié)果;然后選取70%的滑坡作為訓(xùn)練樣本,剩余的30%作為測(cè)試樣本,并在非滑坡面上隨機(jī)生成等量的非滑坡訓(xùn)練樣本和測(cè)試樣本;最后利用ROC曲線法分析各次滑坡易發(fā)性評(píng)價(jià)結(jié)果的成功率和預(yù)測(cè)率,見(jiàn)圖5。
圖5 研究區(qū)滑坡易發(fā)性不同評(píng)價(jià)指標(biāo)體系評(píng)價(jià) 結(jié)果的精度對(duì)比圖Fig.5 Comparison of accuracy of different index systems for landslide succeptibility evaluation of the study area
由圖5可見(jiàn),當(dāng)評(píng)價(jià)指標(biāo)個(gè)數(shù)為7個(gè)時(shí),研究區(qū)滑坡易發(fā)性評(píng)價(jià)結(jié)果的成功率和預(yù)測(cè)率分別為0.821和0.820,均達(dá)到最高。因此,研究區(qū)滑坡易發(fā)性的關(guān)鍵評(píng)價(jià)指標(biāo)體系由坡度、高程、剖面曲率、巖土體類型、水系距離、降雨量和道路距離7個(gè)評(píng)價(jià)指標(biāo)構(gòu)成。
本文利用確定的滑坡易發(fā)性關(guān)鍵評(píng)價(jià)指標(biāo)體系并基于邏輯回歸模型對(duì)研究區(qū)滑坡易發(fā)性進(jìn)行了評(píng)價(jià)。以70%的滑坡及等量的非滑坡作為訓(xùn)練樣本,是否發(fā)生滑坡(發(fā)生為1,未發(fā)生為0)作為因變量,各評(píng)價(jià)指標(biāo)不同狀態(tài)下的歸一化值作為自變量,在SPSS軟件中進(jìn)行二元邏輯回歸分析。本文使用滑坡發(fā)生率對(duì)各評(píng)價(jià)指標(biāo)進(jìn)行歸一化處理,其歸一化處理公式如下[24]:
(6)
(7)
式中:ALij為第i個(gè)一級(jí)評(píng)價(jià)指標(biāo)中第j個(gè)二級(jí)評(píng)價(jià)指標(biāo)內(nèi)的滑坡面積(m2);ATij為第i個(gè)一級(jí)評(píng)價(jià)指標(biāo)中第j個(gè)二級(jí)評(píng)價(jià)指標(biāo)的區(qū)域總面積(m2);dij為第i個(gè)一級(jí)評(píng)價(jià)指標(biāo)中第j個(gè)二級(jí)評(píng)價(jià)指標(biāo)的滑坡發(fā)生概率;n為一級(jí)評(píng)價(jià)指標(biāo)總數(shù)(個(gè));m為二級(jí)評(píng)價(jià)指標(biāo)總數(shù)(個(gè));Iij為第i個(gè)一級(jí)評(píng)價(jià)指標(biāo)中第j個(gè)二級(jí)評(píng)價(jià)指標(biāo)的滑坡發(fā)生概率的歸一化值。
擬合得到的邏輯回歸方程如下:
Y=-5.202+2.721X1+1.761X2+4.656X3+5.288X4+2.295X5+1.348X6+2.170X7
(8)
式中:X1~X7依次為坡度、高程、剖面曲率、巖土體類型、水系距離、降雨量和道路距離。
基于公式(2)和(3)在Arcgis中利用柵格計(jì)算器計(jì)算研究區(qū)所有柵格的滑坡發(fā)生概率,從而得到了全區(qū)滑坡易發(fā)性分區(qū)。
本文將利用確定性系數(shù)法和邏輯回歸模型所得到的研究區(qū)滑坡易發(fā)性評(píng)價(jià)結(jié)果,采用自然斷點(diǎn)法將其分為高易發(fā)區(qū)、較高易發(fā)區(qū)、較低易發(fā)區(qū)和低易發(fā)區(qū)4級(jí),從而得到三峽庫(kù)區(qū)奉節(jié)縣滑坡易發(fā)性分區(qū)圖,見(jiàn)圖6。
圖6 三峽庫(kù)區(qū)奉節(jié)縣滑坡易發(fā)性分區(qū)圖Fig.6 Landslide susceptibility zoning map of Fengjie County in Three Gorges Reservoir
由圖6可見(jiàn),研究區(qū)滑坡高易發(fā)區(qū)主要是沿水系、道路分布,與歷史滑坡災(zāi)害點(diǎn)的分布情況一致;確定性系數(shù)法下的研究區(qū)滑坡高易發(fā)區(qū)沿道路分布的特征較邏輯回歸模型更為明顯(見(jiàn)圖中標(biāo)注處)。
3.6.1 模型合理性檢驗(yàn)
本文通過(guò)統(tǒng)計(jì)測(cè)試樣本在研究區(qū)滑坡各易發(fā)性分區(qū)中的分布,來(lái)檢驗(yàn)?zāi)P偷挠行院涂茖W(xué)性,其統(tǒng)計(jì)結(jié)果見(jiàn)表2和圖7。其中,滑坡比率Ri[25]為某滑坡易發(fā)性分區(qū)內(nèi)滑坡柵格數(shù)占總滑坡柵格數(shù)的比例與該分區(qū)總柵格數(shù)占總研究區(qū)柵格數(shù)比例的比值,反映了滑坡在各個(gè)易發(fā)性分區(qū)中的強(qiáng)度。當(dāng)Ri滿足下式時(shí),表明滑坡易發(fā)性分區(qū)圖有效,且R1值越小、Rn值越大,說(shuō)明滑坡易發(fā)性評(píng)價(jià)結(jié)果越理想。
R1 (9) 其中,下標(biāo)1~n表示滑坡易發(fā)性等級(jí)由低到高。 由表2和圖7可知,利用確定性系數(shù)法和邏輯回歸模型確定的研究區(qū)滑坡易發(fā)性分區(qū)圖中滑坡比例依次增大,說(shuō)明兩種模型的分區(qū)均合理;確定性系數(shù)法確定的研究區(qū)滑坡低易發(fā)區(qū)的Ri值為0.02,其值小于邏輯回歸模型的0.08,確定性系數(shù)法確定的研究區(qū)滑坡高易發(fā)區(qū)的Ri值為3.18,其值大于邏輯回歸模型的3.12;確定性系數(shù)法中有92.24%的滑坡分布在高易發(fā)區(qū)和較高易發(fā)區(qū),其值高于邏輯回歸模型的80.65%,表明確定性系數(shù)法確定的研究區(qū)滑坡易發(fā)性分區(qū)結(jié)果更為理想。 表2 研究區(qū)滑坡柵格統(tǒng)計(jì)結(jié)果表Table 2 Statistical results of landslide grids of the study area 圖7 兩種模型的滑坡易發(fā)性等級(jí)對(duì)比Fig.7 Comparison of different levels of landslide susceptibility between two models 3.6.2 基于ROC曲線法的模型精度分析 本文在SPSS軟件中對(duì)兩種模型獲得的滑坡易發(fā)性評(píng)價(jià)結(jié)果進(jìn)行ROC曲線分析,兩種模型的精度對(duì)比結(jié)果見(jiàn)圖8。 圖8 兩種模型的成功率及預(yù)測(cè)率曲線對(duì)比Fig.8 Comparison of success rate curves and prediction rate curves between two models 由圖8可見(jiàn),確定性系數(shù)法的成功率和預(yù)測(cè)率為82.1%和82.0%,其值優(yōu)于邏輯回歸模型的80.5%和79.5%。 (1) 本文以三峽庫(kù)區(qū)奉節(jié)縣為研究區(qū),結(jié)合實(shí)際場(chǎng)地條件和資料收集情況,選取了坡度、坡向、高程、剖面曲率、斷裂帶距離、巖土體類型、水系距離、降雨量、道路距離和植被覆蓋度10項(xiàng)基本指標(biāo),建立了研究區(qū)滑坡易發(fā)性初始評(píng)價(jià)指標(biāo)體系,并利用頻率比法對(duì)各評(píng)價(jià)指標(biāo)進(jìn)行分級(jí),計(jì)算各評(píng)價(jià)指標(biāo)不同分級(jí)狀態(tài)下的頻率比值,在坡度為10°~20°、高程低于300 m、巖土體類型為軟硬相間層狀砂巖、黏土巖互層巖組時(shí),滑坡頻率比值較高,易于滑坡發(fā)育。 (2) 采用ROC曲線法剔除了斷裂帶距離、植被覆蓋度和坡向3個(gè)評(píng)價(jià)指標(biāo),從而構(gòu)建了對(duì)研究區(qū)滑坡發(fā)育影響的關(guān)鍵評(píng)價(jià)指標(biāo)體系,按評(píng)價(jià)指標(biāo)的重要程度排序?yàn)椋焊叱?巖土體類型>降雨量>水系距離>道路距離>坡度>剖面曲率,與三峽庫(kù)區(qū)滑坡多為降雨性滑坡且由于庫(kù)水位動(dòng)態(tài)變化、長(zhǎng)江兩岸滑坡較為發(fā)育這一實(shí)際情況相符。當(dāng)剔除坡向、植被覆蓋度和斷裂帶距離3個(gè)評(píng)價(jià)指標(biāo)時(shí),模型的預(yù)測(cè)精度最高,為0.82。 (3) 對(duì)確定的研究區(qū)滑坡易發(fā)性關(guān)鍵評(píng)價(jià)指標(biāo)體系,分別運(yùn)用確定性系數(shù)法和邏輯回歸模型對(duì)研究區(qū)滑坡易發(fā)性進(jìn)行評(píng)價(jià),結(jié)果表明:確定性系數(shù)法確定的研究區(qū)滑坡低易發(fā)區(qū)的滑坡比率較邏輯回歸模型更小,確定的研究區(qū)滑坡高易發(fā)區(qū)的滑坡比率較邏輯回歸更大;確定性系數(shù)法中有92.24%的滑坡分布在高易發(fā)區(qū)和較高易發(fā)區(qū),其值高于邏輯回歸模型的80.65%;確定性系數(shù)法的成功率和預(yù)測(cè)率為82.1%和82.0%,其值高于邏輯回歸模型的80.5%和79.5%。上述結(jié)果表明通過(guò)集合ROC曲線法和確定性系數(shù)法的優(yōu)點(diǎn)構(gòu)建的這一套簡(jiǎn)單、準(zhǔn)確的區(qū)域滑坡易發(fā)性評(píng)價(jià)技術(shù)方法,具有可靠性和精確性,可為進(jìn)一步完善滑坡災(zāi)害易發(fā)性評(píng)價(jià)理論和技術(shù)方法提供依據(jù)。4 結(jié) 論