盛明強(qiáng),劉梓軒,張曉晴,胡松雁,郭子正,黃發(fā)明*
(1.南昌大學(xué)建筑工程學(xué)院,南昌 330031;2.中國(guó)地質(zhì)大學(xué)工程學(xué)院,武漢 430074)
滑坡是造成重大人類生命財(cái)產(chǎn)損失和環(huán)境破壞的地質(zhì)災(zāi)害之一,滑坡易發(fā)性研究是區(qū)域滑坡地災(zāi)評(píng)估和防治的熱點(diǎn)技術(shù)。滑坡易發(fā)性可定義為區(qū)域滑坡發(fā)生的空間概率,如何有效開(kāi)展滑坡易發(fā)性建模值得深入探討[1-3]。
滑坡易發(fā)性預(yù)測(cè)包括建模前期處理、獲取數(shù)據(jù)源、劃分評(píng)價(jià)單元、選取基礎(chǔ)環(huán)境因子、創(chuàng)建計(jì)算模型、繪制成功率曲線等過(guò)程[4-5]。其中滑坡編錄與環(huán)境因子的聯(lián)接方法與不同的模型耦合在滑坡易發(fā)性預(yù)測(cè)過(guò)程中尤為重要。現(xiàn)有的預(yù)測(cè)滑坡易發(fā)性相關(guān)研究中大量借鑒了機(jī)器學(xué)習(xí)、數(shù)理統(tǒng)計(jì)和啟發(fā)式模型等數(shù)據(jù)驅(qū)動(dòng)模型[6],其中機(jī)器學(xué)習(xí)通常是指支持向量機(jī) (support vector machine,SVM)[7]、決策樹(shù)[8]、隨機(jī)森林[9]、邏輯回歸[10]、人工神經(jīng)網(wǎng)絡(luò)[11]、灰色關(guān)聯(lián)度[12]等。以往研究表明,上述模型大多具有較高的易發(fā)性預(yù)測(cè)精度,可得到較為可靠的易發(fā)性指數(shù)分布特征[6,13]。近年來(lái),比較分析多種不同的評(píng)價(jià)模型從而找到適用于特定地區(qū)的評(píng)價(jià)模型,已成為當(dāng)前研究熱點(diǎn)[14]。SVM模型的預(yù)測(cè)精度較高,在易發(fā)性預(yù)測(cè)中取得了成功的應(yīng)用。
對(duì)于上述SVM等機(jī)器學(xué)習(xí),需要選取更加恰當(dāng)?shù)哪P洼斎胱兞坎拍苡行ПWC高質(zhì)量的易發(fā)性預(yù)測(cè)制圖。這些輸入變量可以通過(guò)建立滑坡編錄與相關(guān)基礎(chǔ)環(huán)境因子之間的非線性響應(yīng)關(guān)系來(lái)實(shí)現(xiàn)。目前常用于構(gòu)建這種非線性關(guān)系的方法包括證據(jù)權(quán)[15],信息量[4]和頻率比值(frequency ratio,FR)[16]。其中頻率比聯(lián)結(jié)法結(jié)構(gòu)簡(jiǎn)潔,能有效解決各個(gè)基礎(chǔ)環(huán)境因子之間量綱不統(tǒng)一的問(wèn)題,并且能將各基礎(chǔ)環(huán)境因子內(nèi)的滑坡面積與研究區(qū)總面積之間的非線性相關(guān)性進(jìn)行深入討論以反映基礎(chǔ)環(huán)境因子對(duì)滑坡發(fā)生概率的影響程度[5]。因此,現(xiàn)借鑒頻率比聯(lián)接法概念簡(jiǎn)明、操作性強(qiáng)且計(jì)算結(jié)果通俗易懂的優(yōu)勢(shì),將環(huán)境因子的頻率比值作為SVM模型的輸入變量[17]。以此進(jìn)一步建立滑坡易發(fā)性預(yù)測(cè)的FR-SVM模型,期望從模型輸入變量和滑坡-輸入變量的非線性擬合兩方面出發(fā)實(shí)現(xiàn)準(zhǔn)確的易發(fā)性預(yù)測(cè)制圖。
以位于江西南部的上猶縣作為研究區(qū)域,基于遙感(remote sensing,RS)和ArcGIS平臺(tái)獲取地形地貌、水文環(huán)境、基礎(chǔ)地質(zhì)及地表覆蓋等因子,再開(kāi)發(fā)出FR-SVM模型以實(shí)現(xiàn)上猶縣滑坡易發(fā)性預(yù)測(cè)建模。同時(shí)將其預(yù)測(cè)結(jié)果和以原始因子作為輸入變量的單獨(dú)SVM模型進(jìn)行對(duì)比研究。最后用受試者工作特征曲線下的面積 (area under receiver operating characteristic curve,AUC)[18]對(duì)易發(fā)性結(jié)果進(jìn)行精度評(píng)估和檢驗(yàn),以期獲得準(zhǔn)確、有效的滑坡評(píng)價(jià)結(jié)果及與實(shí)際地區(qū)情況更加接近的滑坡易發(fā)性圖。
滑坡易發(fā)性模型評(píng)價(jià)分析過(guò)程主要包含4個(gè)步驟。
(1)對(duì)滑坡編錄展開(kāi)預(yù)處理并采集環(huán)境因子。
(2)基于頻率比聯(lián)結(jié)法來(lái)揭示出對(duì)滑坡發(fā)育具有較大影響的各類基礎(chǔ)環(huán)境因子,并實(shí)現(xiàn)影響程度的定量化表征。
(3)將采用頻率比聯(lián)接法的計(jì)算結(jié)果和原始數(shù)據(jù)作為SVM模型的輸入變量,進(jìn)行建模并進(jìn)一步繪制得到上猶縣滑坡易發(fā)性圖。
(4)基于AUC值開(kāi)展FR-SVM和單獨(dú)SVM模型的預(yù)測(cè)精度評(píng)估,以便為易發(fā)性建模的進(jìn)一步改進(jìn)提供參考。
滑坡易發(fā)性的評(píng)價(jià)常使用頻率比聯(lián)接法來(lái)實(shí)現(xiàn)滑坡編錄與其環(huán)境因子間的非線性聯(lián)接[16]。其基本思路是通過(guò)計(jì)算環(huán)境因子各子區(qū)間對(duì)滑坡發(fā)育的影響程度來(lái)間接實(shí)現(xiàn)模型輸入變量的確定。頻率比FR是滑坡發(fā)生地區(qū)在整個(gè)區(qū)域內(nèi)的平均值,表征環(huán)境因子各區(qū)間對(duì)滑坡發(fā)生的相對(duì)影響程度。FR>1 時(shí)表明該環(huán)境因子區(qū)間與滑坡相關(guān)性較強(qiáng),則滑坡發(fā)生概率較大;FR<1 時(shí)表明該環(huán)境因子區(qū)間與滑坡相關(guān)性較弱,滑坡發(fā)生概率較小。頻率比的計(jì)算公式為
(1)
式(1)中:Aj為環(huán)境因子在區(qū)間內(nèi)出現(xiàn)滑坡的柵格數(shù);A為研究區(qū)內(nèi)已知崩塌所分布柵格的總數(shù);Bj為環(huán)境因子的單元數(shù);B為研究區(qū)柵格總數(shù)。
考慮不同環(huán)境因子Fi,令其所屬的區(qū)間為Fij;通過(guò)不同環(huán)境因子的頻率比值相加,進(jìn)而獲得該空間位置滑坡災(zāi)害L的易發(fā)性指數(shù)LSI,表達(dá)式為
LSI=∑Fij
(2)
SVM模型是對(duì)線性分類器的另一種優(yōu)化設(shè)計(jì)標(biāo)準(zhǔn),也是對(duì)多層感知器在線性可分問(wèn)題上的改進(jìn)。SVM可利用非線性映射函數(shù)將模型輸入變量轉(zhuǎn)換成高維變量,以便可以用線性方式來(lái)準(zhǔn)確地回歸擬合高維變量。SVM適用于樣本較小、非線性及高維空間問(wèn)題,可突出其特有的優(yōu)勢(shì)且可結(jié)合其他機(jī)器學(xué)習(xí)進(jìn)而聯(lián)合分析問(wèn)題中。超平面是模型中使類之間邊距達(dá)最大值的面,其中,在超平面上的點(diǎn)稱為支持向量,而之外的點(diǎn)并不影響構(gòu)建模型。
基于一組線性可分的向量xi(i=1,2,…,n),其中包括11個(gè)環(huán)境因子及其對(duì)應(yīng)輸出類yi,并通過(guò)n維超平面的最大間隙來(lái)區(qū)分滑坡類別。其表達(dá)式為
s.t.yi(ωxi)+b≥1
(3)
式(3)中:||ω||為正常超平面的范數(shù);b為常數(shù)。
通過(guò)引入拉格朗日函數(shù)來(lái)解決凸二次優(yōu)化問(wèn)題,Lagrange函數(shù)表達(dá)式為
(4)
式(4)中:λi為拉格朗日乘數(shù)。
對(duì)于線性不可分離情況,增加松弛變量來(lái)控制類別的劃分誤差。正確分類的約束條件更改為
yi(ωxi)+b≥1
(5)
位于江西南部的上猶縣總面積約為1 543 km2(圖1)。上猶縣地形呈東南低西北高的特點(diǎn),區(qū)內(nèi)有盆地、丘陵和山地3種地貌。同時(shí)孕育規(guī)模不等的山間盆地,地勢(shì)低洼,大多沿水系呈帶狀分布。該區(qū)域?qū)儆趤啛釒Ъ撅L(fēng)氣候,其年均降雨達(dá)到1 497 mm。上猶地區(qū)毗鄰贛江,以章江為主要水系。上猶地區(qū)的巖石巖性以巖漿巖巖類、碳酸巖巖類、碎屑巖巖類為主,因地形地貌而異。該區(qū)域巖石風(fēng)化程度嚴(yán)重,斷層褶皺發(fā)育。以上復(fù)雜的地質(zhì)地貌條件,共同孕育了上猶地區(qū)滑坡災(zāi)害頻發(fā)的自然環(huán)境。
從上猶縣自然資源部門的2015年調(diào)查中總共獲取滑坡點(diǎn)338個(gè),這些滑坡和潛在滑坡分布的總面積高達(dá)8.38 km2,共被劃分9 312個(gè)滑坡柵格。上猶縣南部滑坡相對(duì)較少,中上部滑坡相對(duì)集中,且滑坡多出現(xiàn)于地勢(shì)較低處并呈現(xiàn)沿水系分布的特征?;麦w多為第四紀(jì)紅色黏土,以牽引式滑坡為主要運(yùn)動(dòng)方式,伴有平移式滑坡。滑坡發(fā)育特征顯示高強(qiáng)度的降雨過(guò)程與不合理人類活動(dòng)是導(dǎo)致滑坡發(fā)生的重要外部觸發(fā)因素。
圖1 上猶縣高程及滑坡編錄Fig.1 The evolution and landslide catalog in Shangyou area
滑坡相關(guān)數(shù)據(jù)來(lái)源主要包括:①上猶縣滑坡的地理位置和邊界等編錄信息的采集管理;②野外勘察驗(yàn)證的滑坡災(zāi)害和環(huán)境因子信息;③從中科院對(duì)地觀測(cè)中心免費(fèi)下載的分辨率為30 m的數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù),以便提取地形和水文等基礎(chǔ)環(huán)境因子;④1∶100 000比例尺的上猶縣巖土類型分布圖;⑤從中科院對(duì)地觀測(cè)中心免費(fèi)下載的30 m分辨率的Landsat TM 8遙感影像,用于獲取植被、建筑和濕度等地表覆被類型的環(huán)境因子。
滑坡易發(fā)性預(yù)測(cè)過(guò)程中劃分預(yù)測(cè)單元是一個(gè)重要環(huán)節(jié),常用的單元?jiǎng)澐址绞接袞鸥窈妥匀恍逼耓19]。其中自然斜坡單元可在一定程度上較好地表現(xiàn)地質(zhì)特征,但斜坡提取的自動(dòng)化程度和準(zhǔn)確性較低,導(dǎo)致其在實(shí)際應(yīng)用中受到較多限制。而柵格單元應(yīng)用范圍較廣,表達(dá)地貌較為通俗且模型計(jì)算高效[20]。以往研究表明柵格單元更加適宜在中、小比例尺等地形圖中的易發(fā)性建模[4,6]。此外柵格尺寸選擇也一定程度上影響研究的精準(zhǔn)度。根據(jù)上猶地區(qū)滑坡實(shí)際情況和基礎(chǔ)數(shù)據(jù)源選擇30 m空間分辨率柵格進(jìn)行建模分析,因此在GIS軟件中研究區(qū)內(nèi)共劃分為1 687 179個(gè)柵格。
基礎(chǔ)環(huán)境因子和誘發(fā)環(huán)境因子相互作用導(dǎo)致滑坡的發(fā)生[21-22]。通過(guò)研究歷史滑坡的發(fā)育特征、上猶縣滑坡易發(fā)性的相關(guān)文獻(xiàn)資料以及上猶縣的自然地理特征,選取11個(gè)環(huán)境因子作為FR-SVM和單獨(dú)SVM模型的輸入變量,如表1所示。這些因子主要有地形、水文、地質(zhì)和地表覆蓋因子等幾個(gè)類別,以此實(shí)現(xiàn)建模評(píng)價(jià)指標(biāo)體系的完整構(gòu)建。
2.3.1 基礎(chǔ)環(huán)境因子頻率比分析
以往研究表明滑坡更易發(fā)生于地質(zhì)環(huán)境條件與已知滑坡相似的地區(qū)。基礎(chǔ)環(huán)境因子與滑坡空間分布之間的關(guān)系是研究重點(diǎn),而頻率比聯(lián)接法適用于研究二者之間的非線性相關(guān)性[23]。因此頻率比聯(lián)接法被用于分析環(huán)境因子對(duì)滑坡發(fā)育的影響并進(jìn)一步作為模型輸入變量。通過(guò)ArcGIS軟件,采用自然間斷點(diǎn)分級(jí)法將連續(xù)型的基礎(chǔ)環(huán)境因子分為5個(gè)等級(jí):極高、高、中等、低和極低;巖土巖性因子根據(jù)其地層組合性質(zhì)進(jìn)行劃分,其中巖漿巖通常分布于地殼薄弱、開(kāi)裂地帶,以巖基、巖床、巖脈等不同產(chǎn)狀分布于不同地層中;碎屑巖是機(jī)械破碎的巖石殘余物,分布于地表或接近地表的地層中;碳酸巖的分布與深層斷裂有關(guān),主要產(chǎn)于古老地臺(tái)邊緣斷裂系及褶皺帶內(nèi)中間地塊斷裂帶;變質(zhì)巖主要分布在各個(gè)地質(zhì)時(shí)期的地殼活動(dòng)帶(如地槽區(qū)),在一些侵入體的周圍以及斷裂帶內(nèi),也均有變質(zhì)巖的分布。距水系距離通過(guò)對(duì)DEM數(shù)據(jù)進(jìn)行填洼、流量提取、柵格河網(wǎng)矢量化等操作,得到水系分布;并根據(jù)其匯流累積量進(jìn)行劃分。
表1 各環(huán)境因子頻率比值Table 1 Frequency ratios of various environmental factor
續(xù)表
2.3.2 地形地貌因子
從表1和圖1可以看出,當(dāng)高程在122~386 m時(shí),F(xiàn)R >1表明該區(qū)域有利于滑坡的發(fā)育;當(dāng)高程高于386 m時(shí),F(xiàn)R均小于或接近于1,表明不利于滑坡的發(fā)育。坡向和坡度均由DEM數(shù)據(jù)提取而來(lái)。其中斜坡坡度與滑坡的關(guān)系通過(guò)坡度FR來(lái)表示,斜坡坡向與滑坡的關(guān)系通過(guò)坡向FR來(lái)表示。如表1和圖2 (a)所示,當(dāng)坡度在9.8°~22.8° (約占總柵格百分比48.5%)時(shí),F(xiàn)R>1存在65.5%的滑坡發(fā)生在該區(qū)域內(nèi),表明中等坡度條件下更有利于滑坡的發(fā)展。
平面曲率由坡向的坡度計(jì)算而來(lái),于水平方向上表述地形的特征情況;剖面曲率由坡度的坡度計(jì)算而來(lái),于垂直方向表述斜面斜率的坡度情況,二者從縱橫方向上綜合反映了地形復(fù)雜性[24-25]。地形起伏度在數(shù)值上由區(qū)域內(nèi)高程的最大值與最小值之差計(jì)算而來(lái),表述區(qū)域地形表面的起伏情況。如表1和圖2所示,剖面曲率在-0.5~-0.2 m-1和0.1~4.5 m-1范圍內(nèi)和平面曲率在-19.9~18.7 m-1時(shí),其FR >1表明該范圍內(nèi)滑坡較容易FR>1發(fā)生;當(dāng)?shù)匦纹鸱戎堤幱?8.2~94.9 m時(shí),其表明該范圍內(nèi)滑坡較容易發(fā)生。
2.3.3 水文環(huán)境因子
水系作用于邊坡導(dǎo)致其巖土被沖刷、磨蝕的同時(shí)碎屑物被搬運(yùn)帶走,導(dǎo)致土層間相對(duì)錯(cuò)動(dòng)。通過(guò)GIS軟件對(duì)DEM數(shù)據(jù)進(jìn)行流向分析、洼地判定、填充洼地、匯流分析、河網(wǎng)分析得到水系分布,再進(jìn)行柵格河網(wǎng)矢量化、緩沖區(qū)分析研究區(qū)柵格單元距水系距離。MNDWI反映該區(qū)域地表的濕度分布特征,可有效反映水體等信息對(duì)滑坡發(fā)育的影響規(guī)律。由表1和圖2(e)、圖2(f)可以發(fā)現(xiàn),約有68.1%的單元發(fā)生于距水系250 m的范圍內(nèi);MNDWI在0~129時(shí)FR >1;在整體上FR值隨著MNDWI的增大而逐漸減小,呈負(fù)相關(guān)表明水系對(duì)滑坡分布范圍影響有一定限度。
2.3.4 基礎(chǔ)地質(zhì)因子和地表覆蓋因子
巖土對(duì)滑坡發(fā)育至關(guān)重要,其是影響基巖的力學(xué)性質(zhì)的內(nèi)在因素。通過(guò)地質(zhì)調(diào)查,上猶縣的巖類主要為變質(zhì)巖、碳酸鹽巖以及碎屑巖巖類。位于中部地區(qū)和偏南部區(qū)域的變質(zhì)巖類和位于西部地區(qū)和北部地區(qū)的碳酸鹽巖類,其FR均大于1顯示這兩種巖類是滑坡發(fā)育的重要影響因子。NDVI和NDBI綜合表明滑坡發(fā)育受植被覆蓋程度及人類活動(dòng)的深遠(yuǎn)影響。表1和圖2(g)、圖2(h)、圖2(i)表明,當(dāng)NDVI在0.187~0.553時(shí),F(xiàn)R >1;當(dāng)NDBI值0.419~0.847時(shí),F(xiàn)R >1,表明在該范圍內(nèi)有利于滑坡發(fā)育。
圖2 上猶縣環(huán)境因子分析Fig.2 Environmental factor analysis of Shangyou County
基于2.3節(jié)中的滑坡環(huán)境因子分析結(jié)果,共利用了巖性、距水系距離和地形等等11個(gè)環(huán)境因子的頻率比值作為SVM模型的輸入變量。在開(kāi)展SVM模型的訓(xùn)練之前有必要將所有環(huán)境因子的頻率比值進(jìn)行歸一化處理,以便提高SVM建模準(zhǔn)確性。
模型輸入變量為各9 312個(gè)滑坡和非滑坡柵格單元,其中滑坡柵格單元是上述已知的滑坡編錄信息而非滑坡單元主要通過(guò)隨機(jī)的方式在整個(gè)上猶縣采集獲取。之后在SPSS軟件中將上述18 624個(gè)滑坡-非滑坡柵格單元隨機(jī)劃分為兩部分,一部分是其中的70%用以SVM模型訓(xùn)練,另外一部分是其中的30%用以SVM模型測(cè)試。在模型的訓(xùn)練、測(cè)試的過(guò)程中,在SPSS軟件中分別將滑坡、非滑坡柵格單元分別標(biāo)記為1和0。
將上述訓(xùn)練測(cè)試好的SVM模型應(yīng)用于11個(gè)歸一化的環(huán)境因子頻率比值中,即可得到整個(gè)上猶縣的滑坡易發(fā)性空間分布。進(jìn)一步利用目前最常用的自然間斷點(diǎn)分級(jí)法來(lái)將滑坡易發(fā)性分布圖分級(jí)成極高、高、中等、低和極低5個(gè)易發(fā)區(qū)[4-5]。5個(gè)易發(fā)區(qū)各占總面積的8.95%、13.65%、17.26%、24.07%、36.07%,結(jié)果如表2和圖3所示。從表2中可知,極高和高易發(fā)性分區(qū)中約有49.495%為滑坡柵格,而極低易發(fā)區(qū)中僅有15.08%的滑坡柵格。在上猶縣總面積中極高和高滑坡易發(fā)區(qū)的頻率比值占總頻率比值的66.81%,可見(jiàn)FR-SVM模型預(yù)測(cè)的滑坡易發(fā)性結(jié)果總體而言是準(zhǔn)確可信的。
為驗(yàn)證使用頻率比法計(jì)算SVM模型輸入變量的必要性和可行性,利用原始環(huán)境因子數(shù)據(jù)在無(wú)頻率比分析的基礎(chǔ)上再次進(jìn)行上述建模操作。將3.1節(jié)中利用過(guò)的9 312個(gè)滑坡和隨機(jī)采集的9 312個(gè)非滑坡柵格單元作為單獨(dú)SVM模型的輸入變量,并對(duì)單獨(dú)SVM模型按7∶3的比例進(jìn)行訓(xùn)練和測(cè)試。
將訓(xùn)練測(cè)試好的單獨(dú)SVM模型應(yīng)用于原始環(huán)境因子數(shù)據(jù)可得到上猶縣的滑坡易發(fā)性,同樣采用自然間斷點(diǎn)分級(jí)法將易發(fā)性分布圖劃分為極高、高、中等、低、極低5個(gè)易發(fā)區(qū)。5個(gè)易發(fā)區(qū)各占總面積的18.64%、14.2%、13.58%、27.55%、26.04%,結(jié)果如表3和圖3所示。從表3可知,極高和高易發(fā)性區(qū)中約有77.62%為滑坡柵格,而極低易發(fā)區(qū)僅有1.83%的滑坡柵格,顯示單獨(dú)SVM在整體上預(yù)測(cè)出的上猶縣滑坡易發(fā)性也具有較高的可靠性。從在單獨(dú)SVM和FR-SVM模型預(yù)測(cè)的滑坡易發(fā)性中可知,極高和高易發(fā)區(qū)均較好地涵蓋了已知的滑坡柵格信息。
表2 基于FR-SVM模型評(píng)價(jià)滑坡易發(fā)性等級(jí)的頻率比Table 2 SVM model is used to evaluate the frequency ratio of landslide susceptibility grade
表3 基于單獨(dú)SVM模型評(píng)價(jià)滑坡易發(fā)性等級(jí)的頻率比值Table 3 Frequency ratios of landslide susceptibility levels predicted by the single SVM model
將各模型的訓(xùn)練樣本的預(yù)測(cè)結(jié)果值和測(cè)試樣本的預(yù)測(cè)結(jié)果值(即滑坡易發(fā)性指數(shù)值)分別按從小到大的順序排列,依次將其作為滑坡預(yù)測(cè)的閾值。預(yù)測(cè)大于或等于該閾值的樣本點(diǎn)為滑坡點(diǎn)。預(yù)測(cè)結(jié)果中以正確的滑坡預(yù)測(cè)點(diǎn)數(shù)與滑坡總點(diǎn)數(shù)的比值作為縱坐標(biāo),稱為敏感性;以對(duì)應(yīng)滑坡預(yù)測(cè)結(jié)果錯(cuò)誤點(diǎn)數(shù)與樣本中非滑坡點(diǎn)總數(shù)的比值作為橫坐標(biāo),稱為特異性[26]。
通過(guò)平滑曲線連接坐標(biāo)系中的每個(gè)點(diǎn),得到每個(gè)模型基于訓(xùn)練集的成功率曲線和基于測(cè)試集的測(cè)試率曲線,即可組成ROC曲線。而ROC曲線下的面積即AUC表示具體模型預(yù)測(cè)精度值。AUC越大(其取值范圍為0~1)時(shí)模型的預(yù)測(cè)性能越優(yōu)秀[27]。精度評(píng)價(jià)結(jié)果如圖4所示,可以看出,F(xiàn)R-SVM模型預(yù)測(cè)滑坡易發(fā)性的AUC達(dá)到0.893,而單獨(dú)SVM模型的AUC只是0.798。表明FR-SVM模型在描述易發(fā)性指數(shù)分布方面要優(yōu)于單獨(dú)SVM模型,能更加有效反映上猶縣滑坡災(zāi)害的分布特征和發(fā)育規(guī)律。
圖3 基于FR-SVM模型和單獨(dú)SVM模型預(yù)測(cè)得到的易發(fā)性發(fā)布圖Fig.3 Vulnerability distribution graph predicted based on FR-SVM model and individual SVM model
圖4 各模型的ROC曲線圖Fig.4 ROC curves of all models
在ArcGIS 10.2軟件中對(duì)兩模型預(yù)測(cè)的上猶縣滑坡易發(fā)性圖進(jìn)行對(duì)比分析,可知上猶縣的滑坡易發(fā)性級(jí)別和易發(fā)性指數(shù)等信息與該區(qū)域內(nèi)各種自然環(huán)境因子較為吻合。其中上猶縣極高和高滑坡易發(fā)區(qū)主要集中分布在海拔約低于386 m、較低坡度10°~22°、沿著溝谷水系分布、地形起伏度38~100 m、碎屑巖以及人類工程活動(dòng)較密集的區(qū)域。上猶縣低和極低滑坡易發(fā)區(qū)主要分布在海拔約高于500 m、坡度小于10°或大于22°、遠(yuǎn)離溝谷水系、地形起伏度很低或非常高、變質(zhì)巖以及人類工程活動(dòng)較少的區(qū)域。在FR-SVM模型預(yù)測(cè)精度高于單獨(dú)SVM模型的同時(shí),F(xiàn)R-SVM模型和單獨(dú)SVM模型計(jì)算得到上猶縣的極高和高易發(fā)區(qū)的FR占總FR的百分比均非常高,且通過(guò)隨機(jī)選取并放大研究區(qū)內(nèi)一些典型的極高和高易發(fā)區(qū),觀察得到FR-SVM模型和單獨(dú)SVM模型的易發(fā)性圖中滑坡面均較好地分布于極高和高易發(fā)區(qū)內(nèi),可見(jiàn)兩種模型的預(yù)測(cè)在實(shí)際中能夠得到驗(yàn)證,預(yù)測(cè)的滑坡易發(fā)性級(jí)別分布結(jié)果也能得到互相檢驗(yàn)。
由圖4可知,F(xiàn)R-SVM和單獨(dú)SVM模型預(yù)測(cè)滑坡易發(fā)性的AUC分別為0.893、0.798,表明FR-SVM模型在描述易發(fā)性指數(shù)分布方面要優(yōu)于單獨(dú)SVM模型。這是因?yàn)轭l率比值很好地將環(huán)境因子對(duì)滑坡發(fā)育的非線性作用規(guī)律揭示了出來(lái),初步的將滑坡和其環(huán)境因子聯(lián)接在了一起。用能直觀反映滑坡發(fā)育特征的輸入變量進(jìn)行模型訓(xùn)練測(cè)試,其效果會(huì)優(yōu)于用原始環(huán)境因子數(shù)據(jù)作為模型輸入變量。盡管單獨(dú)SVM的建模流程簡(jiǎn)單且其效率優(yōu)于FR-SVM模型,但是顯然FR-SVM模型揭示滑坡影響因素和分布規(guī)律的工程實(shí)用性更強(qiáng)。
為了探究基于頻率比值的機(jī)器學(xué)習(xí)模型預(yù)測(cè)滑坡易發(fā)性的有效性,以江西上猶縣滑坡為例開(kāi)展易發(fā)性建模研究,分別建立基于FR-SVM和單獨(dú)SVM模型的上猶縣滑坡易發(fā)性預(yù)測(cè)模型并得出建模結(jié)果。
(1)SVM模型是一種簡(jiǎn)單、高效且精度較高的滑坡易發(fā)性預(yù)測(cè)模型,且FR-SVM和單獨(dú)SVM模型均能準(zhǔn)確預(yù)測(cè)出上猶縣的滑坡易發(fā)性空間分布規(guī)律。
(2)通過(guò)ROC曲線分析可知FR-SVM模型的AUC遠(yuǎn)高于單獨(dú)SVM模型,表明FR-SVM模型在描述易發(fā)性指數(shù)分布方面要優(yōu)于單獨(dú)SVM模型,能有效反映上猶縣滑坡發(fā)育規(guī)律及其發(fā)育概率的空間分布。