張 沛,李英冰,張鎮(zhèn)平,胡露太
(武漢大學(xué)測繪學(xué)院,湖北 武漢 430079)
山體滑坡是地震造成的嚴(yán)重次生災(zāi)害之一,地震會使原本處于極限平衡或?qū)⒔鼧O限平衡的山坡在極短時間內(nèi)經(jīng)歷裂縫與下滑的整個過程。地震災(zāi)害具有突發(fā)性,地震滑坡具有形成時間快、規(guī)模大、破壞性極強(qiáng)的特點(diǎn),容易造成人員傷亡和不可估計的經(jīng)濟(jì)損失。2008年汶川地震是有記錄以來誘發(fā)地質(zhì)災(zāi)害最多的地震,觸發(fā)了15多萬處滑坡[1-2]。
對滑坡易發(fā)地區(qū)進(jìn)行滑坡敏感性分析,可以對滑坡發(fā)生概率高的地區(qū)進(jìn)行針對性監(jiān)測預(yù)警,為滑坡風(fēng)險管理與防災(zāi)減災(zāi)提供支持。目前滑坡敏感性的評價方法有4類:確定性物理模型、啟發(fā)模型、統(tǒng)計模型與機(jī)器學(xué)習(xí)模型[3]。物理模型需要實地勘察,耗費(fèi)大量人力[4];啟發(fā)模型(如層次分析法)依賴專家主觀先驗知識[5];統(tǒng)計模型挖掘滑坡與影響因子間的關(guān)聯(lián)模式,常用信息量與頻率比模型等[6];文獻(xiàn)[7]對礦山附近滑坡敏感性的研究中用信息量方法顧及各種滑坡影響因子,但沒有區(qū)分不同因子的貢獻(xiàn)程度。
隨著機(jī)器學(xué)習(xí)的成熟與發(fā)展,邏輯斯蒂回歸LR、支持向量機(jī)SVM、隨機(jī)森林等在滑坡敏感性評價上表現(xiàn)出優(yōu)異性能[8-9]。文獻(xiàn)[10]將隨機(jī)森林與InSAR相結(jié)合,預(yù)測了滑坡敏感性。新興的深度學(xué)習(xí)也憑借其對海量多維數(shù)據(jù)特征的挖掘能力,在多個領(lǐng)域發(fā)展迅猛。文獻(xiàn)[11]將CNN、RNN應(yīng)用于伊朗的滑坡敏感性分析。國內(nèi)將其應(yīng)用于該領(lǐng)域的研究起步較晚,文獻(xiàn)[12]采用一維CNN評價了川藏鐵路沿線的滑坡敏感性。但傳統(tǒng)機(jī)器學(xué)習(xí)與一維CNN忽略了滑坡通常與周圍的空間環(huán)境有緊密聯(lián)系。
因此,本文提出耦合遞歸特征消除與二維卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的RFE-2DCNN模型,對滑坡影響因子貢獻(xiàn)度排序篩選,用優(yōu)化的二維CNN保證模型質(zhì)量與精度,輸入二維圖像彌補(bǔ)了傳統(tǒng)機(jī)器學(xué)習(xí)與一維CNN方法僅考慮當(dāng)前滑坡點(diǎn)信息的缺陷,預(yù)測滑坡敏感性。
本文提出的RFE-2DCNN滑坡敏感性評價方法的技術(shù)路線如圖1所示。
圖1 RFE-2DCNN方法技術(shù)路線
滑坡敏感性的影響因子中,巖性、土地利用、坡向?qū)儆陬悇e變量,采用信息量法對其進(jìn)行量化[13]。滑坡影響因子過多時,可能出現(xiàn)多重共線性,干擾建模結(jié)果,使其出現(xiàn)誤差。因此,首先使用方差膨脹因子VIF檢測滑坡影響因子之間的多重共線性。當(dāng)VIF>10時,認(rèn)為該因子與其他因子高度相關(guān),予以剔除[13]。
1.2.1 遞歸特征消除(RFE)
遞歸特征消除法旨在消除冗余及不相關(guān)變量,是一種尋找最優(yōu)特征子集的貪心算法。通過循環(huán)迭代,每次消除一個最不相關(guān)的特征,根據(jù)被消除的順序?qū)μ卣髋判?選出最優(yōu)特征子集[14]。
1.2.2 二維卷積神經(jīng)網(wǎng)絡(luò)(2DCNN)
一維CNN和機(jī)器學(xué)習(xí)方法的數(shù)據(jù)輸入為單個滑坡點(diǎn)的影響因子特征集,輸入數(shù)據(jù)大小為1×1×n,其中n為影響因子個數(shù)?;碌陌l(fā)生不僅與自身有關(guān),還與孕災(zāi)環(huán)境相關(guān),因此使用二維CNN且輸入二維柵格圖像考慮滑坡點(diǎn)的空間信息。將采樣點(diǎn)作為圖像中心點(diǎn),裁剪出25×25個柵格單元構(gòu)成二維柵格圖像,疊加所有滑坡敏感性影響因子圖層,形成25×25×n的多通道圖像,將其作為二維CNN的輸入,再將預(yù)測精確度作為目標(biāo)函數(shù)且進(jìn)行模型訓(xùn)練。
本文采用的2DCNN結(jié)構(gòu)如圖2所示。其中,卷積層(Conv)用于提取滑坡影響因子特征,卷積核大小為3×3,經(jīng)3次卷積后分別得到深度為32、64和128的特征圖。
圖2 2DCNN結(jié)構(gòu)
通過卷積層后使用ReLU激活函數(shù)與歸一化BN層,ReLU激活函數(shù)將影響因子的特征映射至非線性維度,學(xué)習(xí)高維度特征;BN層用于加快2DCNN的訓(xùn)練和收斂速度,防止過擬合[15]。通過最大池化層(MaxPool)降低分辨率,獲得具有空間不變性的滑坡特征,減少網(wǎng)絡(luò)的數(shù)據(jù)量與計算復(fù)雜性[16],最后使用1×128維度的全連接層(FC)展平特征。
為了防止過擬合,在全連接層中加入L2正則化與Dropout。Dropout在訓(xùn)練時隨機(jī)棄用一定比例的神經(jīng)元,L2正則化在原始損失函數(shù)C0后添加正則化項以防止權(quán)重過大,使模型更平滑[17],最后通過Sigmoid函數(shù)對滑坡特征進(jìn)行分類,輸出預(yù)測的滑坡發(fā)生概率。
采用機(jī)器學(xué)習(xí)方法:Logistic模型和帶有線性核函數(shù)Linear、徑向基核函數(shù)RBF與Sigmoid核函數(shù)的SVM模型驗證結(jié)果,采用與2DCNN相同的特征因子集訓(xùn)練。
Logistic在滑坡敏感性分析中應(yīng)用廣泛,模型將滑坡影響因子線性組合后,以Sigmoid函數(shù)作為后驗概率分布函數(shù)進(jìn)行分類[18]。SVM核函數(shù)將影響因子特征映射到高維空間,利用高維空間中的超平面對滑坡進(jìn)行分類[19]。
在帶有核函數(shù)的SVM中使用粒子群算法尋找最優(yōu)參數(shù),包括SVM-Linear的懲罰參數(shù)C、SVM-RBF和SVM-Sigmoid的懲罰參數(shù)C與核函數(shù)參數(shù)γ。最后使用受試者工作特性曲線ROC及AUC衡量模型性能。
2017年8月8日,四川省阿壩州九寨溝縣發(fā)生7.0級地震,此次地震烈度高、震源淺,震區(qū)地質(zhì)環(huán)境脆弱,給九寨溝景區(qū)的生態(tài)環(huán)境帶來嚴(yán)重破壞[20]。同時,地震觸發(fā)了大量同震滑坡,造成了交通堵塞,對應(yīng)急救援進(jìn)度產(chǎn)生了嚴(yán)重影響。
震區(qū)主要受岷江斷裂、虎牙斷裂、文縣-瑪沁斷裂影響[21],海拔為2048~4455 m,地形起伏大,位于寒冷的亞濕潤和半干旱季風(fēng)性氣候區(qū),年均降雨量約為550 mm[15]。本文選取阿壩州九寨溝縣西南部(涵蓋所有同震滑坡的范圍)為研究區(qū)域,面積約為457.54 km2,如圖3所示。
圖3 研究區(qū)域概況
2.2.1 滑坡清單
滑坡清單是敏感性評價的數(shù)據(jù)基礎(chǔ),該數(shù)據(jù)來源于國家冰川凍土沙漠科學(xué)數(shù)據(jù)中心。研究區(qū)域共有滑坡4834個,最大面積約為0.2 km2,最小面積約為7 m2,總面積約為9.6 km2。
2.2.2 影響因子
本文選取海拔高度、地形濕度指數(shù)(TWI)、坡度、坡向、平面曲率、剖面曲率、地形起伏度、植被歸一化指數(shù)(NDVI)、峰值地面加速度(PGA)、距水系距離、距斷層距離、距道路距離、土地利用、巖性共14個因子作為滑坡敏感性的評價因子。
DEM、坡度、坡向、TWI、曲率、地形起伏度用于反映研究區(qū)域地形狀況,通常較為陡峭的區(qū)域更容易發(fā)生滑坡。巖性與距斷層距離表明地質(zhì)情況,與土層動力穩(wěn)定性有直接關(guān)聯(lián)。土地利用和NDVI表征不同土壤濕度和地表徑流,間接影響滑坡發(fā)展。土地利用與距道路距離反映人類活動情況。PGA則是衡量地震對滑坡影響的重要因素[22]。
影響因子來源見表1,分布如圖4所示,根據(jù)DEM分辨率,將所有影響因子的分辨率統(tǒng)一至30 m,組成14個柵格圖層輸入模型,分析九寨溝地區(qū)滑坡敏感性。
表1 數(shù)據(jù)來源
圖4 滑坡敏感性影響因子
通過方差膨脹因子VIF檢測滑坡影響因子間的相關(guān)性。當(dāng)VIF>10時,被認(rèn)為與其他因子高度相關(guān),檢測結(jié)果見表2,坡度與地形起伏度有較高相關(guān)性。將地形起伏度因子去除后,所有因子VIF值均小于10,說明剩余因子間不存在多重共線性。
表2 影響因子多重共線性與重要性排序
利用遞歸特征消除法對剩余因子進(jìn)行排序,每次剔除一個貢獻(xiàn)最低的特征,組成新的滑坡特征集,重新計算特征重要性,通過10折交叉驗證計算分類精度,重復(fù)此過程對所有因子進(jìn)行排序,選擇分類精度最高的滑坡特征集,結(jié)果見表2,剔除貢獻(xiàn)較低的NDVI、距道路距離與距水系距離,其余10個因子被輸入模型進(jìn)行滑坡敏感性計算。
以1∶1比例隨機(jī)選2000個滑坡點(diǎn)與非滑坡點(diǎn)作為訓(xùn)練集,訓(xùn)練時使用5折交叉驗證測試模型擬合優(yōu)度。按相同比例隨機(jī)選400個滑坡點(diǎn)與非滑坡點(diǎn)作為測試集。裁剪周圍的柵格單元組成25×25大小的柵格圖像作為輸入數(shù)據(jù)集。訓(xùn)練時使用Adam優(yōu)化器,根據(jù)交叉驗證中的驗證集精度自適應(yīng)改變學(xué)習(xí)率,加入早停法,當(dāng)驗證集精度下降時停止訓(xùn)練,保證訓(xùn)練時的驗證集精度。
將訓(xùn)練好的RFE-2DCNN模型應(yīng)用至整個研究區(qū)域,如圖5所示,利用自然斷點(diǎn)法將滑坡敏感性分為5類:極高敏感性[0.78,1)、高敏感性[0.53,0.78)、中等敏感性[0.29,0.53)、低敏感性[0.10,0.29)與極低敏感性[0,0.10),各部分所占比例見表3。極高敏感區(qū)在西北部的九寨天堂景區(qū)及東南部的熊貓海至箭竹海景區(qū)分布較多,這與地震滑坡發(fā)生的地區(qū)相吻合。研究區(qū)域大部分為中低風(fēng)險,占比約為80.1%;極高敏感性區(qū)域僅為10.8%,范圍較小。此外,86%的實測滑坡發(fā)生在高敏感性與極高敏感性地區(qū)內(nèi),證明模型得到的結(jié)果與實際情況相吻合。
表3 RFE-2DCNN法滑坡敏感性各部分比例
圖5 RFE-2DCNN方法的滑坡敏感性分布
為了評價本文提出的RFE-2DCNN模型的有效性與正確性,將其與Logistic、SVM兩種機(jī)器學(xué)習(xí)方法作對比。機(jī)器學(xué)習(xí)方法得到的預(yù)測結(jié)果如圖6所示。與圖5對比發(fā)現(xiàn),考慮周圍一定范圍內(nèi)信息的RFE-2DCNN得到的結(jié)果更平滑連續(xù),僅考慮單點(diǎn)影響因子狀況的機(jī)器學(xué)習(xí)方法得到的結(jié)果更為破碎。
圖6 機(jī)器學(xué)習(xí)方法的滑坡敏感性分布
5種方法的測試集精度見表4。機(jī)器學(xué)習(xí)中SVM-RBF在測試集的準(zhǔn)確度最高,但仍比RFE-2DCNN準(zhǔn)確度低1%。圖7 RFE-2DCNN的AUC值最大,相較于SVM-RBF模型提高了0.018。整體而言,在本文對比的幾個模型中,RFE-2DCNN模型的泛化能力與預(yù)測精度是最好的。
表4 試驗準(zhǔn)確度與AUC
圖7 ROC曲線
本文方法改進(jìn)了傳統(tǒng)機(jī)器學(xué)習(xí)與一維CNN僅考慮滑坡點(diǎn)信息的不足,增加了滑坡點(diǎn)周圍空間信息在模型中的作用。首先在14個滑坡影響因子中,根據(jù)多重共線性檢測與遞歸特征消除法保留具有最大貢獻(xiàn)的10個影響因子,隨后將其輸入帶有L2正則化、Dropout與早停優(yōu)化方法的二維CNN進(jìn)行九寨溝地區(qū)的滑坡敏感性評價,最終將滑坡發(fā)生概率劃分為極高、高、中、低與極低5類。
結(jié)果表明:研究區(qū)大部分是中低風(fēng)險,高風(fēng)險區(qū)域與極高風(fēng)險區(qū)域范圍較小;86%的實測滑坡發(fā)生在高敏感性與極高敏感性區(qū)域內(nèi),證明了模型的正確性與有效性。經(jīng)過與Logistic模型、帶有Linear、RBF和Sigmoid核函數(shù)的SVM模型對比發(fā)現(xiàn),本文方法有最高的準(zhǔn)確度90.5%和AUC(0.968)。證明顧及周圍環(huán)境信息可以提高模型泛化能力與預(yù)測精度。
5種方法的滑坡敏感性圖表明,九寨天堂景區(qū)與九寨溝風(fēng)景區(qū)附近存在敏感性較高的區(qū)域,這對九寨溝地區(qū)的旅游業(yè)有一定影響,災(zāi)害應(yīng)急管理部門可以增加對高敏感性區(qū)域災(zāi)情的監(jiān)測與預(yù)警,對滑坡易發(fā)區(qū)域?qū)嵤┲卫砼c防范措施,降低滑坡災(zāi)害損失。