張澤方
(貴州民族大學(xué) 建筑工程學(xué)院,貴州 貴陽(yáng) 550025)
滑坡易發(fā)性評(píng)價(jià)指根據(jù)已經(jīng)發(fā)生的滑坡災(zāi)害的特征,對(duì)可能發(fā)生滑坡災(zāi)害的傾向性進(jìn)行評(píng)價(jià),確定成災(zāi)概率的大小。早在20世紀(jì)70年代,國(guó)外學(xué)者就已經(jīng)開(kāi)展滑坡易發(fā)性研究工作,Brabb等[1]主要考慮地質(zhì)因素,制作了美國(guó)加州San Mateo地區(qū)的派生地圖,更加簡(jiǎn)潔地表達(dá)了滑坡易發(fā)區(qū)信息。我國(guó)滑坡易發(fā)性研究起步較晚,1991年,狄君靖[2]對(duì)云南省地質(zhì)災(zāi)害控制因素進(jìn)行了分析研究,并在此基礎(chǔ)上作了滑坡易發(fā)性分區(qū),為后續(xù)研究提供了數(shù)學(xué)模型參考。目前,國(guó)內(nèi)外滑坡易發(fā)性評(píng)價(jià)模型主要包括概率統(tǒng)計(jì)模型、機(jī)器學(xué)習(xí)模型等,其中概率統(tǒng)計(jì)模型包括信息量模型[3]、確定性系數(shù)模型[4]、證據(jù)權(quán)模型[5]、二元邏輯回歸模型[6]等,機(jī)器學(xué)習(xí)模型包括神經(jīng)網(wǎng)絡(luò)模型[7]、隨機(jī)森林模型[8]、決策樹(shù)預(yù)測(cè)模型[9]、支持向量機(jī)模型[10]等。然而,對(duì)于單一模型,在環(huán)境因子的狀態(tài)分級(jí)與量化處理中存在主觀因素干擾的問(wèn)題以及無(wú)法客觀確定不同環(huán)境因子權(quán)重的缺陷。因此,兩種甚至多種模型耦合的評(píng)價(jià)方法逐漸成為近年來(lái)探索的熱點(diǎn)。郭子正等[11]將WOE模型和BP神經(jīng)網(wǎng)絡(luò)模型結(jié)合用于三峽萬(wàn)州區(qū)滑坡易發(fā)性評(píng)價(jià),研究表明WOE-BP模型較兩種單一模型更為精確;張玘愷等[12]以九寨溝縣為研究區(qū),基于I、CF和LR模型,提出LR-I和LRCF耦合模型,顯著提高了評(píng)價(jià)精度;儀政等[13]通過(guò)信息量與多模型耦合的方法對(duì)三峽庫(kù)區(qū)秭歸縣侏羅系地層區(qū)進(jìn)行滑坡易發(fā)性評(píng)價(jià),結(jié)果表明耦合模型比單一信息量模型具有更高的預(yù)測(cè)精度;劉璐瑤等[14]將證據(jù)權(quán)與邏輯回歸模型結(jié)合用于浙江省永嘉縣滑坡易發(fā)性評(píng)價(jià),此評(píng)價(jià)結(jié)果的合理性與精確度均優(yōu)于兩種單一模型。上述分析表明,滑坡易發(fā)性評(píng)價(jià)的模型豐富多樣,對(duì)不同區(qū)域而言不一定存在相同的最優(yōu)模型[15],耦合模型的精度總體上高于單一模型。因此,本文嘗試將最大熵模型(MaxEnt)與信息量模型(I)、確定性系數(shù)模型(CF)進(jìn)行耦合,通過(guò)各模型對(duì)比研究,探討適用于望謨縣的滑坡易發(fā)性評(píng)價(jià)模型。
最大熵(MaxEnt)模型是由Phillips等[16]基于機(jī)器學(xué)習(xí)和數(shù)理統(tǒng)計(jì)方法開(kāi)發(fā)的預(yù)測(cè)物種地理分布的生態(tài)位模型,當(dāng)前已經(jīng)有學(xué)者在滑坡易發(fā)性評(píng)價(jià)中引入MaxEnt模型[17]。MaxEnt模型的特征函數(shù)f(a,b)可表示a,b的某種定性關(guān)系,當(dāng)a,b符合特定條件時(shí),特征函數(shù)賦值為1;不符合特定條件時(shí),特征函數(shù)賦值為0[18]。給定一個(gè)約束條件,將訓(xùn)練數(shù)據(jù)視為隨機(jī)變量(a,b)產(chǎn)生,令p(f)表示特征函數(shù)f(a,b)關(guān)于經(jīng)驗(yàn)分布p(a,b)的期望,如下式:
若符合約束條件,則p(b|a)關(guān)于函數(shù)f的期望,與經(jīng)驗(yàn)分布關(guān)于f(a,b)的期望相等:
再求解帶有約束條件的最優(yōu)化問(wèn)題,根據(jù)歸一化指數(shù)exp(1-ω)[17],令Zω(a)表示exp(1-ω),得:
信息量模型是一種基于信息論的統(tǒng)計(jì)模型,它能將代表環(huán)境因素的數(shù)值轉(zhuǎn)化為反映滑坡易發(fā)性的信息量值,信息量值越大表示發(fā)生滑坡的可能性越大,信息量值越小表示發(fā)生滑坡的可能性越小,其計(jì)算公式如下:
I為單個(gè)柵格內(nèi)的總信息量值,n為環(huán)境因子個(gè)數(shù),Ni為研究區(qū)某特定環(huán)境因子內(nèi)滑坡災(zāi)害分布面積;N為研究區(qū)內(nèi)滑坡災(zāi)害分布總面積;Si為研究區(qū)內(nèi)某特定環(huán)境因子的面積;S為研究區(qū)總面積;N/S為研究區(qū)的滑坡災(zāi)害分布密度,Ni/Si為滑坡災(zāi)害在某圖層特定級(jí)別內(nèi)的分布密度。
確定性系數(shù)模型是由Shortiffe等[19]提出的一種概率函數(shù)模型,目前已廣泛應(yīng)用于滑坡災(zāi)害易發(fā)性評(píng)價(jià)研究,CF值越大表示該環(huán)境下越易發(fā)生滑坡,反之則表示越不易發(fā)生滑坡,其計(jì)算公式如下:
式中CF為滑坡災(zāi)害發(fā)生的確定性系數(shù);PPa為滑坡災(zāi)害在環(huán)境因子分類(lèi)a中發(fā)生的條件概率,可用環(huán)境因子分類(lèi)a中的滑坡災(zāi)害面積與分類(lèi)面積的比值表示;PPs表示滑坡災(zāi)害在整個(gè)研究區(qū)中發(fā)生的先驗(yàn)概率,可用滑坡災(zāi)害總面積與研究區(qū)總面積的比值表示,在研究區(qū)確定的情況下,PPs通常是一個(gè)定值。
信息量模型和確定性系數(shù)模型可以獲取到各環(huán)境因子的信息量值和確定性系數(shù)值,這些值雖然從不同角度反映了各環(huán)境因子對(duì)滑坡的影響程度,但是并未確定各環(huán)境因子的權(quán)重,而最大熵模型可以根據(jù)模型中各環(huán)境因子的貢獻(xiàn)率確定其權(quán)重,因此本文將最大熵模型和信息量模型、確定性系數(shù)模型耦合,從而對(duì)研究區(qū)進(jìn)行更加準(zhǔn)確的滑坡易發(fā)性評(píng)價(jià)。
研究區(qū)為望謨?nèi)h,地理位置介于東經(jīng)105°49′~106°32′、北緯24°53′~25°38′之間,總面積約為3018km2,如圖1所示,研究區(qū)地形地貌、地質(zhì)構(gòu)造與滑坡災(zāi)害點(diǎn)分布情況。望謨縣地處云貴高原向廣西丘陵過(guò)渡的斜坡地帶,平均海拔高度為868米,地勢(shì)北高南低,地貌形態(tài)以山地、丘陵為主,盆地較少。研究區(qū)內(nèi)屬亞熱帶季風(fēng)濕潤(rùn)氣候,年均氣溫19.5℃,年均降雨量為1421.1mm;褶皺斷裂發(fā)育,新構(gòu)造活動(dòng)強(qiáng)烈,巖土體組合復(fù)雜多樣,東西部巖溶發(fā)育較為典型;地表水系發(fā)育,其中河流長(zhǎng)度大于10km或流域面積大于20km2的河流共27條,屬山區(qū)雨源性河流,侵蝕作用較強(qiáng)烈。區(qū)內(nèi)突發(fā)性地質(zhì)災(zāi)害類(lèi)型有滑坡、崩塌、泥石流、地面塌陷等,其中滑坡最為突出,且造成的危害最大。
圖1 研究區(qū)地理位置及概況
研究數(shù)據(jù)包括滑坡數(shù)據(jù)和各環(huán)境因子數(shù)據(jù),其中滑坡數(shù)據(jù)、年平均降雨量數(shù)據(jù)來(lái)源于中國(guó)科學(xué)院資源環(huán)境科學(xué)與數(shù)據(jù)中心(https://www.resdc.cn);DEM數(shù)據(jù)和衛(wèi)星影像數(shù)據(jù)取自地理空間數(shù)據(jù)云(https://www.gscloud.cn),在DEM基礎(chǔ)上提取了高程、坡度和坡向,NDVI是通過(guò)ENVI5.3軟件對(duì)衛(wèi)星影像處理得到;地質(zhì)數(shù)據(jù)取自國(guó)家地質(zhì)資料數(shù)據(jù)中心(https://www.ngac.org.cn)1:250萬(wàn)中國(guó)地質(zhì)圖,包括巖性和斷層分布數(shù)據(jù),將巖性按照?qǐng)?jiān)硬程度劃分為堅(jiān)硬巖、較堅(jiān)硬巖、較堅(jiān)硬巖夾軟巖和軟巖,另外計(jì)算斷層的歐氏距離得到距斷層距離數(shù)據(jù);土地利用數(shù)據(jù)來(lái)源于GlobeLand30數(shù)據(jù)集(http://www.globallandcover.com);水系和道路分布數(shù)據(jù)取自全國(guó)地理信息資源目錄服務(wù)系統(tǒng)(https://www.webmap.cn),通過(guò)計(jì)算道路和水系的歐氏距離得到距道路距離和距水系道路數(shù)據(jù)。
望謨縣滑坡易發(fā)性評(píng)價(jià)技術(shù)路線如圖2所示。通過(guò)ArcGIS軟件的裁剪、投影和重采樣等功能模塊,將各環(huán)境因子的投影坐標(biāo)統(tǒng)一為WGS_1984_UTM_48N,柵格大小設(shè)置為30m×30m;從滑坡數(shù)據(jù)庫(kù)中隨機(jī)選取2/3的樣本點(diǎn)作為訓(xùn)練樣本,和環(huán)境因子共同參與各模型的訓(xùn)練,剩余1/3的樣本點(diǎn)作為驗(yàn)證樣本對(duì)各模型的精度進(jìn)行檢驗(yàn)。
圖2 技術(shù)路線
滑坡災(zāi)害的發(fā)生受多種環(huán)境因素共同作用的影響,本文綜合地形地貌、基礎(chǔ)地質(zhì)、水文氣象、工程活動(dòng)等因素,選取高程、坡度、坡向、NDVI、地層巖性、距斷層距離、距水系距離、年平均降雨量、土地利用和距道路距離共10個(gè)環(huán)境因子作為評(píng)價(jià)指標(biāo),如圖3所示。
圖3 環(huán)境因子
對(duì)于離散型的環(huán)境因子,采用固有的自然分組進(jìn)行分級(jí),對(duì)于連續(xù)型的環(huán)境因子,采用等步長(zhǎng)進(jìn)行分級(jí)。在ArcGIS中使用多值提取至點(diǎn)工具將環(huán)境因子數(shù)值提取到滑坡訓(xùn)練樣本上,再通過(guò)公式(4)和公式(5)求出各分級(jí)狀態(tài)下的信息量值和確定性系數(shù)值,如表1所示。
表1 各環(huán)境因子分級(jí)和結(jié)果值
為了保證各環(huán)境因子間的相互獨(dú)立性和評(píng)價(jià)結(jié)果的可靠性,運(yùn)用GIS主成分分析功能,進(jìn)行因子獨(dú)立性檢驗(yàn),各因子之間的相關(guān)系數(shù)矩陣見(jiàn)表2(X1~X10分別表示土地利用、高程、地層巖性、坡度、坡向、距斷層距離、距水系距離、距道路距離、NDVI、年平均降雨量)。根據(jù)金勇進(jìn)[20]對(duì)相關(guān)性大小的劃分標(biāo)準(zhǔn),當(dāng)R小于0.3時(shí),認(rèn)為各因子之間不相關(guān)。如表2所示,各環(huán)境因子相關(guān)性均符合獨(dú)立性檢驗(yàn)。
表2 環(huán)境因子間的相關(guān)系數(shù)矩陣
在GIS平臺(tái)分別將各環(huán)境因子的信息量值、CF值進(jìn)行疊加,得到滑坡信息量值分布圖、滑坡CF值分布圖;將各環(huán)境因子圖層和滑坡訓(xùn)練樣本導(dǎo)入到MaxEnt軟件中,得到基于MaxEnt模型的滑坡易發(fā)性概率分布圖;分別將各環(huán)境因子的信息量值、CF值和滑坡訓(xùn)練樣本導(dǎo)入到MaxEnt軟件中,得到基于I-MaxEnt模型、CF-MaxEnt模型的滑坡易發(fā)性概率分布圖;然后將上述分布圖根據(jù)自然斷點(diǎn)法劃分為5個(gè)易發(fā)區(qū):高易發(fā)區(qū)、中高易發(fā)區(qū)、中易發(fā)區(qū)、中低易發(fā)區(qū)、低易發(fā)區(qū),最終得到各模型滑坡易發(fā)性區(qū)劃,如圖4所示。
圖4 各模型ROC曲線
頻率比即滑坡比與分級(jí)比的比值,用以輔助判斷分類(lèi)級(jí)別內(nèi)滑坡易發(fā)性程度。頻率比越大,易發(fā)性程度越高,反之則越低。將易發(fā)性區(qū)劃圖和滑坡驗(yàn)證樣本進(jìn)行疊加分析,具體結(jié)果如表3所示。I模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級(jí)比共占15.86%,滑坡比共占52.39%,CF模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級(jí)比共占16.05%,滑坡比共占51.39%,MaxEnt模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級(jí)比共占22.93%,滑坡比共占46.84%,I-MaxEnt模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級(jí)比共占19.43%,滑坡比共占73.59%,CF-MaxEnt模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級(jí)比共占18.66%,滑坡比共占73.26%。5種模型的頻率比值從低易發(fā)區(qū)到高易發(fā)區(qū)均在增大,說(shuō)明各模型的評(píng)價(jià)結(jié)果與實(shí)際相符;其中耦合模型在高易發(fā)區(qū)的頻率比顯著大于單一模型對(duì)應(yīng)的頻率比,即耦合模型在高易發(fā)區(qū)中包含了更多的滑坡信息,因而能更加有效地評(píng)價(jià)望謨縣的滑坡易發(fā)性。
表3 各模型不同易發(fā)區(qū)比值
目前認(rèn)可度較高的模型評(píng)價(jià)指標(biāo)為受試者工作特征(ROC)曲線,其縱軸為真陽(yáng)性率(靈敏度),即實(shí)際上是滑坡災(zāi)害且模型判斷為滑坡災(zāi)害的概率;其橫軸為假陽(yáng)性率(特異度),即實(shí)際上非滑坡災(zāi)害且模型判斷為非滑坡災(zāi)害的概率。ROC曲線下面積為AUC值,AUC值介于0~1范圍,其越接近1,模型預(yù)測(cè)效果越好,在0.5~0.6、0.6~0.7、0.7~0.8、0.8~0.9、0.9~1.0時(shí)分別表示預(yù)測(cè)效果失敗、較差、一般、好、特別好。由圖5可知,MaxEnt、I、CF、IMaxEnt和CF-MaxEnt的AUC評(píng)價(jià)精度分別為0.750、0.766、0.762、0.859和0.861,其中I-MaxEnt和CF-MaxEnt耦合模型精度優(yōu)于單一的I、CF、MaxEnt模型精度,且預(yù)測(cè)效果達(dá)到“好”的水平,這表明MaxEnt與多模型耦合的方法適用于望謨縣的滑坡易發(fā)性評(píng)價(jià)研究。
本文以望謨縣為研究區(qū),選取了高程、坡度、坡向、NDVI、地層巖性、距斷層距離、距水系距離、年平均降雨量、土地利用和距道路距離共10個(gè)環(huán)境因子,分別采用信息量模型(I)、確定性系數(shù)模型(CF)、最大熵模型(MaxEnt)以及耦合模型建立相應(yīng)的滑坡易發(fā)性區(qū)劃。
通過(guò)受試者工作特征(ROC)曲線檢驗(yàn)各模型精度,MaxEnt、I、CF、I-MaxEnt和CF-MaxEnt的AUC評(píng) 價(jià) 精 度 分 別 為0.750、0.766、0.762、0.859和0.861,耦合模型的預(yù)測(cè)精度明顯優(yōu)于單一模型,其中確定性系數(shù)-最大熵耦合模型(CF-MaxEnt)預(yù)測(cè)效果相對(duì)較好。
本文考慮的環(huán)境因子未必全部表達(dá)望謨縣的環(huán)境特征,添加更多環(huán)境因子參與模型構(gòu)建可能會(huì)提高評(píng)價(jià)的精度,另外,本文提出的易發(fā)性評(píng)價(jià)模型也許并非最佳,需要再增加其他評(píng)價(jià)模型進(jìn)行對(duì)比分析,這些將在后續(xù)研究中做進(jìn)一步探討。