于建洲 袁 穎
(石家莊經(jīng)濟(jì)學(xué)院勘查技術(shù)與工程學(xué)院,河北 石家莊 050031)
基于支持向量機(jī)的泥石流危險(xiǎn)性評(píng)價(jià)★
于建洲 袁 穎
(石家莊經(jīng)濟(jì)學(xué)院勘查技術(shù)與工程學(xué)院,河北 石家莊 050031)
采用支持向量機(jī)的計(jì)算方法,對(duì)云南省7個(gè)樣本集的評(píng)價(jià)指標(biāo)數(shù)據(jù)和目標(biāo)值進(jìn)行了分組訓(xùn)練和測(cè)試,建立了泥石流危險(xiǎn)性評(píng)價(jià)模型,達(dá)到了較明顯效果,指出該方法在泥石流危險(xiǎn)度劃分中具有較好的利用價(jià)值。
泥石流,支持向量機(jī),危險(xiǎn)性評(píng)價(jià)
泥石流是一種常見(jiàn)的山區(qū)地質(zhì)災(zāi)害,具有突然爆發(fā)、能量大、來(lái)勢(shì)兇猛、破壞力極強(qiáng)的特點(diǎn),常瞬間就能淹沒(méi)村莊、農(nóng)田,沖毀道路橋梁等建筑物,給山區(qū)人民生命安全、經(jīng)濟(jì)發(fā)展和建筑交通造成極大威脅和損害。因此,泥石流危險(xiǎn)性評(píng)價(jià)在土地應(yīng)用、城鎮(zhèn)規(guī)劃道路選線等減災(zāi)預(yù)案中都具有重要作用[1]。
泥石流危險(xiǎn)性評(píng)價(jià)是根據(jù)泥石流危險(xiǎn)度劃分出各區(qū)域(或單溝)泥石流危險(xiǎn)等級(jí)的方法,其本質(zhì)屬于模式識(shí)別問(wèn)題[2]。泥石流危險(xiǎn)性評(píng)價(jià)現(xiàn)在常用神經(jīng)網(wǎng)絡(luò)的方法[3],神經(jīng)網(wǎng)絡(luò)方法需要大樣本作為基礎(chǔ),而大量泥石流數(shù)據(jù)的采集存在一定困難。本項(xiàng)目引入支持向量機(jī)的方法進(jìn)行泥石流的危險(xiǎn)性評(píng)價(jià)。支持向量機(jī)是一種機(jī)器學(xué)習(xí)算法,可以有效的解決小樣本、非線性及高維模式識(shí)別問(wèn)題[4]。
支持向量機(jī)的主要特征是引入了結(jié)構(gòu)風(fēng)險(xiǎn)最小化代替了經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,核心思想是把數(shù)據(jù)非線性映射到高維核空間,在核空間構(gòu)造具有低VC維的最優(yōu)分類超平面[4-6]。以二分類數(shù)據(jù)為例,對(duì)于給定的訓(xùn)練樣本:(xi,yi),i=1,2,…,l,x∈Rn,y∈{±1},超平面記為(w,x)+b=0,為使分類面對(duì)所有樣本正確分類且具備分類間隔,就要求滿足如下約束:
yi[(w·xi)+b]≥1(i=1,2,…,l)。
可以計(jì)算出分類間隔為2/‖w‖,因此構(gòu)造最優(yōu)超平面的問(wèn)題就轉(zhuǎn)化為在約束條件下求:
引入Lagrange函數(shù):
其中,ai>0為L(zhǎng)anrange乘數(shù),則xi為支持向量,得到它的對(duì)偶問(wèn)題:
計(jì)算最優(yōu)權(quán)值向量w*和最優(yōu)偏置b*,分別為:
構(gòu)造超平面(w*·x)+b*=0,由此可得最優(yōu)分類函數(shù)為:
f(x)=sgn{(w*·x)+b*}=
核函數(shù)是支持向量機(jī)應(yīng)用研究的關(guān)鍵,直接決定最終的效率和性能。支持向量機(jī)大多數(shù)是非線性的,不同的核函數(shù)有其自身的特性,本論文借鑒了原立峰等[7]的研究成果,選用RBF徑向基函數(shù),其具有較強(qiáng)的非線性映射能力,應(yīng)用極為廣泛。
2.1 評(píng)價(jià)指標(biāo)
泥石流溝巖性及構(gòu)造特征的復(fù)雜性,決定了影響泥石流危險(xiǎn)性的評(píng)價(jià)因子很多,劉希林等[8]對(duì)泥石流影響因子作出分析,根據(jù)其在危險(xiǎn)度判定中起主導(dǎo)作用還是輔助作用分為主要因子和次要因子,通過(guò)灰色關(guān)聯(lián)度分析,最終得出一次泥石流(可能)最大沖出量(L1)、泥石流發(fā)生頻率(L2)為主導(dǎo)因子,流域面積(S1)、主溝長(zhǎng)度(S2)、流域最大相對(duì)高差(S3)、流域切割密度(S6)、泥砂補(bǔ)給段長(zhǎng)度比(S9)為輔助因子。
2.2 建立模型
本次研究選取文獻(xiàn)[8]中云南省37條溝的259個(gè)數(shù)據(jù)為基礎(chǔ),根據(jù)文獻(xiàn)[7]原立峰等對(duì)其做出的評(píng)價(jià)數(shù)據(jù),將泥石流危險(xiǎn)度的評(píng)價(jià)結(jié)果分為:輕度危險(xiǎn)、中度危險(xiǎn)、高度危險(xiǎn)和極度危險(xiǎn)4類(分別用1,2,3,4表示),通過(guò)上述因子評(píng)價(jià)泥石流的危險(xiǎn)性。
本文中使用了 LIBSVM 相關(guān)工具包[9],從37個(gè)樣本中剔除6個(gè)樣本(包括1大箐溝、5黃龍山溝、16王官屯溝、20花溝、23蔣家溝、37白泥溝,保證每個(gè)地區(qū)有一個(gè)樣本代表)作為訓(xùn)練樣本,而剔除的部分作為測(cè)試樣本,分別對(duì)原始數(shù)據(jù)進(jìn)行(0,1)歸一化處理,支持向量機(jī)核函數(shù)選用徑向基(RBF),采用交叉驗(yàn)證法進(jìn)行網(wǎng)格搜索尋找最優(yōu)參數(shù)值,最終選取了懲罰因子c=4,核參數(shù)g=0.015 625,結(jié)果顯示能夠?qū)τ?xùn)練樣本和測(cè)試樣本準(zhǔn)確分類。
為測(cè)試上述所建立模型的推廣性,又采用黃河上游積石峽水電站庫(kù)區(qū)16條泥石流溝[10]數(shù)據(jù)進(jìn)行了驗(yàn)證,采用原始的c,g值,測(cè)試結(jié)果顯示16條溝中僅有5條測(cè)試準(zhǔn)確,而我們采用其他優(yōu)化算法確定的c,g值進(jìn)行預(yù)測(cè),也只有6條準(zhǔn)確。當(dāng)我們將黃河的部分?jǐn)?shù)據(jù)加入到樣本數(shù)據(jù)集進(jìn)行重新訓(xùn)練并作預(yù)測(cè)時(shí),發(fā)現(xiàn)有12條溝測(cè)試準(zhǔn)確,識(shí)別率提高到75%,此時(shí)c=512,g=1。這說(shuō)明即使SVM模型對(duì)云南省37條溝的數(shù)據(jù)計(jì)算很準(zhǔn),但其推廣和運(yùn)用能力依然不能識(shí)別黃河上游積石峽水電站庫(kù)區(qū)16條泥石流溝,需要添加更多的待識(shí)別區(qū)域的樣本數(shù)據(jù)才能使建設(shè)的SVM具有更好地推廣性和正確的識(shí)別效果,調(diào)整后的預(yù)測(cè)結(jié)果見(jiàn)表1。
表1 黃河上游積石峽水電站庫(kù)區(qū)16條泥石流溝預(yù)測(cè)結(jié)果
支持向量機(jī)作為一種新型基于數(shù)據(jù)統(tǒng)計(jì)學(xué)習(xí)的機(jī)器算法,在本文的研究中運(yùn)用泥石流溝的7個(gè)影響因子較有成效的解決了小樣本的泥石流危險(xiǎn)度評(píng)價(jià)問(wèn)題,同時(shí)也對(duì)泥石流的防治提出了工程性等級(jí)要求。
由于本次研究訓(xùn)練樣本僅31條,各樣本的危險(xiǎn)性等級(jí)分布不均勻,評(píng)價(jià)模型并未達(dá)最優(yōu)水平,所以評(píng)價(jià)結(jié)果也存在不足。但筆者相信在今后可通過(guò)相應(yīng)的改進(jìn)與調(diào)試建立更好的SVM預(yù)測(cè)模型,使其適用于滑坡、崩塌等地質(zhì)災(zāi)害的預(yù)測(cè)和評(píng)判。
[1] 王偉奇.中國(guó)泥石流現(xiàn)狀及淺析[J].科技信息,2009(29):597,745.
[2] 李秀珍,孔紀(jì)名,李朝鳳.多分類支持向量機(jī)在泥石流危險(xiǎn)性區(qū)劃中的應(yīng)用[J].水土保持通報(bào),2010(5):128-133,157.
[3] 劉涌江,胡厚田,白志勇.泥石流危險(xiǎn)度評(píng)價(jià)的神經(jīng)網(wǎng)絡(luò)法[J].地質(zhì)與勘探,2001,37(2):84- 87.
[4] 丁世飛,齊丙娟,譚紅艷.支持向量機(jī)理論與算法研究綜述[J].電子科技大學(xué)學(xué)報(bào),2011(1):2-10.
[5] 白 鵬,張喜斌.支持向量機(jī)理論及工程應(yīng)用實(shí)例[M].西安:西安電子科技大學(xué)出版社,2008.
[6] 張 蓉.基于支持向量機(jī)的泥石流危險(xiǎn)性預(yù)測(cè)[J].信息與電腦(理論版),2012(12):29-31.
[7] 原立峰,周啟剛,馬澤忠.支持向量機(jī)在泥石流危險(xiǎn)度評(píng)價(jià)中的應(yīng)用研究[J].中國(guó)地質(zhì)災(zāi)害與防治學(xué)報(bào),2007(4):29-33,39.
[8] 劉希林,唐 川.泥石流危險(xiǎn)性評(píng)價(jià)[M].北京:科學(xué)出版社,1995:15-26.
[9] 任金龍.基于支持向量的鐵路泥石流危險(xiǎn)性評(píng)價(jià)方法研究[D].成都:西南交通大學(xué),2011.
[10] 胡亞?wèn)|,傅榮華,夏克勤.黃河積石峽水電站庫(kù)區(qū)泥石流危險(xiǎn)度評(píng)價(jià)[J].災(zāi)害學(xué),2004,19(2):36- 41.
Debris flow risk evaluation on the basis of SVM★
YU Jian-zhou YUAN Ying
(College of Survey Technology and Engineering, Shijiazhuang College of Economy, Shijiazhuang 050031, China)
The paper adopts SVM methods, trains and tests 7 samples’ evaluation index data and target value in Yunnan, establishes debris flow risk evaluation model, achieves obvious effect, and finally points out that: the method has better using value in debris flow risk assessment.
debris flow, SVM(Support Vector Machine), risk evaluation
1009-6825(2014)36-0041-02
2014-10-20 ★:石家莊經(jīng)濟(jì)學(xué)院學(xué)生科技基金科研重點(diǎn)項(xiàng)目(項(xiàng)目編號(hào):KBG201402)
于建洲(1992- ),男,在讀本科生; 袁 穎(1976- ),男,副教授
P642.23
A