李 金
(鐵道第三勘察設(shè)計院集團有限公司,天津 300142)
隧道圍巖具有以下特點:1)由于隧道巖體經(jīng)歷不同期次的構(gòu)造作用以及淺、表生作用,巖體中存在大量軟弱結(jié)構(gòu)面,從而使巖體具有各向異性、非均質(zhì)性[3]。2)隧道巖體通常賦存于地應(yīng)力、地下水等復(fù)雜地質(zhì)環(huán)境中,不同地應(yīng)力環(huán)境中巖體的力學(xué)響應(yīng)不同,而地下水滲流場和巖體應(yīng)力場二者耦合共同決定了巖體的復(fù)雜空間應(yīng)力狀態(tài)。3)隧道圍巖在施工中要經(jīng)歷開挖、爆破、卸荷、回填等工程處理,這些擾動使得圍巖的力學(xué)性質(zhì)表現(xiàn)出更加復(fù)雜的時間和空間形態(tài)。
綜上所述,隧道圍巖本質(zhì)上是一個非線性非平衡開放系統(tǒng),表現(xiàn)為結(jié)構(gòu)的無序、不穩(wěn)定、不平衡以及時空的不可逆和非對稱,從而使隧道圍巖的工程地質(zhì)性質(zhì)及其力學(xué)行為具有不確定性,面臨“參數(shù)給不準(zhǔn)”和“模型給不準(zhǔn)”兩大瓶頸問題,而這是傳統(tǒng)的基于經(jīng)驗的圍巖分級方法暫時無法解決的[4]。
面對隧道圍巖的高度復(fù)雜性和非線性特點,使得隧道圍巖穩(wěn)定性評價的確定性理論在準(zhǔn)確性和可靠性方面受到一定限制。而作為智能科學(xué)領(lǐng)域的支持向量機具有對高度非線性和復(fù)雜性系統(tǒng)無限逼近能力的優(yōu)點,使得支持向量機可以成為隧道圍巖分級的強有力工具。
支持向量機網(wǎng)絡(luò)(Support Vector Mochine)的數(shù)學(xué)理論基礎(chǔ)是統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原理,主要理論內(nèi)容是1995年由Vpnik提出的[3]。其基本思想就是通過事先選擇好的某一個非線性變換,將輸入向量映射到高維特征空間中,在特征空間中構(gòu)造一個最優(yōu)分類超平面,使不同類別之間的隔離邊緣最大化,而這個分類超平面由支持向量決定。支持向量機網(wǎng)絡(luò)模型的最大優(yōu)點是在有限樣本的情況下仍能得出精確的預(yù)測結(jié)果(見圖1)。
圖1 支持向量機分類模型示意圖
BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)的理論基礎(chǔ)都是傳統(tǒng)統(tǒng)計學(xué),只有在訓(xùn)練樣本數(shù)據(jù)足夠多甚至趨近于無窮大時,經(jīng)驗風(fēng)險才有可能趨近于期望風(fēng)險,但實際上訓(xùn)練樣本數(shù)據(jù)都是有限的,有時甚至是不足的,所以BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)經(jīng)常出現(xiàn)過學(xué)習(xí)現(xiàn)象,模型的泛化能力不高?;趥鹘y(tǒng)統(tǒng)計學(xué)理論的學(xué)習(xí)機器,如BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò),模型的泛化能力與樣本數(shù)目和研究系統(tǒng)的復(fù)雜性有關(guān),而且始終存在學(xué)習(xí)精度和泛化能力之間的矛盾。
建立基于支持向量機網(wǎng)絡(luò)的隧道圍巖分級模型,首要一步是建立起圍巖分級指標(biāo)體系并予以向量化。本文主要從隧道圍巖的巖塊強度、巖體結(jié)構(gòu)、巖體完整性、巖體受地質(zhì)構(gòu)造影響程度、巖體結(jié)構(gòu)面發(fā)育情況、控制性結(jié)構(gòu)面與隧道軸線的關(guān)系以及地下水狀態(tài)等方面建立分級指標(biāo)體系。
由于這些數(shù)據(jù)大部分都是定性的描述,為了建立定量模型的需要同時也要符合工程地質(zhì)分析的習(xí)慣,需要對分級指標(biāo)數(shù)據(jù)作定量化處理。具體操作方法是采用“1”和“0”的組合向量來分別表示某一工程地質(zhì)屬性的有無,如極硬巖可用(0,0,0,0,1)表示,硬巖可用(0,0,0,1,0)表示,較軟巖(0,0,1,0,0)表示,軟巖(0,1,0,0,0)表示,極軟巖(1,0,0,0,0)表示,其他分類指標(biāo)的定量化以此類推。
依據(jù)以上建立的圍巖分級指標(biāo)體系,在充分調(diào)研文獻資料和隧道施工設(shè)計資料的基礎(chǔ)上,收集整理了93組具有代表性的隧道圍巖分級數(shù)據(jù)作為基于人工神經(jīng)網(wǎng)絡(luò)的圍巖分級模型的樣本數(shù)據(jù),向量化后為93組44維數(shù)據(jù)。
由于定性數(shù)據(jù)的測量誤差較大,所以選定83組數(shù)據(jù)作為訓(xùn)練樣本建立分類模型,最后用10組數(shù)據(jù)作為預(yù)測樣本用來評價分級模型的分級準(zhǔn)確性。
最后需要指出的是,《英文漢詁》是中國第一本完全橫排的書,也是最早使用西方標(biāo)點符號的漢語制作,大大方便了學(xué)習(xí)者的閱讀。因此,全書視野之廣闊、內(nèi)容之豐富、解釋之詳盡、語言之平和,讓讀者深切感受到此書解釋的不再是單純、枯燥的語法,而是語法與人類經(jīng)驗的融合,深入貫徹了“答海內(nèi)學(xué)者之憤悱”這一指導(dǎo)思想。
1)核函數(shù)類型的選擇。
支持向量機網(wǎng)絡(luò)的核函數(shù)類型一般有線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)和Sigmoid核函數(shù)。研究表明核函數(shù)的選擇對支持向量機網(wǎng)絡(luò)的性能影響不大。但是選擇合適的核函數(shù)可以減小分類模型的計算量。綜合考慮核函數(shù)的核參數(shù)數(shù)目、特征空間的非線性變換以及維數(shù)災(zāi)難,最終選取高斯徑向基核函數(shù)。
2)核參數(shù)的選擇。
高斯徑向基核函數(shù)的核參數(shù)主要有中心向量和寬度系數(shù),支持向量機網(wǎng)絡(luò)模型要求解的支持向量就是中心向量,由算法自定選定;而寬度系數(shù)σ2表征神經(jīng)元的感知閾,影響改變樣本特征空間的復(fù)雜程度,過大過小都不合適而且與懲罰因子C共同決定分類模型的結(jié)構(gòu)風(fēng)險,本文通過網(wǎng)格搜索尋找最優(yōu)寬度系數(shù)和懲罰因子。
3)懲罰因子C的選擇。
懲罰因子C用來控制錯分樣本的懲罰程度,在錯分樣本的比例和模型算法復(fù)雜性二者之間尋求折中,其值大小最終影響分類預(yù)測模型的復(fù)雜程度。同樣,懲罰因子C的選擇也存在一個優(yōu)化問題,過大過小皆不合適,而且與寬度系數(shù)σ2共同決定分類模型的結(jié)構(gòu)風(fēng)險,需要對二者同時協(xié)調(diào)優(yōu)化,詳細(xì)過程見圖2。
圖2 支持向量機分類模型網(wǎng)格搜索參數(shù)對流程圖
4)數(shù)據(jù)的處理。
數(shù)據(jù)的處理包括對輸入數(shù)據(jù)的處理即前處理和輸出數(shù)據(jù)的處理即后處理。由于多分類支持向量機本是基于二分類支持向量機發(fā)展而成,所以本文支持向量機網(wǎng)絡(luò)模型的樣本數(shù)據(jù)采用1~5五個數(shù)字分別代表五個圍巖級別,而且不做歸一化處理。
基于以上所述,本文采用網(wǎng)格搜索法先粗搜后細(xì)搜,對寬度系數(shù)和合懲罰因子同時協(xié)調(diào)優(yōu)化,最終選擇寬度系數(shù)和合懲罰因子的最優(yōu)組合值作為分類模型的參數(shù)(見圖3),采用訓(xùn)練樣本數(shù)據(jù)的分類正確率和預(yù)測樣本的分類正確率分別表征網(wǎng)絡(luò)模型的經(jīng)驗誤差和泛化能力。
圖3 支持向量機搜索最佳參數(shù)示意圖
通過一系列優(yōu)化設(shè)計,最終確定:支持向量機網(wǎng)絡(luò)的核函數(shù)采用高斯徑向基核函數(shù),寬度系數(shù)取0.015 625,懲罰因子取181.019 3;樣本數(shù)據(jù)一共93個,訓(xùn)練數(shù)據(jù)83個,仿真預(yù)測數(shù)據(jù)10個。最終預(yù)測結(jié)果見表1和圖4。
表1 支持向量機分級模型預(yù)測結(jié)果
圖4 支持向量機神經(jīng)網(wǎng)絡(luò)分級模型預(yù)測結(jié)果與期望結(jié)果對比
通過上面的圍巖分級結(jié)果分析可知,支持向量機模型分級模型對10個預(yù)測樣本的分級正確率為90%,唯一一個誤判的是樣本89,將Ⅳ級誤判為Ⅲ級,但是誤差不超過一級;表明支持向量機模型基本能完全正確的進行圍巖分級。
支持向量機模型對圍巖分級結(jié)果能夠進行很好的預(yù)測,正確率達(dá)到90%,預(yù)測精度也基本滿意,收斂速度明顯變快。如何進一步對定量實測的工程地質(zhì)指標(biāo)進行建立分級模型是本文的不足,是以后需要進一步深入的工作。其次是擴散系數(shù)和懲罰系數(shù)需要通過不斷試算確定最優(yōu)值,雖然采用了粗細(xì)網(wǎng)格結(jié)合的搜索方法,但是仍然增加了建模時間,如何改進參數(shù)的尋優(yōu)方法也是接下來需要解決的問題。
[1] 馮夏庭.智能巖石力學(xué)導(dǎo)論[M].北京:科學(xué)出版社,2000.
[2] 杜時貴,周慶良.公路隧道圍巖定量分類系統(tǒng)研究設(shè)想和建議[J].西安公路交通大學(xué)學(xué)報,1996,16(4):32-37.
[3] 沈中其,關(guān)寶樹.鐵路隧道圍巖分級方法[M].成都:西南交通大學(xué)出版社,2000.
[4] Vapnik V.Statistical Learning Theory[M].Wiley,New Yorw,NY,1998.
[5] T Joachims.Making Large scale SVM Learning practical Proeeeding of advanced Kernel Methods Support Vector Learning[M].Cambridge,MA:MIT Press,1998.