姜禮濤,周愛紅,2,袁 穎,2,劉育林,寧志杰,牛建廣
(1.河北地質(zhì)大學(xué) 城市地質(zhì)與工程學(xué)院,河北 石家莊 050031;2.河北省地下人工環(huán)境智慧開發(fā)與管控技術(shù)創(chuàng)新中心,河北 石家莊 050031)
砂土液化是指在震動作用下,砂土顆粒喪失接觸壓力與摩擦力,進而喪失強度和剛度的區(qū)域性地質(zhì)災(zāi)害[1-2]。砂土液化不僅會引發(fā)地面沉降、坡體側(cè)滑、管涌流沙等災(zāi)害,還會導(dǎo)致建筑物下沉、歪斜和毀壞,甚至使地下結(jié)構(gòu)浮升到地面。因此建立合理的砂土液化預(yù)測模型,對砂土液化的防治工作具有重大的現(xiàn)實意義[3-4]。
由于砂土液化災(zāi)害的成因機理復(fù)雜、影響因素眾多,并且影響因素與砂土液化間具有極強的不確定性及模糊性,使影響因素預(yù)處理手段與人工智能方法相結(jié)合的方法在砂土液化判別工作中得到了廣泛的應(yīng)用。王帥偉等[5]建立了基于粗糙集(Rough Set,RS)-主成分分析(Principle Component Analysis,PCA)-遺傳算法(Genetic Algorithm,GA)-SVM的砂土液化預(yù)測模型,判別結(jié)果與實際結(jié)果基本吻合;孫偉超等[6]建立的PCA-Levenberg-Marquardt(LM)算法-BP(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)砂土液化模型預(yù)測結(jié)果準確性高,滿足實際工程的需要;毛志勇等[7]建立的粒子群算法(Particle Swarm Optimization,PSO)優(yōu)化SVM的砂土液化模型分類效果較好、建模效率高;宮鳳強等[8]建立的主成分分析與距離判別分析(Distance Discriminant Analysis,DDA)相結(jié)合的砂土液化模型分類結(jié)果準確率高,判別結(jié)果與實際情況一致;杜星等[9]建立的多層感知器 (Multiplayer Perceptron,MPL) 神經(jīng)網(wǎng)絡(luò)砂土液化判別模型,準確地對地震作用下砂土的液化狀態(tài)進行了評估與預(yù)測。雖然上述方法均取得了不錯的應(yīng)用效果,但BP神經(jīng)網(wǎng)絡(luò)模型受網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù)設(shè)置影響較大,PCA提取的主成分并不具有實際的物理意義,RS只能處理離散型數(shù)據(jù),離散化處理連續(xù)型數(shù)據(jù)后會改變數(shù)據(jù)原始的屬性性質(zhì)導(dǎo)致信息缺失,PSO和GA等優(yōu)化算法所得最優(yōu)參數(shù)值并不唯一,這極大的限制了砂土液化模型的建模效率與普適性。因此為科學(xué)判別砂土的液化狀態(tài),還要探索更加合理精準的預(yù)測方法。
經(jīng)閱讀文獻,發(fā)現(xiàn)SVM適用于解決小樣本、非線性和高維度等問題[10-11],ISSA有更好的尋優(yōu)精度、收斂性能和穩(wěn)定性[12],鄰域粗糙集可以有效處理數(shù)值型屬性的數(shù)據(jù)集合[13-14]。鑒于此,本文以文獻[15]中吉林松原地區(qū)的42組實例為樣本,砂土液化的影響因素為依據(jù),引入NRS理論和ISSA算法進行因素約簡與參數(shù)優(yōu)化,基于訓(xùn)練集(35組實例)建立NRS-ISSA-SVM的砂土液化預(yù)測模型。用該模型對測試集(5組實例)的狀態(tài)進行判別,并將判別結(jié)果與NRS-SSA-SVM和NRS-SVM模型對比,以期為砂土液化判別提供一種高效準確的新方法。
麻雀搜索算法(Sparrow Search Algorithm,SSA)是根據(jù)麻雀覓食和反捕食行為而提出的群智能優(yōu)化算法。該算法主要模擬麻雀群覓食過程,將麻雀種群劃分為發(fā)現(xiàn)者(種群找到食物較好的個體)和跟隨者(種群的其他個體)的同時,增加了偵查預(yù)警機制(意識到存在捕食者的個體),如果發(fā)現(xiàn)危險以安全為主,重新搜索食物源。種群中發(fā)現(xiàn)者位置更新,跟隨者位置更新以及偵查預(yù)警行為分別按下式進行:
(1)
式中:t為迭代次數(shù);itermax為最大迭代次數(shù);Xi,j代表第i個麻雀在第j維的位置信息;α∈(0,1]是一個隨機數(shù);Q為服從正態(tài)分布的隨機數(shù);L為元素值為1的d維列向量;R2(R2∈[0,1])和ST(ST∈[0.5,1])分別為預(yù)警值和安全值。
(2)
式中:XP為發(fā)現(xiàn)者所處最佳位置;Xworst表示發(fā)現(xiàn)者所處最差位置;A為元素值為1或-1的d維列向量,并且A+=AT(AAT)-1。
(3)
式中:Xbest表示覓食區(qū)最優(yōu)位置;β服從正態(tài)分布隨機數(shù);K∈[-1,1]二者為步長控制參數(shù);fi為麻雀個體的適應(yīng)度值;fg、fw分別為全局最佳和最差適應(yīng)度值。
多策略融合的改進麻雀搜索算法(ISSA)是針對基本麻雀算法收斂性能差、易陷入局部極小最優(yōu)等問題而提出的改進算法。其改進主要體現(xiàn)在:采用立方混沌映射[16]對麻雀種群進行初始化,增強其隨機性和規(guī)律性,采用透鏡成像反向?qū)W習方法[17]提升麻雀個體質(zhì)量,精英化初始種群。采用雞群優(yōu)化算法[18]中的隨機策略改進跟隨者位置更新方式,以及采用柯西-高斯變異策略[19]對最佳麻雀個體進行變異,提升算法全局搜索能力。
支持向量機的基本思想是通過某種事先確定的非線性映射將輸入X映射到一個高維特征空間,在這個空間中構(gòu)造最優(yōu)分類超平面,從而使不同樣本之間的分離界限達到最大。在以徑向基核函數(shù)(Radial Basis Function,RBF)為核函數(shù)的非線性SVM模型中,懲罰參數(shù)C和RBF中的超參數(shù)g值改變影響決策邊界的間隔的大小,進而影響SVM模型的性能。因此,為提升SVM模型的性能,引入ISSA算法獲取最佳參數(shù)C和g值。具體流程如圖1,圖中輸入為m個實例組成的訓(xùn)練樣本集X=[X1,X2,…,Xj,…,Xm]
圖1 ISSA-SVM算法流程Fig.1 ISSA-SVM algorithm flow
樣本Xj=[xj1,xj2,…,xjn,yj],(j=1,2,…,m),由n個影響因素xjn和1個液化狀態(tài)yi組成,yi∈Y為表示砂土液化狀態(tài)的列向量。
胡清華等[20]針對經(jīng)典粗糙集理論離散化連續(xù)數(shù)值型數(shù)據(jù)時,不同離散化策略結(jié)果存在差異的問題,基于鄰域系統(tǒng)的概念對經(jīng)典粗糙集理論進行延拓提出了鄰域粗糙集理論。作為一種處理不確定性和模糊性的數(shù)學(xué)工具,其不僅可以在處理混合型數(shù)據(jù)時保留原始數(shù)據(jù)中的大量關(guān)鍵信息,還可以高效準確的實現(xiàn)屬性約簡。相關(guān)定義如下:
定義1對n個屬性的分類問題,給定論域U={x1,x2,…,xn},A為砂土液化影響因素 (實數(shù)型集合),D為砂土液化狀態(tài)(決策屬性集合),則稱NDT=〈U,A,D〉為一鄰域決策系統(tǒng)。
定義2給定xi∈U,則有
δB(xi)={xj|xj∈U,ΔB(xi,xj)≤δ}
(4)
式中:Δ為符合某種規(guī)則的距離函數(shù);δ為鄰域;B為條件屬性。
定義3構(gòu)建鄰域決策系統(tǒng)NDT=〈U,A,D〉,決策屬性D將論域U劃分為N個等價類(X1,X2,…,XN),對任意屬性B?A,則決策屬性D關(guān)于子集B的上、下近似分別為
(5)
(6)
其中,
(7)
(8)
同樣可得決策系統(tǒng)邊界為
(9)
鄰域決策系統(tǒng)的正、負域分別為
(10)
(11)
由此可得決策屬性D對條件屬性B的依賴度為
(12)
定義4給定鄰域決策系統(tǒng)NDT,B?A,對任意的a?B-A,{a}為屬性a,定義a對B的重要度為
Sig(a,B,D)=γB∪{a}(D)-γB(D)
(13)
定義5給定鄰域決策系統(tǒng)NDT,a∈B?A,稱B是A的一個約簡,則B要滿足
(1) 任意的α∈B,皆有γB-{a}(D)<γB(D)
(2)γB(D)<γA(D)
砂土液化受到土質(zhì)條件、埋藏條件、動力條件等眾多因素的影響,結(jié)合松原地區(qū)的砂土液化的實際情況,選取反映土體土質(zhì)條件的標準貫入擊數(shù)、平均粒徑、不均勻系數(shù)、黏粒含量和反映水土埋藏條件的地下水埋深、液化層厚度、上覆非液化土層厚度以及反映土體動力特性的地震烈度和地震加速度作為砂土液化的判別指標。從42組實例中隨機挑選了35組作為訓(xùn)練樣本(表1),剩余7組作為預(yù)測樣本(表2),其中不液化、輕微液化、中等液化和嚴重液化,分別用1,2,3,4表示。
表1 訓(xùn)練樣本Table 1 Training samples
表2 預(yù)測樣本Table 2 Predicting samples
以選取的判別指標(標準貫入擊數(shù)x1、地震加速度x2、水位埋深x3、非液化土層厚度x4、液化土層厚度x5、黏粒含量x6、平均粒徑x7及不均勻系數(shù)x8和地震烈度x9)作為鄰域粗糙集的屬性值,砂土液化狀態(tài)作為決策屬性。根據(jù)NRS因素約簡策略,分別計算決策屬性對屬性集合的依賴度及各屬性在屬性集合中對決策屬性的重要度。通過判斷屬性重要度是否大于零而得出約簡集合,剔除冗余屬性,保留對砂土液化影響較大的因素。圖2為各因素對砂土液化狀態(tài)的重要度,可知:標準貫入擊數(shù)x1、水位埋深x3、非液化土層厚度x4和地震烈度x9的重要度大于0,因此,選其作為砂土液化判別模型的評價指標。重要度按由大到小排序為水位埋深、地震烈度、標準貫入擊數(shù)和非液化土層厚度,并且水位埋深重要度遠遠高于其余三個因素。
圖2 各因素對砂土液化狀態(tài)的重要度Fig.2 Importance of various factors on liquefaction state of sand
在《建筑抗震設(shè)計規(guī)范(GB 50011—2010)》[21]中,采用非液化土層厚度和水位埋深、地震烈度或黏粒含量、平均粒徑以及地震烈度,對砂土是否液化進行初判。以水位埋深、黏粒含量與地震加速度作為基本參數(shù),采用標準貫入試驗判別法對初判結(jié)果進一步的液化判別,最后把標準貫入擊數(shù)和土層厚度作為基本參數(shù)對液化等級進行劃分。因此,標準貫入擊數(shù)、地震加速度、水位埋深、非液化土層厚度、液化土層厚度、黏粒含量、平均粒徑及地震烈度都可作為判別砂土液化的重要因素,但都是選取其中幾個因素來對砂土進行液化判別,當同時選取上述因素作為判別指標時,難免會出現(xiàn)信息重疊現(xiàn)象,比如標準貫入擊數(shù)可以用來推斷砂土密實度、均勻性等特征,可替代黏粒含量、平均粒徑及不均勻系數(shù)等因素對液化土的影響;地震烈度可以反映地震加速度,地震烈度越高,地面加速度越大,就越容易發(fā)生液化等。由此可知,NRS因素約簡結(jié)果較為合理。
從數(shù)據(jù)分布方面,分析不同液化狀態(tài)下各影響因素的平均值與方差來判斷約簡結(jié)果是否合理(表3)。其中地震加速度與地震烈度為離散型數(shù)據(jù),不同液化狀態(tài)所對應(yīng)的影響因素取值唯一時,對液化狀態(tài)的判別更加有利,由方差可知,液化狀態(tài)不同時,各液化狀態(tài)下的地震加速度值取值不唯一,地震烈度取值唯一,因此以地震烈度作為評價指標較為合理;其余因素都為連續(xù)型數(shù)據(jù),各影響因素平均值隨液化狀態(tài)的變化呈現(xiàn)出遞增或遞減的趨勢時,對液化狀態(tài)的判別更加有利,標準貫入擊數(shù)、地下水埋深和非液化土層厚度等因素的平均值變化呈現(xiàn)出一定的趨勢,且方差較小的數(shù)據(jù)更集中的分布在平均值附近,數(shù)據(jù)波動較小,而液化土層厚度、黏粒含量、平均粒徑和不均勻系數(shù)等因素規(guī)律性變化趨勢不明顯,且部分指標方差較大,數(shù)據(jù)分布相對分散,因此選取標準貫入擊數(shù)、地下水埋深和非液化土層厚度作為評價指標相對合理。
表3 不同液化狀態(tài)下影響因素的平均值與方差Table 3 Average value and variance of influencing factors under different liquefaction states
綜上所述,選取反映土體土質(zhì)條件的標準貫入擊數(shù)、水土埋藏條件的水位埋深、非液化土層厚度以及土體動力特性的地震烈度作為砂土液化判別模型的評價指標。
本文以NRS因素約簡得到的標準貫入擊數(shù)x1、水位埋深x3、非液化土層厚度x4和地震烈度x9作為輸入,砂土液化狀態(tài)作為輸出,分別利用ISSA算法和SSA算法對懲罰參數(shù)C與核函數(shù)參數(shù)g進行搜索,其參數(shù)尋優(yōu)過程如圖3和圖4所示,將訓(xùn)練樣本代入該模型進行回歸仿真訓(xùn)練,并將預(yù)測分類結(jié)果與真實結(jié)果進行對比,如圖5所示。
由圖3和圖4不難看出,相比于SSA算法,ISSA曲線能夠從初始迭代就開始收斂,并可以快速跳出極值最后使曲線保持平穩(wěn)狀態(tài),說明引入雞群優(yōu)化算法以及采用柯西-高斯變異策略使ISSA算法具有收斂速度快以及良好的局部極值逃逸性能。ISSA算法從初始迭代就取得了較好的適應(yīng)度值,最佳適應(yīng)度值相比于SSA算法變化小,說明引入立方混沌映射和透鏡成像反向?qū)W習方法可明顯提升初始種群個體質(zhì)量,使初始種群更快達到最優(yōu)解;所以使用ISSA算法能更好地優(yōu)化SVM模型。最終確定適用于吉林松原地區(qū)砂土液化判別的SVM模型的參數(shù)C=23.687 9、g=1.222 3,滿足優(yōu)化SVM模型參數(shù)C和g值的需要。由圖5可知,發(fā)生誤判的樣本編號為16、20和22。16、20號樣本發(fā)生誤判原因可能為其標準貫入擊數(shù)值接近第1類別的平均值,而其他影響因素的第1、2類別的值較為相近,所以造成其判別為第1類別。22號樣本因該等級樣本數(shù)量較少,而且其各指標值都與第4類別的平均值接近,所以造成判別其為第4類別;判別結(jié)果準確率可達94.3%,滿足實際工程要求,至此成功建立基于因素約簡與參數(shù)優(yōu)化的吉林松原地區(qū)砂土液化判別模型。此模型判斷該區(qū)域其他地點的砂土狀態(tài)時,只需要提供相應(yīng)的影響因素,該模型便可以通過建立好的映射關(guān)系,通過“自學(xué)習”方式,分析影響因素內(nèi)部的隱含聯(lián)系,進而判別砂土液化狀態(tài)。
圖3 ISSA算法參數(shù)尋優(yōu)Fig.3 ISSA algorithm parameter optimization
圖4 SSA算法參數(shù)尋優(yōu)Fig.4 Parameter optimization using SSA algorithm
圖5 訓(xùn)練樣本原始值和預(yù)測值對比圖Fig.5 Comparison between original and predicted values of training samples
根據(jù)上述模型,對測試集進行判別,同時為了增加說服力與可信性,本文還建立了SVM砂土液化判別模型進行對比。測試集的實際狀態(tài)和模型的判別結(jié)果見混淆矩陣圖6和圖7。
圖6 SVM測試集混淆矩陣Fig.6 SVM test set confusion matrix
圖7 ISSA-SVM測試集混淆矩陣Fig.7 Confusion matrix for ISSA-SVM test set
在混淆矩陣中,每一行中的數(shù)值之和代表該類別的真實樣本數(shù)量,每一列中的數(shù)值表示真實數(shù)據(jù)被預(yù)測為該類別的數(shù)量。其對角線位置代表模型預(yù)測正確的樣本數(shù)量,其他位置代表預(yù)測錯誤。由圖6可知,分布在對角線上有4個樣本,代表在預(yù)測的7個樣本中有4個樣本預(yù)測正確,其余三個預(yù)測錯誤,其中第1類別的樣本誤判為第2類,第3類別的樣本誤判為第2類,第4類別的樣本誤判為第3類,SVM模型判別正確率為57%。由圖7可以看出:7個樣本均分布在對角線上,說明7個樣本的預(yù)測值完全正確,ISSA-SVM模型判別正確率為100%,判別值與砂土實際狀態(tài)一致,能夠準確反映砂土的實際狀態(tài),這表明優(yōu)化算法能夠顯著提高模型的判別效果,ISSA-SVM模型的判別結(jié)果準確率明顯優(yōu)于SVM模型,建立的NRS-ISSA-SVM模型能夠適用于吉林松原地區(qū)的砂土液化判別工作。
為探討砂土液化對選取的判別因子的敏感性,為砂土液化判別提供更為可靠的理論依據(jù)。選取典型的回歸分析方法(regression analysis)[22]對砂土液化判別模型中選取的判別因子進行敏感性分析。
利用SPSS軟件,以判別因子作為自變量,砂土液化等級作為因變量進行多元線性回歸分析,采用逐步回歸法建立最優(yōu)的回歸方程。其具體含義為:未選入回歸方程的因子即為不敏感因子,選入回歸方程的因子即為敏感因子;標準回歸系數(shù)的絕對值代表了因子敏感性大小[23]。非液化土層厚度未選入回歸方程,為不敏感因子。其他因子的標準回歸系數(shù)計算結(jié)果列于表4。
表4 回歸系數(shù)表Table 4 Table of regression coefficients
由表4可知,回歸模型的決定系數(shù)R2為0.906,說明選入回歸的因子與液化等級之間有著較強的線性關(guān)系。各因子敏感性按標準回歸系數(shù)的絕對值大小排序為:地震烈度>地下水埋深>標準貫入擊數(shù)。非液化土層厚度為不敏感因子。
結(jié)合《建筑抗震設(shè)計規(guī)范(GB 50011—2010)》和吉林松原地區(qū)的鄰域粗糙集屬性約簡以及模型訓(xùn)練測試結(jié)果及因子敏感性分析結(jié)果,要判別場地的液化狀態(tài),建議準確查明水位埋深、地震烈度、標準貫入擊數(shù),非液化土層厚度這四個因素。尤其是前三個因素。
(1) 經(jīng)NRS約簡得到的水位埋深、地震烈度、非液化土層厚度和標準貫入擊數(shù)是影響吉林松原地區(qū)的砂土液化的重要因素。敏感性按大小排序為:地震烈度、地下水埋深、標準貫入擊數(shù)。非液化土層厚度為不敏感因子。
(2) NRS計算分析的是各因素和結(jié)果的量化數(shù)值,而不是影響因素本身,因素約簡所得指標在地質(zhì)力學(xué)領(lǐng)域存在局限,但是該方法能夠剔除因素間的交叉和冗余,降低了輸入的維數(shù)與計算量,提高了建模的效率,其因素約簡的結(jié)果仍是可靠的;ISSA算法全局搜索能力強、收斂速度快,能夠高效合理的確定SVM模型所需參數(shù),降低了參數(shù)選取的盲目性。
(3) 砂土影響因素眾多,且這些因素具有多維性和非線性的復(fù)雜關(guān)系,建立的NRS-ISSA-SVM砂土液化模型,合理地對吉林松原地區(qū)的砂土液化狀態(tài)做出了判別,相比于其他模型,表現(xiàn)出了優(yōu)秀的泛化能力與預(yù)測性能,為砂土液化的判別提供了新的手段。