牛鵬飛
(河北地質(zhì)大學(xué)勘查技術(shù)與工程學(xué)院,河北 石家莊 050011)
我國山區(qū)面積約占國土陸地面積70%。大量工程實(shí)踐表明,在山區(qū)公路工程建設(shè)中,不良邊坡體往往給公路工程的建設(shè)和維護(hù)帶來不可預(yù)知的風(fēng)險(xiǎn)。因此,進(jìn)行公路邊坡穩(wěn)定性評(píng)價(jià)具有重要意義。
公路邊坡形成發(fā)育過程十分復(fù)雜,影響邊坡穩(wěn)定性的因素眾多,各因素與邊坡穩(wěn)定性之間的關(guān)系是未知且非線性的,難以用一種簡單的數(shù)學(xué)模型準(zhǔn)確的反映出各因素之間的不確定、復(fù)雜關(guān)系。傳統(tǒng)定性方法[1-4]評(píng)價(jià)邊坡穩(wěn)定性具有一定主觀性,評(píng)價(jià)準(zhǔn)確率較低。近幾年,定量評(píng)價(jià)方法如BP 神經(jīng)網(wǎng)絡(luò)[5-7]、聚類分析法[8-9]、模糊綜合評(píng)判法[10-11]等對(duì)邊坡穩(wěn)定性評(píng)價(jià),取得一定成果,但也存在神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu)、聚類分析缺乏可比性、模糊評(píng)判結(jié)果出現(xiàn)超模糊現(xiàn)象等問題。
利用主成分分析法去除邊坡穩(wěn)定性影響因素的冗余屬性,遺傳算法優(yōu)化支持向量機(jī)參數(shù),支持向量機(jī)解決小樣本數(shù)據(jù)以及非線性等實(shí)際問題中的優(yōu)勢[12],建立PCA-GA-SVM 的公路邊坡穩(wěn)定性評(píng)價(jià)模型。影響公路土質(zhì)邊坡穩(wěn)定性的因素眾多,選取容重、內(nèi)聚力、內(nèi)摩擦角、邊坡角、邊坡高度、孔隙水壓力比6 個(gè)因素作為評(píng)價(jià)指標(biāo)[13-14],通過主成分分析法對(duì)6 個(gè)因素進(jìn)行分析,去除6個(gè)評(píng)價(jià)指標(biāo)之間的關(guān)聯(lián)性,重新線性組合出這些評(píng)價(jià)指標(biāo)的主成分,作為遺傳算法優(yōu)化支持向量機(jī)模型的輸入變量,通過模型應(yīng)用于研究區(qū)訓(xùn)練樣本及檢驗(yàn)樣本,以期解決因素之間復(fù)雜關(guān)系的問題,為公路邊坡防治提供新思路。
PCA 是一種數(shù)學(xué)降維的方法[16],是設(shè)法將原來眾多具有一定相關(guān)性的變量,重新組合成一組新的線性無關(guān)的綜合變量來代替原來的變量。
GA 是模擬自然界生物進(jìn)化機(jī)制的一種過程搜索最優(yōu)算法[17],中心思想是對(duì)一定數(shù)量個(gè)體組成的生物種群進(jìn)行選擇、交叉、變異等遺傳操作,最終求得最優(yōu)解或近似最優(yōu)解。
SVM 是一種二類分類模型[18],能夠很好地處理小樣本數(shù)據(jù),具有高效、簡便的分類、評(píng)價(jià)過程,是在特征空間上的間隔最大的線性分類器,并且能尋找到全局最優(yōu)解。基本思想是求解一個(gè)能夠正確劃分?jǐn)?shù)據(jù)集的分離超平面,并且保證這個(gè)超平面的幾何間距最大化,對(duì)于線性可分的數(shù)據(jù)集,其最大幾何間隔的超平面是唯一的。
PCA-GA-SVM 模型原理:通過PCA 分析法將影響公路邊坡的一定相關(guān)性的因素,重新組合成新的線性無關(guān)變量,作為GA 優(yōu)化SVM 模型的輸入變量,以評(píng)價(jià)值作為輸出變量,最終建立PCAGA-SVM 模型。
對(duì)文獻(xiàn)[15]收集到的40 個(gè)邊坡工程實(shí)例進(jìn)行PCA-GA-SVM 評(píng)價(jià)模型的有效性檢驗(yàn)。選取容重、內(nèi)聚力、內(nèi)摩擦角、邊坡角、邊坡高度、孔隙水壓力比6 個(gè)因素作為影響邊坡穩(wěn)定性的因子。
在這40 個(gè)樣本中隨機(jī)抽取35 個(gè)樣本數(shù)據(jù)作為訓(xùn)練樣本(表1),剩余5 個(gè)作為檢驗(yàn)樣本(表2),用于驗(yàn)證所建立的基于PCA-GA-SVM 邊坡穩(wěn)定性評(píng)價(jià)模型的準(zhǔn)確性。其中,邊坡狀態(tài)以1 和-1 來表示,1 代表“邊坡穩(wěn)定”,-1 代表“邊坡破壞”。
表1 訓(xùn)練樣本Tab.1 Training samples
表2 檢驗(yàn)樣本Tab.2 Testing Samples
為了更好地表示6 個(gè)影響因素之間的相關(guān)性關(guān)系,對(duì)表1 和表2 中的影響因素進(jìn)行主成分分析,得到相關(guān)系數(shù)矩陣如表3 所示。由表3 可以看出,容重與內(nèi)聚力、邊坡高度都有較強(qiáng)相關(guān)性,孔隙水壓力與內(nèi)摩擦角有較強(qiáng)的相關(guān)性,內(nèi)聚力與邊坡高度之間也有較強(qiáng)相關(guān)性,當(dāng)直接分析這些具有相關(guān)性的因素時(shí),可能會(huì)出現(xiàn)嚴(yán)重的共線性問題。因此采用PCA 提取適當(dāng)數(shù)量的主成分,并重新線性組合各評(píng)價(jià)指標(biāo),可以更清楚地闡述影響因素之間的關(guān)系。
表3 相關(guān)系數(shù)矩陣Tab.3 Correlation coefficient matrix
表4 公因子方差比Tab.4 Common factor variance ratio
表4 為各評(píng)價(jià)指標(biāo)的公因子方差比。由表4 可知,除了內(nèi)摩擦角有22. 2%的信息未被提取外,其它5 個(gè)評(píng)價(jià)指標(biāo)的信息被提取得較充分。
表5 為計(jì)算標(biāo)準(zhǔn)化后的數(shù)據(jù)特征值和累計(jì)方差貢獻(xiàn)率,其中F1……F6為6 個(gè)影響因素重新組合出的主成分。從表5 可以看出,前3 個(gè)主成分累計(jì)貢獻(xiàn)率85.307%>85%,但是考慮到后續(xù)模型的預(yù)測效果,取前4 個(gè)主成分代表原來6 個(gè)變量所攜帶的信息。
表5 特征值及主成分貢獻(xiàn)率Tab.5 Eigenvalues and principal component contribution rates
表6 為通過PCA 中最大方差法進(jìn)行因子旋轉(zhuǎn),使因子載荷效果更加充分,得到的因子負(fù)荷矩陣。根據(jù)前4 個(gè)主成分在各影響因素下的權(quán)重系數(shù)可知,第一主成分中,系數(shù)絕對(duì)值比較大的影響因素為孔隙水壓力、邊坡角和內(nèi)摩擦角,表明第一主成分主要反映的是孔隙水壓力、邊坡角和內(nèi)摩擦角這3 個(gè)方面的信息。同理,第二主成分主要反映容重的信息,第三主成分主要反映內(nèi)聚力的信息,第四主成分主要反映邊坡高度的信息。
表6 因子負(fù)荷矩陣Tab.6 Factor load matrix
表7 為PCA 分析得到的因子得分系數(shù)矩陣。各評(píng)價(jià)指標(biāo)可以通過該系數(shù)矩陣對(duì)各主成分重新進(jìn)行線性組合,s1、s2、s3、s4、s5、s6分別代表容重、空隙水壓力比、內(nèi)聚力、邊坡高度、內(nèi)摩擦角、邊坡角。得到4 個(gè)主成分(F1、F2、F3、F4)表達(dá)式見式(1)。
表7 因子得分系數(shù)矩陣Tab.7 Factor score coefficient matrix
由式(1),重新計(jì)算40 組原始數(shù)據(jù)樣本的主成分,如表8 所示。把4 個(gè)線性無關(guān)的主成分作為支持向量機(jī)模型輸入變量,既可以降低變量維數(shù),也能夠提高模型的運(yùn)算效率。
本文選擇作為SVM 分類的核函數(shù)為徑向基函數(shù)(RBF),并采用GA 算法確定核函數(shù)參數(shù)g和懲罰參數(shù)C。采用MATLAB 語言編寫GA 優(yōu)化SVM 模型參數(shù)程序,設(shè)置初始參數(shù)時(shí),種群數(shù)量為20,進(jìn)化代數(shù)為100,交叉率為0.8,變異率為0.2,經(jīng)過多次訓(xùn)練尋找最優(yōu)解,得到的最佳適應(yīng)度曲線如圖1 所示。
最優(yōu)參數(shù)確定為C=6.7907,g=2.1315,均方誤差MSE=0.059838,為檢驗(yàn)PCA-GA-SVM 模型的可行性,運(yùn)用主成分分析確定的4 個(gè)主成分(F1、F2、F3、F4)作為輸入變量,對(duì)表1 中的訓(xùn)練樣本數(shù)據(jù)進(jìn)行回歸仿真,訓(xùn)練樣本的仿真回歸值與實(shí)際值對(duì)比如圖2 所示。
表8 原始數(shù)據(jù)樣本的主成分Tab.8 Principal components of samples of raw data
圖1 遺傳算法尋優(yōu)過程Fig.1 Optimization process of genetic algorithm
圖2 PCA-GA-SVM 模型訓(xùn)練樣本Fig.2 Training sample diagram of PCA-GASVM model
由圖2 得知,基于PCA-GA-SVM 公路邊坡穩(wěn)定性評(píng)價(jià)模型對(duì)35 組訓(xùn)練樣本的評(píng)價(jià)值與實(shí)際值非常接近,精度達(dá)到了工程要求,可以作為實(shí)際工作中評(píng)價(jià)模型。
通過PCA-GA-SVM 邊坡穩(wěn)定性評(píng)價(jià)模型對(duì)表2 中5 組檢驗(yàn)樣本進(jìn)行評(píng)價(jià),并與實(shí)際值進(jìn)行對(duì)比,評(píng)價(jià)值與實(shí)際值的對(duì)比如圖3 所示。為了檢驗(yàn)主成分分析對(duì)預(yù)測結(jié)果的影響,表9 給出了PCA-GA-SVM 模型與GA-SVM 模型評(píng)價(jià)誤差的比較結(jié)果。
圖3 檢驗(yàn)樣本評(píng)價(jià)值和實(shí)際值對(duì)比Fig.3 Comparison between sample evaluation and actual values of testing samples
表9 評(píng)價(jià)值與實(shí)際值對(duì)比Tab.9 Comparison between evaluation and actual values
由圖3 以及表9 結(jié)果可知,基于PCA-GASVM 模型的評(píng)價(jià)結(jié)果的最大絕對(duì)誤差為0.0921,最大相對(duì)誤差9.21%,而GA-SVM 模型的評(píng)價(jià)結(jié)果的最大絕對(duì)誤差為0.1581,最大相對(duì)誤差15.81%??梢钥闯鯬CA-GA-SVM 模型的評(píng)價(jià)結(jié)果在精度上要優(yōu)于GA-SVM 模型,能夠滿足實(shí)際工程的需要。
(1)影響邊坡穩(wěn)定性的因素眾多,難以用一種常規(guī)簡單的模型準(zhǔn)確反映出各因素之間的不確定、復(fù)雜關(guān)系。本文通過建立PCA-GA-SVM 公路邊坡穩(wěn)定性評(píng)價(jià)模型,模型較好地解決了這一問題,進(jìn)一步闡述了各因素之間的關(guān)系。
(2)引入主成分分析的降維思想,用4 個(gè)線性無關(guān)的主成分F1、F2、F3和F4表達(dá)了6 個(gè)影響公路邊坡穩(wěn)定性因素信息量的92.064%,提高了模型的計(jì)算速度和評(píng)價(jià)精度。
(3)通過對(duì)檢驗(yàn)樣本的評(píng)價(jià),PCA-GA-SVM模型的最大相對(duì)誤差為9.21%,評(píng)價(jià)結(jié)果與實(shí)際值較接近,精度優(yōu)于GA-SVM 模型。因此PCAGA-SVM 模型可以在實(shí)際工程中應(yīng)用,為公路邊坡防治提供依據(jù)。
防災(zāi)科技學(xué)院學(xué)報(bào)2019年4期