張?chǎng)问I(yè)譜鄧祥文李書蓉李秀榮
(1.山東建筑大學(xué)土木工程學(xué)院,山東濟(jì)南 250101;2.山東建筑大學(xué)建筑結(jié)構(gòu)加固改造與地下空間工程教育部重點(diǎn)實(shí)驗(yàn)室,山東 濟(jì)南 250101;3.山東建大工程鑒定加固研究院,山東 濟(jì)南 250014)
強(qiáng)夯法[1]是法國(guó)Menard公司在20世紀(jì)70年代創(chuàng)造的一種經(jīng)濟(jì)有效的地基處理方法。為了確保處理后地基場(chǎng)地工程可靠性,有必要對(duì)強(qiáng)夯作用過程進(jìn)行深入研究,而強(qiáng)夯過程是高速瞬時(shí)沖擊的動(dòng)力學(xué)歷程,整個(gè)過程作用機(jī)理復(fù)雜、影響因素繁多且具有高度的非線性,近半個(gè)世紀(jì)以來,工程界在其力學(xué)模型、能量響應(yīng)的仿真模擬及理論解析課題上仍面臨許多困難。
在圍繞強(qiáng)夯法的研究中,有效加固深度的標(biāo)定是應(yīng)用強(qiáng)夯實(shí)現(xiàn)地基處理時(shí)的核心環(huán)節(jié)。強(qiáng)夯有效加固深度[2]是指經(jīng)強(qiáng)夯處理后的地基土力學(xué)指標(biāo)滿足設(shè)計(jì)要求的深度范圍,是關(guān)系到地基處理質(zhì)量的一項(xiàng)決定性指標(biāo),有效加固深度的研究由最初強(qiáng)夯理論提出時(shí)的Menard公式系數(shù)修正法[3],逐步發(fā)展出BILLAM經(jīng)驗(yàn)計(jì)算法、劉海沖經(jīng)驗(yàn)公式法等諸多基于試驗(yàn)與工程現(xiàn)場(chǎng)數(shù)據(jù)的計(jì)算方法。近年來,學(xué)者們從能量守恒[4]、量綱匹配[5]、相關(guān)性分析等方面對(duì)強(qiáng)夯的有效加固深度理論進(jìn)行了更深層次的數(shù)值解析預(yù)測(cè)與分析[6]。強(qiáng)夯過程過于復(fù)雜且非線性程度很高,相關(guān)經(jīng)驗(yàn)公式、力學(xué)模型等存在較大的局限性,同時(shí)諸多經(jīng)驗(yàn)公式的簡(jiǎn)化與調(diào)參過程不可避免地產(chǎn)生誤差,因而對(duì)于有效加固深度預(yù)測(cè)模型與算法研究仍是當(dāng)前亟待解決的難題。
隨著現(xiàn)代電子計(jì)算機(jī)的發(fā)展以及科學(xué)計(jì)算語言的進(jìn)步,許多學(xué)者采用基于機(jī)器學(xué)習(xí)及智能算法預(yù)測(cè)了有效加固深度,如基于模糊信息優(yōu)化處理技術(shù)[7]、BP人工神經(jīng)網(wǎng)絡(luò)技術(shù)(Back Propagation-Artificial Neural Networks,BP-ANN)[8]。其中,神經(jīng)網(wǎng)絡(luò)算法在預(yù)測(cè)領(lǐng)域得到了廣泛的應(yīng)用,但是由于其在局部極小值的處理以及學(xué)習(xí)訓(xùn)練過程中過分依賴經(jīng)驗(yàn)或大量樣本數(shù)據(jù)集等方面的缺陷,降低了該算法在強(qiáng)夯有效加固深度問題上應(yīng)用的準(zhǔn)確性與有效性。在工程數(shù)值問題的回歸分析中,許多學(xué)者應(yīng)用支持向量機(jī)算法的研究取得了進(jìn)展,改進(jìn)支持向量機(jī)算法在機(jī)械系統(tǒng)故障自動(dòng)化診斷[9]、隧道結(jié)構(gòu)行為分析[10]、航空航天器服役狀態(tài)評(píng)估[11]等研究課題中得到重視和發(fā)展。
文章提出了應(yīng)用異于傳統(tǒng)機(jī)器學(xué)習(xí)方法的支持向量機(jī)算法模型回歸預(yù)測(cè)強(qiáng)夯有效加固深度,是支持向量機(jī)算法在該工程問題上的初步嘗試。通過編程構(gòu)建(Support Vector Machines,SVM)模型,并設(shè)計(jì)遺傳算法程序模塊優(yōu)化模型中的關(guān)鍵參數(shù),實(shí)現(xiàn)了對(duì)數(shù)據(jù)的最優(yōu)分析與預(yù)測(cè),并將工程現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)在SVM模型的回歸預(yù)測(cè)精度和BP神經(jīng)網(wǎng)絡(luò)模型中的回歸預(yù)測(cè)精度進(jìn)行對(duì)比,評(píng)價(jià)了這類模型的預(yù)測(cè)精確度和可靠性。
1995年,VAPNIK等[12]提出支持向量機(jī)理論SVM。SVM是一種在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展出來的全新機(jī)器學(xué)習(xí)算法,基于VC維(Vapnik-Chervonenkis Dimension)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化(Structural Risk Minimization,SRM)原則,通過尋找最優(yōu)分隔超平面的過程實(shí)現(xiàn)對(duì)樣本數(shù)據(jù)的分類或者回歸預(yù)測(cè)[13]。最優(yōu)超平面建立的過程使得模型對(duì)于小樣本問題仍能較好地適用,并且泛化能力得到保證,支持向量機(jī)算法具有較高的準(zhǔn)確性及穩(wěn)定性,成為解決有限樣本數(shù)據(jù)處理、高維模式識(shí)別、非線性回歸擬合問題的一種新方式。
支持向量機(jī)的基本原理是通過尋找一個(gè)能將現(xiàn)有樣本集按照模式類型分開且能同時(shí)滿足分類間隔最大的最優(yōu)分類超平面完成數(shù)據(jù)處理。對(duì)于非線性問題,需將數(shù)據(jù)映射到高維度的特征空間后圍繞選擇得到的支持向量(Support Vectors,SV)進(jìn)行回歸分析,進(jìn)而尋找最優(yōu)分類超平面,將線性支持向量機(jī)的應(yīng)用推廣至非線性解空間。
圖1為平面數(shù)據(jù)高維映射后線性可分示意圖,表示了在二維平面線性不可分的兩類數(shù)據(jù)映射至三維空間后可被Z=KX+b形式的平面劃分,其中X={x1,x2}。圖1中,x1軸表示第一維度數(shù)值,x2軸表示第二維度數(shù)值,z軸表示映射后的高維數(shù)值。。 其中,xi(i=1,2,
圖1 平面數(shù)據(jù)高維映射后線性可分示意圖
在回歸擬合問題上,假設(shè)給定一個(gè)樣本集S=…,n)為輸入變量,由n個(gè)d維向量構(gòu)成;yi為對(duì)應(yīng)的期望輸出值。故該樣本集回歸函數(shù)f(x)的形式由式(1)表示為
式中ω∈Rd為權(quán)值矢量;b∈R為標(biāo)量閾值;ω·xi表示ω與xi的點(diǎn)積。求解ω和b的優(yōu)化問題由式(2)和(3)表示為
式中ε為引入的不敏感因子;C為懲罰因子,表示對(duì)超出誤差式中達(dá)ε的樣本的懲罰程度;ξi、ξ*i為松弛變量,是樣本偏離不敏感區(qū)間ε的上、下限界。
支持向量機(jī)數(shù)據(jù)回歸擬合示意圖如圖2所示,展示了支持向量機(jī)算法回歸擬合分析的計(jì)算規(guī)則,坐標(biāo)中的3條曲線分別為f(x)和擬合區(qū)間上、下界。
圖2 支持向量機(jī)數(shù)據(jù)回歸擬合示意圖
根據(jù)非線性規(guī)劃對(duì)偶性理論,引入拉格朗日乘子建立優(yōu)化約束方程,將最小約束整理為凸二次規(guī)劃最大值問題,由式(4)表示為
由最優(yōu)化理論(Karush-Kuhn-Tucker,KKT)條件可知,令式(4)對(duì)ω、b、ξi、偏導(dǎo)為0,可將其轉(zhuǎn)化成對(duì)偶形式求解,由式(5)和(6)表示為
對(duì)式(5)的方程進(jìn)行求解得式(7)為
式中K(xi,xj)=Φ(xi)·Φ(xj),是支持向量機(jī)的核函數(shù)。
綜上映射操作,可得泛化回歸函數(shù),由式(8)表示為
針對(duì)地基處理工程問題的數(shù)據(jù)分析與預(yù)測(cè)問題,應(yīng)選取容錯(cuò)性好,可泛化程度高的算法模型。復(fù)雜工程回歸預(yù)測(cè)中常應(yīng)用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行分析,BP神經(jīng)網(wǎng)絡(luò)模型的研究成果在大樣本、多變量、高度非線性預(yù)測(cè)問題上得到了較高水平的肯定;BP神經(jīng)網(wǎng)絡(luò)利用數(shù)學(xué)關(guān)系構(gòu)建神經(jīng)元網(wǎng)絡(luò)結(jié)構(gòu),并通過對(duì)大量樣本數(shù)據(jù)的訓(xùn)練學(xué)習(xí),逆向確定修正出各隱含層神經(jīng)元間的連接強(qiáng)度,基于經(jīng)驗(yàn)數(shù)據(jù)的學(xué)習(xí)過程使其預(yù)測(cè)準(zhǔn)確率達(dá)到工程可接受水平;但是其算法存在過分依賴于原始經(jīng)驗(yàn)數(shù)據(jù)、較早地收斂于局部極值點(diǎn)、較高頻率的過擬合現(xiàn)象等問題。當(dāng)選擇應(yīng)用優(yōu)化支持向量機(jī)算法預(yù)測(cè)強(qiáng)夯有效加固深度時(shí),由于該算法通過尋找樣本中的支持向量,確定出距離樣本的間距最大的超平面而實(shí)現(xiàn)數(shù)據(jù)處理,且基于VC維理論實(shí)現(xiàn)矩陣變換使得原線性不可分的數(shù)據(jù)在足夠高的維度空間中線性可分,因此支持向量機(jī)具有機(jī)器學(xué)習(xí)算法中最高的樣本泛化能力與非線性適應(yīng)能力,算法即使在小樣本的數(shù)據(jù)分析中仍能發(fā)揮出較大的準(zhǔn)確度優(yōu)勢(shì)。
文章基于計(jì)算軟件MATLAB平臺(tái)LIBSVM[14]工具箱編寫強(qiáng)夯有效加固深度的預(yù)測(cè)回歸程序,對(duì)SVM回歸預(yù)測(cè)進(jìn)行現(xiàn)實(shí)工程數(shù)據(jù)的仿真分析;同時(shí)編程構(gòu)建BP人工神經(jīng)網(wǎng)絡(luò)模型并完成建模、訓(xùn)練、仿真和預(yù)測(cè),對(duì)同一樣本集進(jìn)行訓(xùn)練,使神經(jīng)網(wǎng)絡(luò)模型達(dá)到與SVM模型同等的精度水平后,以地基處理工程現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)為例,分析對(duì)比GA-SVM與BPANN兩種機(jī)器學(xué)習(xí)模型在強(qiáng)夯有效加固深度預(yù)測(cè)精度上的性能表現(xiàn)。
支持向量機(jī)回歸試驗(yàn)中擬合結(jié)果的精度與算法中數(shù)據(jù)嵌入維數(shù)m、懲罰因子C、損失參數(shù)(不敏感因子)ε、核函數(shù)K類型及核函數(shù)相關(guān)參數(shù)之間存在一定聯(lián)系,確定最優(yōu)的模型參數(shù)組合可以使擬合誤差降至最低,且滿足測(cè)試樣本的檢驗(yàn)精度要求。計(jì)算模型中與運(yùn)算效率、計(jì)算精度有關(guān)的參數(shù)為C、ε和σ,其中C在特征空間中控制模型復(fù)雜度和經(jīng)驗(yàn)誤差風(fēng)險(xiǎn)比值,其值越大,SVM對(duì)樣本數(shù)據(jù)的擬合程度越高[15];ε控制樣本中支持向量的數(shù)量,其取值越大支持向量越少。3個(gè)影響參數(shù)間相互制約且無明確函數(shù)相關(guān)性,應(yīng)用進(jìn)化啟發(fā)式尋優(yōu)算法—遺傳算法(Genetic Algorithm,GA)[16]對(duì)C、ε、σ共3個(gè)參數(shù)的取值優(yōu)化。
支持向量機(jī)的遺傳算法優(yōu)化部分具體通過以下步驟實(shí)現(xiàn):
(1)遺傳算法參數(shù)初始化并定義初始種群
確定種群數(shù)目為40,最大迭代次數(shù)為250次,交叉率單點(diǎn)交叉法取0.58,變異率取0.01,選擇范圍取0.9。
(2)確定GA-SVM參數(shù)尋優(yōu)范圍并編碼
C、ε、σ的尋優(yōu)區(qū)間分別設(shè)為[0,60],[0.000 01,0.1],[0,10],將其按二進(jìn)制形式進(jìn)行遺傳算法的種群染色體基因編碼,初始隨機(jī)產(chǎn)生基因型為該二進(jìn)制編碼序列的種群。
(3)適應(yīng)度函數(shù)定義
設(shè)定該模型中種群適應(yīng)度為SVM回歸結(jié)果的均方誤差。
(4)選擇、交叉、變異
根據(jù)個(gè)體適應(yīng)度,通過輪盤賭法將具有較低適應(yīng)度值的個(gè)體淘汰,較高適應(yīng)度值的染色體被復(fù)制;以交叉率交換染色體結(jié)構(gòu)中信息以得到子代基因,在種群進(jìn)化過程中,設(shè)定基因突變率以一定概率隨機(jī)改變?nèi)旧w編碼序列中的基因點(diǎn)。按照遺傳進(jìn)化策略,對(duì)種群運(yùn)用選擇、交叉、變異,并逐代進(jìn)化。
(5)進(jìn)化終止尋優(yōu)求解結(jié)束并解碼
當(dāng)種群進(jìn)化代數(shù)達(dá)到設(shè)定的上限時(shí),尋優(yōu)結(jié)束,將求解過程中適應(yīng)度值最佳的種群解碼,得到滿足條件的全局最優(yōu)解C、ε、σ,參數(shù)最優(yōu)化GA-SVM模型建立完成。
使用優(yōu)化后的GA-SVM算法進(jìn)行樣本集數(shù)據(jù)回歸與測(cè)試集數(shù)據(jù)預(yù)測(cè),可以實(shí)現(xiàn)SVM算法的理論最優(yōu)性能。將其應(yīng)用于具體工程問題,應(yīng)當(dāng)有較高的預(yù)測(cè)精度與泛化能力。GA-SVM算法模型的回歸預(yù)測(cè)流程圖如圖3所示。
圖3 GA-SVM模型回歸預(yù)測(cè)流程圖
為了驗(yàn)證GA-SVM回歸預(yù)測(cè)模型在強(qiáng)夯法有效加固深度預(yù)測(cè)應(yīng)用上的性能,現(xiàn)從我國(guó)地基處理工程現(xiàn)場(chǎng)及相關(guān)文獻(xiàn)資料中選取36個(gè)強(qiáng)夯地基處理樣本集合,確定其輸入?yún)?shù)為地基土的干重度、含水量、夯錘夯擊能量和夯錘面積,期望其輸出值為有效加固深度一項(xiàng)。此樣本數(shù)據(jù)具有較高的離散性和獨(dú)特性,擁有一定程度的代表性。采用選取的36個(gè)工程樣本[17-18]經(jīng)過數(shù)據(jù)歸一化處理后組成的訓(xùn)練樣本集(見表1)對(duì)模型進(jìn)行訓(xùn)練,直到模型針對(duì)訓(xùn)練樣本集的訓(xùn)練預(yù)測(cè)結(jié)果的均方誤差降低至設(shè)定范圍后,應(yīng)用該模型進(jìn)行全新測(cè)試樣本集的仿真預(yù)測(cè)。
表1 實(shí)測(cè)原始數(shù)據(jù)及歸一化處理數(shù)據(jù)結(jié)果表
GA-SVM的完整應(yīng)用過程具體分為以下步驟:
(1)對(duì)輸入數(shù)據(jù)歸一化處理,將不同量綱的數(shù)據(jù)按種類分別歸一化至區(qū)間[-1,1]內(nèi),可由式(9)表示為
式中Kmax、Kmin分別為1、-1;Xmax、Xmin分別為實(shí)測(cè)原始數(shù)據(jù)每列的最大值、最小值組成的矩陣;Xout為歸一化值。
(2)將36組多維數(shù)據(jù)參數(shù)輸入初始化后的GA-SVM參數(shù)尋優(yōu)環(huán)節(jié),當(dāng)均方誤差低至閾值時(shí),輸出C、ε、σ值,以確定具體的SVM模型。
(3)預(yù)測(cè)深度值逆歸一化,將數(shù)據(jù)“放大”回原量綱數(shù)量級(jí),將該SVM模型對(duì)于樣本集的擬合程度與精確率列式計(jì)算;將結(jié)果繪圖展示,觀測(cè)誤差偏離程度與擬合可信度。
(4)選取全新工程測(cè)試數(shù)據(jù)集代入GA-SVM預(yù)測(cè)模型以測(cè)試其對(duì)全新樣本的回歸能力與泛化水平,計(jì)算預(yù)測(cè)準(zhǔn)確率。選取深度數(shù)據(jù)相對(duì)誤差R與平均絕對(duì)均方誤差A(yù)反映結(jié)果的精度,分別由式(10)和(11)表示為
式中yi為預(yù)測(cè)值,為實(shí)測(cè)值。
歸一化數(shù)據(jù)輸入支持向量機(jī)后,支持向量機(jī)3參數(shù)C、ε、σ經(jīng)優(yōu)化后取值分別為3.00、0.00、和1.44。參數(shù)組成的支持向量機(jī)對(duì)原始36個(gè)五維數(shù)據(jù)的擬合精度表征為均方誤差值等于0.005,平方相關(guān)系數(shù)為0.973;重復(fù)優(yōu)化過程至結(jié)果收斂。均方誤差和相關(guān)系數(shù)的數(shù)據(jù)表明,GA-SVM對(duì)訓(xùn)練數(shù)據(jù)的回歸擬合程度達(dá)到相當(dāng)精確的預(yù)測(cè)程度。使用SVM訓(xùn)練階段未學(xué)習(xí)過的工程實(shí)測(cè)測(cè)試數(shù)據(jù)集代入檢驗(yàn),觀測(cè)該模型能否對(duì)于工程實(shí)測(cè)數(shù)據(jù)的預(yù)測(cè)達(dá)到與真值相近的準(zhǔn)確率水平。
校驗(yàn)步驟中用于測(cè)試的實(shí)測(cè)數(shù)據(jù)[17]來自山西省化肥廠工程、化工部第二化工建設(shè)公司、山西化肥廠、化工部北京重機(jī)公司、化工部第二設(shè)計(jì)院及太原工業(yè)大學(xué)等。測(cè)試數(shù)據(jù)見表2,其中A、B、C組工程場(chǎng)地及土質(zhì)等具體如下:
表2 測(cè)試數(shù)據(jù)表
A組:山西化肥廠濕陷性黃土地基強(qiáng)夯處理工程,Ⅰ區(qū),濕陷性黃土地質(zhì),干重度為14.2 kN/m3、含水量為20.18%、強(qiáng)夯夯擊能量為3 500 kN·m、夯錘面積為7.00 m2,其實(shí)測(cè)有效加固深度為6.90 m(該深度數(shù)據(jù)不代入預(yù)測(cè)模型,用作最終預(yù)測(cè)值的驗(yàn)證與誤差檢驗(yàn))。
B組:場(chǎng)地Ⅱ區(qū),濕陷性黃土地質(zhì),干重度組16.24 kN/m3、含水量為20.30%、強(qiáng)夯夯擊能量為2 500 kN·m、夯錘面積為4.52 m2,其實(shí)測(cè)有效加固深度為7.21 m。
C組:場(chǎng)地Ⅰ區(qū),濕陷性黃土地質(zhì),干重度為14.10 kN/m3、含水量為22.35%、強(qiáng)夯夯擊能量為5 000 kN·m、夯錘面積為7.00 m2,其實(shí)測(cè)深度為8.00 m。
檢驗(yàn)步驟中,將GA-SVM的預(yù)測(cè)數(shù)據(jù)與BPANN模型的對(duì)比,BP-ANN基于MATLAB平臺(tái)編程實(shí)現(xiàn),為保證對(duì)比有效客觀,選用訓(xùn)練至同GA-SVM一樣誤差(均方誤差為0.005)水平的BP-ANN進(jìn)行仿真預(yù)測(cè)。其中,BP-ANN模型選用含3個(gè)隱含層共50個(gè)神經(jīng)元構(gòu)成的誤差反向傳播網(wǎng)絡(luò)進(jìn)行訓(xùn)練,模型簡(jiǎn)圖如圖4所示。
圖4 含3個(gè)隱含層的ANN結(jié)構(gòu)圖
圖5 為BP-ANN模型和GA-SVM模型的計(jì)算深度與夯擊能量關(guān)系圖。對(duì)GA-SVM模型與BPANN模型多次重復(fù)仿真預(yù)測(cè),選取具有代表性且客觀可信的數(shù)據(jù),并對(duì)比了兩個(gè)模型計(jì)算測(cè)試樣本集的誤差,見表3。
表3 模型計(jì)算測(cè)試樣本集的誤差對(duì)比表
圖5 不同模型計(jì)算深度與夯擊能量關(guān)系圖
計(jì)算數(shù)據(jù)相對(duì)誤差的絕對(duì)值≤3%時(shí),說明該模型精度較高[19]。由表3可知,GA-SVM的測(cè)試集預(yù)測(cè)值最大偏離真值為3.28%,其平均偏離為1.72%,其預(yù)測(cè)性能能夠滿足較高的精度且算法穩(wěn)定性較好,反映出其經(jīng)小樣本學(xué)習(xí)后的模型泛化能力同樣具有較高可信度;而BP-ANN預(yù)測(cè)模型,大量的神經(jīng)元組成的處理非線性數(shù)據(jù)的網(wǎng)絡(luò)結(jié)構(gòu)對(duì)訓(xùn)練數(shù)據(jù)量要求很高,從結(jié)果數(shù)據(jù)中反映出其對(duì)于測(cè)試樣本的預(yù)測(cè)精度偏離較大,波動(dòng)性過強(qiáng),存在過擬合現(xiàn)象。GA-SVM和BP-ANN測(cè)試集預(yù)測(cè)的均方誤差分別為0.024 1、1.184 9,GA-SVM模型預(yù)測(cè)的均方誤差僅為BP-ANN的2%,達(dá)到了不同量級(jí)的精度,試驗(yàn)過程多次重復(fù)后表明結(jié)果客觀可信,故GA-SVM模型的工程問題的泛化精度得到了有效地保證。
通過編程構(gòu)建的應(yīng)用遺傳算法優(yōu)化支持向量機(jī)理論的數(shù)值擬合、回歸預(yù)測(cè)模型準(zhǔn)確、高效地實(shí)現(xiàn)了對(duì)強(qiáng)夯有效加固深度的計(jì)算分析,并將模型應(yīng)用到工程問題中,得到的主要結(jié)論如下:
(1)遺傳算法優(yōu)化的支持向量機(jī)算法模型能夠在訓(xùn)練樣本上實(shí)現(xiàn)準(zhǔn)確的回歸擬合,數(shù)據(jù)擬合精度達(dá)到均方誤差值0.005,平均相關(guān)系數(shù)為0.973。
(2)GA-SVM模型對(duì)測(cè)試樣本數(shù)據(jù)預(yù)測(cè)精度較高,預(yù)測(cè)結(jié)果均方誤差為0.024 1,相對(duì)誤差<3%,優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果。數(shù)據(jù)證明,基于遺傳算法優(yōu)化的支持向量機(jī)模型在強(qiáng)夯有效加固深度問題上的擬合精度更高,預(yù)測(cè)準(zhǔn)確性更強(qiáng)。