王 響, 邵應峰, 沈 霞, 張 燚, 張子陽
(1.河海大學巖土力學與堤壩工程教育部重點實驗室,南京 210098; 2.河海大學巖土工程科學研究所,南京 210098)
隨著經(jīng)濟的發(fā)展和社會的進步,我國城市化發(fā)展進程加快. 在進行城市排水管網(wǎng)建設(shè)過程中,由于施工條件復雜,經(jīng)常出現(xiàn)溝槽部兩邊的縱向裂縫及溝槽部位的明顯凹槽現(xiàn)象. 出現(xiàn)這些現(xiàn)象,是因為溝槽寬度過小,難以使用重型壓實機械壓實,導致溝槽回填土壓實度達不到設(shè)計要求[1]. 另外,在進行溝槽開挖過程中,會產(chǎn)生大量廢棄土,這些棄土由于缺乏有效監(jiān)管,容易造成占用土地、破環(huán)城市市容并惡化城市環(huán)境衛(wèi)生等方面的危害[2];自密實水泥土是為解決上述難題而研究出來的一種新技術(shù),充分利用開挖的廢棄土,用水泥改良后,可以形成具有自密實性質(zhì)且強度可調(diào)的一種新型填筑材料[3],不僅可以解決溝槽回填壓實度問題,還可以減少棄土的運輸費用[4].
管道溝槽回填土的設(shè)計主要有強度[5]和滲透性[6],水泥土作為一種復合材料,其強度主要受配合比的影響,在配合比設(shè)計中通??紤]的影響因素有含水率、水泥摻入比、外摻劑等[7]. 賈堅[8]通過室內(nèi)試驗發(fā)現(xiàn),綜合含水量和水泥摻入比是影響水泥土強度的關(guān)鍵因素,因此,本文選用水泥摻入比和含水量這兩個影響因素預測水泥土強度. 當水泥土強度和影響因素之間的關(guān)系為線性[9]、指數(shù)[10]、和對數(shù)[11]等簡單情況下,可以通過函數(shù)擬合得到水泥土和影響因素之間的函數(shù)表達式. 由于水泥土和水泥摻入比、含水量之間存在復雜關(guān)系,同時機器學習在處理復雜關(guān)系時具有較大優(yōu)勢[12],因此,可以用這種方法預測水泥土的強度.
利用機器學習進行預測,本質(zhì)是對數(shù)據(jù)的回歸分析,常用的具有回歸分析功能的機器學習方法主要包括神經(jīng)網(wǎng)絡(luò)[13]和支持向量機[14](Support Vector Machine,SVM)等. 神經(jīng)網(wǎng)絡(luò)雖然可以處理非線性問題,但也存在收斂速度慢、過學習和局部極值等問題,而且需要的樣本數(shù)量大[15];由于支持向量機的訓練模式采用優(yōu)化技術(shù)及數(shù)學方式,因此在小樣本、高維、非線性預測領(lǐng)域具有很好的應用效果[16],尤其適合水泥土的小樣本、非線性問題. 目前,吳張中等[17]利用支持向量機建立鉆孔后注漿水泥土強度的SVM回歸模型,該模型描述了泥漿、水泥土比重參數(shù)與水泥土強度之間的映射關(guān)系;魏良針等[18]把均方誤差作為預測模型的適應度函數(shù),并通過網(wǎng)格搜索法、粒子群算法優(yōu)化SVM模型參數(shù),建立了地表沉降預測模型. 因此,本文利用支持向量機的方法得到水泥土強度和影響因素的關(guān)系,并預測特定配合比下的水泥土強度.
試驗采用的原料土為南通現(xiàn)場開挖棄土,土的物理力學指標如表1,固化劑為P·O 42.5 普通硅酸鹽水泥,水為自來水.
將土樣風干碾碎,過2 mm篩,密封保存?zhèn)溆? 試樣制作時,先將水泥和水混合,形成水泥漿液,再將干土加入,放入攪拌機中充分攪拌,攪拌均勻后,在標準圓柱試模中制作直徑50 mm,高度100 mm 的試樣,成型1 d 后放入標準養(yǎng)護箱中養(yǎng)護,養(yǎng)護溫度為(20±2)℃,相對濕度為95%,在齡期28 d 時進行無側(cè)限抗壓強度試驗,取3個平行試樣的算術(shù)平均值作為該組的無側(cè)限抗壓強度值,當試樣的測值與平均值之差超過平均值的±15%時,剔除該數(shù)據(jù),余下試樣的測值計算平均值. 如一組試樣不足兩個,需重做[11].
為了研究并驗證自密實水泥土強度、和水泥摻入比(水泥質(zhì)量/干土質(zhì)量×100%)、含水量(所有水質(zhì)量/干土質(zhì)量)的非線性關(guān)系,本文按不同水泥摻入比(5%、7.5%、10%、12.5%、15%)和不同含水量(0.52、0.55、0.58、0.61、0.64)采取正交試驗,共制作水泥土試塊25組,試塊壓試速率為1 mm/min,試驗結(jié)果如表2所示.
表2 自密實水泥土28 d無側(cè)限抗壓強度結(jié)果Tab.2 Results of unconfined compressive strength of self-compacting cement soil for 28 d
SVM一般分為分類和回歸兩大問題. 其中SVM回歸基本思路:對于給定訓練樣本集Y={ }(xi,yi) ,通過非線性映射?(x),將輸入量x映射到高維空間,然后用函數(shù)f(x)=ω??(x)+b對數(shù)據(jù)進行擬合. 擬合的本質(zhì)是尋找最優(yōu)參數(shù)ω和b使f(x)逼近y. 考慮到允許擬合誤差問題,引入松弛因子ξ和ξ*,由此得到待優(yōu)化函數(shù):
式中:ω為權(quán)重;C為懲罰因子,其作用可以控制擬合誤差;ξ和ξ*是松弛因子,當預測存在誤差時都大于0,否則等于0;x為自變量;y為因變量;b為常數(shù);ε為一個大于0且很小的數(shù). 再引用Lagrange方程,解決對偶優(yōu)化問題:
其中:α、α*、η、η*≥0,為Lagrange乘子,且L對α、α*、η、η*的偏導等于零,再引入徑向基核函數(shù):
式中:g為核函數(shù)參數(shù),可以影響樣本空間到特征空間的映射;xi和xj都為自變量. 該函數(shù)將高維空間轉(zhuǎn)為低維空間,就可以得到非線性擬合函數(shù)f(x)的表達式:
在利用SVM 建立預測模型時,通常會將樣本按2∶1 的比例劃分訓練集和測試集,故將含水量為0.52、0.61、0.64的15組數(shù)據(jù)劃分為訓練集,通過這15組數(shù)據(jù),利用SVM建立yi={28 d無側(cè)限抗壓強度}與xi={水泥摻入比,含水量}之間的回歸模型,分析水泥摻入比、含水量和28 d抗壓強度的關(guān)系,并用SVM建立強度預測模型,最后將剩下的10組數(shù)據(jù)劃分為測試集,然后用該模型輸出這10組配合比的預測強度,并和真實強度進行比對.
根據(jù)式(1)和式(4)可以看出,參數(shù)g和C是SVM 中重要參數(shù),g的取值影響樣本空間到特征空間的映射,C可以控制擬合誤差.因此,可以通過特定的算法調(diào)整參數(shù)的值,從而獲得更優(yōu)的預測模型. 本文通過網(wǎng)格尋優(yōu)算法、粒子群算法和模擬退火算法尋找該模型參數(shù)的最優(yōu)值.
首先,將15組訓練集中的數(shù)據(jù)歸一化并代入支持向量機預測模型中訓練,將g和C兩個參數(shù)范圍設(shè)置在[0,10]內(nèi),為了準確評估參數(shù)變化時模型的預測性能,提出了均方誤差(Mean Squared Error,MSE),當MSE越小時,表示預測模型的誤差越小,如式(6)所示:
式中:yi為預測數(shù)據(jù)實際值;y為預測值;N為樣本數(shù).
網(wǎng)格尋優(yōu)算法的本質(zhì)是將所有情況遍歷一遍[19],因此設(shè)置每個參數(shù)的步長為0.01,將式(6)作為適應度函數(shù),計算每一種情況的適應度值(MSE),優(yōu)化結(jié)果如圖1所示,當g=6.6、C=8.6 時,適應度值最小,對應的MSE 為0.003 8 MPa.
圖1 網(wǎng)格尋優(yōu)算法結(jié)果Fig.1 Results of grid optimization algorithm
粒子群優(yōu)化算法通過隨機生成粒子群,將每一個粒子抽象為一只鳥,待優(yōu)化參數(shù)的個數(shù)代表粒子的維度空間的層數(shù),它可以在d維空間中以一定的速度飛行,通過設(shè)計的適應度函數(shù)判斷所得到的位置是否合適,每次迭代,粒子會根據(jù)前期飛行經(jīng)驗,動態(tài)調(diào)整速度并更新位置,直至找到最佳位置,即問題的最優(yōu)解[20]. 粒子群的規(guī)模不宜太大,設(shè)置為20;加速常數(shù)c1、c2通常取0~2 之間的數(shù),均設(shè)置為2;最大迭代次數(shù)為100;將式(6)作為適應度函數(shù). 每次迭代,計算每個粒子的適應度值(MSE).優(yōu)化結(jié)果見圖2,當?shù)螖?shù)超過40次時,計算結(jié)果收斂于0.005 5附近,計算速度較快. 最終,當g=3.76、C=8.6時,適應度值最小,對應的MSE為0.005 3 MPa.
圖2 粒子群算法結(jié)果Fig.2 Results of particle swarm algorithm
模擬退火算法是一種通用概率算法,用來在一個大的搜尋空間內(nèi)尋找命題的最優(yōu)解. 由于引入了隨機因素,它能以一定的概率接受一個比當前解要差的解,因此,有可能跳出局部的最優(yōu)解以致達到全局的最優(yōu)解[21]. 它來源于固體退火原理,本質(zhì)上是將待優(yōu)化問題類比為退火過程中能量的最低狀態(tài),也就是溫度達到最低點時,概率分布中具有最大概率的狀態(tài). 假設(shè)初始溫度T0=10 ℃,迭代次數(shù)為100,按Tf=0.01 ℃更新溫度,溫度設(shè)定的閾值為0.99,最終優(yōu)化結(jié)果見圖3. 當?shù)谝淮蔚?,適應度值就接近最小值,但并沒有一直收斂于該值附近,而是跳出這個范圍,繼續(xù)搜尋全局最優(yōu)值,保證了結(jié)果的可靠性. 當g=10.27、C=7.16 時,適應度值最小,對應的MSE為0.003 8 MPa.
圖3 模擬退火算法結(jié)果Fig.3 Results of simulated annealing algorithm
為了選擇最優(yōu)的預測模型,首先,利用三種不同算法改進的SVM 預測模型輸出測試集中的10 組預測值,然后將真實值和預測值表示在同一坐標軸上,如圖4. 可以看出,這三種預測模型輸出的預測值和真實值誤差都很小,且增長趨勢一致,可以模擬試樣的無側(cè)限抗壓強度隨水泥摻入比和含水量的非線性變化過程.
由于三種預測模型的預測值和真實值的誤差都很小,所以,不能直接從圖4 中直接選擇最優(yōu)的預測模型. 分別計算三種預測模型在測試集中的預測值和真實值的平方損失(MSE)及絕對損失(MAE),當這兩個值越小時,模型的預測效果越好,計算結(jié)果見表3.
圖4 測試集中預測值和真實值對比圖Fig.4 Comparison chart of predicted values and true values in the test set
從表3 可以看出,GS_SVM 預測模型和SA_SVM 預測模型結(jié)果一樣,但GS_SVM 計算時,需要把所有的結(jié)果都遍歷一遍,計算量大,所以SA_SVM 預測模型的計算速度更快;PSO_SVM預測模型相較于SA_SVM預測模型,少了一次內(nèi)部的迭代循環(huán),計算更快,但容易得到局部最優(yōu)解. 結(jié)果表明,SA_SVM 預測模型為最優(yōu)預測模型,計算速度更快,結(jié)果更準確.
表3 測試集中不同預測模型的預測結(jié)果Tab.3 Prediction results of different forecast models in the test set
本文將機器學習中SVM應用到自密實水泥土最佳配合比預測中,可以根據(jù)水泥摻入比和含水量預測特定的強度,從而確定最佳配合比,顯著降低了試驗的成本,為配合設(shè)計提供重要參考意義,并得到以下結(jié)論:1)自密實水泥土28 d無側(cè)限抗壓強度隨灰土比增大而增大,隨水土比增大而減小.2)自密實水泥土SVM預測模型能夠根據(jù)小樣本進行非線性建模并預測.