王建民,葉鈺蓉,饒超敏,卓仁杰,柳俊哲,3,*
(1.寧波大學 土木與環(huán)境工程學院,浙江 寧波 315211;2.電子科技大學 計算機科學與工程學院,四川 成都 611731;3.青島農(nóng)業(yè)大學 建筑工程學院,山東 青島 266109)
普通混凝土(NC)與陶粒輕骨料混凝土(LWAC)之間的澆筑結合面(疊合面)為疊合構件的薄弱部位.疊合面的黏結強度受兩側混凝土材料性能、澆筑間隔時間、疊合面受力狀態(tài)和疊合面處理方式等多種因素的綜合影響.其中,澆筑間隔時間在較短時間范圍內(nèi)變化時影響較明顯,且為非線性變化關系[1].在低靜水壓力情況下,新老混凝土黏結強度與疊合面上法向作用力近似呈線性關系[2].針對陶粒輕骨料混凝土和普通混凝土在較短時間間隔內(nèi)的疊合澆筑,文獻[3]在試驗分析基礎上提出具有內(nèi)部分層式速度間斷面的剪切破壞模型,將疊合澆筑的剪切破壞強度與剪切破壞面及破壞機構的形成、相關材料的特性相關聯(lián).考慮上述諸多因素及其相互之間的耦合影響,混凝土疊合面上的黏結強度影響表現(xiàn)為復雜關聯(lián)的非線性關系.雖然可通過多參數(shù)分組組合,采用多因素多水平方法對疊合面黏結強度的變化影響開展試驗分析,但有限的分組試驗、試驗數(shù)據(jù)的離散性等無法就各因素對黏結強度的變化和影響進行準確的預測分析.
BP 神經(jīng)網(wǎng)絡(BPNN)已廣泛應用于優(yōu)化混凝土配合比以及預測混凝土性能等方面,并取得了良好的預測效果[4-7].但BPNN 作為一種單一學習器,在預測準確率上仍存在一定的局限,模型的可解釋性不強,建模時神經(jīng)元個數(shù)和隱含層層數(shù)等模型結構參數(shù)的選擇尚無科學依據(jù),需要從實踐中總結經(jīng)驗.機器學習中的其他非線性模型,如隨機森林(RF)、自適應提升(AdaBoost)、極端梯度提升(XGB)和梯度提升決策樹(GBDT)等,是以決策樹(DT)為基本模型的集成學習方法,可將單一學習模型有機結合,形成一個統(tǒng)一模型,從而可獲得更準確可靠的預測學習結果.Tuan 等[8]采用XGB 學習方法根據(jù)混凝土材料組成和齡期對其立方體抗壓強度進行了準確地預測分析.相比較而言,GBDT 作為一種成熟的集成學習算法,將多個回歸樹模型串聯(lián)在一起,組成一個強學習器,其基本學習器回歸樹模型具有效率高、缺失值不明顯的特點[9],更注重學習模型的精度[10],具有高效、預測準確、對原始數(shù)據(jù)不敏感和可解釋性強等優(yōu)點[11-12].熱鍍力學性能學習模型的預測結果比較表明,GBDT、RF 和AdaBoost 這3 種集成學習模型在訓練效率、預測精度以及在測試數(shù)據(jù)上的泛化能力優(yōu)于BP 模型[13].其中,GBDT 模型的預測精度和泛化能力最好.有關GBDT 在混凝土材料及其相關領域的預測分析目前尚未見研究和報道.
本文設計制作了多組陶粒輕骨料混凝土與普通混凝土疊合試塊,對其進行了雙面直剪試驗;在此基礎上,采用GBDT 算法對疊合面的黏結強度進行建模預測分析;并與支持向量回歸(SVR)、K 近鄰回歸(KNN)、DT 和BPNN 這4 種經(jīng)典模型的預測結果進行了綜合對比.
GBDT 作為端到端的機器學習模型,預測結果依賴于訓練樣本集規(guī)模與樣本數(shù)據(jù)的可靠性等.石運良等[14]通過試驗和數(shù)值模擬2 種方式綜合獲取了樣本數(shù)據(jù).考慮到數(shù)值模擬結果在一定程度上依賴于試驗測試結果及數(shù)值模型的建立,本文所有樣本數(shù)據(jù)均基于多因素多水平的正交試驗.
設計制作尺寸為150 mm×150 mm×150 mm 的陶粒輕骨料混凝土與普通混凝土夾層疊合的雙面直剪試塊,如圖1所示.試塊澆筑時,先澆筑中間LWAC夾層部分,根據(jù)不同間隔時間再澆筑兩側NC 疊合層部分.圖1 中F為疊合面法向作用力,q為試驗作用均布荷載.LWAC 和NC 設計強度等級分別為LC30、C40.試驗所用輕骨料為粉煤灰高強陶粒,筒壓強度為8.4 MPa,堆積密度與表觀密度分別為988、1 796 kg/m3;普通粗骨料為5~15 mm 連續(xù)級配的石灰?guī)r碎石,堆積密度與表觀密度分別為1 323、2 464 kg/m3;水泥采用海螺牌P·O 42.5 普通硅酸鹽水泥;細骨料采用淡化后的中細海砂,粉煤灰采用鎮(zhèn)海電廠Ⅱ級粉煤灰;采用自來水進行攪拌.LWAC 和NC 的配合比及28 d立方體抗壓強度見表1.
表1 LWAC 和NC 的配合比及28 d 立方體抗壓強度Table 1 Mix proportion and 28 d cubic compressive strength of LWAC and NC
圖1 雙面疊合澆筑試塊及試驗加載示意圖Fig.1 Diagram of sandwich composite blocks and loading scheme(size:mm)
考慮疊合面法向作用力F和澆筑間隔時間的變化,疊合面處理方式考慮人工刷毛、粉煤灰砂漿涂刷和露骨料劑處理這3 種方式.人工刷毛后疊合面平均粗糙程度控制為2~3 mm.疊合面法向作用力F取0、12.5、25.0、37.5、50.0、75.0、100.0 kN;澆筑間隔時間取10 h 及2、7、14、28 d.根據(jù)多因素多水平正交試驗設計,選取具有代表性的參數(shù)組合進行36 組試驗,具體見表2.每組試驗包含3~5 個試塊,其中包括1~2 塊備用試塊,結果取平均值.各組試塊在實驗室標準養(yǎng)護28 d 后按照圖1 所示進行雙面直剪試驗.試驗加載采用接觸前位移控制、接觸后力控制的方式,加載速率取0.5~0.8 MPa/s.采用千斤頂對試塊分級施加法向荷載.
表2 試驗樣本分組Table 2 Groups of experimental samples
各試塊黏結強度如圖2 所示.由圖2 可見,試塊黏結強度隨法向作用力的變化明顯;試塊黏結強度前期隨澆筑間隔時間的變化明顯,當澆筑間隔時間超過7 d 后,其變化相對平緩.
圖2 各試塊黏結強度Fig.2 Bonding strength of composite blocks
LWAC 與NC 疊合澆筑時,黏結強度與疊合面處理方式、法向作用力、澆筑間隔時間之間存在復雜的非線性關系,所考慮的3 個因素之間又相互影響.GBDT 作為一種以分類回歸樹(CART)為基本模型的集成學習算法,由決策樹(decision tree)和梯度提升(gradient boosting)兩部分組成.其基本學習器是回歸樹,作用是通過構造一個函數(shù)來擬合數(shù)據(jù)集D中的元素,使均方 誤差最小.D={(x1,y1),(x2,y2),…,(xm,ym)}為包含m個訓練樣本的數(shù)據(jù)集,每個樣本由d個特征屬性描述,即:xj=[xj1,xj2,…,xjd];yj為對應樣本的疊合面黏結強度.多個回歸樹模型按照一定的結合策略組成得到GBDT 集成學習器.
通過疊合面處理方式、法向作用力和澆筑間隔時間等條件屬性,建立GBDT 集成學習拓撲模型,來預測陶粒輕骨料混凝土與普通混凝土疊合面的黏結強度,見圖3.圖3 中,Xi、Yi為相應的判據(jù)參數(shù);Si為回歸樹模型中相應葉節(jié)點.
圖3 GBDT 集成學習拓撲模型Fig.3 Topological model of GBDT ensemble learning algorithm
所建立的GBDT 模型基本算法流程如下:
(1)初始化基學習器f0(X):
式中:X=[x1,x2,…,xm];L(yj,α)為損失函數(shù),用于計算真實值與預測值之間的誤差;α為使損失函數(shù)最小化的常數(shù).
(2)建立一系列CART 回歸樹,利用梯度提升技術擬合殘差.在第k(k=1,2,…,K)次迭代中,對于每一個樣本(xj,yj),GBDT 規(guī)定將損失值的負梯度作為殘差估計值.本文選用平方損失函數(shù),該函數(shù)的一階導數(shù)連續(xù)且易于優(yōu)化,被廣泛應用于各種學習任務中.平方損失函數(shù)L表示如下:
故殘差估計值Rjk為:
(3)確定了殘差估計值后,利用CART 回歸樹進行擬合,得到第k棵樹的葉節(jié)點區(qū)域為cjk(j=1,2,…,J),J為回歸樹葉節(jié)點個數(shù).對于每個葉節(jié)點區(qū)域,可確定使對應平方損失函數(shù)最小化的最佳擬合值βjk:
(4)更新學習器fk(X):
式中:η為學習率.
(5)迭代結束之后,形成GBDT 強學習器F(X):
本文所建立的GBDT 模型將混凝土疊合面處理方式、法向作用力和澆筑間隔時間作為模型輸入特征參數(shù),模型輸出特征參數(shù)為混凝土疊合面的黏結強度.根據(jù)分組試驗共獲取36 組樣本數(shù)據(jù).模型在訓練和評估階段,一般采用隨機同分布和交叉驗證理論劃分訓練集、驗證集和測試集.本文在進行數(shù)據(jù)處理時,試驗結果取每組試塊試驗結果的平均值yˉ,各組之間不是重復性試驗.因此,按照5∶1 比例對總樣本數(shù)據(jù)進行劃分,即30 組樣本數(shù)據(jù)構成模型訓練樣本集,剩余6 組樣本數(shù)據(jù)作為模型測試樣本集.按此比例分3 次劃分訓練樣本集和測試樣本集,對GBDT模型進行3 次訓練和測試.
為了評價和檢驗GBDT 模型對疊合混凝土黏結強度的預測效果,本文同時建立了另外4 個經(jīng)典機器學習模型:SVR、KNN、DT 和BPNN,在輸入、輸出特征參數(shù)和樣本數(shù)據(jù)集劃分不變的情況下,通過對各模型進行具體參數(shù)調優(yōu)和訓練,綜合分析比較其預測結果.其中,SVR 通過尋找一個超曲面使期望風險最小,實現(xiàn)預測分析;KNN 算法利用距離其最近的K個“鄰居投票”原理進行預測;DT 模型基于樹的數(shù)據(jù)結構利用信息增益進行預測;BPNN 作為一種網(wǎng)狀結構,通過BP 算法進行訓練,學習某種規(guī)則,在給定輸入值時得到最接近期望輸出值的結果.
各模型預測結果采用擬合優(yōu)度(R2)進行評價對比.同時,參考平均絕對誤差(MAE)和均方根誤差(RMSE)指標對各模型預測效果進行綜合對比.其中,MAE 反映預測值和真實值之間的偏差,RMSE反映預測值和真實值之間差值的標準差,其具體計算方法如下:
式中:T為測試樣本總數(shù);pj為第j個測試樣本的模型預測值.
本文GBDT 模型采用網(wǎng)格搜索法,在建模數(shù)據(jù)集上對模型的4 個超參數(shù)進行優(yōu)化,其最優(yōu)參數(shù)決策樹個數(shù)為700,最大深度為3,葉節(jié)點最小樣本數(shù)為1,學習率為0.05;SVR 模型采用線性核函數(shù),懲罰參數(shù)C為10;KNN 模型超參數(shù)K設定為3,不考慮距離權重;對于DT 模型,采用均方差(MSE)作為結點分裂依據(jù),葉節(jié)點最少樣本數(shù)為1,不限制決策樹最大深度;BPNN 模型采用雙隱層,神經(jīng)元個數(shù)分別為4 和4,采用Sigmoid 激活函數(shù),優(yōu)化算法采用擬牛頓法(L-BFGS).
表3 給出了5 個模型經(jīng)過3 次訓練后,預測結果評價參數(shù)R2、MAE 和RMSE 的統(tǒng)計結果.其中,MAE 和RMSE 反映了模型對測試樣本集的預測精度及模型的泛化能力.由表3 可見:GBDT 模型的擬合優(yōu)度R2的平均值為0.976,優(yōu)于其他4 個預測模型,其次是BPNN 模型,表明在所給樣本集下GBDT 模型表現(xiàn)出更強的數(shù)據(jù)擬合能力;同時,GBDT 模型的MAE 和RMSE 均小于其他4 個預測模型.綜合對比表明,GBDT 模型的整體預測性能優(yōu)于其他模型,并具有較好的泛化能力.
表3 模型預測結果評價參數(shù)Table 3 Evaluation parameters of prediction results from models
表4 給出了各模型對第3 組測試樣本的預測結果及相對誤差.由表4 可見:在6 個測試樣本中,GBDT 模型在整體上可獲得滿意的預測結果,最小和最大相對誤差分別為2.90%和8.64%,總體相對誤差平均值為6.26%,明顯小于其他4 個學習模型的預測結果.
表4 各模型對第3 組測試樣本的預測結果及相對誤差Table 4 Predicted results and relative errors of the third group of samples by different models
圖4給出了GBDT 模型對3組測試樣本預測結果的相對誤差.由圖4可見,除個別測試樣本的相對誤差較明顯外,其余樣本預測結果的相對誤差均在±10%以內(nèi).不排除個別樣本的試驗結果可能存在較明顯誤差,從而對所建立模型的訓練和預測造成一定程度的數(shù)據(jù)“噪聲污染”,影響了模型的預測效果.
圖4 GBDT 模型對3 組測試樣本預測結果的相對誤差Fig.4 Relative errors of three sets of test samples from GBDT model
(1)與支持向量回歸、K 近鄰回歸、決策樹和BPNN 模型相比,GBDT 模型表現(xiàn)出良好的預測性能和泛化能力,在陶粒輕骨料混凝土與普通混凝土疊合面黏結強度預測分析中體現(xiàn)出良好的訓練和預測優(yōu)勢.
(2)所建立的GBDT 模型的預測結果平均相對誤差明顯小于其他4 種模型,表明GBDT 模型在未知數(shù)據(jù)上表現(xiàn)出較好的預測性能,可獲得整體滿意的預測精度.
(3)本文現(xiàn)階段試驗樣本數(shù)據(jù)仍較有限,僅考慮了疊合面處理方式、法向作用力和澆筑間隔時間這3 個輸入特征參數(shù).實際影響混凝土疊合面黏結性能的因素還包括混凝土材料性能、疊合面粗糙度和澆筑施工工藝等諸多因素.相關因素的篩選及其對混凝土疊合面黏結性能的影響和預測分析,以及機器學習模型的優(yōu)化、泛化等仍有待進一步深入研究.