張紀(jì)奧, 馬懷祥, 王承震, 李東升, 喬卉卉
(1.石家莊鐵道大學(xué) 機(jī)械工程學(xué)院,河北 石家莊 050043;2.中鐵十四局集團(tuán)有限公司, 山東 濟(jì)南 250014)
盾構(gòu)機(jī)作為隧道與地下工程建設(shè)的專用裝備,具有安全環(huán)保、掘進(jìn)速度快和勞動(dòng)強(qiáng)度低等優(yōu)點(diǎn),在盾構(gòu)施工過程中,其掘進(jìn)速度是裝備運(yùn)行操控與項(xiàng)目施工規(guī)劃的參考依據(jù)[1],因此,對(duì)盾構(gòu)機(jī)掘進(jìn)速度進(jìn)行預(yù)測研究具有重要工程意義。
近年來,國內(nèi)外學(xué)者對(duì)此主要進(jìn)行了理論模型、經(jīng)驗(yàn)?zāi)P秃椭悄苣P头矫娴难芯?。在理論模型研究方?張厚美等[2]修正了掘進(jìn)速度與總推力、刀盤扭矩的計(jì)算公式;王洪新等[3]對(duì)土倉壓力、總推力、螺旋機(jī)轉(zhuǎn)速和掘進(jìn)速度間關(guān)系的數(shù)學(xué)表達(dá)式進(jìn)行了推導(dǎo)。在經(jīng)驗(yàn)?zāi)P脱芯糠矫?李杰等[4]采用多元非線性回歸建立了復(fù)合地層下掘進(jìn)速度的預(yù)測模型;于云龍等[5]通過對(duì)原始掘進(jìn)參數(shù)進(jìn)行二次轉(zhuǎn)換,修正了盾構(gòu)機(jī)傳統(tǒng)掘進(jìn)速度模型。在智能模型研究方面,隨著大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)被廣泛應(yīng)用于盾構(gòu)掘進(jìn)預(yù)測中。黃靚鈺等[6]、林春金等[7]、孫偉良等[8]采用BP神經(jīng)網(wǎng)絡(luò)建立了掘進(jìn)參數(shù)、土倉壓力和地表沉降的預(yù)測模型;GAO et al[9]使用循環(huán)神經(jīng)網(wǎng)絡(luò)、長短時(shí)記憶網(wǎng)絡(luò)和門控循環(huán)單元建立了盾構(gòu)掘進(jìn)參數(shù)的預(yù)測模型;ELBAZ et al[10]將卷積神經(jīng)網(wǎng)絡(luò)和基于聚類算法的長短時(shí)記憶網(wǎng)絡(luò)相結(jié)合,實(shí)現(xiàn)了盾構(gòu)機(jī)掘進(jìn)系統(tǒng)的能耗預(yù)測。
目前在盾構(gòu)機(jī)掘進(jìn)參數(shù)預(yù)測研究中,所用數(shù)據(jù)多為掘進(jìn)循環(huán)下的參數(shù)均值,在工程施工初期,數(shù)據(jù)量不足會(huì)導(dǎo)致上述模型的預(yù)測效果降低,且現(xiàn)有研究大多依托某單一工程,缺乏不同工程下預(yù)測模型的適用性研究。鑒于此,依托南京長江隧道工程和蕪湖過江隧道工程,采用遷移學(xué)習(xí)策略,提出一種基于混合指標(biāo)分級(jí)的CNN-BiLSTM遷移預(yù)測模型。首先,在已完成工程上對(duì)盾構(gòu)機(jī)混合指標(biāo)進(jìn)行k-means聚類分級(jí),構(gòu)建CNN-BiLSTM模型進(jìn)行預(yù)訓(xùn)練;然后,對(duì)新工程上的混合指標(biāo)等級(jí)進(jìn)行判別,并將預(yù)訓(xùn)練模型應(yīng)用到新工程上進(jìn)行微調(diào),使預(yù)測模型在舊工程下學(xué)習(xí)到的特征知識(shí)能更好地應(yīng)用到新工程中。
南京長江隧道位于江蘇省南京市,橫越長江南北兩岸,全長5 850 m。盾構(gòu)段施工部分為左右兩線,采用2臺(tái)海瑞克泥水式盾構(gòu)同時(shí)施工,刀盤開挖直徑為14.96 m,左右線從浦口區(qū)同向始發(fā)。隧道地層斷面如圖1所示[11],盾構(gòu)隧道分別穿越淤泥質(zhì)粉質(zhì)黏土地層、粉細(xì)砂地層、礫砂地層、圓礫地層和強(qiáng)風(fēng)化泥巖地層。
圖1 南京長江隧道地質(zhì)斷面圖(單位:m)
蕪湖城南過江隧道位于安徽省蕪湖市長江大橋和長江二橋之間,長約4.9 km。采用2臺(tái)氣墊式泥水平衡盾構(gòu),刀盤開挖直徑為15.07 m,盾構(gòu)從江北同向先后始發(fā),分別穿越長江后,在江南接收[12]。地質(zhì)斷面如圖2所示,盾構(gòu)隧道分別穿越粉細(xì)砂、泥質(zhì)粉砂巖、凝灰角礫巖和粉質(zhì)黏土等多種地層。
圖2 蕪湖過江隧道地質(zhì)斷面圖
圖3 不同狀態(tài)下掘進(jìn)速度
施工過程中,盾構(gòu)機(jī)數(shù)據(jù)監(jiān)測系統(tǒng)會(huì)對(duì)掘進(jìn)參數(shù)進(jìn)行采集保存,在管片安裝、設(shè)備維護(hù)和其他情況下,監(jiān)測系統(tǒng)通常會(huì)連續(xù)工作,導(dǎo)致大量的無效數(shù)據(jù)被保存下來。以南京長江隧道工程部分掘進(jìn)速度為例,如圖3所示,其中每個(gè)樣本點(diǎn)為盾構(gòu)機(jī)監(jiān)測系統(tǒng)的采樣點(diǎn),采樣間隔為10 s。
將盾構(gòu)機(jī)的總推力、掘進(jìn)速度和刀盤扭矩作為劃分工作狀態(tài)和停機(jī)狀態(tài)的指標(biāo)[13],式(1)、式(2)為指示函數(shù),將導(dǎo)致的數(shù)據(jù)認(rèn)為是停機(jī)狀態(tài)下的數(shù)據(jù),進(jìn)行清洗。
F(X)=f(F)f(V)f(T)
(1)
(2)
k-means算法作為一種非層次聚類算法,通過迭代過程把數(shù)據(jù)集劃分為不同類別,并逐次更新聚類中心直至達(dá)到要求的精度[14]?;静襟E為:首先,隨機(jī)選取個(gè)初始聚類中心;然后,將每個(gè)數(shù)據(jù)點(diǎn)分配到距離最近的聚類中心所在簇中;最后,計(jì)算每個(gè)簇中數(shù)據(jù)點(diǎn)均值,并將其作為新的聚類中心,重復(fù)以上2個(gè)步驟,直至收斂或達(dá)到最大迭代數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)是一種常用的深度學(xué)習(xí)模型,由卷積層、池化層和全連接層構(gòu)成,具有一定的深度結(jié)構(gòu)與自主學(xué)習(xí)能力,通過模擬人腦系統(tǒng),對(duì)輸入信息進(jìn)行處理,提取主要信息特征[15]。卷積核作為CNN的核心部分,對(duì)數(shù)據(jù)進(jìn)行卷積操作提取數(shù)據(jù)的內(nèi)部特征,表示為
Cj=f(wi?Ai+bi)
(3)
式中,f為激活函數(shù);wi為權(quán)值矩陣;?為卷積操作;bi為偏置矩陣。
長短時(shí)記憶網(wǎng)絡(luò)(LSTM)通過引入輸入門、輸出門和遺忘門來解決梯度消失問題。LSTM的核心結(jié)構(gòu)為記憶細(xì)胞,包含一個(gè)細(xì)胞狀態(tài)c、一個(gè)隱藏狀態(tài)h,其神經(jīng)元的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。BiLSTM是一種雙向循環(huán)神經(jīng)網(wǎng)絡(luò)模型,如圖5所示,可同時(shí)考慮輸入序列的前向和后向信息,能夠更好捕捉上下數(shù)據(jù)特征,提升模型預(yù)測精度和特征數(shù)據(jù)利用率[16],其核心結(jié)構(gòu)為2個(gè)方向相反的LSTM模型構(gòu)成的堆疊結(jié)構(gòu),正向LSTM從前向后遍歷輸入序列,反向LSTM從后往前遍歷輸入序列,正向和反向過程均有其隱藏狀態(tài)h和細(xì)胞狀態(tài)c。
圖4 LSTM網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖5 BiLSTM網(wǎng)絡(luò)結(jié)構(gòu)示意圖
在新工程掘進(jìn)初期數(shù)據(jù)量不足的情況下,提出一種基于混合指標(biāo)分級(jí)的CNN-BiLSTM遷移預(yù)測模型。首先,以南京長江隧道工程數(shù)據(jù)為源域數(shù)據(jù),對(duì)混合指標(biāo)進(jìn)行聚類分級(jí),以蕪湖過江隧道工程數(shù)據(jù)為目標(biāo)域數(shù)據(jù),判斷該工程上混合指標(biāo)的對(duì)應(yīng)等級(jí);然后,構(gòu)建模型在源域的相應(yīng)等級(jí)數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,將模型遷移至目標(biāo)域進(jìn)行微調(diào);最后,實(shí)現(xiàn)在施工初期少量數(shù)據(jù)下盾構(gòu)掘進(jìn)速度的預(yù)測。
為降低不同工程下盾構(gòu)機(jī)型號(hào)、地質(zhì)信息和施工環(huán)境等信息對(duì)模型的影響,引入場切深指數(shù)(FPI)、扭矩切深指數(shù)(TPI)、掘進(jìn)比能(SE)和切割系數(shù)(C)[17]4種混合指標(biāo)進(jìn)行聚類分級(jí),4種指標(biāo)的計(jì)算公式為
(4)
(5)
(6)
(7)
式中,F為刀盤總推力;n為刀盤上刀具數(shù)量;P為貫入度;T為刀盤扭矩;r為刀具力矩半徑;R為刀盤半徑。
由于施工過程中刀具磨損會(huì)造成持續(xù)變化,難以確定具體數(shù)值,故忽略刀具力矩半徑對(duì)切割系數(shù)的影響,將式(7)簡化為
(8)
對(duì)南京長江隧道工程中盾構(gòu)機(jī)采集的掘進(jìn)參數(shù)進(jìn)行混合指標(biāo)計(jì)算,4種指標(biāo)變化趨勢如圖6所示。FPI指數(shù)描述了盾構(gòu)機(jī)在單位貫入度下所需推進(jìn)力,反映盾構(gòu)機(jī)與土體的相互作用,既考慮了地質(zhì)因素影響,又考慮到機(jī)器設(shè)備影響,通過FPI指數(shù)可以快速估算巖石強(qiáng)度。TPI指數(shù)描述了盾構(gòu)機(jī)在單位貫入度下所需刀盤扭矩,同F(xiàn)PI指數(shù)的考慮類似,能夠?qū)Χ軜?gòu)機(jī)掘進(jìn)狀態(tài)進(jìn)行更加完整的表述。掘進(jìn)比能SE表示盾構(gòu)機(jī)在掘進(jìn)單位體積土體時(shí)所需能量,主要用于刀具開挖土體和盾殼克服摩擦力向前推進(jìn)。切割系數(shù)C反映了刀盤總推力和刀盤扭矩之間的關(guān)系,主要受地質(zhì)狀況和刀具磨損的影響。
圖6 混合指標(biāo)趨勢圖
為避免不同指標(biāo)物理量綱的影響,聚類之前對(duì)指標(biāo)進(jìn)行歸一化處理,具體為
(9)
式中,x′為參數(shù)處理后的值;x為當(dāng)前參數(shù)值;xmax、xmin分別為參數(shù)樣本的最大值、最小值。
引入DB指數(shù)評(píng)價(jià)聚類效果,該指數(shù)通過計(jì)算每個(gè)簇與其他簇之間的平均距離和每個(gè)簇內(nèi)元素之間的平均距離之和的比值來度量聚類的性能,最優(yōu)聚類結(jié)果對(duì)應(yīng)的DB值越小越好。對(duì)上述混合指標(biāo)進(jìn)行聚類后對(duì)應(yīng)的DB指數(shù)如圖7所示??芍?dāng)聚類數(shù)為4時(shí),聚類效果最優(yōu),選取k=4對(duì)混合指標(biāo)進(jìn)行聚類,聚類后各環(huán)在混合指標(biāo)上的等級(jí)如圖8所示。
圖7 不同聚類數(shù)下DB指數(shù)
圖8 南京長江隧道各環(huán)聚類等級(jí)
以蕪湖過江隧道工程建設(shè)初期第13、14環(huán)掘進(jìn)參數(shù)為對(duì)象,計(jì)算可知,其混合指標(biāo)距離南京長江隧道工程中第3個(gè)聚類中心距離最近,因此選取南京長江隧道工程第3等級(jí)下212~228環(huán)掘進(jìn)參數(shù)對(duì)模型進(jìn)行預(yù)訓(xùn)練,以蕪湖過江隧道工程中第13環(huán)掘進(jìn)參數(shù)對(duì)模型進(jìn)行微調(diào),第14環(huán)掘進(jìn)參數(shù)對(duì)模型進(jìn)行驗(yàn)證。
取前一采樣時(shí)刻的掘進(jìn)速度、總推力、刀盤扭矩、刀盤轉(zhuǎn)速、貫入度、進(jìn)漿流量、出漿流量、氣墊倉壓力和泥水倉壓力作為輸入數(shù)據(jù),搭建CNN-BiLSTM預(yù)測模型。采用式(9)歸一化方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,下一時(shí)刻的掘進(jìn)速度為輸出數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練。其中CNN層包含2層1D-CNN,卷積核數(shù)目為32和64,卷積核大小為3,激活函數(shù)為relu函數(shù),池化層大小為2。BiLSTM層包含2層BiLSTM,神經(jīng)元數(shù)量為32和64,激活函數(shù)為tan h,添加Dropout正則化防止模型過擬合。最后添加一層全連接層(Dense)作為模型輸出,即下一采樣時(shí)刻的掘進(jìn)速度。
3.2.1 模型預(yù)訓(xùn)練
在源域(南京長江隧道212~228環(huán))上選取相應(yīng)參數(shù)對(duì)模型進(jìn)行預(yù)訓(xùn)練,共5 410條樣本,取前5 000條作為訓(xùn)練集,后410條作為測試集對(duì)模型進(jìn)行驗(yàn)證,其中測試集樣本包括第227環(huán)部分穩(wěn)定掘進(jìn)段以及第228環(huán)上升段和穩(wěn)定掘進(jìn)段,預(yù)測效果如圖9所示??梢钥闯?模型能夠較好地預(yù)測掘進(jìn)速度的變化,明顯預(yù)測掘進(jìn)過程中速度波動(dòng)點(diǎn),選取MAE、RMSE為評(píng)價(jià)指標(biāo),并與CNN模型、LSTM模型、BiLSTM模型進(jìn)行對(duì)比,結(jié)果如表1所示??芍狢NN-BiLSTM模型在預(yù)測精度上均優(yōu)于其他模型,選取該模型可更好地提取輸入數(shù)據(jù)的特征,反映掘進(jìn)速度和其他掘進(jìn)參數(shù)之間的映射關(guān)系。
表1 不同預(yù)測模型性能比較
3.2.2 模型微調(diào)
將預(yù)訓(xùn)練模型中的CNN層和BiLSTM層凍結(jié),在目標(biāo)域(蕪湖過江隧道)上選取第13環(huán)相應(yīng)數(shù)據(jù)對(duì)模型全連接層進(jìn)行微調(diào),在第14環(huán)上進(jìn)行預(yù)測,并與不經(jīng)遷移學(xué)習(xí)預(yù)測結(jié)果進(jìn)行對(duì)比,效果如圖10所示。
圖9 源域預(yù)測效果
圖10 目標(biāo)域預(yù)測效果
由圖10可以看出,模型遷移后可準(zhǔn)確預(yù)測目標(biāo)域掘進(jìn)速度的變化,反映其變化規(guī)律,在評(píng)價(jià)指標(biāo)MAE和RMSE上的表現(xiàn)分別為1.44和1.92。無遷移模型由于數(shù)據(jù)量較少,產(chǎn)生過擬合現(xiàn)象,無法正確反映掘進(jìn)速度的變化,由此可知遷移學(xué)習(xí)預(yù)測模型在工程建設(shè)初期的必要性。
(1)采用k-means聚類方法,基于FPI、TPI、SE、C4種混合指標(biāo),可對(duì)盾構(gòu)機(jī)的掘進(jìn)進(jìn)行聚類分級(jí)判定。
(2)建立的CNN-BiLSTM預(yù)測模型,其在源域和目標(biāo)域上的掘進(jìn)速度預(yù)測值可以很好地?cái)M合實(shí)測數(shù)據(jù),在源域上的MAE和RMSE為1.94和2.57,擬合效果優(yōu)于CNN、LSTM、BiLSTM模型,在目標(biāo)域上的MAE和RMSE為1.44和1.92。
(3)所提模型采用遷移學(xué)習(xí)策略后,可有效解決在盾構(gòu)掘進(jìn)初期數(shù)據(jù)量較少的情況下,深度預(yù)測模型產(chǎn)生的過擬合問題,在工程施工初期具有一定指導(dǎo)意義。