梁 銘, 彭 浩, 解威威, 宋冠先, 朱孟龍, 張亞飛
(廣西路橋工程集團(tuán)有限公司, 廣西 南寧 530000)
據(jù)數(shù)據(jù)統(tǒng)計(jì),截至2020年底,全國(guó)共有特長(zhǎng)隧道1 175處,累計(jì)512.75萬(wàn)m[1]。伴隨巨大的建設(shè)規(guī)模,我國(guó)隧道整體向大埋深、長(zhǎng)洞線的方向轉(zhuǎn)變,選址遠(yuǎn)、高應(yīng)力、強(qiáng)巖溶、高水壓、構(gòu)造復(fù)雜等特點(diǎn)也逐步凸顯[2]。為應(yīng)對(duì)上述情況,保障隧道施工安全,如何進(jìn)一步提高超前地質(zhì)預(yù)報(bào)的合理性與準(zhǔn)確性成為隧道領(lǐng)域的研究重點(diǎn)。
就隧道超前地質(zhì)預(yù)報(bào)而言,常規(guī)的物探方法如地質(zhì)雷達(dá)、TSP、紅外探水等在預(yù)報(bào)距離、預(yù)報(bào)效果及操作難度等方面均存在不同程度的局限性,而鉆探法通過(guò)對(duì)掌子面前方巖體進(jìn)行物理鉆進(jìn),能直觀地反映未開(kāi)挖巖體的真實(shí)地質(zhì)信息[3-4]。但目前鉆探數(shù)據(jù)解譯工作主要依賴(lài)技術(shù)人員結(jié)合現(xiàn)場(chǎng)實(shí)際鉆探情況進(jìn)行,雖然鉆機(jī)搭載的隨鉆測(cè)量系統(tǒng)可實(shí)時(shí)記錄各項(xiàng)鉆探參數(shù),但通常只是作為解譯參考,并未被充分利用[5]??傮w而言,該種解譯方式未跳脫經(jīng)驗(yàn)判斷的范疇,較為粗糙,是一種“偽定量”解譯。
隨著大數(shù)據(jù)、人工智能等信息化技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)的理念已逐步滲入各個(gè)領(lǐng)域,為數(shù)據(jù)分析提供了新的思路[6]。近些年開(kāi)始有研究者將機(jī)器學(xué)習(xí)的方法引入到隧道超前地質(zhì)預(yù)報(bào)的數(shù)據(jù)定量解譯中,并已分別在TSP[7-8]、隧道掌子面圖片[9]、地質(zhì)雷達(dá)[10-11]等領(lǐng)域取得了一定的成果。在超前鉆探方面,由于在鉆進(jìn)的同時(shí)可提供大量與鉆進(jìn)深度相對(duì)應(yīng)的定量指標(biāo),如推進(jìn)速度、推進(jìn)力、轉(zhuǎn)矩、旋轉(zhuǎn)速度等,這為機(jī)器學(xué)習(xí)在超前鉆探地質(zhì)預(yù)報(bào)中的應(yīng)用提供了重要的數(shù)據(jù)基礎(chǔ)。因此,基于鉆探參數(shù)的超前鉆探圍巖質(zhì)量評(píng)價(jià)受到越來(lái)越多學(xué)者的重視。國(guó)內(nèi)如房昱緯等[12]針對(duì)復(fù)雜地層隧道施工,提出了一種基于神經(jīng)網(wǎng)絡(luò)的鉆探測(cè)試數(shù)據(jù)智能分析和地層識(shí)別方法,對(duì)不同地層的識(shí)別準(zhǔn)確率達(dá)到90%以上;邱道宏等[13]與Wang等[14]基于數(shù)字推進(jìn)技術(shù),分別利用量子遺傳(QGA)-徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)(SVM)對(duì)Ⅲ~Ⅴ級(jí)圍巖超前分類(lèi)進(jìn)行研究,實(shí)際工程應(yīng)用顯示分類(lèi)效果良好。國(guó)外如Galende-Hernández等[15]將三臂臺(tái)車(chē)的推進(jìn)速度、旋轉(zhuǎn)速度等8項(xiàng)鉆探參數(shù)與RMR法相結(jié)合,用于確定圍巖級(jí)別,預(yù)測(cè)錯(cuò)誤率僅為3%左右;Ghosh等[16]從23臺(tái)鉆機(jī)共186個(gè)鉆孔中收集了推進(jìn)速度、推進(jìn)壓力等4項(xiàng)鉆探參數(shù),利用機(jī)器學(xué)習(xí)對(duì)隧道掌子面前方巖體的空洞、塌方及破碎帶的預(yù)測(cè)展開(kāi)了研究。此外,在工程實(shí)用性方面,基于超前鉆探參數(shù)的圍巖智能質(zhì)量評(píng)價(jià)方法在鄭萬(wàn)鐵路的多條隧道得到了成功應(yīng)用[17]??梢灶A(yù)見(jiàn),基于鉆探數(shù)據(jù)定量解譯的鉆孔精細(xì)超前探測(cè)技術(shù)是未來(lái)隧道鉆探預(yù)報(bào)領(lǐng)域的重要發(fā)展趨勢(shì)[18]。
但以上研究普遍存在2個(gè)問(wèn)題: 1)大多以單一圍巖級(jí)別或地層屬性作為預(yù)測(cè)結(jié)果,對(duì)于隧道施工的指導(dǎo)意義有限; 2)通常以某單一斷面的預(yù)測(cè)結(jié)果對(duì)該斷面所在一定區(qū)間范圍內(nèi)的圍巖進(jìn)行質(zhì)量評(píng)價(jià),未能充分考慮該區(qū)間整體的巖體質(zhì)量,致使評(píng)價(jià)結(jié)果具備一定的偶然性與隨機(jī)性,且以斷面為單位極易受數(shù)據(jù)噪點(diǎn)的影響,從而進(jìn)一步使得評(píng)價(jià)結(jié)果的真實(shí)性不足。
針對(duì)上述問(wèn)題,本文提出以圍巖完整程度及圍巖級(jí)別組成隧道圍巖質(zhì)量評(píng)價(jià)雙標(biāo)簽,在對(duì)超前鉆探原始采樣數(shù)據(jù)進(jìn)行有針對(duì)性收集的基礎(chǔ)上,構(gòu)建適用于超前鉆探數(shù)據(jù)的預(yù)處理流程及機(jī)器學(xué)習(xí)模型,最終形成基于超前鉆探數(shù)據(jù)的隧道圍巖雙層質(zhì)量評(píng)價(jià)模型,以期為隧道巖體開(kāi)挖工法與支護(hù)措施的動(dòng)態(tài)調(diào)整提供可靠巖體質(zhì)量信息參考。
柳州經(jīng)合山至南寧三南高速公路鳳凰山隧道位于南寧市上林縣,隧道區(qū)屬巖溶峰叢洼地地貌。隧道設(shè)計(jì)長(zhǎng)度約為1 500 m,最大埋深約240 m。隧址區(qū)工程地質(zhì)條件復(fù)雜,主要穿越較破碎—破碎的中風(fēng)化灰?guī)r地層,且?guī)r溶較為發(fā)育,極易發(fā)生涌水突泥等不良地質(zhì)災(zāi)害。為保障隧道施工安全,現(xiàn)場(chǎng)使用Casagrande廠家生產(chǎn)的C6-2型多功能履帶式鉆機(jī)進(jìn)行超前鉆探作業(yè),并基于鉆探數(shù)據(jù)及現(xiàn)場(chǎng)情況進(jìn)行超前地質(zhì)預(yù)報(bào)。鳳凰山隧道超前鉆探作業(yè)如圖1所示。
圖1 鳳凰山隧道超前鉆探作業(yè)示意圖(單位: m)Fig. 1 Schematic of advance drilling operation of Fenghuangshan tunnel (unit: m)
根據(jù)前期已積累的超前鉆探地質(zhì)預(yù)報(bào)數(shù)據(jù),共收集包括YK109+118~+130(1號(hào)孔)、YK109+215~+235(1號(hào)孔)等鉆探采樣數(shù)據(jù)11 233條,數(shù)據(jù)涵蓋的隧道長(zhǎng)度累計(jì)約160 m,涉及到的數(shù)據(jù)標(biāo)簽在完整程度方面包括較完整、較破碎、破碎巖體及軟泥填充空腔共4類(lèi),在圍巖級(jí)別方面包括Ⅲ級(jí)、Ⅳ級(jí)與Ⅴ級(jí)共3類(lèi)。
在隧道超前鉆探過(guò)程中,隨鉆測(cè)量系統(tǒng)隨進(jìn)尺變化進(jìn)行隨機(jī)數(shù)據(jù)采樣,每m采集數(shù)據(jù)約50條。每條采樣數(shù)據(jù)除深度外主要包括4項(xiàng)一級(jí)指標(biāo): 推進(jìn)速度、推進(jìn)力、轉(zhuǎn)矩與旋轉(zhuǎn)速度。其中,推進(jìn)力與旋轉(zhuǎn)速度在鉆探之前根據(jù)圍巖質(zhì)量進(jìn)行預(yù)設(shè),并在鉆探過(guò)程中根據(jù)推進(jìn)的難易程度進(jìn)行適當(dāng)調(diào)節(jié)。隧道超前鉆探原始采樣數(shù)據(jù)(一級(jí)指標(biāo))如圖2所示。
(a) 推進(jìn)速度(b) 推進(jìn)力(c) 轉(zhuǎn)矩(d) 旋轉(zhuǎn)速度圖2 隧道超前鉆探原始采樣數(shù)據(jù)(一級(jí)指標(biāo))Fig. 2 Raw sampling data of advance drilling (first-level index)
通過(guò)對(duì)一級(jí)指標(biāo)的結(jié)構(gòu)特征進(jìn)行定性分析可知,其主要具備以下3個(gè)特點(diǎn):
1)采樣階段性。采樣過(guò)程呈現(xiàn)出明顯的階段劃分,即鉆探采樣開(kāi)始的上升段及采樣過(guò)程中的穩(wěn)定段。其中,上升段通常集中在0~0.5 m的進(jìn)尺范圍內(nèi),該范圍主要涉及空鉆及初噴混凝土鉆探,對(duì)圍巖質(zhì)量評(píng)價(jià)無(wú)參考意義。
2)數(shù)據(jù)非線性。各定量指標(biāo)之間呈現(xiàn)較為明顯的非線性相關(guān),4項(xiàng)一級(jí)指標(biāo)隨深度的采樣數(shù)據(jù)取值變化趨勢(shì)缺乏統(tǒng)一性與規(guī)律性。
3)離散程度大。推進(jìn)速度、轉(zhuǎn)矩與旋轉(zhuǎn)速度指標(biāo)的采樣數(shù)值都表現(xiàn)出了較大的離散性,具體的離散程度與不同質(zhì)量的圍巖密切相關(guān)。
超前鉆探一級(jí)指標(biāo)數(shù)據(jù)相關(guān)性分析如圖3所示,是通過(guò)定量的方法對(duì)所收集的4項(xiàng)一級(jí)指標(biāo)數(shù)據(jù)進(jìn)行分析。其中,主對(duì)角線以外的子圖表示推進(jìn)速度、推進(jìn)力、轉(zhuǎn)矩、旋轉(zhuǎn)速度兩兩指標(biāo)之間的散點(diǎn)圖,主對(duì)角線上的圖形表示各項(xiàng)指標(biāo)的核密度估計(jì)。由圖3可知: 1)4項(xiàng)一級(jí)指標(biāo)之間相關(guān)性較差,這點(diǎn)由位于對(duì)角線兩側(cè)的散點(diǎn)圖中的擬合關(guān)系線可以明顯看出; 2)由核密度估計(jì)分布圖像可以看出,各項(xiàng)一級(jí)指標(biāo)對(duì)應(yīng)圍巖完整程度與圍巖級(jí)別的區(qū)分度較差,即在同一分類(lèi)標(biāo)簽下,各指標(biāo)的分布范圍存在大量的重疊。
(a) 標(biāo)簽完整程度數(shù)據(jù)相關(guān)性分析 (b) 標(biāo)簽圍巖級(jí)別數(shù)據(jù)相關(guān)性分析圖3 超前鉆探一級(jí)指標(biāo)數(shù)據(jù)相關(guān)性分析Fig. 3 Correlation analysis of first-level index data of advance drilling
綜上可知,想要達(dá)到較為理想的多分類(lèi)效果,僅依賴(lài)一級(jí)指標(biāo)是不夠的,應(yīng)對(duì)原始采樣數(shù)據(jù)進(jìn)行預(yù)處理,以提高數(shù)據(jù)質(zhì)量。
在鉆探作業(yè)過(guò)程中,受作業(yè)環(huán)境、鉆機(jī)機(jī)械、鉆探人員操作等客觀因素影響,采集的大量一級(jí)指標(biāo)數(shù)據(jù)中難免存在異常數(shù)據(jù)以及一些特殊推進(jìn)狀態(tài)的數(shù)據(jù)。因此,在進(jìn)行機(jī)器學(xué)習(xí)模型的訓(xùn)練之前,需要對(duì)已有數(shù)據(jù)進(jìn)行降噪處理。針對(duì)超前鉆探原始采樣數(shù)據(jù),主要進(jìn)行的降噪處理措施有以下3項(xiàng):
1)上升段數(shù)據(jù)剔除。將原始采樣數(shù)據(jù)中的上升段(0~0.5 m)數(shù)據(jù)剔除,消除上升段無(wú)解譯價(jià)值數(shù)據(jù)對(duì)后續(xù)模型訓(xùn)練的影響。
2)缺失值數(shù)據(jù)填充。在鉆探數(shù)據(jù)采集時(shí),有時(shí)會(huì)因?yàn)闄C(jī)手的操作導(dǎo)致個(gè)別指標(biāo)的數(shù)據(jù)出現(xiàn)少量缺失,針對(duì)這種數(shù)據(jù)缺失的情況,采用均值填充策略對(duì)缺失值進(jìn)行填充。
3)貫入度異常的數(shù)據(jù)過(guò)濾。由于施工現(xiàn)場(chǎng)存在電磁噪聲和強(qiáng)機(jī)械振動(dòng),即使在正常掘進(jìn)工作狀態(tài),也有部分不正常的數(shù)據(jù)點(diǎn),非正常數(shù)據(jù)點(diǎn)的特征為數(shù)據(jù)的貫入度異常大或者異常小[19]。貫入度
P=v1/v2。
(1)
式中:v1為推進(jìn)速度;v2為旋轉(zhuǎn)速度。
根據(jù)貫入度的定義,對(duì)共計(jì)11 233條鉆探原始采樣數(shù)據(jù)的貫入度進(jìn)行計(jì)算,最終計(jì)算及統(tǒng)計(jì)結(jié)果如圖4所示。
圖4 一級(jí)指標(biāo)數(shù)據(jù)貫入度統(tǒng)計(jì)圖Fig. 4 Statistics of penetration degree of first-level index data
由圖4可知: 1)貫入度取值為0~2.5(因>2.5部分頻次過(guò)少,不予統(tǒng)計(jì)),且大致以P=1為分界點(diǎn),右側(cè)為軟泥填充空腔的一級(jí)指標(biāo)原始采樣數(shù)據(jù),左側(cè)為其余圍巖情況的一級(jí)指標(biāo)原始采樣數(shù)據(jù),且二者均近似呈正態(tài)分布;2)由累計(jì)頻率統(tǒng)計(jì)可以明顯發(fā)現(xiàn),貫入度多集中于0~0.9及1.2~1.8,前者累計(jì)92%,后者累計(jì)7.3%,二者共計(jì)99.3%。以此為依據(jù)并結(jié)合工程實(shí)際經(jīng)驗(yàn),將貫入度P(0.9~1.2)及P>1.8的數(shù)據(jù)進(jìn)行過(guò)濾。
選取YK109+215 ~ +235(1號(hào)孔)中前10 m的推進(jìn)速度原始采樣數(shù)據(jù)進(jìn)行舉例說(shuō)明,其數(shù)據(jù)降噪前后如圖5所示。
(a) 降噪前
(b) 降噪后圖5 一級(jí)指標(biāo)數(shù)據(jù)降噪效果(推進(jìn)速度為例)Fig. 5 Noise reduction effect of first-level index data (drilling rate)
為實(shí)現(xiàn)以段落為單位對(duì)圍巖質(zhì)量進(jìn)行評(píng)價(jià)的目的,在完成一級(jí)指標(biāo)數(shù)據(jù)的降噪處理后,進(jìn)行鉆探數(shù)據(jù)的等距分割。
考慮實(shí)際工程經(jīng)驗(yàn)與預(yù)報(bào)精確度,將數(shù)據(jù)分割間距定為0.5 m。同時(shí),為深度挖掘鉆探數(shù)據(jù)對(duì)應(yīng)不同圍巖質(zhì)量的數(shù)據(jù)規(guī)律,對(duì)指標(biāo)各自分割段內(nèi)的數(shù)據(jù)進(jìn)行二次計(jì)算,形成二級(jí)指標(biāo)作為最終機(jī)器學(xué)習(xí)模型數(shù)據(jù)集的特征。本文選取均值與方差作為二級(jí)指標(biāo),理由如下:
1)均值。不同圍巖質(zhì)量的鉆探數(shù)據(jù)都存在一定的取值范圍,均值是該取值范圍的重要體現(xiàn),且通過(guò)取均值的方式可以降低分割間距內(nèi)異常數(shù)據(jù)對(duì)整體真實(shí)數(shù)據(jù)的影響,從而提高預(yù)測(cè)結(jié)果的準(zhǔn)確率。均值
(2)
式中n為樣本數(shù)量。
2)方差。原始采樣數(shù)據(jù)會(huì)出現(xiàn)不同程度的振幅,即離散程度,離散程度的大小與不同質(zhì)量圍巖密切相關(guān)。通過(guò)取方差的方式可以較為科學(xué)與合理地反映各類(lèi)圍巖的采樣數(shù)據(jù)離散程度,從而提高預(yù)測(cè)結(jié)果的準(zhǔn)確率。方差
(3)
最終所形成的二級(jí)指標(biāo)體系包括: 推進(jìn)速度均值、推進(jìn)力均值、轉(zhuǎn)矩均值、旋轉(zhuǎn)速度均值、推進(jìn)速度方差、推進(jìn)力方差、轉(zhuǎn)矩方差、旋轉(zhuǎn)速度方差共8項(xiàng)。
為使機(jī)器學(xué)習(xí)模型識(shí)別所設(shè)置的標(biāo)簽,需要對(duì)數(shù)據(jù)集分類(lèi)標(biāo)簽進(jìn)行編碼設(shè)置,具體為: 雙層標(biāo)簽,即圍巖完整程度與圍巖級(jí)別分別編碼為Y1與Y2,前者按照較完整、較破碎、破碎與泥質(zhì)填充空腔的順序?qū)?biāo)簽依次編碼為“0”、“1”、“2”、“3”;后者按照Ⅲ、Ⅳ、Ⅴ級(jí)的順序?qū)?biāo)簽依次編碼為“0”、“1”、“2”。
最終,二維評(píng)價(jià)標(biāo)簽組合形式及分布情況如表1所示。
表1 二維評(píng)價(jià)標(biāo)簽組合形式及分布情況Table 1 Combination form and distribution of two-dimensional evaluation labels
在完成二級(jí)指標(biāo)的計(jì)算后,對(duì)8項(xiàng)二級(jí)指標(biāo)進(jìn)行相關(guān)性分析以剔除較高相關(guān)性的指標(biāo),其相關(guān)性分析熱力圖如圖6所示。由圖6可知,8項(xiàng)指標(biāo)之間相關(guān)性最高的2組為推進(jìn)速度方差與轉(zhuǎn)矩方差,相關(guān)系數(shù)為0.55,整體相關(guān)性較低,8項(xiàng)指標(biāo)均保留。
圖6 二級(jí)指標(biāo)相關(guān)性分析熱力圖Fig. 6 Secondary index correlation analysis heat map
作為集成算法中提升法(boosting)的代表算法,XGBoost通過(guò)在數(shù)據(jù)上逐一構(gòu)建多個(gè)弱評(píng)估器,經(jīng)過(guò)多次迭代逐漸累積并匯總多個(gè)弱評(píng)估器的建模結(jié)果,以獲取比單個(gè)模型更好的回歸或分類(lèi)表現(xiàn)[20]。這種以單個(gè)決策樹(shù)作為弱評(píng)估器的疊加策略,可表示成一種加法的形式,如式(5)所示[21]。
(5)
XGBoost引入了模型復(fù)雜度來(lái)衡量算法的運(yùn)算效率。因此,目標(biāo)函數(shù)Obj由傳統(tǒng)損失函數(shù)與模型復(fù)雜度2部分構(gòu)成,如式(6)所示。
(6)
目標(biāo)函數(shù)的最小值Objmin是衡量模型好壞的一個(gè)重要指標(biāo),其最小值越小,就認(rèn)為該模型的表現(xiàn)越好。Objmin運(yùn)算過(guò)程中共涉及的模型超參數(shù)多達(dá)近30個(gè),其中對(duì)模型影響程度最大[22]的主要有n_estimators、max_depth、learning_rate等6項(xiàng)。
針對(duì)XGBoost模型超參數(shù)眾多、人工調(diào)參無(wú)法發(fā)揮模型最優(yōu)性能的問(wèn)題,需要對(duì)其進(jìn)行全局參數(shù)自動(dòng)尋優(yōu)。遺傳算法(genetic algorithm,GA)是一類(lèi)通過(guò)模擬自然界生物自然選擇和自然進(jìn)化的隨機(jī)搜索算法,目前常被用于模型尋參及尋找最優(yōu)解的問(wèn)題之中[23],其算法偽代碼如圖7所示。
圖7 遺傳算法偽代碼Fig. 7 Pseudo-code transmission algorithm
在圖7的輸入?yún)?shù)中,maxf(X)為所要求解的最大約束優(yōu)化問(wèn)題;d為問(wèn)題的規(guī)模或維數(shù);N為初始種群個(gè)體;pc和pm分別為交叉與變異過(guò)程中的交叉概率與變異概率; MaxIt為該算法的迭代進(jìn)化次數(shù);P1(t)與P2(t)為迭代生成的臨時(shí)種群;Zi(t)與B(t)為第t次迭代后遺傳進(jìn)化產(chǎn)生的個(gè)體及其中的最優(yōu)個(gè)體。
分類(lèi)器鏈(classifier chains,CC)模型[24]作為一種最典型的基于問(wèn)題轉(zhuǎn)換策略的多標(biāo)簽分類(lèi)算法,因其簡(jiǎn)單易用而得到廣泛的應(yīng)用和發(fā)展[25],它通過(guò)將前面分類(lèi)器的結(jié)果添加到當(dāng)前分類(lèi)器來(lái)實(shí)現(xiàn)分類(lèi)器的串行連接,克服了模型在訓(xùn)練數(shù)據(jù)中忽略標(biāo)簽間相關(guān)關(guān)系的局限性,從而獲得了較好的預(yù)測(cè)性能。其主要步驟如下:
1)令X?Rk為k維實(shí)例輸入特征空間,Y={l1,l2,…,lq}標(biāo)簽的集合。由n個(gè)樣本數(shù)量組成的訓(xùn)練樣本集D,表示為D={(xi,yi)},i=1,2,…,n。xi=(xi,1,xi,2,…,xi,k)∈X是一個(gè)k維特征向量,xi,j代表特征向量xi的第j個(gè)元素,j=1,2,…,q。yi=(yi,1,yi,2,…,yi,q)∈{0,1}q表示一個(gè)q維的標(biāo)簽向量,其中yi,j=1表示標(biāo)號(hào)lj與xi相關(guān),而yi,j=0則表示與xi無(wú)關(guān)。設(shè)Yi?Y是與xi相關(guān)的標(biāo)記組成的集合,則有Yi={lj|yi,j=1,1≤j≤q}。
2)在訓(xùn)練準(zhǔn)備階段,首先,根據(jù)order命令,生成一個(gè)新的標(biāo)簽序列,記為{1,2,…,q}; 然后,CC模型按照分類(lèi)器鏈的序列訓(xùn)練一組二元分類(lèi)器f1,f2,f3,…,fq。
3)在訓(xùn)練階段,每個(gè)二元分類(lèi)器fj:X→{0,1}(j=1,2,3,…q)都是基于當(dāng)前標(biāo)簽lj同前j-1個(gè)標(biāo)簽l1,l2,…,lj-1的關(guān)聯(lián)性,從特定的派生訓(xùn)練數(shù)據(jù)集Dj={(xi,yi,1,yi,2,…,yi,j)}中訓(xùn)練得到的。該訓(xùn)練數(shù)據(jù)集Dj中的每個(gè)實(shí)例都是由原始數(shù)據(jù)集D中相對(duì)應(yīng)的實(shí)例(xi,yi)派生得到的。
實(shí)際工程經(jīng)驗(yàn)可知,隨著圍巖由較完整到破碎發(fā)展,總體上圍巖級(jí)別越來(lái)越高,且在探測(cè)到泥質(zhì)填充空腔的情況下直接判定為Ⅴ級(jí)圍巖?;谶@種標(biāo)簽之間存在相關(guān)性的情況,本文在XGBoost分類(lèi)模型與GA遺傳算法的基礎(chǔ)上,結(jié)合分類(lèi)器鏈組成CC-GA-XGBoost雙標(biāo)簽鏈?zhǔn)椒诸?lèi)模型,通過(guò)對(duì)完成預(yù)處理的超前鉆探數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,以實(shí)現(xiàn)對(duì)圍巖的雙層質(zhì)量評(píng)價(jià)。具體流程如圖8所示。
圖8 CC-GA-XGBoost模型構(gòu)建及應(yīng)用流程Fig. 8 CC-GA-XGBoost model construction
首先將數(shù)據(jù)集導(dǎo)入GA-XGBoost模型,以完整程度為基準(zhǔn)進(jìn)行超參數(shù)自動(dòng)尋優(yōu)處理。根據(jù)XGBoost模型尋參個(gè)數(shù)以及數(shù)據(jù)集復(fù)雜程度,設(shè)置初始種群數(shù)量為30,使用均勻交叉的方法進(jìn)行種群迭代,適應(yīng)度值定義為5折交叉驗(yàn)證的準(zhǔn)確率(accuracy),計(jì)算公式如式(7)所示。
accuracy=(TP+TN)/(TP+TN+FP+FN)。
(7)
式中: TP為正例預(yù)測(cè)正確的個(gè)數(shù); FP為負(fù)例預(yù)測(cè)錯(cuò)誤的個(gè)數(shù); TN為負(fù)例預(yù)測(cè)正確的個(gè)數(shù); FN為正例預(yù)測(cè)錯(cuò)誤的個(gè)數(shù)。
在迭代過(guò)程中,根據(jù)適應(yīng)度值每次從上一代中選擇出最優(yōu)的3個(gè)個(gè)體直接進(jìn)入下一代,突變概率設(shè)置為0.1,數(shù)據(jù)集劃分比例為7∶3,即70%數(shù)據(jù)用作訓(xùn)練,剩余30%用作預(yù)測(cè)。最終GA-XGBoost調(diào)參過(guò)程適應(yīng)度值的迭代變化如圖9所示。
圖9 最佳適應(yīng)度(accuracy)變化趨勢(shì)圖Fig. 9 Best fitness (accuracy) change trend chart
由圖9可知,經(jīng)過(guò)18次迭代之后,后續(xù)種群中個(gè)體適應(yīng)度的最大值、最小值與均值達(dá)到最高并保持穩(wěn)定。其中,最優(yōu)個(gè)體的適應(yīng)度值(最大值)為0.959 1,即個(gè)體所攜帶的XGBoost超參數(shù)組合使得模型預(yù)測(cè)準(zhǔn)確率為95.91%。具體參數(shù)如表2所示。
表2 XGBoost模型超參數(shù)取值Table 2 XGBoost model hyperparameter values
以參數(shù)尋優(yōu)后的XGBoost模型為基礎(chǔ),將鉆探數(shù)據(jù)的數(shù)據(jù)集導(dǎo)入CC-XGBoost進(jìn)行訓(xùn)練并預(yù)測(cè)雙標(biāo)簽多分類(lèi)結(jié)果,訓(xùn)練集鏈?zhǔn)疥P(guān)系設(shè)置為order=[0,1],數(shù)據(jù)劃分與4.1節(jié)保持一致。最終98例預(yù)測(cè)集樣本的雙標(biāo)簽預(yù)測(cè)結(jié)果如圖10所示,并根據(jù)式(8)—(10)對(duì)各準(zhǔn)確率進(jìn)行求解。
(a) 完整程度標(biāo)簽
(b) 圍巖級(jí)別標(biāo)簽圖10 CC-GA-XGBoost模型二維標(biāo)簽預(yù)測(cè)情況Fig. 10 CC-GA-XGBoost model forecast
accuracy(Y1)=A1/N。
(8)
accuracy(Y2)=A2/N。
(9)
accuracy(綜合)=A3/N。
(10)
式(8)—(10)中:A1為預(yù)測(cè)集中Y1標(biāo)簽預(yù)測(cè)正確的樣本數(shù)量;A2為預(yù)測(cè)集中Y2標(biāo)簽預(yù)測(cè)正確的樣本數(shù)量;A3為預(yù)測(cè)集中Y1、Y2標(biāo)簽全部預(yù)測(cè)正確的樣本數(shù)量;N為預(yù)測(cè)集中的總體樣本數(shù)量。
根據(jù)圖10與式(8)—(10)可得,圍巖完整程度標(biāo)簽下樣本錯(cuò)判4例,分類(lèi)準(zhǔn)確率為95.91%;圍巖級(jí)別標(biāo)簽下樣本錯(cuò)判2例,分類(lèi)準(zhǔn)確率為97.95%;二維標(biāo)簽共錯(cuò)判6例,最終綜合二維質(zhì)量評(píng)價(jià)準(zhǔn)確率為93.88%。通過(guò)對(duì)誤差數(shù)據(jù)進(jìn)行分析可知,在圍巖完整程度方面,模型錯(cuò)判集中在較破碎~破碎,在圍巖級(jí)別方面集中在Ⅲ~Ⅳ級(jí)圍巖,實(shí)際工程中二者分類(lèi)界限存在較強(qiáng)的模糊性,因此模型分類(lèi)結(jié)果也與實(shí)際經(jīng)驗(yàn)相符。
同時(shí),為了說(shuō)明GA與CC對(duì)XGBoost模型雙標(biāo)簽多分類(lèi)的優(yōu)化效果,分別將CC-GA-XGBoost與XGBoost、GA-XGBoost與CC-XGBoost模型進(jìn)行性能對(duì)比,結(jié)果如表3所示。
表3 XGBoost模型超參數(shù)取值Table 3 XGBoost model hyperparameter values
由表3可知: XGBoost模型在默認(rèn)超參數(shù)組合的狀態(tài)下,Y1完整程度與Y2圍巖級(jí)別的分類(lèi)準(zhǔn)確率分別為91.84%與92.85%,雙標(biāo)簽綜合分類(lèi)準(zhǔn)確率僅為88.78%;在配合GA超參數(shù)尋優(yōu)后,各項(xiàng)分類(lèi)準(zhǔn)確率均有所提高,分別為95.91%、96.93%與90.81%;與GA-XGBoost模型相比,CC-XGBoost僅能在默認(rèn)參數(shù)組合的前提下建立完整程度與圍巖級(jí)別之間的相關(guān)性,因此完整程度的分類(lèi)準(zhǔn)確率仍與單獨(dú)的XGBoost模型保持一致,為91.84%,但其優(yōu)化效果將圍巖級(jí)別的分類(lèi)準(zhǔn)確率提高至94.90%;本文CC-GA-XGBoost模型綜合了GA與CC模型的優(yōu)化效果,3項(xiàng)分類(lèi)準(zhǔn)確率最高。
最后,利用XGBoost所集成的樹(shù)模型特性對(duì)所用8項(xiàng)特征的重要度進(jìn)行分析,具體如圖11所示。
圖11 鉆探參數(shù)二級(jí)指標(biāo)特征重要性分析Fig. 11 Analysis on importance of secondary index of drilling
由圖11可知: 在模型所用的8項(xiàng)特征中,較為重要的有推進(jìn)速度方差、推進(jìn)速度均值以及推進(jìn)力均值,三者重要度均在0.15以上,其中,推進(jìn)速度方差的重要度最大達(dá)到了0.214;旋轉(zhuǎn)速度均值、轉(zhuǎn)矩均值與轉(zhuǎn)矩方差重要度一般,分別為0.128、0.118與0.109;推進(jìn)力方差與旋轉(zhuǎn)速度方差重要度最低,均低于0.1。通過(guò)分析不難發(fā)現(xiàn),除推進(jìn)力方差與旋轉(zhuǎn)速度方法外,其余6項(xiàng)特征在經(jīng)過(guò)模型學(xué)習(xí)與訓(xùn)練后均占有較高的分類(lèi)參考權(quán)重。推測(cè)原因?yàn)樵阢@探作業(yè)中,推進(jìn)力與旋轉(zhuǎn)速度2項(xiàng)鉆探參數(shù)通常是在鉆進(jìn)之前機(jī)手根據(jù)掌子面質(zhì)量情況進(jìn)行預(yù)設(shè),且在鉆探過(guò)程中僅進(jìn)行微調(diào),導(dǎo)致二者在同一鉆探區(qū)間、不同分割間距的方差數(shù)值波動(dòng)較小,無(wú)法在不同圍巖質(zhì)量的情況下形成明顯的差異性。
為實(shí)際驗(yàn)證CC-GA-XGBoost隧道圍巖雙層質(zhì)量評(píng)價(jià)模型的可用性,在鳳凰山隧道YK109+960 ~ +980里程段超前鉆探作業(yè)結(jié)束后,提取其鉆探數(shù)據(jù)進(jìn)行預(yù)測(cè)及說(shuō)明。該里程段的原始采樣數(shù)據(jù)如圖12所示。
圖12 YK109+960~+980一級(jí)指標(biāo)數(shù)據(jù)Fig. 12 First-level index data of section YK109+960~+980
提取該里程段的一級(jí)指標(biāo)原始采樣數(shù)據(jù),按照2.1—2.3節(jié)流程進(jìn)行數(shù)據(jù)預(yù)處理后,導(dǎo)入模型進(jìn)行圍巖雙層質(zhì)量評(píng)價(jià),同時(shí)與該里程段的常規(guī)技術(shù)人員鉆探預(yù)報(bào)結(jié)果以及地質(zhì)雷達(dá)預(yù)報(bào)結(jié)果進(jìn)行對(duì)比。該里程段圍巖質(zhì)量評(píng)價(jià)情況如表4所示(為方便展示,將模型預(yù)測(cè)結(jié)果中相同標(biāo)簽里程段進(jìn)行合并)。
表4 YK109+960~ +980里程段圍巖質(zhì)量評(píng)價(jià)情況Table 4 Surrounding rock quality evaluation of section YK109+960~+980
根據(jù)表4,從圍巖完整程度及圍巖級(jí)別2個(gè)層次,對(duì)YK109+960 ~+980里程段共20 m范圍的超前地質(zhì)預(yù)報(bào)總結(jié)如下: 1.0~5.5 m完整程度為較破碎,圍巖級(jí)別為Ⅲ級(jí); 5.5~13.0 m完整程度為較破碎—破碎,圍巖級(jí)別為Ⅳ級(jí); 13.0~13.5 m疑似軟泥填充空腔,圍巖級(jí)別為Ⅴ級(jí); 13.5~14.0 m整體完整程度為較破碎,圍巖級(jí)別為Ⅳ級(jí); 14.0~20.0 m整體完整程度為破碎,圍巖級(jí)別為Ⅴ級(jí),其中,16~16.5 m疑似軟泥填充空腔。
顯然,對(duì)比常規(guī)的超前鉆探預(yù)報(bào)結(jié)果以及地質(zhì)雷達(dá)預(yù)報(bào)結(jié)果,CC-GA-XGBoost隧道圍巖雙層質(zhì)量評(píng)價(jià)模型在實(shí)際工程應(yīng)用中可提供較為詳盡的預(yù)報(bào)解譯信息,根據(jù)數(shù)據(jù)等距分割的設(shè)定,最小精度為0.5 m,這對(duì)全面掌握隧道超前巖體的地質(zhì)信息較為有利。同時(shí),技術(shù)人員可以以雙層質(zhì)量評(píng)價(jià)結(jié)果為參考,對(duì)超前鉆探地質(zhì)預(yù)報(bào)進(jìn)行信息整合,以提高預(yù)測(cè)精度。目前,該方法已作為常規(guī)超前鉆探預(yù)報(bào)的輔助解譯技術(shù)在廣西地區(qū)的一些灰?guī)r隧道中進(jìn)行使用,預(yù)報(bào)準(zhǔn)確率滿(mǎn)足工程實(shí)際的需求。
本研究提出一種基于超前鉆探隨鉆定量數(shù)據(jù)與機(jī)器學(xué)習(xí)算法,對(duì)隧道完整程度與圍巖級(jí)別進(jìn)行雙層質(zhì)量評(píng)價(jià)的方法,并有如下結(jié)論:
1)針對(duì)隧道超前鉆探數(shù)據(jù)的定量解譯問(wèn)題,通過(guò)對(duì)鉆探采樣數(shù)據(jù)進(jìn)行定性與定量分析,以推進(jìn)速度、推進(jìn)力、轉(zhuǎn)矩與旋轉(zhuǎn)速度作為一級(jí)指標(biāo)體系,以圍巖完整程度與圍巖級(jí)別作為多分類(lèi)雙標(biāo)簽,并在此基礎(chǔ)上通過(guò)數(shù)據(jù)降噪、等距分割、二級(jí)指標(biāo)計(jì)算等數(shù)據(jù)預(yù)處理措施,有效提高了數(shù)據(jù)集質(zhì)量,為模型高精度預(yù)測(cè)提供了良好的數(shù)據(jù)基礎(chǔ)。
2)以XGBoost為分類(lèi)器模型,結(jié)合遺傳算法以及分類(lèi)器鏈構(gòu)成GA-CC-XGBoost圍巖雙層質(zhì)量評(píng)價(jià)模型,高效實(shí)現(xiàn)了復(fù)雜機(jī)器學(xué)習(xí)模型的超參數(shù)自動(dòng)尋優(yōu)問(wèn)題以及雙標(biāo)簽多分類(lèi)問(wèn)題中各標(biāo)簽內(nèi)在相關(guān)性的考慮,最終所構(gòu)建模型對(duì)完整程度與圍巖級(jí)別的分類(lèi)準(zhǔn)確率分別為95.91%與97.95%,綜合分類(lèi)準(zhǔn)確率為93.88%。
3)將所構(gòu)建模型應(yīng)用于實(shí)際隧道工程的超前鉆探地質(zhì)預(yù)報(bào)中,結(jié)果表明,預(yù)報(bào)效果優(yōu)于常規(guī)鉆探預(yù)報(bào)與地質(zhì)雷達(dá)預(yù)報(bào)。但應(yīng)當(dāng)注意到,模型預(yù)測(cè)效果與所提供鉆探數(shù)據(jù)的真實(shí)性、有效性密切相關(guān)。
本文僅對(duì)單一灰?guī)r隧道的圍巖雙層質(zhì)量評(píng)價(jià)進(jìn)行了研究,當(dāng)實(shí)際隧道工程地質(zhì)條件更為復(fù)雜,如穿越多種巖性地層、隧道地下水發(fā)育時(shí),如何考慮不同巖性的鉆探數(shù)據(jù)特征,以及地下水對(duì)超前鉆探數(shù)據(jù)特征的影響方式,對(duì)數(shù)據(jù)預(yù)處理措施及分類(lèi)模型進(jìn)行調(diào)整,是下一步需要研究的重點(diǎn)。