師學(xué)明,黃崇鈺,王 瑞,李斌才,鄭 洪
(1.中國(guó)地質(zhì)大學(xué) 地球物理與空間信息學(xué)院,湖北 武漢 430074;2.中鐵第四勘察設(shè)計(jì)院集團(tuán)有限公司,湖北 武漢 430063)
高密度電法具有裝置輕便、數(shù)據(jù)采集自動(dòng)化程度高、測(cè)點(diǎn)密度大、勘探精度高等優(yōu)點(diǎn),已成為灰?guī)r地區(qū)探測(cè)溶洞最有效的方法之一[1-4]。常規(guī)高密度電法資料解釋流程一般是先對(duì)高密度電法視電阻率數(shù)據(jù)進(jìn)行反演,然后基于反演視電阻率斷面圖,結(jié)合鉆孔和其他地質(zhì)資料進(jìn)行地質(zhì)解譯[5-7]。高密度電法數(shù)據(jù)反演方法有最小二乘法(如Res2dinv軟件)、共軛梯度法和高斯—牛頓法等[8]。這類線性化迭代反演方法存在解依賴于初始模型、反演結(jié)果具有多解性等問(wèn)題?;诙嘟獾姆囱萁Y(jié)果進(jìn)行地質(zhì)解譯,容易受到專業(yè)人員主觀因素影響。
隨著非線性反演和人工智能技術(shù)的發(fā)展,非線性反演[9]和基于深度學(xué)習(xí)的高密度電法數(shù)據(jù)智能反演方法技術(shù)已成為研究熱點(diǎn)。顏鐘(2012年)[10]針對(duì)土石壩研究對(duì)象,研究了基于BP神經(jīng)網(wǎng)絡(luò)的高密度電法智能反演方法,并應(yīng)用于土石壩實(shí)測(cè)數(shù)據(jù)的反演。朱聰聰?shù)热?2017年)[11]設(shè)計(jì)了三層隱含層的BP神經(jīng)網(wǎng)絡(luò),采用具有更好正演效果的ANSYS有限元軟件進(jìn)行數(shù)值模擬,生成用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的輸入數(shù)據(jù)和輸出數(shù)據(jù),訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)權(quán)值,通過(guò)工程實(shí)例證明該算法的反演精度優(yōu)于Res2dinv軟件。但BP神經(jīng)網(wǎng)絡(luò)存在著擬合效果嚴(yán)重依賴初始模型的問(wèn)題,需要進(jìn)一步進(jìn)行研究。張凌云(2011年)[12]利用SA、GA、ACO這三種算法的全局搜索優(yōu)勢(shì),對(duì)BP網(wǎng)絡(luò)算法的初始權(quán)值、閾值矩陣進(jìn)行優(yōu)化,顯著縮短了反演計(jì)算時(shí)間,提高了BP神經(jīng)網(wǎng)絡(luò)進(jìn)行電法數(shù)據(jù)反演的準(zhǔn)確率和反演精度。郭謙(2019)[13]采用深度學(xué)習(xí)算法,基于先驗(yàn)約束提高了電阻率的反演精度。
高密度電法視電阻率數(shù)據(jù)是地下電性分布的綜合反映,具有唯一性,也可作為定性分析與地質(zhì)解釋的依據(jù)。本文針對(duì)高密度電法傳統(tǒng)最小二乘反演方法依賴初始模型、存在多解性、反演結(jié)果解譯智能化程度低、解譯結(jié)果易受到專業(yè)人員主觀因素影響等問(wèn)題,從具有唯一性的視電阻率數(shù)據(jù)出發(fā),探索研究直接基于視電阻率的智能解譯方法技術(shù)。
高密度電法是陣列化的直流電阻率方法,其工作原理如圖1所示,通過(guò)在地表一次性布置n個(gè)電極(30~120),然后由電極轉(zhuǎn)換器自動(dòng)選擇不同電極作為供電電極和測(cè)量電極進(jìn)行視電阻率測(cè)量。這種方法在電極布置完成后可自動(dòng)進(jìn)行一條測(cè)線各種電法裝置(溫納α、斯倫貝爾、偶極—偶極裝置等)的視電阻率測(cè)量工作,具有數(shù)據(jù)采集自動(dòng)化程度高、視電阻率測(cè)點(diǎn)密度大、測(cè)量信息豐富、成本低、工作效率高等優(yōu)點(diǎn),在巖溶探測(cè)、環(huán)境調(diào)查等方面得到廣泛應(yīng)用。
高密度電法常用裝置有溫納α裝置(簡(jiǎn)稱溫納裝置)、斯倫貝爾裝置、偶極-偶極裝置、二極AM裝置、三極AMN&MNB裝置等,可根據(jù)探測(cè)目的靈活選擇合適的電極裝置。溫納裝置具有垂向分辨率高、信號(hào)強(qiáng)度大、探測(cè)深度適中、應(yīng)用廣泛等優(yōu)點(diǎn),本文選擇溫納裝置進(jìn)行研究。
圖1 高密度電法工作原理示意圖Fig.1 Schematic diagram of high-density electrical method
常規(guī)高密度電法資料處理與解釋流程一般為:數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)編輯、濾波、反演、綜合地質(zhì)解釋。
高密度電法數(shù)據(jù)反演存在多解性,不同迭代次數(shù)的反演結(jié)果往往差異很大。圖2(a)是武漢某地實(shí)測(cè)的高密度電法溫納裝置視電阻率斷面等值線圖。采用Res2dinv軟件對(duì)實(shí)測(cè)資料進(jìn)行反演,第2次、第3次和第5次迭代次數(shù)反演結(jié)果如圖2(b)~圖2(d)所示。從圖中可以看出,雖然不同迭代次數(shù)數(shù)據(jù)擬合誤差變化不大,擬合誤差在1.29 %~2.1 %,但是反演的電阻率剖面圖存在明顯差異。這給高密度電法資料解譯帶來(lái)較大的困難。所以在實(shí)際資料解釋時(shí),要結(jié)合鉆孔、地質(zhì)情況和觀測(cè)視電阻率斷面圖進(jìn)行綜合分析,解譯嚴(yán)重依賴人工經(jīng)驗(yàn)。
高密度電法視電阻率是地下電性異常體的綜合反映,具有唯一性。為此,本文直接基于高密度電法視電阻率斷面圖,采用深度學(xué)習(xí)算法,實(shí)現(xiàn)異常的智能解譯,提高解譯效率。
設(shè)計(jì)了1 400個(gè)不同填充類型、形狀、規(guī)模、數(shù)量的溶洞電性異常模型(地表水平),利用Res2dmod軟件進(jìn)行了正演數(shù)值模擬計(jì)算,用于構(gòu)建SSD算法的智能解譯學(xué)習(xí)樣本庫(kù)。圖3是Res2dmod設(shè)置的低阻巖溶地電模型與計(jì)算的溫納裝置視電阻率斷面圖。
圖2 實(shí)測(cè)高密度電法視電阻率和不同迭代次數(shù)反演電阻率斷面Fig.2 Measured apparent resistivity section and inversed resistivity section with different iteration using Res2dinv software
圖3 Res2dmod軟件高密度電法正演模擬斷面Fig.3 Schematic diagram of low resisitivity model and forward simulation result using Res2dmod software
基于深度學(xué)習(xí)的SSD(Single Shot Multi-Box Detector)目標(biāo)檢測(cè)算法,是Liu等[14]在2016年提出的一步到位(One-stage)的目標(biāo)檢測(cè)算法。SSD算法在Yolo(You Only Look Once)算法的基礎(chǔ)上改進(jìn)了三點(diǎn):①多尺度特征圖;②利用卷積進(jìn)行檢測(cè);③設(shè)置先驗(yàn)框。這些改進(jìn)使得SSD在準(zhǔn)確度上比Yolo更好,對(duì)于小目標(biāo)檢測(cè)效果也相對(duì)好一點(diǎn)。
SSD算法的主要思路是均勻地在圖片的不同位置進(jìn)行密集抽樣,抽樣時(shí)可以采用不同的尺度和長(zhǎng)寬比,然后利用卷積神經(jīng)網(wǎng)絡(luò)[15-18](Convolutional Neural Network,CNN)提取特征后直接進(jìn)行分類與回歸,整個(gè)過(guò)程只需要一步,算法速度快。其網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
圖4 SSD目標(biāo)檢測(cè)算法網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Network architecture of SSD object detection algorithm
從網(wǎng)絡(luò)結(jié)構(gòu)上分析,SSD目標(biāo)檢測(cè)網(wǎng)絡(luò)保留了VGG16中所有卷積層,利用conv4_3輸出圖片作為特征圖進(jìn)行目標(biāo)檢測(cè)[19],去掉了全連接層,并添加了額外的卷積層用于提取不同尺度的特征圖進(jìn)行目標(biāo)檢測(cè),在不同尺度的特征圖上產(chǎn)生先驗(yàn)框(Prior Box),與真實(shí)框(標(biāo)簽中設(shè)定)進(jìn)行匹配,進(jìn)行網(wǎng)絡(luò)權(quán)值的訓(xùn)練。
本文旨在實(shí)現(xiàn)高密度電阻率法溫納裝置視電阻率異常的智能解譯,需要從視電阻率斷面圖中智能解譯出地下電性異常體的類別、位置和規(guī)模。為此,將視電阻率斷面圖作為深度學(xué)習(xí)的輸入數(shù)據(jù),地下電性異常體的類別、位置和規(guī)模作為標(biāo)簽數(shù)據(jù),然后用SSD算法進(jìn)行學(xué)習(xí)訓(xùn)練。
一般而言,深度學(xué)習(xí)中的目標(biāo)檢測(cè)算法輸入圖像通常為*.jpg、*.png格式,標(biāo)簽的制作通過(guò)利用Labelimg軟件進(jìn)行手工標(biāo)注,其工作界面如圖5所示,操作人員使用鼠標(biāo)框選出目標(biāo)體的真實(shí)框(Ground Truth),得到目標(biāo)的位置和規(guī)模信息,再對(duì)其進(jìn)行類別的設(shè)置,需要耗費(fèi)大量的人力和時(shí)間。
圖5 Labelimg軟件操作界面Fig.5 Labelimg software operation interface
本文高密度電法異常智能解譯學(xué)習(xí)樣本庫(kù)的構(gòu)建流程如下:
1)使用Python語(yǔ)言批量生成用于巖溶電阻率模型*.mod文件;
2)將*.mod文件導(dǎo)入Res2dmod軟件中,進(jìn)行視電阻率正演計(jì)算并保存視電阻率斷面圖,得到深度學(xué)習(xí)訓(xùn)練的輸入數(shù)據(jù);
3)使用Python語(yǔ)言設(shè)計(jì)程序,根據(jù)電阻率模型生成包含電性異常體類別、位置和規(guī)模信息的*.xml格式文件,文件內(nèi)容如圖6所示。
本文構(gòu)建的高密度電法溫納裝置視電阻率異常智能解譯學(xué)習(xí)樣本庫(kù),共包含1 400個(gè)樣本。每個(gè)樣本中電極數(shù)設(shè)為60,剖面長(zhǎng)度59 m,有限探測(cè)深度(AB/6)為10 m。背景地層為灰?guī)r,電阻率設(shè)為800 Ω·m,全填充型溶洞和未填充型溶洞的電阻率分別設(shè)為100 Ω·m和5 000 Ω·m,溶洞位置隨機(jī)分布在地下1~10 m、水平范圍10~50 m的地下空間。學(xué)習(xí)樣本庫(kù)信息如表1所示。
SSD目標(biāo)檢測(cè)算法的實(shí)現(xiàn)基于TensorFlow框架,使用Python編程語(yǔ)言,計(jì)算機(jī)配置參數(shù)如表2所示。
圖6 目標(biāo)檢測(cè)算法標(biāo)簽文件Fig.6 Target detection algorithm label file
表1 學(xué)習(xí)樣本庫(kù)信息
表2 計(jì)算機(jī)配置
將視電阻率異常智能解譯樣本庫(kù)中的樣本按照9∶1的比例隨機(jī)劃分為訓(xùn)練集和驗(yàn)證集,其中訓(xùn)練集用于訓(xùn)練網(wǎng)絡(luò)權(quán)值,驗(yàn)證集的樣本不參與網(wǎng)絡(luò)訓(xùn)練,劃分驗(yàn)證集的目的是在訓(xùn)練過(guò)程中實(shí)時(shí)觀察損失函數(shù)的下降情況,以便在損失函數(shù)收斂效果不好的情況下對(duì)超參數(shù)進(jìn)行動(dòng)態(tài)調(diào)整,訓(xùn)練超參數(shù)如表3所示。
訓(xùn)練批次是指將所有數(shù)據(jù)輸入給網(wǎng)絡(luò)完成前向計(jì)算與誤差反向傳播的總次數(shù),在訓(xùn)練起始批次,損失值下降速度較快,然后下降趨勢(shì)逐漸變緩。需要注意的是,訓(xùn)練批次并不是越多越好,過(guò)度訓(xùn)練可能會(huì)造成過(guò)擬合問(wèn)題。批處理大小是指在每次迭代中,將一批數(shù)據(jù)送入神經(jīng)網(wǎng)絡(luò),計(jì)算它們的損失函數(shù),然后反向傳播誤差,更新模型參數(shù)。批處理的大小可以是任意值,通常在幾十到幾百之間,取決于硬件設(shè)備的內(nèi)存大小和計(jì)算性能。批處理值越大,每次更新模型的方差越小,模型訓(xùn)練的穩(wěn)定性也越高,但是計(jì)算速度可能會(huì)降低。學(xué)習(xí)率控制要調(diào)整網(wǎng)絡(luò)的權(quán)重,以符合梯度損失。值越低,沿著梯度下降越慢。Dropout層是在訓(xùn)練過(guò)程中將部分神經(jīng)元失活,可以提高訓(xùn)練效率,并有效緩解過(guò)擬合現(xiàn)象。Adam優(yōu)化器具有計(jì)算效率高、適用于不穩(wěn)定的目標(biāo)函數(shù)、可自適應(yīng)地調(diào)整學(xué)習(xí)率、可有效處理梯度稀疏問(wèn)題等優(yōu)點(diǎn)。ReLU激活函數(shù)是現(xiàn)在使用較為廣泛的一種深度學(xué)習(xí)激活函數(shù),它具有計(jì)算效率高、可緩解過(guò)擬合問(wèn)題等優(yōu)點(diǎn)。
表3 SSD算法學(xué)習(xí)訓(xùn)練的超參數(shù)設(shè)置
圖7是網(wǎng)絡(luò)訓(xùn)練的損失函數(shù)下降曲線。圖中紅色實(shí)線是訓(xùn)練集損失函數(shù),橙色實(shí)線是驗(yàn)證集損失函數(shù),綠色虛線是光滑后的訓(xùn)練集損失函數(shù),褐色虛線是光滑后的驗(yàn)證集損失函數(shù)。從圖7中可以看出,隨著深度學(xué)習(xí)訓(xùn)練輪次(Eoch)的增加,訓(xùn)練集和驗(yàn)證集損失函數(shù)先是快速下降,然后是緩慢下降。訓(xùn)練50輪次之后,已達(dá)到最佳訓(xùn)練效果。
訓(xùn)練過(guò)程中,網(wǎng)絡(luò)性能指標(biāo)如圖8所示。圖8(a)是未填充型溶洞的查全率(Recall)曲線,圖8(b)是填充型溶洞的查全率曲線,圖8(c)是未填充型溶洞的查準(zhǔn)率曲線,圖8(d)是填充型溶洞的查準(zhǔn)率曲線。從圖8可以看出,當(dāng)閾值選定為0.5(Score_threshold = 0.5)時(shí),未填充型溶洞的查準(zhǔn)率可達(dá)90 %,填充型溶洞查準(zhǔn)率可達(dá)79.49 %。
圖9是溶洞地質(zhì)病害體的智能解譯平均精度圖。mAP(Mean Average Precsion)是衡量算法精確度的重要指標(biāo),是任務(wù)中多類目標(biāo)AP的平均值,每類目標(biāo)體都可以計(jì)算出其查準(zhǔn)率和查全率,每個(gè)類都可以得到一條P-R曲線,AP就是取0~1之間的recall值對(duì)應(yīng)的precision再求平均。mean的意思是對(duì)每個(gè)類的AP再求平均,得到mAP值,大小在[0,1]區(qū)間。mAP值越高,表明網(wǎng)絡(luò)學(xué)習(xí)效果越好。從圖9可以看出,通過(guò)50個(gè)輪次訓(xùn)練,未填充型溶洞的AP值達(dá)94 %,填充型溶洞的AP值達(dá)88 %,多目標(biāo)mAP值為90.68 %,網(wǎng)絡(luò)學(xué)習(xí)取得了較好效果。
圖8 網(wǎng)絡(luò)性能指標(biāo)曲線Fig.8 Network performance of indicators recall and precision
圖9 巖溶地質(zhì)病害體的智能解譯平均精度Fig.9 Intelligent interpretation of karst caves mAP
使用保存的網(wǎng)絡(luò)模型(包含網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)值)對(duì)高密度電法溫納裝置的視電阻率異常進(jìn)行智能解譯數(shù)值試驗(yàn),檢測(cè)SSD智能算法的解譯效果和效率。
對(duì)單個(gè)溶洞視電阻率異常進(jìn)行智能解譯。溶洞地電模型中,電極數(shù)為60,電極距為1 m,剖面長(zhǎng)度59 m,測(cè)線左端為坐標(biāo)原點(diǎn),背景地層為灰?guī)r,電阻率800 Ω·m,全填充溶洞和未填充溶洞電阻率分別為100 Ω·m和5 000 Ω·m,溶洞類型為未填充型溶洞,規(guī)模為2 m×2 m,中心位置(30 m,2 m),如圖10(a)所示。
采用SSD算法進(jìn)行智能解譯的結(jié)果如圖10(b)所示。智能解譯耗時(shí)約0.62 s。從圖10可知,SSD網(wǎng)絡(luò)能準(zhǔn)確地將異常解譯為填充型溶洞,置信度為0.60,溶洞異常體水平長(zhǎng)度為2.08 m,超出實(shí)際規(guī)模0.08 m,垂向厚度為1.96 m,比溶洞小0.04 m,誤差僅為厘米級(jí)。根據(jù)預(yù)測(cè)框左、右、上、下邊界位置計(jì)算的異常體中心位置為(29.84 m,2.04 m),與真實(shí)的(30 m,2 m)非常接近,智能解譯效果好,精度高。
圖10 未填充型溶洞地電模型與智能解譯結(jié)果Fig.10 Electrical model and artificial intelligent interpretation results of unfilled karst cave
對(duì)多個(gè)溶洞模型視電阻率異常進(jìn)行智能解譯。多溶洞地電模型為:地下存在一個(gè)填充型溶洞和一個(gè)未填充型溶洞。未填充型溶洞的規(guī)模為4 m×2.5 m,中心位置(20 m,2.25 m),填充型溶洞規(guī)模為5 m×5 m,中心位置(40 m,4 m),如圖11(a)所示。
采用SSD算法進(jìn)行智能解譯的結(jié)果如圖11(b)所示。智能解譯耗時(shí)約0.63 s。從圖11可知,SSD網(wǎng)絡(luò)能準(zhǔn)確地將異常解譯為1個(gè)未填充型溶洞和1個(gè)填充型溶洞。剖面左邊的非填充型溶洞的水平長(zhǎng)度和厚度分別為4.19 m和2.54 m,分別超出實(shí)際規(guī)模0.19 m和0.04 m,中心位置為(20.02 m,2.56 m),與真實(shí)位置(20 m,2.5 m)相比,誤差為厘米級(jí);剖面右邊的填充型溶洞的水平長(zhǎng)度和厚度分別為5.56 m和4.14 m,分別比實(shí)際規(guī)模小0.44 m和0.86 m,中心位置為(40.00 m,4.22 m),與真實(shí)位置(40 m,4 m)相比,非常接近,智能解譯效果好,精度高。
圖11 多溶洞地電模型與智能解譯結(jié)果Fig.11 Electrical model and artificial intelligent interpretation results of two karst caves
本文基于SSD目標(biāo)檢測(cè)算法開展了高密度電法視電阻率異常智能解譯方法技術(shù)研究,構(gòu)建了1 400個(gè)巖溶電阻率模型的智能解譯學(xué)習(xí)樣本庫(kù),訓(xùn)練了SSD網(wǎng)絡(luò)模型,實(shí)現(xiàn)了基于深度學(xué)習(xí)的視電阻率異常的智能解譯方法技術(shù)。
理論模型結(jié)果表明:SSD算法能夠根據(jù)高密度電法溫納裝置視電阻率斷面圖,獲取地下巖溶異常體的類別、規(guī)模和位置信息,各類目標(biāo)平均準(zhǔn)確率為90.68 %,單個(gè)剖面數(shù)據(jù)智能解譯耗時(shí)不到1 s,智能解譯誤差為厘米級(jí)。
野外環(huán)境復(fù)雜多變,為進(jìn)一步提高SSD算法的實(shí)用性,正在研究包含地形、地層起伏、復(fù)雜異常等因素制作訓(xùn)練數(shù)據(jù)集,并增加訓(xùn)練樣本的數(shù)量,提高高密度電法智能解譯的智能化水平。