閆星宇 顧漢明* 羅紅梅 閆有平
(①中國(guó)地質(zhì)大學(xué)(武漢)地球物理與空間信息學(xué)院,湖北武漢430074; ②地球內(nèi)部多尺度成像湖北省重點(diǎn)實(shí)驗(yàn)室,湖北武漢430074;③中國(guó)石化勝利油田分公司勘探開(kāi)發(fā)研究院,山東東營(yíng)257015; ④中石化工程地球物理有限公司華北分公司,河南鄭州 450000)
地震相可以理解為沉積相在地震資料上反射特征的總和,為分析地質(zhì)條件和預(yù)測(cè)油氣藏提供了參考。早期的地震相分析通常需要解釋人員根據(jù)專業(yè)知識(shí)與地區(qū)經(jīng)驗(yàn),以人的視覺(jué)為基礎(chǔ),通過(guò)地震波運(yùn)動(dòng)學(xué)幾何特征參數(shù)進(jìn)行地震相識(shí)別[1-2]; 或是根據(jù)客觀的地震屬性[3],按一定的程序?qū)Φ卣鹣鄦卧M(jìn)行識(shí)別和作圖。這些傳統(tǒng)的地震相識(shí)別方法通常需要大量的人工操作,并且結(jié)果不可避免地受到一些主觀因素的影響。因此,有必要研究一種快速有效的地震相分類方法,減少地震資料解釋人員的人工操作。
近年來(lái),深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺(jué)等領(lǐng)域取得了重大進(jìn)展,基于地震資料解釋與計(jì)算機(jī)視覺(jué)間的相似性,許多學(xué)者使用能夠自動(dòng)提取有用特征的卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行地震相的分類及預(yù)測(cè)。段玉順等[4]運(yùn)用人工神經(jīng)網(wǎng)絡(luò)分析技術(shù)對(duì)地震道波形及其反映的地質(zhì)特征進(jìn)行自動(dòng)識(shí)別和分類; Jesper[5]使用VGG16網(wǎng)絡(luò)模型識(shí)別地震相; Zhao[6]使用編碼—解碼模型對(duì)小塊數(shù)據(jù)進(jìn)行地震相分類;Lei等[7]使用了一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的地震波形分類方法,對(duì)地震相進(jìn)行分類; Qi等[8]將地震屬性與機(jī)器學(xué)習(xí)技術(shù)相結(jié)合,從而達(dá)到地震相預(yù)測(cè)的目的。這些用于地震相識(shí)別的CNN架構(gòu)大多是在卷積層之后附加全連接層,只能進(jìn)行圖像級(jí)別的地震相分類及預(yù)測(cè),或是選擇局部窗口遍歷地震圖像上的每個(gè)像素以進(jìn)行預(yù)測(cè),精度有限且消耗大量的計(jì)算時(shí)間。因此,用于解決語(yǔ)義分割問(wèn)題的全卷積神經(jīng)網(wǎng)絡(luò)(FCN)開(kāi)始被應(yīng)用于地震資料智能解釋之中。
FCN模型全部采用卷積層結(jié)構(gòu)。Wu等[9]、Shi等[10]首先將帶有跳躍連接結(jié)構(gòu)的U-Net模型分別應(yīng)用于斷層識(shí)別和鹽丘識(shí)別,結(jié)果表明基于圖像分割技術(shù)的U-Net模型對(duì)于疊后地震數(shù)據(jù)的目標(biāo)檢測(cè)具有良好的效果。之后,Alaudah等[11]提出用一種弱監(jiān)督學(xué)習(xí)方法預(yù)測(cè)地震相,可以大幅度地減少人工制作標(biāo)簽數(shù)據(jù)的耗時(shí),但其識(shí)別精度遠(yuǎn)低于主流的強(qiáng)監(jiān)督學(xué)習(xí)。Mukhopadhyay等[12]使用了基于貝葉斯SegNet模型的深度學(xué)習(xí)方法,能夠在識(shí)別地震相的同時(shí)評(píng)判預(yù)測(cè)結(jié)果的不確定性,但貝葉斯深度學(xué)習(xí)方法會(huì)消耗大量的計(jì)算時(shí)間,不適用于大型數(shù)據(jù)。Zhang等[13]使用了在圖像分割領(lǐng)域較先進(jìn)的DeepLab v3+模型,對(duì)F3工區(qū)進(jìn)行地震相識(shí)別并取得了良好的效果,但該網(wǎng)絡(luò)模型結(jié)構(gòu)復(fù)雜,參數(shù)較多,更勝任具有大量訓(xùn)練數(shù)據(jù)的復(fù)雜圖像分割任務(wù),相較一些輕量級(jí)網(wǎng)絡(luò)模型而言泛化性較差。
上述圖像分割技術(shù)所用框架均基于FCN模型,在識(shí)別地震相時(shí),雖然可以有效地提取地震相的邊緣、紋理等絕對(duì)特征,但忽略了存在于圖像中相鄰像素之間的約束關(guān)系,無(wú)法有效地處理場(chǎng)景之間的關(guān)系和全局信息。不同于識(shí)別鹽丘、斷層這類在地震剖面上與背景圍巖具有明顯差異的二分類目標(biāo),圖像分割技術(shù)在地震相識(shí)別中存在以下問(wèn)題: ①地震相識(shí)別需要分類的種類較多,且不同地震相之間可能會(huì)存在相似的地震波場(chǎng)特征,僅根據(jù)視覺(jué)紋理特征難以區(qū)分; ②地震相分布遵循沉積規(guī)律,在縱向上具有一定的空間分布特征,判別地震相時(shí),需要參考其所在空間位置,而上述網(wǎng)絡(luò)模型缺乏這種獲取空間先驗(yàn)信息的能力; ③地震相的邊界往往是不同沉積層的交界,也是巖石礦物質(zhì)逐漸轉(zhuǎn)變的過(guò)渡帶,模型對(duì)地震相邊界的識(shí)別結(jié)果具有較高的不確定性,這一方面會(huì)影響模型對(duì)邊界識(shí)別的效果,另一方面,現(xiàn)有地震相識(shí)別技術(shù)缺乏一個(gè)關(guān)于預(yù)測(cè)結(jié)果不確定性的評(píng)價(jià)體系。基于以上問(wèn)題,本文提出一套適用于地震相識(shí)別和預(yù)測(cè)評(píng)價(jià)的深度學(xué)習(xí)方法。
本文對(duì)U-Net模型進(jìn)行了改進(jìn),在網(wǎng)絡(luò)末端加入一種金字塔池化模塊(Pyramid Pooling Module,PPM),該模塊由多種不同尺度的卷積核組成,可以提取不同等級(jí)的特征信息,使模型能夠并行考慮多個(gè)接收域下的目標(biāo)特征,獲取包含不同尺度、不同子區(qū)域間關(guān)系的分層信息,從而更綜合地考慮地震剖面各個(gè)深度上的全局空間信息。同時(shí),對(duì)目標(biāo)函數(shù)進(jìn)行了改進(jìn),在交叉熵函數(shù)(用于評(píng)價(jià)每個(gè)像素點(diǎn)分類準(zhǔn)確性)基礎(chǔ)上,添加了用于評(píng)價(jià)圖像分割效果的Dice指數(shù),該指數(shù)衡量預(yù)測(cè)樣本與真實(shí)樣本之間的重疊程度。將兩部分函數(shù)通過(guò)加權(quán)組合在一起,一并更新梯度,既能保證地震相分類的正確性又能保證少數(shù)類地震相邊界刻畫(huà)的準(zhǔn)確性。最后,針對(duì)現(xiàn)有深度學(xué)習(xí)技術(shù)缺乏對(duì)模型預(yù)測(cè)結(jié)果的不確定性分析的情形,本文提出用“預(yù)測(cè)信息熵”這一概念進(jìn)行評(píng)估與可視化展現(xiàn)。
地震相的空間分布存在一定的規(guī)律,所以地震剖面上空間分布的先驗(yàn)信息,對(duì)于地震相劃分起著至關(guān)重要的作用。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)因其結(jié)構(gòu)所限,信息流動(dòng)局限在當(dāng)前像素周圍的局部區(qū)域中,對(duì)于獲取空間位置這種大范圍的上、下文信息和表達(dá)能力有限。為了彌補(bǔ)先驗(yàn)信息的不足,本文選擇了一種適用于地震相分類識(shí)別的深度學(xué)習(xí)網(wǎng)絡(luò)模型——U-Net模型,該模型特有的跳躍結(jié)構(gòu)能夠融合淺層與深層信息,在處理疊后地震數(shù)據(jù)目標(biāo)識(shí)別問(wèn)題時(shí)具有優(yōu)秀的表現(xiàn)[9-10],且網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)簡(jiǎn)單,參數(shù)較少,不易導(dǎo)致過(guò)擬合。因此,本次試驗(yàn)選擇U-Net模型為基礎(chǔ)模型,并在末端加入一種能融合多尺度特征的PPM模塊[14],其具體結(jié)構(gòu)如圖1所示。
圖1 用于地震相分類識(shí)別的全卷積神經(jīng)網(wǎng)絡(luò)模型
圖1中每個(gè)立方體展示了輸入地震剖面在經(jīng)過(guò)各層后輸出的特征圖的維度及尺寸。該網(wǎng)絡(luò)模型以U-Net模型[5]為框架,分為編碼和解碼兩部分。編碼部分每層包含卷積核尺寸為3×3的兩個(gè)卷積層以及池化核尺寸為2×2的一個(gè)最大池化層,輸入地震剖面在經(jīng)過(guò)編碼部分每層的計(jì)算后,圖像尺寸逐層減半,通道數(shù)逐層翻倍直至1024; 解碼部分每層包含核尺寸為3×3的兩個(gè)卷積層及核尺寸為2×2的一個(gè)上采樣層,可將特征圖的尺寸還原到原始大小,并將通道數(shù)從1024依次壓縮到64。在深度神經(jīng)網(wǎng)絡(luò)中,淺層網(wǎng)絡(luò)輸出的特征圖分辨率高,保留有更多細(xì)節(jié)信息;深層網(wǎng)絡(luò)學(xué)習(xí)輸出的特征則更加抽象,保留了更多語(yǔ)義信息。U-Net模型在解碼部分將網(wǎng)絡(luò)中具有相同尺寸的特征圖通過(guò)跳躍結(jié)構(gòu)(藍(lán)色箭頭)進(jìn)行連接,從而改善上采樣過(guò)程中信息不足的問(wèn)題。
輸入地震剖面在經(jīng)過(guò)U-Net模型的編碼—解碼過(guò)程后,提取出較為精確的地震相紋理特征。在深度神經(jīng)網(wǎng)絡(luò)中,接收域的大小可以在一定程度上體現(xiàn)模型使用的上、下文信息量[14]。但U-Net等大多數(shù)網(wǎng)絡(luò)模型只能提取單一接收域大小的目標(biāo)特征,這使網(wǎng)絡(luò)結(jié)構(gòu)無(wú)法充分獲取重要的上、下文信息。因此,希望改進(jìn)后的網(wǎng)絡(luò)能并行考慮多個(gè)接收域的目標(biāo)特征,獲取包含不同尺度、不同子區(qū)域間關(guān)系的分層全局信息。
為了解決上述問(wèn)題,本文在U-Net模型中添加了PPM模塊,即將之前提取的特征圖分別經(jīng)過(guò)不同尺寸的平均池化層,輸出尺寸為1×1、2×2、3×3、6×6四個(gè)等級(jí)的特征圖,其中最粗糙的1×1平均池化是全局尺度的池化,其余層次的池化層會(huì)將特征圖劃分為不同子區(qū)域,并分別帶有不同程度的語(yǔ)義信息和邊緣精度信息,最終結(jié)合起來(lái)可展現(xiàn)較完整的空間信息。為了保證全局特征的權(quán)重,四個(gè)級(jí)別的特征圖經(jīng)由1×1的卷積核將通道數(shù)分別降為原來(lái)的1/4,再分別通過(guò)上采樣獲得未池化前的尺寸,與未經(jīng)過(guò)PPM模塊的特征圖合并在一起。在經(jīng)過(guò)最終的卷積層后,輸出每一像素點(diǎn)上對(duì)應(yīng)的地震相分類結(jié)果。
模型中所有的上采樣過(guò)程均采用雙線性插值。改進(jìn)后的網(wǎng)絡(luò)模型在保證U-Net模型分類精度的基礎(chǔ)上,通過(guò)PPM模塊提取不同等級(jí)的特征信息,聚合了不同區(qū)域的上、下文信息,提高了模型獲取全局信息的能力。
在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,能夠評(píng)估網(wǎng)絡(luò)性能的函數(shù)被稱為目標(biāo)函數(shù)或損失函數(shù)。本文深度學(xué)習(xí)模型所處理的問(wèn)題可以被看成一個(gè)逐像素點(diǎn)的地震圖像多分類任務(wù)。傳統(tǒng)的多分類問(wèn)題一般使用多元交叉熵?fù)p失函數(shù)[15],但該損失函數(shù)是逐像素計(jì)算,不考慮鄰域的標(biāo)簽,對(duì)于在數(shù)據(jù)中占比較少的地震相分割效果較差。因此,本文所用的目標(biāo)函數(shù)在傳統(tǒng)多元交叉熵?fù)p失函數(shù)的基礎(chǔ)上加入了Dice指數(shù)損失函數(shù)[16],分別用于評(píng)價(jià)模型對(duì)每一像素點(diǎn)的分類效果與整體圖像分割效果。多元交叉熵(LCE)損失函數(shù)表達(dá)式為
(1)
式中:C為地震相的總類數(shù);N為輸入地震剖面上所包含的像素點(diǎn)總數(shù);yc,n為標(biāo)簽數(shù)據(jù),即實(shí)際地震剖面上第n個(gè)像素點(diǎn)是否為第c類地震相,若是則為1,不是則為0;zc,n為神經(jīng)網(wǎng)絡(luò)最終輸出的結(jié)果,其物理意義可以理解為該點(diǎn)被預(yù)測(cè)為第c類地震相的可能性;pc,n是對(duì)zc,n進(jìn)行softmax函數(shù)歸一化后的結(jié)果,使其值分布于0到1之間,更加符合概率的意義。
由式(1)可見(jiàn),交叉熵?fù)p失函數(shù)將每一個(gè)像素點(diǎn)都視作獨(dú)立的存在,分別計(jì)算每個(gè)像素點(diǎn)的交叉熵并求和,這使該損失函數(shù)不能把握全局的信息,導(dǎo)致分割出來(lái)的地震相形狀與真實(shí)值差異較大,邊界分割效果較差。尤其被用于不均衡數(shù)據(jù)集的預(yù)測(cè)時(shí),為了使交叉熵函數(shù)更容易達(dá)到最小值,模型會(huì)傾向于把最大的權(quán)重分給數(shù)量最多的類別,最終導(dǎo)致模型忽略占比較小的地震相特征。在實(shí)際地震剖面上,占比較小的地震相往往是鹽丘等異常體,數(shù)量雖少但尤為重要。因此,本文引入可以評(píng)價(jià)整體分割效果的Dice損失函數(shù)解決上述問(wèn)題。Dice指數(shù)是一種集合相似度度量函數(shù),可以體現(xiàn)兩個(gè)區(qū)域輪廓的相似程度,取值范圍為[0,1],表達(dá)式為
(2)
式中:A∩B為A和B之間的交集; |A|和|B|分別為A和B的元素的個(gè)數(shù)。用于地震相預(yù)測(cè)時(shí),Dice損失函數(shù)可以寫(xiě)作如下形式
(3)
式中ε為平滑值,本次研究取值為1,在防止分母為0的同時(shí)也可以防止模型的過(guò)擬合。
Dice損失函數(shù)通過(guò)計(jì)算分類概率圖和真實(shí)分割圖中所有像素點(diǎn)的誤差,最大程度地衡量?jī)烧呦嗨菩?,使預(yù)測(cè)結(jié)果與標(biāo)簽盡可能重合。一方面減小不均衡數(shù)據(jù)對(duì)模型訓(xùn)練的影響,另一方面有助于分割出來(lái)的地震相邊界變得相對(duì)清晰,且形狀與真實(shí)值相似,增強(qiáng)地震相邊界的分割效果。最終的目標(biāo)函數(shù)Lloss為式(1)與式(3)的線性加權(quán)組合,即
Lloss=LCE+eLDice
(4)
式中e為Dice損失函數(shù)的權(quán)重。
實(shí)驗(yàn)訓(xùn)練數(shù)據(jù)選用北海F3工區(qū)公開(kāi)數(shù)據(jù)。該工區(qū)位于荷蘭北部,發(fā)育大型河控三角洲體系。主測(cè)線從100 到700,共600條剖面,701道。從地震剖面上可以識(shí)別一些地震反射結(jié)構(gòu): 空白反射、雜亂反射、平行—亞平行反射、疊瓦狀反射等。測(cè)井資料顯示空白反射結(jié)構(gòu)由巖性均一的砂巖或泥巖構(gòu)成; 雜亂反射結(jié)構(gòu)表示滑塌沉積; 斜坡沉積底部的疊瓦狀反射結(jié)構(gòu)顯示為砂質(zhì)濁積巖[17]。如圖2所示,參考F3工區(qū)測(cè)井資料對(duì)三維地震數(shù)據(jù)體進(jìn)行人工地震相解釋,以此作為訓(xùn)練數(shù)據(jù)的標(biāo)簽,主要根據(jù)巖性差異對(duì)地震相進(jìn)行分類。將工區(qū)數(shù)據(jù)體中的300到700號(hào)剖面作為訓(xùn)練集; 100到299號(hào)剖面作為測(cè)試集,用于評(píng)估模型的預(yù)測(cè)效果。
圖2 F3工區(qū)訓(xùn)練數(shù)據(jù)
現(xiàn)有的深度學(xué)習(xí)方法會(huì)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行翻轉(zhuǎn)、鏡像復(fù)制等數(shù)據(jù)增廣操作,以增加樣本的數(shù)量和多樣性,但這種方法應(yīng)用于地震相數(shù)據(jù)時(shí)會(huì)破壞地震相原有的形態(tài)與空間分布規(guī)律。一方面,隨著地層深度的增加地震波會(huì)逐漸衰減,導(dǎo)致主頻降低;另一方面,一些本該出現(xiàn)在深層的地震相在經(jīng)翻轉(zhuǎn)后會(huì)出現(xiàn)在淺層,從而違背地質(zhì)沉積規(guī)律。因此,沿三維數(shù)據(jù)體的主測(cè)線、聯(lián)絡(luò)測(cè)線、SW-NE、NW-SE四個(gè)方向劃分出二維地震剖面,再在每一條地震剖面上選取尺寸為256×256大小的窗口,通過(guò)選取不同的重疊步長(zhǎng)滑動(dòng)截取所需的訓(xùn)練數(shù)據(jù),在保證遵循地震相空間分布規(guī)律的基礎(chǔ)上增加樣本的多樣性。為了加快目標(biāo)函數(shù)收斂,對(duì)訓(xùn)練數(shù)據(jù)中所有地震數(shù)據(jù)的振幅值進(jìn)行標(biāo)準(zhǔn)化處理,使其值域在-1到1之間。本文在訓(xùn)練集中共截取了3005組數(shù)據(jù),標(biāo)簽中共包含6類地震相,各類地震相出現(xiàn)概率歸一化后的分布情況如圖3所示。
圖3 訓(xùn)練數(shù)據(jù)各地震相出現(xiàn)概率分布直方圖
由于各個(gè)地震相標(biāo)簽的數(shù)值之間不存在連續(xù)性關(guān)系,所以在訓(xùn)練前需將標(biāo)簽數(shù)據(jù)轉(zhuǎn)化為獨(dú)熱編碼,以增強(qiáng)其稀疏性。對(duì)于地震剖面上第n個(gè)像素點(diǎn),其獨(dú)熱編碼標(biāo)簽yn可以用一個(gè)由0、1組成,大小為1×C的向量表示,即yn=[y1,n,…,yc,n,…,yC,n],若該點(diǎn)實(shí)際地震相為c,則對(duì)應(yīng)yc,n的值為1,其余的值為 0。各類地震相標(biāo)簽與對(duì)應(yīng)的獨(dú)熱編碼如表1所示。
表1 地震相標(biāo)簽與對(duì)應(yīng)的獨(dú)熱編碼
為了對(duì)比評(píng)價(jià)改進(jìn)前、后網(wǎng)絡(luò)模型與目標(biāo)函數(shù)的效果,設(shè)計(jì)了一系列對(duì)比試驗(yàn)。首先設(shè)置一組常規(guī)U-Net模型作為對(duì)照,為了保證對(duì)照模型的網(wǎng)絡(luò)層數(shù)與所含參數(shù)量級(jí)相同,常規(guī)U-Net網(wǎng)絡(luò)僅將改進(jìn)后網(wǎng)絡(luò)的PPM部分替換為相同數(shù)量的卷積層。將訓(xùn)練集中的地震數(shù)據(jù)和對(duì)應(yīng)的地震相標(biāo)簽分別成對(duì)輸入至兩組深度網(wǎng)絡(luò)模型中,進(jìn)行正向傳播與反向傳播,計(jì)算網(wǎng)絡(luò)的損失函數(shù)值,更新網(wǎng)絡(luò)的可調(diào)整參數(shù),并通過(guò)迭代訓(xùn)練令損失函數(shù)值越來(lái)越小。當(dāng)損失函數(shù)值降低到較小值并且基本不再變化時(shí),說(shuō)明該模型已經(jīng)達(dá)到收斂。本次訓(xùn)練采用Adam優(yōu)化算法[18],學(xué)習(xí)率設(shè)置為1×10-4。改進(jìn)目標(biāo)函數(shù)中需要人工調(diào)試的參數(shù)只有Dice項(xiàng)的權(quán)重e,這里分別取0(即目標(biāo)函數(shù)中不含Dice指數(shù)項(xiàng))、0.01、0.05、0.10,損失函數(shù)值隨迭代次數(shù)的變化曲線對(duì)比如圖4所示。
從圖4可以看出,當(dāng)?shù)_(dá)到1300次后,各組模型的損失函數(shù)值均已收斂。且Dice指數(shù)項(xiàng)權(quán)重e大于0.05時(shí),損失函數(shù)曲線振蕩越發(fā)劇烈,這是因?yàn)殡S著e值的增大,目標(biāo)函數(shù)中的Dice項(xiàng)逐漸主導(dǎo)收斂過(guò)程。式(3)對(duì)正向傳播的結(jié)果p的梯度可表示為2y2/(p+y)2,在某些情況下由于p過(guò)小或過(guò)大,計(jì)算得到的梯度值會(huì)產(chǎn)生劇烈波動(dòng),導(dǎo)致訓(xùn)練不穩(wěn)定,從而使訓(xùn)練中的損失函數(shù)值產(chǎn)生震蕩。
對(duì)于輸入模型中進(jìn)行地震相分類預(yù)測(cè)的地震剖面,深度神經(jīng)網(wǎng)絡(luò)會(huì)對(duì)每個(gè)像素點(diǎn)計(jì)算出一個(gè)概率分布pn=[p1,n,…,pc,n,…,pC,n],分別對(duì)應(yīng)n點(diǎn)為某類地震相的概率,從中選擇概率pc,n最大的那一類判斷為該點(diǎn)的預(yù)測(cè)地震相c。將訓(xùn)練好的各組模型作用于測(cè)試集數(shù)據(jù)進(jìn)行地震相預(yù)測(cè),并將預(yù)測(cè)地震相分類結(jié)果與真實(shí)值比較,以評(píng)價(jià)模型效果。為了更加客觀、全面地評(píng)價(jià)不同參數(shù)及結(jié)構(gòu)的各組模型在測(cè)試集數(shù)據(jù)上的表現(xiàn),采用了準(zhǔn)確率(PA)、類準(zhǔn)確率(CA)、平均交并比(mIOU)三項(xiàng)指標(biāo)進(jìn)行評(píng)價(jià)。PA表示整個(gè)測(cè)試數(shù)據(jù)集中被正確分類的像素點(diǎn)與總像素點(diǎn)比值,用于評(píng)估模型整體預(yù)測(cè)效果,表達(dá)式為
(5)
式中:Yc表示在地震剖面上屬于第c類地震相的像素點(diǎn)集合;Pc表示被網(wǎng)絡(luò)模型預(yù)測(cè)為第c類地震相的像素點(diǎn)集合; 運(yùn)算符|·|表示集合中的元素總數(shù)。
圖4 損失函數(shù)值隨迭代次數(shù)變化曲線
CAc表示第c類地震相在整個(gè)數(shù)據(jù)集中的預(yù)測(cè)準(zhǔn)確率,用于評(píng)估模型對(duì)每一類地震相的預(yù)測(cè)效果
(6)
準(zhǔn)確率指標(biāo)是基于單獨(dú)的像素點(diǎn)計(jì)算分類的正確率,在評(píng)價(jià)圖像分割問(wèn)題時(shí),無(wú)法判斷全局的分割效果[12]。因此,本次研究通過(guò)計(jì)算mIOU指標(biāo)來(lái)評(píng)估模型的表現(xiàn)。mIOU與Dice指數(shù)的作用相似,均用于衡量?jī)蓚€(gè)集合的重疊程度
(7)
對(duì)于不同參數(shù)、結(jié)構(gòu)的各組模型在測(cè)試集數(shù)據(jù)上的預(yù)測(cè)結(jié)果,分別用以上指標(biāo)進(jìn)行計(jì)算,其結(jié)果統(tǒng)計(jì)如表2所示。
表2 不同參數(shù)、結(jié)構(gòu)網(wǎng)絡(luò)模型對(duì)地震相預(yù)測(cè)結(jié)果統(tǒng)計(jì)表
表2統(tǒng)計(jì)結(jié)果表明,加入PPM模塊后,網(wǎng)絡(luò)模型對(duì)于地震相預(yù)測(cè)準(zhǔn)確率明顯高于常規(guī)U-Net模型;且無(wú)論是在常規(guī)網(wǎng)絡(luò)模型還是改進(jìn)模型上,訓(xùn)練時(shí)采用帶有Dice指數(shù)項(xiàng)的目標(biāo)函數(shù),預(yù)測(cè)效果均有一定提升,各項(xiàng)評(píng)價(jià)指標(biāo)表明預(yù)測(cè)結(jié)果優(yōu)于單一的交叉熵?fù)p失函數(shù)。在常規(guī)U-Net模型中,當(dāng)目標(biāo)函數(shù)中e取0.10時(shí),模型對(duì)地震相分類預(yù)測(cè)的效果最好,準(zhǔn)確率為91.61%,平均交并比為64.51%;在含有PPM模塊的網(wǎng)絡(luò)模型中,當(dāng)目標(biāo)函數(shù)中e取0.05時(shí),模型的預(yù)測(cè)效果最好,準(zhǔn)確率為94.74%,平均交并比為73.92%。另外,從統(tǒng)計(jì)結(jié)果可以看出,深度網(wǎng)絡(luò)模型在預(yù)測(cè)第5、第6類地震相時(shí)效果較差,而對(duì)于第1、第3類地震相有著較高的預(yù)測(cè)精度。其原因在于該工區(qū)訓(xùn)練數(shù)據(jù)屬于典型的不均衡分類[19],訓(xùn)練集中歸屬于第5、第6類地震相的像素點(diǎn)數(shù)量遠(yuǎn)遠(yuǎn)少于第1類和第3類(圖3)。在多元交叉熵?fù)p失函數(shù)的最優(yōu)化過(guò)程中,網(wǎng)絡(luò)模型會(huì)更傾向于學(xué)習(xí)這些樣本數(shù)量較多的地震相特征。因此,網(wǎng)絡(luò)模型對(duì)于樣本數(shù)量較少的第5、第6類地震相的預(yù)測(cè)類準(zhǔn)確率較低。而在目標(biāo)函數(shù)中添加Dice指數(shù)項(xiàng)后,這些少數(shù)類地震相的預(yù)測(cè)準(zhǔn)確率較之前有明顯的提高,配合帶有PPM模塊的網(wǎng)絡(luò)模型,其類準(zhǔn)確率均達(dá)到了80%以上,且模型預(yù)測(cè)結(jié)果的平均交并比也有了一定提升。在測(cè)試集數(shù)據(jù)中選取Inline280剖面為例,改進(jìn)前、后的模型及目標(biāo)函數(shù)對(duì)該剖面預(yù)測(cè)結(jié)果如圖5所示。
常規(guī)U-Net模型對(duì)于地震相分類預(yù)測(cè)存在較多問(wèn)題,如圖5c所示,剖面底部的地震相被錯(cuò)誤劃分為第3類、第4類等一些存在于其他深度的地震相。這一方面是由于訓(xùn)練集中這些地震相的樣本數(shù)量較少,因數(shù)據(jù)不均衡而導(dǎo)致的學(xué)習(xí)效果較差,另一方面則是因?yàn)槟P腿狈σ罁?jù)上、下文推斷的能力,造成一些具有相似的弱振幅特征的地震相被錯(cuò)誤地預(yù)測(cè)為第5類地震相。右下角的第6類地震相屬于鹽丘構(gòu)造,數(shù)量較少但往往受到地震解釋人員的關(guān)注,在被準(zhǔn)確識(shí)別的同時(shí)也需要準(zhǔn)確刻畫(huà)其邊界。但傳統(tǒng)的交叉熵?fù)p失函數(shù)只能評(píng)估模型對(duì)于單個(gè)像素點(diǎn)的預(yù)測(cè)準(zhǔn)確性,卻無(wú)法衡量地震相的分割形狀是否與實(shí)際接近,從而導(dǎo)致圖5c中鹽丘邊界刻畫(huà)效果較差。在U-Net模型的目標(biāo)函數(shù)中添加e=0.10的Dice指數(shù)項(xiàng)后,模型對(duì)于鹽丘形狀有了較為準(zhǔn)確的預(yù)測(cè)(圖5d),雖然預(yù)測(cè)結(jié)果仍存在部分地震相的錯(cuò)誤分類,但對(duì)于鹽丘邊界的預(yù)測(cè)效果提升顯著。加入PPM模塊后的U-Net模型對(duì)于該剖面的地震相分類表現(xiàn)出良好的效果(圖5e),由于PPM模塊提升了模型獲取全局信息的能力,預(yù)測(cè)結(jié)果中基本不存在地震相在深度上的錯(cuò)誤分布,但對(duì)于鹽丘邊界的預(yù)測(cè)效果依然不理想。在使用含有Dice指數(shù)項(xiàng)的改進(jìn)目標(biāo)函數(shù)后(e=0.05),預(yù)測(cè)的鹽丘形狀已十分接近真實(shí)值(圖5f),說(shuō)明改進(jìn)后的網(wǎng)絡(luò)模型與目標(biāo)函數(shù)更適合于地震相的分類及預(yù)測(cè)。
圖5 Inline280剖面預(yù)測(cè)結(jié)果
不確定性評(píng)估對(duì)于人工神經(jīng)網(wǎng)絡(luò)這類可解釋性較差的模型來(lái)說(shuō)是十分重要的。對(duì)模型預(yù)測(cè)結(jié)果的不確定性分析有助于了解模型對(duì)于預(yù)測(cè)結(jié)果的“自信”程度。對(duì)于斷層識(shí)別等二分類問(wèn)題,可以直接輸出一個(gè)二維的概率特征圖,并通過(guò)選定閾值調(diào)整想要的預(yù)測(cè)結(jié)果[10]。而地震相分類預(yù)測(cè)屬于多分類問(wèn)題,網(wǎng)絡(luò)模型輸出結(jié)果是一個(gè)三維數(shù)組,對(duì)于每類地震相的預(yù)測(cè)概率難以可視化展現(xiàn)。另一方面,由于式(1)中softmax函數(shù)的性質(zhì),模型在訓(xùn)練中為了盡可能地最小化目標(biāo)函數(shù),會(huì)盲目增大或減小模型輸出的結(jié)果zc,n,導(dǎo)致模型對(duì)于預(yù)測(cè)結(jié)果過(guò)于“自信”,使預(yù)測(cè)概率pc,n無(wú)法真實(shí)地展現(xiàn)模型對(duì)于預(yù)測(cè)結(jié)果的不確定性。
圖6為改進(jìn)后模型對(duì)地震相預(yù)測(cè)結(jié)果分布。圖中,80%以上的預(yù)測(cè)結(jié)果概率pc,n分布在0.01以下和0.98以上,也就是說(shuō)模型認(rèn)為剖面上各像素點(diǎn)被預(yù)測(cè)為某類地震相的概率幾乎為100%。這樣的結(jié)果顯然過(guò)于“自信”,因而無(wú)法關(guān)注到那些在模型預(yù)測(cè)過(guò)程中模棱兩可的像素點(diǎn),也使解釋人員無(wú)法對(duì)地震相分類預(yù)測(cè)模型結(jié)果的可靠性進(jìn)行評(píng)估。為此,本文引入信息論中的信息熵[20]的概念,并提出運(yùn)用預(yù)測(cè)信息熵對(duì)模型預(yù)測(cè)結(jié)果的不確定性進(jìn)行評(píng)估。在信息論中,信息熵用于度量信息中隨機(jī)變量的確定性。在用于地震相預(yù)測(cè)模型中,地震剖面上第n個(gè)像素點(diǎn)處的預(yù)測(cè)信息熵En可表示為
圖6 改進(jìn)后模型對(duì)地震相預(yù)測(cè)結(jié)果分布
(8)
預(yù)測(cè)信息熵越高,表示預(yù)測(cè)結(jié)果pc,n的概率分布越混亂,不確定性越高;反之則表示預(yù)測(cè)結(jié)果不確定性越低,可靠性越高。根據(jù)信息熵這一評(píng)價(jià)標(biāo)準(zhǔn),可以對(duì)地震相預(yù)測(cè)結(jié)果的不確定性進(jìn)行可視化,方便地震解釋人員對(duì)于模型不太確定的地方進(jìn)行人工核實(shí)及修正。計(jì)算圖5e、圖5f兩組模型預(yù)測(cè)結(jié)果的信息熵,并與預(yù)測(cè)誤差進(jìn)行對(duì)比,結(jié)果如圖7所示。
圖7 模型預(yù)測(cè)誤差與預(yù)測(cè)結(jié)果信息熵分布圖
從圖7a、圖7b可以進(jìn)一步看出改進(jìn)后模型對(duì)地震相預(yù)測(cè)結(jié)果具有較高的精度,除不同地震相交界處以外,幾乎不存在預(yù)測(cè)錯(cuò)誤,且在使用含Dice指數(shù)項(xiàng)的目標(biāo)函數(shù)后,模型對(duì)于剖面右下角鹽丘邊界處預(yù)測(cè)錯(cuò)誤的像素點(diǎn)更少,結(jié)果更為準(zhǔn)確。從圖7c、圖7d可以看出,地震相交界處預(yù)測(cè)信息熵較高,其值基本在0.7以上,且該處同樣存在較多的預(yù)測(cè)誤差。這是由于地震相的邊界往往是地質(zhì)沉積過(guò)程中沉積層交界的區(qū)域,邊界附近的巖石巖性與物質(zhì)成分是逐漸過(guò)渡變化的,因此,在地震相分類預(yù)測(cè)中,這些交界部分的預(yù)測(cè)準(zhǔn)確率較低。將預(yù)測(cè)誤差與預(yù)測(cè)信息熵進(jìn)行對(duì)比,發(fā)現(xiàn)模型預(yù)測(cè)錯(cuò)誤的像素點(diǎn)具有較高的信息熵,即該處模型預(yù)測(cè)結(jié)果的可靠性較低,如此便能較好地評(píng)估模型預(yù)測(cè)結(jié)果的不確定性。在使用改進(jìn)網(wǎng)絡(luò)模型對(duì)該剖面進(jìn)行地震相分類預(yù)測(cè)的結(jié)果中,當(dāng)某處En低于0.8時(shí),表示模型對(duì)該處預(yù)測(cè)結(jié)果較為“自信”; 當(dāng)En高于0.8時(shí),就可認(rèn)為該處預(yù)測(cè)不準(zhǔn)確,需要解釋人員進(jìn)行核實(shí)與修正。
地震剖面上全局空間分布的先驗(yàn)信息對(duì)于地震相劃分有著非常重要的作用,而現(xiàn)有基于深度學(xué)習(xí)方法的地震相識(shí)別模型缺乏獲取空間先驗(yàn)信息的能力,且缺乏一個(gè)對(duì)于模型預(yù)測(cè)結(jié)果的不確定性進(jìn)行評(píng)估的指標(biāo)。針對(duì)這些問(wèn)題,采用在U-Net模型中加入PPM模塊,使模型能夠獲取多個(gè)接收域下的特征,從而學(xué)習(xí)到地震剖面上包含不同尺度、不同子區(qū)域間關(guān)系的分層全局信息。使用一種綜合交叉熵與Dice指數(shù)的目標(biāo)函數(shù)改善不均衡數(shù)據(jù)中少數(shù)類地震相邊界刻畫(huà)問(wèn)題。提出用預(yù)測(cè)信息熵分析模型的不確定性。將該方法應(yīng)用于F3工區(qū)海上地震數(shù)據(jù)地震相預(yù)測(cè),實(shí)驗(yàn)結(jié)果表明:
(1)加入PPM模塊后,網(wǎng)絡(luò)模型對(duì)該工區(qū)地震相識(shí)別準(zhǔn)確率有了明顯提高; 使用融合了Dice指數(shù)的新目標(biāo)函數(shù)后,對(duì)于少數(shù)類地震相預(yù)測(cè)結(jié)果有了一定提升,可使地震相邊界刻畫(huà)獲得更為良好的效果。
(2)預(yù)測(cè)信息熵這一指標(biāo)能較好地評(píng)價(jià)地震相預(yù)測(cè)模型的不確定性,對(duì)預(yù)測(cè)結(jié)果的可靠性進(jìn)行可視化展現(xiàn)。預(yù)測(cè)信息熵越低,模型對(duì)該處預(yù)測(cè)結(jié)果的不確定性越低,表明預(yù)測(cè)結(jié)果越可靠。在實(shí)際地震資料解釋中,解釋人員可以通過(guò)選定預(yù)測(cè)信息熵的閾值對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行修正。
本文的深度網(wǎng)絡(luò)模型采用Facebook公司的Pytorch平臺(tái)搭建,使用的所有訓(xùn)練數(shù)據(jù)與代碼開(kāi)源在https://github.com/yxycug/Seismic-Facies-clas-sification。