馬江濤,劉 洋,2,,張浩然
(1.中國石油大學(xué)(北京)人工智能學(xué)院,北京102249;2.中國石油大學(xué)(北京)克拉瑪依校區(qū)石油學(xué)院,新疆克拉瑪依834000;3.中國石油大學(xué)(北京)地球物理學(xué)院,北京102249)
地震相是地下沉積相在地震數(shù)據(jù)中的表現(xiàn),可以間接反映地下沉積特征,其準(zhǔn)確識別對于沉積相研究以及油氣勘探開發(fā)具有重要意義。國內(nèi)外學(xué)者提出了多種地震相識別方法。傳統(tǒng)的地震相識別劃分是指專業(yè)人員根據(jù)沉積相在地震剖面上的特征以及經(jīng)驗(yàn),通過肉眼在地震剖面上人工識別劃分,俗稱相面法[1]。該方法工作量較大,專業(yè)門檻要求較高,且人工解釋存在一定的多解性,使得解釋結(jié)果具有一定的主觀性。隨著地震勘探技術(shù)的進(jìn)步和勘探開發(fā)要求的提高,導(dǎo)致地震數(shù)據(jù)量急劇增加和解釋精度需求越來越高,人工方法難以滿足要求。研究人員借助具有強(qiáng)大算力的計算機(jī)及數(shù)學(xué)工具,利用地震屬性的組合來實(shí)現(xiàn)地震相的識別劃分,誕生了結(jié)合相干屬性、吸收衰減以及負(fù)曲率等進(jìn)行三維地震相劃分的方法[2];結(jié)合波阻抗及振幅等屬性,以多個三維地震屬性體作為輸入,生成三維地震相體,實(shí)現(xiàn)對地震相的劃分[3];并且在地震相分析中引入時頻分析技術(shù),基于S變換分析地震相并進(jìn)行總體描述和局部細(xì)節(jié)的刻畫[4]。這些方法利用地震數(shù)據(jù)的不同特征進(jìn)行地震相識別,識別精度高于人工識別。但是,隨著地震屬性的增多以及勘探目標(biāo)的復(fù)雜化,需要研究有效利用這些屬性的方法,以達(dá)到更好的識別效果。
1956年達(dá)特茅斯會議首次提出的人工智能目前已發(fā)展成一門交叉學(xué)科。研究方向包括機(jī)器學(xué)習(xí)、自然語言處理和計算機(jī)視覺等。目前人工智能已應(yīng)用到包括地球物理在內(nèi)的各個領(lǐng)域。其中,機(jī)器學(xué)習(xí)在地球物理中特別是在地震相識別劃分中得到廣泛應(yīng)用。本文對基于機(jī)器學(xué)習(xí)的地震相識別方法進(jìn)行總結(jié),詳細(xì)介紹其原理以及應(yīng)用情況,最后做出一些展望。
地震相自動識別可以看成一個擬合問題,通過擬合建立起地震記錄與沉積相類型之間的非線性關(guān)系。機(jī)器學(xué)習(xí)的實(shí)質(zhì)就是在大量數(shù)據(jù)的驅(qū)動下,從數(shù)據(jù)中學(xué)習(xí)到這個非線性關(guān)系。地震記錄的數(shù)據(jù)量大且內(nèi)涵信息豐富,因而可以采用機(jī)器學(xué)習(xí)的方法來獲得這個非線性關(guān)系,從而進(jìn)行地震相的識別劃分。
傳統(tǒng)的如S變換等地震相分析方法基于模型驅(qū)動,具有明確的物理含義,但其受制于人工模型約束,對于特別復(fù)雜的情況,模型不能細(xì)致地全方位描述,并且在求解過程中需要各種變換計算,使得效率較低。機(jī)器學(xué)習(xí)通常基于數(shù)據(jù)驅(qū)動擬合非線性關(guān)系函數(shù),并且擬合的函數(shù)空間更大,即得到的模型具有更強(qiáng)的非線性描述表征能力,可能更適合地震相識別劃分。地震相智能識別利用機(jī)器學(xué)習(xí)等技術(shù),根據(jù)地震數(shù)據(jù)自動學(xué)習(xí)識別劃分模型,模型參數(shù)不需要人為限定,因而可以學(xué)習(xí)到表征能力更強(qiáng)的模型。近年來,隨著人工智能技術(shù)的快速發(fā)展,國內(nèi)外學(xué)者基于無監(jiān)督、監(jiān)督和半監(jiān)督這3類機(jī)器學(xué)習(xí)方法,分別發(fā)展了相應(yīng)的地震相智能識別方法,均可實(shí)現(xiàn)對地震相的有效自動識別,下面將詳細(xì)介紹其原理、在地震相識別中的應(yīng)用及其優(yōu)缺點(diǎn)。
無監(jiān)督學(xué)習(xí)在地震相智能識別中起著重要的作用。無監(jiān)督意味著對無標(biāo)簽的數(shù)據(jù)樣本進(jìn)行訓(xùn)練,通過學(xué)習(xí)揭示數(shù)據(jù)內(nèi)部隱性性質(zhì)及其規(guī)律,然而由于缺乏先驗(yàn)知識的引導(dǎo),故無法判斷其正確與否。無監(jiān)督學(xué)習(xí)包括聚類和自組織映射網(wǎng)絡(luò)等方法。
1.1.1 聚類
聚類是按照特定標(biāo)準(zhǔn)將數(shù)據(jù)集分割成不同的類,使得同一個類內(nèi)的數(shù)據(jù)相似性盡可能最大,同時使不在同一個類中的數(shù)據(jù)差異性也盡可能最大,即同類盡可能聚在一起,異類盡可能分開[5]。由于聚類不需要標(biāo)簽數(shù)據(jù),并且簡單易實(shí)現(xiàn),目前已應(yīng)用于地球物理和醫(yī)學(xué)等多個領(lǐng)域。聚類依據(jù)不同的劃分標(biāo)準(zhǔn),將其分為基于劃分式聚類如K均值,和基于密度聚類如具有噪聲的基于密度的聚類(density-based spatial clustering of applications with noise,DBSCAN)方法、層次聚類和譜聚類等。聚類在地震相識別劃分中取得顯著的成果。屬于同一個地震相的數(shù)據(jù)內(nèi)部之間具有一定的相似性,而這恰好符合聚類的特性,將相似的也就是內(nèi)部具有共性的劃分為一類,將異類盡可能分開,這就是聚類在地震相識別劃分中的基本思想。傳統(tǒng)的K均值聚類收斂緩慢,學(xué)習(xí)速率自適應(yīng)的改進(jìn)K均值聚類算法可以解決這一問題,應(yīng)用于地震相識別中取得較好效果[6]?;诓ㄐ尉垲惙诸惖募夹g(shù)可以有效識別沉積微相,在平面上可以較準(zhǔn)確刻畫沉積微相的分布[7-8]?;诿芏鹊暮肼暯堑兰ㄐ尉垲惖卣鹣喾治龇椒?可有效提高地震資料地震相分析的精度[9]。將稀疏表示思想與譜聚類相結(jié)合進(jìn)行無監(jiān)督的地震相分析,可以獲得更準(zhǔn)確的地震相分類結(jié)果[10]?;诘卣鸬棺V特征參數(shù)譜聚類也可以實(shí)現(xiàn)對地震相的識別劃分,實(shí)驗(yàn)結(jié)果如圖1所示。由圖可見,該方法可以更加清晰地識別劃分邊界[11],具有高抗噪性的基于波形層次聚類方法,可以準(zhǔn)確、合理地表征地震相的空間分布[12]。在上述方法中,K均值聚類需要設(shè)置K值(類數(shù)),且對噪聲比較敏感;DBSCAN方法需要設(shè)置鄰域半徑和鄰域密度閾值;層次聚類需要設(shè)置閾值,但計算復(fù)雜度比較高;對于譜聚類,如果聚類的維度高,則分類結(jié)果的效果將不明顯。因此,盡管聚類方法不需要人工制作標(biāo)簽,但人工設(shè)置的聚類參數(shù)直接影響分類數(shù)量和分類結(jié)果,而且分類結(jié)果往往缺乏具體地質(zhì)意義,與地震相類別不一定具有很好的一一對應(yīng)關(guān)系,這些缺點(diǎn)限制了聚類算法在地震相識別劃分中的廣泛應(yīng)用。
1.1.2 自組織映射網(wǎng)絡(luò)
自組織映射網(wǎng)絡(luò)(SOM)是一種無監(jiān)督神經(jīng)網(wǎng)絡(luò)方法,由一個輸入層和一個輸出層構(gòu)成,通過學(xué)習(xí)輸入層的高維輸入數(shù)據(jù),可以得到一個低維映射。與一般基于損失函數(shù)反向傳播的神經(jīng)網(wǎng)絡(luò)不同,不需要標(biāo)簽數(shù)據(jù),只通過神經(jīng)元之間相互競爭來優(yōu)化自身,并且還可以維持輸入數(shù)據(jù)的空間拓?fù)浣Y(jié)構(gòu)。自組織映射網(wǎng)絡(luò)的應(yīng)用非常廣泛,目前在地震相智能識別劃分中已取得較好效果。Stratimagic軟件就是基于自組織映射網(wǎng)絡(luò)進(jìn)行波形分類,進(jìn)而實(shí)現(xiàn)對地震相的識別劃分[13-14]。采用這種波形分類方法可以細(xì)致刻畫出地震信號的橫向變化,從而得到反映地下地層特征的地震相圖。但是該方法主要適用于平行地層結(jié)構(gòu)、地層厚度變化較小、構(gòu)造比較簡單的地區(qū)。對于一些地層厚度變化較大的地區(qū),由于地層不等厚,統(tǒng)一開時窗通常會產(chǎn)生穿時現(xiàn)象,降低了分類預(yù)測的精度[15-16]。與其它幾種無監(jiān)督聚類方法相比,基于地震響應(yīng)特征的自組織映射網(wǎng)絡(luò)在識別地震相結(jié)構(gòu)方面更有優(yōu)勢[17],而且還可以同時利用多種地震屬性[18-19]。在油氣勘探新區(qū)鉆井少的背景下,利用自組織映射網(wǎng)絡(luò)進(jìn)行地震屬性分析,可以預(yù)測地震相—沉積相平面展布規(guī)律[20]。然而,僅利用自組織映射網(wǎng)絡(luò)識別劃分地震相精度有限,因此,國內(nèi)外學(xué)者將自組織映射網(wǎng)絡(luò)方法與其它方法相結(jié)合,進(jìn)一步提高地震相識別精度。MATOS等[21]將小波變換與自組織映射網(wǎng)絡(luò)方法相結(jié)合來進(jìn)行地震相分析,首先,利用小波變換識別地震道奇點(diǎn),再通過自組織映射網(wǎng)絡(luò)神經(jīng)元的競爭分類建立地震相圖。人工免疫算法是模仿生物免疫系統(tǒng)的抗原識別、細(xì)胞分化和細(xì)胞抑制等功能的一種最優(yōu)求解算法。在地震相分類中,基于自組織映射網(wǎng)絡(luò)方法在數(shù)據(jù)含噪時性能會下降,可以先利用人工免疫算法來進(jìn)行去噪和降維,然后再通過自組織映射網(wǎng)絡(luò)方法進(jìn)行波形分類[22]。多波形分類(multi-waveform classification,MWFC)方法首先從地震數(shù)據(jù)中提取多波形,再利用多線性子空間學(xué)習(xí)進(jìn)行降維,最后利用自組織映射網(wǎng)絡(luò)進(jìn)行分類獲得地震相圖;與傳統(tǒng)的波形分類方法相比,該方法對噪聲具有更高的魯棒性[23]。在進(jìn)行地震相分類時,可以添加一些約束物理條件來提高分類精度。ZHAO等[24]利用地層學(xué)信息來約束自組織映射網(wǎng)絡(luò)進(jìn)行地震相分類,可以識別更多的細(xì)節(jié)信息,發(fā)現(xiàn)可能被傳統(tǒng)方法忽略的薄層。自組織映射網(wǎng)絡(luò)屬于無監(jiān)督學(xué)習(xí),因而不需要對數(shù)據(jù)制作標(biāo)簽,并且它具有降維作用,可以將高維數(shù)據(jù)映射到低維,還可以保持拓?fù)浣Y(jié)構(gòu)的不變性。但是,自組織映射網(wǎng)絡(luò)方法的網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)參數(shù)會影響地震相分類結(jié)果,而且分類結(jié)果的地質(zhì)意義也不太明確,這些缺點(diǎn)與聚類方法的缺點(diǎn)類似。
1.1.3 其它方法
研究人員還將其它一些無監(jiān)督方法成功應(yīng)用于地震相識別中。在無監(jiān)督學(xué)習(xí)中,使用深度卷積自編碼器(DCAE)與聚類相結(jié)合進(jìn)行地震相分類[25],由于使用具有強(qiáng)大非線性擬合能力的深度卷積來進(jìn)行特征的提取學(xué)習(xí),因而使得該方法具有更高的精度,而且具有顯著突出地層和沉積信息的潛力。VEILLARD等[26]基于無監(jiān)督深度學(xué)習(xí)的生成模型,提出一種能快速、準(zhǔn)確地解釋三維地質(zhì)目標(biāo)的方法,該方法比較通用并且可以實(shí)時得到準(zhǔn)確的解釋結(jié)果。上述方法在地震相識別劃分中雖取得了一定的效果,但由于其屬于無監(jiān)督方法,沒有目標(biāo)導(dǎo)向,因而其識別劃分精度不高,有待進(jìn)一步提高。
監(jiān)督學(xué)習(xí)是在定義好標(biāo)簽的情況下,讓模型學(xué)習(xí)到數(shù)據(jù)的內(nèi)部隱形特征,從而可以實(shí)現(xiàn)對相似數(shù)據(jù)的預(yù)測。此方法的識別精度幾乎取決于是否擁有足夠全面的準(zhǔn)確標(biāo)簽。監(jiān)督學(xué)習(xí)算法包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隨機(jī)森林等,其中應(yīng)用最廣泛的是神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)受人腦神經(jīng)系統(tǒng)的啟發(fā),即模擬人腦神經(jīng)系統(tǒng)來實(shí)現(xiàn)對事物的學(xué)習(xí)、聯(lián)想、記憶和識別。神經(jīng)網(wǎng)絡(luò)的本質(zhì)就是對數(shù)據(jù)進(jìn)行擬合,根據(jù)萬能逼近定理[27]得知神經(jīng)網(wǎng)絡(luò)可以擬合任何函數(shù)。地震相識別劃分可以看成一個函數(shù)擬合問題,函數(shù)的自變量是地震數(shù)據(jù),因變量是地震相類型,這個函數(shù)具有強(qiáng)烈的非線性特征、非常復(fù)雜且難以顯式表達(dá)。而利用神經(jīng)網(wǎng)絡(luò)正好可以擬合出這個函數(shù),從而實(shí)現(xiàn)對地震相的智能識別劃分。深度神經(jīng)網(wǎng)絡(luò)是個深層模型,包括卷積層、池化層、全連接層以及各種激活函數(shù)。卷積層可以對數(shù)據(jù)進(jìn)行局部感知,即可以考慮局部信息,也具有全局共享的特點(diǎn),因而能對剖面中具有相同特征不同部位的地震相獲得相同的響應(yīng)。池化層能擴(kuò)大感受野,因而能考慮更大尺度的特征信息。深層的網(wǎng)絡(luò)意味著可以提取更高維度的信息,激活函數(shù)使得模型具有更高的非線性擬合能力,并且卷積可以學(xué)習(xí)二維和三維信息,不再僅考慮一維單道信息。由于它可以學(xué)習(xí)橫、縱向信息,因而可以更好地擬合出這個函數(shù),從而進(jìn)一步提高其識別劃分精度。
1.2.1 卷積神經(jīng)網(wǎng)絡(luò)
1943年,美國心理學(xué)家麥克洛奇(MCCULLOCH)和數(shù)學(xué)家皮茲(PITTS)提出了M-P模型[28]。此模型通過把神經(jīng)元看作一個功能邏輯器件來實(shí)現(xiàn)算法,從此開創(chuàng)了神經(jīng)網(wǎng)絡(luò)模型的理論研究。1998年,LECUN等[29]提出了LeNet-5,將BP算法應(yīng)用到神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練上,形成了當(dāng)代卷積神經(jīng)網(wǎng)絡(luò)的雛形,但由于當(dāng)時網(wǎng)絡(luò)訓(xùn)練難度大且效果不顯著,一直不被看好。直到2012年,在Imagenet圖像識別大賽中,Alexnet網(wǎng)絡(luò)[30]一舉奪冠,掀起了卷積神經(jīng)網(wǎng)絡(luò)研究的熱潮。之后又出現(xiàn)了牛津大學(xué)的VGG網(wǎng)絡(luò)[31]、新加坡國立大學(xué)的NiN網(wǎng)絡(luò)[32]、微軟的殘差網(wǎng)絡(luò)[33]以及谷歌的GoogLeNet網(wǎng)絡(luò)[34]等,這些網(wǎng)絡(luò)都可以實(shí)現(xiàn)對圖像高精度的識別。2015年,提出一種端到端結(jié)構(gòu),可以進(jìn)行任意大小圖像輸入的網(wǎng)絡(luò),這是一種拋棄全連接的全卷積神經(jīng)網(wǎng)絡(luò)[35],從此圖像語義分割得到極大發(fā)展。隨后在編碼-解碼器結(jié)構(gòu)的基礎(chǔ)上出現(xiàn)了簡捷的SegNet[36]、UNet[37]網(wǎng)絡(luò)以及DeepLab[38-41]系列等,這些網(wǎng)絡(luò)有效提高了語義分割的精度。可以說,卷積神經(jīng)網(wǎng)絡(luò)在目前的人工智能中發(fā)揮著極其重要的作用。
由于神經(jīng)網(wǎng)絡(luò)成熟的技術(shù)以及良好的應(yīng)用效果,它已被應(yīng)用于各個領(lǐng)域,目前在地震相識別中獲得較好的應(yīng)用效果。WEST等[42]將紋理分析與神經(jīng)網(wǎng)絡(luò)相結(jié)合,實(shí)現(xiàn)對地震相的分類,提高了分類的效率以及細(xì)節(jié)程度。深度學(xué)習(xí)可以學(xué)習(xí)細(xì)微特征,在地震相識別中比隨機(jī)森林具有更好的識別能力[43],還具有較好的泛化性能。對于鹽丘的識別與檢測,利用卷積神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)對其邊界的檢測[44]。采用端到端的編碼-解碼器,可以實(shí)現(xiàn)三維鹽丘邊界的自動檢測[45]。由于編-解碼器特殊的結(jié)構(gòu),它考慮了低維度信息,能夠編碼出高維度的抽象信息,并通過特征圖的縮放減少運(yùn)算量,因而其計算成本較小,并且能準(zhǔn)確識別出鹽丘邊界。編-解碼結(jié)構(gòu)的SegNet網(wǎng)絡(luò),可以準(zhǔn)確檢測出三維地震數(shù)據(jù)體中的河道[46]?;诰矸e神經(jīng)網(wǎng)絡(luò)的方法,不僅可以對鹽體進(jìn)行高精度的自動分類[47],還可以進(jìn)行自動地震解釋,該類方法成功解釋出了完整的三維鹽體[48]。這都是基于卷積、池化、全連接層以及各種激活函數(shù)的神經(jīng)網(wǎng)絡(luò)的強(qiáng)大擬合能力,擬合出較為準(zhǔn)確的函數(shù),因而取得較好的結(jié)果。采用編-解碼結(jié)構(gòu)進(jìn)行地震解釋時,可以將上采樣方式改為反卷積,反卷積有可學(xué)習(xí)參數(shù),因而可以靈活地學(xué)習(xí)到不同的上采樣方式,進(jìn)而提高模型刻畫、恢復(fù)特征圖的能力,以此進(jìn)一步提高模型的解釋精度。反卷積神經(jīng)網(wǎng)絡(luò)(deconvolutional neural networks,DCNN)可以實(shí)時進(jìn)行地震解釋,準(zhǔn)確地識別和解釋地震圖像中的重要特征[49]。如圖2所示,DCNN識別結(jié)果與實(shí)際標(biāo)簽較為接近,尤其是鹽丘(黑色)、強(qiáng)連續(xù)反射(青色)和陡峭的傾斜(橙色)結(jié)構(gòu)。在利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行地震相分析時,不僅可利用地震數(shù)據(jù)進(jìn)行學(xué)習(xí),還可以利用其它的信息。通過將自然圖像中學(xué)習(xí)到的稀疏特征信息分類作用于地震數(shù)據(jù),突出地震體的不同特征與結(jié)構(gòu)[50]。在利用編-解碼結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)進(jìn)行地震相分析時,可以識別劃分單個相或同時劃分多個相,也可以采用多個模型集成,采用投票機(jī)制進(jìn)一步提高模型的識別精度[51]。由圖3 和圖4可以看出,集成學(xué)習(xí)預(yù)測結(jié)果與標(biāo)簽吻合較好,說明其模型具有較好的識別性能。神經(jīng)網(wǎng)絡(luò)可以與其它方法進(jìn)行融合,進(jìn)一步提高其識別劃分的精度。深度卷積嵌入聚類(deep convolutional embedded clustering,DCEC)利用深度神經(jīng)網(wǎng)絡(luò)表征高維數(shù)據(jù)特征,再使用聚類對地震相進(jìn)行聚類劃分,以此進(jìn)一步識別更細(xì)微的相[52]。DCEC的網(wǎng)絡(luò)結(jié)構(gòu)和預(yù)測識別結(jié)果對比如圖5和圖6所示。由圖5和圖6可以看出,DCEC方法可以預(yù)測出更細(xì)微的地震相,說明此方法可以得到更豐富的地震相信息。在利用編-解碼結(jié)構(gòu)進(jìn)行地震相識別時,加入金字塔池化模塊可以更好地刻畫邊界,識別地震相更加精確[53]。基于貝葉斯的卷積神經(jīng)網(wǎng)絡(luò)不僅可以在地震數(shù)據(jù)中準(zhǔn)確識別出地震相,還可以定性度量預(yù)測的不確定性,因此解釋人員可以利用不確定性判斷地震相預(yù)測的可靠程度[54-55]。在利用常規(guī)單道卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行地震相識別的同時,可以利用多道并行的方式學(xué)習(xí)多尺度的信息,進(jìn)而提高模型識別性能。采用多尺度信息學(xué)習(xí)的增強(qiáng)編碼器-解碼器來進(jìn)行識別劃分,其結(jié)果比常規(guī)卷積網(wǎng)絡(luò)具有更高的識別精度[56]。使用Flood-filling network(FFN)網(wǎng)絡(luò)的工作流,交互式跟蹤地震地質(zhì)體進(jìn)行解釋的方法,與以往最大不同之處在于,它可以進(jìn)行迭代分割并移動視場,不僅能檢測地質(zhì)體,還可以跟蹤單個地質(zhì)體,其結(jié)果表明該方法改善了分割精度,并可以分離相同分類屬性的多個實(shí)例[57]。如圖7所示,當(dāng)整個迭代過程結(jié)束后,地質(zhì)體被較好地檢測出來。由于采用監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)有先驗(yàn)知識對其進(jìn)行引導(dǎo),并且由于其結(jié)構(gòu)的獨(dú)特性而具有較好的非線性表達(dá)能力,因此其識別效率較高、精度較好。然而它是黑盒模型,難以準(zhǔn)確解釋模型,并且需要大量的標(biāo)簽數(shù)據(jù)進(jìn)行學(xué)習(xí)。對于海量的地震數(shù)據(jù),當(dāng)標(biāo)簽數(shù)據(jù)稀少時,會導(dǎo)致實(shí)際應(yīng)用存在一定的局限性。
圖3 基于深度學(xué)習(xí)的地震相識別劃分結(jié)果(單一相的預(yù)測結(jié)果)[51]
圖4 基于深度學(xué)習(xí)的地震相識別劃分結(jié)果(采用集成學(xué)習(xí)的多個地震相預(yù)測結(jié)果)[51]
圖5 深度卷積嵌入聚類的網(wǎng)絡(luò)結(jié)構(gòu)[52]
圖6 不同方法地震相預(yù)測結(jié)果對比[52]
圖7 基于FFN網(wǎng)絡(luò)的地震鹽體預(yù)測迭代(鹽體圖像的迭代預(yù)測,以黃色十字為種子點(diǎn),模型進(jìn)行分割、運(yùn)動和似然(likelihood)更新,藍(lán)色框代表視場位置)[57]
1.2.2 其它方法
其它用于地震相智能識別的監(jiān)督學(xué)習(xí)方法包括支持向量機(jī)、隨機(jī)森林和概率神經(jīng)網(wǎng)絡(luò)等。如果要將不同的類盡可能分開,則需要一個高維超平面,而支持向量機(jī)(support vector machine,SVM)可以找到這個超平面,使各類樣本點(diǎn)距此超平面最遠(yuǎn)。對于超平面的定義,只與距離最近的樣本點(diǎn)有關(guān),因此將這些點(diǎn)稱為支持向量?;赟VM的巖相分類具有很好的泛化性[58]。但是由于SVM具有較高的復(fù)雜性,為了降低計算量,基于近似支持向量機(jī)(proximal support vector machine,PSVM)被用來進(jìn)行巖相分類[59]。其模型預(yù)測結(jié)果如圖8所示,藍(lán)色曲線為石灰?guī)r邊界,灰色和黑色分別代表了PSVM分類的石灰?guī)r和頁巖,可以看出,采用PSVM預(yù)測的結(jié)果與傳統(tǒng)解釋結(jié)果非常接近。隨機(jī)森林是由多個樹組成的一種集成算法,由于它的特殊結(jié)構(gòu)使其具有一定的可解釋性,因而采用它進(jìn)行地震相分類可以得到每個屬性在分類中的重要性以及樹形圖,有助于儲層解釋[60]。基于圖像分割的地震相分類可以有效提高分類地震相的空間連續(xù)性和精度[61]。由圖9可以看出,基于圖像分割的預(yù)測結(jié)果空間連續(xù)性較好,而SVM的連續(xù)性較差,精度相對較低。采用支持向量機(jī)、隨機(jī)森林等算法可以實(shí)現(xiàn)地震相的快速智能識別劃分,然而其采用一維數(shù)據(jù)進(jìn)行學(xué)習(xí),缺失了橫向空間信息,因而具有局限性,識別方法及識別精度有待進(jìn)一步提高。
圖8 基于近似支持向量機(jī)的巖相預(yù)測結(jié)果[59]
圖9 基于圖像分割的地震相預(yù)測結(jié)果對比[61]
在實(shí)際應(yīng)用中若僅使用無監(jiān)督學(xué)習(xí),結(jié)果準(zhǔn)確率可能較差;僅使用監(jiān)督學(xué)習(xí),沒有足夠的標(biāo)簽數(shù)據(jù),而獲取大量的地震標(biāo)簽數(shù)據(jù)比較難,那么在標(biāo)簽較少的情況下,如何處理就值得深入研究。基于此,發(fā)展了半監(jiān)督學(xué)習(xí)。半監(jiān)督學(xué)習(xí)是指在少量標(biāo)簽樣本下,模型以標(biāo)簽樣本基礎(chǔ)進(jìn)行學(xué)習(xí),再結(jié)合其它樣本不斷調(diào)整學(xué)習(xí),最終學(xué)習(xí)到較為理想的模型進(jìn)行預(yù)測。采用弱標(biāo)簽標(biāo)記技術(shù)生成大量訓(xùn)練樣本,進(jìn)而用來訓(xùn)練反卷積網(wǎng)絡(luò),并且通過修改損失函數(shù)進(jìn)行約束,解決了標(biāo)簽數(shù)據(jù)少的問題,提高了地震相預(yù)測的精度[62]。生成對抗網(wǎng)絡(luò)由判別器與生成器構(gòu)成,生成器負(fù)責(zé)生成數(shù)據(jù),判別器用來辨別真?zhèn)?當(dāng)二者達(dá)到平衡時,說明生成器可以合成高逼真數(shù)據(jù),進(jìn)而用生成器可以生成大量數(shù)據(jù)。半監(jiān)督生成對抗網(wǎng)絡(luò)是對常規(guī)的生成對抗網(wǎng)絡(luò)進(jìn)行修改,利用少量標(biāo)簽數(shù)據(jù)來使生成器與判別器進(jìn)行對抗學(xué)習(xí),當(dāng)模型收斂后直接用判別器進(jìn)行地震相分類,實(shí)驗(yàn)結(jié)果說明此方法可以進(jìn)行地震相分類,而且避免了模型過擬合現(xiàn)象[63]。利用半監(jiān)督方法可以實(shí)現(xiàn)地震相分類,并且能緩解監(jiān)督方法在訓(xùn)練數(shù)據(jù)匱乏時的過擬合問題[64-65]。半監(jiān)督學(xué)習(xí)可以緩解數(shù)據(jù)量不足問題,為監(jiān)督學(xué)習(xí)開辟了一條新道路,但是由于偽標(biāo)簽等影響,使得整個模型性能有所下降。
無監(jiān)督、半監(jiān)督和監(jiān)督學(xué)習(xí)3類方法各有優(yōu)勢與側(cè)重點(diǎn),可以根據(jù)不同的實(shí)際情況選擇不同的方法來進(jìn)行地震相識別劃分。無監(jiān)督方法可以在沒有標(biāo)簽數(shù)據(jù)的情況下,對數(shù)據(jù)內(nèi)部規(guī)律進(jìn)行學(xué)習(xí),通過聚類來實(shí)現(xiàn)對地震相的識別劃分。由于沒有先驗(yàn)知識的約束,因而其識別劃分的精度有限。半監(jiān)督學(xué)習(xí)是在標(biāo)簽數(shù)據(jù)有限的情況下進(jìn)行地震相識別劃分的,可以看成無監(jiān)督與監(jiān)督學(xué)習(xí)的有機(jī)結(jié)合,通過無監(jiān)督生成偽標(biāo)簽,再通過監(jiān)督學(xué)習(xí)識別劃分地震相,但由于偽標(biāo)簽的負(fù)面性,可能會使得模型精度有所下降。監(jiān)督學(xué)習(xí)利用大量標(biāo)簽數(shù)據(jù)來約束學(xué)習(xí),由于有先驗(yàn)知識的監(jiān)督,并且利用神經(jīng)網(wǎng)絡(luò)的強(qiáng)大非線性擬合能力,因而精度較高。
該實(shí)例基于改進(jìn)的U-Net網(wǎng)絡(luò)模型進(jìn)行地震相自動識別。網(wǎng)絡(luò)模型結(jié)構(gòu)如圖10所示,輸入為地震數(shù)據(jù),在編碼階段先經(jīng)過4次并行模塊,每次并行模塊都進(jìn)行通道擴(kuò)增,進(jìn)行數(shù)據(jù)尺寸大小減半的下采樣。然后在解碼時進(jìn)行4次上采樣過程,每次上采樣都壓縮通道數(shù),再與下采樣對應(yīng)的值在通道維進(jìn)行拼接融合。上采樣結(jié)束后,網(wǎng)絡(luò)模型得到一張9通道的特征圖,經(jīng)過Softmax函數(shù)得到9張概率圖,取每個像素點(diǎn)最大概率對應(yīng)的索引值,得到一張網(wǎng)絡(luò)模型最終輸出剖面,該剖面即地震相識別分類結(jié)果。
經(jīng)過多次實(shí)驗(yàn)發(fā)現(xiàn),采用卷積下采樣比最大池化效果好,這是因?yàn)榫矸e下采樣時有可學(xué)習(xí)的參數(shù),可以學(xué)習(xí)到更好的下采樣策略,但是由于引入過多參數(shù),導(dǎo)致模型運(yùn)算速度減慢,因此最終選擇最大池化作為本模型下采樣方式。通過多次實(shí)驗(yàn),最終采用轉(zhuǎn)置卷積作為此模型的上采樣方式。轉(zhuǎn)置卷積也具有可學(xué)習(xí)的參數(shù),可以靈活地學(xué)習(xí)多種上采樣模式,數(shù)據(jù)特征信息之間也可以相互融合,而不是和反最大池化一樣只將值放入最大值的位置上,其它位置用0替補(bǔ)。為了降低模型復(fù)雜度,提高模型效率,所以有下采樣過程,但無法避免下采樣存在信息丟失現(xiàn)象。如果在下采樣前提取更多的特征,則可以學(xué)習(xí)更多有用的信息。即使在下采樣時丟失一部分信息,也會有所保留,而且由于躍層拼接結(jié)構(gòu)的存在,在上采樣時會用到這些提取的信息,可以緩解信息丟失問題。設(shè)計模型如圖10和圖11所示。圖11表示圖10中的并道維的拼接,最后經(jīng)過1×1卷積進(jìn)行信息融合輸出。使用基于Python編程語言的PaddlePaddle框架和百度AI Studio平臺,實(shí)現(xiàn)了地震相的自動識別劃分。在模型訓(xùn)練時,采用Adam優(yōu)化器,學(xué)習(xí)率設(shè)定為0.001,批次為8。由于本研究屬于分類問題,因而損失函數(shù)采用交叉熵(Cross Entropy),評價指標(biāo)選取語義分割中常用的mIoU。
圖10 用于地震相識別劃分的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
圖11 圖10中并行模塊的結(jié)構(gòu)
行模塊。并行模塊采用5個不同大小的卷積層來并行學(xué)習(xí)不同尺度的信息,該卷積層由深度可分離卷積與空洞卷積組合構(gòu)成,再將各自學(xué)習(xí)到的信息進(jìn)行通地震數(shù)據(jù)測試表明,圖10模型在驗(yàn)證集上mIoU為0.943,在測試集上為0.941。圖12為模型在測試集上預(yù)測的剖面結(jié)果。從結(jié)果與標(biāo)簽對比可以看出,兩者吻合較好,說明網(wǎng)絡(luò)模型具有表征學(xué)習(xí)出各個地震相的能力,表明深度學(xué)習(xí)在地震相識別中的可行性。
圖12 圖10模型預(yù)測地震相結(jié)果對比
目前的地震相智能識別方法主要包括無監(jiān)督、半監(jiān)督與監(jiān)督3類。由于地震相識別問題的特點(diǎn)、神經(jīng)網(wǎng)絡(luò)方法的靈活性以及易實(shí)現(xiàn)性,使得神經(jīng)網(wǎng)絡(luò)方法成為目前地震相智能識別的主要方法。神經(jīng)網(wǎng)絡(luò)可以利用多個卷積和池化層,使之具有強(qiáng)大的非線性擬合能力,因而具有更高識別精度。對于具體的實(shí)際問題,應(yīng)該依據(jù)具體條件通過優(yōu)選得到一個較好的模型進(jìn)行地震相的智能識別。
隨著技術(shù)的不斷更新和算力的不斷增強(qiáng),地震相識別方法從最初的人工相面法發(fā)展到目前自動智能識別,從常規(guī)的二維面識別發(fā)展到現(xiàn)在的三維體識別,以高效的人工智能方法取代了低效的人工識別。對地震相識別方法的發(fā)展做出以下幾點(diǎn)展望。
1) 少量標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)地震相識別有待發(fā)展。神經(jīng)網(wǎng)絡(luò)屬于數(shù)據(jù)驅(qū)動模型,標(biāo)簽數(shù)據(jù)是模型是否成功的關(guān)鍵。地震數(shù)據(jù)量大而廣,然而往往缺乏足夠的真實(shí)標(biāo)簽,對于神經(jīng)網(wǎng)絡(luò)這種監(jiān)督學(xué)習(xí)來說是致命的,沒有大量標(biāo)簽數(shù)據(jù)來訓(xùn)練,就難以得到有效的識別模型。對于標(biāo)簽數(shù)據(jù)稀少的問題,可以利用無監(jiān)督和半監(jiān)督學(xué)習(xí)等技術(shù)有效克服。從調(diào)研中發(fā)現(xiàn),已經(jīng)有人展開這方面的技術(shù)研究,并取得一定的成果,但多數(shù)還是以監(jiān)督學(xué)習(xí)為主,因而有待進(jìn)一步研究;另外可以應(yīng)用遷移學(xué)習(xí)技術(shù),發(fā)展具有一定普適性的網(wǎng)絡(luò)模型,使一個工區(qū)訓(xùn)練的模型可以遷移到其它工區(qū)使用,從而緩解標(biāo)簽數(shù)據(jù)少的問題。
2) 基于神經(jīng)網(wǎng)絡(luò)的地震相自動識別精度有待提高。地下各種地震相之間大小不一,差別較大。在訓(xùn)練網(wǎng)絡(luò)模型時會出現(xiàn)數(shù)據(jù)不平衡問題,導(dǎo)致在訓(xùn)練過程中看似訓(xùn)練準(zhǔn)確率很高,實(shí)際上占多數(shù)的數(shù)據(jù)類別可能會奪取訓(xùn)練主導(dǎo)權(quán),讓占少數(shù)的數(shù)據(jù)類別很難被網(wǎng)絡(luò)學(xué)習(xí)到,導(dǎo)致實(shí)際預(yù)測結(jié)果較差。對于這個問題,可以從以下3個方面著手解決:①前期特征工程處理,可以考慮將占多數(shù)的丟棄一部分,或者可以將小部分多重復(fù)幾次,使各類數(shù)據(jù)占比較為均衡;②網(wǎng)絡(luò)模型處理,向網(wǎng)絡(luò)模型中加入物理約束層,將一些類似的經(jīng)驗(yàn)公式和機(jī)理模型等加入網(wǎng)絡(luò)模型中進(jìn)行約束,以此來削弱數(shù)據(jù)不平衡的影響;③損失函數(shù)處理,通過修改損失函數(shù)約束網(wǎng)絡(luò)模型的訓(xùn)練,根據(jù)一些經(jīng)驗(yàn)公式等,加入到損失函數(shù)中,以有效消除此問題。以上3種方法的具體實(shí)現(xiàn)還需開展進(jìn)一步的研究。
3) 基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)地震相自動識別。注意力機(jī)制是模仿生物視覺機(jī)制,讓系統(tǒng)學(xué)會注意力關(guān)注重點(diǎn)信息忽略無效信息,從而提高預(yù)測精度。目前注意力機(jī)制在圖像分類與分割中取得了較好的效果,但很少有人將其應(yīng)用于地震相識別中,可以嘗試將其與地震相識別相結(jié)合以提高識別精度。目前,Transformer在計算機(jī)視覺中取得較好的效果,也可以將其用來助力地震相智能識別,進(jìn)一步提高網(wǎng)絡(luò)模型預(yù)測精度。
4) 基于強(qiáng)化學(xué)習(xí)的地震相智能識別。強(qiáng)化學(xué)習(xí)不依賴于標(biāo)簽數(shù)據(jù),它包含一個獎勵系統(tǒng),通過觀察環(huán)境、執(zhí)行動作以及得到的獎勵不斷學(xué)習(xí)。在地震相識別中不需要標(biāo)簽數(shù)據(jù),只需要建立好系統(tǒng),即可通過自主學(xué)習(xí)進(jìn)行地震相識別,而且識別的精度和效率可能會更高,但如何有效應(yīng)用還需要研究。