蘆升彥
中聯(lián)煤層氣有限責任公司, 山西 太原 030000
在實際生產(chǎn)應用中,常常因為儀器故障和井眼坍塌等問題,導致測井曲線某些井段部分測井曲線失真或間斷性缺失的情況,使得后續(xù)的測井解釋工作無法進一步開展,但是重測曲線不僅價格昂貴且操作十分困難[1-2]。以往都是使用數(shù)據(jù)統(tǒng)計分析然后利用線性擬合的方式來計算重構曲線的方法,但是由于實際地質(zhì)情況的復雜多變,很難用一個函數(shù)表達式來定性的準確表達,故其精確性無法滿足超精細測井解釋的需求。
本文將多層感知器(multi-layer perceptron,MLP)神經(jīng)網(wǎng)絡系統(tǒng)的方法應用到測井曲線重構試驗中,并選擇合理的、質(zhì)量較好的曲線作為輸入層數(shù)據(jù),待重構曲線作為輸出層數(shù)據(jù),中間隱藏層的層數(shù)并不固定。與傳統(tǒng)的測井曲線重構方法相比,MLP神經(jīng)網(wǎng)絡模型具備更好的信息表征能力,可以充分挖掘出不同測井曲線參數(shù)之間的非線性因果映射關系和隨地層物理屬性變化的上下空間關聯(lián)信息[3]。在試驗過程中須選擇合理的激活函數(shù)、損失函數(shù)以及梯度下降最優(yōu)化的方法,完成曲線的重構。
人工神經(jīng)網(wǎng)絡的最大優(yōu)勢是其能夠被用作一個任意函數(shù)逼近的機制,是對輸入的訓練數(shù)據(jù)進行反復地訓練學習建立高度擬合的函數(shù),并且加入一些輔助算法尋求最優(yōu)解的過程。人工神經(jīng)網(wǎng)絡是由許多相同的簡單處理單元并聯(lián)組合而成,雖然每個單元的功能簡單,但大量簡單單元的并行活動,使其對信息的處理能力與效果驚人。神經(jīng)網(wǎng)絡系統(tǒng)是由大量簡單神經(jīng)元構成的,每個神經(jīng)元接受大量其他神經(jīng)元的輸入,通過非線性輸入、輸出關系,產(chǎn)生輸出影響其他神經(jīng)元。網(wǎng)絡就是這樣互相制約相互影響,實現(xiàn)從輸入狀態(tài)空間到輸出狀態(tài)空間非線性映射。人工神經(jīng)網(wǎng)絡可以通過訓練和學習來獲得網(wǎng)絡的權值與結構,呈現(xiàn)出很強的自學習能力和對環(huán)境的自適應能力。
MLP是人工神經(jīng)網(wǎng)絡的一種結構,它除了輸入層和輸出層,特別之處在于它中間可以有多個隱藏層。最簡單的MLP只需要有1層隱藏層,即輸入層、隱藏層和輸出層可構成一個簡單的MLP神經(jīng)網(wǎng)絡。MLP神經(jīng)網(wǎng)絡不同層之間是全連接的(全連接的意思是指上一層的任一神經(jīng)元與下一層的所有神經(jīng)元都有連接),同層之間彼此獨立不相連接。
MLP神經(jīng)網(wǎng)絡結構如圖1所示,在MLP神經(jīng)網(wǎng)絡中輸入層是輸入的變量,不需要經(jīng)過任何處理,如輸入1個m維向量,就有m個神經(jīng)元。隱藏層的神經(jīng)元是和輸入層和輸出層全連接的,假設輸入層用向量X表示,隱藏層用向量d表示,輸出層用向量y表示;則隱藏層的輸出就是d=f1(W1X+b1);最后就是輸出層和隱藏層的關系了,隱藏層作為輸入層和輸出層的橋梁,隱藏層的輸出作為輸出層的輸入,y=f2(W2d+b2),其中W1、W2是權重(也叫連接系數(shù)),b1、b2是偏置,函數(shù)f1、f2是激活函數(shù)。
圖1 MLP神經(jīng)網(wǎng)絡結構
綜上所述,MLP神經(jīng)網(wǎng)絡模型用公式總結起來就是:y=f2[W2(W1X+b1)+b2]。因此,MLP所有的參數(shù)就是各個層之間的連接權重以及偏置,包括W1、b1、W2、b2;求解最佳參數(shù)就變成了一個最優(yōu)化的問題。解決最優(yōu)化問題,最常用的就是使用隨機梯度下降法(SGD):首先隨機初始化所有參數(shù),然后迭代地訓練,不斷地計算梯度和更新參數(shù),直到滿足某個條件為止(例如誤差足夠小、迭代次數(shù)足夠多時)。
神經(jīng)網(wǎng)絡主要有3個基本要素:權重、偏置和激活函數(shù)。神經(jīng)元之間的連接強度由權重表示,權重的大小表示可能性的大小;偏置的設置是為了正確分類樣本,是模型中一個重要的參數(shù),即保證通過輸入算出的輸出值不能隨意激活;激活函數(shù)發(fā)揮非線性映射的作用,可將神經(jīng)元的輸出幅度限制在一定范圍內(nèi)[4]。一個完整的MLP神經(jīng)網(wǎng)絡參數(shù)更新的循環(huán)流程已經(jīng)完成:輸入—隱藏層—輸出—損失函數(shù)—誤差反向傳播—修正權重及偏置—重復此循環(huán)。
為探究MLP神經(jīng)網(wǎng)絡模型在油氣田測井曲線重構及復原領域的實際應用效果,進行了相關試驗。試驗以X油氣田的油井數(shù)據(jù)集為基礎,該測井序列采樣間隔為0.125 m,地層以常規(guī)的砂泥巖剖面為主,巖性相對穩(wěn)定,這可能為后續(xù)的測井曲線重構降低了一定難度。補償密度(DEN)曲線在地層巖性判別、物性分析、孔隙度計算等具有重要意義,因此本次試驗選擇以DEN曲線為例進行研究。
若單獨研究不同測井序列數(shù)據(jù)集之間的縱向關聯(lián)關系,而忽視其本身隱藏的地質(zhì)特性和地球物理屬性,往往不能得到較為精確和穩(wěn)定的預測結果。因此,為了提高測井數(shù)據(jù)預測的準確率并提升模型的魯棒性,必須同時挖掘測井曲線橫向和縱向隱藏的特征信息,從數(shù)據(jù)和預測模型2個維度構建預測精度較高的復原方法。數(shù)據(jù)方面主要是對測井曲線作精細的預處理,預測模型方面主要通過選擇合理的優(yōu)化算法對模型進行優(yōu)化。
基于MLP的測井曲線重構技術主要由樣本數(shù)據(jù)的選擇與整理、關鍵參數(shù)的選擇和優(yōu)化及模型的精度評價等部分組成,重構模型流程如圖2所示。該模型的過程主要分為5步。①通過主成分分析等數(shù)學方法,優(yōu)選出對需要待重構曲線的敏感測井參數(shù)。②對樣本測井數(shù)據(jù)進行剔除異常值、數(shù)據(jù)標準化和歸一化預處理,最后將樣本按8:2的比例分為測試樣本和訓練樣本。③根據(jù)需求選擇適合的激活函數(shù)。④創(chuàng)建基于MLP的測井曲線重構模型;選取Adam作為優(yōu)化器,來更新MLP模型的權重和參數(shù),同時,為防止發(fā)生梯度爆炸,采用SGD隨機梯度下降法來訓練深層模型,反復循環(huán)迭代,將預測數(shù)據(jù)與原有數(shù)據(jù)進行交叉驗證,尋找滿足誤差要求的最佳的權重、偏置參數(shù)組合。⑤利用該模型對測試集數(shù)據(jù)進行計算,并對其性能進行分析評估,評估原則為重構曲線和實測曲線重合度較高則說明預測結果較好。
圖2 基于MLP的測井曲線重構模型流程
由于很難定性判斷重構曲線的質(zhì)量,因此在試驗中把質(zhì)量好且完整的測井曲線,人為地、無規(guī)律地刪除部分曲線數(shù)據(jù),使曲線變成間斷性數(shù)據(jù)缺失的曲線,最后將重構曲線與原始曲線做對比,如圖3所示。以DEN曲線為例,試驗中把實測DEN曲線間斷性地、無規(guī)律地刪除一些數(shù)據(jù),人為地制造缺失曲線DEN-2,同時要保留原曲線用來和后續(xù)重構的曲線做質(zhì)量對比?;诘厍蛭锢頊y井基本原理,通過敏感性分析,優(yōu)選出與DEN曲線敏感性較高的4個測井參數(shù)作為輸入曲線:自然伽馬曲線GR、中子曲線TNPH、深電阻率曲線RT、沖洗帶電阻率曲線TXO,DEN曲線作為輸出曲線。
圖3 重構曲線測井圖對比
結果分析如圖3所示:其中第5道中的DEN為原始實測測井曲線,DEN-MLP為重構曲線,第6道中的DEN-2為缺失曲線。通過對比可以發(fā)現(xiàn):重構的DEN-MLP曲線與實測DEN曲線基本重合,圖中重構曲線與原始曲線重合度越高說明重構曲線質(zhì)量越好。從圖中可以看出試驗得到的重構曲線有著良好的預測性能,預測曲線與真實曲線之間的貼合重疊程度較高,其重構的補償密度曲線的走勢與原始真實曲線的走勢基本保持一致,不僅可以捕獲到DEN曲線的總體走勢,在測井曲線的某些波峰和波谷這些幅值發(fā)生突變的地方也有較好的反映,說明預測值與真實值之間處于強相關狀態(tài)。如圖4所示,結果顯示R2=0.992 9,也表明了重構預測曲線與實測曲線相關性較高。
圖4 實測密度和重構密度曲線交會圖
基于MLP神經(jīng)網(wǎng)絡的測井曲線重構模型預測精度較高,可以為油田后續(xù)的勘探開發(fā)、地層研究、儲層評價等提供更高精度的曲線輸出和強有力的數(shù)據(jù)保障,進一步助力油田的降本增效行動,該方法可以在其他油田推廣使用,同時也為其他研究者在測井曲線重構方向提供了新思路。
本文介紹了一種基于MLP神經(jīng)網(wǎng)絡模型重構測井曲線的方法。該方法通過隱藏層并引入激活函數(shù)來建立輸入曲線和輸出曲線的非線性關系;通過機器學習來進行,無需人工的過多干預,突破了傳統(tǒng)的利用經(jīng)驗公式和僅建立曲線間線性關系的局限性。
研究表明:在進行測井曲線重構時,不能只考慮不同測井曲線之間的縱向關聯(lián)性,還應該綜合考慮并充分挖掘其深層次隱藏的地質(zhì)特性和地球物理特性,必須在數(shù)據(jù)處理和模型優(yōu)化2個方面進行研究,只有這樣才可以提高曲線預測的精度。
在密度測井曲線重構的試驗中證明了基于MLP神經(jīng)網(wǎng)絡進行曲線重構的準確性、實用性和便捷性、可推廣性。試驗結果分析表明利用MLP技術得到的重構曲線精度較高,計算速度快,具有較強的普適性,同時可以降低成本,提高效率,可以在油田推廣使用。