孫欽帥 宋延杰 唐曉敏
1. 中海油田服務股份有限公司, 河北 廊坊 065201;2. 東北石油大學地球科學學院, 黑龍江 大慶 163000
基巖一直是遼河凹陷重要的勘探領(lǐng)域之一?!笆晃濉币詠?通過深化勘探,興隆臺、高升、中央凸起等領(lǐng)域取得了多項重大發(fā)現(xiàn)與突破,為近十幾年遼河油田增儲穩(wěn)產(chǎn)提供了重要的支撐點[1-3]。其間發(fā)現(xiàn)的含油氣層系遍及太古界、中上元古界、古生界、中生界等前古近系各個層系,巖性包括不同變質(zhì)程度的變質(zhì)巖(混合花崗巖、石英巖、板巖、片麻巖等)、砂礫巖、巖漿巖、碳酸鹽巖等[4-7]。
近十幾年來,變質(zhì)巖潛山已成為遼河凹陷油氣勘探的重要開發(fā)領(lǐng)域,變質(zhì)巖潛山儲集層儲集空間類型多樣,包括風化淋濾孔(縫)、構(gòu)造裂縫和礦物顆粒晶內(nèi)裂縫等[8-11],且變質(zhì)巖巖性直接或間接影響著裂縫發(fā)育狀況和溶蝕作用等原生因素,因此研究區(qū)層位的巖性識別和預測任務對于下一步的儲層預測與評價有極其重要的意義。本次研究通過對X潛山變質(zhì)巖類測井響應機理分析,優(yōu)選了對變質(zhì)巖敏感的響應參數(shù),建立了巖性識別圖版,同時利用決策樹(Decision Tree,DT)模型與支持向量機(A Library for Support Vector Machines,LIBSVM)模型對巖性進行了判別,建立了變質(zhì)巖定性識別模型,以期為研究區(qū)變質(zhì)巖巖性識別提供參考依據(jù)。
變質(zhì)巖的測井響應主要是指巖性(化學成分、礦物成分)、物性和含油氣性的綜合響應[12]。X潛山變質(zhì)巖的主要造巖礦物按顏色和化學成分大體可分成兩類:一類主要礦物成分為堿性長石類、斜長石類及石英的淺色礦物系列,其測井特征值普遍表現(xiàn)為相對低密度、低中子、低光電吸收截面指數(shù),且具有較高的自然伽馬值;另一類主要礦物成分為角閃石、黑云母、輝石的暗色礦物系列,這類礦物的密度較高,同時因角閃石、黑云母等暗色礦物中含有較多的結(jié)晶水或結(jié)構(gòu)水,礦物中氫元素含量高,中子孔隙度較高,自然伽馬值較低。因此,根據(jù)主要造巖礦物組成和含量以及礦物的物理性質(zhì),可知混合花崗巖、混合片麻巖、片麻巖、角閃巖的密度和中子值依次增大,混合花崗巖、混合片麻巖、片麻巖的自然伽馬為高值,角閃巖的自然伽馬為低值。
由于混合花崗巖、混合片麻巖、片麻巖、角閃巖的密度和中子響應不同,因此,混合花崗巖、混合片麻巖、片麻巖、角閃巖的視石灰?guī)r刻度的中子密度孔隙度差值也應不同。這里從理論上分析混合花崗巖、混合片麻巖、片麻巖、角閃巖的視石灰?guī)r刻度的中子密度孔隙度差值變化情況。
X=φD-φN
(1)
對于純巖石,巖石的密度和中子測井響應為:
(2)
圖1為理論模擬的混合花崗巖、混合片麻巖、片麻巖、角閃巖的視石灰?guī)r刻度的中子密度孔隙度差值與孔隙度值交會圖。為了更接近研究區(qū)真實的物性條件,圖2為孔隙度5%時,理論模擬的混合花崗巖、混合片麻巖、片麻巖、角閃巖視石灰?guī)r刻度的中子密度孔隙度差值曲線圖。從圖2可以看出,混合花崗巖、混合片麻巖、片麻巖、角閃巖的中子密度孔隙度差值具有一定差異。
圖1 變質(zhì)巖中子密度孔隙度差值與孔隙度模擬圖Fig.1 Simulation diagram of PDNC and porosityof metamorphic rocks
圖2 變質(zhì)巖巖性剖面中子密度孔隙度差值響應模擬圖(孔隙度5%)Fig.2 XPDNC response simulation diagram of lithologic profileof metamorphic rock(The porosity is 5%)
基于變質(zhì)巖測井響應機理分析,優(yōu)選出自然伽馬曲線及視石灰?guī)r刻度的中子密度孔隙度差值曲線作為敏感響應曲線,利用X潛山14口井212個巖層的測井數(shù)據(jù),建立的變質(zhì)巖中子密度孔隙度差值—自然伽馬巖性識別圖版見圖3,圖版精度為86.8%,并給出了其巖性判別標準見表1。
圖3 變質(zhì)巖中子密度孔隙度差值—自然伽馬識別圖版Fig.3 XPDNC-GR identification chart of metamorphic rocks
表1 變質(zhì)巖巖性判別標準表
DT模型作為一種經(jīng)典的數(shù)據(jù)挖掘分類算法,因其具有優(yōu)秀的非線性分類能力和簡單易懂的分析原理及結(jié)果在地質(zhì)勘探領(lǐng)域得到了廣泛應用[13-14]。通常DT模型的建立包括建樹和剪枝兩步。建樹階段常用算法包括ID3、C4.5、CART、QUEST和CHAID。各種算法在學習過程中為了盡可能正確地對樣本集進行分類,需要不停對節(jié)點進行劃分,結(jié)果就是整棵樹分支過多,即導致了過擬合現(xiàn)象。剪枝的目的就是為了避免DT模型的過擬合,常用的方法包括預剪枝和后剪枝:預剪枝就是在DT模型構(gòu)造過程中,先對每個節(jié)點在劃分前進行估計,若當前節(jié)點的劃分不能帶來模型泛化性能的提升,那么就不對該節(jié)點進行劃分并將其標記為葉節(jié)點;后剪枝就是先把整棵DT模型構(gòu)造完畢,然后自下向上對每個非葉節(jié)點進行考察,若將該節(jié)點對應的子樹換為葉節(jié)點能夠帶來泛化性能的提升,則把該節(jié)點替換為葉節(jié)點。
測井參數(shù)的選擇對于測井巖性識別的準確率具有很重要的影響,基于測井響應機理分析結(jié)果,選取對變質(zhì)巖反應靈敏的自然伽馬、經(jīng)井徑校正后的補償中子、補償密度及視石灰?guī)r刻度的中子密度孔隙度差值作為測井參數(shù),混合花崗巖、混合片麻巖、片麻巖、角閃巖巖性標簽分別用1、2、3、4代表,選取X潛山14口井212個巖層的測井參數(shù)為樣本集,并隨機抽取160個測井參數(shù)樣本作為訓練集,剩余樣本作為測試集。利用訓練集進行建樹階段,采用了C4.5算法及后剪枝方法,最終得到了基于DT模型的巖性分類器,見圖4。其重采樣誤差為0.057,交叉驗證誤差為0.138 4。利用建好的DT模型對52個測試集樣本進行了仿真測試,預測類別與真實類別對比結(jié)果,符合率為86.54%,見圖5。利用模型對整個樣本集判別,其符合率為92.0%。
圖4 變質(zhì)巖巖性識別DT模型圖Fig.4 Decision tree model for lithology identification ofmetamorphic rocks
圖5 DT模型測試集預測結(jié)果圖Fig.5 The prediction results of the test set of the decisiontree model
LIBSVM作為一種有監(jiān)督的機器學習方法,具有極優(yōu)的分類能力[15-20],常用的核函數(shù)有線性核函數(shù)、多項式核函數(shù)、Sigmoid核函數(shù)和徑向基(Radital Basis Function,RBF)核函數(shù)。其中,RBF核函數(shù)能夠?qū)崿F(xiàn)非線性映射且參數(shù)相對較少,穩(wěn)健性明顯高于其他核函數(shù),這在測井巖性識別時優(yōu)勢明顯。對于多分類問題,LIBSVM將其轉(zhuǎn)換成二分類問題,常用的方法有一對多和一對一。一對多方法中,訓練時把k類樣本中某一個歸為一類,其余歸為一類,使用二分類的LIBSVM訓練出一個二分類器,同理遍歷每一個樣本使其自己為一類,其余樣本為另一類,這樣最終就會得到k個二分類器組成k分類器。對未知樣本分類時,分別用k個二分類器進行分類,將分類結(jié)果出現(xiàn)最多的類別最為最終的分類結(jié)果。對于一對一方法,訓練時任意兩類樣本都會得到一個二分類器,最終得到k×(k-1)/2個二分類器共同組成k分類器。對未知樣本分類時,使用k×(k-1)/2個二分類器進行分類,將出現(xiàn)最多的那個類別作為這個樣本的最終分類結(jié)果。下面是基于LIBSVM模型的巖性定性識別步驟。
1)模型測井參數(shù)的選取。選取對變質(zhì)巖反應靈敏的自然伽馬、經(jīng)井徑校正后的補償中子、補償密度及視石灰?guī)r刻度的中子密度孔隙度差值作為測井參數(shù),混合花崗巖、混合片麻巖、片麻巖、角閃巖巖性標簽分別用1、2、3、4代表。
2)樣本集的簡單縮放。為了避免大數(shù)值區(qū)間的屬性過分支配小數(shù)值區(qū)間的屬性,將樣本集的每種屬性利用極差標準化的方法縮放到[-1,1]區(qū)間。
3)選用RBF核函數(shù)作為映射函數(shù)。由于樣本個數(shù)遠大于測井參數(shù)個數(shù),且RBF核函數(shù)能實現(xiàn)非線性映射且比多項式核函數(shù)參數(shù)少,可以降低模型復雜程度、減小計算量同時縮短運行時間,因此選用RBF核函數(shù)較為合適。
4)采用網(wǎng)格搜索及交叉驗證方法求取最佳參數(shù)——誤差懲罰系數(shù)C與RBF核函數(shù)參數(shù)λ。為了評估統(tǒng)計分析、機器學習方法對獨立于練習數(shù)據(jù)的數(shù)據(jù)集的泛化能力,避免過擬合,采用網(wǎng)格搜索及5折交叉驗證的方法得到滿足精度要求的一組最佳參數(shù)為C=42.22,λ=1。
6)對測試集進行模型仿真測試。利用建立的LIBSVM模型對測試集數(shù)據(jù)進行了測試,測試集樣本的分類正確率為84.615%,均方根誤差為0.153 8,平方相關(guān)系數(shù)為0.765 5,見圖6。
圖6 LIBSVM模型測試集預測結(jié)果圖Fig.6 The prediction results of the test set of theLIBSVM model
利用圖版法、DT模型及LIBSVM模型對hg1井太古界巖性進行了識別,見圖7。第八道為圖版法識別巖性,第九道為DT模型識別巖性,第十道為LIBSVM識別巖性,第十一道為由鉆井取心和錄井分析得出的實際巖性。在2 497.0~2 515.4 m、2 515.4~2 529.4 m、2 532.4~2 541.3 m、2 561.8~2 564.2 m、2 564.2~2 568.5 m、2 568.5~2 580.1 m井段3種方法識別巖性均與實際巖性一致。在2 529.4~2 532.4 m井段,圖版法與DT模型識別巖性均為混合片麻巖,LIBSVM模型識別為片麻巖,實際巖性為片麻巖。在2 541.3~2 558.6 m井段,圖版法與LIBSVM模型識別巖性均為混合片麻巖,DT模型識別為片麻巖,實際巖性為片麻巖。在2 558.6~2 561.8 m井段,圖版法識別巖性為混合片麻巖,DT模型與LIBSVM模型識別巖性均為混合花崗巖,實際巖性為混合花崗巖。DT模型與LIBSVM模型識別符合率均為88.89%,圖版法識別符合率為66.67%。識別結(jié)果表明DT模型及LIBSVM模型對研究區(qū)變質(zhì)巖巖性判別具有一定的可靠性與適用性,在缺少鉆井取心資料的深度段可以有效進行變質(zhì)巖巖性識別。
圖7 三種巖性識別方法應用效果對比圖Fig.7 Comparison of application effects of three lithology identification methods
1)基于錄井巖性、巖石薄片及測井響應特征將研究區(qū)變質(zhì)巖類歸為了混合花崗巖、混合片麻巖、片麻巖及角閃巖4類,通過測井響應機理分析,構(gòu)造了視石灰?guī)r刻度的中子密度孔隙度差值這一組合參數(shù),并優(yōu)選出了變質(zhì)巖的敏感測井響應為補償中子、補償密度、自然伽馬、中子密度孔隙度差值。
2)在變質(zhì)巖類敏感測井響應優(yōu)選基礎(chǔ)之上,建立了中子密度孔隙度差值—自然伽馬巖性識別圖版及其識別標準,基于C4.5算法及后剪枝方法建立了變質(zhì)巖識別DT模型,給出了變質(zhì)巖識別樹狀結(jié)構(gòu)圖。以RBF核函數(shù)為映射函數(shù),采用網(wǎng)格搜索方法優(yōu)化了誤差懲罰系數(shù)C與RBF核函數(shù)參數(shù)λ,進而建立了變質(zhì)巖識別LIBSVM模型,DT模型與LIBSVM模型精度均高于圖版法精度。
3)分別利用圖版法、DT模型及LIBSVM模型對研究區(qū)單井進行巖性識別,并與鉆井取心巖性進行對比,結(jié)果表明DT模型與LIBSVM模型分類能力更優(yōu),符合率也更高。與圖版法相比,DT模型與LIBSVM模型避免了人為性,保證準確率的同時增加了可操作性,具有廣闊的應用空間。