廖廣志 ,李遠征 ,肖立志 ,秦志軍,胡向陽,胡法龍
1 中國石油大學(北京)油氣資源與探測國家重點實驗室,北京 102249 2 中國石油大學(北京)教育部非常規(guī)油氣國際合作聯(lián)合實驗室,北京 102249 3 中國石油大學(北京)地球探測與信息技術北京市重點實驗室,北京 102249 4 中國石油新疆油田勘探開發(fā)研究院,克拉瑪依 834000 5 中海石油(中國)有限公司湛江分公司,湛江 524057 6 中國石油勘探開發(fā)研究院測井與遙感技術研究所,北京 100083
在中低滲油氣藏中,毛管壓力是油氣自吸的主要作用力,也是油氣排驅的主要阻力,并在很多油氣藏中影響著油氣的分布。而影響毛管壓力的一個主要因素是儲層的孔隙結構[1-2]。由于儲層孔隙結構的差異,孔滲條件相同的中低滲油氣藏的烴飽和特性可能完全不同[3]。儲層孔隙結構表征與預測對地質作用分析與油氣分布等方面的新認識具有重要意義。造成儲層孔隙結構差異的因素較多,比如巖石類型、分選、粒度等。成巖作用對儲層的微觀孔隙結構有著正反兩方面的影響。壓實作用減小了一些原生孔隙,而由膠結作用形成的膠結物使得孔隙結構變得更加復雜;溶蝕作用可以形成均質性較好的次生孔;由地質構造作用產生的下降和隆升使地層受到沉陷和剝蝕,亦能部分重構儲層的孔隙結構[4-6]。
壓汞毛管壓力數據(MICP)是間接識別儲層孔隙結構的常用數據之一。目前在實驗室有許多關于儲層巖石孔隙結構的研究方法,如使用巖心切片和MICP數據對巖心數據進行統(tǒng)計分析[7],利用核磁T2譜擬合擬毛管壓力曲線來表征微觀孔隙結構[8],利用巖心CT和數字巖心相結合的多維成像技術來指示宏觀參數和微觀參數之間的關系等[9-12]。這些方法對孔隙結構的表征在響應機理、分辨率、響應范圍等方面各不相同,存在較大差異,有時候甚至存在矛盾之處。目前,大部分方法只能通過巖心取樣在實驗室進行測量分析,由于成本原因難以在井下推廣應用。儲層微觀孔隙結構表征和預測的主要重點是:1)如何正確認識儲層不同的孔隙結構以及不同的孔隙結構對油氣分布的控制作用;2)如何建立一個經濟有效的孔隙結構分類方法;3)如何構建微觀孔隙結構與宏觀表征參數之間的關系。
以數據為驅動的深度學習算法可以充分整合不同類型數據中的有效信息,對多源數據進行特征描述[12]。深度學習技術可以自主學習特征,避免復雜的前期預處理,根據學習模型獲得無序的、非線性的調節(jié),使其無限逼近目標[13-14]。本研究以新疆某地區(qū)砂礫巖地層為例,在深入分析MICP數據特征的基礎上,提取11個特征參數中的敏感性參數來表征儲層孔隙結構。利用灰色關聯(lián)分析、主成分分析、因子分析和智能聚類等數據挖掘技術解決數據之間的共線問題和孔隙結構分類問題,然后將常規(guī)測井資料作為輸入層,提出了一種應用卷積神經網絡預測儲層微觀孔隙結構的方法。
利用MICP數據特征可以表征不同的孔隙結構參數,如孔喉半徑、分選、孔喉分布的均勻性、連通性等[15-16]??紫督Y構參數可以用分布函數模型來計算。表1為計算得到的孔隙結構參數及其物理意義。
表中,Pd為排驅壓力,Di為進汞飽和度為i時所對應的喉道半徑,Smax為最大進汞飽和度,Vk為孔隙體積,Vh為喉道體積,R為平均孔隙半徑,P50為進汞飽和度為50%時的壓力。
灰色關聯(lián)分析是一種多因素統(tǒng)計分析方法,是根據因素之間發(fā)展趨勢的相似或相異程度,即灰色關聯(lián)度,作為衡量因素間關聯(lián)程度的一種方法[17-18]。這里將巖心滲透率作為灰色關聯(lián)分析中的參考數列,各個孔隙結構參數作為比較數列,進而確定孔隙結構的敏感性參數。
灰色關聯(lián)分析的結果如表2所示,選取關聯(lián)度較大的Ra、Dm、We、Kp、Skp、K和α為孔隙結構的敏感性參數,所選參數具有很強的相關性,為解決參數間的共線性問題,需對所選參數做進一步的分析。
主成分分析和因子分析是高維數據降維的兩種常用方法,將兩種方法用于孔隙結構參數的壓縮,解決共性線問題。表3是主成分分析的結果,第一列是提取的主成分,第二列每個主成分對應的特征值,其大小表示包含原始變量各主成分的能力,第三列和第四列表示每個主成分的貢獻率及累計貢獻率。從表中可以看出,前3個主成分包含原始數據90%以上的信息,提取前3個主成分可達到數據壓縮的效果。由主分析分析的碎石圖(圖1)的結果也可以看到,前3個主成分所對應的平臺陡峭,包含原始數據的大部分信息。
表1 孔隙結構參數及物理意義Table 1 Pore structure parameters and physical significance
表2 灰色關聯(lián)分析Table 2 Grey relational analysis
主成分分析主要用于數據壓縮,消除共線性,但難以解釋每個主成分的實際意義,基于參數矩陣的因子分析可以對提取的因子做因子旋轉,使得因子與組分之間的關系得到重新分布,從而使孔隙結構類型更易于解釋[18]。圖2為提取的主因子與孔隙結構參數的三維交匯圖,表4是因子旋轉之后的結果。由表可知,Skp、Kp和α的因子1的得分分別為0.962、-0.783和0.612,說明因子1主要反映的而是孔喉分選及分布的信息。We和K的因子2的得分分別為0.880和-0.979,說明因子2主要反映孔喉滲流及連通性的信息。而Ra和Dm因子3的因子得分分別為0.983和0.910,說明因子3主要反映孔喉大小信息。由此推斷出孔隙結構可以從孔喉分選及分布、孔喉滲流及連通、孔喉大小三方面來描述。
表3 主成分分析Table 3 Principal component analysis
對經過主成分分析之后的孔隙結構數據進行聚類分析,以確定孔隙結構的類型。首先引入層次聚類的方法。層次聚類試圖在不同層次上對數據集進行劃分,從而形成樹形的聚類結構。有“自底向上”的聚合策略,也有“自頂向下”的分拆策略?!白缘紫蛏稀本酆喜呗允紫葘⒚總€對象作為一個簇,然后合并這些簇為越來越大的簇,直到所有的對象都在一個簇中。計算簇與簇之間距離的方法有三種,包括最短距離法,最長距離法,類平均法[19]。
圖1 主成分分析碎石圖Fig. 1 Scree plot of principal component analysis
圖2 孔隙結構參數因子分析得分圖Fig. 2 Factor analysis score chart of pore structure parameters
表4 因子分析旋轉成分矩陣Table 4 Factor analysis rotation component matrix
原始孔隙結構數據經過主成分分析之后,每個樣本得到3個主成分,將這3個主成分組成三維向量進行凝聚層次聚類分析。采用類平均法計算兩個簇中的每個數據點與其它簇中所有數據點的距離,然后將所有距離的均值作為兩個簇間的距離。其綜合考慮到了所有的數據點,結果較最短距離法和最長距離法更為合理。圖3是凝聚層次聚類的結果示意圖。
由凝聚層次聚類結果可知,以1.0作為類間距離劃分的標準值,孔隙結構可以分為5類。同時引入K均值聚類的方法和譜聚類的方法進行對比分析。
圖3 凝聚層次聚類結果Fig. 3 The results of aggregation hierarchical clustering
圖4 K均值聚類流程Fig. 4 K-means clustering process
表5 K值聚類的聚類中心Table 5 The center of the K-means clustering
原始孔隙結構數據經過主成分分析之后,每個樣本得到3個主成分,將這3個主成分組成三維向量,進行K均值聚類分析,由凝聚層次聚類的結果可知,孔隙結構可以分成5類,故進行K均值聚類分析時,隨機選擇5個聚類中心,其聚類流程如圖4所示,最終得到的5類孔隙結構,聚類中心如表5所示。
譜聚類是一種基于圖論的聚類方法,通過對樣本數據的拉普拉斯特征向量進行聚類,從而達到對樣本數據進行聚類的目的[20]。將每個樣本的3個主成分組成三維向量,依次計算樣本數據的相似度矩陣、度矩陣、拉普拉斯矩陣,然后對拉普拉斯矩陣進行標準化,計算特征值,最后進行聚類,其算法流程如圖5所示。
綜合凝聚層次聚類、K均值聚類、譜聚類的聚類結果,結合孔隙結構特征參數,最終孔隙結構的分類如表6所示。
根據孔隙結構的最終分類結果,分別繪制5類毛管壓力曲線,如圖6所示。
由各類毛管壓力曲線形態(tài)可知,第一類毛管壓力曲線對應的孔隙結構最好,第五類毛管壓力曲線對應的孔隙結構最差。同時將提取的主成分與各類孔隙結構做三維交匯圖(圖7)。
圖5 譜聚類流程Fig. 5 Spectral clustering process
從三維分布上(圖7)看,第一類孔隙結構的第一主成分主要分布范圍為0.91~4.55,第二主成分主要分布范圍為0.81~1.07,第三主成分主要分布范圍為-0.64~1.19;第二類孔隙結構的第一主成分主要分布范圍為-0.78~0.75,第二主成分主要分布范圍為0.22~1.06,第三主成分主要分布范圍為-1.23~-0.09;第三類孔隙結構的第一主成分主要分布范圍為-1.52~0.05,第二主成分主要分布范圍為0.08~0.35,第三主成分主要分布范圍為0.76~1.31;第四類孔隙結構的第一主成分主要分布范圍為-1.86~-0.35,第二主成分主要分布范圍為-1.36~-0.06,第三主成分主要分布范圍為-1.07~0.21;第五類孔隙結構的第一主成分主要分布范圍為-1.89~0.13,第二主成分主要分布范圍為-4.38~-2.07,第三主成分主要分布范圍為-0.74~-0.52;各類孔隙結構與提取的主成分之間有比較明顯的界限,說明孔隙結構數據經過挖掘之后,其分類是有效的。
測井資料能夠反映儲層孔隙結構信息,但在實際應用中存在較大困難,原因是孔隙結構與測井資料的定量關系是一個十分復雜的非線性系統(tǒng)。用常規(guī)的物理模型難以準確表達兩者之間的定量關系??紫督Y構類型的預測需要提取特征,解決MICP數據與測井資料之間的尺度問題。
表6 部分樣本孔隙分類結果Table 6 Part of pore structure classification results
人工神經網絡雖然具有良好的智能特性,但不具備自主地學習特征。卷積神經網絡(CNN)是近年來快速發(fā)展的一種高效模式識別方法。該網絡避免了復雜的前期預處理,可以直接輸入原始信息[21]。其示意圖如圖8所示。
圖6 各類孔隙結構毛管壓力曲線Fig. 6 Capillary pressure curves of various pore structures
相比于人工神經網絡,CNN具有以下優(yōu)勢:
1)局部感知:每個神經元不是對全部測井曲線進行感知,而是對局部信息進行感知,然后在更高層將局部信息綜合起來獲得全局信息。從而有效地減少訓練參數,降低網絡規(guī)模,如圖9所示。
2)權值共享:將卷積操作看成是與位置無關的特征提取方式,測井曲線的一部分統(tǒng)計特性與其他部分是一樣的,這意味著學習的某一部分也能用在另一部分上。所以對于這條曲線上的所有位置,都能使用同樣的學習特征。這將減少網絡各層之間的連接,同時又降低過擬合的風險。
圖7 各類孔隙結構與主成分三維交匯圖Fig. 7 Three-dimensional intersection diagrams of various pore structures and principal components
圖8 卷積神經網絡示意圖Fig. 8 Schematic diagram of convolutional neural network
3)子采樣:子采樣也叫做池化,池化層夾在連續(xù)的卷積層中間,用于壓縮數據和參數的量,減小過擬合(圖10)。
孔隙結構類型預測問題與大部分分類預測問題相似,是通過監(jiān)督學習的方法訓練模型來預測未知數據。然而,測井數據不同于常規(guī)的圖像、文字等數據,其特征難以用深度學習的方法進行表達。這里將測井數據模擬成圖片的像素點數據,將前文聚類分析得到的孔隙結構類別作為標簽,利用卷積神經網絡良好的特征學習能力自主訓練儲層特征,基于此設計了單層卷積神經網絡模型和雙層卷積神經網絡模型。
單層卷積神經網絡模型的網絡結構如圖11所示。
單層卷積神經網絡模型由4部分組成,分別為測井信息輸入層、卷積特征層、池化層、全連接層。輸入層為自然伽馬、自然電位、井徑、三電阻率、聲波、中子、密度9種測井數據模擬成的3×3像素點,卷積特征層由4個卷積核組成,大小為2×2×1,步長為1,池化層采用的是2×2最大值池化,步長為1,接著連接兩個全連接層,網絡的輸出層后加上一個softmax層,將網絡輸出的得分值轉化為各個孔隙結構的概率分布,權重初始化采用高斯初始化,偏置用0.1初始化。激活函數采用relu激活函數,損失函數采用交叉熵損失函數。采用梯度下降法進行批量訓練,每4個樣本組成一個batch,所有batch完成一次訓練為一次迭代過程,訓練過程使損失函數不斷減小,直到到達設定的閾值或迭代次數達到設定的次數,完成訓練后,保存權重和偏置參數,得到訓練好的神經網絡模型。
圖9 神經元局部連接Fig. 9 Local connection of neurons
圖10 池化過程Fig. 10 Pooling process
網絡在訓練10 000次左右達到收斂,在訓練集上能達到85%左右的準確率,在測試集上的準確率為78.6%,如圖12所示。
雙層卷積網絡模型如圖13所示,將常規(guī)測井數據模擬成9×9的像素矩陣作為網絡的輸入,第一層卷積采用4個卷積核,大小為3×3×1,步長為1;池化層采用的是2×2最大值池化,步長為1;第二層卷積采用8個卷積核,大小為3×3×4,步長為1,最后采用兩個全連接層。網絡的輸出層后加上一個softmax層,將網絡輸出的得分值轉化為各個孔隙結構的概率分布,權重初始化采用高斯初始化,偏置用0.1初始化。激活函數采用relu激活函數,損失函數采用交叉熵損失函數。采用梯度下降法進行批量訓練,每4個樣本組成一個batch,所有batch完成一次訓練為一次迭代過程,訓練過程使損失函數不斷減小,直到到達設定的閾值或迭代次數達到設定的次數,完成訓練后,保存權重和偏置參數,得到訓練好的神經網絡模型。
雙層卷積神經網絡在迭代10 000次左右就收斂了,如圖14所示,在訓練集上,其訓練的準確率可以達到90%,而在測試集上,最終預測的準確率的可達到82.1%,比單層卷積神經網絡模型的準確率提升3.5%。這是因為原始數據經過兩次卷積操作后,其特征被一步步抽象化,由低維到高維,最終送入全連接層的是一些相對很純凈的特征。測試集上的預測結果如圖15所示,左圖中勾表示預測正確,叉表示預測錯誤,右圖中最后一道為測試結果。從圖15可以看到,雙層卷積神經網絡模型預測準確性較高。
圖11 單層卷積神經網絡結構Fig. 11 The structure of single-layer convolutional neural network
圖12 單層卷積神經網絡訓練和測試誤差曲線Fig. 12 Training and test error curves of single layer convolutional neural network
圖13 雙層卷積神經網絡網絡結構Fig. 13 The structure of double-layer convolutional neural network
圖14 雙層卷積神經網絡訓練和測試誤差曲線Fig. 14 Training and testing error curves of double-layer convolutional neural network
圖15 雙層卷積神經網絡預測結果Fig. 15 Prediction results of double-layer convolutional neural network
將單層卷積神經網絡模型和雙層卷積神經網絡模型應用于未取心井,其應用效果如圖16所示,表7為測井資料綜合解釋成果表。
可以看到,單層和雙層卷積神經網絡在油層和干層的預測結果差異不大,但在差油層和含油層,雙層卷積神經網絡的預測結果比單層卷積神經網絡預測結果相比,與測井解釋結果更相符。
圖16 模型的實際應用Fig. 16 Practical application of the model
表7 測試井測井資料綜合解釋成果表Table 7 Results of comprehensive interpretation of test well logging data
深度學習作為一種快速發(fā)展人工智能技術在各個領域都開始了廣泛的應用,圍繞深度神經網絡的研究也與日俱增,然而目前深度學習在油氣儲層預測中的應用研究還較少。本研究基于巖心毛管壓力數據,利用灰色關聯(lián)分析、主成分分析、因子分析和智能聚類等數據挖掘技術,選取孔隙結構敏感性參數,解決數據之間的共線問題,利用智能聚類技術對孔隙結構進行聚類分析,確定儲層孔隙結構的分類;在借鑒卷積神經網絡在圖像識別和音頻分析領域應用方法的基礎上,將其用于儲層微觀孔隙結構預測;提出了測井曲線單層卷積模型和雙層卷積模型,將常規(guī)測井數據模擬成圖像像素點作為網絡的輸入,以便更好地表達儲層特征。研究結果表明:卷積神經網絡可用于儲層微觀孔隙結構預測,且預測精度較高;同時雙層卷積神經網絡不僅可以達到更好的預測效果,而且通過卷積運算可以提取更深層次、更抽象的儲層特征,為測井資料綜合解釋提供重要的支持。