宋金波, 張劍風(fēng), 宋衍茹
(1.東北石油大學(xué),黑龍江大慶 163318;2.大慶油田有限責(zé)任公司第九采油廠地質(zhì)大隊黑龍江大慶163513;3.大慶工程有限公司,黑龍江大慶 163513)
目前,在世界范圍內(nèi),注水開采的油氣產(chǎn)量占了很大比重.由于長期大量的注入水,許多油田已經(jīng)發(fā)生水淹,油田進入了高含水期開采階段.水淹層解釋已成為油田開發(fā)生產(chǎn)中的重要工作.大慶西部外圍油田低孔低滲泥質(zhì)砂巖儲層巖性復(fù)雜,泥質(zhì)含量高,儲層以薄互層為主,導(dǎo)致測井響應(yīng)不同程度地受到影響而失真,油水層識別難度大,測井解釋符合率較低,傳統(tǒng)的經(jīng)驗性測井解釋逐漸滿足不了生產(chǎn)需要.
近年來,支持向量機(SVM)在模式識別中取得了良好的應(yīng)用.它是由Vapnik在1995年提出的以結(jié)構(gòu)風(fēng)險最小化為原則的統(tǒng)計學(xué)習(xí)方法[1],相對于傳統(tǒng)統(tǒng)計學(xué)的經(jīng)驗風(fēng)險最小化原則,有效的提高了學(xué)習(xí)的泛化能力.標(biāo)準(zhǔn)支持向量機通過適當(dāng)?shù)倪x擇核函數(shù)及函數(shù)子集,根據(jù)有限樣本信息在模型復(fù)雜性和學(xué)習(xí)泛化能力之間尋找最佳折中,使分類器的實際風(fēng)險達(dá)到最小[2~3],而Suykens J.A.K[4]在1999年提出的最小二乘支持向量機(Least Squares Support Vector Machine,簡稱 LSSVM)作為支持向量機的一種,采用最小二乘線性系統(tǒng)作為損失函數(shù),將凸優(yōu)化的求解過程變成了解一個等式方程組,求解速度相對加快,并且在解決模式識別小樣本、非線性及高維識別中表現(xiàn)出一定的優(yōu)勢,具有良好的應(yīng)用前景[3-6].測井資料的水淹層識別過程則是一個典型的小樣本高維非線性模式識別過程,因此,針對低孔低滲透油藏水淹層識別困難現(xiàn)狀,本文以大慶西部外圍XZ油田為例,給出了LSSVM分類識別方法,建立分類識別模型并驗證其合理性,試圖尋求一種便捷可行的低孔低滲泥質(zhì)砂巖水淹層識別方法[7-9].
支持向量機(SVM)采用結(jié)構(gòu)風(fēng)險原則訓(xùn)練學(xué)習(xí)機,通過核函數(shù)的非線性映射把實際的n維向量從原來的空間映射到高維特征空間,然后在此高維特征空間中構(gòu)造最優(yōu)線性決策函數(shù),并且用VC維理論度量結(jié)構(gòu)風(fēng)險最小,算法最終歸結(jié)為求解一個凸二次規(guī)劃問題,從而獲得全局最優(yōu)解.
SVM是從二分類問題發(fā)展而來的.首先要定義一個用于分類的判別函數(shù),即n為空間的分界面,這個分界面不僅能將兩類樣本正確的分開,而且還能保證樣本點距離分界面的間隔最大[2].假設(shè)分類線為x·w+b=0(w為權(quán)向量,b∈R),對它進行歸一化,從而使線性可分的樣本集x?Rd,y∈ {+1,- 1},滿足[2]
此時的分類間隔為2/‖w‖,若使分類間隔最大,則使
最大.所以,求解最優(yōu)分類面問題實質(zhì)上就是求(2)式在約束(1)式下的條件極值.
然而,在實際應(yīng)用過程中需要分類識別的大多是小樣本非線性的,此時,可以通過非線性映射將問題轉(zhuǎn)化為某個高維空間的線性問題,在此高維空間中求解線性分類問題,找到最優(yōu)分類面[10].假設(shè)特征空間F內(nèi),對于線性不可分的間隔超平面是在條件下求如下函數(shù)的極小值
其中 <·>符號表示在特征空間中求點積,Ψ為Rd→F樣本空間到特征空間的映射,c為懲罰參數(shù),ζi≥0為允許分類誤差而引入的松弛變量.
引入Lagrange乘子,可以將標(biāo)準(zhǔn)支持向量機的最優(yōu)問題轉(zhuǎn)化為如下的二次歸化問題:
式中,K(xi,xj)為任意滿足Mercer條件的核函數(shù).
最小二乘支持向量機作為標(biāo)準(zhǔn)支持向量機的發(fā)展,將最小二乘線性系統(tǒng)引入到支持向量機中,用誤差的二范數(shù)作為系統(tǒng)的損失函數(shù),代替了標(biāo)準(zhǔn)支持向量機中的用誤差來作為損失函數(shù),所以,最小二乘支持向量機優(yōu)化問題為[4]:
引入Lagrange乘子,可以將最小二乘支持向量機的優(yōu)化問題轉(zhuǎn)化為求解如下線性方程組的問題:
大慶西部XZ油田平均滲透率為5.4mD,平均孔隙度為12.6%,泥質(zhì)含量21.5%,屬于典型的低孔低滲泥質(zhì)砂巖油藏.由于該油田儲層物性差異較大,儲層非均質(zhì)性強,油田注水后受效不均勻,層間矛盾突出.一是泥質(zhì)和鈣質(zhì)含量較高、薄互層發(fā)育,水淹層常規(guī)測井響應(yīng)特征不明顯,識別難度大;二是儲層非均質(zhì)性強,各層水淹程度不同,儲層受注入水沖刷,導(dǎo)電機理發(fā)生變化,水淹層電性特征不能反映儲層的真實流體性質(zhì),水淹層人工解釋解釋符合率低,給油田開發(fā)帶來較大的困難.
在測井解釋中,學(xué)習(xí)樣本的真實性、代表性和泛化性是決定模型判別效果的關(guān)鍵.因此,本文樣本選取過程中,主要考慮對儲層水淹較為敏感的聲波時差、深側(cè)向等測井信息以及泥質(zhì)含量等儲層特征信息,且樣本深度段有試油資料作為驗證.輸出結(jié)果用正整數(shù)代表油層是否水淹及水淹級別.在與模型匹配的核函數(shù)選擇的基礎(chǔ)上,編寫了分類計算程序,通過有試油資料的多組樣本數(shù)據(jù)學(xué)習(xí)和訓(xùn)練,選取識別率最高模型對應(yīng)的參數(shù)為最優(yōu)參數(shù).
經(jīng)過對研究目標(biāo)油田測井曲線和地質(zhì)特征深入分析后,優(yōu)選出以下7個對儲層水淹最為敏感的參數(shù):
(1)測井資料參數(shù):聲波時差(AC),自然電位(SP),深側(cè)向(RLLD).
(2)儲層參數(shù):泥質(zhì)含量(Vsh),孔隙度(φ).
(3)飽和度:利用取心資料擬合公式計算含水飽和度(Sw)和束縛水飽和度(Swi).
表1 LSSVM模型部分輸入數(shù)據(jù)
圖1 大慶西部XZ油田A井測井綜合解釋成果圖
經(jīng)過優(yōu)選不同核函數(shù)進行對比分析,針對目標(biāo)油田水淹層識別和分類問題,徑向基函數(shù)(RBF)識別符合率最高,因此選擇RBF函數(shù)作為核函數(shù),使用網(wǎng)格選擇法確定最優(yōu)的參數(shù)和數(shù)值,最終優(yōu)選的參數(shù)c=2145,σ2=1.
實驗過程中,根據(jù)算法用C++語言編寫水淹層識別模型程序,利用已優(yōu)選的參數(shù),從目標(biāo)油田選取有試油資料的20口井70個小層,將其中的30個小層輸入樣本作為訓(xùn)練樣本,另外40個小層的樣本作為驗證樣本,輸出結(jié)果利用正整數(shù)分別代表不同的水淹級別:1代表未水淹層(油層)、2代表差油層、3代表水層、4代表弱水淹層、5代表中水淹層和6代表強水淹層.
表2 復(fù)雜儲層流體性質(zhì)分類結(jié)果
圖1為所選研究目標(biāo)油田的1口井水淹綜合解釋成果圖,人工解釋認(rèn)為PI5-21號小層是弱水淹層,但通過所建立的自動識別模型判定為高水淹層,試油資料顯示含水91.2%;PI6號小層人工解釋為油層,但通過所建立的自動識別模型判定為中水淹層,試油資料證實含水63.3%,因此,從試油結(jié)果看,所建立的分類模型識別結(jié)果是正確的.利用訓(xùn)練好的LSSVM模型對其余40個小層的樣本驗證,并與試油結(jié)果對比分析,符合率達(dá)到92.2%(如表2所示).從驗證結(jié)果來看,所建立的LSSVM模型對電性響應(yīng)較弱的中水淹層和弱水淹層識別程度高,說明最小二乘支持向量機尤其對四性關(guān)系較差的儲層水淹程度判別具有高效性.
通過理論研究和實驗驗證,本文所建立的基于最小二乘支持向量機的水淹層分類識別模型,可以在給定測井曲線信息、地質(zhì)信息情況下建立起良好有效的與儲層流體性質(zhì)之間的對應(yīng)關(guān)系,實現(xiàn)低孔低滲油田水淹層高精度判別,能夠避免人工解釋引起的誤判.同時,低孔低滲儲層厚度薄、巖性復(fù)雜,測井曲線不能完全反映地層的真實流體性質(zhì),因此,水淹層解釋過程需在生產(chǎn)動態(tài)資料的指導(dǎo)下,地質(zhì)、測井、錄井等多專業(yè)相結(jié)合,才能獲得較高的識別率.
[1]Vapnik V.The nature of Statistical Learning Theory[M].New York:Springer.1995,10-45.
[2]Burges C J C.A Tutorial on Support Vector Machines for Pattern Reconnition[J].Data Mining and Knowledge Discovering,1998,2(2):32-35.
[3]郭新辰.最小二乘支持向量機及應(yīng)用研究[D].長春:吉林大學(xué),2008.12:23-36.
[4]Suykens J A K,Vandew alle J.Least Squares Support Vect or Mach Ine Classif iers[J].Neural rocessing Lett ers,1999,9(3):293- 300.
[5]趙宇,王志良.一種基于支持向量機的測井巖性預(yù)測新方法[J].微計算機(測控自動化),2004,20(6):50-51.
[6][11]閻威武,邵惠鶴.支持向量機和最小二乘支持向量機的比較及應(yīng)用研究[J].控制與決策,2003,18(3):358-360.
[7]楊斌.一種用于測井油氣層綜合識別的支持向量機方法[J].測井技術(shù),2005,29(6):512-514.
[8]宋延杰,張劍風(fēng),基于支持向量機的復(fù)雜巖性測井識別方法[J],大慶石油學(xué)院學(xué)報,2007,31(5):18-20.
[9]連承波,等.基于支持向量機的低阻油層識別方法及應(yīng)用[J],石油天然氣學(xué)報,2008,30(1):80-82.
[10]張學(xué)工.關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機[J].自動化學(xué)報,2000,26(1):18-21.