周繼宏,袁 瑞 (長(zhǎng)江大學(xué)地球物理與石油資源學(xué)院)油氣資源與勘探技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(長(zhǎng)江大學(xué)),湖北荊州434023
基于支持向量機(jī)的復(fù)雜碎屑巖儲(chǔ)層巖性識(shí)別
周繼宏,袁 瑞 (長(zhǎng)江大學(xué)地球物理與石油資源學(xué)院)油氣資源與勘探技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(長(zhǎng)江大學(xué)),湖北荊州434023
以塔河地區(qū)石炭系碎屑巖儲(chǔ)層的巖性識(shí)別為例,闡述了采用支持向量機(jī)技術(shù)及利用常規(guī)測(cè)井資料在取心資料少的情況下識(shí)別復(fù)雜碎屑巖儲(chǔ)層巖性的方法。塔河地區(qū)石炭系碎屑巖儲(chǔ)層的巖性復(fù)雜,普遍含泥、含灰和含礫,加之取心資料少和測(cè)井新技術(shù)資料缺乏,其巖性識(shí)別遇到了較大的困難。從常規(guī)測(cè)井資料中選取對(duì)儲(chǔ)層巖性相對(duì)敏感的多種資料,選用徑向基核函數(shù)和一對(duì)一多類分類編碼模式,利用有限的取心資料建立巖性分類器。展示了塔河地區(qū)其中一個(gè)區(qū)塊的巖性識(shí)別結(jié)果,并與BP神經(jīng)網(wǎng)絡(luò)方法的識(shí)別結(jié)果進(jìn)行了對(duì)比,結(jié)果顯示該方法具有更好的應(yīng)用效果。
復(fù)雜碎屑巖;巖性識(shí)別;測(cè)井資料;支持向量機(jī);塔河地區(qū)
隨著石油勘探的不斷深入,復(fù)雜碎屑巖油氣儲(chǔ)層越來(lái)越受到重視。近年來(lái),塔河地區(qū)在古生界碎屑巖地層中的油氣勘探和開(kāi)發(fā)已獲得突破,但仍有許多基礎(chǔ)性問(wèn)題亟待深入研究,例如石炭系復(fù)雜碎屑巖儲(chǔ)層的巖性識(shí)別。塔河地區(qū)石炭系碎屑巖儲(chǔ)層普遍含泥、含灰和含礫,屬?gòu)?fù)雜巖性儲(chǔ)層。此外,該地層取心資料較少,測(cè)井新技術(shù)資料缺乏,因此該儲(chǔ)層的巖性識(shí)別遇到了較大的困難。諸如測(cè)井曲線綜合分析法、孔隙度測(cè)井曲線重疊法、巖性交會(huì)圖版法等常規(guī)測(cè)井巖性識(shí)別方法已很難奏效。雖然國(guó)內(nèi)外已運(yùn)用人工神經(jīng)網(wǎng)絡(luò)方法在自動(dòng)識(shí)別巖性方面取得了一定成果,但其網(wǎng)絡(luò)結(jié)構(gòu)難于確定,易出現(xiàn)過(guò)學(xué)習(xí)和欠學(xué)習(xí)以及局部極小等問(wèn)題,導(dǎo)致巖性識(shí)別效果不佳[1]。
1995年波蘭數(shù)學(xué)家Vapnik[2]提出了支持向量機(jī)(Support Vector Machines,SVM),目前,該方法已經(jīng)被運(yùn)用于儲(chǔ)層巖性識(shí)別、流體識(shí)別、參數(shù)預(yù)測(cè)等石油勘探開(kāi)發(fā)領(lǐng)域,表現(xiàn)出良好的分類或識(shí)別能力[3~5]。筆者首次采用支持向量機(jī)對(duì)塔河地區(qū)石炭系復(fù)雜碎屑巖儲(chǔ)層的巖性識(shí)別進(jìn)行了初步研究,從常規(guī)測(cè)井資料中選取對(duì)儲(chǔ)層巖性相對(duì)敏感的多種資料,選用徑向基核函數(shù)和一對(duì)一多類分類編碼模式,利用有限的取心資料建立巖性分類器進(jìn)行巖性識(shí)別學(xué)習(xí),并與實(shí)際取心資料和BP神經(jīng)網(wǎng)絡(luò)方法的識(shí)別結(jié)果進(jìn)行對(duì)比,獲得了較好的運(yùn)用效果。
據(jù)綜合地質(zhì)研究,塔河地區(qū)石炭系地層可分為巴楚組和卡拉沙依組。
巴楚組自下而上可包括下砂泥巖段、下泥巖段、雙峰灰?guī)r段3個(gè)巖性段。區(qū)內(nèi)巖性、巖相變化較大,主要為淺灰、褐灰色灰質(zhì)巖屑砂巖,礫巖和灰綠、褐色泥巖互層,夾含砂質(zhì)泥晶灰?guī)r、粒屑灰?guī)r,并且?guī)r屑含量高、灰質(zhì)膠結(jié)強(qiáng),灰質(zhì)、云質(zhì)膠結(jié)物含量達(dá)10%~25%。
卡拉沙依組分為下部上泥巖段和上部砂泥巖互層段2個(gè)巖性段。由下往上砂巖及礫石含量逐漸增多,砂巖粒度逐漸變粗,礫石粒徑逐漸增大;礫石成分由以泥礫為主逐漸變?yōu)橐允ⅰ㈧菔癁橹?;泥巖色調(diào)由深灰、黑色、灰褐色為主逐漸變?yōu)橐宰睾稚珵橹鳌?/p>
總體上講,塔河地區(qū)石炭系碎屑巖儲(chǔ)層的巖性較為復(fù)雜。儲(chǔ)層主要為淺灰、灰白色長(zhǎng)石石英砂巖,長(zhǎng)石巖屑砂巖,其次為巖屑石英砂巖、巖屑長(zhǎng)石砂巖,少量為巖屑砂巖、粉砂巖及礫巖等。巖石普遍含灰質(zhì),礫巖和砂礫巖多為砂巖間的夾層。儲(chǔ)層巖石碎屑成分主要有石英、巖屑、長(zhǎng)石,總體上以石英為主。長(zhǎng)石多為正長(zhǎng)石,斜長(zhǎng)石、微斜長(zhǎng)石和條紋長(zhǎng)石含量較低;巖屑類型以酸性噴出巖、沉積巖巖屑為主,極少量變質(zhì)巖,并且隨著巖屑含量的增加,儲(chǔ)層的顆粒分選、磨圓均變差,強(qiáng)烈的壓實(shí)作用使顆粒呈點(diǎn)接觸演變?yōu)榫€狀、凹凸接觸。碎屑顆粒以細(xì)粒為主、中粒次之,少數(shù)粗粒、粉粒,分選好~中等,次圓狀為主,少量次棱角狀。膠結(jié)物成分以灰質(zhì)膠結(jié)為主,雜基含量較低,成分主要為泥質(zhì)。
建立在統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理基礎(chǔ)上的支持向量機(jī)是一種新型學(xué)習(xí)機(jī)模型。其根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中,以獲得最好的泛化能力,在處理小樣本、非線性及高維模式識(shí)別問(wèn)題中表現(xiàn)出了獨(dú)特的優(yōu)勢(shì)[2]。自其誕生以來(lái),支持向量機(jī)在文本分類、圖像識(shí)別、蛋白質(zhì)同源檢測(cè)及基因表達(dá)等方面的應(yīng)用已卓有成效。
圖1 二維最優(yōu)分類面示意圖
基于支持向量機(jī)方法的2類巖性分類問(wèn)題如圖1所示。支持向量機(jī)利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則設(shè)計(jì)具有最大間隔的最優(yōu)分類線,即同時(shí)要求分類線不但能將砂巖和泥巖正確分開(kāi),而且還要使分類間隔最大,推廣到高維空間即為最優(yōu)分類超平面。分類面的方程為:
式中,x為巖性樣本數(shù)據(jù);b為分類閾值。
對(duì)于給定的P個(gè)巖性樣本點(diǎn)的訓(xùn)練集:
式中,i=1,2,…,P;xi、yi分別為第i個(gè)巖性樣本的數(shù)據(jù)和類別,xi∈Rn,yi∈{-1,1}。
當(dāng)最優(yōu)分類面不能完全把2類巖性的樣本點(diǎn)分開(kāi)時(shí),則引入松弛因子,允許錯(cuò)分巖性的存在,此時(shí)支持向量機(jī)在最小化目標(biāo)函數(shù)中加入懲罰項(xiàng)(其中,為正常數(shù),稱為懲罰因子)。最終,利用Lagrange函數(shù)將最優(yōu)分類面的求解問(wèn)題轉(zhuǎn)化為凸二次規(guī)劃尋優(yōu)的對(duì)偶問(wèn)題:
式中,αi為第i個(gè)巖性樣本對(duì)應(yīng)的Lagrange乘子;xi、xj分別為2個(gè)不同的巖性樣本數(shù)據(jù);yi、yj分別為2個(gè)不同的巖性類別;i、j為不同的巖性樣本點(diǎn),i≠j。通過(guò)求解方程組(3),最后所得分類決策函數(shù)y(x)為:
支持向量機(jī)利用滿足Mercer條件的核函數(shù)K(xi,xj)在高維特征空間中設(shè)計(jì)線性最優(yōu)分類面,得到輸入空間中的非線性學(xué)習(xí)算法,即用非線性變換將n維矢量空間中的隨機(jī)向量x映射到nh(nh>n)維高維特征空間,在高維特征空間中設(shè)計(jì)線性學(xué)習(xí)算法,而計(jì)算的復(fù)雜度卻沒(méi)有增加,此時(shí)的分類決策函數(shù)為:
常用的核函數(shù)有線性函數(shù)、多項(xiàng)式函數(shù)、徑向基函數(shù)和Sigmoid函數(shù)等。其中徑向基函數(shù)是普遍使用的核函數(shù),因?yàn)槠鋵?duì)應(yīng)的特征空間是無(wú)窮維的,有限的數(shù)據(jù)樣本在該特征空間中肯定是線性可分的。徑向基核函數(shù)的表達(dá)式為:
式中,σ2為徑向基核函數(shù)參數(shù)[7]。
最初的支持向量機(jī)是針對(duì)2類分類問(wèn)題提出的,而復(fù)雜巖性識(shí)別是一個(gè)M(M>2)類分類問(wèn)題。因此,需要對(duì)支持向量機(jī)分類器構(gòu)建多類分類編碼模式。目前,支持向量機(jī)分類器支持且使用較多的多類分類編碼模式有一對(duì)一編碼、一對(duì)余編碼和糾錯(cuò)輸出編碼等[7]。其中一對(duì)一編碼在每2個(gè)類別上訓(xùn)練一個(gè)兩類分類器,共得到M(M-1)/2個(gè)兩類分類器,每個(gè)分類器對(duì)測(cè)試樣本進(jìn)行“投票”,票數(shù)最多的類別即為測(cè)試樣本的歸屬。選取不同的核函數(shù)和多類分類編碼模式即可構(gòu)造不同的支持向量多類分類器。
針對(duì)塔河地區(qū)石炭系復(fù)雜碎屑巖儲(chǔ)層巖性識(shí)別問(wèn)題,筆者引入支持向量機(jī)方法在這方面做了初步研究。在MATLAB2009a平臺(tái)下,運(yùn)用臺(tái)灣大學(xué)林智仁等基于MATLAB開(kāi)發(fā)設(shè)計(jì)的一個(gè)簡(jiǎn)單、易于使用和快速有效的支持向量機(jī)模式識(shí)別與回歸的工具包LIBSVM[8],對(duì)塔河地區(qū)石炭系儲(chǔ)層取心資料進(jìn)行學(xué)習(xí)分類,獲得了較好的巖性識(shí)別效果。下面以塔河地區(qū)X區(qū)塊為例,介紹支持向量機(jī)方法在塔河地區(qū)石炭系復(fù)雜碎屑巖儲(chǔ)層巖性識(shí)別中的應(yīng)用。
針對(duì)X區(qū)塊的石炭系儲(chǔ)層的取心資料,將TK1X井和TK2X井2口取心井共123份巖心分析資料分為4種巖石類型:砂巖、含礫砂巖、含泥砂巖和含灰砂巖,并分別用標(biāo)號(hào)1、2、3、4表示。其中砂巖9份,含礫砂巖61份,含泥砂巖50份,含灰砂巖僅3份。塔河地區(qū)石炭系碎屑巖儲(chǔ)層砂巖顯示高電阻率、低自然電位幅度特征;膠結(jié)物含量高導(dǎo)致含礫砂巖具高電阻率、低聲波時(shí)差、高密度的特征。因此,選取對(duì)應(yīng)的自然電位測(cè)井值SP、自然伽馬測(cè)井值GR、聲波時(shí)差測(cè)井值A(chǔ)C和深電阻率測(cè)井值Rt作為支持向量機(jī)巖性分類器的輸入特征值。
為了避免自然電位測(cè)井曲線基線不同造成的影響,利用泥質(zhì)含量計(jì)算公式求取泥質(zhì)含量Vsh,并在輸入特征值中代替SP。泥質(zhì)含量計(jì)算公式為:
式中,SHI為泥質(zhì)指數(shù);SPmin為純砂巖的自然電位測(cè)井值;SPmax為純泥巖的自然電位測(cè)井值;GCUR為地層系數(shù),取GCUR=2。
同時(shí),為了避免各輸入特征值的量綱差異,將輸入特征值歸一化到[0,1],即:
式中,w為某種輸入特征值;wmin、wmax分別為該輸入特征值的最小值和最大值。
從123份巖心資料中,隨機(jī)選取6份砂巖、53份含礫砂巖、42份含泥砂巖和2份含灰砂巖作為支持向量機(jī)分類器的訓(xùn)練集,剩下共20份巖樣資料作為測(cè)試集。利用訓(xùn)練集、選擇徑向基核函數(shù)和一對(duì)一多類分類編碼模式建立支持向量機(jī)分類器模型,對(duì)測(cè)試集做出巖性分類決策。結(jié)果見(jiàn)表1,20塊巖樣中有15塊識(shí)別正確,巖性識(shí)別符合率為75%。
表1 巖性識(shí)別結(jié)果表
為了對(duì)比分析基于支持向量機(jī)方法的塔河地區(qū)石炭系復(fù)雜碎屑巖儲(chǔ)層巖性識(shí)別效果,引入目前被廣泛使用的BP神經(jīng)網(wǎng)絡(luò)方法對(duì)該學(xué)習(xí)樣本進(jìn)行學(xué)習(xí)分類[9],識(shí)別符合率為55%。表1詳細(xì)列出了實(shí)際巖心類型以及2種巖性識(shí)別方法的巖性識(shí)別結(jié)果。從表1中可以看出,在塔河地區(qū)石炭系復(fù)雜碎屑巖儲(chǔ)層的巖性識(shí)別中,基于支持向量機(jī)方法的巖性識(shí)別效果明顯好于BP神經(jīng)網(wǎng)絡(luò)方法。
1)在取心資料少的情況下,利用常規(guī)測(cè)井資料,采用支持向量機(jī)技術(shù)識(shí)別復(fù)雜碎屑巖儲(chǔ)層巖性仍能獲得較好的效果。
2)在其他地區(qū)應(yīng)用該方法時(shí),由于不同地區(qū)儲(chǔ)層巖性特性存在差異,因此注意做好從測(cè)井資料中提取巖性特征等基礎(chǔ)工作。
中國(guó)石化西北油田勘探開(kāi)發(fā)研究院樊政軍副總工程師和測(cè)井所柳建華所長(zhǎng)提出了一些建議,測(cè)井所李永華工程師提供了幫助,在此一并致謝。
[1]魏聰,肖玉峰,董平川.最小二乘支持向量機(jī)在儲(chǔ)層流體識(shí)別中的應(yīng)用[J].石油天然氣學(xué)報(bào),2009,31(2):275~278.
[2]Vapnik V.The nature of statistical learning theory[M].2nd edition.NY:Springer-Verlag,1999.
[3]張翔,肖小玲,嚴(yán)良俊,等.基于模糊支持向量機(jī)方法的巖性識(shí)別[J].石油天然氣學(xué)報(bào),2009,31(6):115~118.
[4]彭濤,張翔.支持向量機(jī)及其在石油勘探開(kāi)發(fā)中的應(yīng)用綜述[J].勘探地球物理進(jìn)展,2007,30(2):91~95.
[5]連承波,趙永軍,鐘建華,等.基于支持向量機(jī)的低阻油層識(shí)別方法及應(yīng)用[J].石油天然氣學(xué)報(bào),2008,30(1):80~82.
[6]白鵬,張喜斌,張斌,等.支持向量機(jī)理論及工程應(yīng)用實(shí)例[M].西安:西安電子科技大學(xué)出版社,2008.
[7]鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機(jī)[M].北京:科學(xué)技術(shù)出版社,2004.
[8]Hsu C W,Chang C C,Lin C J.A practical guide to Support Vector Classification[EB/OL].http://www.csie.ntu.edu.tw/~cjlin,2010-4-15.
[9]楊斌,匡立春,孫中春,等.神經(jīng)網(wǎng)絡(luò)及其在石油測(cè)井中的應(yīng)用[M].北京:石油工業(yè)出版社,2005.
[編輯] 龍 舟
72 Identifying Complex Lithology of Clastic Rock Reservoir by Support Vector Machine
ZHOU Ji-h(huán)ong,YUAN Rui
(First Authors Address:College of Geophysics and Oil Resources,Yangtze University;Key Laboratory of Exploration Technologies for Oil and Gas Resources(Yangtze University),Ministry of Education,Jingzhou 434023,Hubei,China)
The lithologic identification of clastic rocks of Carboniferous reservoir in Tahe Area was taken for example,the methods were denoted for lithologic identification by using support vector machine and conventional logging data under the condition of lacking core data.In Tahe Area,the lithology was complex in Carboniferous reservoir,it generally contained mud,ash and gravel,whats more,there were lacking of coring and new logging technology data.Therefore,it was difficult for lithologic identification.Data that was relatively sensitive to reservoir lithology were chosen form conventional logging data for choosing radial basis function and one to one coding mathod,a lithology classifier was built up by limited coring data.It presents the result of lithologic identification in a certain block in Tahe Area,it is contrasted with that of BP neural network,it shows that the method is used with better effect.
complex lithology of clastic rock;lithologic identification;logging data;support vector machine;Tahe Area
book=292,ebook=292
P631.84
A
1000-9752(2012)07-0072-04
2012-03-10
中國(guó)石油化工集團(tuán)股份有限公司勘探先導(dǎo)性項(xiàng)目(KY2010-S-078)。
周繼宏(1965-),男,1987年江漢石油學(xué)院畢業(yè),碩士,副教授,現(xiàn)從事石油測(cè)井方法與地質(zhì)應(yīng)用的教學(xué)及研究工作。