郭素杰 李景衛(wèi) 于偉高 呂江萍 姜維寨 戴廣闊 胡琳
1.中國(guó)石油渤海鉆探工程有限公司第二錄井分公司;2.中國(guó)石油渤海鉆探工程有限公司井下作業(yè)分公司;3.中國(guó)石油天然氣股份有限公司華北油田分公司勘探部
油氣層評(píng)價(jià)是油氣勘探領(lǐng)域中具有挑戰(zhàn)性的學(xué)科之一,目前的評(píng)價(jià)手段主要是基于錄井以及測(cè)井資料,其中錄井發(fā)展了氣測(cè)、熱解、定量熒光等數(shù)十項(xiàng)技術(shù),檢測(cè)不同的井筒信息[1],測(cè)井則基于聲學(xué)、電學(xué)等基礎(chǔ)理論形成了多項(xiàng)技術(shù),兩大領(lǐng)域均對(duì)各單項(xiàng)技術(shù)開展了較為深入的研究,能對(duì)大部分的儲(chǔ)層流體性質(zhì)做出合理的解釋,但均對(duì)復(fù)雜油氣層的識(shí)別效果較差[2]。將能夠充分應(yīng)用數(shù)據(jù)信息的數(shù)據(jù)挖掘技術(shù)應(yīng)用于油氣層評(píng)價(jià)成為必然趨勢(shì)。
數(shù)據(jù)挖掘技術(shù)能從海量的數(shù)據(jù)中提取出有效信息,廣泛應(yīng)用于商業(yè)、金融等領(lǐng)域,近年來逐漸引入石油勘探開發(fā)領(lǐng)域,如張鵬等[3]應(yīng)用BP神經(jīng)網(wǎng)絡(luò)法預(yù)測(cè)碳酸鹽巖儲(chǔ)層的應(yīng)力敏感程度,解決了深層碳酸鹽巖儲(chǔ)層由于取心困難導(dǎo)致無法支撐實(shí)驗(yàn)的難題;陶彬等[4]引入大數(shù)據(jù)思想尋找深層無實(shí)驗(yàn)樣品預(yù)測(cè)井壁穩(wěn)定主控因素,為深層油氣開發(fā)過程中控制井壁穩(wěn)定提供了一種方法;黃知娟等[5]將大數(shù)據(jù)用于分析單井試采產(chǎn)液量驟降的原因;王茜等[6]形成了基于鉆井模型與人工智能相耦合的實(shí)時(shí)智能鉆井監(jiān)測(cè)技術(shù);檀朝東等[7]基于強(qiáng)化學(xué)習(xí)建立了煤層氣井螺桿泵排采參數(shù)智能決策技術(shù)。具體到儲(chǔ)層評(píng)價(jià)領(lǐng)域,許長(zhǎng)福等[8]、朱麗萍等[9]分別開展了基于數(shù)據(jù)驅(qū)動(dòng)和模型驅(qū)動(dòng)的低阻油層識(shí)別方法;張?chǎng)危?0]基于測(cè)井技術(shù)將數(shù)據(jù)挖掘應(yīng)用于儲(chǔ)層評(píng)價(jià)。但常規(guī)意義的數(shù)據(jù)挖掘方法僅從數(shù)據(jù)本身的角度完成挖掘,因此,該技術(shù)在常規(guī)油氣層評(píng)價(jià)領(lǐng)域預(yù)測(cè)效果較好,而在復(fù)雜儲(chǔ)層的評(píng)價(jià)中缺乏指導(dǎo)意義,且數(shù)據(jù)未加篩選,較多的無效參數(shù)在增加了數(shù)據(jù)計(jì)算量的同時(shí)還可能會(huì)導(dǎo)致計(jì)算精度的下降。針對(duì)該問題,筆者在前期研究成果及數(shù)據(jù)描述的基礎(chǔ)上進(jìn)行參數(shù)優(yōu)選之后,再針對(duì)研究區(qū)內(nèi)的生物降解油、重稠油、多油源油氣藏,應(yīng)用因子分析、多元判別、灰色關(guān)聯(lián)等多種技術(shù),構(gòu)建基于知識(shí)驅(qū)動(dòng)的多參數(shù)量化模型進(jìn)行油氣層評(píng)價(jià),從而最大程度減少數(shù)據(jù)冗余并保證模型的穩(wěn)定性。
隨著海量井筒數(shù)據(jù)的不斷涌現(xiàn),蘊(yùn)涵在其中的油氣規(guī)律并未完全被發(fā)現(xiàn),僅錄井輕烴分析就能檢測(cè)C1~C9共103個(gè)單體烴的組分含量,再加上各項(xiàng)派生參數(shù)則數(shù)不勝數(shù)。目前的油氣水層解釋一般都是靠專家經(jīng)驗(yàn)分析特征參數(shù),大量表征地質(zhì)信息的數(shù)據(jù)或相互關(guān)系并沒有被充分利用,而數(shù)據(jù)挖掘技術(shù)的發(fā)展使該項(xiàng)難題可能得到解決。
數(shù)據(jù)挖掘技術(shù)能夠從大量的數(shù)據(jù)中,提取具有潛在價(jià)值的信息。而基于知識(shí)驅(qū)動(dòng)的數(shù)據(jù)挖掘技術(shù)在常規(guī)的數(shù)據(jù)驅(qū)動(dòng)的基礎(chǔ)上引入前期研究的規(guī)律,在減少數(shù)據(jù)冗余的同時(shí)能夠使模型的效果更突出。
應(yīng)用基于知識(shí)驅(qū)動(dòng)的數(shù)據(jù)挖掘技術(shù)評(píng)價(jià)油氣層首先要對(duì)各類特殊油氣藏的錄井參數(shù)響應(yīng)特點(diǎn)進(jìn)行分析,例如,生物降解油表現(xiàn)為高氣測(cè)全烴值、高甲烷相對(duì)百分含量、高實(shí)物顯示級(jí)別的三高特征[11];重稠油的評(píng)價(jià)需要引入原油密度的評(píng)價(jià)參數(shù)[12];而多油源油層由于每種油源特征的參數(shù)不一致,模型中需要納入反映油源的參數(shù)[13]。筆者在研究區(qū)應(yīng)用因子分析評(píng)價(jià)生物降解油、針對(duì)重稠油應(yīng)用判別分析的方法進(jìn)行多參數(shù)綜合評(píng)價(jià)、應(yīng)用灰色關(guān)聯(lián)分析評(píng)價(jià)多油源油層取得了較好的應(yīng)用效果。
因子分析的基本思想是降維,用較少的新指標(biāo)盡可能多地反映原參數(shù)的信息[14],若樣品的2個(gè)指標(biāo)x1與x2有一定的相關(guān)性,就可以將其擬合成1個(gè)指標(biāo)F代表原來2個(gè)指標(biāo)的信息,從而達(dá)到降維的目的,在實(shí)際工作中往往用二維坐標(biāo)來代表原來更多的參數(shù)信息。
判別分析是一種用于判別和分類的多元統(tǒng)計(jì)方法[15]。將多維參數(shù)投影到一維,以達(dá)到降維的目的,以類間距離最大而類內(nèi)距離最小原則建立判別函數(shù),應(yīng)用已知結(jié)果的大量數(shù)據(jù)確定判別函數(shù)各變量的系數(shù),將待解釋層數(shù)據(jù)代入到判別函數(shù)判定待解釋層的歸屬。本文用兩個(gè)函數(shù)代替原來的多個(gè)參數(shù)的信息構(gòu)建圖版投點(diǎn)用于油氣層評(píng)價(jià)。
灰色關(guān)聯(lián)分析可根據(jù)曲線的幾何形狀的相似度確定兩個(gè)參數(shù)的聯(lián)系是否緊密,曲線形態(tài)相似,則關(guān)聯(lián)度大,反之則?。?6]。這種方法的優(yōu)點(diǎn)是對(duì)樣本量多寡和數(shù)據(jù)分布規(guī)律沒有要求,用于研究“小樣本,貧信息”的不確定性問題。在油氣層評(píng)價(jià)中主要用于求取參數(shù)權(quán)重。
冀中坳陷饒陽凹陷勘探面積達(dá)5 280 km2,共包括16個(gè)抬升幅度較大的正向構(gòu)造和10個(gè)沉降幅度明顯的沉積洼槽。區(qū)內(nèi)分布有生物降解油、重稠油、多油源油氣藏等多種復(fù)雜油氣藏,復(fù)雜的構(gòu)造背景和油氣藏類型造成錄井參數(shù)響應(yīng)特征差異大,增加了油氣層評(píng)價(jià)難度。
生物降解油層主要分布在南馬莊構(gòu)造帶淺層,由于地質(zhì)構(gòu)造的特征,油氣層埋藏較淺,受多次運(yùn)移、生物降解、氧化等作用的破壞,導(dǎo)致地層油氣原有物理性質(zhì)發(fā)生改變,原油當(dāng)中輕質(zhì)烴類及正構(gòu)烷烴的含量減少,不可分辨物增多,油質(zhì)變差,密度、黏度增大,形成了特殊類型的油氣藏。在錄井資料上表現(xiàn)為“三高一無”的特征?!叭摺敝福焊邭鉁y(cè)全烴、高甲烷相對(duì)含量、高實(shí)物顯示級(jí)別,“一無”指熱解氣相色譜無烷烴峰。由于錄井資料表現(xiàn)儲(chǔ)層流體性質(zhì)的差異,造成該特殊類型油氣層解釋評(píng)價(jià)難度增大。
2.1.1 數(shù)據(jù)分析
以南馬莊構(gòu)造帶已試油的沙一段46個(gè)層的資料為基礎(chǔ)進(jìn)行分析。依據(jù)前人研究成果選擇了6個(gè)指標(biāo)對(duì)生物降解油層進(jìn)行綜合評(píng)價(jià)[17],分別為全烴值Tg(鉆井過程中的巖石破碎氣、擴(kuò)散氣、壓差氣和溶解氣,成分為C1~C5的烴類組分)、甲烷含量C1(氣測(cè)甲烷相對(duì)百分含量)、產(chǎn)烴潛量Pg(90~600℃區(qū)間的總烴含量)、定量熒光相當(dāng)油含量N(單位樣品中熒光物質(zhì)折算的含油濃度,反映被測(cè)樣品中的含油氣豐度)、孔隙度 φ(核磁共振或測(cè)井?dāng)?shù)據(jù),孔隙度決定地層中流體的多少)、滲透率k(核磁共振或測(cè)井?dāng)?shù)據(jù),反映地層孔隙的可流通性)。
應(yīng)用SPSS進(jìn)行因子分析,特征根大于1的因子有2個(gè),共貢獻(xiàn)原有6個(gè)參數(shù)的75.124%(表1)。因子表達(dá)式為
表1 因子分析結(jié)果Table 1 Factor analysis results
式中,下標(biāo)z表示標(biāo)準(zhǔn)化后的數(shù)據(jù)。
2.1.2 圖版建立
以F1、F2為橫、縱坐標(biāo),將該區(qū)46個(gè)試油層的數(shù)據(jù)計(jì)算結(jié)果進(jìn)行投點(diǎn),建立該區(qū)因子分析解釋圖版,可以看出不同類型儲(chǔ)層分區(qū)明顯(見圖1)。
2.1.3 新井應(yīng)用
X6-26X井是南馬莊構(gòu)造帶的一口評(píng)價(jià)井,8號(hào)層 (1 295~1 298 m)巖性為油跡細(xì)砂巖,氣測(cè)全烴值為10.01%,C1相對(duì)含量95.63%,C2相對(duì)含量1.42%,有效孔隙度為 21.1%,滲透率為 114.49×10?3μm2,產(chǎn)烴潛量為12.83 mg/g,依據(jù)常規(guī)解釋標(biāo)準(zhǔn),一般解釋油層,但是氣相色譜譜圖(圖2)以不可分辨物為主,無烷烴峰,資料反映為典型的“三高一無”,為生物降解油特征,在圖版上位于油水同層區(qū)(圖1),經(jīng)試油證實(shí)日產(chǎn)油 5.31 m3/d,日產(chǎn)水 1.64 m3/d,與圖版解釋一致。
圖2 X6-26X井氣相色譜圖Fig.2 Gas chromatogram for Well X6-26X
重稠油因?qū)嵨镲@示級(jí)別一般為油跡或油斑以上導(dǎo)致偏高解釋,而試油往往產(chǎn)水。饒陽凹陷以中質(zhì)原油為主,但馬西地區(qū)油質(zhì)偏重,多在0.9 g/cm3以上,單一參數(shù)正確認(rèn)識(shí)地層流體關(guān)系困難。通過判別分析實(shí)現(xiàn)了多角度對(duì)油氣層的有效評(píng)價(jià)[18],在馬西洼槽共應(yīng)用14口井,解釋符合率77.8%。
2.2.1 數(shù)據(jù)分析
在馬西洼槽收集了經(jīng)試油驗(yàn)證的32口井的60 個(gè)重稠油層氣測(cè) (全烴Tg、C1、C2、C3、iC4、nC4、iC5、nC5)、熱解 (S0、S1、S2、TPI)、定量熒光 (相當(dāng)油含量N、油性指數(shù)M)及測(cè)井參數(shù)(聲波時(shí)差Δt、孔隙度 φ、泥質(zhì)含量C、滲透率k)共計(jì)20個(gè)參數(shù),這些參數(shù)分別反映地層含油性、物性及原油性質(zhì)。
通過前期研究挖掘出較為敏感的參數(shù)包括Tg、C1、S2、 φ、k,應(yīng)用SPSS軟件對(duì)60個(gè)試油層數(shù)據(jù)進(jìn)行判別分析,形成了4個(gè)判別函數(shù)(表2),其中前2個(gè)函數(shù)的貢獻(xiàn)率達(dá)到了90.1%,因此應(yīng)用前2個(gè)非標(biāo)準(zhǔn)化判別函數(shù)建立解釋模型。
表2 典型判別式函數(shù)系數(shù)及特征值Table 2 Function coefficients and eigenvalues for typical discriminants
2.2.2 圖版建立
將60個(gè)試油層的參數(shù) (Tg、C1、S2、 φ、k)分別代入到F1和F2,得到了區(qū)域多參數(shù)重稠油解釋圖版 (圖3)。
圖3 馬西洼槽函數(shù)判別解釋圖版Fig.3 Functional discriminant chart for the Maxi sag
2.2.3 新井應(yīng)用
J40x 井 24 號(hào)層 2 313~2 318 m,巖屑錄井為油跡細(xì)砂巖,井壁取心為油浸細(xì)砂巖1顆,氣測(cè)全烴10.91%,產(chǎn)烴潛量Pg為 16.92 mg/g,表現(xiàn)為油層特征,但是總產(chǎn)率指數(shù)TPI僅0.504,重稠油特征明顯,判別分析圖版投點(diǎn)落在油層區(qū)。采用射流泵對(duì)該段試油,日產(chǎn)油為 33.99 t/d,水 12.57 m3,與解釋結(jié)論相符。
饒陽凹陷楊武寨構(gòu)造帶有3套生油層系,分別為沙四+孔店組、沙三段、沙一下段,其中以沙三段暗色泥巖、沙一下段特殊巖性為主。由于生油母質(zhì)類型和埋深的差異,生成的原油物理性質(zhì)差別較大,本區(qū)發(fā)育的斷層,對(duì)原油的運(yùn)移提供了主要通道,因此,縱向上含油段長(zhǎng)且不同類型原油交叉成藏,甚至存在混源油藏,導(dǎo)致流體性質(zhì)評(píng)價(jià)困難。且該區(qū)由于有3種油源,每種油源數(shù)據(jù)有限難以單獨(dú)建模,因此采用了對(duì)樣本量要求不大的灰色關(guān)聯(lián)分析方法進(jìn)行綜合建立模型,分別求取含油氣豐度指數(shù)和物性指數(shù),再引入能夠反映油源的Ph/C18,構(gòu)建三維立體解釋圖版。
2.3.1 數(shù)據(jù)分析
選用的評(píng)價(jià)模型為
式中,Q為油氣豐度指數(shù);W為物性指數(shù);xiz、yiz為標(biāo)準(zhǔn)化后的評(píng)價(jià)參數(shù);ai、bi為評(píng)價(jià)參數(shù)的權(quán)系數(shù),采用灰色聯(lián)分析方法求??;n為評(píng)價(jià)參數(shù)的數(shù)量。
根據(jù)前期研究成果,在油氣豐度方面氣測(cè)全烴、相當(dāng)油含量、產(chǎn)烴潛量3項(xiàng)較為敏感,而在物性評(píng)價(jià)中聲波時(shí)差、孔隙度、滲透率(測(cè)井)3項(xiàng)資料最為有效。因此以該區(qū)29口井92個(gè)試油層為數(shù)據(jù)源計(jì)算得到了各參數(shù)的權(quán)系數(shù),物性指數(shù)與油氣豐度指數(shù)計(jì)算公式為
2.3.2 圖版建立
以92個(gè)試油層為數(shù)據(jù)源,以含油氣豐度指數(shù)為X坐標(biāo),以物性指數(shù)為Y坐標(biāo),以反映油源的Ph/C18為Z坐標(biāo),構(gòu)建楊武寨構(gòu)造帶灰色關(guān)聯(lián)分析三維解釋圖版見圖4。
2.3.3 新井應(yīng)用
Q164x 井 2 號(hào)層 2 489~2 495 m,巖性為熒光細(xì)砂巖,氣測(cè)全烴為3.14%,井壁取心2顆,為油斑細(xì)砂巖,Pg值為16.98 mg/g。從氣相色譜圖看為沙一沙三混源油源(圖5),Ph/C18為1.21,也表現(xiàn)為混源,三維圖版上位于油層區(qū)域。經(jīng)抽汲試油證實(shí)該段日產(chǎn)油45.74 m3/d,與圖版解釋結(jié)論一致。
圖5 Q164x井氣相色譜圖Fig.5 Gas chromatogram for Well Q164x
(1)通過引入基于知識(shí)驅(qū)動(dòng)的數(shù)據(jù)挖掘技術(shù),將數(shù)學(xué)理論與專家經(jīng)驗(yàn)相結(jié)合,綜合錄井、測(cè)井、試油等多項(xiàng)資料,組合形成優(yōu)勢(shì)參數(shù),用較少的參數(shù)分別從儲(chǔ)層含油氣豐度、物性以及組分特征等多個(gè)角度評(píng)價(jià)油氣層,解決了復(fù)雜油氣藏儲(chǔ)層流體性質(zhì)評(píng)價(jià)難點(diǎn)。
(2)數(shù)據(jù)挖掘技術(shù)在油氣層評(píng)價(jià)中的成功探索展示了其廣闊的應(yīng)用范圍,隨著油田信息化進(jìn)程的推進(jìn),數(shù)據(jù)標(biāo)準(zhǔn)化程度的提升,該技術(shù)將能夠在工程安全、井位部署等領(lǐng)域發(fā)揮更為重要的作用。