• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于CBFS-CV算法的煤層氣井壓裂效果主控因素識別

    2022-02-25 06:03:48張馨慧楊兆中李小剛代博仁
    油氣地質與采收率 2022年1期
    關鍵詞:互信息煤體氣量

    閔 超,張馨慧,楊兆中,李小剛,代博仁

    (1.西南石油大學理學院,四川 成都 610500;2.西南石油大學人工智能研究院,四川 成都 610500;3.西南石油大學油氣藏地質及開發(fā)工程國家重點實驗室,四川 成都 610500)

    中國煤層氣儲量巨大,埋深為2 000 m 以內的煤層氣資源占有量位列世界前三,是非常規(guī)能源的重要組成部分。滲透率低、地應力梯度分布不均以及普遍欠壓實是中國煤層氣儲層的三大特點[1],故需對儲層進行改造以提升產氣效果,進而實現(xiàn)工業(yè)化的開采。水力壓裂可使煤層氣井達到工業(yè)化開采的條件[2],但由于壓裂前期的選井技術不足,容易導致初次壓裂規(guī)模不夠和有效支撐裂縫延展性差等問題。此外,在生產過程中還存在壓裂液殘渣過多或破膠不徹底引起的煤粉堵塞問題[3],使得煤層氣井的初次壓裂效果較差。重復壓裂是為了提升單井產氣量,使壓裂增產的有效期變長,因此,提高重復壓裂井的壓裂效果是解決煤層氣開發(fā)的關鍵問題之一。

    目前針對煤層氣井壓裂效果主控因素識別的研究方法主要包括層次分析法[4]、數(shù)值模擬分析法[5-7]、單因素分析法[8]和灰色關聯(lián)分析法[9-11]等,但以上方法都有一定的局限性。層次分析法的單因素評判需要人為打分,多因素情況下權重不易確定;數(shù)值模擬分析法依賴于數(shù)據(jù)本身,無法對其他客觀條件進行模擬;單因素分析法忽略了特征指標之間的相互作用;灰色關聯(lián)分析法對樣本數(shù)據(jù)沒有要求,但分析過程中涉及到最優(yōu)值確定的主觀性判斷。而基于Copula 互信息的特征選擇算法(CBFS)是使用Copula 互信息來度量因素與因素以及因素與類別之間的關系,精確地刻畫了變量之間的關系,確定了各因素之間的相互依賴關系,有效地解決了互信息累加導致某些因素被高估的問題,增加了算法的穩(wěn)定性。

    基于大數(shù)據(jù)和特征選擇[12],筆者提出一種改進的煤層氣井壓裂效果主控因素的識別算法(CBFSCV),該算法利用Copula 互信息最大限度地減少了冗余性,增加了因素與指標的相關性,彌補了最佳特征數(shù)目不確定的缺點[13]。典型井案例分析表明,這對輔助煤層氣井的重復壓裂優(yōu)化設計、提升壓裂效果提供了支撐作用。

    1 CBFS-CV算法

    特征選擇是指在眾多特征中選擇出有代表性的特征,其可有效緩解維數(shù)災難,降低學習任務難度,是機器學習過程中一個重要的步驟。特征選擇模型主要包括3 種,即Embedded,F(xiàn)ilter 和Wrapper。SNEHALIKA 等提出的CBFS 算法屬于Filter 模型評價標準的信息標準類[14],該算法使用Copula 互信息作為評價函數(shù),通過最大相關性和最小冗余性標準輸出特征子集,但難以確定特征數(shù)目k的取值。針對這一問題,在基于Copula 互信息的特征選擇算法基礎上加入了交叉驗證算法,結合梯度提升回歸模型進行預測檢驗,形成了一種改進特征選擇算法(CBFS-CV)?,F(xiàn)有的特征選擇算法大多依賴于數(shù)據(jù)集,但數(shù)據(jù)集的噪聲會影響所選擇的特征子集,以基于Copula 互信息作為評價函數(shù),最小化被選特征和未被選特征之間的信息量,最大化類別和未被選特征之間的Copula 互信息,采用Copula 函數(shù)研究隨機過程的相關性[15],把聯(lián)合分布函數(shù)和各自的邊緣分布函數(shù)連接在一起,有效減少冗余性,增大其相關性。

    將(2)式代入(4)式后,可得隨機變量X,Y基于

    Copula的互信息表達式為:

    CBFS-CV 算法的具體步驟為:①初始化特征子集S。②初始化最相關特征,計算總特征集合F與類別變量Ylabel的基于Copula 的互信息值,并將最大值賦值于S。③查找最小冗余特征子集,計算未被選特征fi與被選特征( )f1,f2,…,fs之間的基于Copula的互信息值,并將信息值存儲于集合D中。④查找最大相關特征子集,計算未被選特征fi與類別Ylabel之間的基于Copula 的互信息,并將信息值存儲于集合R中。⑤對集合R與集合D作差,并將差值存儲于集合E中,從E中選取互信息值最大的特征,合并到所選特征子集S中。⑥循環(huán)執(zhí)行步驟③—⑤k次,得到特征子集S。⑦進行交叉驗證,在S中依次選擇不同數(shù)量特征,組成特征子集,以準確度為評判標準對特征子集進行排序,確定準確度最高或最符合條件所對應的特征子集及kbest值。

    2 煤層氣井壓裂效果主控因素識別

    選取的X 區(qū)塊位于沁水盆地東南部,該地區(qū)總體上為一單斜構造[17],區(qū)塊面積達763.21 km2,投產井數(shù)1 013口,主要目的煤層為二疊系山西組的3號煤層,動用地質儲量為228.29×108m3,煤體主要以碎裂煤和碎粒煤為主,其次為原生煤和砂質泥巖。多數(shù)煤層壓裂井采用套管注入和清水壓裂液,支撐劑使用50/100目細砂、20/40目中砂以及12/20目粗砂。

    煤層氣井的壓裂效果受多種因素共同影響,主要表現(xiàn)在工程因素和地質因素2 個方面,工程因素包括射孔段厚度、壓裂液參數(shù)、支撐劑參數(shù)和施工參數(shù)等,地質因素包含煤體結構、儲層參數(shù)以及滲透率等。本文以日產氣量作為煤層氣井壓裂效果的評價參數(shù)。

    2.1 數(shù)據(jù)處理

    數(shù)據(jù)源自于X 區(qū)塊,其中包含200 口井的30 個地質及工程因素數(shù)據(jù),為確保研究結果的準確性,對數(shù)據(jù)進行預處理,其步驟包括:①缺失值處理,剔除全部數(shù)據(jù)缺失的樣本井,對于樣本井口數(shù)據(jù)部分缺失的現(xiàn)象,采用KNN 算法進行填補。②異常值處理,繪制箱形圖篩選出部分異于最小值—最大值區(qū)間的異常值,對其歸零,采用處理缺失值的方法對異常值進行處理。③歸約處理,刪除工程因素中的支撐劑類型以及支撐劑設計總量等定量數(shù)據(jù)。④標準化處理,采用Z-Score 值標準方法對數(shù)據(jù)進行標準化處理。綜上,得到完整的171 口井的26 個地質及工程因素數(shù)據(jù)。

    2.2 主控因素識別

    針對眾多的地質及工程因素,對其進行相關性分析[18]。利用Pearson 相關系數(shù)評價因素之間的相關程度,因素fi和fj的Pearson相關系數(shù)表達式為:

    依據(jù)相關性分析的基本理論,確定各因素之間的相關系數(shù)。由計算結果可知,壓裂液參數(shù)中的前置液量與攜砂液砂比、前置液比、壓裂液施工總量以及最大施工排量的相關系數(shù)分別為0.75,0.88,0.69 和0.70,表明該因素與其他因素均存在很大相關性,為避免多重共線性問題,將該因素剔除。同時壓裂液設計總量與壓裂液施工總量的相關系數(shù)高達0.86,需剔除兩者之一,本文選擇剔除壓裂液設計總量,最終剩余12個工程因素和12個地質因素。

    初步剔除共線性因素后,采用CBFS 算法對剩余因素進行主控因素識別,首先對數(shù)據(jù)進行無監(jiān)督的離散化,再計算地質及工程因素之間的Copula 互信息,并構建核數(shù)為3的并行集合,在查找最大相關特征和最小冗余特征子集時實現(xiàn)對小塊的并行計算,提高計算效率。綜上所述,利用CBFS算法對X區(qū)塊煤層氣井壓裂效果的影響因素排序如表1所示。

    表1 X區(qū)塊煤層氣井壓裂效果影響因素排序Table1 Sequence of factors affecting fracturing performance in CBM wells in Block X

    基于CBFS 算法,以準確率為交叉驗證算法的評判標準,確定地質及工程因素的最佳特征數(shù)目。由地質及工程因素的交叉驗證結果(圖1)可知,最佳特征數(shù)目為3~6 時,壓裂效果預測準確率均超過80%,為保證利用篩選出的主控因素對壓裂效果預測的準確率以及避免非主控因素造成的誤差,在CBFS 算法中k取值為5,得到影響煤層氣井壓裂效果的主控因素依次為煤體結構、含氣飽和度、含氣量、臨儲比和最大施工排量。

    圖1 地質及工程因素的交叉驗證結果Fig.1 Cross-validation results of geological and engineering factors

    煤體結構受構造運動作用后,可壓性和力學性質都會存在較大差異,煤體的破壞程度越大,壓裂效果就越差[19]。煤體結構類型中,原生結構煤與日產氣量呈正相關,碎裂煤和碎粒煤與日產氣量呈負相關。

    含氣飽和度、含氣量和臨儲比均為儲層參數(shù),其中含氣量和含氣飽和度為物性參數(shù),臨儲比為動力參數(shù),都是影響日產氣量的重要因素。研究區(qū)塊的含氣量越大,煤層氣井的日產氣量越高,儲層參數(shù)均與日產氣量呈正相關。

    最大施工排量為施工排量參數(shù)。在現(xiàn)場作業(yè)中,施工排量必須大于地層吸液能力[9],如果施工排量過小,無法在煤層中壓開裂縫或產生較長的裂縫,導致地層吸液能力變差,壓裂效率降低;如果施工排量過大,會導致井口施工壓力過高等不利影響,故必須將最大施工排量控制在一個合理的范圍內,使得壓裂效果更好。

    3 模型驗證及工程驗證

    從機器學習模型和工程實踐2 個方面驗證CBFS-CV算法的準確性和有效性。

    3.1 機器學習模型驗證

    煤層氣井產能預測的主要方法有數(shù)值模擬方法、數(shù)理統(tǒng)計方法、物質平衡法等,以上方法對數(shù)據(jù)要求較為嚴格且需要很強的數(shù)學理論知識,方法實用性不強且無法具體分析各種因素對產能的影響[20]。為驗證CBFS-CV算法所選因素的準確性,利用機器學習算法中的隨機森林回歸[21]及梯度提升回歸[22-23]模型對煤層氣井的日產氣量進行預測,并與實際值相比較,確定能夠真實有效反映日產氣量的回歸模型。

    采用評價指標中的均方誤差(MSE)和決定系數(shù)(R2)對回歸模型進行評價,表達式分別為:

    選取20%的煤層氣井地質及工程因素數(shù)據(jù)進行測試,由2種回歸模型的實驗結果(表2)和測試樣本的預測值與實際值對比(圖2)可知,梯度提升回歸和隨機森林回歸模型的決定系數(shù)均達到0.8 以上,且梯度提升回歸模型決定系數(shù)高于隨機森林回歸模型,均方誤差偏小,其擬合結果更貼近于真實值,表明依據(jù)煤體結構、儲層參數(shù)以及最大施工排量3 個主控因素對產能的解釋程度可達88%,也證明了梯度提升回歸模型具有良好的預測能力。

    表2 2種回歸模型的實驗結果Table2 Experimental results of two regression models

    圖2 2種回歸模型預測值與實際值對比Fig.2 Comparison of predicted values and actual values of two regression models

    3.2 工程驗證

    選取研究區(qū)塊某一典型井TS-X,該井初次壓裂后,日產氣量為288 m3/d,日產水量為2.21 m3/d,初次壓裂效果不理想。依據(jù)研究結果,以煤體結構、儲層參數(shù)和施工排量參數(shù)為出發(fā)點,結合壓裂資料對該井進一步分析得出:①TS-X井煤體結構為碎粒煤且煤層厚度薄,含氣量、含氣飽和度和臨儲比均低于煤層氣井壓裂效果好的平均值。②目前,TS-X井儲層日產氣量小于500 m3/d,但投產以來日產氣量有大于500 m3/d 的情況,且其相鄰井日產氣量均大于500 m3/d,說明該井有進一步進行重復壓裂、提高產能的余地。③根據(jù)前期資料分析,研究區(qū)塊的壓裂最大施工排量控制在7.0~8.5 m3/min 為宜,TSX 井初次壓裂最大施工排量為8.03 m3/min,還有進一步提升余地。④TS-X 井壓裂施工曲線形態(tài)為波動型,且該井日產氣量和日產水量都較小,說明可能由于前期抽排速度過大或者中途停抽,導致煤粉堵塞了滲流通道,滿足煤層氣井重復壓裂的條件。

    煤層含氣量、含氣飽和度及臨儲比屬不可控因素,無有效改造手段,選擇高含氣量區(qū)域是獲得高產氣量的物質基礎,且TS-X 井的最大施工排量也在合理范圍內,故需對煤體結構差、煤粉堵塞滲流通道等問題提出改造技術來進一步改善壓裂效果。因此,綜合分析結果,對TS-X 井推薦采用氮氣泡沫解堵工藝方案來進行重復壓裂,該方案可以增加井眼內能量,干擾滯留煤粉,沖開堵塞分支從而提高日產氣量。

    采用改進方案后,TS-X井重復壓裂施工曲線形態(tài)變?yōu)橄壬蠼敌停▓D3),表明地層吃砂能力強且加砂容易,更易形成高導流能力支撐裂縫,有利于后期排采,該井的含氣量和含氣飽和度均已達到了壓裂效果好的煤層氣井的平均值且見到了較好的增產效果,日產氣量由288 m3/d 增至805 m3/d,壓裂效果明顯改善,達到了工業(yè)化開采的條件。

    圖3 TS-X井重復壓裂前后的產氣效果對比Fig.3 Comparison of gas production performance before and after repeated fracturing in Well TS-X

    4 結論

    基于CBFS-CV 算法,結合X 區(qū)塊的地質及工程數(shù)據(jù),利用梯度提升回歸模型進行預測檢驗,結果表明依據(jù)CBFS-CV 算法篩選出的因素對產能的解釋程度達到88%,并驗證了該算法的可行性,為煤層氣井壓裂效果主控因素的識別提供了一種改進的算法。

    煤體結構、儲層參數(shù)和施工排量參數(shù)是影響煤層氣井壓裂效果的3個主控因素。儲層參數(shù)和煤體結構類型中的原生結構煤與日產氣量呈正相關;煤體結構類型中的碎裂煤和碎粒煤與日產氣量呈負相關;最大施工排量控制在合理范圍內,壓裂效果更好。

    通過工程驗證方法,對初次壓裂效果不好的典型井采用氮氣泡沫解堵工藝方案進行重復壓裂,解決了煤體結構差、煤粉堵塞滲流通道等問題,壓裂效果明顯改善,達到了工業(yè)化開采的條件。煤層氣井的壓裂效果受到多種因素共同作用,下一步將結合人工智能算法深入研究,形成一種適合多區(qū)塊、多維度的煤層氣井壓裂效果影響因素識別的方法。

    符號解釋

    猜你喜歡
    互信息煤體氣量
    注熱井周圍煤體蠕變過程的滲透率變化規(guī)律模擬研究
    頁巖超臨界態(tài)吸附氣量計算模型
    氣量可以學習嗎
    正交試驗下煤體滲透性影響因素評價
    煤炭工程(2019年4期)2019-05-05 02:30:16
    大港油田穩(wěn)步提高產氣量 提前4個月完成全年指標
    錄井工程(2017年3期)2018-01-22 08:39:56
    以“中央廚房”為突破口探索時政報道的融煤體之路——以浙江之聲為例
    傳媒評論(2017年7期)2017-11-08 03:11:15
    氣量三層次
    領導文萃(2017年10期)2017-06-05 22:27:01
    基于互信息的貝葉斯網(wǎng)絡結構學習
    聯(lián)合互信息水下目標特征選擇算法
    改進的互信息最小化非線性盲源分離算法
    電測與儀表(2015年9期)2015-04-09 11:59:22
    会昌县| 调兵山市| 冀州市| 九龙县| 彰武县| 清水河县| 宁城县| 秦皇岛市| 元江| 屯昌县| 揭东县| 泸水县| 日照市| 奉新县| 金门县| 乐都县| 房山区| 肇东市| 德格县| 无棣县| 土默特右旗| 伊川县| 奈曼旗| 黑水县| 伽师县| 池州市| 罗山县| 韩城市| 浑源县| 佛冈县| 和田县| 昌乐县| 岳阳市| 临颍县| 雅安市| 黎川县| 大足县| 建水县| 谷城县| 龙江县| 土默特左旗|