• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于隨機森林的溢漏實時判斷方法研究

      2020-07-21 01:56:50史肖燕周英操趙莉萍蔣宏偉
      鉆采工藝 2020年1期
      關(guān)鍵詞:溢流決策樹鉆井

      史肖燕, 周英操, 趙莉萍, 蔣宏偉

      (中國石油集團工程技術(shù)研究院有限公司)

      井漏和溢流是影響鉆井施工安全最為常見的兩種井下復雜事故。井漏和溢流不僅會帶來嚴重的儲層損害,增加勘探開發(fā)投入成本,造成油氣開發(fā)效率低下,一旦控制不力,還會誘發(fā)卡鉆、井塌、井噴等重大惡性事故,造成損失及負面社會影響。因此,鉆井過程中溢流、漏失的實時識別判斷具有重要意義。

      目前,國內(nèi)外在溢流、漏失監(jiān)測方面展開了較多研究,形成的技術(shù)主要有:井口監(jiān)測技術(shù)、井下隨鉆監(jiān)測技術(shù)和人工智能監(jiān)測技術(shù)。井口監(jiān)測技術(shù)成熟,能比較準確地監(jiān)測出溢流和漏失,但這種方法的監(jiān)測結(jié)果存在滯后性,不能很好地解決高壓氣井、深水鉆井等特殊環(huán)境下的井下溢流、漏失監(jiān)測問題。井下隨鉆監(jiān)測方法能夠快速、早期監(jiān)測到溢流和漏失,但成本較高,并且隨鉆測量儀器存在失效的風險。隨著信息技術(shù)和人工智能技術(shù)快速發(fā)展,國內(nèi)外研究人員把人工智能技術(shù)應用到溢流、漏失的監(jiān)測中,監(jiān)測結(jié)果更為準確,但這些人工智能的方法普遍存在著建模較為復雜,推廣較難的問題。

      近年來,以數(shù)據(jù)為驅(qū)動的機器學習算法在社會各領(lǐng)域得到了廣泛的應用,其中最重要的算法之一隨機森林具有建模較為簡單、調(diào)節(jié)參數(shù)少、預測準確率高和強魯棒性的特點。本文采用隨機森林的方法對鉆井實時測量數(shù)據(jù)進行建模,來對溢流、漏失進行實時識別判斷。

      一、隨機森林方法

      隨機森林由Breiman L在2001年提出,是一個可處理高維度與非線性樣本的分類器組合模型。大量的理論和實證研究都證明了隨機森林具有很高的預測準確率,對異常值和噪聲具有很好的容忍度,并且不容易出現(xiàn)過擬合。因此,自其被提出以來,在醫(yī)學、生物信息、管理學等領(lǐng)域得到了廣泛應用。隨機森林分類的基本思想[1-2]:首先,利用自助法(Bootstrap)抽樣技術(shù)從原始訓練集抽取k個樣本集;然后,對k個樣本集分別建立k個決策樹模型,得到k種分類結(jié)果;最后,對每個新記錄根據(jù)k種分類結(jié)果進行投票表決決定其最終分類。

      二、基于隨機森林的溢漏實時判斷方法

      在鉆井過程中,當有溢流、漏失發(fā)生時,在鉆井測量參數(shù)上會有所體現(xiàn);例如溢流發(fā)生時,進出口流量之差會增加,立壓降低,大鉤負載緩增;漏失發(fā)生時,進出口流量之差減少,立管壓力降低,井底環(huán)壓降低;由此可見,鉆井測量參數(shù)與溢流、漏失存在著相關(guān)關(guān)系??砂岩缌?、漏失的識別問題建模成以鉆井測量參數(shù)為自變量,是否發(fā)生溢流、漏失為結(jié)果變量的分類模型。本文選用隨機森林方法對溢流、漏失的實時識別進行分類建模,通過大量歷史數(shù)據(jù)對隨機森林進行訓練,并對新的實時輸入數(shù)據(jù)作出是否發(fā)生溢流、漏失的分類。

      基于隨機森林的溢流、漏失實時判斷方法的流程如圖1所示。

      圖1 基于隨機森林的溢流、漏失實時判斷方法的流程圖

      1. 生成原始數(shù)據(jù)集

      隨機森林是有監(jiān)督的機器學習算法,用于訓練算法的樣本數(shù)據(jù)需要有輸入變量和結(jié)果變量。在本文的模型中,輸入變量即以時間為索引的鉆井測量參數(shù),結(jié)果變量為是否發(fā)生溢流或漏失。因為溢流、漏失的信息一般以文本的方式記錄在井史數(shù)據(jù)中,因此需要對文本數(shù)據(jù)進行自動識別,并根據(jù)文本中溢流、漏失事故的發(fā)生和持續(xù)時間,生成以時間為索引的溢流、漏失數(shù)據(jù);合并以時間為索引的鉆井測量參數(shù)和溢流、漏失數(shù)據(jù),即可生成用于隨機森林算法的原始數(shù)據(jù)集。生成的原始數(shù)據(jù)集是以時間為索引的多維特征數(shù)據(jù)和分類結(jié)果,特征包括:入口流量、出口流量、PWD環(huán)空壓力、PWD環(huán)空溫度、大鉤載荷、井深、鉆頭深度、總池體積、立管壓力、轉(zhuǎn)速、鉆壓、鉆井液出口密度和鉆井液出口溫度;數(shù)據(jù)的分類結(jié)果為離散值:0代表無事故發(fā)生,1代表有溢流發(fā)生,2代表有漏失發(fā)生。

      2. 數(shù)據(jù)預處理

      本文的原始數(shù)據(jù)集是以時間先后為順序排列的數(shù)據(jù)集,很難直接用于溢流、漏失實時識別的建模,為了讓數(shù)據(jù)適合于隨機森林的建模,需要對數(shù)據(jù)進行預處理。

      首先,溢流、漏失的發(fā)生導致原始數(shù)據(jù)集中各特征數(shù)據(jù)發(fā)生變化,因此各特征數(shù)據(jù)的相對變化量能更好的應用于隨機森林中決策樹的創(chuàng)建,而且使用特征數(shù)據(jù)的相對變化量,可綜合多口井的數(shù)據(jù),形成更大數(shù)據(jù)量的歷史數(shù)據(jù)集。對于某一特征數(shù)據(jù),相對變化量的計算公式為:

      (1)

      式中:A(Ti)—特征數(shù)據(jù)列A在Ti時間點的值;A(Ti-1)—特征數(shù)據(jù)列A在Ti-1時間點的值。

      其次,在不同的工況下,當溢流和漏失發(fā)生時,各特征數(shù)據(jù)的變化情況不同,因此根據(jù)原始數(shù)據(jù)集中的數(shù)據(jù),對工況進行自動識別,有助于下一步?jīng)Q策樹的生成。本文自動識別的工況包括:鉆進、起鉆、下鉆和其它(包括接單跟,卸單根和鉆井液循環(huán)等)。鉆井工況計算方法為:

      在時間Ti,若HDEP(Ti)=BDEP(Ti),HDEP(Ti)> HDEP(Ti-1),則鉆井狀態(tài)DS(Ti)為鉆進。

      在時間Ti,若HDEP(Ti)>BDEP(Ti),BDEP(Ti)>BDEP(Ti-1),則鉆井狀態(tài)DS(Ti)為下鉆。

      在時間Ti,若HDEP(Ti)>BDEP(Ti),BDEP(Ti)

      否則, 鉆井狀態(tài)為其它。

      其中,HDEP(Ti)為Ti時刻的井深,HDEP(Ti-1)為Ti-1時刻的井深,BDEP(Ti)為Ti時刻的鉆頭深度,BDEP(Ti-1)為Ti-1時刻的鉆頭深度。

      再次,把相關(guān)特征數(shù)據(jù)進行簡單的計算,能與溢流、漏失的發(fā)生建立更直接的關(guān)系,例如出口流量和入口流量之差,可更直接反應是否有溢流、漏失發(fā)生。因此把出入口流量差加入到輸入特征集中。

      3. 生成子數(shù)據(jù)集

      對于預處理之后的溢流、漏失數(shù)據(jù)集,隨機森林采用Bootstrap重采樣方法,生成k個用于決策樹生成的樣本集,k由所需建立的決策樹的數(shù)量確定。隨機森林中決策樹的數(shù)量對預測結(jié)果有重要影響,本文將在現(xiàn)場實例中進行討論。Bootstrap方法的基本思想為[3]:從容量為N的原始樣本集中進行有放回的重復采樣,采樣樣本的容量也為N,每個觀測對象被抽到的概率為1/N,每次采樣構(gòu)成的子樣本集稱為Bootstrap樣本集。

      4. 用CART樹進行分類

      對于上述步驟生成的每一個樣本集,隨機森林采用CART決策樹來對訓練數(shù)據(jù)進行分類。CART算法采用一種二分遞歸分割的技術(shù),總是將當前樣本集分割為兩個子樣本集,使得生成的決策樹的每個非葉節(jié)點都只有兩個分支,因此CART算法生成的決策樹是結(jié)構(gòu)簡潔的二叉樹,可用于分類和回歸任務。在創(chuàng)建分類樹遞歸過程中,CART每次都選擇當前數(shù)據(jù)集中具有最小gini信息增益的特征作為節(jié)點劃分決策樹。gini指數(shù)是一種不等性度量,可用來度量任何不均勻分布,是介于0~1之間的數(shù),0代表完全相等,1代表完全不想等。分類度量時,總體內(nèi)包含的類別越雜亂,gini指數(shù)就越大。gini指數(shù)的計算公式為:

      (2)

      式中:pj—類別j在樣本T中出現(xiàn)的頻率;

      nj—樣本T中類別j的個數(shù)。

      在每個節(jié)點分裂時,計算不同特征和不同閾值相對應的gini信息增益,選擇最小的gini指數(shù)對應的特征和閾值,對特征空間進行二元分裂。對節(jié)點進行二元分裂時,gini信息增益的計算公式為:

      (3)

      式中:s1—T1中樣本的個數(shù);s2—T2中樣本的個數(shù)。

      不同于傳統(tǒng)的CART樹,隨機森林在CART樹的創(chuàng)建過程中,采用了隨機特征的選擇,即在每一個結(jié)點隨機選擇一小組輸入變量(m個特征,m<總待選特征個數(shù))進行分割,如圖2所示。

      圖2 決策樹創(chuàng)建過程中的特征選擇

      5. 溢流、漏失識別

      對于新的輸入樣本,隨機森林根據(jù)CART算法所生成的k棵決策樹的投票結(jié)果,判斷是否有溢流、漏失發(fā)生。

      三、現(xiàn)場實例

      1. 實驗數(shù)據(jù)

      本文以塔里木油田的某復雜井為例,用基于隨機森林的智能方法對溢流、漏失進行實時識別。用于隨機森林算法訓練的歷史數(shù)據(jù)從該井的鄰井數(shù)據(jù)中獲取,訓練數(shù)據(jù)集包括正常鉆井樣本,溢流樣本和漏失樣本。

      2. 溢流識別

      對該井的鉆井測量參數(shù)進行實時監(jiān)測的開始時間為2018年2月11日21∶08,如圖3所示。從21∶09開始,該井停止鉆進,并打開泵進行循環(huán)。由圖3可見從21∶09開始,出口流量大于入口流量;總池體積從21∶19分開始明顯增加,到21∶25達到峰值,為147.9 m3,增量為0.9 m3,可判斷有溢流發(fā)生。

      圖3 鉆井實時測量參數(shù)

      圖4為用隨機森林的方法對溢流進行實時識別的結(jié)果,0代表正常工況,1代表溢流工況,2代表漏失工況。由圖4可見,系統(tǒng)自動在溢流發(fā)生初期(21∶09)即對溢流進行了自動識別,這比用傳統(tǒng)的總池體積增加法來判斷溢流提早了16 min,實現(xiàn)了溢流監(jiān)測的及時性;在21∶24,出口流量等于入口流量,溢流結(jié)束,系統(tǒng)亦進行了自動識別,識別的結(jié)果為正常工況。

      圖4 基于隨機森林的溢流實時識別

      3. 漏失識別

      從2018年2月16日00∶16開始,對該井的鉆井測量參數(shù)進行實時監(jiān)測,如圖5所示。從00∶16開始,該井邊鉆邊漏,出口流量小于入口流量。從00∶35開始,總池體積明顯減少,到00∶39,總池體積從原來的129.3 m3降低到128.1 m3,減少了1.2 m3,可判斷漏失發(fā)生。

      圖6為用隨機森林的方法對漏失進行實時識別的結(jié)果。由圖6可見,系統(tǒng)自動在溢流發(fā)生初期(00∶16)即對漏失進行了自動識別,這比用傳統(tǒng)的總池體積減少法來判斷漏失提早了23 min,實現(xiàn)了漏失監(jiān)測的及時性。

      圖5 鉆井實時測量參數(shù)

      圖6 基于隨機森林的漏失實時識別

      4. 建模參數(shù)的選擇

      用隨機森林的方法建模時,一個重要參數(shù)為決策樹的數(shù)量,此參數(shù)的選擇對于隨機森林的預測準確性有重要影響。因此本文對此參數(shù)的選擇進行討論。

      圖7~圖10展示了用不同的決策樹數(shù)量,對發(fā)生在2月11日20∶17開始的溢流進行識別的結(jié)果。由圖7可見,當決策樹數(shù)量為10時,溢流的識別結(jié)果里有較多的錯誤,隨著決策樹數(shù)量的增加,溢流識別結(jié)果越來越準確,到?jīng)Q策樹數(shù)量為100時,識別結(jié)果趨于穩(wěn)定。因此選用100為決策樹數(shù)量可得到較為準確的預測結(jié)果。

      圖7 決策樹數(shù)量為10時的溢流識別圖

      圖8 決策樹數(shù)量為20時的溢流識別圖

      5. 變量的重要性分析

      本文還用隨機森林的方法對用于溢流漏失識別的14個輸入特征的重要性進行分析,其中,流入流出差對于溢流漏失識別的重要性最高,這符合當前主要的溢流、漏失識別的判斷依據(jù);重要程度接近于0的鉆壓變化量、轉(zhuǎn)速變化量、泵沖變化量和出口溫度變化量可從用于隨機森林建模的輸入特征中剔除,以提高計算速度。

      圖9 決策樹數(shù)量為50時的溢流識別圖

      圖10 決策樹數(shù)量為100時的溢流識別圖

      四、結(jié)論

      (1)隨機森林作為新興起的集成學習算法,具有預測準確度高、對噪聲的容忍度大,計算速度快等優(yōu)點,這些優(yōu)點使其適用于溢流、漏失的實時識別判斷。

      (2)現(xiàn)場實例顯示,通過對鉆井實時測量數(shù)據(jù)的合理預處理,結(jié)合隨機森林的方法,溢流、漏失可在早期被準確識別。

      (3)由于隨機森林可以處理大量的特征數(shù)據(jù)(輸入數(shù)據(jù)),并可在決定類別時,評估特征的重要性;本文利用隨機森林對初選的特征進行重要性分析,結(jié)果表明鉆井液流入流出差對于溢流、漏失的判斷具有重要影響。

      猜你喜歡
      溢流決策樹鉆井
      聰聰?shù)叵颅h(huán)游記之超深鉆井
      自升式鉆井平臺Aker操作系統(tǒng)應用探討
      海洋石油(2021年3期)2021-11-05 07:42:54
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      掃描“藍鯨”——觀察海上鉆井平臺
      決策樹和隨機森林方法在管理決策中的應用
      電子制作(2018年16期)2018-09-26 03:27:06
      精確發(fā)現(xiàn)溢流研究及在西北工區(qū)現(xiàn)場應用
      錄井工程(2017年3期)2018-01-22 08:40:07
      基于模糊專家系統(tǒng)的鉆井溢流智能預警技術(shù)
      基于決策樹的出租車乘客出行目的識別
      精細控壓鉆井溢流檢測及模擬研究
      G0-7“工廠化”井組鉆井工藝技術(shù)
      岳阳县| 清河县| 湘乡市| 安塞县| 阜南县| 牡丹江市| 卢氏县| 仁寿县| 定州市| 灵石县| 临夏县| 株洲市| 措美县| 横山县| 体育| 巍山| 呼伦贝尔市| 九龙县| 唐河县| 渝中区| 化德县| 肇庆市| 新绛县| 福安市| 陆丰市| 广昌县| 柏乡县| 福州市| 麻栗坡县| 阿城市| 平利县| 高唐县| 峨边| 泾川县| 顺昌县| 蒙自县| 东光县| 志丹县| 赤壁市| 德昌县| 五峰|