劉勝娃,蘇興華,詹勝,何以晴,胡剛,隗崇華
摘要:當(dāng)前鉆井工況異常復(fù)雜,異常工況特征較多,影響了鉆井工況異常識別結(jié)果的準(zhǔn)確性與全面性,為此,本文提出基于改進(jìn)隨機(jī)森林算法的鉆井工況異常自動識別方法。布設(shè)傳感器監(jiān)測鉆柱振動數(shù)據(jù),提取數(shù)據(jù)中的鉆井異常參數(shù),使用EMD提取異常工況特征。結(jié)合異常工況特征提取結(jié)果,利用改進(jìn)隨機(jī)森林算法構(gòu)建鉆井工況異常自動識別模型,得到相關(guān)的識別結(jié)果。實驗結(jié)果表明,設(shè)計方法在鉆井工況異常自動識別方面具有極高的可靠性,能夠保證工況異常識別結(jié)果的準(zhǔn)確性與全面性。
關(guān)鍵詞:隨機(jī)森林算法;鉆井工況異常;異常識別;EMD;異常工況特征
中圖分類號:TE142? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2022)35-0087-03
鉆井工程是一個具有較強(qiáng)不確定性的復(fù)雜施工過程[1],在鉆井施工作業(yè)的過程中,受鉆井設(shè)備、井下環(huán)境等異常的影響,時常發(fā)生不同類型的鉆井異常工況[2]。這些異常工況威脅著鉆井施工的安全性,一旦鉆井發(fā)生故障,如跳鉆和黏滑情況[3]等,可能直接導(dǎo)致關(guān)井等后果,嚴(yán)重影響鉆井的工作效率和質(zhì)量[4]。研究鉆井工況異常的識別方法,對于及時處理異常工況,提高鉆井工作效率,降低維護(hù)成本具有重要意義[5]。而傳統(tǒng)的鉆井工況異常識別方法存在難以提取異常工況特征的局限性,識別結(jié)果存在偏差,存在漏識、誤識等情況,為此,本文提出基于改進(jìn)隨機(jī)森林算法的鉆井工況異常自動識別方法,并通過實驗驗證了本文方法在鉆井工況異常識別中的應(yīng)用性能。
1 設(shè)計基于改進(jìn)隨機(jī)森林算法的異常檢測識別模型
1.1 布設(shè)傳感器監(jiān)測鉆柱振動數(shù)據(jù)
為了實現(xiàn)對于鉆井工況異常的自動識別,需要在獲取大量鉆井工作數(shù)據(jù)的基礎(chǔ)上,對異常情況進(jìn)行分析。所以,需要對鉆井設(shè)備進(jìn)行實時監(jiān)測,以獲取工況數(shù)據(jù),為異常識別提供重要的數(shù)據(jù)基礎(chǔ)。為此,本文使用振動傳感器,對鉆井的鉆柱進(jìn)行振動信號的測量。由于在實際的工況中,鉆井鉆柱的振動方向并不是單一垂直運(yùn)動的,而是會受到各種反作用力,產(chǎn)生水平振動、垂直振動以及變向振動等。為了數(shù)據(jù)采集的全面性與完整性,本文還另外添加一臺加速度傳感器,以滿足對于鉆柱振動數(shù)據(jù)的全面測量。同時,為滿足數(shù)據(jù)處理高效率的要求,本文使用云端數(shù)據(jù)庫將收集信號進(jìn)行實時存儲,以便后期進(jìn)行線上的數(shù)據(jù)處理。
1.2 提取數(shù)據(jù)中的鉆井異常參數(shù)
在收集好鉆井運(yùn)行時相關(guān)的工況數(shù)據(jù)后,本文對數(shù)據(jù)進(jìn)行初步處理,降低信號數(shù)據(jù)中的干擾因素,并提取其中的鉆井異常工況的參數(shù)。在此,本文使用聚類算法提取異常參數(shù)。
假設(shè)數(shù)據(jù)集為[A],其中存在的數(shù)據(jù)對象有[N]個,那么可以將數(shù)據(jù)集[A]表示為[A=1,2,...,N]。對于任意一個數(shù)據(jù)對象[N]來說,都有各自的屬性分類[B],那么可以將數(shù)據(jù)根據(jù)屬性進(jìn)行劃分,使其成為含特定屬性[B]的聚類。在此基礎(chǔ)上,選用該聚類簇的平均值[C]為中心,重新對剩下的數(shù)據(jù)進(jìn)行劃分,形成新的聚類,重復(fù)循環(huán),直到數(shù)據(jù)劃分完成。依據(jù)平方誤差的計算公式,異常參數(shù)的提取公式表示如下:
[Q=i=1na∈ba-Ci]? ? ? ? ? ? ? ? ? ? ?(1)
式中,[n]表示的是聚類數(shù)量參數(shù),[a]表示的是數(shù)據(jù)集中的某一數(shù)據(jù)對象;[b]表示的是某一聚類分簇;[Ci]表示的是該分簇的平均參數(shù)。通過上述公式,能夠計算出全部數(shù)據(jù)對象的平方誤差參數(shù)[Q],實現(xiàn)對異常參數(shù)的提取。
1.3 EMD提取異常工況特征
本文在獲取鉆井異常工況的數(shù)據(jù)參數(shù)后,需要對其中的異常特征進(jìn)行提取,以更好地分析鉆井工況異常的類型與相應(yīng)特征,從而進(jìn)行異常工況識別。為了保證提取效果,本文使用EMD方法,對異常工況的特征進(jìn)行提取。
在鉆井向下鉆進(jìn)的過程中,容易出現(xiàn)鉆頭脫離的跳鉆情況,為此本文對鉆柱垂直運(yùn)動方向的數(shù)據(jù)進(jìn)行特征提取,以識別鉆井的異常工況。利用EMD方法對鉆井異常參數(shù)進(jìn)行時域特征的提取。假設(shè)異常參數(shù)[D]中,存在極大值[dmax]以及極小值[dmin],通過連接[dmax]和[dmin],使得存在兩條貫穿全部異常參數(shù)的曲線[z]、[x],那么對于[z]和[x]來說,能夠求出二者間的平均曲線[v],可以得出如下計算公式:
[g=D-v]? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
式中,通過異常參數(shù)與平均曲線作差得到異常參數(shù)[D]的特征尺度[g]。但僅僅計算出[g]是不能滿足特征提取需求的,因此,還需要驗證[g]的數(shù)值能夠符合特征尺度的條件要求。驗證成功后,繼續(xù)進(jìn)行下一特征尺度的提取,直到獲得[n]個[g]值。
通過上述方法,能夠提取跳鉆情況的異常特征,然而在實際鉆井運(yùn)行過程中,出現(xiàn)異常工況的情形是多樣的,僅憑一種異常特征,難以識別全部的異常情況。對此,本文還對異常參數(shù)的頻域特征進(jìn)行提取,以完善異常工況的特征情況。
經(jīng)過分析歷史數(shù)據(jù)中的異常工況數(shù)據(jù),并結(jié)合專家經(jīng)驗,本文建立了鉆井工況異常特征的關(guān)系規(guī)律,部分情況如表1所示:
1.4 改進(jìn)隨機(jī)森林算法實現(xiàn)異常識別
在提取異常特征以后,本文建立了相應(yīng)的異常特征對比數(shù)據(jù)庫,以滿足對于實時獲取的鉆井運(yùn)行數(shù)據(jù)進(jìn)行匹配,搜尋其中的異常工況信息,利用改進(jìn)隨機(jī)森林算法進(jìn)行鉆井工況異常自動識別。
我們先構(gòu)建判斷異常特征的決策樹。假設(shè)傳感器捕獲的數(shù)據(jù)集為[W],其中對于異常識別的決策特征為[E],由于特征類型眾多,為每個異常特征進(jìn)行屬性劃分,劃分出[q]個屬性量,那么對于該數(shù)據(jù)集來說,能夠求出其相關(guān)的信息熵[R],其公式表示如下:
[R=i=1ntilog3ti]? ? ? ? ? ? ? ? ? ? ? ?(3)
式中,[n]表示的是數(shù)據(jù)中的特征數(shù)量參數(shù);[ti]表示的是[W]根據(jù)[E]進(jìn)行分類后的數(shù)據(jù)子集。
隨機(jī)森林算法就是通過特征取值,隨后對數(shù)據(jù)集進(jìn)行劃分,將其分為無數(shù)個小子集,形成相應(yīng)的決策樹模型。這種計算過程較為復(fù)雜,使得故障識別的運(yùn)算效率不能滿足實際的需求,為此,需要對其進(jìn)行優(yōu)化。對此,本文引入步長LMS算法,對隨機(jī)森林模型進(jìn)行優(yōu)化。
首先,劃分?jǐn)?shù)據(jù)的特征。由于已經(jīng)通過歷史數(shù)據(jù)提取了異常工況的特征參數(shù)[D],那么可以以此為標(biāo)準(zhǔn),對數(shù)據(jù)集[W]進(jìn)行預(yù)劃分。計算出[W]集合內(nèi)的特征參數(shù)[e],將[e]與標(biāo)準(zhǔn)參數(shù)[D]進(jìn)行比對,若滿足[e?D]這一條件,那么就可以將該特征歸為左分支,若滿足[e≥D]這一條件,則歸到右側(cè)分支。按照這一思路,能夠?qū)e]進(jìn)行排序,從而得到[E=e1,e2,...,en]。
其次,對構(gòu)建好的決策樹進(jìn)行離散度的評價,以縮小算法的方差差異。假設(shè)標(biāo)準(zhǔn)差參數(shù)為[r],那么對于集合[E]來說,其離散程度[M]的計算公式可以表示為:
[M=r?]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(4)
其中,[?]表示的是集合[E]的平均參數(shù),通過[r]與[?]之間的比值,能夠分析出數(shù)據(jù)集[W]的離散度。
最后,使用步長LMS對其進(jìn)行優(yōu)化。假設(shè)窗口的滑動步長范圍為[l],且滿足[l=1,5],從[l]的最小值1起始,當(dāng)窗口滑動的過程中,需要確定滑動均值[la],然后通過[la]的大小確定最佳的集合劃分點(diǎn)[a]。以此方式,不斷進(jìn)行劃分,直至特征參數(shù)被劃分完畢。這樣,就能夠獲取優(yōu)化后的隨機(jī)森林決策樹。
通過建立改進(jìn)后的隨機(jī)森林構(gòu)建鉆井工況異常自動識別模型,能夠判斷數(shù)據(jù)集中異常工況的特征數(shù)據(jù),從而在歷史數(shù)據(jù)庫中尋找最優(yōu)解,通過匹配,實現(xiàn)鉆井工況異常的自動識別,以此保證識別質(zhì)量與效果。
2 實驗論證分析
為驗證本文設(shè)計的基于改進(jìn)隨機(jī)森林算法的鉆井工況異常自動識別方法的有效性,進(jìn)行實驗論證。在某地的鉆井施工過程中進(jìn)行實驗,具體的實驗準(zhǔn)備以及實驗結(jié)果如下。
2.1 實驗準(zhǔn)備
本文對該地的11號鉆井進(jìn)行工況異常識別的實驗,該鉆井機(jī)為徐工的XSL7/350型鉆機(jī),鉆孔深度高達(dá)700m,并采用履帶式驅(qū)動,便于進(jìn)行調(diào)度,該鉆機(jī)采用CUMMINS QSB5.9-C210型發(fā)動機(jī),功率可達(dá)155kw,具有較強(qiáng)的地層適應(yīng)性。通過安裝振動傳感器,以此測得了鉆井運(yùn)行過程中,正常工況以及發(fā)生異常工況的信號數(shù)據(jù),經(jīng)過分析后繪制了相應(yīng)的分解圖,具體情況如下圖1與圖2所示:
分析對比圖1、圖2可以看出,鉆井工作時正常情況下振動數(shù)據(jù)波動較為平穩(wěn),上下不會超過0.5m/s2。而發(fā)生異常工況時,存在信號波動尖峰,超過正常波動閾值,如圖2監(jiān)測數(shù)據(jù)點(diǎn)在460左右,超過了0.5,并且數(shù)據(jù)點(diǎn)在590~690之間,存在持續(xù)波動段,可見出現(xiàn)跳鉆類異常工況,以此能夠保證實驗的真實性和可靠性。
2.2 實驗結(jié)果
本文分別使用傳統(tǒng)的隨機(jī)森林識別方法以及本文設(shè)計的改進(jìn)隨機(jī)森林的自動識別方法進(jìn)行異常工況識別,記錄兩種方法的識別數(shù)據(jù)。得到了兩種方法對于鉆井異常工況識別的結(jié)果,具體情況如下圖3所示:
圖3中,閾值在0范圍內(nèi)上下波動1表示識別結(jié)果為工況正常,達(dá)到5左右表示識別結(jié)果為異常,-5左右表示為識別結(jié)果模糊。由上圖3可以看出,隨著采樣增加,本文方法與實際監(jiān)測的振動信號結(jié)果分析基本一致,較傳統(tǒng)方法在識別結(jié)果準(zhǔn)確性方面具有明顯的優(yōu)勢。在前期正常工況時,傳統(tǒng)方法與本文設(shè)計方法能夠保證較平穩(wěn)識別,而面對瞬時異常時,本文方法能夠準(zhǔn)確識別異常,傳統(tǒng)方法卻沒有識別出異常情況。同時,在面對持續(xù)異常情況時,本文方法能夠做到精準(zhǔn)及時識別,而傳統(tǒng)方法識別存在較大時間差,并且判斷結(jié)果存在模糊情況。對比證明,本文設(shè)計方法更具可靠性,且對于鉆井工況異常的識別準(zhǔn)確率較高。
3 結(jié)束語
為了保證鉆井工況異常自動識別效率與質(zhì)量,通過改進(jìn)隨機(jī)森林算法,實現(xiàn)對于鉆井工況異常的自動識別。對比傳統(tǒng)識別方法,驗證了本文設(shè)計方法具有極高的可靠性,能夠保證工況異常識別的準(zhǔn)確全面,可以在實際中得到廣泛應(yīng)用。
參考文獻(xiàn):
[1] 羅光強(qiáng),李揚(yáng),周策,等.深孔智能化鉆井參數(shù)遠(yuǎn)程監(jiān)控及工況識別系統(tǒng)研究[J].地質(zhì)與勘探,2022,58(3):696-702.
[2] 李衍志,范勇,高琳.基于形態(tài)流的石油鉆井水流異常檢測[J].計算機(jī)應(yīng)用,2021,41(6):1842-1848.
[3] 劉勝娃,曹湘華.基于決策樹的鉆井工況智能識別方法[J].新型工業(yè)化,2022,12(1):28-30.
[4] 李雷,韓烈祥,姚建林.參數(shù)耦合在粒子沖擊鉆井智能決策系統(tǒng)中的應(yīng)用[J].鉆采工藝,2020,43(3):4-6,45,1.
[5] 李兵,韓睿,何怡剛,等.改進(jìn)隨機(jī)森林算法在電機(jī)軸承故障診斷中的應(yīng)用[J].中國電機(jī)工程學(xué)報,2020,40(4):1310-1319,1422.
【通聯(lián)編輯:張薇】