孫 挺, 趙 穎, 楊 進(jìn), 殷啟帥, 汪文星, 陳 緣
(中國石油大學(xué)(北京)安全與海洋工程學(xué)院,北京 102249)
提高鉆井時(shí)效是降本增效的重要手段,但目前通常對鉆井時(shí)效進(jìn)行事后人工分析,具有主觀性和滯后性。隨著機(jī)器學(xué)習(xí)和大數(shù)據(jù)技術(shù)的迅速發(fā)展,國內(nèi)外很多學(xué)者開展了大數(shù)據(jù)和人工智能方法在石油工程中的應(yīng)用研究,A. M. Alsalama 等人[1]提出了一個(gè)包含所需數(shù)據(jù)挖掘和分析工具的集成系統(tǒng),大大縮短了傳統(tǒng)方法進(jìn)行預(yù)警的時(shí)間;K. Balaji 等人[2]從基礎(chǔ)、理論和應(yīng)用方面總結(jié)了數(shù)據(jù)驅(qū)動方法在石油天然氣工程中的發(fā)展;劉剛[3]建立了基于多源信息的SVM 自適應(yīng)鉆井井下故障預(yù)警模型;袁野[4]提出了基于SVM 的井眼軌跡智能預(yù)測方法,建立了井眼的三維可視圖,可以有效地控制井眼軌跡;孫萬海[5]提出了一種基于PSO-SVM 的鉆井故障智能預(yù)警系統(tǒng),提高了鉆井質(zhì)量;王江萍等人[6]提出應(yīng)用神經(jīng)網(wǎng)絡(luò)技術(shù)對井漏、井塌、井涌及井噴等井下故障進(jìn)行診斷。可見,目前國內(nèi)外主要是運(yùn)用大數(shù)據(jù)和機(jī)器學(xué)習(xí)對鉆井故障進(jìn)行預(yù)測及預(yù)防或研究相關(guān)理論問題,對工況識別的研究較少,且存在數(shù)據(jù)量小和缺乏現(xiàn)場實(shí)例驗(yàn)證等問題。YIN Qishuai 等人[7]提出了一種基于程序的工況識別方法,很好地消除了人員對鉆井工況識別的影響,但該方法基于編程語言,沒有考慮前后數(shù)據(jù)之間的聯(lián)系和鉆井?dāng)?shù)據(jù)可能存在波動等問題。為此,筆者提出了一種普遍適用的純數(shù)據(jù)驅(qū)動方法,利用支持向量機(jī)(support vector machine,SVM)識別鉆井工況,減少不可見非生產(chǎn)時(shí)間,提高鉆井作業(yè)效率;采用訓(xùn)練-測試的方式,訓(xùn)練數(shù)據(jù)為綜合錄井提供的實(shí)時(shí)數(shù)據(jù),解決了傳統(tǒng)方法對人員依賴大的缺點(diǎn);在鉆井工況識別中應(yīng)用機(jī)器學(xué)習(xí)與數(shù)據(jù)驅(qū)動方法,同時(shí)允許數(shù)據(jù)存在一定的波動,克服了編程語言識別帶來的問題。
支持向量機(jī)是一種監(jiān)督式學(xué)習(xí)模型,可以用于模式識別、分類和回歸問題的分析。該模型是基于統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則建立的,主要思想是建立一個(gè)線性分離超平面,將非線性輸入映射到高維特征空間中,使正例和反例之間的隔離邊緣被最大化[8-15]。支持向量機(jī)的原理如圖1 所示。圖1 中,x1和x2代表輸入?yún)?shù)特征,w 為核函數(shù),b 為偏置,l2代表數(shù)據(jù)分類的最佳方案。模型的輸入為鉆頭位置、大鉤載荷、機(jī)械鉆速、鉆壓、大鉤載荷、轉(zhuǎn)速、扭矩、出口排量和立管壓力等9 種參數(shù),輸出包括倒劃眼、接立柱、下套管、下鉆及旋轉(zhuǎn)鉆進(jìn)5 種正常工況和鉆塞等復(fù)雜工況。根據(jù)9 種輸入?yún)?shù)的特征,采用SVM 將它們分為6 種輸出結(jié)果。
圖 1 支持向量機(jī)原理示意Fig. 1 Principle schematic diagram of support vector machine
針對非線性分類問題,B. E. Boser 等人[16]提出了將核技巧應(yīng)用于最大邊界超平面,從而創(chuàng)建非線性分類器的方法。經(jīng)過不斷發(fā)展,應(yīng)用于SVM 的核函數(shù)主要包括以下幾種類型[17]。
線性核函數(shù):
多項(xiàng)式核函數(shù):
徑向基核函數(shù):
兩層感知器核函數(shù):
式中: xi,xj為空間中的2 個(gè)向量;k 為核函數(shù);d,γ,κ,c為系數(shù)。
通過核函數(shù)處理,將非線性問題轉(zhuǎn)化為線性問題,如圖2 所示。
筆者在研究中,利用SVM 進(jìn)行6 個(gè)鉆井工況的識別,識別結(jié)構(gòu)如圖3 所示。收集現(xiàn)場22 種鉆井工況的錄井?dāng)?shù)據(jù),選擇具有代表性的倒劃眼、接立柱、下套管、下鉆及旋轉(zhuǎn)鉆進(jìn)等5 種正常工況和鉆塞等復(fù)雜工況共6 種工況進(jìn)行分析。結(jié)合研究中數(shù)據(jù)的使用情況,選取的參數(shù)包括鉆頭位置、大鉤載荷、機(jī)械鉆速、鉆壓、大鉤高度、轉(zhuǎn)速、扭矩、出口排量和立管壓力。
圖 2 核函數(shù)作用示意Fig.2 Functional schematic diagram of the kernel function
圖 3 支持向量機(jī)的識別結(jié)構(gòu)示意Fig. 3 Recognition structure of support vector machine
為了提高工況識別的準(zhǔn)確率,首先對數(shù)據(jù)進(jìn)行[0,1]歸一化處理,然后優(yōu)選SVM 核函數(shù)類型,并進(jìn)行交叉驗(yàn)證,優(yōu)化模型。
應(yīng)用SVM 時(shí),關(guān)鍵是選擇核函數(shù),不同的核函數(shù)適用于不同的問題,對準(zhǔn)確率有很大的影響。采用不同的核函數(shù),對不同工況進(jìn)行歸一化處理,輸出的結(jié)果如圖4—圖7 所示。
4 種核函數(shù)的識別準(zhǔn)確率和計(jì)算時(shí)間的對比情況見表1。
圖 4 線性核函數(shù)的識別結(jié)果Fig. 4 Identification results of linear kernel function
圖 5 多項(xiàng)式核函數(shù)的識別結(jié)果Fig. 5 Identification results of polynomial kernel function
圖 6 徑向基核函數(shù)的識別結(jié)果Fig. 6 Identification results of radial basis kernel functions
圖 7 兩層感知器核函數(shù)的識別結(jié)果Fig. 7 Identification results of kernel functions by two-layer perceptron
由表1 可知,兩層感知器核函數(shù)的識別準(zhǔn)確率最低,且耗費(fèi)時(shí)間最長;徑向基核函數(shù)的識別準(zhǔn)確率較高。
利用SVM 進(jìn)行鉆井工況識別時(shí),得到的模型需要具有高的準(zhǔn)確率和魯棒性,采用交叉驗(yàn)證的方法,將原始數(shù)據(jù)分成K 組,隨機(jī)選取一組子集做驗(yàn)證集,其余K-1 組子集做訓(xùn)練集,得到K 個(gè)模型,最后選擇準(zhǔn)確率最高模型的性能指標(biāo)[16]作為最終SVM的參數(shù)。
表 1 不同核函數(shù)計(jì)算結(jié)果對比Table 1 Comparisons of calculation results with different kernel functions
通過交叉驗(yàn)證可以選出最佳的懲罰函數(shù)c 和核函數(shù)參數(shù)g,交叉驗(yàn)證的結(jié)果如圖8 所示(圖8 中,不同等高線表示c 和g 不同取值對應(yīng)的準(zhǔn)確率)。
圖 8 交叉驗(yàn)證結(jié)果Fig. 8 Cross validation results
由圖8 可知,時(shí),準(zhǔn)確率可達(dá)到97%以上,此時(shí)選取c 最小的那組數(shù)據(jù)(這是因?yàn)椋琧 值過高會出現(xiàn)過學(xué)習(xí)現(xiàn)象,即訓(xùn)練集的準(zhǔn)確率滿足一定的要求,但測試集準(zhǔn)確率很低),即c=0.353 6,g=1.534 0(見圖8 中點(diǎn)A)。準(zhǔn)確識別鉆井工況后,就可以對鉆井作業(yè)進(jìn)行事后分析,識別不可見非生產(chǎn)時(shí)間,提高鉆井效率,從而提高鉆井的安全性和經(jīng)濟(jì)性。
選取4 口井進(jìn)行模型驗(yàn)證,以其中2 口井的錄井?dāng)?shù)據(jù)為訓(xùn)練集,其他2 口井的錄井?dāng)?shù)據(jù)為測試集,訓(xùn)練集和測試集SVM 的識別結(jié)果如圖9 所示。從圖9 可以看出,訓(xùn)練集的識別準(zhǔn)確率高于測試集,測試集中接立柱和旋轉(zhuǎn)鉆進(jìn)的識別準(zhǔn)確率最高,達(dá)到了97%,工況識別準(zhǔn)確率總體達(dá)到95%以上,說明該方法在新樣本中有很好的泛化性。
圖 9 最終的工況識別結(jié)果Fig. 9 Final identification results of working condition
海上導(dǎo)管架平臺因作業(yè)空間受限,通常在一個(gè)導(dǎo)管架平臺上布置數(shù)十口井,這種井槽集中在一個(gè)區(qū)域的布井方式,形成了“批鉆(一次性完成同一開次鉆井作業(yè))”作業(yè)模式。由于這些井的地層情況、鉆井設(shè)計(jì)方案、鉆井設(shè)備、施工隊(duì)伍相似,所以在“批鉆”模式下,同一井段的時(shí)效具有可比性。因此,采用基于支持向量機(jī)的鉆井工況實(shí)時(shí)智能識別方法,進(jìn)行工況識別、時(shí)效分析和時(shí)效輔助決策,實(shí)現(xiàn)提質(zhì)增效。以南海某平臺批鉆作業(yè)為例,首先對一口井的三開錄井?dāng)?shù)據(jù)進(jìn)行學(xué)習(xí),訓(xùn)練得到工況識別模型;然后根據(jù)其余14 口已鉆井的三開錄井?dāng)?shù)據(jù)識別接立柱工況和分析鉆井時(shí)效,從而指導(dǎo)待鉆井的施工,提高接立柱的效率。具體應(yīng)用步驟如下:
1)工況識別。利用B1 井的三開錄井?dāng)?shù)據(jù),訓(xùn)練得到最優(yōu)模型,然后使用該模型對其余14 口已鉆井的三開工況進(jìn)行識別,并統(tǒng)計(jì)接立柱作業(yè)時(shí)間。
2)時(shí)效分析。為了得到三開中接立柱的平均時(shí)間,統(tǒng)計(jì)了前15 口已鉆井的三開接立柱時(shí)間(見圖10)。由圖10 可知,10%的接立柱作業(yè)可在1.3 min 內(nèi)完成,50%的接立柱作業(yè)可在2.1 min 內(nèi)完成,90%的接立柱作業(yè)可在4.9 min 內(nèi)完成,接立柱作業(yè)的平均完成時(shí)間為2.5 min。
3)輔助決策。按照三開接立柱順序分為4 個(gè)階段,第1 階段為第1—12 根立柱,第2 階段為第13—24 根立柱,第3 階段為第25—36 根立柱,第4 階段為第37 至最后所有的立柱,前15 口井三開4 個(gè)階段的平均接立柱時(shí)間為2.5 min。
圖 10 接立柱做作業(yè)完成時(shí)間分布Fig. 10 Completion time distribution to pick up stands
將得到的模型應(yīng)用到新井中,實(shí)時(shí)判斷得到第1—12 根立柱的平均作業(yè)時(shí)間為2.7 min,大于前15 口井的時(shí)間2.5 min,此時(shí)實(shí)時(shí)監(jiān)測中心向平臺發(fā)送“作業(yè)效率有待提高”的指令,指導(dǎo)下一階段(第13—24 根立柱)作業(yè),并以此類推,完成全井段的時(shí)效分析,保證作業(yè)效率(見表2)。
表 2 不同層位接立柱時(shí)間統(tǒng)計(jì)Table 2 Time statistics for making up a stand of drill pip
4)現(xiàn)場施工應(yīng)用。將該方法應(yīng)用到6 口新鉆井的鉆井施工中(包含上面提到的新鉆井),各井三開接立柱作業(yè)的平均完成時(shí)間的變化如圖11 所示。由圖11 可以看出,每口新鉆井的平均接立柱時(shí)間穩(wěn)步下降,效率穩(wěn)步提高,實(shí)現(xiàn)了提質(zhì)增效。
1)將機(jī)器學(xué)習(xí)的SVM 方法應(yīng)用于石油工程的鉆井工況識別中,以提高鉆井效率。
2)提出一種純數(shù)據(jù)驅(qū)動的方法,并充分利用油田現(xiàn)場數(shù)據(jù),減少了傳統(tǒng)方法對人員經(jīng)驗(yàn)的依賴,提高了識別準(zhǔn)確率,縮短了工況識別所需時(shí)間。
3)利用SVM 對6 種鉆井工況進(jìn)行識別,通過優(yōu)選核函數(shù)類型、進(jìn)行交叉驗(yàn)證,逐步優(yōu)化智能識別模型,不斷提高模型識別的準(zhǔn)確率,最終將識別準(zhǔn)確率提高到了95%。
圖 11 接立柱作業(yè)平均完成時(shí)間的變化情況Fig. 11 Average completion time variation to pick up stands