李 鑫 耿玉廣 楊小平 黃少偉 張文靜 周正奇(.華北油田公司采油工程研究院,河北任丘 0655;.華北油田公司第一采油廠,河北任丘 0655)
以噸液百米舉升耗電量為目標(biāo)的大數(shù)據(jù)分析應(yīng)用
李鑫1耿玉廣1楊小平1黃少偉1張文靜1周正奇2
(1.華北油田公司采油工程研究院,河北任丘062552;2.華北油田公司第一采油廠,河北任丘062552)
應(yīng)用大數(shù)據(jù)挖掘技術(shù)可實(shí)現(xiàn)將采油工程海量數(shù)據(jù)轉(zhuǎn)化為可用于指導(dǎo)油田生產(chǎn)的意見(jiàn)。由于影響噸液百米舉升耗電量指標(biāo)的因素眾多,對(duì)于何種因素是影響區(qū)塊或單井噸液百米舉升耗電量指標(biāo)的主要因素并不十分明確,這就需要利用大數(shù)據(jù)挖掘技術(shù)來(lái)剖析各種因素對(duì)噸液百米舉升耗電量的影響。以噸液百米舉升耗電量為目標(biāo),建立了相應(yīng)的數(shù)學(xué)分析模型,基于油田生產(chǎn)數(shù)據(jù)庫(kù)的海量數(shù)據(jù),開(kāi)發(fā)了數(shù)據(jù)挖掘軟件,挖掘出影響阿爾油田機(jī)采井噸液百米舉升耗電量的數(shù)十個(gè)關(guān)聯(lián)因素,定量化泵效、沉沒(méi)度等指標(biāo)范圍,并預(yù)測(cè)了噸液百米舉升耗電量指標(biāo)的未來(lái)的變化趨勢(shì),提出了措施調(diào)整建議。編制的采油工程大數(shù)據(jù)軟件是實(shí)現(xiàn)大數(shù)據(jù)管理、數(shù)據(jù)挖掘、結(jié)果呈現(xiàn)的載體,包括系統(tǒng)管理、數(shù)據(jù)預(yù)處理、功能模塊、功能應(yīng)用、圖形報(bào)表展示、分析模型、進(jìn)程可視等功能,為用戶提供了實(shí)用的數(shù)據(jù)挖掘工具平臺(tái)。
智慧油田;大數(shù)據(jù);耗電量;數(shù)據(jù)挖掘;算法模型
當(dāng)前,大數(shù)據(jù)挖掘技術(shù)與石油工程領(lǐng)域還沒(méi)有做到充分結(jié)合,應(yīng)用也并不廣泛。有部分學(xué)者將數(shù)據(jù)挖掘技術(shù)應(yīng)用到石油工程領(lǐng)域,如G. Zangl[1]通過(guò)建立數(shù)據(jù)挖掘模型,進(jìn)一步保證了油田各項(xiàng)數(shù)據(jù)的質(zhì)量,實(shí)現(xiàn)了對(duì)油井或整個(gè)生產(chǎn)系統(tǒng)的監(jiān)視,對(duì)提高油氣田產(chǎn)量具有重要意義。隨著華北油田勘探開(kāi)發(fā)工作的不斷深入和數(shù)字油田建設(shè)的快速發(fā)展,在油氣生產(chǎn)過(guò)程中積累了海量數(shù)據(jù),為應(yīng)用大數(shù)據(jù)挖掘技術(shù)提供了堅(jiān)實(shí)的基礎(chǔ)。采用數(shù)據(jù)挖掘算法和技術(shù)能夠充分利用多專業(yè)的大數(shù)據(jù),挖掘出蘊(yùn)含在海量數(shù)據(jù)中不易發(fā)現(xiàn)的規(guī)律,在此基礎(chǔ)上綜合考慮多種因素變化,預(yù)測(cè)這些因素對(duì)未來(lái)生產(chǎn)動(dòng)態(tài)的影響。以噸液百米舉升耗電量為挖掘目標(biāo),進(jìn)行大數(shù)據(jù)分析研究,挖掘各種影響因素與噸液百米舉升耗電量之間的內(nèi)在隱蔽規(guī)律,綜合考慮多種因素對(duì)未來(lái)抽油機(jī)井系統(tǒng)效率、噸液百米舉升耗電量的影響,準(zhǔn)確采取降低噸液百米舉升耗電量的措施手段。
油氣田領(lǐng)域的應(yīng)用數(shù)據(jù)庫(kù)獨(dú)立而分散,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)并存,為了使這些數(shù)據(jù)產(chǎn)生效益,將大量的實(shí)際數(shù)據(jù)作為樣本點(diǎn),通過(guò)相應(yīng)的數(shù)學(xué)分析方法對(duì)這些樣本點(diǎn)進(jìn)行分析,得到其中的變化規(guī)律和各個(gè)樣本參數(shù)間的關(guān)聯(lián)性[2]。
數(shù)據(jù)挖掘又稱為數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含其中的、不為人們所知的、但又有潛在應(yīng)用價(jià)值的信息和知識(shí)的過(guò)程[3]。
1.1總體設(shè)計(jì)
通過(guò)建立主題數(shù)據(jù)庫(kù),從相關(guān)數(shù)據(jù)庫(kù)中獲取所需數(shù)據(jù),并配置包括灰色關(guān)聯(lián)、因素分析、聚類分析等多種數(shù)據(jù)挖掘算法,形成數(shù)據(jù)挖掘平臺(tái),對(duì)大量多維、多源數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析與預(yù)測(cè)工作,并以圖表、報(bào)表等形式進(jìn)行成果展現(xiàn),形成基于噸液百米舉升耗電量指標(biāo)的大數(shù)據(jù)挖掘系統(tǒng)應(yīng)用。如圖1所示。
圖1 數(shù)據(jù)挖掘軟件平臺(tái)系統(tǒng)總體設(shè)計(jì)
1.2數(shù)據(jù)準(zhǔn)備
噸液百米舉升耗電量指原油在開(kāi)采過(guò)程中把1 t液體從地下提升100 m所消耗的電能。
單井噸液百米舉升耗電量計(jì)算公式[4]
式中,X為單井噸液百米舉升耗電量,kW·h/(100 m·t);W為單井日耗電量,kW·h;Q為單井日產(chǎn)液量,t;H為有效揚(yáng)程,m。
在油田生產(chǎn)中涉及噸液百米舉升耗電量指標(biāo)的因素很多,已知的有:產(chǎn)液量、含水率、井液黏度、井口回壓、套壓、沉沒(méi)度、沖程、沖次,泵徑、油管直徑、泵掛深度、桿柱組合,抽油機(jī)井系統(tǒng)效率(井下效率、地面效率)、泵效,電機(jī)輸入功率、電機(jī)功率、電機(jī)負(fù)載率、抽油機(jī)平衡率等。未知的有:環(huán)境溫度、調(diào)參時(shí)機(jī)、洗井次數(shù)、清蠟周期、增注量等。而產(chǎn)液量、電機(jī)功率其數(shù)值與噸液百米舉升耗電量沒(méi)有直接的線性關(guān)系[5],所以需要通過(guò)統(tǒng)計(jì)、分析找出其相關(guān)性。
1.3挖掘算法
在數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,采用了灰色關(guān)聯(lián)方法、因素分析法和聚類分析法等多種數(shù)據(jù)挖掘算法建立挖掘模型,對(duì)大量多維、多源數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析與預(yù)測(cè)工作[6]。
1.3.1灰色關(guān)聯(lián)方法任何隨機(jī)過(guò)程都是一定范圍、一定時(shí)區(qū)變化的灰色量,其隨機(jī)過(guò)程為灰色過(guò)程。對(duì)于抽油機(jī)井噸液百米舉升耗電量,各影響因素不是確定值,而是一個(gè)變化范圍?;疑碚摲治龇椒ㄊ且环N動(dòng)態(tài)發(fā)展態(tài)勢(shì)的量化描述和比較方法[7]。亦即“灰色關(guān)聯(lián)度”,作為衡量因素間關(guān)聯(lián)程度的一種方法。
設(shè)母序列為{X0,(k)},子序列為{Xi,(k)},其中k=1,2,…,N;i =1,2,…,m。N為時(shí)間序列長(zhǎng)度,m為影響因素個(gè)數(shù)。
由于系統(tǒng)中各因素的物理意義不同,導(dǎo)致數(shù)據(jù)的量綱也不一定相同,因此在進(jìn)行灰色關(guān)聯(lián)度分析時(shí),一般都要進(jìn)行無(wú)量綱化的數(shù)據(jù)處理。
極大值法——無(wú)量綱化數(shù)據(jù)處理
則關(guān)聯(lián)系數(shù),當(dāng)t = k時(shí)
其中
式中,?ymin、?ymax為各個(gè)時(shí)刻絕對(duì)值差的最小值與最大值;ρ為分辨系數(shù)[0~1],通常取0.5。
關(guān)聯(lián)度
通過(guò)對(duì)噸液百米舉升耗電量的影響因素進(jìn)行灰色關(guān)聯(lián)分析,生產(chǎn)決策者可掌握影響噸液百米舉升耗電量指標(biāo)的最重要的影響因素排名,并根據(jù)影響程度排名有的放矢地采取相應(yīng)措施,降低噸油百米舉升耗電量,提高抽油機(jī)井生產(chǎn)管理水平。
1.3.2因素分析法因素分析法又稱連鎖置換法或連鎖替代法,是通過(guò)逐個(gè)替換因素,確定相互聯(lián)系的因素對(duì)分析指標(biāo)變動(dòng)影響程度的一種方法[8]。實(shí)時(shí)分析機(jī)采井各部分工作狀態(tài)的參數(shù)大小,建立指標(biāo)評(píng)價(jià)標(biāo)準(zhǔn),應(yīng)用模糊隸屬函數(shù)標(biāo)準(zhǔn)化方法把指標(biāo)進(jìn)行歸一化,對(duì)各個(gè)指標(biāo)進(jìn)行評(píng)價(jià)。
越大越優(yōu)型
越小越優(yōu)型
適中型
式中, OFMij為第i個(gè)因素的第j個(gè)客觀指標(biāo)的隸屬度,亦為標(biāo)準(zhǔn)化計(jì)量值;OFij為第i個(gè)因素的第j個(gè)客觀指標(biāo)的計(jì)量值;OFijmax為第i個(gè)因素的第j個(gè)客觀指標(biāo)的最大可能值;OFijmin為第i個(gè)因素的第j個(gè)客觀指標(biāo)的最小可能值; OFbe為第i個(gè)因素的第j個(gè)客觀指標(biāo)的最優(yōu)值。
單因素分析指標(biāo)級(jí)別分為好(0.75~1.0)、較好(0.5~0.75)、一般(0.25~0.5)和差(0~0.25)。通過(guò)影響因素分析法可對(duì)影響噸液百米舉升耗電量指標(biāo)的幾個(gè)因素進(jìn)行評(píng)價(jià),并與其評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行比對(duì),就可得到各影響因素的評(píng)價(jià)級(jí)別,進(jìn)而分析得到導(dǎo)致噸液百米舉升耗電量指標(biāo)低的具體原因,對(duì)抽油機(jī)井工作參數(shù)進(jìn)行調(diào)整,進(jìn)一步提高抽油機(jī)的系統(tǒng)效率,降低噸液百米舉升耗電量指標(biāo)。
1.3.3聚類分析法根據(jù)事物的特征對(duì)其進(jìn)行聚類或分類,以期發(fā)現(xiàn)規(guī)律和典型模式。這類技術(shù)是數(shù)據(jù)挖掘技術(shù)的最重要技術(shù)之一[9]。聚類分析是歸納的,不需要事先確定分類的準(zhǔn)則來(lái)分析數(shù)據(jù)對(duì)象,不考慮已知的類標(biāo)記,聚類目標(biāo)就是通過(guò)聚類算法產(chǎn)生這種標(biāo)記。
通過(guò)研究噸液百米舉升耗電量所在區(qū)塊的分布,能夠很好地根據(jù)噸液百米舉升耗電量指標(biāo)對(duì)多口抽油機(jī)井進(jìn)行分類,發(fā)現(xiàn)高耗能井的規(guī)律,從而研究各類噸液百米舉升耗電量指標(biāo)特征,并根據(jù)現(xiàn)場(chǎng)實(shí)際情況做出客觀評(píng)價(jià)。
1.4系統(tǒng)平臺(tái)
軟件平臺(tái)是實(shí)現(xiàn)數(shù)據(jù)挖掘、結(jié)果呈現(xiàn)的載體,包括分析系統(tǒng)、功能模塊、分析模型、功能應(yīng)用、進(jìn)程可視、結(jié)果展示等功能,滿足用戶選用適合的挖掘算法、定制曲線圖表等,數(shù)據(jù)挖掘軟件平臺(tái)構(gòu)成見(jiàn)圖2。
圖2 數(shù)據(jù)挖掘軟件平臺(tái)構(gòu)成示意圖
采用阿爾、岔河集油田近400萬(wàn)條油井實(shí)時(shí)生產(chǎn)數(shù)據(jù),結(jié)合抽油機(jī)井基礎(chǔ)數(shù)據(jù)、示功圖計(jì)量和系統(tǒng)效率分析數(shù)據(jù)以及當(dāng)?shù)赝跉鉁財(cái)?shù)據(jù),建立了針對(duì)噸液百米舉升耗電量挖掘任務(wù)的主題數(shù)據(jù)庫(kù),并利用配置的各種基礎(chǔ)、專業(yè)和高級(jí)挖掘算法對(duì)其進(jìn)行數(shù)據(jù)挖掘工作,從中發(fā)現(xiàn)和總結(jié)影響噸液百米舉升耗電量指標(biāo)的相關(guān)規(guī)律,提出了更加有針對(duì)性的降低噸液百米舉升耗電量指標(biāo)的措施。
2.1基礎(chǔ)挖掘?qū)嵗?/p>
通過(guò)對(duì)不同數(shù)據(jù)以曲線圖、柱狀圖、散點(diǎn)圖、餅圖和泡狀圖等形式進(jìn)行直接展示,可以對(duì)某一個(gè)參數(shù)進(jìn)行連續(xù)顯示,從中找出數(shù)據(jù)的變化規(guī)律,實(shí)現(xiàn)單口油井生產(chǎn)數(shù)據(jù)分析;也可以通過(guò)井與井間的數(shù)據(jù)對(duì)比,發(fā)現(xiàn)井間的差異,實(shí)現(xiàn)油井間的對(duì)比。以XX井在一年半的時(shí)間里噸液百米舉升耗電量的變化為例,可以發(fā)現(xiàn)噸液百米舉升耗電量隨時(shí)間是在不斷變化的,從中反映管理水平;結(jié)合井位圖直觀地展示一個(gè)區(qū)塊內(nèi)多口油井的噸液百米舉升耗電量,其中圖形越大,表明耗電量越高。
2.2專業(yè)挖掘?qū)嵗?/p>
通過(guò)分析環(huán)境溫度與噸液百米舉升耗電量關(guān)系,可以發(fā)現(xiàn),環(huán)境對(duì)噸液百米舉升耗電量有一定影響,氣溫高,噸液百米舉升耗電量低;氣溫低,噸液百米舉升耗電量高。通過(guò)分析某區(qū)塊某一時(shí)間內(nèi)全部油井的耗電量情況,可以看出大部分井都在合理區(qū),也有部分井處在潛力區(qū),通過(guò)采取適當(dāng)措施可以降低耗電量;部分井可能數(shù)據(jù)有問(wèn)題需要落實(shí),這就為下一步在哪些井上采取措施提供了方向。
2.3高級(jí)挖掘?qū)嵗?/p>
隨機(jī)選擇Ax井的16個(gè)與噸液百米舉升耗電量可能有關(guān)的因素,采用灰色關(guān)聯(lián)度分析方法,得到相關(guān)度及排序,見(jiàn)表1。從表1可以看出,Ax井沉沒(méi)度、泵效、有效功率、泵功率和日產(chǎn)液對(duì)噸液百米舉升耗電量的影響最大。該井泵效(23.62%)和日產(chǎn)液量較低(3.4 t/d),且處于下降趨勢(shì),建議該井通過(guò)調(diào)整抽汲參數(shù)提高泵效和產(chǎn)液量,進(jìn)而可降低噸液百米舉升耗電量。
表1 Ax井噸液百米舉升耗電量的影響因素排序
選取A井區(qū)某一天的所有井?dāng)?shù)據(jù),對(duì)與噸液百米舉升耗電量關(guān)聯(lián)度較高的沉沒(méi)度和系統(tǒng)效率2個(gè)因素為研究對(duì)象,先聚類歸納后再進(jìn)行平均處理得到關(guān)系曲線。圖3顯示隨沉沒(méi)度增加,噸液百米舉升耗電量先逐漸減少然后增加,而系統(tǒng)效率隨著沉沒(méi)度的增大先增大后減少。因此,A井區(qū)合理沉沒(méi)度區(qū)間應(yīng)控制在400~650 m之間。
圖3 A井區(qū)沉沒(méi)度、系統(tǒng)效率與噸液百米舉升耗電量聚類分析
(1)通過(guò)對(duì)噸液百米舉升耗電量大數(shù)據(jù)分析方法的研究應(yīng)用,為在油田各工程領(lǐng)域應(yīng)用大數(shù)據(jù)分析技術(shù)提供了很好的借鑒作用。
(2)以噸液百米舉升耗電量為分析目標(biāo),結(jié)合基礎(chǔ)、專業(yè)及高級(jí)挖掘算法庫(kù)開(kāi)展的大數(shù)據(jù)分析研究工作,為油田工程技術(shù)研究提供了一套新的數(shù)據(jù)分析方法。
(3)大數(shù)據(jù)挖掘就是通過(guò)“回頭看”,把前期大量的生產(chǎn)數(shù)據(jù),經(jīng)過(guò)分析、對(duì)比,找出產(chǎn)生問(wèn)題的原因,提出解決的辦法,達(dá)到優(yōu)化生產(chǎn)運(yùn)行參數(shù)、節(jié)能降耗的目的。
[1]ZANGL G, OBERWINKLER C P, Schlumberger. SPE annual technical conference and exhibition[R] . Houston, Texas, 26-29 September 2004.
[2]劉國(guó)民,孟祥菊,李亞,等.數(shù)據(jù)挖掘技術(shù)在油田上的應(yīng)用[J].內(nèi)蒙古石油化工,2009(16):92-96.
[3]王宏威.油田數(shù)據(jù)挖掘技術(shù)的研究與應(yīng)用[D].黑龍江大慶:大慶石油學(xué)院,2005-02.
[4]DB21/1740—2009,原油(氣)液生產(chǎn)噸液百米用電限額與計(jì)算方法[S].
[5]姜海濤.單井電量計(jì)量在節(jié)能對(duì)標(biāo)方面的應(yīng)用[J].油氣田地面工程,2013,23(9):100.
[6]檀朝東,岳晶晶,吳麗烽,等.數(shù)據(jù)挖掘技術(shù)在油藏挖掘軟件中的應(yīng)用[J].中國(guó)石油和化工,2010(10):66-67.
[7]胡永宏,賀思輝.綜合評(píng)價(jià)方法[M].北京:科學(xué)出版社,2000:129-140.
[8]龔攀,劉金蘭,張婷婷.基于因素分析法的石油企業(yè)利潤(rùn)影響因素分析[J]. 價(jià)值工程,2011(35):131-132.
[9]呂安民,林宗堅(jiān),李成名.數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的技術(shù)方法[J].測(cè)繪科學(xué),2000,25(4):37-38.
(修改稿收到日期2015-06-26)
〔編輯景暖〕
Big data analysis and application targeted at power consumption by lifting one ton of liquid to 100 m
LI Xin1, GENG Yuguang1, YANG Xiaoping1, HUANG Shaowei1, ZHANG Wenjing1, ZHOU Zhengqi2
(1. Research Institute of Oil Production Engineering, Huabei Oilfield Company, Renqiu 062552, China; 2. No.1 Oil Production Plant, Huabei Oilfield Company, Renqiu 062552, China)
The use of big data mining technology can transform the mass data of oil production engineering into ideas of guiding oilfield production. There are numerous factors which affect the power consumption indicators for lifting one ton of liquid to 100 m, so it is not quite clear which is the main factor that affect the power consumption indicators for lifting. This will need the big data mining technology to analyze the effect of various factors on power consumption indicators for lifting. With the goal of power consumption for lifting, a relevant mathematic analytic model was built, and data mining software was developed based on the mass data of oilfield production database, and tens of related factors were mined which affected the power consumption for lifting in artificially lifted wells of Al Oilfield. The target scope of pump efficiency and submergence was quantified. The future trend of power consumption indicators for lifting was predicted, and suggestions for related measures and adjustment were come up with. The developed big data software of oil production engineering was a carrier which realized big data management, data mining and result presentation, including functions like system management, data preprocessing, functional modules, function application, display of graphic report, analytic model, and progress visualization, providing a practical data mining tool platform for our customers.
intelligent oilfield; big data; power consumption; data mining; arithmetic model
TE355.5;TE19
A
1000 – 7393( 2015 ) 04 – 0076 – 04
10.13639/j.odpt.2015.04.020
華北油田公司中長(zhǎng)期重大科研項(xiàng)目“智慧油田研究與實(shí)踐——油氣田自動(dòng)化生產(chǎn)指揮系統(tǒng)及采油工程云系統(tǒng)研建”(編號(hào):2013-HB-Z1010)。
李鑫,1962年生。1984年畢業(yè)于華北石油職工大學(xué)油田自動(dòng)化專業(yè),從事油田自動(dòng)化技術(shù)研究與應(yīng)用工作,高級(jí)工程師。電話:0317-2727695。E-mail:cyy_lixin@petrochina.com.cn。
引用格式:李鑫,耿玉廣,楊小平,等.以噸液百米舉升耗電量為目標(biāo)的大數(shù)據(jù)分析應(yīng)用[J].石油鉆采工藝,2015,37(4):76-79.