王桂芳,王碩亮,許學(xué)健,雷燕,康波
(1.中國石油 吐哈油田分公司 勘探開發(fā)研究院,新疆 哈密 839009;2.中國地質(zhì)大學(xué) 能源學(xué)院,北京 100083)
KS 油田位于哈薩克斯坦南圖爾蓋盆地Aryskum坳陷Ashisai 凸起,構(gòu)造頂部發(fā)育小斷層,油藏內(nèi)部斷裂不發(fā)育[1-4]。主要目的層為白堊系和上侏羅統(tǒng),發(fā)現(xiàn)MⅠ、MⅡ、JⅠ、JⅡ、JⅢ和JⅣ共6套含油層系。儲集層物性較好,為中—高孔、中—高滲儲集層,其中白堊系儲集層平均孔隙度為28.7%,平均滲透率為2 288 mD;侏羅系儲集層平均孔隙度為23.8%,平均滲透率為625 mD。油藏原油性質(zhì)較好,具有低密度和低黏度的特點(diǎn)。該油田已進(jìn)入開發(fā)后期,含水率高達(dá)98.2%[5-8],采出程度達(dá)90.9%,多數(shù)采油井處于高含水率、低產(chǎn)油量的狀態(tài)。KS 油田儲集層砂巖強(qiáng)親水,在均質(zhì)砂巖中水驅(qū)效率很高,注入高效驅(qū)油劑后采收率提高幅度有限;在非均質(zhì)砂巖中,注入水易沿高滲層竄流,波及體積小[9]。因此,亟需開展注水井調(diào)剖,但該油田調(diào)剖堵水經(jīng)驗(yàn)欠缺,調(diào)剖堵水選井決策時的具體界限難以界定。
調(diào)剖堵水常用的選井選層方法有PI 決策[10-13]和RE 決策,對于中—高滲儲集層,PI決策中的壓力指數(shù)決策方法雖然不能保證調(diào)剖效果,但能夠指導(dǎo)調(diào)剖措施的實(shí)施,因?yàn)閴毫χ笖?shù)能反映中—高滲儲集層的滲透率,高滲通道可使?jié)B透率增大,儲集層非均質(zhì)性增強(qiáng)[14-17],但是僅通過注水井井口壓降測試數(shù)據(jù)來判斷注水井是否應(yīng)該調(diào)剖,沒有考慮采油井的生產(chǎn)狀況,不能充分體現(xiàn)油藏的整體開發(fā)規(guī)律。RE 決策的指標(biāo)選取較PI 決策更加全面,但是各指標(biāo)的界限和權(quán)重難以確定,不同類型油藏的不同開發(fā)階段對調(diào)剖選井決策的指標(biāo)界限和權(quán)重影響較大,人為干擾因素過多。
本文提出調(diào)剖選井模糊聚類方法,根據(jù)KS 油田地質(zhì)特征和生產(chǎn)特征,構(gòu)建基于多項(xiàng)式核函數(shù)、徑向基核函數(shù)和Sigmoid 核函數(shù)[18]的新型核函數(shù),提高調(diào)剖選井的樣本集識別率和檢測集識別率。將該方法應(yīng)用于KS 油田,篩選出3 口注水井調(diào)剖,都取得較好的降水增油效果。
首先,更新劃分矩陣U=[μij]:
更新聚類中心:
根據(jù)所選擇的指標(biāo)體系與最終結(jié)果的邏輯關(guān)系,確定聚類類別的物理意義和對應(yīng)措施。
從計算過程可以看出,模糊聚類分析是一個爬坡過程,以類間距離最大和類內(nèi)距離最小為準(zhǔn)則,不斷進(jìn)行迭代計算,直至得到最優(yōu)解。因此,此計算過程對距離的表達(dá)式要求很高,不同的指標(biāo)集合、不同的數(shù)據(jù)形式,所對應(yīng)的最優(yōu)距離表達(dá)式不同,目前常用5種距離表達(dá)式(表1)。
表1 模糊聚類類間最優(yōu)距離計算方法Table 1.Calculation methods of the optimal distance between fuzzy clusters
在聚類分析過程中,利用不同的距離表達(dá)式,識別出來的各類模式結(jié)果也不相同,這主要取決于目標(biāo)數(shù)據(jù)體的分布形式。例如,歐氏距離(歐幾里德距離)可以識別出圓形的數(shù)據(jù)形式,如果研究目標(biāo)是圓形的分布模式,利用歐氏距離可較準(zhǔn)確識別;若研究目標(biāo)是矩形或三角形的分布模式,則誤差較大。
以KS 油田的實(shí)際數(shù)據(jù)為基礎(chǔ),分別利用歐氏距離和曼哈坦距離公式進(jìn)行模糊聚類計算。利用歐氏距離識別出的3 個類中心坐標(biāo)分別為(1.065,0.006),(2.998,0.041),(4.940,0.018);利用曼哈坦距離識別出的3個類中心坐標(biāo)分別為(1.056,0.017),(3.102,-0.029),(4.911,0.001)。采用不同表達(dá)式計算的距離具有差異,因此明確數(shù)據(jù)的分布規(guī)律十分必要。在調(diào)剖選井決策中,如果沒有明確研究目標(biāo)的數(shù)據(jù)分布模式,在距離表達(dá)式的選取上,必然存在一定的盲目性。直接用某一種距離計算方法對油水井進(jìn)行分類,容易產(chǎn)生較大的誤差。
考慮到核函數(shù)具有將空間非線性樣本映射到高維空間呈線性分布的特征,將核函數(shù)引入模糊聚類計算,以解決油田動態(tài)數(shù)據(jù)分布特征不穩(wěn)定的問題。常用的核函數(shù)有多項(xiàng)式核函數(shù)、徑向基核函數(shù)和Sigmoid核函數(shù)(表2)。
表2 常用核函數(shù)的表達(dá)式和特征Table 2.Expressions and characteristics of commonly used kernel functions
由于以上核函數(shù)均存在一定不足,本文將以上3種核函數(shù)進(jìn)行多元線性組合,構(gòu)建了一種新型核函數(shù)。新型核函數(shù)中存在n1、n2和n3共3個待定系數(shù),代表3種核函數(shù)對新型核函數(shù)的影響程度,可通過模糊聚類學(xué)習(xí)樣本進(jìn)行機(jī)器學(xué)習(xí)和訓(xùn)練時確定具體數(shù)值。構(gòu)建的新型核函數(shù)為:
由于KS 油田調(diào)剖樣品數(shù)量較少,選用與KS 油田相鄰的KN 油田的調(diào)剖堵水?dāng)?shù)據(jù),作為學(xué)習(xí)和檢測的樣本。KN 油田累計實(shí)施調(diào)剖堵水達(dá)100 余井次,將調(diào)剖后增油量超過300 t 的單井作為急需調(diào)剖的學(xué)習(xí)樣本;將調(diào)剖后見效但增油量小于300 t 的單井作為密切觀察的學(xué)習(xí)樣本;將無需調(diào)剖的單井作為正常生產(chǎn)的學(xué)習(xí)樣本,分別采用多項(xiàng)式核函數(shù)、徑向基核函數(shù)、Sigmoid 核函數(shù)和本文構(gòu)建的新型核函數(shù)進(jìn)行學(xué)習(xí)和驗(yàn)證。由計算結(jié)果可知,新型核函數(shù)的樣本集識別率和檢測集識別率比其他幾種核函數(shù)更高(表3),說明新型核函數(shù)對于調(diào)剖堵水選井決策指標(biāo)體系的數(shù)據(jù)具有較好的學(xué)習(xí)和預(yù)測能力。因此,選用新型核函數(shù)對KS油田的基礎(chǔ)數(shù)據(jù)進(jìn)行空間轉(zhuǎn)換。
表3 各類核函數(shù)樣本識別結(jié)果Table 3.Recognition results of various kernel function samples
根據(jù)KS 油田的生產(chǎn)特點(diǎn),確定了注水井調(diào)剖模糊聚類方法的指標(biāo)體系選取原則:①數(shù)據(jù)多,模糊聚類方法對具有一定規(guī)模和分布規(guī)律的數(shù)據(jù)有較好的識別效果;②時間長,能夠反映長期高強(qiáng)度注水開發(fā)后儲集層孔隙結(jié)構(gòu)的變化;③成本低,要求決策過程費(fèi)用低、周期短、不影響生產(chǎn);④時效性好,要求指標(biāo)體系能夠較準(zhǔn)確反映目前實(shí)際生產(chǎn)狀況和變化趨勢;⑤獨(dú)立性強(qiáng),指標(biāo)體系之間不能存在共軛性。根據(jù)以上原則,最終確定了4 個靜態(tài)指標(biāo)(有效厚度、滲透率、滲透率突進(jìn)系數(shù)、滲透率變異系數(shù))、4個注水井指標(biāo)(日注水量、注水油壓、視吸水指數(shù)、單位厚度累計注水量)、4 個采油井指標(biāo)(日產(chǎn)液量變化率、含水率、視產(chǎn)液指數(shù)變化率、單位厚度累計產(chǎn)液量)和2 個井間指標(biāo)(油水井關(guān)聯(lián)性、關(guān)聯(lián)性變化率)。該指標(biāo)體系的數(shù)值越大,越需要調(diào)剖,因此,類中心數(shù)值最大的一類對應(yīng)的選井決策結(jié)果是急需調(diào)剖[19-20],類中心數(shù)值最小的一類對應(yīng)的選井決策結(jié)果是正常生產(chǎn)。
本文提出的基于新型核函數(shù)的調(diào)剖選井模糊聚類方法主要包括4 個步驟,分別是數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)特征降維、聚類計算和歸類分析。
(1)數(shù)據(jù)標(biāo)準(zhǔn)化 為了使影響資料質(zhì)量的各種系統(tǒng)誤差降到最低,需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。假設(shè)由原始數(shù)據(jù)構(gòu)成的矩陣經(jīng)標(biāo)準(zhǔn)化后形成矩陣Sj為第j個變量的標(biāo)準(zhǔn)差。相關(guān)公式如下:
(2)數(shù)據(jù)特征降維 由于單井描述特征較多,數(shù)據(jù)可讀性差,特征多重共線性嚴(yán)重,算法的搜索難度大,計算成本高,需要將數(shù)據(jù)進(jìn)行特征降維,將高維模型投影到低維模型上。假設(shè)Rn為某個數(shù)據(jù)集,可得一組有序的正交基向量,對任意X∈Rn,降維之后的向量可表示為:
(3)聚類計算 基于新型核函數(shù)的模糊聚類算法,可以根據(jù)實(shí)際情況,產(chǎn)生最合適的類的數(shù)目,半徑和最小密度閾值均為全局參數(shù)。
(4)歸類分析 基于新型核函數(shù)的模糊聚類算法可以根據(jù)實(shí)際情況產(chǎn)生最佳分類數(shù),可以通過調(diào)試最小密度閾值得到規(guī)定分類數(shù)。
對KS 油田22 口注水井進(jìn)行模糊聚類計算,結(jié)果表明,急需調(diào)剖的井有3 口,密切觀察和正常生產(chǎn)的井分別為13口和6口(表4)。
表4 KS油田注水井調(diào)剖選井結(jié)果Table 4.Results of water injection well selection for profile control in KS oilfield
對這3 口注水井實(shí)施調(diào)剖,均取得了較好的降水增油效果(表5)。從采油井2717 井的生產(chǎn)曲線可以看出,注水井2716井調(diào)剖后,對應(yīng)采油井2717井含水率明顯下降,產(chǎn)油量顯著上升,表明注水井調(diào)剖選井工作較為成功(圖1)。
表5 KS油田典型注水井調(diào)剖效果統(tǒng)計Table 5.Statistics of profile control effects for typical water injection wells in KS oilfield
(1)針對KS油田的地質(zhì)和生產(chǎn)特點(diǎn),對傳統(tǒng)的調(diào)剖注水井選井決策方法進(jìn)行了改進(jìn),采用多元線性組合的方式構(gòu)建了一種新型核函數(shù),建立了新型的模糊聚類算法,選擇需要調(diào)剖的井,能夠達(dá)到較高的擬合精度和預(yù)測精度。
(2)新型注水井調(diào)剖選井決策方法應(yīng)用于KS油田,從22口注水井中優(yōu)選出3口進(jìn)行調(diào)剖,取得了較好的增油降水效果。
符 號 注 釋
A——協(xié)方差矩陣;
b——聚類中心迭代次數(shù);
c,v——Sigmoid核函數(shù)參數(shù);
d——距離,m;
g——加權(quán)指數(shù);
h——樣本數(shù)最大值;
i,j——元素序號;
k——樣品指標(biāo)數(shù);
K(xi,xj)——核函數(shù);
m,n——i,j的最大值;
n1、n2、n3——待定系數(shù);
p——樣品指標(biāo)數(shù)最大值;
q——階數(shù);
Rn——數(shù)據(jù)集;
Sj——第j個變量的標(biāo)準(zhǔn)差;
U——矩陣;
vi——行聚類中心;
vk——列聚類中心;
Vb——第b個聚類中心;
Vb+1——第b+1個聚類中心;
x′——標(biāo)準(zhǔn)化矩陣;
xi——第i行數(shù)據(jù);
xik——第i行第k列數(shù)據(jù);
xij——第i行第j列數(shù)據(jù);
——標(biāo)準(zhǔn)化矩陣第i行第j列數(shù)據(jù);
xj——第j列數(shù)據(jù);
xjk——第j行第k列數(shù)據(jù);
X——降維后向量;
yn——降維前第n個向量;
ε——模糊聚類精度要求;
μij——模糊聚類劃分矩陣;
σ——函數(shù)寬度參數(shù);
φi——第i個正交基向量;
φn——第n個正交基向量。