盧異,胡浩 ,成亞斌,夏國(guó)朝,任光文
1.中國(guó)石油大港油田勘探開(kāi)發(fā)研究院,天津?yàn)I海新區(qū)300280
2.中海福陸重工有限公司,廣東珠海519090
3.中國(guó)石油大港油田公司資源評(píng)價(jià)處,天津?yàn)I海新區(qū)300280
隨著數(shù)值模擬理論的不斷完善以及計(jì)算機(jī)技術(shù)的快速發(fā)展,油氣藏?cái)?shù)值模擬逐漸由人工歷史擬合向自動(dòng)歷史擬合發(fā)展[1-7],由傳統(tǒng)的單模型預(yù)測(cè)向多模型預(yù)測(cè)改進(jìn)[8-11]。多模型自動(dòng)歷史擬合主要分為兩個(gè)部分:多初始模型的建立與挑選以及多模型的自動(dòng)歷史擬合。由于所建立的地質(zhì)模型即使經(jīng)過(guò)歷史擬合,也僅能說(shuō)明模型計(jì)算結(jié)果和已知的歷史動(dòng)態(tài)基本一致,無(wú)法保證能反映地下儲(chǔ)層的真實(shí)分布,同時(shí)也無(wú)法保證對(duì)未來(lái)的預(yù)測(cè)準(zhǔn)確。而采用多個(gè)特征各異卻又符合歷史動(dòng)態(tài)的模型同時(shí)進(jìn)行預(yù)測(cè),提供一個(gè)未來(lái)生產(chǎn)情況的參考區(qū)間而非參考值,將更能夠降低開(kāi)發(fā)風(fēng)險(xiǎn)。
實(shí)際油藏建模中,即使經(jīng)過(guò)粗化,大型油藏模型的網(wǎng)格數(shù)量仍可達(dá)數(shù)十萬(wàn)以上,數(shù)據(jù)量龐大,導(dǎo)致模型后期處理以及自動(dòng)歷史擬合效率低下,因此,需要對(duì)模型數(shù)據(jù)進(jìn)行降維[12-14]。主成分分析(Principal Component Analysis,PCA)[15]是由Hotelling[16]提出的數(shù)據(jù)降維方法,通過(guò)對(duì)原始變量的相關(guān)矩陣或協(xié)方差矩陣結(jié)構(gòu)的研究,將多個(gè)隨機(jī)變量轉(zhuǎn)換為少數(shù)幾個(gè)新的隨機(jī)變量(同時(shí)保留原始變量絕大部分特征信息),從而達(dá)到降維目的。
設(shè)隨機(jī)實(shí)現(xiàn)樣本為M={m1,m2,···,mNr},其中,mi表示第i個(gè)實(shí)現(xiàn)的參數(shù)向量,Nr則是實(shí)現(xiàn)個(gè)數(shù)。
根據(jù)最優(yōu)重建準(zhǔn)則,PCA 目標(biāo)函數(shù)為
式中:
降維矩陣和原始參數(shù)向量相乘可將模型的參數(shù)向量由Nm維轉(zhuǎn)化為n維(通常Nm?n),樣本矩陣M和單個(gè)實(shí)現(xiàn)數(shù)據(jù)向量m的降維可由式(4)計(jì)算
式中:
多個(gè)地質(zhì)模型經(jīng)過(guò)聚類(lèi),將屬性相近的地質(zhì)模型歸并成一類(lèi),可以減少用于歷史擬合的模型數(shù)量,本次采用K 中心點(diǎn)聚類(lèi)方法進(jìn)行聚類(lèi)[17],主要原理如下:
設(shè)數(shù)據(jù)集合X中有f條a維數(shù)據(jù),每條數(shù)據(jù)xq為一個(gè)對(duì)象。當(dāng)e個(gè)初始中心點(diǎn)對(duì)象隨機(jī)或按照一定依據(jù)選定后,將剩余的f?e個(gè)非中心點(diǎn)劃分為e個(gè)組,分組的規(guī)則是將非中心點(diǎn)對(duì)象化歸到離它最近的中心點(diǎn)。準(zhǔn)確地說(shuō):如果Oq是一個(gè)非代表對(duì)象,Ow是一個(gè)代表對(duì)象(中心點(diǎn)),并且Oq與Ow的距離d(Oq,Ow)是Oq與所有中心點(diǎn)距離最近的,則稱(chēng)Oq屬于Ow所代表的簇。兩個(gè)對(duì)象的距離為
式(5)表示的是曼哈頓距離,根據(jù)不同情況可以選擇歐氏距離等其他形式的距離。
初始中心點(diǎn)確定并劃分好簇后,隨后每一步隨機(jī)使用一個(gè)非中心點(diǎn)對(duì)象Or替換現(xiàn)有中心點(diǎn)對(duì)象Ow,提高聚類(lèi)質(zhì)量。為了確保中心點(diǎn)Ow能夠被Or很好地替代,在每一次替換時(shí)需要考慮4種情況。
對(duì)于所有f?e個(gè)非代表對(duì)象Oq,一次替代所造成的總代價(jià)為
式中:
若Ct小于0,則認(rèn)為本次替換可以提高聚類(lèi)質(zhì)量,認(rèn)可本次替換,反之則拒絕替換。
常規(guī)K 中心點(diǎn)聚類(lèi)時(shí)間復(fù)雜度很高,最多需要e(f?e)2次計(jì)算判斷,尤其對(duì)初始中心點(diǎn)的選擇異常敏感?;陬I(lǐng)域的K 中心點(diǎn)算法[18]通過(guò)對(duì)中心點(diǎn)設(shè)定鄰域半徑,選取相互距離較遠(yuǎn)的e個(gè)處于樣本分布密集區(qū)域的數(shù)據(jù)作為K 中心點(diǎn)算法的初始聚類(lèi)中心,即可以在初期找到佳中心點(diǎn)或到達(dá)最佳中心點(diǎn)附近,減少中心點(diǎn)替換次數(shù),又能避免初始中心點(diǎn)處于同一簇造成重復(fù)計(jì)算。
數(shù)據(jù)對(duì)象的鄰域半徑R定義為
對(duì)于任意數(shù)據(jù)對(duì)象xw,以xw為中心,半徑為R的圓形區(qū)域內(nèi)的數(shù)據(jù)對(duì)象稱(chēng)為數(shù)據(jù)對(duì)象xw的鄰域,用δw表示。
在鄰域的限制下,K 中心點(diǎn)聚類(lèi)效率得到顯著提高。
在自動(dòng)歷史擬合研究中,需要將參數(shù)表示為向量的形式。如同時(shí)對(duì)孔隙度、滲透率、飽和度、相對(duì)滲透率和水體參數(shù)進(jìn)行調(diào)整,則油藏參數(shù)組成的控制變量h可表示為
為了得到統(tǒng)一的歷史數(shù)據(jù)格式,即每項(xiàng)數(shù)據(jù)在每個(gè)時(shí)間點(diǎn)都有數(shù)值,對(duì)應(yīng)時(shí)間步測(cè)量則為測(cè)量值,沒(méi)有測(cè)量也必須填寫(xiě)任意值,通常為0。
近年來(lái),基于貝葉斯理論目標(biāo)函數(shù)[11]被廣泛用于自動(dòng)歷史擬合領(lǐng)域,不僅可以考慮動(dòng)態(tài)歷史和模型響應(yīng)之間的偏差,同時(shí)可以充分利用隨機(jī)實(shí)現(xiàn)中的先驗(yàn)信息,使得擬合后的模型更為符合實(shí)際地質(zhì)統(tǒng)計(jì)規(guī)律。
目標(biāo)函數(shù)的表達(dá)式為
將式(5)代入式(10),通過(guò)PCA 進(jìn)行變換可得模型降維后目標(biāo)函數(shù)式(11),可有效減少求解的計(jì)算量。
SPSA 算法[19]可以一次同時(shí)擾動(dòng)所有控制變量,每次迭代僅需擾動(dòng)兩次即可求取隨機(jī)梯度,隨機(jī)梯度的期望為真實(shí)梯度,且恒為上山方向,在解決多變量的歷史擬合問(wèn)題時(shí),效率高且收斂速度快。
本次在SPSA 算法的基礎(chǔ)上,為了使隨機(jī)梯度更接近真實(shí)梯度,提高算法穩(wěn)定性,采用在每個(gè)迭代步中求取多個(gè)隨機(jī)梯度,以其均值作為搜索方式
目前普遍認(rèn)可實(shí)際油藏相鄰網(wǎng)格的參數(shù)存在一定的相關(guān)性,參數(shù)場(chǎng)中相鄰網(wǎng)格之間為漸變關(guān)系,引入控制變量協(xié)方差矩陣來(lái)指導(dǎo)生成擾動(dòng)向量[20-21]
多模型歷史擬合完整流程如圖1所示,主要包括5個(gè)步驟。
圖1 多模型歷史擬合完整流程Fig.1 Process of multi-model history matching
(1)整理靜態(tài)地質(zhì)資料和動(dòng)態(tài)觀測(cè)數(shù)據(jù),依據(jù)靜態(tài)資料使用隨機(jī)模擬建立多個(gè)實(shí)現(xiàn);
(2)使用PCA 算法對(duì)模型數(shù)據(jù)進(jìn)行降維;
(3)使用改進(jìn)的K 中心點(diǎn)聚類(lèi)算法挑選指定數(shù)量的隨機(jī)實(shí)現(xiàn)作為初始模型;
(4)設(shè)定SPSA 算法參數(shù),對(duì)所有初始模型進(jìn)行自動(dòng)歷史擬合;
(5)使用擬合后的模型進(jìn)行動(dòng)態(tài)預(yù)測(cè),評(píng)價(jià)開(kāi)發(fā)不確定性。
以反五點(diǎn)井網(wǎng)模型為例,工區(qū)面積為1000m×1000m,網(wǎng)格劃分為25×25×1=625個(gè),網(wǎng)格尺寸為40 m×40m×20m,包含1口注水井(I)和4口采油井(A、B、C 和D 井)。研究區(qū)儲(chǔ)層參數(shù)如表1 所示,5口井的物性參數(shù)見(jiàn)表2。
表1 儲(chǔ)層參數(shù)Tab.1Properties of reservoir
表2 井的物性參數(shù)Tab.2 Physical properties of five wells
依據(jù)5口井的地質(zhì)資料,使用序貫高斯模擬隨機(jī)生成701組孔隙度、滲透率和凈毛比的模型。選擇其中一組作為參考模型,將其進(jìn)行數(shù)值模擬運(yùn)算后的生產(chǎn)數(shù)據(jù)作為油藏歷史數(shù)據(jù)。
圖2為參考模型的孔隙度、滲透率及凈毛比的空間分布。該模型共模擬7200d,前6000d 作為歷史數(shù)據(jù),用于歷史擬合,將后1200d 假設(shè)為未來(lái)真實(shí)動(dòng)態(tài),用于和經(jīng)歷史擬合確定后的模型參數(shù)預(yù)測(cè)結(jié)果做對(duì)比,分析預(yù)測(cè)的不確定性。
模型中的4口采油井采用定液量的方式生產(chǎn),產(chǎn)油量變化如圖3所示。從圖3中可以看出,4口井的穩(wěn)產(chǎn)時(shí)間不同,D 井的穩(wěn)產(chǎn)時(shí)間最長(zhǎng)、B 井的穩(wěn)產(chǎn)時(shí)間最短。
圖3 參考模型生產(chǎn)井產(chǎn)油量曲線Fig.3 Oil productionrate of four production wellssimulated by reference geologic model
使用PCA 算法對(duì)700個(gè)隨機(jī)實(shí)現(xiàn)進(jìn)行降維,每個(gè)實(shí)現(xiàn)包含孔隙度、滲透率和凈毛比3類(lèi)共625×3=1875個(gè)數(shù)據(jù),經(jīng)降維計(jì)算,前221個(gè)主成分即可表達(dá)原始數(shù)據(jù)90%以上的特征信息。由此每個(gè)實(shí)現(xiàn)的參數(shù)數(shù)據(jù)可由1875維降至221維。主成分?jǐn)?shù)據(jù)對(duì)總樣本數(shù)據(jù)的特征貢獻(xiàn)率如圖4所示。降維后的模型數(shù)據(jù)量大大減少,可以明顯減少聚類(lèi)計(jì)算量以及擬合階段需要調(diào)整的參數(shù)數(shù)量。
圖4 主成分特征貢獻(xiàn)率Fig.4 Contribution rateof principal component
使用改進(jìn)的K 中心點(diǎn)聚類(lèi)算法,在降維后的數(shù)據(jù)中挑選出5個(gè)實(shí)現(xiàn)作為初始模型,初始模型的滲透率分布如圖5所示,觀察可知,5個(gè)初始模型的滲透率分布具有明顯差別,各初始模型能很好地代表一類(lèi)實(shí)現(xiàn),能夠更廣泛地包含儲(chǔ)層物性的分布。
圖55 個(gè)初始模型的滲透率參數(shù)場(chǎng)Fig.5 Permeability distributionof five initial models
本例中僅考慮孔隙度、滲透率和凈毛比3類(lèi)變量對(duì)歷史擬合的影響;經(jīng)敏感性分析,發(fā)現(xiàn)滲透率對(duì)擬合效果產(chǎn)生較大影響,孔隙度和凈毛比影響可以忽略,且自動(dòng)歷史擬合迭代超過(guò)30次后,目標(biāo)函數(shù)已趨于收斂。
將滲透率作為擬合參數(shù),設(shè)定最大擾動(dòng)次數(shù)為30次。其余參數(shù)設(shè)置為:隨機(jī)梯度個(gè)數(shù)為3,增益系數(shù)為10(增益系數(shù)是期望迭代次數(shù)的1/10或者更少),初始擾動(dòng)幅度為0.6,初始搜索步長(zhǎng)為0.3。歷史擬合后的模型滲透率分布如圖6所示,生產(chǎn)井A歷史擬合前后的產(chǎn)油量對(duì)比見(jiàn)圖7。
圖6 擬合后的滲透率模型Fig.6 Permeability distribution after history matching
圖7 不同初始模型下A 井產(chǎn)油量對(duì)比Fig.7 Contrast of oil productionrate of Well A simulated by five initial geologic models
由圖7可以看出,A 井經(jīng)過(guò)生產(chǎn)歷史擬合后,5個(gè)模型的產(chǎn)油量與歷史數(shù)據(jù)的符合率顯著提高,表明擬合效果較好。同時(shí),從圖6可以看出,盡管各模型的滲透率分布存在差異,但都能獲得相似的生產(chǎn)歷史擬合效果,這也反映出生產(chǎn)歷史擬合存在多解性,即多個(gè)地質(zhì)模型的分布可以達(dá)到較為相似的生產(chǎn)效果。
另外,從A 井6 000~7 200 d 的生產(chǎn)預(yù)測(cè)結(jié)果可以看出,使用任何一個(gè)經(jīng)歷史擬合后的模型預(yù)測(cè)A井的未來(lái)產(chǎn)量,都與A 井真實(shí)產(chǎn)量存在一定差異,但A 井的真實(shí)產(chǎn)量包含在5個(gè)模型預(yù)測(cè)的產(chǎn)量范圍內(nèi)(圖7)。這表明,使用單一模型預(yù)測(cè)的生產(chǎn)效果不佳,而采用多個(gè)模型預(yù)測(cè)的生產(chǎn)效果接近真實(shí)情況,因此,在今后的油藏?cái)?shù)值模擬中,有必要采用多個(gè)模型進(jìn)行生產(chǎn)效果預(yù)測(cè)。
(1)地質(zhì)模型經(jīng)過(guò)PCA 降維,可以保留地質(zhì)模型中大部分特征的信息,并大大降低參數(shù)維度,減少聚類(lèi)計(jì)算量,提高擬合效率。
(2)提出了利用改進(jìn)K 中心點(diǎn)聚類(lèi)方法為基礎(chǔ)的初始模型挑選方法,使挑選出的模型具有很好的代表性,更廣泛地反映儲(chǔ)層的可能分布狀況。
(3)在自動(dòng)歷史擬合中將基于貝葉斯理論的目標(biāo)函數(shù)和PCA 算法相結(jié)合,提高了目標(biāo)函數(shù)的計(jì)算效率。
(4)以理想反五點(diǎn)井網(wǎng)模型為研究對(duì)象,進(jìn)行模型降維、聚類(lèi)挑選及自動(dòng)歷史擬合的完整流程,驗(yàn)證了多模型自動(dòng)歷史擬合的可行性,實(shí)例中的整體動(dòng)態(tài)數(shù)據(jù)的匹配度有明顯提高,效果顯著。