趙 杰 李春華
摘 要:利用測井資料實現(xiàn)巖性識別對于儲層評價具有重要意義,采用概率神經(jīng)網(wǎng)絡(luò)(PNN)和自組織特征映射神經(jīng)網(wǎng)絡(luò)(SOM)的模式識別方法,分別建立測井巖性識別模型,并利用該模型對樣本進行預(yù)測。仿真結(jié)果表明,建立的模型用于巖性識別具有預(yù)測精度高、易收斂和自動聚類等特點,對于巖性類別的劃分是準(zhǔn)確和可靠的,為相關(guān)領(lǐng)域的研究提供了新方法。
關(guān)鍵詞:自組織特征映射神經(jīng)網(wǎng)絡(luò);概率神經(jīng)網(wǎng)絡(luò);巖性識別;預(yù)測
中圖分類號:TP183
0 引 言
巖性識別是儲層評價的重要工作之一,是求解儲層參數(shù)的基礎(chǔ)。測井在勘探中的作用和地位正在日益提高,測井參數(shù)值是地下巖石的礦物成分、結(jié)構(gòu)和孔隙度等的綜合反映,是巖性分析的基礎(chǔ)資料。對于一組特定的測井參數(shù)值,它就必然對應(yīng)著地層中的某一種或某幾種巖性。在分析巖心和測井參數(shù)對應(yīng)特征的基礎(chǔ)上,劃分巖心的巖石類型,并從各類巖石中讀取能夠代表巖樣的測井參數(shù)值,確定巖性與測井參數(shù)對應(yīng)關(guān)系。
由于井下地質(zhì)構(gòu)造的復(fù)雜性和測井參數(shù)分布的模糊性,傳統(tǒng)的數(shù)理統(tǒng)計等方法難以準(zhǔn)確地反映測井資料與地層巖性的非線性映射關(guān)系,識別精度有限,采用具有聚類功能的人工神經(jīng)網(wǎng)絡(luò)——自組織特征映射網(wǎng)絡(luò)(SOM)和概率神經(jīng)網(wǎng)絡(luò)(PNN)完成測井資料的巖性識別。采用神經(jīng)網(wǎng)絡(luò)對測井?dāng)?shù)據(jù)進行巖性識別,具有較強的自組織和自適應(yīng)性,有較高的容錯能力。
1 概率神經(jīng)網(wǎng)絡(luò)(PNN)
概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)是基于貝葉斯最小風(fēng)險準(zhǔn)則和Parzen窗的概率密度函數(shù)方法發(fā)展而來的一種并行算法,是徑向基函數(shù)模型的發(fā)展[3]。它直接考慮樣本空間的概率特性,以樣本空間的典型樣本作為隱含層的節(jié)點,其網(wǎng)絡(luò)權(quán)值是模式樣本的分布。
概率神經(jīng)網(wǎng)絡(luò)由四個結(jié)構(gòu)層組成:輸入層、樣本層、累加層和輸出層。輸入層的節(jié)點數(shù)是樣本向量的維數(shù),將所有樣本不變地傳給樣本層后,樣本層將輸入向量的各個分向量進行加權(quán)求和,然后再用一個非線性算子進行運算,非線性算子取高斯函數(shù):
式中:[WTHX]X為輸入向量;W[WTBX]為權(quán)值向量;1/R2為平滑因子。オ
然后將計算結(jié)果傳遞到累加層[5],累加層各個節(jié)點只與相應(yīng)類別的樣本節(jié)點相連,計算同類樣本輸出值的和,權(quán)值都為1。網(wǎng)絡(luò)的輸出層,即競爭層采用勝者為王的學(xué)習(xí)規(guī)則,使具有最大概率的向量的輸出為1,其他類別的向量輸出為0。這樣網(wǎng)絡(luò)就按Bayes決策[6]將輸入的向量分配到具有最大后驗概率的類別中去。
2 自組織特征映射神經(jīng)網(wǎng)絡(luò)(SOM)
自組織特征映射網(wǎng)絡(luò)(Self[CD*2]Organizing feature Map,SOM),接受外界輸入模式時,將會分為不同的對應(yīng)區(qū)域,各區(qū)域?qū)斎肽J骄哂胁煌捻憫?yīng)特征。自組織映射學(xué)習(xí)算法包含:競爭、合作和更新三個過程[7]。
(1) 在競爭過程中,確定輸出最大的神經(jīng)元為獲勝神經(jīng)元。由于神經(jīng)元的激勵函數(shù)為線性函數(shù),神經(jīng)元的最大輸出取決于其輸入u琲=∑Nj=1w﹊j獂璲,即輸入向量[WTHX]X[WTBX]=猍x1,x2,…x璑]玊和權(quán)值向量[WTHX]W[WTBX]璱=[w﹊1,w﹊2,…w﹊N猐玊,i=1,2,…,M的內(nèi)積。而該內(nèi)積在輸入向量和權(quán)值向量均為歸一化向量時,等價于輸入向量和權(quán)值向量的歐氏距離最小。所謂歐氏距離就是n維歐氏空間中向量[WTHX]Y[WTBX]=[y1,y2,…,y璑]和向量[WTHX]Z[WTBX]=[z1,z2,…,z璑]的距離,其值為∑ni=1(y璱-z璱)2。所以當(dāng)輸入向量為[WTHX]X[WTBX]且第c個神經(jīng)元獲勝,滿足條件:‖[WTHX]X[WTBX]-[WTHX]W[WTBX]璫‖=┆玬in‖[WTHX]X[WTBX]-猍WTHX]W[WTBX]璱‖(i=1,2,…,M) 。И
(2) 在合作過程中,確定獲勝神經(jīng)元的加強中心。拓?fù)溧徲虻闹行木褪窃诟偁庍^程中得到的獲勝神經(jīng)元,在鄰域范圍內(nèi)的神經(jīng)元為興奮神經(jīng)元,即加強中心。
(3) 在更新過程中,采用Hebb學(xué)習(xí)規(guī)則[8]的改變形式,對網(wǎng)絡(luò)上獲勝神經(jīng)元拓?fù)溧徲騼?nèi)的神經(jīng)元進行權(quán)值向量的更新。
自組織特征映射神經(jīng)網(wǎng)絡(luò)是一種競爭式學(xué)習(xí)網(wǎng)絡(luò),共有兩層,輸入層各神經(jīng)元通過權(quán)向量將外界信息匯集到輸出層的各神經(jīng)元。采用Kohonen算法,獲勝神經(jīng)元對其鄰近神經(jīng)元的影響是由近及遠(yuǎn),由興奮逐漸轉(zhuǎn)變?yōu)橐种?其學(xué)習(xí)算法中不僅獲勝神經(jīng)元本身要調(diào)整權(quán)向量,它周圍的神經(jīng)元在其影響下也要程度不同地調(diào)整權(quán)向量,調(diào)整力度依鄰域內(nèi)各神經(jīng)元距獲勝神經(jīng)元的遠(yuǎn)近而逐漸衰減。最后使輸出層各神經(jīng)元成為對特定模式類敏感的神經(jīng)細(xì)胞,對應(yīng)的內(nèi)星權(quán)向量成為各輸入模式類的中心向量。并且當(dāng)兩個模式類的特征接近時,代表這兩類的神經(jīng)元在位置上也接近,從而在輸出層形成能夠反映樣本模式類分布情況的有序特征圖[9]。
3 基于神經(jīng)網(wǎng)絡(luò)的巖性識別
通過對已知井段測井?dāng)?shù)據(jù)進行學(xué)習(xí),來預(yù)測同一地區(qū)其他井段的巖性。
3.1 巖性樣本
為了探討神經(jīng)網(wǎng)絡(luò)在巖性識別中的具體應(yīng)用,選擇一批測井巖性數(shù)據(jù)用于巖性識別建模工作。選擇某地區(qū)的資料進行研究,該地區(qū)屬于碳酸鹽地層,選取的樣本巖性有3種,即泥巖、砂巖和石灰?guī)r。影響巖性的重要因子有5個,補償中子空隙度CNL、補償密度曲線DEN、聲波時差DTC、自然伽瑪GR和微電阻率RT。通過對歷史資料的分析,獲得了6組樣本數(shù)據(jù)。
在各種測井工作中,由于不同的測井響應(yīng)具有各自的測量量綱,數(shù)值大小不一,差異較大,無法直接進行定量比較,因而必須對測井?dāng)?shù)據(jù)進行處理,對其歸一化,將非地質(zhì)因素校正到同一水平上。在歸一化處理后的測井響應(yīng)值是沒有量綱的,而且其數(shù)值在[0,1]范圍內(nèi)變化,消除了不同測井響應(yīng)在量綱和數(shù)量級上的差異。原始數(shù)據(jù)歸一化后的結(jié)果數(shù)據(jù)列出如表1所示。
3.2 PNN網(wǎng)絡(luò)巖性識別仿真
建立PNN網(wǎng)絡(luò),其輸入層有5個神經(jīng)元,分別對應(yīng)5個影響因子,選取的樣本有三種不同的巖性,利用二進制格式描述這三種巖性,作為目標(biāo)向量。利用下面函數(shù)創(chuàng)建PNN網(wǎng)絡(luò)用于巖性識別。
net=newpnn([WTHX]P[WTBZ],[WTHX]T[WTBZ],SPREAD);其中:[WTHX]P[WTBZ]為輸入向量;[WTHX]T[WTBZ]為目標(biāo)向量;SPREAD為分布密度。
運用建立的模型對學(xué)習(xí)樣本仿真,輸出結(jié)果如表1最后一列所示。
由表1的仿真結(jié)果可知,網(wǎng)絡(luò)成功地將巖性樣本分為三類,這與實際情況一致,并且可知第1類為泥巖,┑2類為砂巖,第3類為石灰?guī)r。接下來用一組測試樣本,檢驗?zāi)P偷奈粗獛r性的識別能力。測試樣本數(shù)據(jù)如表2所示。
運用建立的模型對上表的巖性影響因子測試樣本進行仿真,輸出結(jié)果如表2最后一列所示。仿真結(jié)果顯示該組測試樣本屬于第3類,即為石灰?guī)r,與期望輸出一致。可見,PNN網(wǎng)絡(luò)能夠正確識別未知巖性樣本。
3.3 SOM網(wǎng)絡(luò)巖性識別仿真
SOM神經(jīng)元數(shù)的選取與樣本有多少模式有關(guān)。如果神經(jīng)元數(shù)較少,對輸入樣本類別進行“粗分”,如果神經(jīng)元數(shù)較多,可將輸入樣本類別“細(xì)化”。
選取競爭層神經(jīng)元為2×3的組織結(jié)構(gòu),通過距離函數(shù)linkdist來計算距離,利用下面函數(shù)創(chuàng)建SOM網(wǎng)絡(luò),用于巖性類別的“粗分”。
由于網(wǎng)絡(luò)的初始權(quán)值相同,權(quán)向量是重合的。利用表1的學(xué)習(xí)樣本對網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練步數(shù)的大小影響網(wǎng)絡(luò)的聚類功能。不斷調(diào)整訓(xùn)練步數(shù),訓(xùn)練100次后,神經(jīng)元就可以自組織分布。網(wǎng)絡(luò)訓(xùn)練結(jié)束后權(quán)值也就固定了,以后每輸入一組新的樣本,競爭層的神經(jīng)元開始競爭,激活與之最為接近的神經(jīng)元,從而實現(xiàn)巖性自動識別。運用建立的SOM網(wǎng)絡(luò)對學(xué)習(xí)樣本和測試樣本進行仿真,聚類結(jié)果如表3所示。樣本序號類別激發(fā)神經(jīng)元索引
聚類結(jié)果表明學(xué)習(xí)樣本分為三類,序號為1,2的樣本為第1類,激活第5個神經(jīng)元;序號為3,5的樣本為第2類,激活第4個神經(jīng)元;序號為4,6的樣本為┑3類,激活第1個神經(jīng)元。而測試樣本激活第1個神經(jīng)元,屬于第3類,由學(xué)習(xí)樣本可知,為石灰?guī)r??梢?SOM網(wǎng)絡(luò)能夠準(zhǔn)確地劃分巖性類別。
將上述巖性樣本類別“細(xì)化”,或者增加更多不同類型的巖性樣本,那么應(yīng)該增加競爭層神經(jīng)元的數(shù)量。選取競爭層神經(jīng)元為3×4的組織結(jié)構(gòu),創(chuàng)建SOM網(wǎng)絡(luò),隨著神經(jīng)元個數(shù)的增加,增加訓(xùn)練次數(shù),當(dāng)訓(xùn)練1 000次時,神經(jīng)元就可以自組織分布。運用建立的SOM網(wǎng)絡(luò)對學(xué)習(xí)樣本和測試樣本進行仿真,聚類結(jié)果如表4所示。[JP]
參照樣本實際分布曲線,分析聚類結(jié)果,當(dāng)競爭層的神經(jīng)元數(shù)目較多時,幾乎每一個樣本都被劃分為┮煥?。獜膱D1可以看出,序號1和2樣本、序號3和5樣本分別在高維空間相近,而聚類后激活的相應(yīng)神經(jīng)元的位置也接近,序號4和6樣本相仿程度更高,聚類后激發(fā)了同一個神經(jīng)元1,這和實際情況是吻合的。測試樣[LL]本與序號4和6樣本極為接近,聚類后激發(fā)了同一個神經(jīng)元,即網(wǎng)絡(luò)的第1個神經(jīng)元,所以樣本屬于第4類。增加競爭層神經(jīng)元的數(shù)量,可以使巖性類別劃分更加詳細(xì),巖性識別準(zhǔn)確。
4 結(jié) 語
采用概率神經(jīng)網(wǎng)絡(luò)和自組織特征映射神經(jīng)網(wǎng)絡(luò)對巖性進行自動識別是準(zhǔn)確的。PNN網(wǎng)絡(luò)不需要訓(xùn)練,具有結(jié)構(gòu)簡單、追加樣本容易的特點,是一種具有較強容錯能力和機構(gòu)自適應(yīng)調(diào)整的網(wǎng)絡(luò),但需要預(yù)設(shè)目標(biāo)向量。SOM網(wǎng)絡(luò)具有效率高,無需監(jiān)督,能自動對輸入模式進行聚類的優(yōu)勢,但輸出層的神經(jīng)元數(shù)目多,網(wǎng)絡(luò)規(guī)模較大。仿真結(jié)果表明這兩種網(wǎng)絡(luò)用于巖性分類和識別是準(zhǔn)確和可靠的,對用于油層、煤層及其勘探等領(lǐng)域,具有重要的參考價值。
參 考 文 獻
[1]于代國,孫建孟,王煥增,等.測井識別巖性新方法[CD2]支持向量機方法[J].大慶石油地質(zhì)與開發(fā),2005,24(2):93[CD*2]95.
[2]Gao T H,Cao J Y,Zhang M L,Qi J B.Lithology Recognition during Oil Well Drilling Based on Fuzzy[CD*2]adaptive Hamming Network [A].Proceedings of the Sixth International Conference on Intelligent Systems Design and Applications[C].2006:574[CD*2]578.
[3]Specht D F.Probabilistic Neural Network and General Regression Neural Network [M].McGraw-Hill,1996.
[4]Tao Song,Mo Jamshidi,Roland R Lee,玡t al.A Novel Weighted Probabilistic Neural Network for MR Image Segmentation[A].IEEE International Conference on System,Man and Cybernetics[C].2005,3:2 501[CD*2]2 506.
[5]Han J,Kanmber M.Data Mining:Concepts and Techniques[M].San Francisco:Academic Press,2001.
[6]Chuhee Lee,Euisun Choi.Bayes Error Evaluation of the Gaussian ML Classifier[J].IEEE Trans.on Geoscience and Remote Sensing,2000,38 (3):1 471[CD*2]1 475.
[7]楊建剛.人工神經(jīng)網(wǎng)絡(luò)實用教程[M].杭州:浙江大學(xué)出版社,2001.
[JP2][8]Parag C,Pendharkar A.Data Envelopment Analysis[CD*2]based Approach for Data Preprocessing[J].IEEE Trans.on Knowledge and Data Engineering,2005,17(10):1 379[CD*2]1 388.[JP]
[9]韓力群.人工神經(jīng)網(wǎng)絡(luò)教程[M].北京:北京郵電大學(xué)出版社,2006.
[10]飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與Matlab 7實現(xiàn)[M].北京:電子工業(yè)出版社,2005.[HJ0][HJ]
作者簡介 趙 杰 女,1977年出生,黑龍江人,碩士研究生,講師。研究方向為自動化與智能控制。