楊玲
摘 要: 地層劃分是一個(gè)復(fù)雜的非線性系統(tǒng),根據(jù)地層結(jié)構(gòu),本文提出了一種基于SVM(支持向量機(jī))的劃分方法。該方法利用同一區(qū)域地質(zhì)結(jié)構(gòu)相似、地質(zhì)結(jié)構(gòu)有序連續(xù)的特征,使用有序?qū)W習(xí)多分類模型,以高斯核函數(shù)為核函數(shù),建立了地層自動(dòng)分層模型,最終得到樣本空間的分類結(jié)果。實(shí)驗(yàn)結(jié)果表明,按照所提方法訓(xùn)練出的SVM可以很好地劃分同一區(qū)域內(nèi)其他井的地層,有效地提高地層劃分的效率。
關(guān)鍵詞: 地層劃分;SVM;高斯核函數(shù)
0 引言
地層劃分的目的是把地層由上至下切割成不同的片段,劃分出不同等級的地層單位,即把一個(gè)地區(qū)的地層進(jìn)行縱向劃分,以便與地質(zhì)單層相對應(yīng)。目前采用的方法主要有人工解釋方法,數(shù)理統(tǒng)計(jì)方法和人工智能方法。
人工解釋的方法對測井曲線進(jìn)行分層,該方法不僅費(fèi)時(shí)費(fèi)力,而且分層取值過程中受測井分析人員的經(jīng)驗(yàn)知識和熟練程度影響較大,主觀性較強(qiáng);數(shù)理統(tǒng)計(jì)方法能夠保持巖層內(nèi)部的均一性,但計(jì)算量比較大,同時(shí)對測井信息和地質(zhì)信息的一一對應(yīng)有很高的要求,如果達(dá)不到(事實(shí)上也無法完全做到一一對應(yīng)),則分層結(jié)果不易達(dá)到地質(zhì)應(yīng)用的要求。人工智能是一種現(xiàn)代化方法,主要有神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)等,其具有較好地學(xué)習(xí)和自適應(yīng)能力,但在地質(zhì)分層應(yīng)用中目前仍處于探索階段。
本文采用SVM機(jī)器學(xué)習(xí)方法對測井曲線進(jìn)行地層劃分,以同一區(qū)域已有的分層井?dāng)?shù)據(jù)變化特點(diǎn)為切入點(diǎn),結(jié)合每口井測井曲線數(shù)據(jù)以及代表地層特性測井曲線數(shù)據(jù)的變化特點(diǎn),建立合理的數(shù)學(xué)模型,實(shí)現(xiàn)自動(dòng)分層。實(shí)踐證明,根據(jù)實(shí)際問題合理選擇二類分類模型和核函數(shù),SVM方法對于測井曲線劃分是行之有效的。
1 SVM簡介
SVM方法是建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的機(jī)器學(xué)習(xí)方法,其目的在于尋找一個(gè)超平面H(d),該超平面可以將訓(xùn)練集中的數(shù)據(jù)分開,且與類域邊界的沿垂直于該超平面方向的距離最大,故SVM法亦被稱為最大邊緣(Maximum Margin)算法。通過學(xué)習(xí)算法,SVM可以自動(dòng)尋找出那些對分類有較好區(qū)分能力的支持向量,構(gòu)造出的分類器可以最大化識別類與類的間隔,因而有較好的適應(yīng)能力和較高的分準(zhǔn)率。目前,構(gòu)造SVM多類分類器的方法主要有兩類:一類是直接法,直接在目標(biāo)函數(shù)上進(jìn)行修改,將多個(gè)分類面的參數(shù)求解合并到一個(gè)最優(yōu)化問題中,通過求解該最優(yōu)化問題“一次性”實(shí)現(xiàn)多類分類。這種方法看似簡單,但其計(jì)算復(fù)雜度比較高,實(shí)現(xiàn)起來比較困難,只適合用于小型問題;另一類是間接法,主要是通過組合多個(gè)二分類器來實(shí)現(xiàn)多分類器的構(gòu)造,常見的方法有一對多法和一對一法兩種。不同的構(gòu)造方法訓(xùn)練時(shí)需要的分類器個(gè)數(shù)不同,實(shí)際應(yīng)用時(shí),可根據(jù)問題背景選擇合適的分類方法。
2 SVM測井曲線分層
測井曲線分層是通過多條測井曲線數(shù)據(jù)對地層進(jìn)行劃分的過程,由于地層具有連續(xù)性且在同一區(qū)域內(nèi)地質(zhì)特征相似,而對某采樣點(diǎn)進(jìn)行分類時(shí),其只可能屬于兩個(gè)連續(xù)地層中的某一層,因此測井曲線分層可以歸為有序多分類問題。
2.1 設(shè)計(jì)多類分類模型
對測井曲線分層,采用優(yōu)化的一對一的方法,將多類問題轉(zhuǎn)化為二類問題。按照地層順序,建立N-1個(gè)相鄰地層的二類模型。
已知測井曲線數(shù)據(jù)X={Xij}r×s,r為樣本個(gè)數(shù);地層分類L={li}n×1,N為地層個(gè)數(shù)。將X按照已知的分層結(jié)果分為N個(gè)子集:Xl,l=1,2,...,N,按照順序依次建立Xl和Xl+1的二類模型。
2.2 分層模型
對測井曲線分層,重點(diǎn)是尋找地層分層界面。但是由于地質(zhì)的隨機(jī)性、復(fù)雜性和不可預(yù)見性,單獨(dú)一個(gè)或幾個(gè)采樣點(diǎn)并不能代表某一連續(xù)區(qū)域的地質(zhì)特征。因此,需在一定區(qū)域內(nèi)多達(dá)幾十個(gè)、甚至幾百個(gè)的連續(xù)采樣點(diǎn)的二分類基礎(chǔ)上做進(jìn)一步分析。尋找出分類結(jié)果的分類面從而確定出地層的分界面。
假設(shè)已知連續(xù)樣本集X={xij}m*s,為l和l+1層的樣本點(diǎn),其中m為樣本個(gè)數(shù);l和l+1的分界樣本點(diǎn)為Xt,t∈{1,2,...,m}。
由二類模型的決策函數(shù)f(X)=sgn(g(X)),可以計(jì)算得到Y(jié)={yi}m*1,其中Yi∈{+1,-1}。假設(shè)Xt為兩類分類面,由于二類分類問題存在錯(cuò)判的情況,只能保證Y={yi},y=1,2,...,t中大部分應(yīng)該為+1,而Yl+1={yi},i=t,t+i,...,m中大部分應(yīng)該為-1。此時(shí),為了得到分界點(diǎn)Xt,需要求解如下模型:
但是根據(jù)上述假設(shè),需要確定樣本集X可以被分為兩類,因此可以增加約束條件:
其中C∈{0,1,...m/4}為兩類樣本個(gè)數(shù)的差值的閥值,根據(jù)樣本個(gè)數(shù)可以適當(dāng)選擇數(shù)值。
2.3 曲線分層
由于每次只能對連續(xù)兩層的樣本數(shù)據(jù)進(jìn)行分類,因此采用循環(huán)步進(jìn)的方式實(shí)現(xiàn)分層,流程如圖1所示。
每次從樣本集中選擇連續(xù)的t個(gè)樣本點(diǎn),根據(jù) l 和 l+1 層的學(xué)習(xí)結(jié)果進(jìn)行分類,則可能有三種結(jié)果:第一種大部分為 l 層,則向前步進(jìn)選取新的 t 個(gè)樣本點(diǎn);第二種大部分為 l+1 層,則退回上層分層線重新選取新的 t 個(gè)樣本點(diǎn),并更新l=l+1;第三種兩層點(diǎn)比較均衡,此時(shí)通過分層模型確定分層界面。循環(huán)上述步驟,直到分層結(jié)束。
3. 結(jié)果比較與分析
首先對樣本井進(jìn)行學(xué)習(xí)并對其進(jìn)行自動(dòng)分層,然后根據(jù)樣本井的學(xué)習(xí)結(jié)果對 B-D 號井進(jìn)行自動(dòng)分層,人工與自動(dòng)分層結(jié)果比較如表4-1.
表 4-1 B-D 號井分層結(jié)果比較
由實(shí)驗(yàn)結(jié)果可知,與人工解釋方法相比,SVM應(yīng)用于測井曲線自動(dòng)分層效果良好,在測井?dāng)?shù)據(jù)較少的情況下也可以很好的實(shí)現(xiàn)分層,大大提高了工作效率,并減少了人為主觀性及經(jīng)驗(yàn)性對分層結(jié)果的影響。
參考文獻(xiàn)
[1] Hsu C W, Lin C J. A comparison of methods for multi-class support vector machines. IEEE Transactions on Neural Networks. 2002.