鄧浩 劉靖
摘 要:目前的礦產(chǎn)資源預測與評價方法在如何融合多維、多元地質(zhì)信息方面缺乏更深層次的研究。本文在在已有模型和技術的基礎上,提出了采用貝葉斯網(wǎng)絡模型進行成礦預測的方法。貝葉斯統(tǒng)計不同于一般的統(tǒng)計方法,其不僅利用模型信息和數(shù)據(jù)信息,而且充分利用先驗信息。本文以新疆阿希金礦為研究區(qū),利用貝葉斯網(wǎng)學習學習成礦因素和金品位間的關系,計算未知區(qū)的金品位的后驗概率。并使用該貝葉斯網(wǎng)對未知區(qū)金品位進行預測。
關鍵詞:貝葉斯網(wǎng) 阿西礦區(qū) 隱伏礦體預測
1 引 言
阿希金礦床是20世紀80年代末于新疆西天山地區(qū)發(fā)現(xiàn)的低硫型淺成低溫熱液金礦床[1]。而如今地表礦、淺部礦已開采殆盡,找礦已經(jīng)向隱伏礦、深部礦轉變,找礦難度不斷加大,隱伏礦體定位預測理論與方法的研究己成為了當代成礦預測學的科學前沿和研究重點[2]。
隨著計算機技術的不斷發(fā)展,運用數(shù)學地質(zhì)理論及三維可視化技術對礦體進行空間定位預測也得到了快速發(fā)展;三維成礦預測方法[3]近年來已發(fā)展成為融合三維地質(zhì)建模、多元地學信息集成的三維定位定量預測方法。目前針對研究區(qū)深部找礦的研究較少,這在一定程度上制約了對構造控礦與礦體定位規(guī)律的進一步認識。另一方面,在控礦因素與礦化指標間的關聯(lián)關系上,尚缺少定量層面的研究。由于地質(zhì)信息的復雜性和不確定性,難以建立精確的數(shù)學解析模型來描述控礦因素和礦化信息的關聯(lián)關系。而貝葉斯網(wǎng)就是一種基于概率的不確定性推理網(wǎng)絡,用來表示變量集合連接概率的圖形模型,提供了一種表示因果信息的方法。它最早由Judea Pearl于1988年提出,當時主要用于處理人工智能中的不確定性信息。隨后它逐步成為了處理不確定性信息技術的主流,并且在計算機智能科學、工業(yè)控制、醫(yī)療診斷等領域的許多智能化系統(tǒng)中得到了重要的應用。
因此本文在已有模型和技術的基礎上,提出了采用貝葉斯網(wǎng)絡模型進行成礦預測的方法。并將該方法應用于新疆阿希礦區(qū),通過對該礦區(qū)的已知數(shù)據(jù)學習貝葉斯網(wǎng),并使用該貝葉斯網(wǎng)對未知區(qū)金品位進行預測通。
2 研究區(qū)概況
阿希金礦位于伊犁—中天山板塊北緣博羅霍洛島弧帶的吐拉蘇盆地中,這些板塊、微板塊之間的相互作決定了其大地構造演化的基本特征,并制約了該地區(qū)現(xiàn)今大地構造和礦產(chǎn)的分布[4]。
礦區(qū)出露地層為下石炭統(tǒng)大哈拉軍山組第五巖段和下石炭統(tǒng)阿恰勒河組第一巖段[5]。哈拉軍山組第五巖性段是一套中—中酸性火山巖建造,阿恰勒河組第一巖性段為火山活動平息后的正常沉積物,屬一套淺海相碎屑巖—碳酸巖建造[6],并且以角度不整合覆蓋于前者之上[5]。
區(qū)域構造線以NWW—SEE為主,區(qū)內(nèi)褶皺比斷裂發(fā)育,總體構成一個復式背斜。礦床受火山機構及其相關斷裂控制,礦區(qū)內(nèi)發(fā)育系列環(huán)形和放射狀斷裂。F2斷裂構造是礦區(qū)金礦化導礦、容礦構造為一體的控礦斷裂構造,是阿希金礦成礦流體大規(guī)模遷移、匯聚的主要通道和場所[7]。礦區(qū)火山巖分布廣泛,巖相變化大,發(fā)育有噴溢相溶巖、爆發(fā)相火山碎屑巖以及次火山巖相英安斑巖等多種巖相。
圍巖蝕變具有一定的水平分帶性,蝕變帶發(fā)育了以礦體為中心,向外依次為硅化、黃鐵絹英巖化和青磐巖化的蝕變分帶,但硅化帶上盤的黃鐵絹英巖化蝕變范圍明顯寬于下盤[8]。主要礦石礦物為黃鐵礦、銀金礦、白鐵礦、毒砂、黃銅礦、方鉛礦等。礦石結構相對較為復雜,主要有交代殘余結構、填隙結構、壓碎結構、包含結構、環(huán)帶結構、加大邊結構和鋸齒狀結構[9]。
3 貝葉斯網(wǎng)
貝葉斯網(wǎng)包括定性和定量兩個方面,在定性方面描述了貝葉斯網(wǎng)的各變量的連接關系,在定量方面刻畫了各變量間的條件概率。因此貝葉斯網(wǎng)學習也包括兩個過程,一是對于除根節(jié)點外的每一變量找到所有父節(jié)點,也就是貝葉斯網(wǎng)的結構學習;二是在已知結構的基礎上,獲得這些參數(shù)的估計。
3.1 結構學習
結構學習即是根據(jù)已知數(shù)據(jù),學習貝葉斯網(wǎng)絡的過程。貝葉斯網(wǎng)的構造方法有兩種,一種是通過咨詢專家手工構造,這種方法適用于變量少、邏輯關系強且易于表達的領域 ,另一種方法是使用一定的算法對大量的數(shù)據(jù)進行分析來獲得網(wǎng)絡結構。近年來,隨著計算機技術和大數(shù)據(jù)的發(fā)展,從數(shù)據(jù)中學習網(wǎng)絡結構已成為最有效的方式之一。
從數(shù)據(jù)中學習貝葉斯網(wǎng)結構主要有基于評分[10-11]和基于約束[12]的兩種方法?;诩s束的結構學習方法從數(shù)據(jù)出發(fā),首先做一些關于變量之間獨立關系的假設檢驗,獲得一些獨立性關系,然后尋找與這些關系(約束)相容的網(wǎng)絡結構,該方法能比較直觀的描述因果關系,且速度較快,但是在獨立性檢驗時比較容易出錯,而一旦前面出錯,就會影響后面的計算?;谠u分的方法把結構學習看為一個最優(yōu)化問題,該方法首先確定一個評分準則來評價不同模型的好壞,然后從所有可能的模型結構中選出評分最高的結構模型作為最終的模型結構,其中最常用的是K2算法和爬山法[13]。
K2算法是最早的貝葉斯網(wǎng)結構學習算法之一。設D是關于變量X1,…Xn的一組完整數(shù)據(jù),K2算法的目的是要尋找CH評分高的模型。計出于算復雜度的考慮,k2不是要尋找出CH評分最高的模型,而是要尋找在一定條件下的最優(yōu)模型,所使用的條件有兩個,他們使搜索空間大大縮?。海?)變量的一個拓撲排序ρ,其中父節(jié)點要排在子節(jié)點之前,(2)任一變量的父節(jié)點個數(shù)不超過u。為簡化模型評分的計算,k2假設參數(shù)先驗分布都是均勻分布。
爬山法的目標是要找出評分最高的模型。它從一個初始模型出發(fā)開始搜索,初始模型一般設為無邊模型。在搜索的每一步,它首先用搜索算子對當前模型進行局部修改,得到一系列候選模型;然后計算每個候選模型的評分,并將最有候選模型與當前模型比較;若最有候選模型的評分大,則以它為下一個當前模型,繼續(xù)搜索,否則,就停止搜索,并返回當前模型。
基于評分的方法不需要變量間的約束性關系,直接從數(shù)據(jù)本身出發(fā),對于缺值數(shù)據(jù)也適用。
3.2 參數(shù)估計
3.3 概率推理
已知貝葉斯網(wǎng)的結構和參數(shù)估計,當給定一組變量確切值的情況下,可以計算出一組查詢變量的概率分布。
推理是通過計算回答查詢的過程。貝葉斯網(wǎng)中的推理問題有三大類:已知貝葉斯網(wǎng)中某些變量的取值計算另外一些變量的后驗概率分布問題;已知某些變量計算后驗概率最大狀態(tài)組合的最大后驗假設問題;與證據(jù)相一致的狀態(tài)組合中概率最大組合的最大可能解釋問題。已知貝葉斯網(wǎng)的結構和參數(shù)估計,當給定一組變量確切值的情況下,可以計算出一組查詢變量的后驗概率。
在實際應用中,往往需要在同一貝葉斯網(wǎng)中進行多次不同的推理,而兩次不同的推理之間往往存在一些相同的步驟。團樹傳播算法是一種利用步驟共享來加快推理的算法。它首先用貝葉斯中的概率函數(shù)將團樹初始化,并且設置證據(jù),然后任選一個團作為樞紐節(jié)點,進行信息傳遞。信息傳遞分為收集階段,CTP從葉節(jié)點開始,逐步朝樞紐節(jié)點方向傳遞信息。在信息分發(fā)階段,CTP從樞紐節(jié)點開始,逐步向葉節(jié)點傳遞信息。
4 實例分析
本文以阿希金礦區(qū)地質(zhì)體三維模型為基礎,以阿希金礦區(qū)礦體定位概念模型為指導,提取主斷裂面距離場因素(dF)、管道相距離場因素(dGV)、成礦流體通道距離場因素(dore-f)、主斷裂面坡度因素(gF)、管道相坡度因素(gGV)、主斷裂面趨勢-起伏因素(wrF)、管道相趨勢-起伏因素(wrGV)一共七個指標作為阿希礦區(qū)的控礦因素作為證據(jù)變量,這七個指標和金礦品味的散點關系圖1如下所示,并根據(jù)該圖將證據(jù)變量分為利于成礦和不利于成礦兩種類型。
根據(jù)上圖可知:(1)當管道相距離場因素在10m-95m區(qū)間內(nèi)時,Au品位較高,因此將該段管道相距離作為利于成礦距離;(2)當管道相趨勢-起伏因素在-10m-15m區(qū)間內(nèi)時,Au品位較高,因此將該管道相趨勢-起伏作為利于成礦的趨勢;(3)當管道相坡度因素在60°-85°區(qū)間內(nèi)時,Au品位較高,因此將該范圍的管道相坡度作為利于成礦坡度;(4)當主斷裂面距離場因素在0m-60m區(qū)間內(nèi)時,Au品位較高,因此將該主斷裂面距離作為利于成礦距離;(5)當主斷裂面趨勢-起伏因素在-10m-35m區(qū)間內(nèi)時,Au品位較高,因此將該主斷裂面趨勢起伏作為利于成礦的趨勢;(6)當主斷裂面坡度因素在57°-90°區(qū)間內(nèi)時,Au品位較高,因此將該范圍的主斷裂坡度作為利于成礦坡度;(7)當成礦流體通道距離場因素在0m-250m區(qū)間內(nèi)時,Au品位較高,因此將該成礦流體通道距離作為利于成礦距離。據(jù)此便將所有證據(jù)變量分為利于成礦和不利于成礦兩種類型。
對于分類后的數(shù)據(jù),分別用1,2,3,4,5,6,7,8表示Au,dF, wrF, gF, dGV, wrGV, gGV, doref金品位和七個成礦因素的順序。本文采用K2算法進行貝葉斯網(wǎng)的結構學習,圖2為為使用K2算法學習得到的兩種模型。當學習順序為[8,1,2,3,4,5,6,7]時,學習貝葉斯網(wǎng)結構為圖2中模型1,評分結果為[0.4500,0.5500,0.5500,0.2833,0.4500,0.6167,0.3833,0.7167];當學習順序為[8,1,2,3,4,5,6,7] 時,學習貝葉斯網(wǎng)結構為圖2中模型2,對應的評分結果為[0.4500,0.5500,0.4500,0.5500,0.4500,0.5500,0.2833,0.6167]。比較可知,其中當為模型1 時,模型總體評分最高,性能最好。并對模型1計算貝葉斯網(wǎng)的參數(shù)估計,獲得每個節(jié)點的聯(lián)合概率分布。
為了保證預測模型中的控礦因素指標能夠?qū)ξ粗獏^(qū)預測起到有效的指示作用,需要設定一個邊界條件,保證該礦區(qū)內(nèi)控礦因素指標的數(shù)值落在已知區(qū)模型控制的范圍之內(nèi)(即已知區(qū)的數(shù)據(jù)密集區(qū)域)。阿希礦區(qū)預測模型的控礦因素指標邊界條件如表1所示。當?shù)V區(qū)內(nèi)各找礦指標的值均落在對應區(qū)間內(nèi)時,則可認為預測得到的礦化指標Au值有效。
在上述邊界條件的限制下,采用團樹傳播算法,計算當證據(jù)變量即七個成礦因素已知時Au的后驗概率,并將后驗概率最大的一類結果作為對Au的預測結果。圖3為對阿希金礦未知區(qū)Au的預測值在GOCAD中顯示的結果。
5 結論
本文采用貝葉斯估計的方法,從數(shù)學統(tǒng)計的角度對各成礦因素間的關系進行分析并進行隱伏礦體的成礦預測,得到了很好的預測結果。該方法對先驗地質(zhì)知識依賴性較強,能夠充分利用已有先驗知識。得到的結構模型,能夠為從地質(zhì)方面解釋各成礦因素的關系提供預想和思路。
參考文獻
[1] 董連慧, 沙德銘. 西天山地區(qū)晚古生代淺成低溫熱液金礦床[M]. 地質(zhì)出版社, 2005.
[2] 張均. 隱伏礦體定位預測的方法學基礎及方法論[J]. 地質(zhì)與資源, 2000, 9(2):100-104.
[3] 毛先成. 三維數(shù)字礦床與隱伏礦體立體定量預測研究[D]. 中南大學, 2006.
[4] 魏佳林. 新疆阿希金礦床礦體空間定位規(guī)律及找礦方向研究[D]. 中國地質(zhì)大學, 2012.
[5] 李志忠. 淺談新疆阿希金礦床地質(zhì)特征及成礦機理[J]. 新疆有色金屬, 2006, 29(3):6-7.
[6] 韓建民. 新疆阿希金礦礦床地質(zhì)特征及找礦方向[J]. 新疆有色金屬, 2003(s1):37-39.
[7] 王慶峰. 新疆阿希金礦深部成礦預測研究[J]. 新疆有色金屬, 2013, 36(2):33-36.
[8] 劉占坤, 毛先成, 潘敏, et al. 西天山阿希金礦床圍巖蝕變[J]. 地質(zhì)科技情報, 2017(5):195-203.
[9] 徐伯駿, 費小麗, 曹新志, et al. 新疆伊犁阿希金礦床成礦深度和剝蝕程度分析[J]. 地質(zhì)科技情報, 2014(3):154-162.
[10] Linhart H, Zucchini W. Model selection. New York: John Wiley & Sons Inc. Publishers. 1986.
[11] Burnham K P, Anderson D R. Model selection and multimodel inference:a partical information theoretic approach. New York: Spring Verlag. 2002.
[12] Spirtes P, Meek C. Learning Bayesian networks with discrete variable from data. In Proceedings of First International Conference on Knowledge Discovery and Data Mining, Montreal, QU. San Francisco; Morgn Kaufmann Publishers. 1995, 294~299.
[13] Glover F. Future paths for integer programming and links to artificial intelligence. Computers and Operations Research, 1986, 13(5):533~549.