• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于因子分析和RGB加色混合的鉆探品位數(shù)據(jù)可視化

    2021-03-24 08:06:08盧志偉呂紹玉
    中國礦業(yè) 2021年3期
    關(guān)鍵詞:降維品位可視化

    盧志偉,呂紹玉,王 均,趙 鴻,王 東

    (1.中國地質(zhì)大學(xué)(北京)地球科學(xué)與資源學(xué)院,北京 100083;2.貴州省地礦局一一三地質(zhì)大隊,貴州 六盤水 553000;3.中國地質(zhì)調(diào)查局國家地質(zhì)實驗測試中心,北京 100037)

    0 引 言

    隨著地質(zhì)學(xué)領(lǐng)域越來越多的引入定量化研究,數(shù)據(jù)已經(jīng)成為了地質(zhì)學(xué)研究最基本的信息載體[1]。地質(zhì)學(xué)領(lǐng)域涵蓋的數(shù)據(jù)形式多種多樣,大部分是定量化的數(shù)字形式,這類量化數(shù)據(jù)是抽象的,通過單一的數(shù)據(jù)往往不能夠直觀、全面地感受到數(shù)據(jù)中承載的重要信息[2]。因此,數(shù)據(jù)的可視化已經(jīng)成為地質(zhì)學(xué)數(shù)據(jù)處理中重要的環(huán)節(jié)[3],通過圖像簡明、直觀地呈現(xiàn)出數(shù)據(jù)背后的信息。例如在物探和化探中,將眾多的空間數(shù)據(jù)信息表達(dá)成圖件,進(jìn)而更好地進(jìn)行下一步研究。在數(shù)據(jù)可視化中,高維數(shù)據(jù)可視化是重點和難點[4],例如鉆孔品位數(shù)據(jù),通常包含多于三個成礦元素的數(shù)據(jù)。由于人眼可感知的維度最多到三維,一旦數(shù)據(jù)維度大于三維就不能直接感知。因此,如何對高維地學(xué)數(shù)據(jù)進(jìn)行可視化處理是地學(xué)數(shù)據(jù)可視化研究中的重要內(nèi)容。高維數(shù)據(jù)的可視化,一般是通過降維的方法把數(shù)據(jù)從高維降到三維或更少的維度,從而在低維空間進(jìn)行可視化。降維是高維數(shù)據(jù)處理當(dāng)中使用最多的方法之一,就是降低原始數(shù)據(jù)的維度,把數(shù)據(jù)當(dāng)中的信息壓縮到更低的維度。數(shù)據(jù)降維的方法多種多樣,常用的有傳統(tǒng)因子分析、主成分分析以及各種基于流形學(xué)習(xí)的非線性降維方法[5](如t-SNE[6]、MDS[7])。

    傳統(tǒng)鉆孔品位數(shù)據(jù)大多以表格的形式呈現(xiàn),或者是簡單地把品位數(shù)據(jù)劃分為不同類別的礦體和圍巖,這些方法無法直觀表達(dá)鉆孔品位數(shù)據(jù)的隱藏信息,忽略掉了鉆孔品位數(shù)據(jù)的漸變信息,因此需要建立三維模型來表達(dá)鉆孔品位數(shù)據(jù)。傳統(tǒng)的礦床三維建模構(gòu)建的礦體品位模型往往將品位值按高低進(jìn)行可視化,但只能對一種成礦元素的品位進(jìn)行可視化,無法同時看到多個成礦元素的品位,也就無法實現(xiàn)多維品位數(shù)據(jù)的可視化[8-10]。

    據(jù)此,本文提出基于因子分析和RGB加色混合的品位數(shù)據(jù)可視化方法,首先將高維品位數(shù)據(jù)降低到低維,然后把低維變量分別表達(dá)為RGB三原色,進(jìn)行加色混合,從而實現(xiàn)高維品位數(shù)據(jù)的可視化,從品位可視化結(jié)果中可以同時看到多個元素的品位變化,且能較好地保留品位的漸變信息,便于研究礦床品位的變化趨勢和變化規(guī)律。

    1 研究方法

    1.1 因子分析

    因子分析是一種將大量的變量(高維變量)減少為少量的因子(低維變量)的數(shù)據(jù)簡化和降維的技術(shù)[11]。該技術(shù)通過研究變量之間的內(nèi)部相互依賴關(guān)系,根據(jù)數(shù)據(jù)的基本結(jié)構(gòu),將輸入變量概括為少數(shù)幾個“抽象”的低維變量,用這幾個低維變量來反映信息[12],這幾個低維變量被稱為“因子”。這些因子是相關(guān)性較強的原始變量的綜合指標(biāo),具有抽象性和不可直觀性。根據(jù)研究對象,因子分析可分為R型因子分析和Q型因子分析,R型因子分析針對變量進(jìn)行分析,Q型因子分析針對數(shù)據(jù)樣本進(jìn)行分析。本文涉及的是R型因子分析[13],主要步驟包括7步:①確定研究問題,選取原始變量;②對原始變量協(xié)方差(相關(guān))矩陣進(jìn)行檢驗,確定是否符合因子分析條件,最常用的檢驗方法是KMO取樣適合度檢驗和巴特利特球形檢驗;③選擇因子提取方法。主要有主成分法、最大似然法、主軸因子法、最小二乘法等,主成分法最常用;④確定因子數(shù)目,一般用碎石圖、平行分析等方法加以判別,因子數(shù)目不能大于原始變量數(shù)目;⑤因子旋轉(zhuǎn),確定好因子旋轉(zhuǎn)方法(如方差極大化方法),對因子進(jìn)行旋轉(zhuǎn),使原始變量與盡可能少的因子有密切關(guān)系,增加因子的可解釋性,使因子的實際意義更加明確;⑥因子的命名和解釋,根據(jù)因子的實際意義對其命名,方便后面使用;⑦計算數(shù)據(jù)樣本的因子得分,因子得分就是每個樣本從原始數(shù)據(jù)轉(zhuǎn)換為新的低維變量之后的數(shù)據(jù),用這些數(shù)據(jù)進(jìn)行分析。

    1.2 RGB加色混合

    加色混合是常用的多維數(shù)據(jù)可視化方法[14-15],其基本原理是通過把不同變量表達(dá)為紅(R)、綠(G)、藍(lán)(B)顏色體系中不同的顏色成分,進(jìn)行加色混合,用混合后的顏色來可視化多個變量的綜合信息。圖1顯示了RGB三種顏色的混合原理和效果。RGB加色混合的常見規(guī)律如下所述。

    圖1 RGB顏色合成示意圖

    1) R、G、B三原色的值是有范圍的,通常設(shè)定為0~255的整數(shù),三原色合成顏色可以表示為(R,G,B)的形式,形成一個由三個變量構(gòu)成的三維顏色空間(圖1),該三維空間中,一個點代表一個顏色,比如(255,0,0)表示紅色,(255,255,0)表示黃色。

    2) 三原色中任意一個顏色,值越小,顏色越暗,值為0時呈黑色,顏色越大越亮。

    3) 當(dāng)R、G、B三色等量混合時,可得到白色。三原色中的兩色等量混合時,綠+藍(lán)=青;紅+綠=黃;藍(lán)+紅=品紅。

    4) 三原色不等量混合,顏色偏向于較強的顏色。

    5) 原色光混合后的亮度高于原有色光的亮度。

    加色混合需要先將代表顏色的變量連續(xù)值映射到顏色空間,就是把品位指標(biāo)連續(xù)值轉(zhuǎn)換為顏色值(0~255的整數(shù)),本文采用先將連續(xù)值標(biāo)準(zhǔn)化到0~1 之間,然后乘以255,再近似為整數(shù)的方法。

    1.3 品位缺失值處理

    對鉆孔品位數(shù)據(jù)進(jìn)行加色混合的目的是對鉆孔品位的垂向變化規(guī)律進(jìn)行可視化,這就要求鉆孔品位值在鉆孔上盡量連續(xù),缺失數(shù)據(jù)越少越好。但是在實際情況中,受樣品測試方法的限制,可能會導(dǎo)致元素低于檢出限,造成數(shù)據(jù)缺失;或者不同時期的鉆探品位數(shù)據(jù),前后針對的找礦目標(biāo)不用,測試元素項目不同,從而造成目標(biāo)元素品位數(shù)據(jù)缺失。品位數(shù)據(jù)的缺失造成存在缺失值的鉆孔部位其品位信息無法被可視化,不利于品位數(shù)據(jù)空間變化規(guī)律的研究。

    本文選取多元線性回歸方法求解缺失品位數(shù)據(jù)的預(yù)測值,進(jìn)行缺失數(shù)據(jù)插補。多元線性回歸模型假設(shè)響應(yīng)變量Y與預(yù)測變量x1,x2,…,xn之間存在的線性關(guān)系見式(1)。

    (1)

    式中:Y為響應(yīng)變量;xi為預(yù)測變量;a為截距;bi為回歸系數(shù);ε為回歸殘差。

    在實際問題中,給定的自變量并不是都與預(yù)測目標(biāo)關(guān)系密切,如何確定對回歸模型有顯著影響的自變量組合是影響結(jié)果的重要因素。一般的解決辦法是根據(jù)研究的問題,結(jié)合領(lǐng)域知識,羅列出對因變量有影響的因素作為自變量。 當(dāng)理論和經(jīng)驗對模型中應(yīng)該包含哪些變量無法提供可靠的依據(jù)時,采用逐步回歸法,從數(shù)據(jù)本身出發(fā)對自變量進(jìn)行自動選擇[17]。

    1.4 技術(shù)流程

    綜合上述方法,形成了本文研究的技術(shù)流程(圖2),包括對原始數(shù)據(jù)的清洗、利用因子分析法對數(shù)據(jù)降維、利用加色混合實現(xiàn)數(shù)據(jù)可視化。

    圖2 技術(shù)流程圖

    2 研究區(qū)概況及數(shù)據(jù)簡介

    2.1 研究區(qū)概況

    五里坪礦床屬鉛、鋅、鉬、銀多金屬礦床,位于黔西北啞都-蟒硐斷裂構(gòu)造成礦亞帶[18],通過研究已證實該礦成礦潛力巨大[19]。五里坪礦床具體特征如下所述。

    1) 礦體宏觀特征。鉛鋅(鉬)礦體主要產(chǎn)于北西向主干斷層破碎帶及次級構(gòu)造中,尤其產(chǎn)于舊司組(C1j)及上司組(C1s)的炭質(zhì)黏土巖、黏土巖上覆擺佐組(C1b)的白云巖、白云質(zhì)灰?guī)r所形成的層間破碎帶和層間軟弱帶中。

    2) 礦化蝕變特征。圍巖蝕變主要有硅化、白云巖化、黃鐵礦化、褐鐵礦化、方鉛礦化、重晶石化、方解石化等。其中,黃鐵礦、石英與鉬礦、鉛鋅礦的關(guān)系較為密切。礦石常見它形-半自形-自形粒狀結(jié)構(gòu)、碎屑狀結(jié)構(gòu)、壓碎角礫狀結(jié)構(gòu)等,以角礫狀構(gòu)造、浸點狀構(gòu)造、似層狀構(gòu)造為主。

    3) 礦石礦物成分及特征。礦石礦物主要為鉬鉛礦、方鉛礦、閃鋅礦、黃鐵礦等。其中,鉬鉛礦粒度0.1~0.3 mm,有兩種存在形式:①灰白色透明半透明碎屑狀或四方板狀不完整晶形,玻璃光澤至金剛光澤,粉末呈白色,斷口油脂光澤,硬度2.5;②以方鉛礦、白鉛礦為假象呈不規(guī)則粒狀,半金屬光澤至光澤暗淡,硬度2.5~3.0。上述兩種存在形式為罕見的鉬鉛礦形式,在該區(qū)為首次發(fā)現(xiàn)。

    4) 礦床成因。根據(jù)礦區(qū)內(nèi)礦層特征、礦物組分、礦石組構(gòu)及礦物共生組合、鉬鉛鋅的賦存狀態(tài)研究,初步認(rèn)為該礦床屬熱液型多金屬礦床[20]。

    2.2 數(shù)據(jù)來源

    本次所涉及的品位數(shù)據(jù)來自2012—2017年不同批次鉆探。品位數(shù)據(jù)涉及到Pb、Zn、Ag、Mo、Sb共5個元素,其中,Sb元素存在數(shù)據(jù)缺失的情況較多(大約占全部數(shù)據(jù)的10%)。

    3 結(jié)果與討論

    3.1 缺失值處理結(jié)果

    以Pb、Zn、Mo、Ag品位數(shù)據(jù)為模型的自變量,Sb為因變量,使用逐步回歸法對數(shù)據(jù)中的Sb品位值缺失值進(jìn)行預(yù)測。逐步回歸分析AIC值顯示的變量重要性排序為:Mo>Pb>Ag>Zn,其中,Ag和Zn的回歸系數(shù)顯著性水平較差,對于回歸模型影響較小,因此剔除自變量Ag和Zn,保留Pb、Mo兩個變量,建立的回歸方程見式(2)。

    Sb=0.015 412+1.702 175×Mo- 0.05 398×Pb (2)

    回歸方程相關(guān)的檢驗參數(shù)見表1?;貧w方程中兩個自變量的方差膨脹因子(VIF)經(jīng)檢測均小于2,因此不存在多重共線性問題。自變量Pb和Mo的p值均小于0.001,在p=0.001的水平上通過顯著性檢驗?;貧w分析結(jié)果評價參數(shù)顯示:R2為0.815 8,RMSE為0.103 9。說明回歸分析效果較好,可以滿足實際需求。圖3為回歸分析預(yù)測值與實際值散點圖,由圖3可知,散點分布較為緊湊,趨勢性明顯,圍繞y=x斜線分布,說明預(yù)測值較好的擬合了實際值,預(yù)測效果越好。利用這個訓(xùn)練好的回歸方程對Sb品位缺失值進(jìn)行回歸,供下一步因子分析使用。

    3.2 因子分析結(jié)果

    對插補好缺失值的品位數(shù)據(jù)進(jìn)行巴特利特球度檢驗,并計算KMO值。結(jié)果表明巴特利特球度檢驗的顯著性p值遠(yuǎn)遠(yuǎn)小于0.05,KMO值為0.71,說明符合因子分析的條件。將處理完缺失數(shù)據(jù)的品位數(shù)據(jù)進(jìn)行因子分析,以實現(xiàn)數(shù)據(jù)降維,用最少的因子盡可能地解釋數(shù)據(jù)中更多的方差。圖4為對品位數(shù)據(jù)進(jìn)行平行分析得到的平行分析碎石圖,圖中的虛線代表隨機模擬數(shù)據(jù),實線代表真實數(shù)據(jù),代表真實數(shù)據(jù)的曲線中有3個成分的特征值位于模擬數(shù)據(jù)曲線之上。因此,根據(jù)碎石圖結(jié)果,保留3個因子。

    圖3 Sb品位訓(xùn)練數(shù)據(jù)及測試數(shù)據(jù)與實測值散點圖

    圖4 平行分析碎石圖

    確定因子數(shù)量后,選擇主成分法進(jìn)行因子提取,把5個元素降維成3個,3個因子分量的總累計方差貢獻(xiàn)率為86.02%。為了使因子分析得出的因子載荷結(jié)構(gòu)簡化,便于解釋,需進(jìn)行因子旋轉(zhuǎn),本文選擇最大方差法進(jìn)行因子旋轉(zhuǎn)。表2為旋轉(zhuǎn)之后的因子載荷,圖5為旋轉(zhuǎn)后的因子載荷圖。從表2和圖5可以看出,F(xiàn)1因子代表Pb和Ag,F(xiàn)2因子代表Mo和Sb,F(xiàn)3因子代表Zn。3個因子分量就是品位加色混合的輸入數(shù)據(jù)。

    表2 五里坪礦床鉆孔品位數(shù)據(jù)R型因子分析旋轉(zhuǎn)因子載荷表

    圖5 旋轉(zhuǎn)后因子載荷圖

    通過因子分析,將5個元素品位數(shù)據(jù)降維成了3個低維變量,為了方便敘述,將根據(jù)旋轉(zhuǎn)因子載荷把F1因子稱為Pb-Ag因子,F(xiàn)2稱為Mo-Sb因子,F(xiàn)3因子稱為Zn因子。

    3.3 加色混合可視化結(jié)果

    通過RGB加色混合方法將3個因子變量映射到RGB顏色空間。Pb-Ag因子映射到RGB中的紅色(R),Mo-Sb因子映射到綠色(G),Zn因子映射到藍(lán)色(B)。H1樣品的Pb-Ag因子得分為0.15;Mo-Sb因子得分為-0.5;Zn因子得分為-0.01,將這些值轉(zhuǎn)換為RGB顏色值之后分別為:30、0、25三個整數(shù)。則H1樣品的RGB顏色值為(30,0,25),利用這個顏色值在Excel中對各個樣品對應(yīng)的單元格進(jìn)行顏色填充,從而實現(xiàn)該樣品的品位RGB加色混合可視化,選取鉆孔KYZK02中的一段來舉例展示加色混合效果(表3)。

    從表3中可以看出,樣品H1和樣品H11的顏色較暗,說明三種顏色值都較小,3個因子都較小,表明所有元素在這2個樣品上品位值都不高,取樣位置可能是圍巖或者礦化較弱。其余大部分樣品顏色鮮亮,呈現(xiàn)青色,這種顏色主要是由藍(lán)色和綠色混合而成,說明F2、F3兩個因子得分高,說明這些樣品的Mo、Sb、Zn品位較高,Pb和Ag品位較小。H6呈現(xiàn)肉紅色,偏向于黃色,亮度較高,說明,紅色和綠色成分較強,反映在元素上,說明Pb、Ag組合和Mo、Sb組合的品位較高。由此可見,通過顏色值可以看反映巖心品位的高低。并且通過顏色的垂向變化,可以看出品位在鉆孔上的分布和變化規(guī)律。

    表3 鉆孔KYZK02(29.2~40.0 m)品位數(shù)據(jù)及可視化

    圖6 鉆孔KYZK01品位可視化結(jié)果

    表3的可視化結(jié)果說明,品位數(shù)據(jù)降維可視化得到的RGB加色混合色譜很好地反映了鉆孔中的品位變化規(guī)律。品位變化規(guī)律要與地質(zhì)因素對照才有實際意義,因此為了將品位加色混合可視化結(jié)果與巖性、礦化、構(gòu)造等條件一起對比討論,選擇了地質(zhì)、礦化信息較為豐富的KYZK01鉆孔進(jìn)行品位值加色混合可視化(圖6)。圖6中列出了巖性描述、柱狀圖、采樣位置、品位值及F1~F3因子加色混合可視化結(jié)果和單個因子分量可視化結(jié)果。 列出F1~F3的單個變量可視化結(jié)果,是為了對單個變量進(jìn)行單色可視化,反映單個變量的變化情況,并與三個因子變量的加色混合可視化結(jié)果相對比。從圖6中可以得到以下規(guī)律。

    1) 鉆孔中紅、綠、藍(lán)三色都有,說明三者代表的品位組分,即Pb-Ag、Mo-Sb、Zn三種品位組合各自占主導(dǎo)的礦化在鉆孔中都有分布。

    2) 鉆孔上部以紅色為主色調(diào),下部以藍(lán)色和綠色為主色調(diào),說明上部主要為Pb、Ag礦化,下部主要為Mo、Zn礦化。

    3) 合成色譜中顏色較亮的地方比較偏向于三原色中的紅、綠、藍(lán)單色,而不是青、品紅、黃色以及白色等合成色。說明三種元素組合中,同一位置出現(xiàn)2個因子、3個因子得分都高的情況較少,更多的是一個高,另外兩個低,比如Pb-Ag品位高,而Mo-Sb、Zn品位低。

    4) 在兩個斷層(圖中虛線)經(jīng)過的部位,RGB合成色譜偏向于紅色,說明斷層附近Pb、Ag品位高。

    5) 整個加色混合色譜中的顏色變化呈現(xiàn)出漸變?yōu)橹?,突變?yōu)檩o的規(guī)律。反映出五里坪鉛鋅多金屬礦床的品位變化是以漸變?yōu)橹?,突變?yōu)檩o。

    以上品位分布規(guī)律僅是從KYZK01一個鉆孔的品位加色混合可視化結(jié)果中看出來的,只能體現(xiàn)這一個鉆孔中的規(guī)律,如要得到五里坪鉛鋅多金屬礦床更多、更準(zhǔn)確、更具有普遍意義的品位分布規(guī)律,還需要結(jié)合更多的鉆孔品位可視化結(jié)果。提取出這些品位分布規(guī)律,對于預(yù)測未知區(qū)域的品位分布情況,以及研究礦床成因、控礦因素等問題具有一定意義。

    由于RGB加色混合方法每次最多只能同時可視化3個變量,但是因子分析并不能強制要求品位值降低到三維,在原始變量較多的情況下,降維之后的變量依然可能大于3個。因此若降維之后,因子數(shù)量大于3個,可以采取從多個變量里面每次選擇3個進(jìn)行加色合成,進(jìn)行多次加色合成,生成多個色譜的方法?;蛘哂闷渌軌蛑付ń稻S目標(biāo)維度的降維方法,這樣可以保證變量在3個以內(nèi)。

    4 結(jié) 論

    1) 本文提出的高維品位數(shù)據(jù)可視化方法能夠直觀地呈現(xiàn)出品位數(shù)據(jù)在鉆孔上的高低變化,將品位數(shù)據(jù)沿著鉆孔從上到下的變化趨勢直觀反映出來,對于研究品位的空間變化規(guī)律具有意義。

    2) 顏色亮度反映品位高低,顏色類型反映不同品位組分相對的占比。

    3) 將巖性、構(gòu)造等要素和品位可視化圖放在一起對照,能夠從中找出影響品位變化的地質(zhì)因素。本文僅展現(xiàn)了所提出的可視化方法在平面圖上的應(yīng)用,未來可以繼續(xù)探索將這種方法拓展到三維地質(zhì)模型。

    4) RGB加色混合可視化方法目前還存在一些缺陷,即每次最多只能同時可視化3個變量。后續(xù)研究中將對這個問題進(jìn)行研究,提出更完善的品位數(shù)據(jù)可視化方案。

    猜你喜歡
    降維品位可視化
    品位(外一首)
    混動成為降維打擊的實力 東風(fēng)風(fēng)神皓極
    車主之友(2022年4期)2022-08-27 00:57:12
    基于CiteSpace的足三里穴研究可視化分析
    基于Power BI的油田注水運行動態(tài)分析與可視化展示
    云南化工(2021年8期)2021-12-21 06:37:54
    鐘情山花爛漫 品位幸福時光
    基于CGAL和OpenGL的海底地形三維可視化
    降維打擊
    海峽姐妹(2019年12期)2020-01-14 03:24:40
    “融評”:黨媒評論的可視化創(chuàng)新
    傳媒評論(2019年4期)2019-07-13 05:49:14
    金堆城鉬礦床硫元素分布規(guī)律研究
    萊鋼3200 m3高爐低品位冶煉實踐
    山東冶金(2015年5期)2015-12-10 03:27:38
    巨野县| 利川市| 云阳县| 乐至县| 黄山市| 大连市| 大宁县| 承德市| 凌海市| 锡林浩特市| 宁德市| 宁波市| 益阳市| 禹城市| 诸城市| 黄浦区| 阿拉善左旗| 安图县| 彭水| 随州市| 胶南市| 抚松县| 尉犁县| 蓬安县| 章丘市| 五原县| 水城县| 郑州市| 陇川县| 宁陵县| 平乡县| 富宁县| 溆浦县| 丰镇市| 永泰县| 五河县| 永嘉县| 兴隆县| 罗平县| 辽源市| 平塘县|