楊靜遠(yuǎn),廖志堅(jiān)
(云南省地質(zhì)技術(shù)信息中心,云南 昆明 650051)
地質(zhì)調(diào)查工作的長期開展產(chǎn)生了大量的地質(zhì)數(shù)據(jù)與技術(shù)資料。這些數(shù)據(jù)信息呈現(xiàn)出靜態(tài)數(shù)據(jù)與動態(tài)數(shù)據(jù)等多元化姿態(tài)。其中包括了基礎(chǔ)性地質(zhì)勘查、資源勘查與評價(jià)、地質(zhì)災(zāi)害、地質(zhì)環(huán)境調(diào)查等。這些工作所產(chǎn)生的數(shù)據(jù)信息,門類繁復(fù),結(jié)構(gòu)復(fù)雜多樣,詳細(xì)程度不一,通過強(qiáng)化對現(xiàn)階段地質(zhì)大數(shù)據(jù)的管理和應(yīng)用,突破傳統(tǒng)的數(shù)據(jù)分析思維方式,促使地質(zhì)大數(shù)據(jù)與信息化相結(jié)合,使二者在地質(zhì)調(diào)查工作中得到廣泛普及,發(fā)揮重要的作用。
(1)地質(zhì)大數(shù)據(jù)概述。地質(zhì)數(shù)據(jù)指的是在地質(zhì)調(diào)查工作過程中所產(chǎn)生的原始數(shù)據(jù),這其中包括基礎(chǔ)性地質(zhì)勘查、礦產(chǎn)資源勘查與評價(jià)、地質(zhì)災(zāi)害、地質(zhì)環(huán)境調(diào)查等工作所產(chǎn)生的基礎(chǔ)性數(shù)據(jù)和資料。而地質(zhì)大數(shù)據(jù)則是對上述原始數(shù)據(jù)在統(tǒng)一的模型結(jié)構(gòu)和標(biāo)準(zhǔn)下,通過數(shù)據(jù)清洗入庫過程,對原始數(shù)據(jù)內(nèi)容的加工整合來得到可參考和利用價(jià)值更高的地質(zhì)信息[1]。在實(shí)現(xiàn)這個目標(biāo)的過程中離不開大數(shù)據(jù)技術(shù)對于地質(zhì)原始數(shù)據(jù)的處理,其可以幫助地質(zhì)原始數(shù)據(jù)結(jié)構(gòu)進(jìn)行優(yōu)化整合,同時對分散的地質(zhì)數(shù)據(jù)和相關(guān)內(nèi)容進(jìn)行建模,最終實(shí)現(xiàn)地質(zhì)大數(shù)據(jù)的技術(shù)轉(zhuǎn)化和服務(wù)內(nèi)容創(chuàng)新。
(2)地質(zhì)大數(shù)據(jù)特點(diǎn)。地質(zhì)科學(xué)作為一門數(shù)據(jù)密集型學(xué)科,其在地質(zhì)調(diào)查工作中獲取地質(zhì)原始數(shù)據(jù)具有專業(yè)性強(qiáng)、難度高、成本大的特點(diǎn)。特別是在地質(zhì)調(diào)查工作中涉及到高山、水域、地質(zhì)地形破碎帶等特殊區(qū)域時,地質(zhì)數(shù)據(jù)獲取難度則更大。而且由于地質(zhì)構(gòu)成元素的多元性以及區(qū)域性地質(zhì)工作程度的不一致性,導(dǎo)致獲取的地質(zhì)大數(shù)據(jù)也具有多元化的特點(diǎn)。除此之外,地質(zhì)大數(shù)據(jù)還具有空間性、隨機(jī)性、模糊性和非線性等多種特征,而且還會伴隨自然因素和時間影響產(chǎn)生不穩(wěn)定性。
地質(zhì)大數(shù)據(jù)作為當(dāng)今大數(shù)據(jù)內(nèi)容中的重要組成部分,是現(xiàn)階段地質(zhì)調(diào)查工作與信息化技術(shù)相融合后的最終結(jié)果。地質(zhì)大數(shù)據(jù)具有很多特性,首先是多樣性,這其中包括了對多門類的已有宏觀地質(zhì)數(shù)據(jù)進(jìn)行存儲處理以及微觀地質(zhì)學(xué)數(shù)據(jù)信息,如聲光電磁等原始地質(zhì)勘探數(shù)據(jù)[2]。其次是空間屬性和時間屬性,在地質(zhì)大數(shù)據(jù)中任何地質(zhì)數(shù)據(jù)信息都依附于空間信息,而且會隨著地球的自然作用、區(qū)域地質(zhì)調(diào)查工作程度的深入或礦產(chǎn)資源開發(fā)形成動態(tài)的變化。最后是地質(zhì)大數(shù)據(jù)的價(jià)值性,通過數(shù)據(jù)歸集、分析來獲取有價(jià)值的信息,為進(jìn)一步的工作提供基礎(chǔ)性數(shù)據(jù)支撐或形成相關(guān)成果。
(1)地質(zhì)大數(shù)據(jù)技術(shù)與地質(zhì)大數(shù)據(jù)應(yīng)用。地質(zhì)大數(shù)據(jù)技術(shù)主要是對已有的地質(zhì)數(shù)據(jù)信息進(jìn)行清洗入庫、傳輸轉(zhuǎn)換、存儲管理以及數(shù)據(jù)分析關(guān)聯(lián)。通過這一系列對于數(shù)據(jù)信息的處理最終實(shí)現(xiàn)地質(zhì)數(shù)據(jù)信息資源的統(tǒng)一歸集管理和共享。而地質(zhì)大數(shù)據(jù)的應(yīng)用則是以大數(shù)據(jù)為先提條件,采用云平臺和互聯(lián)網(wǎng)技術(shù)對現(xiàn)有的數(shù)據(jù)信息進(jìn)行整合分析,以此來實(shí)現(xiàn)地質(zhì)原始數(shù)據(jù)信息的深入挖掘。并在其中找出一些實(shí)用性和利用價(jià)值高的信息應(yīng)用于地質(zhì)勘探調(diào)查工作中。并使這些數(shù)據(jù)進(jìn)行不斷增值,最終為現(xiàn)有的地質(zhì)工作信息化工作帶來創(chuàng)新,優(yōu)化服務(wù)。
(2)數(shù)據(jù)挖掘與關(guān)聯(lián)建模。地質(zhì)大數(shù)據(jù)的數(shù)據(jù)挖掘研究區(qū)別于傳統(tǒng)的數(shù)據(jù)研究,地質(zhì)大數(shù)據(jù)中的數(shù)據(jù)挖掘是要根據(jù)地質(zhì)數(shù)據(jù)中空間屬性、時間屬性和詳細(xì)程度等的內(nèi)在邏輯進(jìn)行統(tǒng)一的整合分類,通過數(shù)據(jù)對比和數(shù)據(jù)分類來進(jìn)行歸納總結(jié)。提取具有參考價(jià)值的數(shù)據(jù)信息并總結(jié)不同數(shù)據(jù)之間的相互聯(lián)系。除此之外,數(shù)據(jù)挖掘通過對不同獲取渠道、不同形態(tài)以及不同類別的地質(zhì)數(shù)據(jù)進(jìn)行相關(guān)性分析,以此來提高對于地質(zhì)原始數(shù)據(jù)資料的管理和應(yīng)用效率。
(3)基于大數(shù)據(jù)的可視化與智能化。數(shù)據(jù)的可視化與智能化是現(xiàn)階段地質(zhì)大數(shù)據(jù)中對數(shù)據(jù)資料內(nèi)容進(jìn)行管理、分析、對比的重要手段。數(shù)據(jù)的可視化與智能化是通過計(jì)算機(jī)技術(shù)、地理信息技術(shù)來對獲取的地質(zhì)數(shù)據(jù)信息進(jìn)行圖形化處理。而在地質(zhì)大數(shù)據(jù)的可視化分析過程中通過交互可視界面來對數(shù)據(jù)信息內(nèi)容進(jìn)行分析整合,形成數(shù)據(jù)圖形,能夠更加直觀、清晰、全面的觀察數(shù)據(jù)內(nèi)容,并且獲取其中的關(guān)聯(lián)??梢暦治鰠^(qū)別于一般的分析模式,其最大的特點(diǎn)是在分析過程中不依賴數(shù)學(xué)模型。通過可視分析來將地質(zhì)大數(shù)據(jù)中的數(shù)據(jù)內(nèi)容進(jìn)行數(shù)據(jù)可視化,便于更加直接的對數(shù)據(jù)內(nèi)容進(jìn)行分析。
(1)地質(zhì)云平臺。地質(zhì)云平臺是指利用現(xiàn)有的云計(jì)算技術(shù)為基礎(chǔ),對地質(zhì)大數(shù)據(jù)中的多元化資料內(nèi)容進(jìn)行匯總歸集和海量數(shù)據(jù)存儲,以實(shí)現(xiàn)當(dāng)前地質(zhì)調(diào)查工作中的需要的實(shí)時數(shù)據(jù)存儲、數(shù)據(jù)傳輸、資源整合和信息提取等功能。在構(gòu)建地質(zhì)云平臺的過程中,首先要明確當(dāng)前地質(zhì)大數(shù)據(jù)應(yīng)用于地質(zhì)調(diào)查工作中的作用,其次是要通過云計(jì)算技術(shù)來實(shí)現(xiàn)地質(zhì)數(shù)據(jù)的云存儲,最后是要搭建一個虛擬的服務(wù)平臺為從事地質(zhì)勘探工作的人員提供服務(wù)管理和數(shù)據(jù)檢索功能。通過地質(zhì)云平臺來實(shí)現(xiàn)地質(zhì)數(shù)據(jù)信息的綜合管理,提高地質(zhì)數(shù)據(jù)的使用效率。除此之外,對于地質(zhì)數(shù)據(jù)有需求的用戶還可以通過互聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)查詢。開展地質(zhì)勘調(diào)查工作時需要大量的數(shù)據(jù)信息作為參考,因此可以通過借助地質(zhì)云平臺技術(shù)來獲取在地質(zhì)勘探中所需要的數(shù)據(jù)信息,便于地質(zhì)勘探工作順利的開展。地質(zhì)云平臺的出現(xiàn)為地質(zhì)數(shù)據(jù)提供了更多服務(wù)對象,實(shí)現(xiàn)了地質(zhì)數(shù)據(jù)更高的價(jià)值體現(xiàn)。
(2)大數(shù)據(jù)應(yīng)用服務(wù)系統(tǒng)。伴隨我國科技水平的不斷發(fā)展和互聯(lián)網(wǎng)技術(shù)的普及應(yīng)用,地質(zhì)工作中的信息化發(fā)展逐步實(shí)現(xiàn)了數(shù)據(jù)資源共享以及提供信息化服務(wù)。地質(zhì)大數(shù)據(jù)的開發(fā)和應(yīng)用也正符合目前我國大數(shù)據(jù)發(fā)展的總體戰(zhàn)略目標(biāo)。這種大數(shù)據(jù)應(yīng)用服務(wù)系統(tǒng)通過當(dāng)今先進(jìn)的網(wǎng)絡(luò)技術(shù)和云計(jì)算技術(shù)對地質(zhì)大數(shù)據(jù)中的資源信息進(jìn)行整合分析。通過大數(shù)據(jù)應(yīng)用服務(wù)系統(tǒng)來挖掘數(shù)據(jù)資料中的內(nèi)在聯(lián)系,從而獲得更多更有利用價(jià)值的信息。為我國地質(zhì)勘探調(diào)查工作提供多方位的信息化服務(wù)。
綜上所述,在當(dāng)今大數(shù)據(jù)環(huán)境下促使地質(zhì)數(shù)據(jù)的調(diào)查與分析進(jìn)行不斷創(chuàng)新。在這種新形勢下地質(zhì)大數(shù)據(jù)的產(chǎn)生為我國地質(zhì)調(diào)查工作提供了更多便利。其在地質(zhì)勘探以及相關(guān)地質(zhì)科研工作過程中都起到了不可替代的重要作用。地質(zhì)大數(shù)據(jù)對地質(zhì)原始數(shù)據(jù)的分析整合可以有效的調(diào)取地質(zhì)勘探中所需要的數(shù)據(jù)信息,同時還能發(fā)現(xiàn)地質(zhì)數(shù)據(jù)中不同資源信息的內(nèi)在關(guān)聯(lián)。希望通過本文對地質(zhì)大數(shù)據(jù)的應(yīng)用以及地質(zhì)信息化的淺要分析能促進(jìn)二者朝著更好的方向發(fā)展,僅供參考。
參考文獻(xiàn)
[1]李敏,傅潔,陳安蜀,李磊,彭麗娜.大數(shù)據(jù)時代的國家基礎(chǔ)地質(zhì)信息化建設(shè)[J].地質(zhì)與資源,2017,26(03):329-332.
[2]韓媛,王占昌,楊博,伍錦程.淺談基于Postgres-XL的分布式地質(zhì)大數(shù)據(jù)集群架構(gòu)[J].中國礦業(yè),2017,26(S1):83-86+91.