文/長春市測繪院 周佩鑫 張永發(fā)
大數(shù)據(jù)視野下的測繪檔案管理思路探析
文/長春市測繪院周佩鑫張永發(fā)
大數(shù)據(jù)時代的來臨意味著大測繪時代的到來。本文試圖結(jié)合測繪地理信息的大數(shù)據(jù)特征,探析在大數(shù)據(jù)時代下的測繪檔案管理工作思路。
大數(shù)據(jù);測繪檔案;管理
麥肯錫全球研究機(jī)構(gòu)對于“大數(shù)據(jù)(Big data)”給出的定義是:“一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征?!贝髷?shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。
大數(shù)據(jù)時代的到來為測繪地理信息的創(chuàng)新發(fā)展帶來了新的挑戰(zhàn)與機(jī)遇。當(dāng)前,海量的地理信息數(shù)據(jù)還遠(yuǎn)遠(yuǎn)沒有被充分利用起來,只有充分挖掘數(shù)據(jù),加大對地理信息數(shù)據(jù)的開發(fā)應(yīng)用研究,才能更好地提供多元化的地理信息服務(wù)。
測繪地理信息檔案是指在測繪生產(chǎn)、科學(xué)研究、基本建設(shè)等活動中形成的應(yīng)當(dāng)歸檔保存的各種技術(shù)文件、技術(shù)標(biāo)準(zhǔn)、原始記錄、計算資料、成果、成圖、航空照片、衛(wèi)星照片、磁帶、磁盤、圖紙、圖表等。大數(shù)據(jù)的基本特征可以用4個V來總結(jié),即國際數(shù)據(jù)公司(IDC)提出的海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)和動態(tài)的數(shù)據(jù)體系(Velocity)、多樣的數(shù)據(jù)類型(Variety)、數(shù)據(jù)價值密度低(Value)。
大數(shù)據(jù)的技術(shù)路徑和分析方法為測繪地理信息檔案資源的規(guī)劃、整合、管理和利用提供了更有效的方式,測繪地理信息檔案與大數(shù)據(jù)同樣具有數(shù)據(jù)體量大、數(shù)據(jù)種類多、數(shù)據(jù)價值有待挖掘等特點:
(一)數(shù)據(jù)體量大。人類的社會活動與地理空間位置密不可分,地理信息是整合集成社會經(jīng)濟(jì)和自然人文信息的公共基底,隨著測繪技術(shù)、傳感器技術(shù)的發(fā)展,測繪數(shù)據(jù)的獲取能力快速提高,隨之而來的便是檔案數(shù)據(jù)的快速增長。這些測繪地理信息數(shù)據(jù)不僅可以有效揭示經(jīng)濟(jì)社會發(fā)展與資源環(huán)境的內(nèi)在關(guān)系和演變規(guī)律,還可以綜合反映人地關(guān)系的協(xié)調(diào)程度。
(二)數(shù)據(jù)種類多。檔案包含了文字、數(shù)據(jù)、圖件、圖表、聲像等多樣化數(shù)據(jù),還有數(shù)據(jù)庫、三維地理信息產(chǎn)品等類型的數(shù)據(jù)。按照國家測繪地理信息局與國家檔案局在2015年聯(lián)合下發(fā)的《測繪地理信息檔案業(yè)務(wù)管理規(guī)定》,測繪地理信息檔案共分為14類:⑴航空、航天遙感影像獲?。虎拼蟮販y量;⑶測繪地理信息采集與更新;⑷地理信息數(shù)據(jù)庫建庫與維護(hù);⑸地理國情監(jiān)測(普查);⑹應(yīng)急測繪保障服務(wù);⑺測繪成果與地理信息應(yīng)用;⑻工程測量;⑼海洋測繪與江河湖水下測量;⑽界線測繪;⑾不動產(chǎn)測繪;⑿地圖制作;⒀測繪科學(xué)技術(shù)研究;⒁其他。
(三)數(shù)據(jù)價值有待挖掘。近年來,測繪地理信息數(shù)據(jù)在輔助政府決策、公共應(yīng)急救急、規(guī)劃管理、基礎(chǔ)設(shè)施建設(shè)等多個領(lǐng)域發(fā)揮了重要作用,技術(shù)成果類檔案的利用率較高。但是在地理信息數(shù)據(jù)量和數(shù)據(jù)類型上還有巨大的拓展?jié)摿?,地理信息?shù)據(jù)尤其是歷史檔案數(shù)據(jù)的價值并未充分發(fā)揮,這就需要密切結(jié)合實際發(fā)展需要,研究測繪地理信息檔案資源的建設(shè)和應(yīng)用,充分挖掘檔案資源的數(shù)據(jù)價值,才能更好地為國民經(jīng)濟(jì)發(fā)展服務(wù)。
(一)構(gòu)建時空地理信息數(shù)據(jù)。大數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析的基礎(chǔ)是數(shù)據(jù),目前,測繪地理信息檔案還有相當(dāng)數(shù)量的紙質(zhì)文檔,要應(yīng)對大數(shù)據(jù)時代的快速變革,迅速完成檔案資料的數(shù)字化勢在必行。在數(shù)字化的同時,實現(xiàn)信息化,也就是添加測繪地理信息自身的屬性信息,除了常規(guī)的元數(shù)據(jù)信息,還要注意采集其歷史檔案的時空屬性,包括檔案產(chǎn)生及入庫的相關(guān)時間、多年來的檔案利用情況、用戶信息等,形成時空地理信息數(shù)據(jù)。通過分析各類地理要素時間維度的變化情況,能夠極大地豐富地理信息的數(shù)據(jù)量,這不是簡單意義上的加減法,而是指數(shù)級的變化,所形成的龐大數(shù)據(jù)源,將有助于對地理要素的變化規(guī)律做出質(zhì)變分析和科學(xué)判斷。
(二)豐富和擴(kuò)展測繪地理信息檔案資源。通過收集歷年的社會政治、經(jīng)濟(jì)、文化、氣候以及政府發(fā)布的各種統(tǒng)計信息,與時空地理信息數(shù)據(jù)進(jìn)行融合處理,可以統(tǒng)計出基于地理信息諸如農(nóng)作物產(chǎn)量和品種變化、城鄉(xiāng)邊界變化、城鎮(zhèn)人口密度變化、生產(chǎn)力布局變化等,在統(tǒng)計數(shù)據(jù)的基礎(chǔ)上采用科學(xué)的方法建立數(shù)學(xué)模型,探尋發(fā)展規(guī)律,為政府的決策、各行業(yè)的智慧發(fā)展提供有價值的信息和參考。
(三)深入挖掘測繪地理信息檔案的信息價值。在時空地理信息數(shù)據(jù)基礎(chǔ)上利用大數(shù)據(jù)技術(shù),對海量的數(shù)據(jù)資源進(jìn)行聚類、分類、相關(guān)性分析,找到數(shù)據(jù)之間的關(guān)系,建立各種數(shù)據(jù)模型,將“死檔案”變?yōu)椤盎钚畔ⅰ保褭n案資源轉(zhuǎn)化為有價值的生產(chǎn)力。在分析統(tǒng)計地理信息的利用情況時,如各區(qū)域利用率和用戶行業(yè)分布,對測繪地理信息的社會需求情況做出精確的判斷,對于指導(dǎo)測繪地理信息生產(chǎn)、地理信息數(shù)據(jù)的充分利用、擴(kuò)大社會服務(wù)面等有極大的幫助。而在結(jié)合了其他行業(yè)統(tǒng)計數(shù)據(jù)后,深入分析這些數(shù)據(jù)與地理信息數(shù)據(jù)的關(guān)系,找出規(guī)律,建立聯(lián)系,就能基于地理空間分析功能提煉出各種高價值含量的信息和知識,促進(jìn)各領(lǐng)域、各方面的智慧發(fā)展。
[1]閻曉峰.大數(shù)據(jù)與檔案資源開發(fā)利用[J].中國檔案,2015(11):16-19.
[2]馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國防科技,2013,34(2):10-17.
[3]耿秋,孟劍.大數(shù)據(jù)時代:機(jī)遇?挑戰(zhàn)?[J].中國新時代,2012(6):60-61.