文/國家海洋局東海信息中心 張春艷 孫杰 蔡夢凡
計算機技術(shù)革命性地改變世界,全面融入社會生活,帶來的信息積累的速度和信息量爆炸式增長引發(fā)新的變革?!按髷?shù)據(jù)”,順勢而生,它是具有更強的決策力、洞察力、流程優(yōu)化能力、高增長率和多樣化的信息資產(chǎn),同時具有容量大、多樣、快速、價值密度相對較低的特點。大數(shù)據(jù)技術(shù)在海洋領(lǐng)域的戰(zhàn)略意義不在于掌握的數(shù)據(jù)信息的數(shù)量,而是在于對這些有意義的數(shù)據(jù)進行專業(yè)化處理體現(xiàn)其價值。比如我們可以通過收集、分析歷年的海洋災情數(shù)據(jù),包括臺風風暴潮、海浪災害等,并對數(shù)據(jù)進行比較分析,建立一個特定的數(shù)學模型,深入研究海洋災害歷史性影響范圍,為海洋防災減災提供輔助決策支撐。
(一)傳統(tǒng)海洋檔案來源有限。傳統(tǒng)的海洋檔案數(shù)據(jù)來源基本靠延遲歸檔的海洋檔案資料。這些資料主要來自日常的海洋行政管理和海洋業(yè)務工作包括海洋臺站觀測、船舶設備管理、船舶測報、海洋專題調(diào)查、海洋斷面調(diào)查、基本建設等。
(二)傳統(tǒng)海洋檔案載體單一。從國家海洋局兩次歷史檔案進館內(nèi)容來看,紙質(zhì)檔案占主導。東海區(qū)移交至中國海洋檔案館1965-2000年檔案中紙質(zhì)檔案7500余卷。其中第一次移交進館的1965-1982年產(chǎn)生的檔案3400余卷,均為紙質(zhì)檔案材料。第二次移交進館1983-2000年歷史檔案,紙質(zhì)檔案約4100余卷,僅有少量的照片檔案,聲像檔案、史料檔案。
(三)海洋檔案類型固定。海洋檔案主要是在履行業(yè)務職能和承擔各類項目等活動中形成的科技檔案,以及在管理工作中形成的機關(guān)文書檔案。1965-2000年間產(chǎn)生的檔案多為海洋科技檔案。這些科技檔案中多數(shù)為海洋臺站觀測記錄,類型和格式都相對固定。
(四)傳統(tǒng)檔案數(shù)量增長穩(wěn)定。通過國家海洋局東海分局(以下簡稱東海分局)兩次歷史檔案進館分析過去30年海洋檔案的增長速度:第一次檔案進館檔案海濱觀測和東海標準斷面調(diào)查分別為1779卷、230卷,與第二次進館數(shù)量對比2029卷、274卷相差不大,見“圖1”。
圖1 兩次歷史檔案進館卷數(shù)比較
21世紀是海洋世紀,為了實現(xiàn)我國的“海洋強國”戰(zhàn)略,海洋科技實力不斷提高,海洋檔案作為各類海洋活動記錄載體也發(fā)生了歷史性的變革。
(一)與傳統(tǒng)檔案的對比。1.海洋檔案數(shù)據(jù)來源多頭、載體多樣。隨著海洋業(yè)務的擴展和先進的海洋儀器的大量采用,數(shù)據(jù)來源越來越廣,數(shù)據(jù)量越來越大。業(yè)務系統(tǒng)傳輸數(shù)據(jù)、業(yè)務系統(tǒng)的加工數(shù)據(jù)、收集資料等都納入了海洋檔案歸檔范圍中。同時,海洋檔案的外延不斷延伸,檔案載體和形式也千姿百態(tài)?,F(xiàn)代海洋檔案涵蓋了紙質(zhì)(含照片和圖件)、錄音帶、錄像帶、磁盤、光盤、硬盤、底片、膠片、幻燈片和實物等不同的載體形式。2.海洋檔案類型及屬性更復雜。在海洋業(yè)務中,進行海洋地質(zhì)勘探、水下地形測量、海洋環(huán)境監(jiān)測、水動力要素觀測、氣象要素觀測、生物種類鑒定、放化殘毒分析、海洋環(huán)境要素預報、海洋災害預測預報等活動過程中形成了大量的檔案文獻、專業(yè)基礎數(shù)據(jù)等資料。在實際的實施上,由于有多個系統(tǒng)記錄的海洋信息的各種數(shù)據(jù),形成了非常密集的記錄。這些記錄所涵蓋的信息包羅萬象,既有時間維度,也有地理維度,同時還有頻率維度、區(qū)域維度、站點維度等等。3.現(xiàn)代海洋檔案數(shù)據(jù)量增長快。隨著聲光電等高科技手段在海洋業(yè)務中的應用、數(shù)字信息及載體的迅猛發(fā)展、現(xiàn)代智能技術(shù)和信息技術(shù)與海洋裝備和海洋活動相結(jié)合,07年開始東海區(qū)部分臺站數(shù)據(jù)電子化,到09年基本所有臺站都實現(xiàn)自動化觀測,在日常運營中生成、海洋實時傳輸中產(chǎn)生的數(shù)據(jù)以每分MB的速度累積。4.海洋檔案需求多樣性呈現(xiàn)個性化趨勢。隨著海洋業(yè)務的擴展,使海洋科技檔案和資料工作不斷發(fā)揮作用,這就對海洋檔案的利用提出了新的更高要求,更快,更準、更全。傳統(tǒng)的海洋檔案服務是比較狹隘和單一的,一般情況是在知道某個明確需求(某份文件)下,檔案人員為此提供一對一的服務。在傳統(tǒng)的檔案信息化技術(shù)下,通過數(shù)字化手段和數(shù)字檔案館的建設檔案服務水平得到一些提升,但同樣是面臨服務單一的問題。一是嚴重依賴于檔案管理水平,比如著錄的準確度、詳細度。二是在跨類別、跨庫檢索上會有缺陷。大數(shù)據(jù)時代背景下,為滿足業(yè)務需求,海洋檔案服務向多元化發(fā)展,以提供海洋檔案信息服務(憑證參考作用)、電子信息利用服務(文檔類)、數(shù)據(jù)資料服務(電子資料)、數(shù)據(jù)產(chǎn)品服務這四類為主。
圖2 1965-2010年東海分局發(fā)展歷程
(二)發(fā)展變革原因。1.海洋業(yè)務的擴展。1965-2000年,海洋局的職能歷經(jīng)8次調(diào)整,經(jīng)歷了艱苦創(chuàng)業(yè)時期、改革發(fā)展時期、依法管海時期3個階段。海洋檔案依托于海洋事業(yè)的發(fā)展,不同的海洋活動產(chǎn)生不同的資料,隨著業(yè)務的發(fā)展海洋檔案類型不斷新增,見“圖2”。以海濱觀測為例,觀測臺站由最初的20個臺站,發(fā)展到現(xiàn)在50多個,其中近半數(shù)為現(xiàn)代自動化觀測站。隨著海濱觀測業(yè)務的不斷發(fā)展完善,1958-2006年海濱觀測規(guī)范,經(jīng)歷了6個版本的變遷,在觀測要素、觀測方法、記錄方式等方面做了許多調(diào)整和改動。2.海洋科學技術(shù)發(fā)展。隨著時代的進步與科學技術(shù)的發(fā)展,海洋事業(yè)實現(xiàn)了前所未有的飛躍。高科技多媒體的聲光電技術(shù),成為現(xiàn)代化海洋科技發(fā)展中不可缺少的輔助手段之一,其應用越來越廣泛,并且隨著技術(shù)的提高與種類的多樣化,越來越起著拓寬海洋業(yè)務手段和范圍的作用。地波雷達、海上大型浮標的布設、船用測量儀器、聲學儀器、以及GPS技術(shù)等其他高精尖手段廣泛應用于日常的海洋觀監(jiān)測、勘察、調(diào)查等科學研究過程中。海洋物探、水文調(diào)查、地形地貌調(diào)查、觀測預報、測繪等工作的數(shù)字化產(chǎn)生,海洋科技檔案也隨之從傳統(tǒng)的紙質(zhì)檔案逐漸轉(zhuǎn)變?yōu)殡娮訖n案。3.新時代要求。與全球性的海洋開發(fā)利用熱潮相適應,海洋信息化進程不斷加快,中國近?!皵?shù)字海洋”信息基礎框架建設完成,各海洋專題服務網(wǎng)站建設不斷完善,海洋綜合管理信息系統(tǒng)建設得到深化拓展。同時,“智慧海洋”也要求將各類海洋信息資源整合在一起,海洋檔案作為重要的海洋信息資源,探索大數(shù)據(jù)技術(shù)在海洋檔案方面的應用是“智慧海洋”的內(nèi)在要求。
(三)大數(shù)據(jù)技術(shù)應用。在大數(shù)據(jù)時代,利用大數(shù)據(jù)技術(shù)從大量的電子化和數(shù)字化海洋檔案文獻、專業(yè)基礎數(shù)據(jù)中實現(xiàn)智能化檢索檔案,探索非結(jié)構(gòu)化檔案文獻的關(guān)系、災害趨勢預測、災害處置預案推薦分析、觀測數(shù)據(jù)的挖掘分析等。在節(jié)約人力和物力的同時能夠高效實現(xiàn)檔案文獻分類整理檢索、專業(yè)基礎數(shù)據(jù)挖掘分析,給用戶呈現(xiàn)精細化、直觀的、動態(tài)的、趨勢的專業(yè)數(shù)據(jù)分析結(jié)果。1.與傳統(tǒng)海洋數(shù)據(jù)分析對比。傳統(tǒng)意義上的數(shù)據(jù)是賦值的數(shù)字,大數(shù)據(jù)時代的數(shù)據(jù)內(nèi)涵和概念擴展為數(shù)字和信息的統(tǒng)稱?,F(xiàn)在的海洋業(yè)務中大數(shù)據(jù)分析,跟傳統(tǒng)意義的分析有一個本質(zhì)區(qū)別,就是傳統(tǒng)的分析是基于結(jié)構(gòu)化、關(guān)系型的數(shù)據(jù),而且往往是取一個很小的數(shù)據(jù)集,來對整個海洋數(shù)據(jù)進行預測和判斷。但現(xiàn)在是大數(shù)據(jù)時代,理念已完全改變,現(xiàn)在的海洋大數(shù)據(jù)分析是對整個數(shù)據(jù)全集直接進行存儲和管理分析。2.大數(shù)據(jù)分析技術(shù)在海洋檔案中的應用。大數(shù)據(jù)分析采用的模式識別技術(shù)、圖文轉(zhuǎn)換技術(shù)、語義分析技術(shù)、地理信息技術(shù)等成為關(guān)鍵技術(shù)。通過對涉海海洋檔案、文獻,海洋活動數(shù)據(jù)充分獲取,應用大數(shù)據(jù)的方法和技術(shù)處理(ETL),收集、過濾、加工、分析、展現(xiàn)并提供開放的信息訪問接口。用戶通過訪問數(shù)據(jù)接口,提供數(shù)據(jù)處理的展示平臺,也可以進一步為各類用戶、系統(tǒng)開發(fā)所需的個性化數(shù)據(jù)服務。大數(shù)據(jù)分析的工具從長期來說可以提高工作效率,優(yōu)化人力資源分配,促進海洋各項工作的進展。目前國家海洋局東海信息中心正在探索建設的東海檔案數(shù)據(jù)庫管理系統(tǒng)就是大數(shù)據(jù)技術(shù)在海洋檔案方面應用的典型?;趯n案文獻和專業(yè)數(shù)據(jù)等數(shù)據(jù)清洗、整理、轉(zhuǎn)換、展現(xiàn)應用計算機模型建立海洋檔案智能檢索及專業(yè)數(shù)據(jù)分析系統(tǒng)平臺,從多個視角、多個層次、多個維度碎片化檔案文獻數(shù)據(jù)、刻畫海洋觀測、監(jiān)測的高清數(shù)據(jù)畫像,進一步分析檔案數(shù)據(jù)、實時監(jiān)測數(shù)據(jù),為更好地管理和利用海洋提供數(shù)字支持。
當代海洋檔案發(fā)展,既要有較高的學術(shù)和價值定位,又要符合大數(shù)據(jù)的時代背景。同時,還要不斷地利用現(xiàn)代信息化手段,讓海洋檔案資料充分應用和投入到海洋生產(chǎn)、再生產(chǎn)等實踐過程中,為海洋業(yè)務決策提供相應的數(shù)據(jù)、信息支撐,優(yōu)化決策,造福于民。