王益平
(哈爾濱市水利機械工程公司)
摘 要:隨著計算機技術和互聯(lián)網(wǎng)的不斷發(fā)展和普及,大數(shù)據(jù)時代正在到來。檔案資源作為記錄重大事件的有效數(shù)據(jù)信息,對人類社會發(fā)展有著重要作用。在這樣的時代背景下,檔案資源的相關管理工作也就更加復雜。目前,我國的檔案管理工作中,存在著一定的數(shù)據(jù)安全問題,可用的管理人員也相對較少。檔案的數(shù)字化資源的有效管理工作非常具有難度。本文將主要針對大數(shù)據(jù)時代檔案數(shù)字資源的整合問題作出分析,希望能夠通過討論得出有效的解決措施。
關鍵詞:大數(shù)據(jù)時代;檔案數(shù)字資源;整合;難點;對策
現(xiàn)代化社會中,管理工作者普遍認為數(shù)據(jù)才是管理工作中最重要的元素。隨著大數(shù)據(jù)時代的到來,數(shù)字化資源已經(jīng)逐漸成為主導人類生活的基礎性資源。檔案資源作為記錄人類社會發(fā)展的重要資料,對人類社會有著重要的意義。在大數(shù)據(jù)時代發(fā)展背景下,檔案工作的難度也相應增大。為了使檔案管理工作更加高效、有序的進行,檔案管理相關部門應改進和完善原有的數(shù)據(jù)資源處理方式,這樣才能是檔案管理工作的進行更加科學,從而促進我國檔案事業(yè)的發(fā)展。
1 大數(shù)據(jù)時代背景下檔案資源的特征
大數(shù)據(jù)的構(gòu)成相對較為復雜,所呈現(xiàn)出的狀態(tài)也相對多樣,但其作用本質(zhì)是為了使人類社會向著簡單化發(fā)展。大數(shù)據(jù)的主要思想,就是其“預測”思想。在這種思想的指導下,人類可以找到解決某一問題的新視角與新方法。因此,大數(shù)據(jù)也在社會發(fā)展中得到了廣泛的應用和普及。這樣的發(fā)展趨勢,也會幫助大數(shù)據(jù)在無意間逐漸的改變?nèi)藗兊纳鐣畹姆椒矫婷?。在這之中,人類社會的各種資源也整隨著時代特征出現(xiàn)變化,檔案就是其中的一個具體表現(xiàn)。
1.1 數(shù)據(jù)量大,增長迅速
在大數(shù)據(jù)時代,我國檔案數(shù)字資源建設可分為“增量檔案電子化,存量檔案數(shù)字化”兩大部分二據(jù)國家檔案局的統(tǒng)計資料顯示,我國檔案館館藏檔案資源豐富,僅國家檔案館在}l}ll年的館藏已達3.3億卷,預計到2020年將達到6億多卷州引隨著館藏檔案數(shù)字化工作的推進,它們將匯聚成巨大的檔案數(shù)字資源庫二另一方面,在大數(shù)據(jù)時代,電子檔案的數(shù)量成倍增長二它不僅包含電子文件、圖表、聲像、數(shù)據(jù)庫等,更會包括那些在紙質(zhì)保管時代,因單位信息價值低經(jīng)鑒定沒有歸檔價值的原始記錄,如訪間日志、瀏覽軌跡等二因為大數(shù)據(jù)技術能挖掘出以前無法為人們所發(fā)現(xiàn)的數(shù)據(jù)的潛在價值,因此有必要對數(shù)據(jù)的檔案屬性進行重新鑒定,自然會有海量數(shù)據(jù)新增到檔案領域。
1.2 檔案資源分布廣泛
在大數(shù)據(jù)時代,信息資源的分布更加廣泛。隨著人類對數(shù)字資源逐漸增加的使用與探索,數(shù)字資源的發(fā)展速度整逐漸加快。加之移動終端的飛速發(fā)展更導致了數(shù)據(jù)產(chǎn)生方式呈現(xiàn)出多樣性的特征二可見,大數(shù)據(jù)時代的檔案數(shù)字資源將廣泛存在于不同的信息系統(tǒng)中,會帶有明顯的時空特性,呈現(xiàn)出結(jié)構(gòu)化信息、半結(jié)構(gòu)化信息和非結(jié)構(gòu)化信息相融合的態(tài)勢,形成分布廣泛的大量異構(gòu)數(shù)據(jù)。
1.3 數(shù)據(jù)資源的高度可靠性
在資源的利用過程中,人們最為注重的是資源是否真實、可靠。大數(shù)據(jù)時代背景下,資源本身數(shù)量十分巨大,這就導致了人們獲取信息的價值密度正在相應的減小?,F(xiàn)實生活中,對于不了解的事實,人們更加傾向于通過查閱資料來增進自己對其的認識,進而在根據(jù)所了解到的事實作出判斷。作為記錄人類社會的事件的重要信息,檔案具有其他資料所不具備的真實性。它是人們普遍相信的最可靠的信息來源。在大數(shù)據(jù)的背景中,工作人員應利用大數(shù)據(jù)的基本知識,完成對檔案資源的進一步開發(fā)和管理,以實現(xiàn)檔案資源的存在價值。
2 數(shù)字化檔案資源的整合
隨著大數(shù)據(jù)運用的逐漸深入,繁多的檔案資源在整合的過程中存在著很多重要的問題。其中,檔案數(shù)據(jù)的存儲安全問題和隱私保護問題,是必須得到高效保障的。另外,隨著檔案數(shù)據(jù)的增多,管理人員的數(shù)量問題也是一個必須要解決的難點問題。
2.1 數(shù)據(jù)存儲間題
在大數(shù)據(jù)時代,檔案數(shù)字資源整合的首要挑戰(zhàn)來自數(shù)據(jù)存儲。一是檔案管理系統(tǒng)在面對海量數(shù)據(jù)時需要高可擴展性的支撐二而目前集中式的數(shù)據(jù)存儲和管理模式非但資金投入較大,更無法適應檔案數(shù)字資源體量激增的新情況,在檔案數(shù)字資源的高效存儲和快捷訪間方面面臨嚴峻挑戰(zhàn)。二是目前基于關系型數(shù)據(jù)庫研發(fā)的檔案管理系統(tǒng)無法適應大數(shù)據(jù)時代占數(shù)據(jù)總量80%以下的非結(jié)構(gòu)化數(shù)據(jù)存儲和處理的需要。
2.2 數(shù)據(jù)分析間題
大數(shù)據(jù)時代是一個泛在信息、泛在知識的時代,隨著信息化程度的加深,檔案數(shù)字資源的來源結(jié)構(gòu)將發(fā)生巨大變化,傳統(tǒng)的基于封閉的結(jié)構(gòu)化數(shù)據(jù)進行的數(shù)據(jù)挖掘算法在分析處理非結(jié)構(gòu)化數(shù)據(jù)時存在局限。而且,要獲得大數(shù)據(jù)分析的價值,就應關注檔案數(shù)字資源中的數(shù)據(jù)關系和語義表征,實現(xiàn)信息整合與知識整合。但目前檔案數(shù)字資源整合還處于數(shù)據(jù)整合階段,偏重于實現(xiàn)異質(zhì)異構(gòu)數(shù)據(jù)在物理或邏輯上的集中和互聯(lián)互通,僅能為用戶提供信息檢索服務,這與大數(shù)據(jù)時代的要求相去甚遠。
2.3 安全隱私間題
檔案數(shù)字資源不同于其它信息資源,它是國家和社會精心挑選并保存下來的真實的歷史記錄,其中包含著大量國家秘密、工作秘密、個人隱私等重要信啟、,事關國計民生。在大數(shù)據(jù)時代,如何對檔案數(shù)字資源中敏感數(shù)據(jù)的所有權(quán)和使用權(quán)做出明確界定?如何選擇合適的安全防護策略以適應數(shù)據(jù)非線性增長的需求,杜絕安全隱患?如何應對大數(shù)據(jù)分布式處理帶來的數(shù)據(jù)、隱私等的泄露風險?這些都是擺在我們面前不可回避的重要課題。
3 解決問題的對策
想要解決資源整合問題,就需要對檔案數(shù)字資源的管理工作進行相關改進。工作人員需要靈活應用云技術和數(shù)字處理技術,來提高檔案部門的工作效率。
大數(shù)據(jù)時代賦予了檔案數(shù)字資源新的特征,因此要實現(xiàn)其整合在很大程度上考驗著檔案基礎數(shù)據(jù)的質(zhì)與量。這就要求檔案工作者突破固有狹義的檔案資源觀的局限,在大數(shù)據(jù)技術和理念的指引下,積極構(gòu)建適應大數(shù)據(jù)時代的“大檔案觀”。即要從“社會記憶”的高度重新審視檔案數(shù)字資源的構(gòu)成范圍和收集視角,改變過去以黨政機關文書檔案為主體的收集模式,加大對社會民生、對個人等復雜化、碎片化信息的關注,使檔案能真正反映政治、經(jīng)濟、科技、文化、社會生活等的全貌,反映國家和社會的實時變遷。
從技術上來說,實現(xiàn)大數(shù)據(jù)時代檔案數(shù)字資源整合的關鍵是要建立適應大數(shù)據(jù)要求的檔案數(shù)字資源分析生態(tài)系統(tǒng),這就需要云計算技術與大數(shù)據(jù)處理工具的協(xié)調(diào)配合。云計算(Cloud Computing)技術具有虛擬資源池化、高可擴展性、高可靠性、按需付費、泛在接入等顯著的特征。它適應了大數(shù)據(jù)時代分布式存儲與海量數(shù)據(jù)并行處理的需要,實現(xiàn)了計算機資源的服務化,是大數(shù)據(jù)時代擋案數(shù)字資源整合的基礎平臺和支撐技術。
結(jié)束語
為適應大數(shù)據(jù)時代的發(fā)展趨勢,檔案數(shù)字資源整合工作必須得到有效的保障。相關工作人員應該對目前工作中存在的難點問題進行深入的研究和解決,以推動我國檔案數(shù)字資源的發(fā)展,進而使整個檔案管理工作能夠適應大數(shù)據(jù)時代的發(fā)展趨勢。
參考文獻
[1]周峰林大數(shù)據(jù)時代的數(shù)字檔案館(室)建設——專訪國家檔案局檔案館(室)業(yè)務指導司司長孫鋼[J]浙江檔案,2013.(8).
[2]楊冬權(quán)關于隨館藏數(shù)量增加而相應增加各級國家檔案館人員編制的提案[N].中國檔案報,2013-03-07.
[3]馮惠玲,張輯哲檔案學概論隊[N].北京:中國人民大學出版社,2006.endprint