任力
摘 要:該文從當前新技術時代的特征出發(fā),概述數據處理、人工智能、網絡技術等時代背景下,大數據對傳統檔案信息管理的沖擊。分析了大數據技術時代,檔案信息管理在管理思維與管理方法等方面的變化與變革。思維方面,從注重保存到檔案保存與開發(fā)并重;方法方面,從平面單機檔案數據管理到智能化、可實現大數據分析與處理的立體網絡化檔案管理新方式;最后,提出應對大數據技術時代檔案信息管理新要求的對策。
關鍵詞:大數據技術 檔案管理 理念 思維 方法 變革
中圖分類號:G270.7 文獻標識碼:A 文章編號:1672-3791(2016)11(b)-0023-02
在這個科技飛速發(fā)展的年代,新技術的不斷涌現成為推動整個社會前行的發(fā)動機。大數據、云計算、人工智能等每一次技術的進步和革新,都滲透到社會的各個行業(yè)和領域,在引領社會變革的同時,使之快步走入信息化時代。在檔案界,新技術的應用和管理正成為不斷深入研究的課題,檔案工作的發(fā)展理念、工作目標和實施路徑發(fā)生了深刻的改變,檔案事業(yè)的發(fā)展正邁向更廣闊的未來。
1 大數據時代檔案管理所涉新技術的發(fā)展特征
1.1 數據處理技術
當今的檔案數據正在向電子化過渡,檔案信息已經成為存儲在某種介質上能被相應電子設備識別的物理符號。與紙質數據相比,它是對一定事實、概念或指令的一種全新的表達形式。隨著計算機和網絡技術的發(fā)展,數據信息的處理更加高效和便捷。面對海量、無序的數據,應用計算機軟件程序,人們能夠對數據進行快速的采集、存儲、檢索、加工、變換和傳輸,并通過各種數據處理的應用軟件包,將數據提取并演算出有價值和意義的信息。數據處理技術是檔案管理的重要環(huán)節(jié),隨著新技術的不斷發(fā)展和創(chuàng)新,檔案工作才得以向系統化和自動化發(fā)展。當前檔案數據處理工作主要依靠計算機和網絡來支撐,依據不同電子處理設備的結構、工作方式或時空分布,對各種原始數據的分析、整理、計算、編輯等的加工和處理,由相應的軟硬件來共同完成。
1.2 人工智能技術
人工智能被稱為世界三大頂尖技術之一,其目的是讓機器來替代人類智慧才能完成的復雜工作。作為計算機科學的一個分支,通過了解和掌握智能的實質,以此設計和生產出近似或高于人類智能的儀器和設備,讓機器來完成人類的智能工作。該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。2016年3月基于人工智能的圍棋程序阿爾法狗戰(zhàn)勝了世界冠軍李世石,標志著人工智能已經向實踐應用領域取得了突破性的進展。面對多元化的檔案信息資源,檔案數據規(guī)模的幾何式增長,檔案社會化程度的不斷提升,檔案管理工作也應更加智慧和智能,而人工智能技術也終將成為檔案信息化建設的技術引擎。
1.3 計算機網絡技術
計算機網絡將處于不同地理位置的計算機相連接,以實現信息檢索、網絡通信、辦公自動化、電子商務和遠程教育等功能。當今世界已進入全球化、高速和智能的網絡時代,一個巨型的“虛擬世界”在逐步形成,人們可以足不出戶的實現互動和交流,現實生活向數字化發(fā)展。計算機網絡技術也為檔案管理工作插上了翅膀,每一項網絡新技術的出現都極大的促進了檔案管理工作效率和水平的提高,在當前的檔案信息化建設中,云計算、數據挖掘和物聯網技術的不斷成熟和完善,解決了傳統檔案受時間和空間的限制,實現了檔案信息的高效檢索和利用,真正實現了其在人類記憶、信息服務和文化傳承等方面的社會功能。
2 大數據技術時代檔案信息管理面臨的挑戰(zhàn)與變革
2.1 大數據技術時代檔案管理思維的變化
從何種角度、層次、方式去管理、開發(fā)和利用檔案,取決于每個檔案管理者的思維方式。隨著科學技術的發(fā)展,傳統的分類、比較、歸納和演繹的檔案學邏輯思維方式,往往將檔案管理局限在文字館藏的管理上,面對檔案資源范疇和信息形式的變化,以及互聯網、移動終端和個人電腦等產生的電子檔案數據,以傳統的鑒定和整理思維加以處理,很難從檔案中挖掘出高價值的有效信息。因此面對大數據時代的來臨,檔案工作者應當采用擴散型和橫向型的思維,關注檔案事業(yè)發(fā)展的整體性和多維性,從信息科學汲取養(yǎng)分,改變單純的以保存、檢索等為主要的檔案信息服務理念,將網絡化、智能化的檔案數據挖掘和分析工作當成未來檔案服務的主要方式,真正體現檔案信息的價值,滿足檔案工作的社會化需求。
2.2 大數據技術時代檔案管理方法的變革
檔案管理工作肩負著對檔案信息采集、整理、鑒定、存儲和檢索等任務,具有社會記憶、信息服務和文化傳承等社會職責。在傳統的檔案管理方式下,對檔案數據往往是孤立、扁平和簡單化的處理模式,對海量數據缺乏一種立體和智能化的技術手段,大量死檔案和低價值數據是各檔案管理部門普遍存在的通病。而在大數據時代下,云計算、大數據分析、人工智能等技術的出現,使主動利用檔案成為可能,不同的檔案管理部門,可以針對自身檔案數據的特點和屬性,利用基于不同數據模型而開發(fā)的軟硬件系統,對本單位的海量數據進行相關性分析,從而滿足檔案管理者和使用者的需求,使檔案更加價值和意義。
3 應對大數據技術時代要求的檔案信息管理策略
3.1 利用人工智能技術,對檔案資源進行采集、分類和管理
人工智能技術的飛速發(fā)展使檔案智能管理的實現成為可能,檔案信息擺脫了傳統載體的限制,在計算機網絡中,應用基于自然語言搜索、云計算和數據挖掘等技術,在各種軟硬件的相互配合下,能夠完成從檔案資源的采集、分類、存儲、鑒定、安全、分析、檢索等一系列的檔案管理業(yè)務,有效提升檔案信息化建設水平。以檔案數據收集為例:文本挖掘是人工智能中最早實現的技術之一,面對浩如煙海的檔案信息資料,想要收集滿足自身需要的有價值數據,憑借人力是根本不可能實現的。而應用基于人工智能技術的數據挖掘產品智能Agent,通過關鍵詞檢索和智能分析系統,能夠在海量信息中搜索和提取到網絡資源中幾乎全部的數字化成果,使檔案的檢索和利用更加的方便和快捷。
3.2 基于大數據技術下的檔案信息資源的共建與共享
“運用互聯網和大數據加強橫向聯系,讓數據多跑路,群眾少跑腿”是近期國務院對滿足百姓信息需求的新倡導。對檔案管理工作而言,也就是利用大數據技術實現檔案信息資源的共建和共享。大數據本身的物性是經過數字化后被存儲的可被識別的物理代碼,其真正意義在于能夠從這些海量的信息中提取和利用有價值的部分。也就是利用互聯網和大數據的相關技術,使數據更加公開和透明,實現不同部門間、不同社會群體間的信息傳導和利用,為檔案管理者和服務對象提供數據支撐,充分體現檔案管理工作的社會價值。應在檔案信息共建共享的原則、技術和設備、實施路徑、安全性等方面制定詳細和可行的規(guī)劃,從而確保檔案管理的社會價值最大化實現。
3.3 應用數據挖掘技術,對檔案信息進行開發(fā)和利用
當前我國檔案管理的自動化、網絡化工作已經基本實現,很多檔案管理部門都能利用計算機軟件或網絡平臺,對檔案工作所產生的海量數據信息進行記錄、整理和分析,并從中挖掘有價值的信息,為檔案業(yè)務信息的管理提供可以參考的決策信息,為檔案數據資源的優(yōu)化和整合,檔案服務的便捷和高效提供了一定的技術支撐。但在檔案數據的深層次處理方面,由于分析方法和技術上的缺失,在對大規(guī)模數據處理上仍顯不足。而隨著數據挖掘技術的日趨成熟,人們可以通過特定的算法和模型,對數據進行總結、分類發(fā)現、聚類和關聯,對檔案數據進行更高層次的抽象,提高檔案資源的實際利用率。檔案管理部門應積極應用最新的數據挖掘技術,將傳統的數據保管模式向數據開發(fā)和利用模式轉變,將檔案服務從被動向信息的主動提供者轉型。
參考文獻
[1]周林興,周振國.高校檔案館、博物館數字資源整合研究[J].檔案管理,2014(5):10-14.
[2]張芳霖,唐霜.大數據影響下檔案學發(fā)展趨勢的思考[J].北京檔案,2014(9):9-13.
[3]楊來青,徐明君,鄒杰.檔案館未來發(fā)展的新前景:智慧檔案館[J].中國檔案,2013(2):68-70.