廖桂芹
中共婁底市委黨校,湖南 婁底 417000
當(dāng)今社會(huì)科技日新月異,大數(shù)據(jù)技術(shù)迅猛發(fā)展,對(duì)我國各行各業(yè)都產(chǎn)生了深遠(yuǎn)影響,檔案學(xué)在大數(shù)據(jù)背景下面臨著前所未有的機(jī)遇和挑戰(zhàn)。檔案科學(xué)具有大量性、增長性、多樣性等特點(diǎn),與“大數(shù)據(jù)”技術(shù)的優(yōu)勢(shì)不謀而合。檔案科學(xué)當(dāng)以此為契機(jī),創(chuàng)新理論、升級(jí)技術(shù)、轉(zhuǎn)變思維,推動(dòng)檔案科學(xué)的進(jìn)一步發(fā)展。
大數(shù)據(jù)技術(shù)利用全新處理模式對(duì)大量數(shù)據(jù)快速處理,可發(fā)掘出海量數(shù)據(jù)背后的有價(jià)值信息。檔案作為記錄社會(huì)科技、工業(yè)、軍事、農(nóng)業(yè)、人文社科等各行各業(yè)的海量數(shù)據(jù)資源庫,迫切需要利用大數(shù)據(jù)技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行一定處理,發(fā)掘出對(duì)我國社會(huì)發(fā)展有用的高價(jià)值信息,但大數(shù)據(jù)背景下我國檔案學(xué)的發(fā)展還存在一些客觀問題。
(一)傳統(tǒng)檔案記錄方式與當(dāng)下大數(shù)據(jù)技術(shù)不匹配,傳統(tǒng)檔案一開始以紙質(zhì)記錄方式為主,隨著計(jì)算機(jī)技術(shù)的革新,逐步發(fā)展為電子文檔記錄和數(shù)字化記錄,最后發(fā)展為今天基于互聯(lián)網(wǎng)技術(shù)的大數(shù)據(jù)時(shí)代[1]。要實(shí)現(xiàn)檔案的大數(shù)據(jù)處理,首先面臨的問題是,如何將傳統(tǒng)紙質(zhì)檔案、電子檔案和數(shù)字文檔中存在的一些非結(jié)構(gòu)化或者半結(jié)構(gòu)化信息數(shù)據(jù)重新編撰存儲(chǔ),以達(dá)到大數(shù)據(jù)處理的基本要求。如海量數(shù)據(jù)資源間需要存在一定的關(guān)聯(lián)或者組合才能通過大數(shù)據(jù)技術(shù)得到有價(jià)值信息,而部分傳統(tǒng)檔案數(shù)據(jù)存儲(chǔ)模式不符合大數(shù)據(jù)技術(shù)所要求的的關(guān)聯(lián)或者組合方式。
(二)傳統(tǒng)檔案資源轉(zhuǎn)化率與大數(shù)據(jù)要求存在沖突,受當(dāng)前檔案管理機(jī)制,存儲(chǔ)容量限度和管理成本等因素影響,傳統(tǒng)檔案對(duì)所記錄信息的實(shí)際價(jià)值有一定要求。檔案記載是有選擇性的將發(fā)生的“大事”歸入檔案,對(duì)從檔案學(xué)角度來說低價(jià)值信息只進(jìn)行簡單記錄或者不予記錄,并且對(duì)于低價(jià)值檔案一般還會(huì)設(shè)置保存年限,到期后進(jìn)行批量銷毀。而大數(shù)據(jù)技術(shù)的特點(diǎn)是從看似無用的海量低價(jià)值信息中,通過數(shù)據(jù)處理挖掘出高價(jià)值信息。這就與傳統(tǒng)檔案中的“價(jià)值”要求出現(xiàn)沖突,因?yàn)榘凑諅鹘y(tǒng)檔案學(xué)中的價(jià)值要求,大數(shù)據(jù)分析所需要的海量數(shù)據(jù)中有一部分是無價(jià)值的。如果將大數(shù)據(jù)所需海量數(shù)據(jù)全部存儲(chǔ),必定會(huì)導(dǎo)致檔案管理成本增加,但如果不存,則無法對(duì)大數(shù)據(jù)挖掘出的高價(jià)值信息形成有力支撐。所以,海量信息的存儲(chǔ)問題是傳統(tǒng)檔案與大數(shù)據(jù)技術(shù)結(jié)合所面臨的的一個(gè)巨大問題[2]。
(三)傳統(tǒng)檔案與大數(shù)據(jù)結(jié)合所面臨的法律問題。政府部門中涉及到國家安全的檔案信息,企業(yè)中涉及到企業(yè)產(chǎn)品核心技術(shù)的檔案信息,還有個(gè)人檔案信息中的隱私問題等,都不允許被大數(shù)據(jù)技術(shù)隨便利用,我國還缺少如何在保護(hù)數(shù)據(jù)安全和隱私的前提下利用大數(shù)據(jù)的相關(guān)法律法規(guī)。
(一)積極轉(zhuǎn)變思維模式,變被動(dòng)提供為主動(dòng)參與[3]。當(dāng)前我國檔案管理基本處于被動(dòng)服務(wù)的觀念,具體說來就是等待用戶上門提出具體需求,然后根據(jù)其需求提供檔案信息服務(wù),用戶對(duì)檔案信息的獲取方式受到很大限制。在當(dāng)前大數(shù)據(jù)技術(shù)應(yīng)用越來越廣的背景下,我國檔案管理應(yīng)積極轉(zhuǎn)變思維模式,變被動(dòng)參與為主動(dòng)出擊,充分利用大數(shù)據(jù)的技術(shù)優(yōu)勢(shì),對(duì)檔案中的碎片化信息進(jìn)行有效整理和分析,形成量化數(shù)據(jù),并將可以公開的信息主動(dòng)共享給用戶,提高檔案信息的社會(huì)價(jià)值。同時(shí)檔案管理還可以為用戶提供個(gè)性化訂制服務(wù),根據(jù)用戶的需求,將用戶所需檔案信息進(jìn)行大數(shù)據(jù)處理,為其判斷提供參考。
(二)加快傳統(tǒng)檔案信息數(shù)字化轉(zhuǎn)換,提高資源利用率。雖然我國已經(jīng)對(duì)傳統(tǒng)檔案進(jìn)行了大量數(shù)字化建設(shè),但目前仍存在未數(shù)字化轉(zhuǎn)換的檔案信息,需進(jìn)一步加快相關(guān)工作的推進(jìn)。由于與載體不可分離的原因,同一檔案可能同時(shí)存在于多個(gè)檔案存儲(chǔ)單位,在數(shù)字化建設(shè)過程中容易產(chǎn)生重復(fù),加重了計(jì)算機(jī)存儲(chǔ)負(fù)擔(dān)。所以需對(duì)除服部分進(jìn)行合理查重,降低檔案數(shù)字化建設(shè)過程中重復(fù)率的出現(xiàn),提高服務(wù)器存儲(chǔ)資源的利用率。
(三)利用互聯(lián)網(wǎng),推進(jìn)檔案信息云共享。云計(jì)算是大數(shù)據(jù)技術(shù)處理海量數(shù)據(jù)的基礎(chǔ),我國各地區(qū)均建有本地檔案庫,傳統(tǒng)檔案存儲(chǔ)方式要實(shí)現(xiàn)地區(qū)間檔案信息的互換和共享存在一定困難。可考慮通過云共享技術(shù),將各地區(qū)甚至全國的檔案通過互聯(lián)網(wǎng)連接在一起,實(shí)現(xiàn)全國檔案信息的資源共享和交換,為大數(shù)據(jù)技術(shù)的實(shí)施提供數(shù)據(jù)支撐。
(四)加快推進(jìn)大數(shù)據(jù)背景下檔案管理的立法工作,大數(shù)據(jù)技術(shù)發(fā)掘出高價(jià)值信息的基礎(chǔ)是基于海量數(shù)據(jù)資源,國家及企業(yè)機(jī)密,個(gè)人隱私信息等越來越受到重視,積極推進(jìn)相關(guān)立法工作,為檔案大數(shù)據(jù)化工作提供必要的法律規(guī)范勢(shì)在必行。
大數(shù)據(jù)技術(shù)作為一種全新的數(shù)據(jù)處理模式,在人們?nèi)粘I钪邪缪葜絹碓街匾慕巧?。大?shù)據(jù)技術(shù)的快速發(fā)展為我國檔案學(xué)數(shù)字化建設(shè)帶來無限機(jī)遇,我們要在檔案管理工作中進(jìn)一步轉(zhuǎn)變思維,創(chuàng)新工作方法,合理利用大數(shù)據(jù)技術(shù),充分發(fā)掘檔案信息中潛在的高價(jià)值信息,創(chuàng)造出更大的社會(huì)效益。