劉娟
摘 要:大數(shù)據(jù)之“大”不在于“大容量”,而在于潛在“大價(jià)值”。高速公路檔案管理者應(yīng)在充分理解大數(shù)據(jù)時(shí)代背景下,分析影響數(shù)字檔案共享的制約因素并從多方面努力為共享創(chuàng)造條件,主動(dòng)服務(wù),利用大數(shù)據(jù)為檔案行業(yè)的發(fā)展帶來(lái)新的生機(jī)。
關(guān)鍵詞:大數(shù)據(jù);共享;檔案
大數(shù)據(jù)是一種歷史現(xiàn)象也是一股新的技術(shù)浪潮,通過(guò)挖掘檔案信息資源,能發(fā)現(xiàn)新的知識(shí)、創(chuàng)造新的價(jià)值。高速公路檔案是指在公路建設(shè)中形成的一系列有價(jià)值的歷史記錄,是國(guó)家檔案的重要構(gòu)成,也是未來(lái)公路建設(shè)的參考依據(jù)。傳統(tǒng)的管理活動(dòng)中,高數(shù)公路檔案的形式有文書、圖表、視頻等。在大數(shù)據(jù)時(shí)代高速公路檔案數(shù)字資源更強(qiáng)調(diào)保存在電子產(chǎn)品(如電腦)中的一些有價(jià)值的數(shù)字信息。隨著數(shù)量的爆炸,數(shù)字檔案的收集、保存、維護(hù),時(shí)間空間兩個(gè)維度共同作用等催生了高速公路數(shù)字資源共享的挑戰(zhàn)。
1 數(shù)字檔案共享意義
1.1 提升本單位檔案工作影響力
檔案是真實(shí)的歷史記錄,是高速公路公司開展科研管理的參考資源?;ヂ?lián)網(wǎng)的發(fā)展使得能在局域網(wǎng)范圍內(nèi)實(shí)現(xiàn)本單位內(nèi)部檔案利用者數(shù)字資源共享,利用者通過(guò)授權(quán)可以全面的了解本單位的歷史沿革、深刻把握各科技工作的內(nèi)在聯(lián)系及各具體高速公路管理的執(zhí)行細(xì)節(jié)。本單位利用者能方便快捷的使用檔案,從數(shù)字資源中吸取科技管理工作的經(jīng)驗(yàn)及教訓(xùn),擴(kuò)大了檔案工作的影響力,進(jìn)而提升內(nèi)部檔案利用者使用檔案的頻次,發(fā)揮檔案在未來(lái)公路建設(shè)中的價(jià)值。
1.2 節(jié)省了利用者的時(shí)間和經(jīng)費(fèi)
傳統(tǒng)檔案管理體制下,如需查詢需先到檔案室進(jìn)行登記再就地查看或借出或以電函的方式利用。就高速公路管理特征來(lái)看,很多技術(shù)工作者都是在現(xiàn)場(chǎng)項(xiàng)目工作,查檔往返耗時(shí)很長(zhǎng),食宿費(fèi)交通費(fèi)也貴。通過(guò)實(shí)現(xiàn)數(shù)字檔案共享利用者只需要身份認(rèn)證就可以在局域網(wǎng)上快速實(shí)現(xiàn)查閱利用,打破了相關(guān)障礙。
1.3 促進(jìn)發(fā)展與交流
前面兩點(diǎn)是針對(duì)本單位檔案利用者而言,通過(guò)“開放數(shù)字檔案”可以使檔案利用進(jìn)一步擴(kuò)大范圍。利用范圍的擴(kuò)大可以提升社會(huì)檔案意識(shí),推動(dòng)檔案行業(yè)向前端行業(yè)不斷推進(jìn)。利用范圍的擴(kuò)大可以促進(jìn)高速公路建設(shè)中與其他單建設(shè)單位的交流,可以促進(jìn)與政府部門、非營(yíng)利性機(jī)構(gòu)的合作。數(shù)字資源不僅可以治國(guó)更可以強(qiáng)國(guó),數(shù)字資源正在成為各行各業(yè)蓬勃發(fā)展最重要的創(chuàng)新資源,檔案行業(yè)也應(yīng)努力把握規(guī)律實(shí)現(xiàn)行業(yè)的飛躍甚至是人類社會(huì)的進(jìn)步。
2 高速公路數(shù)字檔案共享的制約因素
2.1 共享技術(shù)落后
大數(shù)據(jù)時(shí)代共享數(shù)字檔案要有突出的成效需能為不同的利用者提供個(gè)性化的服務(wù)。這是評(píng)價(jià)利用工作的一個(gè)重要標(biāo)準(zhǔn)。若技術(shù)水平落后無(wú)法實(shí)現(xiàn)數(shù)字挖掘,就難以做到高度細(xì)密的定制信息?,F(xiàn)階段技術(shù)僅在覆蓋范圍較小的局域網(wǎng)內(nèi)實(shí)現(xiàn)各種形式的利用,但還談不上個(gè)性化服務(wù)的目標(biāo)。同時(shí),大數(shù)據(jù)時(shí)代共享要有突出的成效需要打破時(shí)空的障礙。在互聯(lián)網(wǎng)時(shí)代遠(yuǎn)程協(xié)作就是一種普遍的服務(wù),若信息技術(shù)水平低才則不能快速實(shí)現(xiàn)計(jì)算機(jī)轉(zhuǎn)化。最后,大數(shù)據(jù)時(shí)代共享數(shù)字檔案需要不斷的更新數(shù)據(jù)、更新技術(shù)。信息時(shí)代三大定律,摩爾定律、吉爾德定律和麥特卡夫定律都表明信息技術(shù)的更迭也非常的快,如移動(dòng)通訊網(wǎng)絡(luò)從2G走向3G再到全面4G現(xiàn)在已經(jīng)開始試點(diǎn)5G,若共享技術(shù)落后便無(wú)法實(shí)現(xiàn)信息技術(shù)的更迭以滿足當(dāng)下更多的利用需求。
2.2 缺乏科學(xué)統(tǒng)籌
大數(shù)據(jù)時(shí)代數(shù)字檔案共享的前提是標(biāo)準(zhǔn)化,其中需要加強(qiáng)對(duì)元數(shù)據(jù)的定義。檔案行業(yè)內(nèi)的數(shù)據(jù)標(biāo)準(zhǔn)制定將起到重要作用。未來(lái)的競(jìng)爭(zhēng)是知識(shí)生產(chǎn)率的競(jìng)爭(zhēng),故必須要對(duì)數(shù)字資源管理工作進(jìn)行統(tǒng)籌,加強(qiáng)數(shù)字檔案的治理。檔案行業(yè)必須對(duì)數(shù)字資源共享的操作流程、數(shù)據(jù)存儲(chǔ)、使用等做出統(tǒng)一的標(biāo)準(zhǔn)與規(guī)范,元數(shù)據(jù)有統(tǒng)一的標(biāo)準(zhǔn)。但大數(shù)據(jù)時(shí)代數(shù)字資源增長(zhǎng)的速度太快,很多標(biāo)準(zhǔn)及規(guī)范只能邊實(shí)施邊制定,標(biāo)準(zhǔn)總體缺乏前瞻性。檔案行政管理部門配套的法律法規(guī)的缺失也為高速公路數(shù)字檔案資源共享的實(shí)現(xiàn)形成了阻礙。受傳統(tǒng)思維和“條塊分割”的管理模式的影響,管理者往往忽視共享,對(duì)共享工作的積極性不夠高,數(shù)字檔案共享工作進(jìn)步緩慢。
2.3 數(shù)字檔案挖掘缺乏深度
由于數(shù)字檔案來(lái)源具有分散性,現(xiàn)沒(méi)有統(tǒng)一對(duì)原始數(shù)據(jù)進(jìn)行分析整合,只是機(jī)械的實(shí)現(xiàn)傳統(tǒng)檔案的數(shù)字化,數(shù)字檔案之間缺乏內(nèi)在聯(lián)系,數(shù)字檔案無(wú)法合理有效利用,使得無(wú)法提供高質(zhì)量的服務(wù)。高速公路檔案數(shù)字檔案錄入時(shí),數(shù)據(jù)缺乏深入挖掘,都只是一次信息,沒(méi)有做二次信息和三次信息的開發(fā),僅是表面數(shù)據(jù),未將潛在數(shù)據(jù)進(jìn)行利用,無(wú)法更好的提供高質(zhì)量的利用服務(wù)。另外數(shù)字檔案數(shù)量豐富,在數(shù)據(jù)挖掘時(shí)需要對(duì)數(shù)據(jù)進(jìn)行分層,首先是鑒定數(shù)字檔案的真假再次是鑒定數(shù)字檔案不同的重要程度?,F(xiàn)實(shí)情況是數(shù)字資源具有非完整性,部分信息是片面或不真實(shí)的,而且沒(méi)有對(duì)信息進(jìn)行篩選分層,因此數(shù)字檔案展現(xiàn)給利用者的形式較為粗放。
3 實(shí)現(xiàn)高速公路檔案數(shù)字檔案共享的舉措
3.1 以深度挖掘數(shù)字檔案信息資源為基礎(chǔ)工作
數(shù)字檔案要實(shí)現(xiàn)共享必須要盡可能對(duì)海量信息資源進(jìn)行加工,形成豐富的資源庫(kù),解決海量的信息資源與復(fù)雜信息加工整序之間的矛盾,提高數(shù)字檔案的準(zhǔn)確性。首先,保證數(shù)字檔案的真實(shí)性是提高數(shù)字檔案準(zhǔn)確性的前提條件。電子文件的內(nèi)容、結(jié)構(gòu)和背景信息是分散保存的。其內(nèi)容和結(jié)構(gòu)信息分散保存在文件系統(tǒng)和數(shù)據(jù)庫(kù)中;一份信息的來(lái)源可能來(lái)自其他多個(gè)文件,如高速公司項(xiàng)目建設(shè)的報(bào)告,可能在應(yīng)用程序中只有數(shù)據(jù)地址,數(shù)據(jù)內(nèi)容仍在數(shù)據(jù)庫(kù)里,在歸檔時(shí)容易出現(xiàn)信息不完整不真實(shí)反映全貌。所以做到數(shù)字檔案在經(jīng)過(guò)傳輸、遷移等處理后與形成時(shí)的原始狀態(tài)一致是一個(gè)重要的前提。管理者要通過(guò)身份認(rèn)證、數(shù)字簽名、權(quán)限控制等方式掌握各種可能的變化并做好防控措施。其次,保證數(shù)字檔案的完整與有效。檔案管理者要明確數(shù)字資源的歸檔范圍(包括相應(yīng)的背景信息和元數(shù)據(jù));要對(duì)有用信息和無(wú)用信息進(jìn)行區(qū)分,既要防止信息不虞又要防止信息相對(duì)過(guò)剩;同時(shí)要注意區(qū)分帶有密級(jí)的電子文件的管理。最后,要做好對(duì)數(shù)字檔案的深度加工。在信息化管理的開端時(shí)期,所形成的檔案大多是單一、雜亂、冗余和非關(guān)聯(lián)性的,這些沒(méi)有被深入加工整理過(guò)的檔案使得利用者的需求不能高效滿足,造成了信息交流的障礙。高速公司建設(shè)工作的不斷發(fā)展與相關(guān)利用者信息交流的滯后構(gòu)成了一種基本矛盾狀態(tài),這也是加強(qiáng)數(shù)字檔案管理的核心問(wèn)題。檔案工作者在管理時(shí)需要將全部的數(shù)字檔案放在一個(gè)“大數(shù)據(jù)”中,形成多個(gè)整體,將多元的零散的數(shù)字資源整合起來(lái),努力開發(fā)二次信息和三次信息。Deepweb是指通過(guò)專門的搜索提問(wèn)才能獲得的網(wǎng)絡(luò)信息,內(nèi)容更豐富、更專業(yè),質(zhì)量較優(yōu),是經(jīng)過(guò)整理的二次信息。Surfaceweb是通過(guò)傳統(tǒng)搜索引擎就可以獲得的網(wǎng)絡(luò)信息,沒(méi)有經(jīng)過(guò)專業(yè)整理,很多都是無(wú)用信息。當(dāng)人們?cè)诶胹urfaceweb獲取信息時(shí),人們承受著“數(shù)據(jù)過(guò)?!钡膲毫?,想要的信息卻總是找不到。對(duì)數(shù)字檔案深度加工就是為了形成類似于deepweb數(shù)據(jù)庫(kù)的數(shù)字資源,利用者可以方便快捷的找到自己真實(shí)需要的數(shù)據(jù)。
3.2 一手抓軟技術(shù)、一手抓硬技術(shù)
軟技術(shù)主要包含管理標(biāo)準(zhǔn)、流程等手段,硬技術(shù)主要包含信息技術(shù)及人財(cái)物的準(zhǔn)備等。第一,軟技術(shù)方面:要統(tǒng)一元數(shù)據(jù)的定義,在大數(shù)據(jù)時(shí)代不同來(lái)源的數(shù)字檔案進(jìn)行管理時(shí)不同的數(shù)據(jù)管理系統(tǒng)之間要進(jìn)行整合,必然要有統(tǒng)一的元數(shù)據(jù)。只有標(biāo)準(zhǔn)化才能促進(jìn)規(guī)劃化、只有規(guī)范化才能形成數(shù)字檔案共享機(jī)制。這是一個(gè)循序漸進(jìn)的管理過(guò)程,以好元數(shù)據(jù)定義打好基礎(chǔ)不僅僅是檔案行業(yè)面臨的挑戰(zhàn),更是各行各業(yè)、整個(gè)時(shí)代的趨勢(shì)。各單位領(lǐng)導(dǎo)應(yīng)該高度重視數(shù)字檔案管理,把標(biāo)準(zhǔn)化在單位進(jìn)行落實(shí);要健全管理制度,檔案行政管理部門要盡快根據(jù)大數(shù)據(jù)時(shí)代的特點(diǎn)發(fā)布相關(guān)的管理制度以指導(dǎo)新時(shí)代的檔案工作,本單位也要結(jié)業(yè)到業(yè)務(wù)工作的專業(yè)性科學(xué)制定本單位數(shù)字檔案開發(fā)的制度。第二,硬技術(shù)方面:應(yīng)多培養(yǎng)復(fù)合型檔案管理人才,并在數(shù)字資源利用活動(dòng)等具體實(shí)踐中激發(fā)管理人員的創(chuàng)新力量,還應(yīng)該將數(shù)字資源的使用、管理舉措等納入到檔案工作人員的培訓(xùn);提高數(shù)字檔案工作經(jīng)費(fèi)并用于上門指導(dǎo)、定期咨詢等宣傳介紹活動(dòng)中,在本單位形成良好的文化氛圍;打造優(yōu)秀的數(shù)字檔案使用平臺(tái)并持續(xù)做好信息技術(shù)維護(hù)。
3.3 以利用者為軸心有層次的開放數(shù)字檔案
檔案工作價(jià)值提升的關(guān)鍵在于數(shù)字檔案共享的實(shí)現(xiàn),數(shù)字檔案共享的前提是數(shù)字資源的開放。開放數(shù)字檔案是指將原始的數(shù)字信息及元數(shù)據(jù)以可以下載的電子格式放在互聯(lián)網(wǎng)上,讓利用者自由使用。開放數(shù)字檔案和公開數(shù)字檔案是兩個(gè)不同的概念,公開是信息層面上的,是一條條;開放是數(shù)據(jù)庫(kù)層面的,是一片一片的,并且開放是有層次性的,這種有層次的開放可以滿足單位建設(shè)的發(fā)展,滿足職工群眾的知情權(quán),讓生產(chǎn)資料的數(shù)字檔案自由的流動(dòng)起來(lái)。只有有層次的開放才能不斷滿足利用者個(gè)性化的利用需求。這其中對(duì)定制信息、數(shù)據(jù)挖掘技術(shù)要求非常的高。同時(shí),本單位要用開放包容的心態(tài)去開展數(shù)字檔案共享工作。數(shù)字檔案質(zhì)量不斷的提升必然會(huì)擴(kuò)大利用者的范圍,利用者會(huì)慢慢的突破高速公路建設(shè)單位的范圍。同行建設(shè)單位、商業(yè)合作機(jī)構(gòu)、檔案局館及路橋市政建設(shè)專業(yè)學(xué)者都是潛在的利用者。這些利用者不會(huì)馬上到來(lái),但在未來(lái)極有可能會(huì)來(lái)臨,因此在開放數(shù)字檔案時(shí)要預(yù)先考慮到擴(kuò)大利用者后的一些管理事項(xiàng),充分考慮到保密的范圍,做好身份驗(yàn)證、信息加密等技術(shù)的基礎(chǔ)工作。避免檔案工作孤軍奮戰(zhàn),加強(qiáng)與業(yè)務(wù)部門、人事、財(cái)務(wù)部門的協(xié)作配合,加強(qiáng)與外部機(jī)構(gòu)的交流,共建共管數(shù)字檔案并實(shí)現(xiàn)共享。
4 結(jié)束語(yǔ)
大數(shù)據(jù)時(shí)代提供了提升檔案的價(jià)值機(jī)會(huì),各單位應(yīng)該抓住機(jī)遇做好數(shù)字檔案的開發(fā)共享工作,推動(dòng)本單位檔案工作的進(jìn)步和檔案行業(yè)的發(fā)展。
參考文獻(xiàn)
[1]軻鑫,馮小慶.軍事檔案數(shù)字信息資源共享方式探析[J].2012年全國(guó)檔案工作者年會(huì)論文集(上).
[2]鄧紹興,陳智為.檔案管理學(xué)(修訂本)[M].中國(guó)人民大學(xué)出版社,1994年.
[3]黨躍武,譚詳金.信息管理導(dǎo)論[M].高等教育出版社,2008年.
[4]王健,文書學(xué)[M].中國(guó)人民大學(xué)出版社,2007年.
[5]蘇立,大數(shù)據(jù)時(shí)代高校數(shù)字檔案共享服務(wù)研究[J].蘭臺(tái)內(nèi)外,2019(2).