文/李瑞 姜?dú)J芳
大數(shù)據(jù)技術(shù)逐漸趨于成熟,為檔案資源管理開拓了新視野,推動(dòng)了檔案資源向信息化方向發(fā)展,對(duì)檔案資源的工作方式產(chǎn)生巨大改變,同時(shí)充分利用了檔案資源的價(jià)值。本文介紹了檔案資源管理工作的現(xiàn)狀及存在問題,分析了大數(shù)據(jù)環(huán)境下檔案資源的技術(shù)發(fā)展特征,重點(diǎn)分析了檔案資源在信息時(shí)代的工作方式,提出了檔案資源管理工作在大數(shù)據(jù)環(huán)境下的具體措施建議
大數(shù)據(jù)(Big data),或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)規(guī)模巨大到無法通過人工在合理時(shí)間內(nèi)達(dá)到截取、管理、處理,并整理成為人類所能解讀的信息[1-2]。隨著不同行業(yè)越來越多地應(yīng)用大數(shù)據(jù)技術(shù),其發(fā)揮的作用也越來越重要。在客戶服務(wù)、業(yè)務(wù)流程、改善生活、提高醫(yī)療和研發(fā)等多方提供作用。大數(shù)據(jù)環(huán)境是指一個(gè)由技術(shù)來驅(qū)動(dòng)社會(huì),由數(shù)據(jù)來傳遞信息,其數(shù)據(jù)和人類生活密切聯(lián)系的人文環(huán)境。大數(shù)據(jù)環(huán)境下,其數(shù)據(jù)具有可信性,數(shù)據(jù)產(chǎn)生方式具有持續(xù)性,社會(huì)具有互聯(lián)互通性,實(shí)踐具有智能性[3]。當(dāng)今,在大數(shù)據(jù)環(huán)境影響下的社會(huì),檔案資源信息的管理模式已經(jīng)開始拋棄傳統(tǒng)的紙質(zhì)儲(chǔ)存,開始向電子化、互聯(lián)網(wǎng)+方向發(fā)展,逐漸轉(zhuǎn)化為一種物理符號(hào),其能被電子設(shè)備識(shí)別并進(jìn)行處理。就現(xiàn)有的檔案信息的數(shù)量規(guī)模而言,現(xiàn)有的檔案中也存在“大數(shù)據(jù)”。這種檔案大數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)量巨大、數(shù)據(jù)類型繁多、價(jià)值密度低、處理速度快[4]。這種應(yīng)用作為工具,是對(duì)檔案的價(jià)值利用與提升,并將會(huì)改變社會(huì)對(duì)于數(shù)據(jù)與檔案的認(rèn)知。
隨著中國(guó)信息化、現(xiàn)代化的發(fā)展,各個(gè)行業(yè)的數(shù)據(jù)量與檔案資源量也直線上升,給檔案信息的工作方式帶來了很大的挑戰(zhàn)。
在一般單位中,檔案信息管理作為基礎(chǔ)性工作并未受到足夠重視。單位的主管者一般將管理精力主要集中在業(yè)務(wù)上,不夠重視檔案資源管理工作。很多單位并沒有認(rèn)識(shí)到檔案數(shù)據(jù)管理工作的重要作用,仍然按照傳統(tǒng)的管理觀念和模式展開工作,并且在檔案資源的管理過程中,沒有投入足夠的資金,致使檔案資源管理的軟硬件設(shè)施配備不健全,不利于檔案資源管理工作的順利開展。
如今,在實(shí)際的檔案資源管理過程中,其管理模式依然照搬傳統(tǒng)的檔案管理思維。具體表現(xiàn)就是重視傳統(tǒng)紙質(zhì)檔案管理,不重視互聯(lián)網(wǎng)+信息化、電子化檔案資源管理,很少體現(xiàn)檔案的利用價(jià)值。對(duì)于檔案,仍以以前傳統(tǒng)管理思維進(jìn)行處理,認(rèn)為其只需進(jìn)行整理歸檔,很少將大數(shù)據(jù)思維運(yùn)用于檔案資源價(jià)值的挖掘利用之中,因此許多具有高價(jià)值的信息挖掘、提取不出來。
在如今信息化高速發(fā)展的時(shí)代,從事檔案資源管理工作的檔案人員需要有更多關(guān)于大數(shù)據(jù)技術(shù)的知識(shí)儲(chǔ)備。如上文所說,現(xiàn)今社會(huì)中,檔案信息的管理方式要轉(zhuǎn)整理為應(yīng)用,逐步體現(xiàn)、提取檔案中的利用價(jià)值。在這種要求下,檔案資源管理者除了需要具備傳統(tǒng)的檔案管理知識(shí),還需要對(duì)云計(jì)算技術(shù)、計(jì)算機(jī)應(yīng)用技術(shù)以及大數(shù)據(jù)技術(shù)有一定了解。并能在對(duì)檔案資源信息進(jìn)行收集和歸納整理的基礎(chǔ)上,進(jìn)一步對(duì)檔案資源數(shù)據(jù)背后所隱藏的高價(jià)值信息進(jìn)行探索提取。但是,目前絕大多數(shù)檔案管理人員對(duì)于“大數(shù)據(jù)”很陌生,對(duì)大數(shù)據(jù)的概念不清楚,對(duì)大數(shù)據(jù)的基本技術(shù)不掌握,這就造成了現(xiàn)在的檔案管理理念仍為過去傳統(tǒng)的檔案信息管理理念,這樣的陳舊思想是不能適應(yīng)大數(shù)據(jù)環(huán)境下檔案資源管理工作方式需求的。
在大數(shù)據(jù)環(huán)境下,檔案數(shù)據(jù)主要來自于接收各種渠道的原始文件。為了實(shí)現(xiàn)數(shù)字檔案數(shù)據(jù)的自動(dòng)分類,必須將檔案系統(tǒng)與其他業(yè)務(wù)信息系統(tǒng)緊密聯(lián)系起來,保證其實(shí)時(shí)性和準(zhǔn)確性。例如在PDM 系統(tǒng)和OA系統(tǒng)中嵌入了文件傳輸和歸檔功能,建立了與文件系統(tǒng)的實(shí)時(shí)通信接口。
在大數(shù)據(jù)環(huán)境下,檔案資源的種類繁多,數(shù)據(jù)量逐漸變大。傳統(tǒng)的數(shù)據(jù)庫已經(jīng)不能系統(tǒng)性地組織操作各種類型的檔案數(shù)據(jù),并且對(duì)檔案信息數(shù)據(jù)的高價(jià)值進(jìn)行深度分析。因此在巨量數(shù)據(jù)環(huán)境下,對(duì)存檔的龐大數(shù)據(jù)進(jìn)行并行性處理成為唯一選擇。這種并行處理不僅可以同時(shí)對(duì)多個(gè)數(shù)據(jù)庫進(jìn)行檢索及分析,而且它會(huì)找尋不同數(shù)據(jù)庫的并行節(jié)點(diǎn),對(duì)這種交叉并行節(jié)點(diǎn)進(jìn)行并行處理,可以大大提升處理性能,提高處理速度。基于大數(shù)據(jù)儲(chǔ)存系統(tǒng)的文件管理系統(tǒng)是未來發(fā)展的趨勢(shì),這種檔案文件管理系統(tǒng)不僅可以實(shí)時(shí)改變計(jì)算的資源和數(shù)據(jù)所需要的存儲(chǔ)空間,還可以滿足日常用戶所帶來的超大訪問量,以及產(chǎn)生的龐大的檔案數(shù)據(jù)量。這就在很大程度上減少了系統(tǒng)運(yùn)營(yíng)所需的資源與成本。
檔案系統(tǒng)中除了永久儲(chǔ)存檔案數(shù)據(jù)之外,還包括了超大量的用戶實(shí)時(shí)檔案數(shù)據(jù),例如搜索量、某一欄目的點(diǎn)擊量、預(yù)覽購(gòu)買等數(shù)據(jù)。用戶的行為數(shù)據(jù)所產(chǎn)生的價(jià)值比用戶的永久儲(chǔ)存檔案更有價(jià)值。這些實(shí)時(shí)產(chǎn)生的存檔數(shù)據(jù)信息在獲取用戶需求、實(shí)時(shí)需求分析和用戶排名等方面發(fā)揮著重要作用。在數(shù)據(jù)挖掘和分析中,我們可以利用用戶需求和文件需求之間的關(guān)系,最大限度地提高用戶體驗(yàn)。
加強(qiáng)檔案安全管理是提高檔案資源綜合管理水平的有效措施。具體方式為:首先,強(qiáng)化對(duì)檔案資源的防火墻訪問的安全防護(hù),避免使用無確切來源的防火墻。其次在檔案資源管理內(nèi)網(wǎng)中,針對(duì)相應(yīng)的使用軟件也應(yīng)設(shè)置一定的防火墻,使并入大數(shù)據(jù)環(huán)境的檔案資源管理也進(jìn)行了相應(yīng)的安全性強(qiáng)化[5]。另外,需要著重開發(fā)和應(yīng)用網(wǎng)絡(luò)黑客侵入檢測(cè)防控系統(tǒng)。外部信息的檢測(cè)需要著重加強(qiáng),并且不能忽視對(duì)內(nèi)部檔案數(shù)據(jù)的檢測(cè)防范。防止內(nèi)部檔案數(shù)據(jù)信息泛濫化使用,從而使檔案管理的安全系數(shù)得到有效提高。此外,在現(xiàn)有的殺毒軟件基礎(chǔ)上,還需積極構(gòu)建檔案管理適用的相關(guān)網(wǎng)絡(luò)病毒防御系統(tǒng)。構(gòu)建這種防御系統(tǒng),可以有效地保護(hù)內(nèi)網(wǎng)的檔案信息數(shù)據(jù),避免了檔案數(shù)據(jù)丟失、病毒入侵、黑客盜取數(shù)據(jù)等問題的出現(xiàn),使檔案資源管理的安全性得到進(jìn)一步確保。
在大數(shù)據(jù)環(huán)境下,檔案資源管理的規(guī)范化、標(biāo)準(zhǔn)化程度較低。因此,檔案信息的規(guī)范性、標(biāo)準(zhǔn)化應(yīng)得到重視。首先,規(guī)范和優(yōu)化檔案資源信息的管理工作流程,盡可能地實(shí)現(xiàn)檔案信息收集、傳遞和應(yīng)用等過程中的資源內(nèi)部共享。這樣可以有效提高員工的工作效率。其次,合理選擇檔案信息管理適用的信息存儲(chǔ)方法?,F(xiàn)階段,主流的存儲(chǔ)方式有硬盤存儲(chǔ)、機(jī)械光盤存儲(chǔ)、網(wǎng)絡(luò)云端存儲(chǔ)以及云備份存儲(chǔ)等[6]。各種存儲(chǔ)方式均有各自的優(yōu)缺點(diǎn)。因此,為了更好地提高檔案管理的標(biāo)準(zhǔn)化程度,需要管理者在綜合考慮各類因素的前提下,在檔案信息資料儲(chǔ)存方式的選擇上做到最優(yōu)化選擇。
在大數(shù)據(jù)環(huán)境中,除了管理人員從硬件構(gòu)建大數(shù)據(jù)檔案資源管理環(huán)境,大數(shù)據(jù)環(huán)境也對(duì)檔案資源管理有一定的反饋方式。一方面,大數(shù)據(jù)環(huán)境的不安全性,需要增強(qiáng)檔案信息管理人員的安全意識(shí)。檔案資源管理人員通過安全教育以及大數(shù)據(jù)反饋,認(rèn)識(shí)到檔案管理的重要性,進(jìn)而以敬業(yè)、有責(zé)任心、上進(jìn)的態(tài)度投入檔案管理工作中,使大數(shù)據(jù)環(huán)境下檔案信息管理工作得到進(jìn)一步強(qiáng)化。此外,大數(shù)據(jù)環(huán)境的信息化也在迫使檔案管理工作者主動(dòng)學(xué)習(xí)、提升自我。檔案工作人員只有提高在檔案資源管理方面自身的知識(shí)水平,才能在實(shí)際工作中借助自身知識(shí),提高檔案資源的服務(wù)質(zhì)量。
大數(shù)據(jù)的最大特征就是具有大量數(shù)據(jù),在平時(shí)的檔案資源管理工作中會(huì)產(chǎn)生海量數(shù)據(jù)。但有很多信息數(shù)據(jù)儲(chǔ)存時(shí)間長(zhǎng),信息數(shù)據(jù)老舊,沒有絲毫利用價(jià)值,其就變?yōu)闄n案信息中的垃圾數(shù)據(jù)。在垃圾數(shù)據(jù)逐漸增多的情況下,會(huì)妨礙檔案資源管理工作開展。例如,造成獲取檔案信息數(shù)據(jù)的不準(zhǔn)確性、檢索速度的逐漸變緩、后期軟硬件系統(tǒng)的維護(hù)困難加大等等。因此,有必要積極地對(duì)垃圾數(shù)據(jù)進(jìn)行處理,創(chuàng)造一個(gè)高速安全的大數(shù)據(jù)環(huán)境給檔案信息管理系統(tǒng)[7]。此外,可以借助國(guó)家相關(guān)法律法規(guī)來提高檔案資源管理的安全性。要建立健全內(nèi)部檔案管理規(guī)章制度,嚴(yán)格遵守規(guī)章制度要求,依照規(guī)范流程辦事,這樣才能全面提升檔案資源管理的安全水平。
大數(shù)據(jù)技術(shù)逐漸趨于成熟,為檔案資源管理開拓了新視野,推動(dòng)了檔案資源向信息化方向的發(fā)展,其不僅改變了傳統(tǒng)檔案管理模式,還提高了檔案數(shù)據(jù)信息的價(jià)值。因此要主動(dòng)面對(duì)現(xiàn)有的傳統(tǒng)紙質(zhì)檔案管理中所遇到的問題和挑戰(zhàn),積極利用大數(shù)據(jù)技術(shù),做好檔案資源管理工作,從而使檔案資源更好地服務(wù)于社會(huì)。