梁威
【摘要】大數(shù)據(jù)作為信息時代的產(chǎn)物,其作為數(shù)據(jù)集合,具有規(guī)模大、流轉(zhuǎn)速度快、類型多樣及價值密度低等特點,在檔案工作中引入大數(shù)據(jù)技術(shù),可以更好地推動檔案工作的快速發(fā)展,使其與時代發(fā)展潮流相適應(yīng)。文中分析了大數(shù)據(jù)技術(shù)在檔案工作中應(yīng)用的基礎(chǔ),并進(jìn)一步對檔案大數(shù)據(jù)框架構(gòu)建及應(yīng)用的策略進(jìn)行了具體的闡述。
【關(guān)鍵詞】檔案;大數(shù)據(jù)技術(shù);大數(shù)據(jù)框架構(gòu)建;應(yīng)用
一、大數(shù)據(jù)技術(shù)在檔案工作中應(yīng)用的基礎(chǔ)
檔案是社會發(fā)展過程中的重要歷史記錄,基于我國地域遼闊性的特點,檔案數(shù)量十分龐大。當(dāng)前檔案總量可謂是一個巨大的資源庫,同時也為檔案數(shù)據(jù)庫的構(gòu)建奠定了良好的基礎(chǔ)。在當(dāng)前國家、地方及企事業(yè)單位中的檔案部門中都保存著具有較高價值的檔案信息,但基于個人利用需求,在這些龐大的檔案信息中,每次可以利用的檔案數(shù)據(jù)數(shù)量較少,檔案數(shù)據(jù)價值密度處于較低水平。在社會發(fā)展過程中形成的各種檔案資料,存在種類多樣的特點,而且在信息時代,檔案種類還在進(jìn)一步擴(kuò)展,出現(xiàn)了一些非結(jié)構(gòu)化的檔案信息。為了能夠?qū)Y(jié)構(gòu)化和非結(jié)構(gòu)化的檔案進(jìn)行有效的保存和利用,需要運用大數(shù)據(jù)技術(shù)來對檔案信息進(jìn)行數(shù)字化處理,構(gòu)建數(shù)據(jù)化資源庫。隨著當(dāng)前檔案產(chǎn)生的數(shù)量不斷增加,人們對檔案的保存和利用意識也在不斷增加,這也對檔案收集、分析、整理和利用提出了更高的要求。當(dāng)前檔案工作智能化水平還不高,通過運用大數(shù)據(jù)技術(shù),可能實現(xiàn)對各種檔案資源的快速分析和處理,從而及時為人們提供所需要的檔案信息。
二、檔案大數(shù)據(jù)框架構(gòu)建及應(yīng)用策略
(一)轉(zhuǎn)變服務(wù)觀念。在當(dāng)前檔案工作中,需要積極轉(zhuǎn)變服務(wù)態(tài)度。當(dāng)前大部分檔案部門服務(wù)理念還處于傳統(tǒng)的理論水平上,在實際檔案服務(wù)中存在被動的情況,而且具體服務(wù)內(nèi)容也只是單純提供檔案信息。隨著檔案信息化建設(shè)工作的不斷深入,檔案目錄和部分檔案全文實現(xiàn)了數(shù)字化,并上傳到網(wǎng)絡(luò)供利用者瀏覽。這就需要檔案部門積極主動開展檔案服務(wù),精準(zhǔn)把握檔案利用者的需求,檔案管理人員要深入了解檔案業(yè)務(wù),明確檔案利用者的需求,從而全面提高檔案服務(wù)的質(zhì)量。
(二)建立檔案數(shù)據(jù)的準(zhǔn)入和管理機(jī)制。為了確保檔案數(shù)據(jù)的質(zhì)量,需要通過建立高質(zhì)量和高價值的檔案資源庫,強(qiáng)化對檔案數(shù)據(jù)的管理,并建立數(shù)據(jù)準(zhǔn)入標(biāo)準(zhǔn),將不合格的檔案數(shù)據(jù)信息及時剔除掉,在檔案搜集過程中更好地突出檔案的質(zhì)量。針對于檔案信息,做到隨時收集、定期收集、重點收集和普遍收集,并將這些收集方式有效結(jié)合,對具有價值的文件資料則宜采取特殊整理和標(biāo)記,并對電子目錄質(zhì)量進(jìn)行檢查,確保與入檔的程序和要求相符。做好電子檔案分類編目工作,對檔案質(zhì)量進(jìn)行層層把關(guān),以此來保證檔案大數(shù)據(jù)建設(shè)工作的有序開展。
(三)創(chuàng)建完善的檔案數(shù)據(jù)標(biāo)準(zhǔn)。大數(shù)據(jù)時代環(huán)境下,檔案信息種類越來越豐富,檔案數(shù)據(jù)信息的數(shù)量也不斷增多,在這種情況下,傳統(tǒng)的紙質(zhì)檔案管理模式越來越無法與時代發(fā)展需求相適應(yīng),為了進(jìn)一步提高檔案管理工作的效率,需要建立完善的檔案管理工作標(biāo)準(zhǔn),對檔案信息的內(nèi)容進(jìn)行明確規(guī)定,制定科學(xué)的檔案工作流程,并將其落實到位。在檔案信息化建設(shè)過程中,需要根據(jù)相應(yīng)標(biāo)準(zhǔn)來設(shè)置檔案硬件設(shè)備和軟件系統(tǒng),實現(xiàn)檔案信息數(shù)據(jù)的精準(zhǔn)歸類。在針對檔案信息數(shù)據(jù)進(jìn)行保存的過程中,要確保檔案信息的真實性和完整性。
(四)搭建檔案大數(shù)據(jù)網(wǎng)絡(luò)平臺,實現(xiàn)檔案資源共享。通過檔案大數(shù)據(jù)網(wǎng)絡(luò)平臺的搭建,可以有效促進(jìn)檔案管理技術(shù)的創(chuàng)新,使檔案管理工作能夠更好地順應(yīng)大數(shù)據(jù)時代的發(fā)展要求。在當(dāng)前社會發(fā)展過程中,每天都會有大量的數(shù)據(jù)產(chǎn)生,這些數(shù)據(jù)處于分散存放的狀態(tài),檔案信息資源無法實現(xiàn)共享,導(dǎo)致檔案信息資源的巨大浪費,而且也無法滿足信息時代人們對檔案的利用需求。因此迫切需要通過運用大數(shù)據(jù)技術(shù)來搭建檔案大數(shù)據(jù)網(wǎng)絡(luò)平臺,將檔案工作與大數(shù)據(jù)技術(shù)相結(jié)合,充分運用大數(shù)據(jù)技術(shù)和云計算技術(shù),加快推動檔案信息資源的整合,并對檔案信息進(jìn)行深入挖掘,基于檔案利用者的需求,為其提供精細(xì)、準(zhǔn)確的檔案信息,全面提高檔案信息的利用率,加快實現(xiàn)檔案信息的共享。
(五)云服務(wù)的實現(xiàn)。大數(shù)據(jù)以云計算為基礎(chǔ),而且檔案信息資源的整合也離不開云計算技術(shù),因此通過在全國范圍內(nèi)建立公有云,以此來實現(xiàn)全國范圍內(nèi)檔案條目的集中和共享。而且在公有云背景下,區(qū)域內(nèi)檔案部門可以通過建立自己的私有云,以此來為大數(shù)據(jù)平臺提供重要的數(shù)據(jù)支撐。
三、結(jié)束語
基于大數(shù)據(jù)背景下,檔案工作與大數(shù)據(jù)技術(shù)的有效結(jié)合,可以有效推動檔案管理工作的數(shù)據(jù)化發(fā)展。因此對于當(dāng)前檔案管理部門而言,需要著眼于當(dāng)前大數(shù)據(jù)時代檔案工作的發(fā)展需求,充分運用信息技術(shù),建立健全檔案管理機(jī)制,充分運用大數(shù)據(jù)技術(shù)來提升檔案工作的質(zhì)量和水平,實現(xiàn)檔案信息資源的高效利用。
【參考文獻(xiàn)】
[1]劉國華,李澤鋒.檔案工作中大數(shù)據(jù)框架構(gòu)建及應(yīng)用思考[J].檔案管理,2014.
[2]滕春娥.大數(shù)據(jù)環(huán)境下檔案工作轉(zhuǎn)型研究[J].北京檔案, 2015.
[3]鄒華英.試論大數(shù)據(jù)時代的檔案工作[J].檔案與建設(shè), 2013.