宋雪寧
摘 要:隨著我國(guó)智慧檔案館建設(shè)縱深發(fā)展,數(shù)字化背景下檔案服務(wù)和檔案利用已經(jīng)形成了大量數(shù)據(jù)積淀,為實(shí)現(xiàn)檔案數(shù)據(jù)化管理奠定了基礎(chǔ)。本文從大數(shù)據(jù)下檔案數(shù)據(jù)化管理轉(zhuǎn)型的基礎(chǔ)出發(fā),從檔案服務(wù)管理、資源開發(fā)和資源利用三個(gè)層面論述了大數(shù)據(jù)下檔案數(shù)據(jù)化管理轉(zhuǎn)型的策略。
關(guān)鍵詞:大數(shù)據(jù);檔案數(shù)據(jù)化管理;升級(jí)轉(zhuǎn)型;人工智能
隨著信息技術(shù)的不斷進(jìn)步,依托信息技術(shù)的各種智能終端的普及,數(shù)字化已經(jīng)在人們的生活中逐漸普及,人們的生活已經(jīng)全面進(jìn)入了數(shù)據(jù)時(shí)代。2017年12月27日國(guó)家檔案局局長(zhǎng)李明華在全國(guó)檔案局長(zhǎng)館長(zhǎng)會(huì)議中,明確指出了網(wǎng)絡(luò)和信息技術(shù)快速發(fā)展背景下,我國(guó)檔案工作應(yīng)抓好戰(zhàn)略轉(zhuǎn)型機(jī)遇,逐步實(shí)現(xiàn)以信息化為核心的檔案管理現(xiàn)代化。在2019年全國(guó)檔案局長(zhǎng)館長(zhǎng)相關(guān)會(huì)議中,對(duì)于加大檔案科技攻關(guān)、加強(qiáng)檔案信息化建設(shè)、促進(jìn)檔案管理現(xiàn)代化發(fā)展[1]。隨著數(shù)字時(shí)代的到來,檔案?jìng)鹘y(tǒng)的技術(shù)、記憶功能被數(shù)字化記憶打破,信息技術(shù)不斷沖擊這檔案?jìng)鹘y(tǒng)載體模式,數(shù)字化存儲(chǔ)逐漸被應(yīng)用在檔案管理與檔案記憶實(shí)踐過程中,促進(jìn)了檔案資源數(shù)據(jù)化發(fā)展。
一、大數(shù)據(jù)下檔案數(shù)據(jù)化管理轉(zhuǎn)型的基礎(chǔ)
當(dāng)前我們正處在大數(shù)據(jù)時(shí)代,檔案信息形式和檔案存儲(chǔ)資料主要以數(shù)字化為主, 檔案管理人員依托多媒體方式和文本形式來實(shí)現(xiàn)數(shù)字化管理。檔案管理數(shù)字化發(fā)展為檔案數(shù)據(jù)化管理轉(zhuǎn)型奠定了基礎(chǔ)。在當(dāng)前的分類和整理過程中檔案管理人員主要利用智能技術(shù)來進(jìn)行檢索,比如,自然語言處理等,然而受影響檢索效率的因素是非常多。隨著時(shí)代的發(fā)展,這種搜索和檢索信息的方式隨著檔案信息數(shù)據(jù)和形式的日益增多,無法滿足檔案管理的需求?;诖?,檔案管理人員可以利用智能化圖片和語言識(shí)別方式進(jìn)行檔案信息搜索,還可以利用機(jī)器學(xué)習(xí)管理模式,對(duì)海量的檔案信息資料進(jìn)行智能化的分類,具體操作為檔案管理人員根據(jù)預(yù)先設(shè)定的方式,對(duì)檔案進(jìn)行分類,并利用人工智能技術(shù)收集整理信息。在信息檢索方面,可充分利用人工智能技術(shù)的中的檢索功能、普通話處理技術(shù)、模式分辨等,篩選檔案信息,確保檔案信息的精準(zhǔn)度,同時(shí)還可以輸入關(guān)鍵詞,借助人工智能技術(shù)自動(dòng)化對(duì)一些無利用物價(jià)值的信息和數(shù)據(jù)進(jìn)行過濾,全面提升檔案管理信息檢索準(zhǔn)確性和工作效率的提升[2]。所有的檔案管理和檔案利用數(shù)據(jù)在數(shù)字技術(shù)下都將產(chǎn)生對(duì)應(yīng)的“標(biāo)簽”,為檔案數(shù)據(jù)化管理轉(zhuǎn)型奠定了基礎(chǔ)。
二、大數(shù)據(jù)下檔案數(shù)據(jù)化管理轉(zhuǎn)型的策略
(一)檔案服務(wù)管理轉(zhuǎn)型:基礎(chǔ)用戶數(shù)據(jù)與用戶畫像
利用智能平臺(tái)采集檔案用戶數(shù)據(jù)是實(shí)現(xiàn)檔案館精準(zhǔn)服務(wù)的基礎(chǔ),把握數(shù)據(jù)的多維性是做好數(shù)據(jù)采集工作的基礎(chǔ)。其中,用戶屬性、行為和情景等是檔案用戶數(shù)據(jù)采集與數(shù)據(jù)基礎(chǔ)建設(shè)的主要類型。檔案用戶屬性數(shù)據(jù)是檔案用戶在檔案館服務(wù)需求時(shí)注冊(cè)的個(gè)人基礎(chǔ)資料,包含了用戶的基礎(chǔ)資料和檔案利用的目的;用戶行為數(shù)據(jù)是用戶在檔案館檔案利用中產(chǎn)生的數(shù)據(jù),主要表現(xiàn)在檔案館網(wǎng)站、檔案館APP后臺(tái)等的檔案行為?;谟脩羰褂盟a(chǎn)生的檔案查詢、登錄、閱覽等數(shù)據(jù),可以通過數(shù)據(jù)分析接入檔案服務(wù)系統(tǒng),通過用戶行為反映用戶對(duì)檔案的需求和選擇偏好。另外,檔案館工作人員通過隨訪、問卷和觀察等社會(huì)調(diào)研方式形成的基礎(chǔ)數(shù)據(jù)也是用戶行為數(shù)據(jù)范疇;用戶情景數(shù)據(jù)主要是借助智能技術(shù)、RS技術(shù)、GPS技術(shù)等采集用戶的地理、時(shí)間和社交關(guān)系等數(shù)據(jù),幫助識(shí)別用戶所處的實(shí)地情況。同時(shí),檔案館在確保用戶數(shù)據(jù)隱私和信息安全的前提下,與“多為端口”合作,借助爬蟲技術(shù)和數(shù)據(jù)挖掘跟蹤技術(shù)跟蹤用戶的數(shù)字行為,推動(dòng)用戶數(shù)據(jù)共享,滿足檔案利用和服務(wù)精準(zhǔn)化發(fā)展需求。結(jié)合用戶行為特征,關(guān)聯(lián)數(shù)據(jù)需要挖掘不同用戶的具體行為,做好用戶標(biāo)簽聚類和相似度計(jì)算工作,明確受眾檔案需求結(jié)構(gòu),為不同用戶和不同群體提供相應(yīng)的檔案服務(wù),滿足新時(shí)期檔案受眾的個(gè)性化需求。
(二)檔案資源開發(fā)轉(zhuǎn)型:表征性向數(shù)據(jù)信息轉(zhuǎn)型
數(shù)字時(shí)代檔案資源開發(fā)呈現(xiàn)新態(tài)勢(shì):對(duì)象數(shù)字化、工具信息化、主體多元化、過程科學(xué)化、目的多樣化。因此,檔案資源開發(fā)對(duì)象層次不僅局限于信息層面,必須面向多面內(nèi)容,深入數(shù)據(jù)層面,獲取細(xì)粒度的記憶單元,并且注重記憶數(shù)據(jù)之間的關(guān)聯(lián)組織。有序組織是有效開發(fā)的前提,從檔案資源開發(fā)由表征性向數(shù)據(jù)信息轉(zhuǎn)型。一是檔案信息資源開發(fā)不斷深化。借助于先進(jìn)自然語言處理、文本分析和識(shí)別、信息分析和抽取等數(shù)據(jù)分析技術(shù),拆解碎片化的檔案記憶知識(shí)內(nèi)容和數(shù)據(jù),獲取出具有碎片化意義的檔案記憶知識(shí)單元,“以檔案內(nèi)容的碎片化增加檔案能量,促進(jìn)檔案活化,從而可以優(yōu)先嵌入新的知識(shí)建構(gòu)和創(chuàng)新活動(dòng)”;二是檔案關(guān)聯(lián)度加強(qiáng)。利用本體技術(shù),有側(cè)重地對(duì)核心概念進(jìn)行本體化處理,如人物、地點(diǎn)、時(shí)間、組織機(jī)構(gòu)、事件等,以構(gòu)建輕量、有機(jī)的檔案結(jié)構(gòu),提高檢索效率與開發(fā)靈活度。
(三)檔案資源利用轉(zhuǎn)型:智能技術(shù)助力數(shù)據(jù)咨詢
毋庸置疑,人工智能集多個(gè)學(xué)科為一體,智能型公共服務(wù)機(jī)器人具有引導(dǎo)、講解、人機(jī)交互以及自主行走等功能。對(duì)此,檔案館可以在館內(nèi)大廳安排智能機(jī)器人,利用機(jī)器人接待查閱的檔案的用戶,對(duì)其在館藏信息、查閱檔案流程的方面的問題予以解決。同時(shí)用戶還可以根據(jù)自身查閱檔案信息的需求,輸入關(guān)鍵詞后機(jī)器人為其快速調(diào)取庫房檔案并為用戶提供檔案副本。隨著信息網(wǎng)絡(luò)和新媒體日新月異的發(fā)展,現(xiàn)階段微信公眾號(hào)和官網(wǎng)是每個(gè)檔案館所必有的,為了提升檔案服務(wù)滿意度,檔案館還可以投入智能系統(tǒng),充分利用系統(tǒng)線上實(shí)時(shí)智能功能,及時(shí)回答用戶問題,為用戶檔案信息的利用提供方便。對(duì)于檔案館而言,同時(shí)智能線上與智能服務(wù)線下有機(jī)結(jié)合,一方面為用戶解決了困惑,另一方面還促使自身服務(wù)效率的提升。
三、結(jié)語
在大數(shù)據(jù)爆棚式增長(zhǎng)的時(shí)代,信息、數(shù)據(jù)、知識(shí)是適應(yīng)時(shí)代發(fā)展的必然趨勢(shì)。在推動(dòng)檔案數(shù)據(jù)化管理轉(zhuǎn)型中,檔案館可以和計(jì)算機(jī)科學(xué)、營(yíng)銷等領(lǐng)域交流合作,在現(xiàn)有的檔案管理數(shù)字化基礎(chǔ)上推動(dòng)檔案管理數(shù)據(jù)化發(fā)展,從檔案館檔案管理、檔案服務(wù)和檔案利用等層面綜合發(fā)力,加強(qiáng)大數(shù)據(jù)在檔案館服務(wù)中的理論和實(shí)踐探索,促使檔案管理效率的全面提升。
參考文獻(xiàn)
[1] 徐松.數(shù)字時(shí)代檔案數(shù)據(jù)化管理問題研究[J].山西檔案,2020(02):142-144+186.
[2] 王曉春.檔案大數(shù)據(jù)研究的批判性考察[J].山西檔案,2017(04):72-74.