李改英
摘要:信息時(shí)代背景下,信息分析與處理方式多式多樣。大數(shù)據(jù)技術(shù)近幾年開始應(yīng)用于檔案數(shù)據(jù)挖掘中,使得檔案管理工作變得信息化和精細(xì)化。本文就大數(shù)據(jù)技術(shù)在檔案數(shù)據(jù)挖掘中的價(jià)值與策略進(jìn)行深入分析。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);數(shù)據(jù)挖掘;檔案信息
伴隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)挖掘技術(shù)在檔案管理中的應(yīng)用將進(jìn)入一個(gè)新的發(fā)展時(shí)期。盡管檔案學(xué)術(shù)界很早就提出知識(shí)管理與知識(shí)挖掘,但知識(shí)挖掘尚停留在概念和理論探討階段[1]。大數(shù)據(jù)挖掘,即從大數(shù)據(jù)中挖掘知識(shí),大數(shù)據(jù)挖掘技術(shù)有效地解決了數(shù)據(jù)和知識(shí)之間的鴻溝,是將數(shù)據(jù)轉(zhuǎn)變成知識(shí)的有效方式。大數(shù)據(jù)時(shí)代給數(shù)據(jù)挖掘技術(shù)帶來的根本性改變是使數(shù)據(jù)的深度挖掘成為可能,對(duì)大量數(shù)據(jù)進(jìn)行分析處理和智能化挖掘,從管理角度來看,要達(dá)到最優(yōu)的結(jié)果,不僅數(shù)據(jù)要全面、可靠、有價(jià)值,而且需要對(duì)數(shù)據(jù)進(jìn)行深度挖掘[2]。
一、大數(shù)據(jù)技術(shù)與檔案數(shù)據(jù)挖掘內(nèi)容
(一)挖掘檔案資源
在大數(shù)據(jù)技術(shù)支持下,檔案管理工作的思路應(yīng)轉(zhuǎn)變?yōu)椤按髷?shù)據(jù)”,合理整合檔案數(shù)據(jù),建立完善的大數(shù)據(jù)檔案資源體系和共享軟件檔案數(shù)據(jù)資源庫,從而實(shí)現(xiàn)館藏檔案的共享和聯(lián)系。另外,云計(jì)算平臺(tái)和互聯(lián)網(wǎng)技術(shù)等推動(dòng)了地區(qū)檔案數(shù)據(jù)資源網(wǎng)絡(luò)系統(tǒng)的建設(shè)與完善,使得檔案用戶查詢相關(guān)資料更加方便簡(jiǎn)潔。
(二)用戶數(shù)據(jù)挖掘
大數(shù)據(jù)技術(shù)下的檔案資源挖掘,可以挖掘更多的用戶數(shù)據(jù),使得大數(shù)據(jù)檔案服務(wù)變得更加精準(zhǔn),同時(shí)也提升了用戶的體驗(yàn)感與認(rèn)同感。在進(jìn)行檔案數(shù)據(jù)挖掘的時(shí)候,應(yīng)該重點(diǎn)對(duì)用戶的檔案信息、用戶統(tǒng)計(jì)資料等進(jìn)行挖掘整理。在檔案數(shù)據(jù)挖掘的時(shí)候,可以利用大數(shù)據(jù)技術(shù)訪問用戶的瀏覽日志文件,還可以用數(shù)據(jù)分析技術(shù)進(jìn)行檔案資料分析,對(duì)用戶的檢索關(guān)鍵詞進(jìn)行數(shù)據(jù)化統(tǒng)計(jì),從而提高檔案信息查準(zhǔn)率。
二、利用大數(shù)據(jù)技術(shù)進(jìn)行檔案數(shù)據(jù)挖掘的有效措施
(一)構(gòu)建大數(shù)據(jù)技術(shù)為核心的數(shù)據(jù)資源體系
隨著社會(huì)的進(jìn)步,檔案數(shù)據(jù)應(yīng)展現(xiàn)時(shí)代特色,構(gòu)建中華民族體記憶的“中國(guó)式”數(shù)字資源庫[3]。數(shù)字資源可以是文本形式、音頻形式、圖片形式等。首先,應(yīng)擴(kuò)大檔案數(shù)據(jù)資源總量,加大實(shí)體檔案資源的建設(shè),完善實(shí)體檔案門類,優(yōu)化館藏檔案結(jié)構(gòu)。其次,應(yīng)重點(diǎn)建設(shè)數(shù)字資源,構(gòu)建完善的數(shù)字化檔案資源庫,使電子檔案分門別類的歸檔。最后,應(yīng)大力整合檔案數(shù)據(jù)資源,實(shí)現(xiàn)資源共享,增加數(shù)據(jù)應(yīng)用價(jià)值。一方面,在檔案數(shù)據(jù)管理方面,大數(shù)據(jù)技術(shù)為檔案管理與檔案挖掘提供了有效保證,另一方面,在大數(shù)據(jù)技術(shù)下檔案的深入挖掘中,還進(jìn)一步優(yōu)化了檔案館的使用功能。
(二)構(gòu)建和諧的用戶關(guān)系管理,增大數(shù)據(jù)內(nèi)在關(guān)聯(lián)
在大數(shù)據(jù)時(shí)代,人們應(yīng)該轉(zhuǎn)變?cè)械摹耙蚬P(guān)系”認(rèn)知思路與觀念,用“相互關(guān)系”取代傳統(tǒng)思想,用新的視覺看待檔案數(shù)據(jù)挖掘,用新的技術(shù)去挖掘檔案數(shù)據(jù),將以前的“知道為什么”變成“知道是什么”大數(shù)據(jù)技術(shù)有預(yù)測(cè)分析的功能,可以對(duì)檔案用戶之前的網(wǎng)上行為,現(xiàn)在的進(jìn)行行為進(jìn)行分析,還可以根據(jù)用戶的基本情況預(yù)測(cè)未來的行為,挖掘出數(shù)據(jù)之間的關(guān)聯(lián)性,實(shí)現(xiàn)檔案資源的集成、創(chuàng)新與優(yōu)化。可以借助大數(shù)據(jù)技術(shù),統(tǒng)計(jì)分析用戶的行為軌跡,研究用戶的使用習(xí)慣和興趣,分析用戶的儲(chǔ)存行為等,在隱性層面滿足用戶的實(shí)際需求。例如,借助大數(shù)據(jù)技術(shù)針對(duì)不同的用戶,可以產(chǎn)生動(dòng)態(tài)推薦超級(jí)鏈接列表。
(三)利用大數(shù)據(jù)技術(shù)保護(hù)數(shù)據(jù)安全
在大數(shù)據(jù)時(shí)代,信息隱私安全保護(hù)面臨著嚴(yán)峻考驗(yàn),技術(shù)因素和人力因素都會(huì)影響數(shù)據(jù)的安全性,如果合理利用大數(shù)據(jù)技術(shù),就可以為檔案管理工作提供可靠的預(yù)測(cè)決策的情報(bào)。首先,應(yīng)健全大數(shù)據(jù)檔案挖掘法律法規(guī),加強(qiáng)對(duì)個(gè)人檔案信息隱私的保護(hù)力度,另外,還應(yīng)建立個(gè)人檔案數(shù)據(jù)安全管理體系,合理管理檔案信息,避免發(fā)生數(shù)據(jù)外泄和丟失等現(xiàn)象。其次,選擇可以保護(hù)數(shù)據(jù)隱私的挖掘方法與技術(shù),明確私人信息和公共信息,先確保私人信息的安全,再進(jìn)行數(shù)據(jù)深入挖掘。
(四)實(shí)施智慧因子聯(lián)合大數(shù)據(jù)技術(shù)的數(shù)據(jù)挖掘模式
自“智慧城市”概念提出后,“智慧因子”被廣泛應(yīng)用于各行各業(yè)中,例如智慧上海、智慧物流、智慧檔案館等[4]。智慧檔案館就是檔案數(shù)據(jù)挖掘中“智慧因子聯(lián)合大數(shù)據(jù)技術(shù)”的實(shí)際應(yīng)用案例,在大數(shù)據(jù)技術(shù)中植入智慧因子,將智慧服務(wù)為檔案館理論,在互聯(lián)網(wǎng)技術(shù)和物聯(lián)網(wǎng)技術(shù)的支持下,形成智能網(wǎng)絡(luò)體系,真正實(shí)現(xiàn)檔案信息資源的有機(jī)整合和廣度挖掘,推動(dòng)我國(guó)檔案服務(wù)的信息化和智慧化發(fā)展。大數(shù)據(jù)技術(shù)可以將各種檔案資源進(jìn)行有機(jī)整合,同時(shí),借助智慧因子,創(chuàng)新智慧服務(wù)理念和手段,使得檔案數(shù)據(jù)資源開發(fā)更加個(gè)性化,同時(shí)讓隱性知識(shí)變得顯性化。
三、結(jié)語
綜上所述,在大數(shù)據(jù)時(shí)代背景下,大數(shù)據(jù)檔案、大數(shù)據(jù)服務(wù)、智慧檔案等都大大促進(jìn)了檔案管理工作的發(fā)展。隨著科學(xué)技術(shù)的不斷發(fā)展,未來檔案管理工作中應(yīng)真正落實(shí)大數(shù)據(jù)技術(shù),使得每位檔案管理人員在工作中都可以輕車熟路。檔案數(shù)據(jù)挖掘有幾個(gè)不同的環(huán)節(jié),在應(yīng)用大數(shù)據(jù)技術(shù)的時(shí)候,應(yīng)該認(rèn)清數(shù)據(jù)挖掘環(huán)節(jié)的特性,采取合理的數(shù)據(jù)挖掘措施,實(shí)現(xiàn)檔案數(shù)據(jù)資料的有效挖掘和合理運(yùn)行,實(shí)現(xiàn)大數(shù)據(jù)技術(shù)下檔案數(shù)據(jù)的良性循環(huán)。
參考文獻(xiàn):
[1]楊來青.大數(shù)據(jù)背景下檔案信息資源挖掘策略與方法研究[J].中國(guó)檔案,2018(08):60-61.
[2]陳水湖.試論大數(shù)據(jù)環(huán)境下的檔案“數(shù)據(jù)化”管理[J].機(jī)電兵船檔案,2018(02):69-72.
[3]梁雯.大數(shù)據(jù)視域下檔案數(shù)據(jù)管理的創(chuàng)新策略研究[J].科學(xué)大眾(科學(xué)教育),2018(01):184.
[4]吳曉文,孫杰,楊帆.大數(shù)據(jù)背景下海洋檔案數(shù)據(jù)挖掘研究[J].辦公室業(yè)務(wù),2017(19):186-187.