張文元+張倩
摘要:檔案數(shù)據(jù)深度挖掘是大數(shù)據(jù)技術(shù)應(yīng)用于檔案管理中的主要特點(diǎn),推動(dòng)檔案管理模式發(fā)生變化:一是檔案管理流程走向精細(xì)化,二是這種精細(xì)化使檔案資源和用戶需求的雙向控制關(guān)系發(fā)揮到極致。為了保證檔案數(shù)據(jù)深度挖掘,促使檔案管理走向精細(xì)化,提出了實(shí)現(xiàn)對(duì)策:建立以數(shù)據(jù)挖掘技術(shù)為核心的信息系統(tǒng),構(gòu)建以人為本的用戶關(guān)系管理,保證數(shù)據(jù)挖掘技術(shù)中的數(shù)據(jù)隱私安全,借力“智慧因子”完善數(shù)據(jù)挖掘技術(shù)等。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);數(shù)據(jù)挖掘;檔案管理
伴隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)挖掘技術(shù)在檔案管理中的應(yīng)用將進(jìn)入一個(gè)新的發(fā)展時(shí)期。盡管檔案學(xué)術(shù)界很早就提出知識(shí)管理與知識(shí)挖掘,但知識(shí)挖掘尚停留在概念和理論探討階段[1]。大數(shù)據(jù)挖掘,即從大數(shù)據(jù)中挖掘知識(shí),大數(shù)據(jù)挖掘技術(shù)有效地解決了數(shù)據(jù)和知識(shí)之間的鴻溝,是將數(shù)據(jù)轉(zhuǎn)變成知識(shí)的有效方式[2]。因此,有檔案學(xué)研究者認(rèn)為“檔案館的傳統(tǒng)業(yè)務(wù)將向檔案資源的數(shù)據(jù)分析、數(shù)據(jù)挖掘方向轉(zhuǎn)移,對(duì)大量數(shù)據(jù)的分析處理將成為檔案館的主要業(yè)務(wù)”[3],“檔案信息服務(wù)的底層基礎(chǔ)可能不再是檢索,而是智能化的數(shù)據(jù)挖掘”[4]。
大數(shù)據(jù)時(shí)代給數(shù)據(jù)挖掘技術(shù)帶來(lái)的根本性改變是使數(shù)據(jù)的深度挖掘成為可能,對(duì)大量數(shù)據(jù)進(jìn)行分析處理和智能化挖掘,從管理角度來(lái)看,要達(dá)到最優(yōu)的結(jié)果,不僅數(shù)據(jù)要全面、可靠、有價(jià)值,而且需要對(duì)數(shù)據(jù)進(jìn)行深度挖掘。
1 數(shù)據(jù)深度挖掘是大數(shù)據(jù)技術(shù)應(yīng)用于檔案管理中的主要特點(diǎn)
數(shù)據(jù)挖掘技術(shù)是通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行建模,并通過(guò)數(shù)理模型對(duì)企業(yè)的海量數(shù)據(jù)進(jìn)行整理與分析,以幫助企業(yè)了解其不同的客戶或不同的市場(chǎng)劃分的一種從海量數(shù)據(jù)中找出企業(yè)所需知識(shí)的技術(shù)方法[5]。數(shù)據(jù)深度挖掘,是一個(gè)對(duì)數(shù)據(jù)進(jìn)行建模的過(guò)程,并對(duì)數(shù)據(jù)進(jìn)行分類與統(tǒng)計(jì),查找得出數(shù)據(jù)分布的關(guān)聯(lián)性,這也是探索規(guī)律的過(guò)程。
如,檔案人員想要做好檔案編研選題,不僅要對(duì)用戶利用檔案數(shù)據(jù),包括檔案調(diào)卷數(shù)量、檔案利用次數(shù)、復(fù)制檔案數(shù)量、制發(fā)檔案證明數(shù)量等進(jìn)行深度挖掘,而且還需要對(duì)用戶訪問(wèn)記錄,包括網(wǎng)頁(yè)采用的關(guān)鍵字、下載記錄、檢索詞、用戶利用網(wǎng)頁(yè)時(shí)間和頻度等信息進(jìn)行深度挖掘,然后利用分類功能及數(shù)據(jù)分析,建立檔案編研選題的用戶模型,一是按需確定不同類型的編研選題,提供個(gè)性化的服務(wù);二是根據(jù)檔案用戶需求特點(diǎn),預(yù)測(cè)其未來(lái)趨向,結(jié)合社會(huì)熱點(diǎn)選定檔案編研題目,從而使檔案編研部門推出用戶滿意的編研成果。在檔案利用方面,對(duì)檔案利用登記數(shù)據(jù)庫(kù)進(jìn)行深度挖掘,分別選取不同方面數(shù)據(jù)進(jìn)行建模,可以得出不同檔案利用形式的變化趨勢(shì),從而對(duì)檔案利用趨勢(shì)進(jìn)行分析和預(yù)測(cè),對(duì)利用頻率高的檔案進(jìn)行全文數(shù)字化,既可以提高檔案利用效率,又可以起到保護(hù)檔案原件的作用。
因此,檔案數(shù)據(jù)的深度挖掘是大數(shù)據(jù)時(shí)代的主要特點(diǎn),檔案學(xué)的發(fā)展歷程告訴我們,每一次重大的技術(shù)變革都必然影響著檔案學(xué)的發(fā)展,如計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的引入,引起了檔案管理理念與實(shí)踐的變革,改變了文件與檔案的處理流程[5]。大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)的深度挖掘?yàn)闄n案管理流程由粗放走向精細(xì)化提供了可能。
2 大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)深度挖掘使檔案管理模式走向精細(xì)化
大數(shù)據(jù)挖掘技術(shù)基于傳統(tǒng)的數(shù)據(jù)挖掘,使用的是數(shù)據(jù)倉(cāng)庫(kù),構(gòu)造的是“泛關(guān)系”的聚分類模型,采取的是海量數(shù)據(jù)分析方法,機(jī)器與人類一樣具備語(yǔ)義知識(shí),提供的是可視化視圖來(lái)揭示信息,可以說(shuō)是傳統(tǒng)數(shù)據(jù)挖掘方法的深化。由中國(guó)人民大學(xué)網(wǎng)絡(luò)與移動(dòng)數(shù)據(jù)管理實(shí)驗(yàn)室開(kāi)發(fā)ScholarSpace,大數(shù)據(jù)處理的最基本流程由數(shù)據(jù)來(lái)源、數(shù)據(jù)抽取與集成、數(shù)據(jù)分析、數(shù)據(jù)解釋等過(guò)程組成[6],分析認(rèn)為大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)挖掘由數(shù)據(jù)采集層、數(shù)據(jù)整理層、數(shù)據(jù)分析層、數(shù)據(jù)展示層組成。
2.1 數(shù)據(jù)采集層收集高質(zhì)量的檔案數(shù)據(jù),為檔案管理精細(xì)化奠定基礎(chǔ)。數(shù)據(jù)采集是大數(shù)據(jù)技術(shù)處理流程中最為基礎(chǔ)的一步,高質(zhì)量的數(shù)據(jù)是大數(shù)據(jù)技術(shù)發(fā)揮效能的前提,大數(shù)據(jù)技術(shù)只有在高質(zhì)量的大數(shù)據(jù)環(huán)境下才能提取出隱含的、有用的信息。由于大數(shù)據(jù)具有實(shí)時(shí)與動(dòng)態(tài)性特征,“在線”、“近線”和“離線”的各種數(shù)字資源均是采集對(duì)象。為了使所獲得的數(shù)據(jù)更具有代表性,通過(guò)什么方式獲取數(shù)據(jù)信息顯得格外重要。數(shù)據(jù)采集層要收集不同數(shù)據(jù)源產(chǎn)生的數(shù)據(jù),為檔案數(shù)據(jù)挖掘的后續(xù)工作做好準(zhǔn)備。
2.2 數(shù)據(jù)整理層改變傳統(tǒng)數(shù)據(jù)處理方式,凸顯檔案管理精細(xì)化過(guò)程。經(jīng)過(guò)各種渠道獲取的檔案數(shù)據(jù)種類繁雜、結(jié)構(gòu)多樣,通過(guò)處理、集成、存儲(chǔ)可以做到:
一是將結(jié)構(gòu)復(fù)雜的數(shù)據(jù)轉(zhuǎn)換為單一的或便于處理結(jié)構(gòu)的數(shù)據(jù)?,F(xiàn)代互聯(lián)網(wǎng)應(yīng)用呈現(xiàn)出半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)大幅度增長(zhǎng)的趨勢(shì),這些資源將成為館藏的重要來(lái)源。如,對(duì)檔案系統(tǒng)運(yùn)行日志資料等數(shù)據(jù),就需要轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),形成檔案統(tǒng)一的語(yǔ)言。二是對(duì)采集到的數(shù)據(jù)進(jìn)行“去噪”和“清洗”,以保證數(shù)據(jù)的質(zhì)量和可靠性。由于原始數(shù)據(jù)中有噪聲數(shù)據(jù)、冗余數(shù)據(jù)等問(wèn)題,對(duì)數(shù)據(jù)進(jìn)行解析、清洗、重構(gòu),以提高待挖掘數(shù)據(jù)的質(zhì)量。三是對(duì)整理好的數(shù)據(jù)進(jìn)行存儲(chǔ),建立專門的數(shù)據(jù)庫(kù)分門別類地放置,減少數(shù)據(jù)查詢和訪問(wèn)的時(shí)間,提高數(shù)據(jù)提取速度。
2.3 數(shù)據(jù)分析層對(duì)檔案數(shù)據(jù)的精細(xì)分析,凸顯檔案管理精細(xì)化的思維模式。數(shù)據(jù)分析是整個(gè)大數(shù)據(jù)處理流程最為核心的部分?!跋嚓P(guān)性”分析是大數(shù)據(jù)技術(shù)重要的思維模式,通過(guò)對(duì)數(shù)據(jù)彼此關(guān)聯(lián)性的分析,能夠更清楚地看到隱藏在背后的看似不相關(guān)的數(shù)據(jù)之間彼此的密切聯(lián)系,使檔案數(shù)據(jù)挖掘從常規(guī)分析向廣度、深度分析轉(zhuǎn)變。
“相關(guān)性”分析可激活數(shù)字檔案資源,大數(shù)據(jù)技術(shù)的核心作用就是挖掘出龐大的數(shù)據(jù)倉(cāng)庫(kù)獨(dú)有的價(jià)值,不管是網(wǎng)絡(luò)實(shí)時(shí)運(yùn)算的“熱數(shù)據(jù)”,還是非在線的“冷數(shù)據(jù)”,通過(guò)對(duì)檔案數(shù)據(jù)的綜合挖掘、深度整合和數(shù)據(jù)分析,激活休眠狀態(tài)的檔案資源,展現(xiàn)數(shù)據(jù)價(jià)值,創(chuàng)造出新知識(shí)、新價(jià)值?!跋嚓P(guān)性”分析能有效破除信息孤島的數(shù)據(jù)壁壘,使各個(gè)孤立的、互不聯(lián)通的數(shù)據(jù)庫(kù)之間資源實(shí)現(xiàn)充分共享。
2.4 數(shù)據(jù)展示層為檔案用戶提供更加精準(zhǔn)服務(wù),凸顯檔案管理精細(xì)化“以人為本”的價(jià)值追求。對(duì)檔案用戶來(lái)說(shuō),最關(guān)心的不是數(shù)據(jù)分析處理過(guò)程,而是對(duì)大數(shù)據(jù)分析結(jié)果的解釋與展示。若數(shù)據(jù)分析的結(jié)果不能得到精準(zhǔn)的展示,會(huì)對(duì)檔案用戶產(chǎn)生困擾,甚至?xí)`導(dǎo)用戶。通過(guò)檔案管理信息系統(tǒng),將深度挖掘的數(shù)據(jù)可視化,可以使用戶清楚地看到未來(lái)發(fā)展的方向,從而對(duì)決策結(jié)果作出評(píng)價(jià),這也是決定整個(gè)系統(tǒng)挖掘技術(shù)是否成功的標(biāo)準(zhǔn)。
3 大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)深度挖掘,將檔案管理精細(xì)化發(fā)揮到極致
大數(shù)據(jù)技術(shù)在檔案管理中的應(yīng)用從兩個(gè)方向進(jìn)行描述:從橫向上看,以大數(shù)據(jù)挖掘技術(shù)為中心沿?cái)?shù)據(jù)收集、整理、分析到展示等技術(shù)解決方案;從縱向上看,以數(shù)據(jù)產(chǎn)品為中心沿檔案資源挖掘、用戶數(shù)據(jù)挖掘及關(guān)系洞察及趨勢(shì)預(yù)測(cè)逐級(jí)遞進(jìn)。大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)深度挖掘使檔案資源與用戶需求的雙向控制達(dá)到最優(yōu)化,凸顯管理精細(xì)化趨勢(shì)。
3.1 檔案資源挖掘。由于缺乏綜合數(shù)據(jù)挖掘和深度整合,檔案資源存在著重藏輕用深度挖掘不夠的問(wèn)題,因此,通過(guò)對(duì)檔案資源數(shù)據(jù)的深度挖掘,展現(xiàn)數(shù)據(jù)價(jià)值,創(chuàng)造出新價(jià)值。
首先,大數(shù)據(jù)時(shí)代樹(shù)立“大檔案”工作思路,重視數(shù)據(jù)積累,不僅要建立檔案資源體系,還要建立數(shù)據(jù)資源體系觀。其次,建立共享檔案數(shù)據(jù)資源庫(kù)。以省級(jí)為單位,建立集中的、規(guī)范的、可供共享的檔案數(shù)據(jù)資源庫(kù),使各檔案館藏之間相互關(guān)聯(lián),成為一個(gè)內(nèi)容豐富且不拘泥于實(shí)體存儲(chǔ)的,信息互聯(lián)共享的檔案數(shù)據(jù)資源網(wǎng)。最后,利用云計(jì)算平臺(tái)和處理技術(shù)構(gòu)建檔案數(shù)據(jù)資源網(wǎng),可以用于實(shí)時(shí)性檔案數(shù)據(jù)的接收,也可以對(duì)非實(shí)時(shí)性數(shù)據(jù)進(jìn)行分類處理,使其成為檔案用戶提供服務(wù)的平臺(tái)。
3.2 用戶數(shù)據(jù)挖掘。通過(guò)對(duì)用戶數(shù)據(jù)挖掘做到精確洞察,精準(zhǔn)服務(wù),提升檔案用戶認(rèn)同感,實(shí)現(xiàn)檔案服務(wù)價(jià)值。用戶數(shù)據(jù)挖掘包括以下方面:
一是對(duì)用戶信息進(jìn)行數(shù)據(jù)挖掘。提取用戶的信息需求,查看用戶訪問(wèn)服務(wù)器時(shí)留下的日志文件,跟蹤用戶行為,推測(cè)用戶興趣,提供個(gè)性化利用服務(wù)。二是對(duì)用戶統(tǒng)計(jì)檢索和瀏覽記錄進(jìn)行挖掘。如,利用統(tǒng)計(jì)分析的方法,通過(guò)分析用戶對(duì)檔案目錄的點(diǎn)擊率,選取點(diǎn)擊率高的檔案進(jìn)行數(shù)字化;通過(guò)分析用戶檢索時(shí)使用的檔案檢索詞,充實(shí)和完善數(shù)據(jù)倉(cāng)庫(kù)中的檢索關(guān)鍵詞,以提高查準(zhǔn)率;通過(guò)統(tǒng)計(jì)分析用戶對(duì)網(wǎng)頁(yè)的訪問(wèn)頻率,進(jìn)而開(kāi)展深層次的信息服務(wù)。
3.3 關(guān)系洞察及趨勢(shì)分析。無(wú)論是檔案資源和用戶數(shù)據(jù),通過(guò)挖掘得到的僅是某一方面的數(shù)據(jù),這些數(shù)據(jù)往往是孤立的數(shù)據(jù)點(diǎn),因此,要使這些數(shù)據(jù)集成為一個(gè)完整的網(wǎng)絡(luò),必須對(duì)數(shù)據(jù)網(wǎng)絡(luò)后面的數(shù)據(jù)關(guān)系進(jìn)行深入分析。如,單單對(duì)檔案收集情況進(jìn)行挖掘,得到的僅僅是檔案人員與檔案之間的關(guān)系,對(duì)檔案利用情況進(jìn)行挖掘,得到的僅僅是檔案與用戶之間的數(shù)據(jù)關(guān)系。然而,要想精準(zhǔn)洞察檔案之間、用戶之間及檔案與用戶之間關(guān)系,必須將以上各個(gè)孤立的數(shù)據(jù)點(diǎn)進(jìn)行整合,得到一個(gè)完整的檔案網(wǎng)絡(luò),才能使檔案發(fā)展、社會(huì)服務(wù)等趨勢(shì)的預(yù)測(cè)成為可能。
4 積極探索綜合性的對(duì)策促進(jìn)檔案數(shù)據(jù)深度挖掘的實(shí)現(xiàn)
在融合數(shù)據(jù),精細(xì)分析后,我們應(yīng)通過(guò)綜合性的策略保證大數(shù)據(jù)技術(shù)在檔案數(shù)據(jù)挖掘中的應(yīng)用落到實(shí)處,保障大數(shù)據(jù)技術(shù)在檔案管理應(yīng)用中的有效實(shí)現(xiàn)與良性循環(huán)。
4.1 建立以大數(shù)據(jù)技術(shù)為核心的數(shù)據(jù)資源體系,使檔案數(shù)據(jù)挖掘具有時(shí)代特色。構(gòu)建一個(gè)“以數(shù)字資源為主體,以文本、圖片、音頻、視頻等為形式,為中華民族集體記憶的建構(gòu)和傳承提供文獻(xiàn)支撐的‘中國(guó)記憶數(shù)字資源庫(kù)”[7],是時(shí)代賦予我們的目標(biāo)與使命。
首先,擴(kuò)大數(shù)據(jù)總量,構(gòu)建現(xiàn)代化的檔案資源體系,加強(qiáng)實(shí)體資源的建設(shè),完善檔案門類,優(yōu)化館藏結(jié)構(gòu)。其次,加強(qiáng)數(shù)字資源建設(shè),按照“存量數(shù)據(jù)化,增量電子化”戰(zhàn)略,組建數(shù)字化檔案資源庫(kù),加強(qiáng)電子文件的收集歸檔。最后,積極開(kāi)放數(shù)據(jù),整合數(shù)據(jù)資源,增強(qiáng)知識(shí)挖掘,實(shí)現(xiàn)數(shù)據(jù)增值。大數(shù)據(jù)技術(shù)為檔案管理的深度挖掘提供了數(shù)據(jù)管理方面的保障,而對(duì)數(shù)據(jù)的深度挖掘使檔案館的功能擴(kuò)展到發(fā)現(xiàn)與預(yù)測(cè)。
4.2 構(gòu)建以人為本的用戶關(guān)系管理,使得檔案數(shù)據(jù)內(nèi)在關(guān)聯(lián)得以深度挖掘。大數(shù)據(jù)時(shí)代最大轉(zhuǎn)變是放棄對(duì)因果關(guān)系的渴求,取而代之關(guān)注相互關(guān)系,只要知道“是什么”,而不需要知道“為什么”[8],這一轉(zhuǎn)變將使我們以新的視角去理解檔案用戶數(shù)據(jù)挖掘。
利用大數(shù)據(jù)技術(shù)可以掌握用戶此前的行為、正在進(jìn)行的實(shí)時(shí)行為,還可以對(duì)用戶未來(lái)行為進(jìn)行預(yù)測(cè)分析,深度挖掘數(shù)據(jù)內(nèi)在關(guān)聯(lián),促進(jìn)資源集成創(chuàng)新,實(shí)現(xiàn)檔案數(shù)據(jù)資源的增值服務(wù)。借助大數(shù)據(jù)技術(shù),對(duì)用戶搜索方式、行為軌跡、使用習(xí)慣、利用興趣、存儲(chǔ)行為等數(shù)據(jù)進(jìn)行分析,有效發(fā)現(xiàn)用戶隱性訴求。如,針對(duì)不同用戶,產(chǎn)生動(dòng)態(tài)推薦超級(jí)鏈接列表。建立以用戶名為單位的個(gè)性化數(shù)據(jù)庫(kù),把用戶想要的東西、挖掘分析結(jié)果放入。
4.3 在挖掘數(shù)據(jù)同時(shí)保護(hù)數(shù)據(jù)隱私安全,為檔案數(shù)據(jù)深度挖掘提供良好的環(huán)境保證。大數(shù)據(jù)時(shí)代的隱私保護(hù)面臨著技術(shù)和人力層面的雙重考驗(yàn),如果將這些數(shù)據(jù)合理利用,將為檔案預(yù)測(cè)決策提供必要的情報(bào)信息。如何在保護(hù)隱私的前提下對(duì)檔案數(shù)據(jù)進(jìn)行有效的挖掘,我們應(yīng)做到:一是健全法律規(guī)范對(duì)個(gè)人的隱私權(quán)利給予保護(hù),建立健全數(shù)據(jù)安全管理規(guī)劃體系,避免因個(gè)人隱私數(shù)據(jù)被隨意挖掘?yàn)E用而造成影響社會(huì)穩(wěn)定的事件發(fā)生。二是使用保護(hù)數(shù)據(jù)隱私的數(shù)據(jù)挖掘方法,合理界定哪些信息是屬于私人信息,在保護(hù)私人信息安全的情況下進(jìn)行數(shù)據(jù)挖掘。
4.4 借力“智慧因子”完善大數(shù)據(jù)技術(shù)在檔案數(shù)據(jù)挖掘中的應(yīng)用。隨著“智慧城市”的提出,智慧的概念涉及各個(gè)領(lǐng)域,智慧檔案館也應(yīng)運(yùn)而生,智慧檔案館的核心理念是智慧服務(wù),在大數(shù)據(jù)技術(shù)中植入智慧因子,依托物聯(lián)網(wǎng)技術(shù)將館舍、檔案、網(wǎng)絡(luò)、數(shù)據(jù)以及用戶統(tǒng)一在智能網(wǎng)絡(luò)中,達(dá)到有效整合和深度挖掘,深層次推動(dòng)檔案服務(wù)智慧化。大數(shù)據(jù)技術(shù)不僅將檔案資源、用戶數(shù)據(jù)、關(guān)系洞察及趨勢(shì)分析產(chǎn)生的各種數(shù)據(jù)資源進(jìn)行匯聚融合,而且利用智慧服務(wù)理念創(chuàng)新開(kāi)發(fā)個(gè)性化的服務(wù)手段,使得檔案知識(shí)的隱性知識(shí)顯性化,為用戶提供精細(xì)化的服務(wù)體驗(yàn),推進(jìn)檔案信息資源智慧服務(wù)和知識(shí)空間的構(gòu)建。
5 結(jié)論
大數(shù)據(jù)時(shí)代,大檔案、大服務(wù)、智慧檔案等成為檔案工作的新發(fā)展,隨著檔案管理創(chuàng)新的深入推進(jìn),大數(shù)據(jù)技術(shù)將真正落實(shí)到檔案管理各個(gè)環(huán)節(jié),數(shù)據(jù)挖掘技術(shù)將更加?jì)故斓卦跈n案管理中得到運(yùn)用。通過(guò)本文分析我們得出以下結(jié)論:
(1)檔案數(shù)據(jù)的深度挖掘是大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘技術(shù)在檔案管理應(yīng)用中最主要特點(diǎn),促進(jìn)檔案管理模式發(fā)生改變。因此,在開(kāi)展檔案管理流程研究時(shí),應(yīng)當(dāng)立足于這一點(diǎn),從而達(dá)到整體的最優(yōu)化。
(2)大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)的深度挖掘歷經(jīng)不同過(guò)程環(huán)節(jié),我們應(yīng)當(dāng)在厘清各環(huán)節(jié)的基礎(chǔ)上,采取有效措施促進(jìn)整個(gè)過(guò)程的有效運(yùn)行,實(shí)現(xiàn)整個(gè)過(guò)程的良性循環(huán)與互動(dòng)。
(3)大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)挖掘的實(shí)現(xiàn)除了依賴大檔案數(shù)據(jù)資源作為基礎(chǔ)外,還需要有“以人為本”的用戶關(guān)系管理、智慧服務(wù)理念、規(guī)范化的數(shù)據(jù)安全管理環(huán)境等,因此,檔案部門應(yīng)當(dāng)加強(qiáng)與各部門之間的協(xié)同合作,實(shí)現(xiàn)大數(shù)據(jù)技術(shù)在檔案管理中的應(yīng)用。
參考文獻(xiàn):
[1] 于英香.檔案大數(shù)據(jù)研究熱的冷思考[J].檔案學(xué)通訊,2015(2):5.
[2] 王雅潔等.大數(shù)據(jù)挖掘在食品安全預(yù)警領(lǐng)域的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2015(8):332.
[3] 周楓.資源 技術(shù) 思維——大數(shù)據(jù)時(shí)代檔案館的三維詮釋[J].檔案學(xué)研究,2013(6):63~64.
[4] 張芳霖,唐霜.大數(shù)據(jù)影響下檔案學(xué)發(fā)展趨勢(shì)的思考[J].北京檔案,2014(9):12.
[5] 曹莉.芻議大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘與精細(xì)管理[J].經(jīng)營(yíng)管理者,2013(18):191~192.
[6] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013(1):150~151.
[7] 馮惠玲.檔案記憶觀、資源觀與“中國(guó)記憶”數(shù)字資源建設(shè)[J].檔案學(xué)通訊,2012(3):6.
[8] 邁爾-舍恩伯格,庫(kù)克耶著,周濤譯.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].浙江人民出版社,2013:12~13.