白茹花
【摘要】在高校檔案管理中引入大數(shù)據(jù)思維,圍繞高校內(nèi)部檔案建設(shè)需求和用戶(hù)體驗(yàn),采用不同的大數(shù)據(jù)收集和分析方法,將檔案管理提升到更互聯(lián)網(wǎng)化的管理模式,以提高檔案的利用率和用戶(hù)滿(mǎn)意度。
【關(guān)鍵詞】大數(shù)據(jù);檔案管理;高校
高校的檔案建設(shè)往往按照自身工作要求,對(duì)檔案進(jìn)行分類(lèi)、收集、加工、保存等工作。經(jīng)過(guò)多年的積累,形成具有通用與專(zhuān)業(yè)內(nèi)容并存的檔案結(jié)構(gòu)體系。然而,目前不少高校的檔案數(shù)據(jù)容量雖然很大,但檔案的重復(fù)利用率普遍不高,未能充分發(fā)揮出檔案服務(wù)的價(jià)值。檔案的獲取受時(shí)間、空間、地點(diǎn)、查詢(xún)速度等條件的限制和約束。在這種情況下,高校檔案管理與服務(wù)應(yīng)逐步形成高校的大數(shù)據(jù)思維,打造更互聯(lián)網(wǎng)化的檔案管理模式,才能提高檔案的利用率和用戶(hù)滿(mǎn)意度。
一、高校內(nèi)部檔案管理存在的問(wèn)題
(一)檔案系統(tǒng)內(nèi)部相互獨(dú)立,信息孤島問(wèn)題嚴(yán)重。高校內(nèi)部的檔案建設(shè)體系,基本上是按照業(yè)務(wù)方向進(jìn)行分類(lèi),這些系統(tǒng)的業(yè)務(wù)內(nèi)容不同,對(duì)檔案處理方式也就不同,造成檔案格式各自為政,檔案之間形成所謂的信息孤島,雖然易于各類(lèi)檔案的建檔與管理,也利于建設(shè)人員專(zhuān)注于檔案的專(zhuān)業(yè)化程度。但是由于無(wú)法形成一個(gè)完整檔案建設(shè)和管理體系。在內(nèi)容上不能互聯(lián)互通,在數(shù)據(jù)格式上造成多種形式并存,在邏輯上顯得雜亂無(wú)序,不利于站在一個(gè)整體的角度對(duì)高校檔案建設(shè)進(jìn)行發(fā)展規(guī)劃。
(二)高校檔案利用率不高,用戶(hù)體驗(yàn)有待改進(jìn)。高校檔案的價(jià)值,不僅僅是為了解決數(shù)據(jù)保存的完整,也是要讓檔案得到二次利用,要讓更多的用戶(hù)獲取與使用,從而直接或間接產(chǎn)生價(jià)值。目前大部分電子檔案數(shù)據(jù)在數(shù)據(jù)庫(kù)中都是按照條目進(jìn)行存儲(chǔ),而當(dāng)用戶(hù)試圖使用這些資源時(shí),也是按照條目來(lái)瀏覽和使用的。這種模式缺少資源條目之間的縱向聯(lián)系,對(duì)用戶(hù)來(lái)說(shuō),卻往往需要通過(guò)不同緯度獲取多種檔案。比如通過(guò)文章標(biāo)題能夠找到多年來(lái)類(lèi)似的公文,大家已經(jīng)習(xí)慣了互聯(lián)網(wǎng)上的搜索引擎一站式的查找資料方法,并不關(guān)注要找的資料是哪種格式或存儲(chǔ)在什么位置,如果為了找到某一條信息,用戶(hù)需要進(jìn)行若干次查找和瀏覽,本來(lái)簡(jiǎn)單的操作被成倍放大,用戶(hù)體驗(yàn)就變的很差。檔案利用率上不去,也就不能發(fā)揮應(yīng)有的作用。
二、高校內(nèi)檔案管理與服務(wù)引進(jìn)大數(shù)據(jù)的必要性
大數(shù)據(jù)技術(shù)讓不同的數(shù)據(jù)聚合產(chǎn)生新的知識(shí),通過(guò)收集來(lái)自各種不同格式、不同分類(lèi)的檔案數(shù)據(jù)源,可以提取有用的信息,經(jīng)過(guò)數(shù)據(jù)清洗、轉(zhuǎn)換、重構(gòu)形成新的數(shù)據(jù)集合,然后通過(guò)合適的查詢(xún)和分析工具、數(shù)據(jù)挖掘工具、聯(lián)機(jī)處理工具對(duì)數(shù)據(jù)進(jìn)行加工處理,最終轉(zhuǎn)化為滿(mǎn)足不同用戶(hù)的新知識(shí)。
高校檔案管理引進(jìn)大數(shù)據(jù)技術(shù),通過(guò)針對(duì)現(xiàn)有檔案管理系統(tǒng)數(shù)據(jù)庫(kù)進(jìn)行關(guān)聯(lián)分析,找出數(shù)據(jù)的相關(guān)性,提取有價(jià)值的信息,可以為檔案管理與數(shù)據(jù)提取提供廣泛、深入的數(shù)據(jù)支持。同時(shí),大數(shù)據(jù)技術(shù)還可以從大量數(shù)據(jù)中發(fā)現(xiàn)那些難以分析接納的知識(shí),實(shí)現(xiàn)真正意義的數(shù)據(jù)整合。
三、大數(shù)據(jù)在高校內(nèi)部檔案服務(wù)的應(yīng)用探索
在高校檔案管理中引進(jìn)大數(shù)據(jù)思維,圍繞高校內(nèi)部檔案建設(shè)需求和用戶(hù)體驗(yàn),采用不同的大數(shù)據(jù)收集和分析方法,將檔案管理提升到更互聯(lián)網(wǎng)化的高度。
(一)基于用戶(hù)行為的檔案服務(wù)定制。傳統(tǒng)高校的檔案服務(wù)方式習(xí)慣于采用被動(dòng)服務(wù)方式,其特點(diǎn)是不關(guān)注不了解用戶(hù)的實(shí)際要求,檔案管理系統(tǒng)開(kāi)發(fā)人員按照工作經(jīng)驗(yàn)進(jìn)行檔案的收集開(kāi)發(fā)。用戶(hù)處于被動(dòng)接受地位,檔案到用戶(hù)屬于單向流動(dòng),這種服務(wù)方式已經(jīng)遠(yuǎn)遠(yuǎn)滿(mǎn)足不了用戶(hù)的真實(shí)需要。要想真正了解用戶(hù)必須借助大數(shù)據(jù),通過(guò)統(tǒng)計(jì)工具收集用戶(hù)的上網(wǎng)行為數(shù)據(jù),然后就可以通過(guò)對(duì)用戶(hù)行為數(shù)據(jù)按照一定算法進(jìn)行分析和歸納。以用戶(hù)行為產(chǎn)生的歷史數(shù)據(jù)為基礎(chǔ),實(shí)現(xiàn)向用戶(hù)主動(dòng)推送檔案;同時(shí),還可以向用戶(hù)提供智能化檢索功能,使用戶(hù)能夠更快更全地找到所需要的檔案信息。
(二)基于用戶(hù)評(píng)價(jià)的檔案管理。檔案最大的價(jià)值來(lái)自于再次利用,來(lái)自于服務(wù)用戶(hù)。因此,用戶(hù)對(duì)檔案評(píng)價(jià)數(shù)據(jù)具有非常大的價(jià)值,它是高校了解現(xiàn)有檔案的內(nèi)容質(zhì)量、運(yùn)行效率、服務(wù)水平等方面的數(shù)據(jù)渠道。用戶(hù)評(píng)價(jià)既包含對(duì)檔案現(xiàn)狀的具體意見(jiàn)和整體評(píng)價(jià),還包含對(duì)檔案未來(lái)發(fā)展的期望和需求。通過(guò)對(duì)用戶(hù)評(píng)價(jià)數(shù)據(jù)的分析,可以為檔案在加工、發(fā)布、保存等環(huán)節(jié)上提供操作依據(jù)。
(三)實(shí)現(xiàn)檔案的互聯(lián)互通。檔案之間的格式、形式可能不同,但往往相互之間有著緊密的聯(lián)系,例如某個(gè)發(fā)文有可能和合同、財(cái)務(wù)報(bào)銷(xiāo)單據(jù)等的某些內(nèi)容相一致或者存在關(guān)聯(lián)關(guān)系,單獨(dú)的一份檔案可能不能滿(mǎn)足用戶(hù)索取需求,與其他檔案關(guān)聯(lián)與使用成為了必然。然而,不同檔案之間來(lái)源和內(nèi)容側(cè)重點(diǎn)不同,造成檔案之間沒(méi)有建立邏輯關(guān)系,仍然存在著“信息孤島”問(wèn)題。只有通過(guò)大數(shù)據(jù)手段,按照檔案的關(guān)鍵詞、內(nèi)容片段等信息對(duì)不同結(jié)構(gòu)、不同來(lái)源的檔案進(jìn)行組合,可以將原本隸屬于不同種類(lèi)的檔案進(jìn)行關(guān)聯(lián),在邏輯上整合為一個(gè)實(shí)體,當(dāng)用戶(hù)在查看或?yàn)g覽某一資源的同時(shí),與之相關(guān)聯(lián)的檔案就可以同時(shí)展示給用戶(hù)。避免用戶(hù)重復(fù)查找。這些所謂的“信息孤島”將能夠通過(guò)數(shù)據(jù)挖掘和數(shù)據(jù)分析的手段進(jìn)行整合,原本互相不可能關(guān)聯(lián)的獨(dú)立檔案信息就可以組合為一個(gè)有機(jī)的生態(tài)系統(tǒng)。
四、結(jié)論
大數(shù)據(jù)時(shí)代讓數(shù)據(jù)流通變得更多更快、也為高校的檔案關(guān)聯(lián)提升帶來(lái)契機(jī)。高校內(nèi)部檔案管理與服務(wù)面臨的問(wèn)題就是檔案分類(lèi)多,檔案關(guān)聯(lián)性差,用戶(hù)對(duì)檔案的需求多樣。因此高校內(nèi)部的檔案管理必須通過(guò)借助大數(shù)據(jù)分析手段,真正實(shí)時(shí)了解用戶(hù),充分挖掘現(xiàn)有檔案的數(shù)據(jù)價(jià)值,對(duì)檔案進(jìn)行調(diào)整和邏輯整合。不斷優(yōu)化用戶(hù)體驗(yàn),從而最大程度發(fā)揮高校檔案的應(yīng)用價(jià)值。
【參考文獻(xiàn)】
[1]吳建成.大數(shù)據(jù)時(shí)代背景下的檔案利用服務(wù)探討.湖北檔案,2013(03).