汪月月
【摘要】隨著大數據時代的來臨,檔案信息化進程不斷加快,檔案部門通過檔案信息系統(tǒng)管理的數字檔案資源數量與種類越來越多。本文分析了大數據技術給檔案管理工作帶來的挑戰(zhàn)和機遇,并討論大數據技術在高校檔案信息化和信息安全防護機制建設等方面的應用。
【關鍵詞】檔案管理;大數據;高校
大數據技術的逐步發(fā)展給檔案管理工作帶來了巨大的變化。伴隨著一系列機遇的到來,新形勢對檔案管理工作提出了挑戰(zhàn)。隨著大數據技術的不斷完善,國內高校的檔案管理信息化程度已相當高,一定程度上提高了檔案管理工作的實際效率,同時檔案管理信息化也逐漸發(fā)展起來。另外,高校檔案館資源朝著多趨勢發(fā)展,且數據量越來越大,具備了大數據的特征。種類繁多、結構各異的海量數據和互聯網具有不確定性。
一、大數據時代背景
大數據技術的發(fā)展給檔案管理提供了良好的發(fā)展契機,有效提升了檔案管理工作的整體效率。在大數據時代,傳統(tǒng)載體檔案將面臨全面的數據化而不僅僅是數字化。數字化可能是僵死的信息存儲,而數據化則是可檢索和可以進行關聯分析的活數據。大數據技術作為一種從大量網絡結構性、非結構性、異構類數據提取有價值信息的能力,所需處理的數據規(guī)模巨大。人們使用網絡產生的數據資源有多種類型,包括音視頻資料、文本數據、地理位置信息、上網記錄等,符合用戶個人預期的個性化數據占主導地位。利用大數據技術對數據資源進行分析,運算效率較高,遵循“1秒定律”,可以從各種結構的網絡數據中快速找到有價值的信息供用戶使用。
總之,“大數據”是海量信息資源的總稱,計算對象是大規(guī)模的網絡數據,但真正有價值的信息可能是整體數據的一小部分。所以,大數據技術應用的主要目的是從海量的信息數據中提取有價值的信息。
二、大數據背景下檔案管理面臨的挑戰(zhàn)
(一)抽取和挖掘有用的信息和知識。知識管理是檔案管理發(fā)展的趨勢和方向,現在的檔案用戶早已不再局限于對數據和文件的利用,更加希望能夠獲得隱藏在數據背后的信息和知識。所以,檔案利用服務也不能僅僅限于提供數據,而應該將信息轉化為知識。但是,知識不是自身產生的,同樣也不是簡單的信息綜合,需要不斷抽取和挖掘才能發(fā)掘出來。
(二)查詢到所需要的檔案信息。與以往信息缺乏的時代相比,如今的信息時代,各種電子文件被廣泛利用。但是,各種信息文件太多,造成了信息泛濫,為篩選有用信息帶來了困難。由于檔案信息化建設工作不斷加強和數據涵蓋量快速增長,我們在查詢時,有用的信息往往被埋沒在大量無用信息中。不僅如此,檢索性能直線下降,甚至沒有響應。因此,檔案服務要解決的最重要問題就是如何在大量的檔案中快速而準確地找到有用的信息。
(三)對大數據進行充分的開發(fā)利用。對檔案進行管理的目的是便于日后對檔案的利用,需要二次開發(fā)檔案信息資源,做成各種形式的編研產品,同時主動提供給查找檔案者。在大數據時代背景下,各種檔案數量急劇增加、各種檔案類型以及編研開發(fā)非結構化的檔案信息,給二次開發(fā)檔案信息資源工作帶來了困難。首先是在海量數據中尋找有價值信息之間的聯系,其次是編研開發(fā)非結構化的檔案信息,最后是降低檔案開發(fā)工作人員的工作量。雖然目前先進的互聯網信息技術已應用至社會各階層和各領域,但工作人員手工修訂和整理各類檔案與文件的傳統(tǒng)方式依然在實際工作中沿用。
(四)缺乏相應的軟件支撐。高校檔案管理工作的落實部署、檢查、審查、監(jiān)督等重要環(huán)節(jié),都需要相應的軟件進行支撐。軟件在檔案管理之中的作用應該依托校園網,使得各部門的檔案數據能夠依據要求進行傳輸以及公開。
三、大數據背景下的高校檔案管理
隨著大數據技術的日益完善,將大數據技術應用于檔案管理具有非常重要的意義,不僅可以解決傳統(tǒng)檔案管理模式效率低、成本高的問題,還可以滿足不同類型的檔案管理需求。
(一)軟硬件設施的建設。高校檔案管理工作的信息化離不開軟硬件設施的支持,對于硬件設施主要是提供用于檔案管理工作所需要的計算機以及存儲設備,工作主要內容是做好計算機以及電子文件存儲設備的安全維護與數據備份管理。對于軟件設施,則主要是選擇操作容易、維護簡便以及具有查詢功能的管理軟件。通過高端的軟硬件設施,確保高校檔案管理信息化順利開展。
(二)高校檔案信息資料。高校檔案信息資料的收集整理主要是按照規(guī)范、標準以及統(tǒng)一的數據格式對各種電子文件資源進行整理,可以在檔案管理信息部門設置中心系統(tǒng),作為收發(fā)、存儲以及整理電子文件的中轉站,提高信息的收集以及保管工作的效率。
(三)檔案管理系統(tǒng)的安全保密。由于部分高校檔案信息資料具有一定密級,因此對于這些資料,既要確保檔案資料的真實、可靠、完整,同時也要確保電子檔案數據庫處于安全可靠的狀態(tài),對這些電子檔案進行訪問使用,必須經過相應的授權方可操作。
四、大數據技術在高校檔案管理中的應用
(一)檔案數據資源趨勢分析機制。在高校檔案管理中,檔案管理員為了滿足用戶的個性化需求,從海量的數據資源中提取有價值的信息,提供給師生或是學校行政部門,有必要建立數據資源趨勢分析機制,基于用戶行為及個體意愿從大量結構化、異構化的數據資源中提取有價值的信息數據提供給使用者。所謂數據資源趨勢分析機制,是指檔案管理機制的構建者利用大數據技術、分布式數據庫、算法工具構建面向網絡資源、館藏資源進行分析、處理、獲取、管理的邏輯系統(tǒng)。一方面,高校檔案管理部門要以師生用戶的隱性信息需求為核心,分析用戶的需求變化和分布狀態(tài)提供專業(yè)的數據平臺供用戶使用;另一方面,檔案管理部門利用算法工具分析館藏資源、網絡資源的使用情況及資源中所包含的價值性信息,針對使用者使用需求進行匹配。值得注意的是,用戶的資源需求是多元的,所應用的算法工具及分析模型要在不同的時間節(jié)點內調整,能隨著檔案信息資源更新、用戶需求變化做出改變,實現用戶需求管理與知識挖掘同步進行。
(二)關聯性數據標注系統(tǒng)。數據標注系統(tǒng)是高校檔案管理部門針對用戶需求管理、信息資源挖掘和價值性信息使用所形成的知識標注機制,主要是針對用戶的需求變化、檔案信息資源使用情況、價值性信息挖掘,對用戶使用過、未使用的數據資源進行數據性關聯性標注。高校檔案管理部門針對海量的數據信息、檔案信息資源進行知識挖掘,最重要的原則是根據資源的價值進行數據標注,使之具有標簽管理特征。用戶根據檔案資源的標注,借助標簽管理系統(tǒng)能夠根據檔案信息資源的數據邏輯特征快速找到關聯性數據,準確查詢。
(三)實現檔案資源可視化處理。在檔案信息資源挖掘和標注過程中利用計算機可視化技術,對結構化的檔案數據進行分析對比,能根據算法工具就資源的類型、時間、作者、價值等信息進行統(tǒng)計,依托計算機網絡生成分析報告,以可視化的數據模型呈現出來。同時,利用計算機可視化技術能對有關資源主題深入分析,基于關聯性數據資源生成可視化圖表,用戶充分了解檔案信息發(fā)展建設情況,選擇有價值的信息資源。值得注意的是,利用計算機可視化技術能夠幫助檔案管理部門以更加直觀的方式查看基于數據挖掘機制產生的價值信息,為后期開展用戶的個性化檔案管理服務進行經驗積累。
(四)設置智能輔助工具。傳統(tǒng)的檔案信息檢索使用模式主要是通過輸入相應的關鍵詞,得到檢索結果,從中發(fā)現有價值的信息資源?;诖髷祿夹g產生的智能輔助工具是在信息資源合理利用、合理使用的基礎上加上智能算法形成的。通過主動推送信息,在用戶輸入關鍵詞時,系統(tǒng)根據用戶的搜索行為自動向用戶提供信息數據。例如,在檢索某一時間節(jié)點信息時,系統(tǒng)會根據用戶的輸入法使用變化,自動篩選數據資源,及時向用戶提供與之對應的檔案信息,方便用戶快速作出決策。
【參考文獻】
[1]朱琦.大數據技術在檔案管理中的應用研究[J].科技資訊,2018,16(02):8-9.
[2]陳明九.大數據時代高校檔案管理系統(tǒng)建設研究——以山東建筑大學為例[J].山東建筑大學學報,2015,30(05):506-510.
[3]謝怡.基于大數據的高校檔案管理模式變革[J].山東理工大學學報(社會科學版),2015,31(06):103-107.
[4]朱喬芙.檔案管理系統(tǒng)的設計與實現研究[J].信息記錄材料,2018,19(04):181-182.
[5]林叢.福建省高校檔案管理系統(tǒng)的應用現狀與對策[J].辦公室業(yè)務,2017(19):113.
[6]畢大鵬.高校檔案管理信息系統(tǒng)的設計與實現[J].電子技術與軟件工程,2016(05):69.
[7]許琪瑋.論高校檔案管理與大數據技術的應用[J].辦公室業(yè)務,2018(14):157.
[8]王津琳.云計算、大數據在水利檔案管理系統(tǒng)建設中應用的構想[J].海河水利,2017(06):55-56.
[9]康廣文,劉月香.計算機在檔案管理中的應用與發(fā)展[J].黑龍江科技信息,1998(03):18.
[10]劉莎.檔案管理信息系統(tǒng)建設應注意的幾個問題[J].檔案管理,2018(06):96.
[11]王瑋.云計算環(huán)境下的高校檔案管理系統(tǒng)研究[J].電子測試,2016(21):111+105.
[12]王春英.大數據技術在檔案管理中的應用研究[J].黑龍江檔案,2016(02):48.