郭山
摘要:大數(shù)據(jù)時代的到來對各行各業(yè)造成了不同程度的沖擊,在應用大數(shù)據(jù)技術優(yōu)化工作流程、提高工作效率的過程中,一些難以避免的問題和困難逐漸浮出水面,如何用新的思維和方法去解決他們,關系到后續(xù)一系列的運營和變革。傳統(tǒng)圖書館在進行數(shù)字化建設過程中,數(shù)據(jù)大規(guī)模性問題、數(shù)據(jù)多樣性問題以及數(shù)據(jù)價值性問題等成為不小的挑戰(zhàn),而克服之道就在于從大數(shù)據(jù)固有特性角度進行分析以總結(jié)出有效的解決之策,本文即對此展開論述。
關鍵詞:大數(shù)據(jù);數(shù)字圖書館;建設;問題;解決措施
在大數(shù)據(jù)背景下,傳統(tǒng)圖書館建設也走上了數(shù)字化道路,它基于先進的計算機技術、信息技術和通訊技術等,借助網(wǎng)絡平臺和軟件工具,實現(xiàn)了對圖書文件信息的采集、篩選、加工、存儲、整合以及管理,通過完成的圖書信息管理系統(tǒng)來提高工作效率并滿足人們?nèi)找嬖鲩L的借閱需求。而數(shù)字圖書館的建設隨著大數(shù)據(jù)技術的發(fā)展也遭遇了一定的瓶頸,只有對其正確看待并合理分析,才能取得突破以保證數(shù)字圖書館發(fā)揮應有的價值。
一、大數(shù)據(jù)的概念
目前,大眾對大數(shù)據(jù)沒有一個統(tǒng)一的、明確的概念,大數(shù)據(jù)通常是指大小規(guī)格超越傳統(tǒng)數(shù)據(jù)庫軟件工具抓取、存儲、管理和分析能力的數(shù)據(jù)群。這個定義有很強的主觀色彩,因為沒有一個統(tǒng)一的標準來確定超過多少TB(1000GB)的數(shù)據(jù)才是大數(shù)據(jù)。但隨著時間的推移和技術的發(fā)展,我們可以知道大數(shù)據(jù)的量會越來越大。還有一點,這定義也會因為部門的差異而發(fā)生標準的變化,這和通用的是什么軟件以及特定行業(yè)數(shù)據(jù)集的大小有密切的關系。所以,現(xiàn)有各行業(yè)的大數(shù)據(jù)可以是幾十TB,也可以是幾干TB。按照EMC的界定,特指的大數(shù)據(jù)一定是指大型數(shù)據(jù)集,規(guī)模大概在10TB。通過多用戶將多個數(shù)據(jù)集集合在一起,能構成PB的數(shù)據(jù)量。
二、大數(shù)據(jù)背景下數(shù)字圖書館建設面臨的問題
大數(shù)據(jù)的優(yōu)勢體現(xiàn)在數(shù)據(jù)來源、數(shù)據(jù)處理方式和數(shù)據(jù)思維等方面,相應的應用難點也需要從其根本特性入手分析:
(一)如何解決數(shù)據(jù)的大規(guī)模性問題
數(shù)字圖書館收錄了包括文獻、光盤、網(wǎng)絡等在內(nèi)的各種資源,也聚焦了讀者和向讀者提供服務的各類信息。這些數(shù)據(jù)資源日復一日地增長累計,已經(jīng)形成了一個龐大的數(shù)據(jù)集,傳統(tǒng)以MB為基本單位的數(shù)據(jù)庫處理根本難以應對,只能依靠以GB、TB或PB為基本單位的大數(shù)據(jù)進行處理??梢姡髷?shù)據(jù)的“大”就體現(xiàn)在對數(shù)據(jù)收集的全面性、完整性和綜合性上,因此數(shù)字圖書館的建設首先要解決的問題就是如何處理海量的大數(shù)據(jù)存儲信息。
(二)如何解決數(shù)據(jù)的多樣性問題
數(shù)字圖書館的數(shù)據(jù)除了主要的圖書信息和讀者服務信息外,還擁有很多不同類型的數(shù)據(jù)信息,如閱讀社交數(shù)據(jù)、用戶反饋數(shù)據(jù)、系統(tǒng)運營與管理數(shù)據(jù)等,而它們的編碼和存儲格式各有差異,需要采取不同的處理方法。在數(shù)字圖書館建設過程中,這些異構數(shù)據(jù)在有限時間內(nèi)能否被合理利用,將成為數(shù)字圖書館發(fā)揮價值的關鍵。
(三)如何解決數(shù)據(jù)的價值性問題
數(shù)字圖書館的誕生是時代發(fā)展的必然產(chǎn)物,傳統(tǒng)地只向讀者提供借閱服務的運營目標正逐漸向數(shù)據(jù)分析與挖掘方向靠攏,因此其業(yè)務核心變成了對海量數(shù)據(jù)的深入分析與合理應用。在這一過程中,一些蘊藏在數(shù)據(jù)信息里的碎片化知識需要被精準地識別和展現(xiàn),因而數(shù)字圖書館面臨著從龐雜的數(shù)據(jù)中找出有價值信息的嚴峻挑戰(zhàn)。
三、大數(shù)據(jù)背景下數(shù)字圖書館建設的應對策略
(一)選擇性地聚集數(shù)字資源
針對數(shù)據(jù)大規(guī)模性問題,最佳的方法是轉(zhuǎn)變思維,即在建設數(shù)字圖書館時避免“貪大求全”,不必刻意囊括所有類別的數(shù)字資源,而是優(yōu)先選擇有特色或者已經(jīng)形成規(guī)模的數(shù)字資源,在此基礎上對其他資源進行整合,最終形成一套有組織、有系統(tǒng)地開發(fā)、整理和建設方法,確保數(shù)字圖書館的主要價值得以體現(xiàn)。具體來說,可以開展館際區(qū)域合作與資源整合共享,一方面減輕大數(shù)字給自身帶來的經(jīng)濟負擔,抵御資源投入不足風險;一方面針對選擇建設的數(shù)字資源進行更加完善的處理,比如怎樣長期保存、選擇何種存儲介質(zhì)、落實備份與遷移、探索仿真與再造等。
(二)趨向平臺化建設
現(xiàn)階段數(shù)字圖書館在管理結(jié)構化數(shù)據(jù)方面較為成熟,但對于非結(jié)構化數(shù)據(jù)的處理則應對不佳,一個有效的解決之策就是借助基于網(wǎng)格技術的信息化平臺,將計算機、數(shù)據(jù)庫、互聯(lián)網(wǎng)、傳感器、終端等整合成一個功能強大的虛擬計算機,從而實現(xiàn)數(shù)字圖書館異構環(huán)境下跨平臺異構資源的協(xié)同工作。該平臺應基于用戶需求進行建設,既要保證數(shù)據(jù)信息的質(zhì)量,又要保證不同類型的數(shù)據(jù)信息能夠被快捷、有效地存儲、保管、檢索和管理,這樣才能真正解決數(shù)據(jù)的多樣性問題。
(三)創(chuàng)新應用服務與軟件技術
數(shù)字圖書館的數(shù)據(jù)價值,在大數(shù)據(jù)背景下主要體現(xiàn)在這些方面:信息檢索、數(shù)據(jù)挖掘、知識呈現(xiàn)和個性化服務等,而它們都需要可靠的應用服務和軟件實現(xiàn)。為此,在建設數(shù)字圖書館過程中,一定要重視前沿科技活力的注入以及軟件技術的創(chuàng)新與發(fā)展,這樣才能跟上時代步伐。大數(shù)據(jù)背景下,數(shù)字圖書館的服務方式、途徑等時刻都在變化,所提供的服務也不僅僅是圖書借閱、信息查詢等,圍繞包括讀者、企業(yè)、機構等在內(nèi)的不同類型的用戶,數(shù)字圖書館必須具備強大的數(shù)據(jù)挖掘、數(shù)據(jù)處理、數(shù)據(jù)分析和呈現(xiàn)能力,才能在新時代發(fā)揮不俗的價值功能。
四、結(jié)束語
數(shù)字圖書館是大數(shù)據(jù)時代下孕育的產(chǎn)物,其建設過程在大數(shù)據(jù)背景下也遭遇了一些困難,需要集中精力突破數(shù)字資源建設、平臺打造以及服務價值提升等發(fā)展桎梏,用行之有效的應對措施保證數(shù)字圖書館的建設合理化、應用有效化,成為與時代共存并共進的綜合性服務設施。
參考文獻:
[1]郭軼賓.探究大數(shù)據(jù)背景下數(shù)字圖書館面臨的機遇與挑戰(zhàn)[J].智庫時代,2018(書):171-172.
[2]盧巧時.大數(shù)據(jù)時代數(shù)字圖書館面臨的機遇和挑戰(zhàn)[J].才智,2018(29):226.
[3]鄧文婷,大數(shù)據(jù)時代的數(shù)字圖書館建設研究[J].福建廣播電視大學學報,2018(04):25-28.