【摘 要】大數(shù)據(jù)數(shù)據(jù)量巨大,含有大量非結(jié)構(gòu)化數(shù)據(jù),具4V特性:大容量、高速度、價值和多類型。大數(shù)據(jù)環(huán)境下圖書館需升級基礎(chǔ)設(shè)施;進行數(shù)據(jù)系統(tǒng)化、標(biāo)準(zhǔn)化建設(shè);改變?nèi)瞬胖贫群凸芾眢w制。同時轉(zhuǎn)變觀念,突出共享,培養(yǎng)館員的大數(shù)據(jù)分析處理能力,為讀者提供有預(yù)見性的個性化服務(wù)。
【關(guān)鍵詞】大數(shù)據(jù);資源建設(shè);圖書館服務(wù)
隨著數(shù)字圖書館的建立和應(yīng)用,高校圖書館逐步轉(zhuǎn)向以讀者為中心的服務(wù)模式。讀者訪問圖書館的同時產(chǎn)生了海量的各種類型的數(shù)據(jù),包括讀者行為信息,圖書管理日志以及運行監(jiān)控數(shù)據(jù)等。這些數(shù)據(jù)非結(jié)構(gòu)化且較分散,蘊含的潛在價值需要去挖掘。同時不斷增長的海量數(shù)據(jù)對圖書館存儲基礎(chǔ)設(shè)施也提出了嚴(yán)峻的挑戰(zhàn)。
一、大數(shù)據(jù)(Big Data)概念
(一)大數(shù)據(jù)的提出
信息技術(shù)特別是互聯(lián)網(wǎng)的飛速發(fā)展產(chǎn)生了大量數(shù)據(jù),一部數(shù)字化電影就有數(shù)GB,單個數(shù)據(jù)庫可達TB,甚至PB(1024TB)量級。IDC預(yù)計到2020年,全球?qū)⒖偣矒碛?5億GB的數(shù)據(jù)量[1]。2011年5月麥肯錫公司發(fā)布《Bia Data:the Next Frontier for Innovation》報告,首次提出了“大數(shù)據(jù)”概念。大數(shù)據(jù)一般指達到PB量級的各種數(shù)據(jù)的集合,具有4V特性:容量(Volume)、速度(Velocity)、價值(Value)和類型(Variety)。即數(shù)據(jù)量巨大;數(shù)據(jù)處理速度快;蘊含潛在的價值轉(zhuǎn)化;數(shù)據(jù)類型復(fù)雜多樣[2]。
(二)圖書館的大數(shù)據(jù)
高校圖書館在長期的積累下館藏信息資源已有相當(dāng)規(guī)模,服務(wù)理念和模式也幾經(jīng)改變。數(shù)字圖書館的發(fā)展使數(shù)字化數(shù)據(jù)急劇增長。高校圖書館收集有大量文獻信息資源,讀者多樣且眾多,使得圖書館必然面臨大數(shù)據(jù)的產(chǎn)生與存儲應(yīng)用。在數(shù)據(jù)規(guī)模、數(shù)據(jù)結(jié)構(gòu)、服務(wù)模式等多個方面,當(dāng)前圖書館正面臨著巨大的挑戰(zhàn)[3]。2012年上海國際圖書館論壇在國內(nèi)圖書情報界首次引入大數(shù)據(jù)理念。PB級別非結(jié)構(gòu)化數(shù)據(jù)的處理應(yīng)用需要發(fā)展新的技術(shù)和模型,圖書館現(xiàn)有的數(shù)據(jù)庫、數(shù)據(jù)分析與挖掘技術(shù)難以對大數(shù)據(jù)進行有效的加工處理。大數(shù)據(jù)是圖書館的挑戰(zhàn)同時也是機遇。借助大數(shù)據(jù)技術(shù)實現(xiàn)數(shù)據(jù)的系統(tǒng)化、標(biāo)準(zhǔn)化建設(shè),可充分利用圖書館館藏信息資源優(yōu)勢,促進圖書館的良性發(fā)展。
二、大數(shù)據(jù)環(huán)境下高校圖書館信息資源建設(shè)
(一)升級基礎(chǔ)設(shè)施
數(shù)據(jù)信息的產(chǎn)生速度大大超出了我們的想象。大數(shù)據(jù)數(shù)據(jù)量巨大、高速、類型多樣化的特點,需要對現(xiàn)有存儲基礎(chǔ)設(shè)施進行升級來滿足大數(shù)據(jù)運轉(zhuǎn)要求。服務(wù)器計算能力要強,可預(yù)留3年左右冗余計算能力,采用SMP服務(wù)器并可分布式聯(lián)機擴展。存儲系統(tǒng)應(yīng)具有熱拔插、容錯和可擴展能力,如采用SAN存儲技術(shù)。網(wǎng)絡(luò)布線以光纖為主干??蓴U展性,分布式為重點,設(shè)定一定的冗余以應(yīng)對數(shù)據(jù)量的增長,滿足大數(shù)據(jù)分析處理、挖掘等運轉(zhuǎn)的要求。
(二)數(shù)據(jù)系統(tǒng)化、標(biāo)準(zhǔn)化
大數(shù)據(jù)不僅數(shù)據(jù)量巨大,還具有非結(jié)構(gòu)化的特點。要對高校圖書館非結(jié)構(gòu)化數(shù)據(jù)迅速增長的情況給予足夠重視。通過完善數(shù)據(jù)存儲系統(tǒng),構(gòu)建新的文件系統(tǒng),實現(xiàn)數(shù)據(jù)的系統(tǒng)化、標(biāo)準(zhǔn)化建設(shè)。在數(shù)據(jù)利用方面,對現(xiàn)有資源數(shù)據(jù),采用回歸分析、聚類分析、特征分析等技術(shù)進行數(shù)據(jù)挖掘,充分利用現(xiàn)有數(shù)據(jù)價值。數(shù)據(jù)分析中SQL可重復(fù),高度結(jié)構(gòu)化,兼容性好,適用于各種數(shù)據(jù)庫結(jié)構(gòu),是分析結(jié)構(gòu)化數(shù)據(jù)的普遍方法。但SQL較繁瑣,效率低。分析大容量數(shù)據(jù)可采用基于分布式架構(gòu)的Hadoop工具。Hadoop效率高、 擴展佳、可靠并且可容錯,應(yīng)用廣泛,是開展大數(shù)據(jù)分析的較佳選擇。
(三)人才制度和管理體制的改變
大數(shù)據(jù)的有效利用離不開管理制度的支持和人員的引進和培養(yǎng)。大數(shù)據(jù)是新興的理念,需要對館員進行培訓(xùn)來理解什么是大數(shù)據(jù),如何認識大數(shù)據(jù),如何利用大數(shù)據(jù),破除對大數(shù)據(jù)的神秘感。對大數(shù)據(jù)的加工利用則需要培養(yǎng)和引進具有扎實的大數(shù)據(jù)加工處理技術(shù)的高素質(zhì)館員。在制度上要完善業(yè)務(wù)流程、轉(zhuǎn)變服務(wù)理念以及考評機制,給予大數(shù)據(jù)相應(yīng)地位,重視對大數(shù)據(jù)的開發(fā)利用,利用大數(shù)據(jù)改善讀者服務(wù),提高服務(wù)效率。
三、圖書館服務(wù)的影響
(一)提供個性化服務(wù)
大數(shù)據(jù)時代信息獲取渠道的多樣化使圖書館地位受到挑戰(zhàn)。圖書館館員應(yīng)在工作中轉(zhuǎn)變服務(wù)方式,牢固樹立個性化服務(wù)的信念,滿足讀者差異性需求。同時要通過大數(shù)據(jù)處理技術(shù)分析讀者閱讀習(xí)慣,針對讀者個人專業(yè)、科研和教學(xué)等方面進行需求趨勢預(yù)測并推送給讀者作參考。圖書館咨詢服務(wù)已不僅局限于查詢信息與反饋信息,要求圖書館館員能夠提供綜合性強的個性化信息。由圖書傳遞向信息服務(wù)甚至向知識服務(wù)轉(zhuǎn)變[4]。
(二)轉(zhuǎn)變觀念,突出共享
突出互聯(lián)網(wǎng)思維,轉(zhuǎn)變觀念,建立共享意識。高校圖書館由于從屬于各個高等院校,一直以服務(wù)本校師生為主,普遍缺乏共享意識。首先要明確高校圖書館資源是全社會共有的,理應(yīng)全社會共享。通過參加高校聯(lián)盟,開展CALIS和BALIS服務(wù)等方式將各自的館藏資源共享,提高利用率,減少浪費。
(三)大數(shù)據(jù)處理分析能力培養(yǎng)
經(jīng)過數(shù)字圖書館的建設(shè)和應(yīng)用,信息網(wǎng)絡(luò)技術(shù)的應(yīng)用實踐,高校圖書館館員的計算機操作技能有了很大提高。但對大數(shù)據(jù)普遍沒有意識,更缺乏利用能力。大數(shù)據(jù)時代,云計算技術(shù)使得數(shù)據(jù)處理方便高效,從大數(shù)據(jù)中獲取到有用的信息并且充分利用日益重要。對館員開展定期培訓(xùn),樹立大數(shù)據(jù)理念,掌握并熟悉數(shù)據(jù)分析、挖掘工具的使用,利用分析結(jié)果有針對性地改進服務(wù),積極主動為讀者提供有預(yù)見性的個性化服務(wù)。
結(jié) 語
高校圖書館是人類各類文獻信息資源的集中存儲中心。信息網(wǎng)絡(luò)技術(shù)產(chǎn)生并廣泛應(yīng)用后,越來越多的數(shù)據(jù)庫、知識庫、教育資源向互聯(lián)網(wǎng)開放,數(shù)字資源極大豐富。信息資源獲取渠道多元化趨勢日益明顯,高校圖書館的資源中心地位日趨弱化,高校圖書館要抓住大數(shù)據(jù)時代的機遇,利用館藏信息資源優(yōu)勢,積極研究對圖書館大數(shù)據(jù)的開發(fā)利用,牢固樹立共享服務(wù)觀念,更好為讀者提供服務(wù),提高信息資源利用率。
作者簡介:屈勁風(fēng)(1970-),男,北京市人,民族:漢,職稱:館員,學(xué)歷:本科,單位:北京聯(lián)合大學(xué)圖書館,館員,研究方向:圖書情報。
參考文獻:
[1]云計算環(huán)境下大數(shù)據(jù)及其智能處理技術(shù)[EB/OL].[2013-07-12].http://wenku. baidu.com/view/b20357b065ce050876321384.html.
[2]李鵬云.大數(shù)據(jù)與圖書館服務(wù)[J].農(nóng)業(yè)圖書情報學(xué)刊,2013,(9):178-181.
[3]劉瓊.大數(shù)據(jù)環(huán)境下圖書館面臨的影響與挑戰(zhàn)[J].理論觀察,2013,(8):112-113.
[4]許中華.圖書館員職業(yè)道德與職業(yè)自覺芻議.信息管理,2009(1).