顏琪媛
摘要:應用大數(shù)據(jù)技術(shù),可以讓圖書館在新時期得到進一步地發(fā)展,可以讓信息服務水平得到提升。本文首先對大數(shù)據(jù)對圖書館帶來的影響進行分析,然后從信息服務的角度,對大數(shù)據(jù)在圖書館中的應用特點進行闡述,最后結(jié)合實例,提出幾點大數(shù)據(jù)在圖書館的應用策略。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);數(shù)字圖書館;信息服務
前言:
大數(shù)據(jù)是一種較為抽象的概念,主要指的是因為自身具有較大的容量、較快的增長速度、較為復雜的關(guān)系而需要新的處理模式才可以讓其決策力得到提升的海量信息資產(chǎn)。其本身具有規(guī)模大、結(jié)構(gòu)多樣、價值密度低的特點,其流程可以概括為數(shù)據(jù)采集、數(shù)據(jù)分析與數(shù)據(jù)解釋三個環(huán)節(jié)。
一、大數(shù)據(jù)對圖書館帶來的影響
(一)借助大數(shù)據(jù)建立知識服務導航機制
在傳統(tǒng)圖書館中,讀者在帶有明確目的的情況下,按照類別去尋找自己所需的書籍往往存在很多困難,需要工作人員提供幫助。非但讀者不夠方便,工作人員的工作量也被加大了。借助大數(shù)據(jù)技術(shù),可以建立起良好的知識服務導航機制,可以讓此問題得到徹底解決??梢岳靡苿討贸绦?qū)^內(nèi)地圖和OPAC進行有機整合,讓讀者在找尋資料時可以明確位置。
(二)借助大數(shù)據(jù)完善新的知識服務方式
借助大數(shù)據(jù)技術(shù),圖書館可以完成用戶數(shù)據(jù)信息的分析工作,不但可以明確用戶的信息行為,還能夠?qū)τ脩魸撛谛枨髷?shù)據(jù)予以深度挖掘。讀者的閱讀習慣、讀者的構(gòu)成部分、讀者的潛在需求以及相關(guān)的借閱數(shù)據(jù)都是極具價值的信息,通過對這些信息的分析,可以對讀者展開針對性的服務。如某位讀者經(jīng)常在圖書館內(nèi)借閱文學類的圖書,那么在其登錄數(shù)字化借閱端口時,就會出現(xiàn)多種此類圖書,起到良好的推薦作用[1]。
(三)大數(shù)據(jù)讓圖書館數(shù)據(jù)存儲和計算面臨挑戰(zhàn)
在大數(shù)據(jù)時代,數(shù)據(jù)的數(shù)量與類型都在不斷增多,非結(jié)構(gòu)化與結(jié)構(gòu)化的數(shù)據(jù)信息會隨著用戶的網(wǎng)絡活動而不斷產(chǎn)生,這無疑會提高圖書館數(shù)據(jù)存儲、計算、分析的要求,存儲能力和運算能力的限制會讓圖書館數(shù)據(jù)在應用過程中出現(xiàn)困難,讓圖書館面臨挑戰(zhàn)。
二、大數(shù)據(jù)在圖書館的應用特點
從信息服務角度來看,大數(shù)據(jù)在圖書館進行應用的過程中,服務對象、服務技術(shù)和服務模式均有所改變。現(xiàn)階段,智能手機已然成為了閱讀信息的主要載體,習慣使用智能手機的年輕人也隨之成為圖書館的主要服務對象;在服務技術(shù)方面,利用網(wǎng)絡化技術(shù)可以對傳統(tǒng)信息資源予以轉(zhuǎn)化,將其存儲于虛擬空間,對其進行處理的客觀技術(shù)在不斷更新,不斷轉(zhuǎn)變,而技術(shù)的轉(zhuǎn)變帶動了圖書館工作人員的轉(zhuǎn)變,要求工作人員需要掌握更多的服務技能;在服務模式方面,大數(shù)據(jù)在圖書館應用之后,可以不用親身到圖書館就可以完成信息的查找工作,信息服務模式發(fā)生了極大轉(zhuǎn)變,通過檢索功能,可以很快查找到所需信息,服務效率得到極大增強。同時,因為網(wǎng)絡通信技術(shù)的迅速崛起,如果圖書館建立起相應的APP,那么還可以通過軟件來為讀者提供個性化的信息推送服務[2]。
三、大數(shù)據(jù)在圖書館的應用策略
(一)選擇合理的大數(shù)據(jù)處理技術(shù)
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)格式漸漸變得豐富多樣,如視頻、音頻都已成為常見格式。在對圖書館大量數(shù)據(jù)進行存儲時,可以利用聯(lián)網(wǎng)方便、速度很快的硬盤存儲方式。圖書館在數(shù)據(jù)處理時,涉及到的信息大部分為結(jié)構(gòu)化數(shù)據(jù)信息,對有價值信息進行挖掘時具有很大的難度,圖書館應該對數(shù)據(jù)處理方式進行及時改變,對用戶的信息行為、借閱記錄等信息都需要予以深入分析,讓基礎設施得到改善,讓服務方案得到提升。就目前來看,圖書館可以選擇的數(shù)據(jù)處理方法主要可分為四種,第一種為Map Reduce技術(shù),這種技術(shù)可以把復雜的運行在大規(guī)模集群上的并行計算過程轉(zhuǎn)化為兩個函數(shù)的映射與簡化,對于編程人員來說十分方便,其處理流程可以概括為,編號代碼、配置作業(yè)、提交作業(yè)、分配和執(zhí)行Map任務、處理中間結(jié)果、分配和執(zhí)行Reduce任務;第二種為No Only SQL數(shù)據(jù)庫,這種數(shù)據(jù)庫的模型較為簡單,元數(shù)據(jù)、應用數(shù)據(jù)為分開狀態(tài),系統(tǒng)管理十分靈活;第三種為Hadoop技術(shù),這種技術(shù)具有易用性與開源性,其主要模塊分為兩部分,即MapReduce與分布式系統(tǒng),它們是處理核心,使用者能夠通過Hadoop完成計算機資源的組織工作,讓分布式計算平臺得以搭建;第四種為云計算技術(shù),無論是硬件還是軟件都是信息資源,都可以利用互聯(lián)網(wǎng)提供給用戶,同時,它可以讓信息資源結(jié)構(gòu)得到擴展,讓動態(tài)信息得到更新。
(二)解決圖書館信息資源組織問題
在應用大數(shù)據(jù)技術(shù)的過程中,信息資源組織面對的問題包含兩個方面,即信息特征的揭示困難和具體組織對象的選擇困難。為解決這兩大難點,需要著眼于流程設計和方法實施這兩個方面。
1.信息資源組織流程
信息人員利用多種信息技術(shù)可以完成分散、雜亂、大量的元數(shù)據(jù)選擇工作,對信息予以優(yōu)化和處理可以形成一個整體流程,非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)是大數(shù)據(jù)的主要來源,對半結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)予以存儲,對非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)予以流處理,讓并行數(shù)據(jù)庫和關(guān)系數(shù)據(jù)庫經(jīng)過批處理后可以完成數(shù)據(jù)的應用工作。
2.信息資源組織方法
在圖書館信息資源中,無論是網(wǎng)絡信息還是館藏信息都會在發(fā)展到一定程度后迅速增長,組成大數(shù)據(jù),現(xiàn)階段,數(shù)據(jù)庫方式、主題樹方式、超媒體方式與文件方式不能讓信息的收集和分析足夠高效,不能給用戶提供良好的服務體驗。信息資源組織方式中的批處理和流處理可以對非結(jié)構(gòu)化數(shù)據(jù)產(chǎn)生良好的信息資源組織效果。
(三)建立個性化、智能化的信息檢索系統(tǒng)
1.個性化搜索
如前文所說,在用戶信息收集基礎之上,建立起信息檢索系統(tǒng),用戶信息包含了學習信息、個人信息與行為信息,利用這些信息可以讓圖書館清楚用戶需求,形成推薦目錄。為實現(xiàn)個性化搜索,必須要確保搜索引擎的智能化,根據(jù)用戶輸入的關(guān)鍵詞,按照相關(guān)度、瀏覽數(shù)量等順序來呈現(xiàn)給用戶,查全率和查準率都要有所保障。搜索引擎應該具有人機對話功能和相應的分析能力,需要針對用戶搜索做出快速反應。同時,圖書館需要對搜索引擎予以定期評估,建立起以用戶為中心的搜索機制。endprint
2.智能化搜索
為實現(xiàn)智能化搜索,需要做好三方面的工作。首先,圖書館應該在系統(tǒng)搜索引擎中建立起機器學習的功能;其次,圖書館應該利用此功能,讓搜索引擎得到擴展,除了文字檢索之外,還可以擴展到視頻檢索、圖片檢索等;最后,搜索引擎應該具有自動更新功能,數(shù)據(jù)數(shù)量與類型在不斷增長,搜索引擎對平臺中的海量數(shù)據(jù)需要做到實時更新,確保結(jié)果的全面與準確。除此之外,在更新搜索引擎時應該結(jié)合用戶對信息的進行搜索的習慣。
(四)設計圖書館公共數(shù)據(jù)庫
1.設計圖書館公共數(shù)據(jù)庫的重要性
圖書館資料建設分為三個階段,第一階段為藏書建設,第二階段為文獻資源建設,第三階段為圖書館信息資源建設。完善圖書館公共數(shù)據(jù)庫是第三階段的主要內(nèi)容,公共資源建設包含三個方面,搜集制作資源、管理組織資源和資源服務體系,利用大數(shù)據(jù)技術(shù)可以完成資源的搜索、存儲與篩選工作,可以讓讀者需要得到滿足,并擴大圖書館自身的發(fā)展范圍。
2.設計圖書館公共數(shù)據(jù)庫的方法
以我國沈陽市圖書館為例,在公共數(shù)據(jù)庫結(jié)構(gòu)功能設計中其主線為使用者,E-R模型圖如圖1所示。
如圖1所示,通過網(wǎng)絡信息采集器,圖書管理員可以完成社交網(wǎng)、公共信息網(wǎng)等方面的信息采集工作,讓其在公共數(shù)據(jù)庫中得到儲存。而在用戶登錄模塊,圖書管理員在輸入密碼與用戶名之后,可以進入后臺管理界面,在此界面,可操作項包含了期刊管理、典藏管理等內(nèi)容。而在讀者檢索界面,可以進行圖書檢索、期刊檢索、模糊檢索和類別檢索。在公共數(shù)據(jù)庫管理框架的設計上,可分成三個步驟進行,首先需要使用網(wǎng)絡數(shù)據(jù)采集工具完成資源信息的采集工作,然后需要對采集的信息進行儲存和組織,最后需要對信息資源進行分析,結(jié)合當前情況,資源信息分析出現(xiàn)在移動終端設備與互聯(lián)網(wǎng)設備的情況較多。在網(wǎng)絡平臺公共信息數(shù)據(jù)存儲時,把組織之后的信息數(shù)據(jù)以列式存儲的方法存放在hbase數(shù)據(jù)庫里,一個存儲列對應一個頁鏈接。
(五)提高圖書館信息服務水平
1.學科知識服務
為提高圖書館信息服務水平,需要加強學科知識服務水平,需要為用戶提供具有個性化、科學化的圖書信息。無論是高校圖書館還是公共圖書館,這種學科知識服務都是必要的。在大數(shù)據(jù)的應用過程中,圖書館的信息服務內(nèi)容會產(chǎn)生變化,信息服務模式也會隨之變化,學科知識在迅速增長,在不斷更新,已然組成了學科生態(tài)系統(tǒng),在此基礎上,對這些數(shù)據(jù)信息進行采集與分析,利用處理工具與相關(guān)技術(shù)可以讓數(shù)據(jù)的潛在價值被挖掘出來,以學科為基礎,分析專業(yè)信息資源的檢索系統(tǒng)中的瀏覽下載頻率,可以找出不同時間段內(nèi)用戶的興趣點,對數(shù)據(jù)信息進行統(tǒng)計和挖掘可以找到圖書、用戶與信息資源之間的網(wǎng)絡結(jié)構(gòu),進而完成網(wǎng)絡的構(gòu)建工作。
2.一站式資源服務
在圖書館中應用大數(shù)據(jù)技術(shù),需要提供給用戶一站式資源服務。在當前環(huán)境下,數(shù)字化的信息資源十分龐大,數(shù)據(jù)的類型繁多且結(jié)構(gòu)相對復雜。在圖書館中,信息資源包含了兩個方面,即虛擬館藏資源與現(xiàn)實館藏資源。虛擬館藏資源包括了在線出版物、網(wǎng)絡數(shù)據(jù)庫和網(wǎng)絡動態(tài)信息,利用Hadoop、Map Reduce、云計算等技術(shù)可以讓用戶在復雜的數(shù)據(jù)中快速找到所需信息,將多種信息資源予以開放式存儲,可以讓用戶成為信息的主動發(fā)布者。同時,圖書館在數(shù)據(jù)信息整合的時候應該對重復數(shù)據(jù)予以去除,讓數(shù)據(jù)的可依賴性更高,利用大數(shù)據(jù)智能化檢索技術(shù)可以完成一站式資源服務的提供工作。
3.信息可視化服務
信息可視化程度和用戶面對信息的直觀性是緊密相關(guān)的。在大數(shù)據(jù)中,包含了大量信息,且這些信息的價值密度點不是很高,結(jié)合大數(shù)據(jù)分析技術(shù)可以將有價值信息予以找出,然后利用可視化技術(shù)(如歷史流、標簽云、空間信息)可以將此信息變得更為直觀。讓用戶的檢索、評價速度提升,進而使得圖書館對自身系統(tǒng)進行優(yōu)化。同時,信息可視化技術(shù)可以與學科計量學方法相結(jié)合,生成學科知識地圖,讓作者、學科以及著作之間的關(guān)系得到直觀表現(xiàn),讓學科知識的結(jié)構(gòu)得到闡述,讓各個領域的發(fā)展動態(tài)得到反映。以上海市圖書館為例,該圖書館在應用大數(shù)據(jù)過程這能夠推出了手機APP,且使用了iBeacon技術(shù),這種技術(shù)能夠?qū)⒍S碼、位置定位等移動手段和圖書館的服務結(jié)合,在借紙質(zhì)圖書時,利用手機APP還可以幫助讀者快速找到圖書所在位置,而在查詢圖書時,無論讀者身在何處,都可以對其進行查看。
4.智慧服務
在知識服務的基礎上,對其進行升華和創(chuàng)新可以形成智慧服務。瀏覽信息時產(chǎn)生的日志,借還書產(chǎn)生的數(shù)據(jù),書目查詢時產(chǎn)生的檢索目錄共同形成了用戶的信息來源,在數(shù)字圖書館中應用大數(shù)據(jù)的挖掘技術(shù),可以讓用戶對信息服務的滿意度得到提升,針對用戶的實際需求,可以為用戶提供具有主動性的定制化服務。以汕頭市圖書館為例,汕頭市圖書館在2017年6月份正式啟動了大數(shù)據(jù)服務平臺,并將圖書館入門處的智慧墻與之連接,智慧墻中顯示了每個小時的圖書館人次,圖書館的借還量、圖書借閱榜單以及新書的推薦等,就目前來看,在排行榜上,“東野圭吾”、“我的前半生”為熱門檢索詞,實現(xiàn)了智慧服務的目標。
結(jié)論:
綜上所述,通過選擇合理的大數(shù)據(jù)處理技術(shù)、解決圖書館信息資源組織問題、建立個性化智能化的信息檢索系統(tǒng)、設計圖書館公共數(shù)據(jù)庫和提高圖書館信息服務水平可以讓大數(shù)據(jù)技術(shù)在圖書館中得到良好的應用,進而推動圖書館的進一步發(fā)展,讓讀者獲得更為舒適的服務體驗。
參考文獻:
[1]高曉東,周建.高職院校圖書館大數(shù)據(jù)在學業(yè)預警中的應用[J].圖書館學刊,2015,3701:115-117.(2015-01-30)
[2]羅芳.大數(shù)據(jù)在圖書館的應用[J].科技廣場,2015,03:132-135.endprint