王姝+馬春華
【摘 要】 網(wǎng)絡(luò)技術(shù)在高校圖書館大規(guī)模應(yīng)用,引發(fā)了圖書館任務(wù)的變化,用互聯(lián)網(wǎng)為學(xué)科知識服務(wù)和用戶個性化服務(wù),已成為圖書館兩大服務(wù)主題,而兩大服務(wù)要依靠做好大數(shù)據(jù)服務(wù)。高校圖書館大數(shù)據(jù)具有自身特征,在應(yīng)用中面臨諸多挑戰(zhàn),要使大數(shù)據(jù)發(fā)揮作用,體現(xiàn)價值,必須堅持理論創(chuàng)新、技術(shù)創(chuàng)新、規(guī)模創(chuàng)新和方法創(chuàng)新。進(jìn)而推進(jìn)大數(shù)據(jù)服務(wù)的順利開展。
【關(guān)鍵詞】 數(shù)據(jù)特征 技術(shù)創(chuàng)新
1、高校圖書館大數(shù)據(jù)特征
大數(shù)據(jù)是云計算、互聯(lián)網(wǎng)、社交網(wǎng)等信息技術(shù)快速發(fā)展的產(chǎn)物,具有種類多、體量大、流量快、價值高的基本特征。高校圖書館大數(shù)據(jù)除了上述特征之外,還具有其自身的明顯特征,主要表現(xiàn)在:
1.1大數(shù)據(jù)和知識既聯(lián)系又有區(qū)別。圖書館中的大數(shù)據(jù)在被調(diào)用分析前是無序的,不能直接被利用。而圖書館中的藏書、論文數(shù)據(jù)庫等信息資源是可直接閱讀的,應(yīng)屬于不可直接利用的大數(shù)據(jù)。但讀者的借閱記錄、用戶信息行為,訪問記錄等可以是圖書館大數(shù)據(jù)或可以成為圖書館大數(shù)據(jù)。
1.2數(shù)據(jù)分類明晰。從情報學(xué)的研究角度看,高校圖書館大數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù),如紙質(zhì)純印本、光盤、數(shù)據(jù)庫資源等;非結(jié)構(gòu)化數(shù)據(jù),如用戶瀏覽、借閱和日常圖書館服務(wù)環(huán)節(jié)記錄數(shù)據(jù)等;異構(gòu)化數(shù)據(jù),如自建統(tǒng)計,人員維護(hù)記載或外購數(shù)字資源等。圖書館大數(shù)據(jù)種類繁多,內(nèi)容十分豐富。
1.3數(shù)據(jù)流量增加迅猛。最近幾年,高校圖書館內(nèi)的各類中外文期刊,專業(yè)學(xué)術(shù)論文等圖書資源迅速膨脹,同時搜索和瀏覽數(shù)據(jù)也在急劇增加,體量浩大,前所未有。
1.4大數(shù)據(jù)關(guān)聯(lián)性明顯。高校圖書館大數(shù)據(jù)是由一個個數(shù)據(jù)、數(shù)據(jù)庫、數(shù)據(jù)集和數(shù)據(jù)群累加聚集而形成的。數(shù)據(jù)館藏資源不僅體現(xiàn)出數(shù)據(jù)集內(nèi)部的關(guān)聯(lián)性,也能體現(xiàn)出數(shù)據(jù)集與數(shù)據(jù)集、數(shù)據(jù)群與數(shù)據(jù)群,數(shù)據(jù)集與數(shù)據(jù)群之間的密切聯(lián)系。當(dāng)然這種關(guān)聯(lián)性要通過大數(shù)據(jù)挖掘才可體現(xiàn)其巨大價值。
1.5數(shù)據(jù)價值巨大但密度較低。因受到各方面因素的制約,知識服務(wù)領(lǐng)域的開放程度并不如人意。“信息孤島”仍隨處可見,這為數(shù)據(jù)的完整收集,特別是高質(zhì)量的數(shù)據(jù)獲取帶來了困難。由于海量大數(shù)據(jù)中包含著很多無用信息,低價值密度特點(diǎn)突出。大數(shù)據(jù)的真正利用價值有待于沉入挖掘。
2、大數(shù)據(jù)應(yīng)用貴在創(chuàng)新
面對挑戰(zhàn)和阻礙,高校圖書館要敢于迎難而上,堅持在理論上創(chuàng)新,在技術(shù)上創(chuàng)新,在模式上創(chuàng)新,在方法上創(chuàng)新,通過不斷創(chuàng)新發(fā)掘應(yīng)用大數(shù)據(jù)的源泉。
2.1理論上創(chuàng)新。高校圖書館目前可將圖論作為基礎(chǔ)理論,即以圖為數(shù)據(jù)結(jié)構(gòu)對現(xiàn)實(shí)世界進(jìn)行研究,這對網(wǎng)絡(luò)信息挖掘以及大數(shù)據(jù)體系運(yùn)作將起到很好的促進(jìn)作用。這一理論通過構(gòu)建“語義網(wǎng)絡(luò)”來表達(dá)“顯性知識”,又通過構(gòu)建“社會網(wǎng)絡(luò)”來挖掘“隱性知識”,進(jìn)而實(shí)現(xiàn)輔助知識創(chuàng)新。在建立云計算平臺的基礎(chǔ)上,可為開發(fā)大數(shù)據(jù)應(yīng)用論證未來方向?;趫D的挖掘算法是語義網(wǎng)絡(luò)與社會網(wǎng)絡(luò)的密切結(jié)合,因此可做到大數(shù)據(jù)的共享和轉(zhuǎn)移,能作為高校圖書館學(xué)科知識挖掘的主要工具。把可視化與知識地圖同時應(yīng)用在知識展現(xiàn)和知識服務(wù)上。分布式云計算平臺目前已集成了圖挖掘算法庫,據(jù)此可將中低端的計算設(shè)備,組成分布式計算機(jī)集群,并方便地使用這些類庫數(shù)據(jù)開展圖書館大數(shù)據(jù)應(yīng)用,即可節(jié)省大量軟硬件購置資金,降低營運(yùn)成本,又可極大提高計算性能,使“高校資金投入短缺”的難題得到有效破解。
2.2技術(shù)上創(chuàng)新。實(shí)現(xiàn)數(shù)據(jù)管理標(biāo)準(zhǔn)化操作,在技術(shù)上要以空間數(shù)據(jù)為核心,以地址數(shù)據(jù)為關(guān)聯(lián),以空間數(shù)據(jù)和非空間數(shù)據(jù)一體化為突破口,將圖書館業(yè)務(wù)全力向數(shù)據(jù)分析、數(shù)據(jù)挖掘方向轉(zhuǎn)移,強(qiáng)化數(shù)據(jù)中心系統(tǒng)基礎(chǔ)能力的提升。一方面要做好各類數(shù)據(jù)的采集,處理與分析工作,保障圖書館資源數(shù)據(jù)量不斷擴(kuò)展。另一方面要做好與其他高校圖書館,第三方運(yùn)營商的技術(shù)聯(lián)盟,做到技術(shù)上資源共享,數(shù)據(jù)上優(yōu)勢互補(bǔ),在資源、認(rèn)證、檢索、服務(wù)和技術(shù)標(biāo)準(zhǔn)統(tǒng)一的框架下,從大量數(shù)據(jù)中找出更多更大的潛在價值,進(jìn)而打破“信息孤島”壁壘,推動高校圖書館服務(wù)能力和水平全面提升。
2.3模式上創(chuàng)新。大數(shù)據(jù)的本質(zhì)特征是多樣性。因此在模式上應(yīng)把不同類型數(shù)據(jù)資源選擇與整合,做為創(chuàng)新的重中之重。從學(xué)科角度出發(fā),圖書館要緊緊圍繞教學(xué)和科研需求,選配具有專業(yè)知識與圖書館管理知識的圖書管員,利用深入數(shù)據(jù)挖掘所獲的專業(yè)領(lǐng)域知識,支持知識應(yīng)用和知識創(chuàng)新,應(yīng)選擇相關(guān)性較高的大數(shù)據(jù)資源,并注意這些數(shù)據(jù)存在大量冗余,做出有效清洗,以便形成具有一定相關(guān)性,豐富多樣的高質(zhì)量數(shù)據(jù)模型,充分體現(xiàn)出本單位學(xué)科特色。從個性化角度出發(fā),高校圖書館可通過可視化并經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)快速查詢和檢索,用以構(gòu)建用戶分析模型,分析用戶興趣、偏好、習(xí)慣、以及變化的需求,利用可視化算法和大數(shù)據(jù)分析,預(yù)測用戶變化趨勢,找出個性化閱讀的準(zhǔn)確定位,將高校圖書館打造成大規(guī)模、大數(shù)據(jù)、高水準(zhǔn)、高效率的信息網(wǎng)絡(luò)化服務(wù)中心。
2.4方法上創(chuàng)新。經(jīng)過大數(shù)據(jù)捕獲、組織、分析和篩選,方可明確圖書館服務(wù)方向及服務(wù)策略。為此在方法上,對這些數(shù)據(jù)的分類與利用需進(jìn)行相應(yīng)環(huán)境、條件的限定,堅持循序漸進(jìn),逐步深化。如運(yùn)用劃時段,分地域,講群體等諸多實(shí)用而又科學(xué)的方法,以確保服務(wù)更有針對性和鮮明性。目前,高校圖書館均配置了一定數(shù)量的中低端硬件設(shè)備,包括服務(wù)器和普通電腦等,可基于已有設(shè)備構(gòu)建計算機(jī)集群,搭建云操作平臺系統(tǒng),完成大量從節(jié)點(diǎn)分布式存儲和平行計算調(diào)度。這種方式運(yùn)行于普遍服務(wù)器和計算平臺上,具有使用方便、穩(wěn)定、性能好的優(yōu)點(diǎn),給大數(shù)據(jù)服務(wù)如何應(yīng)用在方法創(chuàng)新上留下了啟示。
結(jié)語
高校圖書館應(yīng)用大數(shù)據(jù)服務(wù)于科研教學(xué),服務(wù)于廣大師生,這是網(wǎng)絡(luò)信息時代的大勢所趨。具備條件的圖書館已經(jīng)開始應(yīng)用大數(shù)據(jù),暫時沒有條件的正在創(chuàng)造條件準(zhǔn)備使用大數(shù)據(jù)服務(wù)。但構(gòu)建大數(shù)據(jù)平臺不是一蹴而就的簡單事情,而是一項(xiàng)耗資巨大、技術(shù)復(fù)雜的系統(tǒng)工程,不僅需要強(qiáng)大的軟硬件設(shè)備作支撐,更需要一種勇于探索、敢于創(chuàng)新的科學(xué)精神。在實(shí)踐中,只要堅持積極主動地拓展大數(shù)據(jù)使用范圍,不斷拓寬大數(shù)據(jù)優(yōu)質(zhì)服務(wù)領(lǐng)域,就一定能充分展現(xiàn)出高校圖書館在大數(shù)據(jù)時代的價值和作用。
【參考文獻(xiàn)】
[1] 王學(xué)勤.建立驅(qū)動的大數(shù)據(jù)服務(wù)[J].圖書情報工作.2014.80-83.endprint