張大勇
(湖南城市學(xué)院圖書館,湖南 益陽 413000)
在云計算、物聯(lián)網(wǎng)等技術(shù)的推動下,世界已經(jīng)進入了一個“大數(shù)據(jù)”時代。如何有效地利用大數(shù)據(jù)成為政府公共管理和企業(yè)界共同關(guān)注的問題,但這些數(shù)據(jù)集的規(guī)模往往超出數(shù)據(jù)處理者的能力。圖書館主要工作為實踐,研究和教育。以最大限度地利用人類的知識,促進專業(yè)的交流為責(zé)任。圖書館職業(yè)無法離開專業(yè)知識和信息,影響人類社會的可持續(xù)發(fā)展。數(shù)據(jù)是圖書館藏書的重要組成部分。數(shù)據(jù)作為原始類的產(chǎn)品,可以加工、整理、分析,最后提煉成人與人之間的生產(chǎn)和生活中發(fā)揮更大作用的信息和知識。因此,大數(shù)據(jù)主題是圖書館行業(yè)內(nèi)應(yīng)當(dāng)研究的問題,展示了圖書館界在信息社會求生存,謀發(fā)展能力的提升。本文旨在討論大數(shù)據(jù)時代下,圖書館與大數(shù)據(jù)相關(guān)的研究內(nèi)容、發(fā)展存在的問題以及總體發(fā)展趨勢。
圖書館已有的研究中有文獻計量學(xué)等和大數(shù)據(jù)有關(guān)。研究人員為了促進信息科學(xué)與社會科學(xué)的進步,通過大型網(wǎng)絡(luò)規(guī)模的收集獲得數(shù)據(jù)和分析數(shù)據(jù)得出相關(guān)結(jié)論來實現(xiàn)目標(biāo)。由于大數(shù)據(jù)技術(shù)的應(yīng)用,傳統(tǒng)的文獻計量學(xué)的研究從過去只有簡單的描述性研究擴展到評估和預(yù)測的研究。圖書館學(xué)研究人員參與了很多相關(guān)的項目,例如,新西蘭的奧塔哥大學(xué)的圖書館承擔(dān)了研究數(shù)據(jù)管理項目的任務(wù),在麻省理工大學(xué)設(shè)立項目研究圖書館數(shù)據(jù)存儲、需求分析數(shù)據(jù)的管理,和傳播數(shù)據(jù),并完成數(shù)據(jù)收集保存標(biāo)準(zhǔn)的制定工作。烏里韋和麥克唐納在認為數(shù)據(jù)監(jiān)測工作將從傳統(tǒng)的信息技術(shù)受益。Huwe 建議采取政治手段,以促進圖書館和數(shù)據(jù)中心的發(fā)展,他認為高等教育機構(gòu)應(yīng)該認可圖書館對學(xué)術(shù)研究的支持。通過分析2008 非常流行的“數(shù)字化監(jiān)控中心的生命周期模型”,希金斯提出,圖書館的“數(shù)據(jù)保留計劃”的生命周期可以被納入其數(shù)字機構(gòu)庫文件管理實體。此外,美國學(xué)者對館員在大數(shù)據(jù)環(huán)境中的作用和專業(yè)知識進行了調(diào)查,他們一致認為圖書館可以在大數(shù)據(jù)時代承擔(dān)數(shù)據(jù)管理職責(zé)。謝菲爾德大學(xué)還安排了基礎(chǔ)的信息學(xué)專業(yè)課程。2011年6月倫敦國際監(jiān)護教育論壇投入使用的,也給數(shù)字監(jiān)控領(lǐng)域的發(fā)展提供了一個機會。
國內(nèi)目前的相關(guān)研究課題還處于剛起步的狀態(tài),CNKI 與該主題相關(guān)的文章也只有寥寥幾篇。相比之下,國內(nèi)對“數(shù)據(jù)監(jiān)護權(quán)”的關(guān)注度更高這,主要是針對大學(xué)圖書館在這個專業(yè)領(lǐng)域展開更多的研究。這方面的論文在2012年之后有一個井噴式的增長,但總體來說,國內(nèi)相關(guān)文獻還相對較少,研究項目也幾乎沒有。
在數(shù)字化時代,數(shù)據(jù)處理更容易、更快。圖書館的數(shù)據(jù)資源種類多、數(shù)量大、形式多樣。截至2008年底,CALS 的文檔數(shù)據(jù)量達到180T,2010年底的國家圖書館數(shù)字資源總量達到480 T。目前,國家博物館進行維護之后,數(shù)字圖書館的非結(jié)構(gòu)化數(shù)據(jù)的存儲容量將非常大??倲?shù)字資源工程也達到108TB。由此看來,圖書館的數(shù)字資源總量已聚集為一個大的數(shù)據(jù)集。再次,圖書館自動化服務(wù)水平已發(fā)展到了一個新的階段。此外,用戶服務(wù)信息每日激增,用戶對服務(wù)的要求越來越高,圖書館要根據(jù)用戶的服務(wù)信息,做出相應(yīng)的調(diào)整。因此,根據(jù)各自限定的環(huán)境和條件,從大量的數(shù)據(jù)分析中挖掘出用戶當(dāng)前和未來的需求都非常迫切。
目前,隨著科學(xué)技術(shù)的不斷發(fā)展,傳統(tǒng)的紙質(zhì)圖書館向電子、數(shù)字圖書館的轉(zhuǎn)變,因此圖書館服務(wù)的性質(zhì)已經(jīng)發(fā)生了很大的變化。傳統(tǒng)圖書館是點對點的服務(wù),而目前數(shù)字圖書館已經(jīng)成為綜合性服務(wù),服務(wù)的風(fēng)格和方法等方面都發(fā)生了很大的變化。在服務(wù)理念上,數(shù)字圖書館是基于數(shù)據(jù)服務(wù)的基礎(chǔ)上,在大數(shù)據(jù)的基礎(chǔ)上,從數(shù)據(jù)采集,智能服務(wù),提供綜合服務(wù),創(chuàng)新了服務(wù)模式。在大數(shù)據(jù)時代,數(shù)據(jù)資源是豐富的,每個圖書館可以利用網(wǎng)絡(luò)來收集大量的數(shù)據(jù)資源,基于資源共享提供各種數(shù)據(jù)管理的資源之間的無縫連接。
在大數(shù)據(jù)時代背景下,競爭已經(jīng)不再是一個簡單的數(shù)據(jù)資源所有權(quán)的競爭,而是在數(shù)據(jù)的結(jié)構(gòu)以及類型上、數(shù)據(jù)的開發(fā)以及利用上的競爭。從圖書館的角度來看,它是在大數(shù)據(jù)背景下,為了避免自己被邊緣化,就必須分析數(shù)據(jù),來進行相關(guān)的數(shù)據(jù)分析服務(wù)。分析數(shù)據(jù)庫業(yè)務(wù)有以下幾個方面:首先,圖書館需要建立自己的大數(shù)據(jù)分析,數(shù)據(jù)分析通常在現(xiàn)有的數(shù)據(jù),如讀者愛好的書籍等。另外是對讀者的分析,這類似企業(yè)和其他客戶群體參考提供的數(shù)據(jù)分析、競爭情報分析,但也有很大的區(qū)別,不同之處在于數(shù)據(jù)分析對象、用于數(shù)據(jù)分析和數(shù)據(jù)分析的目的等。對于這樣的數(shù)據(jù),可能不會被圖書館所擁有,所以它必然成為在這個行業(yè)發(fā)展的瓶頸限制,我們應(yīng)該想辦法解決這些問題。
[1]劉瓊.大數(shù)據(jù)環(huán)境下圖書館面臨的影響與挑戰(zhàn)[J].理論觀察,2013(8):112-113.
[2]孫琳.大數(shù)據(jù)時代圖書館服務(wù)體系創(chuàng)新研究[J].理論觀察,2013(4):99-100.
[3]李立.大數(shù)據(jù)在數(shù)字圖書館中的應(yīng)用分析[J].高校實驗室工作研究,2014(3):35-37.
[4]李白楊,張心源.數(shù)字圖書館建設(shè)中大數(shù)據(jù)問題初探[J].情報科學(xué),2013,11:26-29.