數(shù)字圖書館的“大數(shù)據(jù)”
2012年3月奧巴馬政府宣布投資2億美元啟動“大數(shù)據(jù)研究與發(fā)展計劃”,并將之定義為“未來的新石油”,標志著大數(shù)據(jù)時代的到來。
大數(shù)據(jù)實際上是指針對海量數(shù)據(jù)的處理方法。當數(shù)據(jù)量和規(guī)模巨大到無法利用目前主流軟件工具處理時,如何在合理時間內(nèi)擷取、管理、處理并整理分析成為有用的資訊,是大數(shù)據(jù)要解決的問題。大數(shù)據(jù)對人類的數(shù)據(jù)駕馭能力提出了新的挑戰(zhàn),也為人們獲得更為深刻、全面的洞察力提供了前所未有的空間與潛力。
數(shù)字圖書館作為人類知識的儲存空間、社會文化的傳承渠道,積累著大量數(shù)據(jù),如各類型書目數(shù)據(jù)、文摘數(shù)據(jù)、全文數(shù)據(jù)、事實型數(shù)據(jù),等等。這些數(shù)據(jù)中蘊含著大量的知識及其關(guān)聯(lián),對各種知識主題、實體對象和載體形式,以及科研要素、科學文獻、科技項目、事件活動、專家學者、產(chǎn)品技術(shù)、組織機構(gòu)和呈現(xiàn)之間的關(guān)系進行揭示和挖掘,形成知識網(wǎng)絡平臺,進行相關(guān)計量分析和監(jiān)測評估,以形成新的科學知識和實事對策,可以豐富數(shù)字圖書館的服務內(nèi)涵。
隨著互聯(lián)網(wǎng)與人們生活的不斷融合,人們的每一行為都會成為數(shù)據(jù),不知不覺中人們的信息行為和消費習慣都會被記錄。數(shù)字圖書館擁有豐富的用戶數(shù)據(jù)資源,如用戶注冊信息、用戶利用信息(如瀏覽、檢索、下載等)、用戶交互信息等各類日志等,通過分析這些用戶數(shù)據(jù),能夠?qū)τ脩舻拈営[習慣、資源利用行為、網(wǎng)絡使用痕跡進行細粒度的分析,進而拓展數(shù)字圖書館的服務形式。
大數(shù)據(jù)的發(fā)展,提供了一種看待世界的全新方法,更多地基于事實與數(shù)據(jù)作出判斷,使社會也經(jīng)歷思維變革、商業(yè)變革和管理變革;大數(shù)據(jù)也必將促進數(shù)字圖書館數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)使用及數(shù)據(jù)服務的深層次變革,既提出針對數(shù)據(jù)本身的處理和服務要求,也提出針對圖書館員的職責和意識要求。這更多地需要圖書館員適應大數(shù)據(jù)時代,改進自身的數(shù)據(jù)處理觀念并提高數(shù)據(jù)挖掘能力。
曾建勛