◎文/趙楠(安徽審計職業(yè)學院)
隨著信息時代的高速發(fā)展以及網絡通信技術的日臻成熟,各類數(shù)據(jù)呈現(xiàn)出爆炸式的增長。與此同時,大數(shù)據(jù)的概念被提出并逐漸成為信息集合的代名詞。一般來說,大數(shù)據(jù)指的是不能在可容忍的時間內用傳統(tǒng)軟硬件工具和技術對其進行存儲、管理和應用的數(shù)據(jù)集,有體量大、生成快、種類多等特征[1]。大數(shù)據(jù)以超出人們想象的速度產生、發(fā)展和積累,引發(fā)了各界對大數(shù)據(jù)的討論和研究。早期的大數(shù)據(jù)用戶主要是國外的互聯(lián)網創(chuàng)業(yè)者,他們依靠分析大數(shù)據(jù)來精心策劃互聯(lián)網公司及旗下產品,比如國外的Facebook、谷歌和亞馬遜等互聯(lián)網公司,海量的數(shù)據(jù)集合匯集起來,通過數(shù)據(jù)的存儲、開源軟件的發(fā)布以及分布式計算,互聯(lián)網企業(yè)從他們收集的數(shù)據(jù)中有效地挖掘了大量的數(shù)據(jù)集并提取有價值的信息。我國的大數(shù)據(jù)發(fā)展雖然起步晚些,但是發(fā)展速度快、規(guī)模大,而且在大數(shù)據(jù)應用的服務業(yè)領域現(xiàn)在已經走在了世界前列,比如深度挖掘潛在客戶并精準投放營銷廣告的移動互聯(lián)網金融、實時匹配用戶需求的共享出行服務,都是國內大數(shù)據(jù)應用發(fā)展的典型案例。
大數(shù)據(jù)時代對數(shù)據(jù)存儲、利用方式的巨大轉變及其流行趨勢與廣泛影響,對致力于成為信息資源共享服務中心的高校圖書館形成了強烈的沖擊。高校圖書館有種類多樣的數(shù)據(jù)庫、電子圖書期刊以及音視頻資源等,讀者查找資源的選擇變多了,但是所花費的時間也同樣增加,各種資源的有效利用率也有一定程度的下降。圖書館的信息資源存在廣泛的價值,但是由于資源的容量巨大而有效資源所占的比例較小導致資源的價值密度相對較低。因此,高校圖書館必須深刻認識和理解大數(shù)據(jù)技術及其應用,對圖書館數(shù)據(jù)進行充分地采集、分析和挖掘,梳理出讀者對信息資源的利用需求。高校圖書館館員需要進行服務轉型升級,將被動地滿足讀者需求變?yōu)橹鲃拥赜献x者需求,了解如何利用大數(shù)據(jù)深度挖掘讀者需求以及引導教科研人員將大數(shù)據(jù)技術應用整合到他們的學術、科研中。在大數(shù)據(jù)背景下智慧性、個性化圖書館將是高校圖書館發(fā)展的潮流趨勢,館員將讀者使用圖書館內資源的信息“變廢為寶”,進行數(shù)據(jù)整合、分析,根據(jù)讀者的個人信息和行為習慣,得出讀者的潛在需求,從而向讀者推送特定的內容以方便其使用相關資源。
高校圖書館建設要利用大數(shù)據(jù)技術的支持,大數(shù)據(jù)技術運用在高校圖書館的具體業(yè)務上也要進行方法創(chuàng)新。為了更好地加強這兩個方面的聯(lián)系,現(xiàn)從高校圖書館資源建設角度,對大數(shù)據(jù)背景下高校圖書館資源現(xiàn)狀進行分析思考,并提出解決相應問題的思路。
資源是圖書館存在的基礎,也是利用大數(shù)據(jù)技術進行高校圖書館建設的必不可少的重要因素。但是,隨著信息量的倍增和種類繁多的資源出現(xiàn),高校圖書館在資源使用發(fā)掘、管理應用以及構建共享平臺上還存在很多制約大數(shù)據(jù)環(huán)境下圖書館發(fā)展的瓶頸。
高校圖書館作為文獻信息中心購買了多種類型的館藏資源,而圖書館館員對已購買的資源利用情況只能通過后臺查看來統(tǒng)計各個用戶的使用量情況,對不同專業(yè)的學生和教師讀者使用不同種類的資源情況還不能做到準確掌握,不能通過使用情況有針對性地提高不同種類資源的利用率。圖書館館員每天面對的海量數(shù)據(jù)以及不同需求的讀者,如何掌握讀者使用信息的規(guī)律,發(fā)掘各類讀者的潛在信息需求,如何給讀者提供個性化服務,如何給教科研人員提供精準化的學科服務和參考咨詢,這些問題顯得越來越棘手。
在資源管理方面,高校圖書館每天由于檢索、發(fā)現(xiàn)、傳遞以及使用資源而產生大量的數(shù)據(jù),而一般情況下,讀者進行資源傳遞、交流后留下的痕跡信息很快被遺棄?!袄欠佩e了地方的資源”,高校圖書館每天產生的信息也是如此。一個數(shù)據(jù)庫的創(chuàng)建、使用不是一味地進行數(shù)據(jù)的疊加才實現(xiàn)的,而是通過數(shù)據(jù)之間的關聯(lián)性,梳理出結構性和非結構性數(shù)據(jù),形成整體的有組織的管理方式。高校圖書館如何將已使用的數(shù)據(jù)進行重新整合、分析,通過對訪問數(shù)據(jù)的深度挖掘與分析實現(xiàn)數(shù)據(jù)的回收利用,提供更加貼切、更加精準的用戶需求服務,對“一切以讀者為中心”的圖書館來說是體現(xiàn)其價值的重要依據(jù)[2]。
高校圖書館內普遍存在的問題是資源和系統(tǒng)種類繁多且關聯(lián)耦合性不強,信息孤島問題造成的管理和服務上的不便越來越明顯。高校教師讀者從事科研和課題研究時,學生讀者在進行畢業(yè)論文撰寫時,往往需要查找很多相關資料,需要使用不同的資源。但是,各種資源種類繁多,查找資源費時費力,沒有一個集中的元數(shù)據(jù)集合,沒有一種集中平臺來實現(xiàn)各類資源的統(tǒng)一檢索、跨庫檢索,無法提供一站式的資源檢索服務平臺。當讀者需要查找資料時,由于資源、數(shù)據(jù)庫種類繁多,需要分別到幾個甚至更多的數(shù)據(jù)庫中去登陸、檢索,這樣大大增加了讀者獲取資源的時間。不便捷的讀者體驗也間接降低了各類資源的有效利用率,對以服務讀者為中心的高校圖書館來說都是不利因素。
對用戶而言,要“按需融合”,將用戶的特定需求融合到資源使用中,充分掌握讀者使用資源的規(guī)律,發(fā)掘各類讀者潛在的使用需求,進而給讀者提供個性化、精準化的服務。比如對不同專業(yè)的學生來說,考取相應的職業(yè)資格證書對其以后就業(yè)、晉升都有很大幫助,因此以專業(yè)來區(qū)分不同需求的讀者對其進行相應的資源推送,并且通過其檢索、瀏覽相應資源的信息來挖掘讀者對相關資源的掌握情況以便進行持續(xù)、跟蹤性地推送。對于圖書館的資源來說,通過建立資源的元數(shù)據(jù),對資源進行組織、加工和創(chuàng)新,解決資源之間的散亂和冗余問題,進而發(fā)現(xiàn)資源之間的潛在關聯(lián)性,從而創(chuàng)造新的價值。
從高校圖書館資源管理的整體角度來說,就是構建一個物理分散、邏輯集中、共享共用的統(tǒng)一集群化管理架構和大數(shù)據(jù)平臺,為高校圖書館的決策支持、信息服務等提供數(shù)據(jù)應用支撐,促進各類資源的共享、協(xié)調管理。具體實施上,可以對高校圖書館所涉及的所有系統(tǒng)進行全面的管理,解決統(tǒng)一認證問題,用單點登錄代替多點登錄的繁瑣,優(yōu)化用戶使用流程;對全館所涉及到的各類資源建立統(tǒng)一的資源管理框架,形成數(shù)據(jù)索引庫;對圖書館數(shù)字化資產進行全面管理,避免資源孤立、信息孤島等問題出現(xiàn),并且結合各種形式的客戶端技術將全館所有讀者數(shù)據(jù)進行匯總分析,通過大數(shù)據(jù)技術加以分析利用,深度挖掘有價值的數(shù)據(jù)信息,為高校圖書館建設和服務決策提供強大的數(shù)據(jù)支撐。
大數(shù)據(jù)技術的應用就是要讓讀者便捷高效地獲取所需服務和資源而不受時間空間限制,甚至在讀者沒有意識到的情況下已經獲得了服務,高校圖書館可以通過搭建“平臺-支撐-應用”三級智慧化體系結構來實現(xiàn)。對圖書館整體而言,搭建一個基礎平臺來管理和控制各種數(shù)據(jù)資源是根本,進行全館大數(shù)據(jù)的數(shù)據(jù)收集、標準化,對各類多源、異構數(shù)據(jù)進行有效融合,形成全面、豐富、融合的智慧化體系結構的資源基礎;然后組合各個不同分工的子平臺,提供相應的大數(shù)據(jù)分析決策、資源整合、數(shù)據(jù)倉儲等系統(tǒng)作為支撐,負責高校圖書館的用戶信息管理與需求預測、資源管理分析等任務;在支撐平臺的數(shù)據(jù)基礎上,針對具體的讀者需求展開各種具體的信息服務,建立相應的個性化服務、智能搜索等應用系統(tǒng)。因此,高校圖書館智慧化體系結構應該是一種全方位、立體化的,具有主動性、人性化、個性化、泛在化等特點[3]。
大數(shù)據(jù)技術在我國高校圖書館領域的發(fā)展尚處于起步階段,并且由于學校的規(guī)模和科研水平等原因導致其在各高校的發(fā)展程度良莠不齊,但是它為高校圖書館的資源建設帶來了歷史性機遇是毋庸置疑的。未來高校圖書館建設面臨著諸多未知和挑戰(zhàn),必須不斷創(chuàng)新高校圖書館的服務和技術,以大數(shù)據(jù)應用來促進新發(fā)展新亮點,這也是大數(shù)據(jù)時代高校圖書館建設的研究熱點和方向。