□趙 昕 高 瓏 王祥偉
2011年5月,麥肯斯公司(Mckinsey and Company)發(fā)布了《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個(gè)前沿領(lǐng)域》報(bào)告,首次提出“大數(shù)據(jù)”的概念,并指出“數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和領(lǐng)域,逐漸變成重要的生產(chǎn)因素之一;人們對于海量數(shù)據(jù)的應(yīng)用預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余即將到來”。2012年,美國出臺《大數(shù)據(jù)研究和發(fā)展計(jì)劃》,把大數(shù)據(jù)作為一項(xiàng)國家戰(zhàn)略,關(guān)乎國家核心競爭力。2013年,英國出臺《英國數(shù)據(jù)能力發(fā)展戰(zhàn)略規(guī)劃》,投資1.89億英鎊,推動(dòng)英國在“數(shù)據(jù)革命”中走在世界前列。2016年3月18日,我國“十三五”規(guī)劃提出“實(shí)施國家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開放共享”[1]。由此可見,在全世界范圍內(nèi)大數(shù)據(jù)已經(jīng)從商業(yè)層面上升到國家戰(zhàn)略層面。但是,截至目前對于“大數(shù)據(jù)”的概念并未形成統(tǒng)一的定義,IT廠商、研究機(jī)構(gòu)、維基百科和數(shù)據(jù)科學(xué)家等提出的各種定義存在一個(gè)共識:大數(shù)據(jù)不是對數(shù)據(jù)量的定量描述,而是在種類繁多、數(shù)量巨大的數(shù)據(jù)中對信息的快速獲取。
大數(shù)據(jù)不僅僅是數(shù)量的大小問題,主要有以下幾個(gè)方面特征:第一,數(shù)據(jù)總量巨大。近年來,數(shù)據(jù)總量已躍升至PB級甚至ZB級。第二,數(shù)據(jù)增長速度迅猛。每天互聯(lián)網(wǎng)、手機(jī)APP、傳感器網(wǎng)絡(luò)、地理信息系統(tǒng)、數(shù)字圖書館、社交網(wǎng)絡(luò)都會產(chǎn)生海量數(shù)據(jù),很多領(lǐng)域的數(shù)據(jù)呈指數(shù)級別增長,并且動(dòng)態(tài)性強(qiáng),要求能夠進(jìn)行實(shí)時(shí)分析與響應(yīng),否則就會過時(shí)。第三,數(shù)據(jù)來源和類型多樣。大數(shù)據(jù)中只有10%是儲存在數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù),其余都是在日常生活中由智能設(shè)備、網(wǎng)頁點(diǎn)擊、社交網(wǎng)站等產(chǎn)生的半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。第四,大數(shù)據(jù)的價(jià)值巨大。令人不堪重負(fù)的數(shù)據(jù)洪流中隱藏著巨大的財(cái)富,這些數(shù)據(jù)準(zhǔn)確記錄了過去和現(xiàn)在發(fā)生的事情,只要能在數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,就能夠大大提高面向未來決策的準(zhǔn)確性和可靠性。
(一)服務(wù)理念存在缺失。大數(shù)據(jù)時(shí)代要求高校圖書館不僅要收集、整理、分析數(shù)據(jù),還要時(shí)刻關(guān)注信息服務(wù)的全過程,并通過挖掘數(shù)據(jù)分析未來的服務(wù)走向。但是受傳統(tǒng)信息服務(wù)思維慣性的影響,國內(nèi)大部分高校圖書館的服務(wù)主要局限在提供文獻(xiàn)和信息咨詢,對于主動(dòng)服務(wù)、推送服務(wù)、個(gè)性化服務(wù)等理念的貫徹和執(zhí)行相對欠缺,影響高校圖書館的服務(wù)質(zhì)量。此外,高校圖書館信息服務(wù)的服務(wù)理念還沒有充分融入數(shù)據(jù)理念,尤其缺乏數(shù)據(jù)服務(wù)的意識,沒有將服務(wù)建立在捕捉、挖掘和分析圖書館各類數(shù)據(jù)基礎(chǔ)上,為用戶決策和研究創(chuàng)新提供數(shù)據(jù)支持。
(二)沒有準(zhǔn)確獲取用戶實(shí)時(shí)信息需求。在傳統(tǒng)的數(shù)據(jù)環(huán)境下,高校圖書館通常采用訪談或調(diào)查問卷的方式獲取用戶信息需求,但是這些獲取方式存在一定的缺陷,比如調(diào)查問卷設(shè)計(jì)不合理、訪談時(shí)用戶表達(dá)不清或擔(dān)心隱私泄露等,這些都導(dǎo)致高校圖書館無法準(zhǔn)確獲取用戶實(shí)時(shí)的信息需求。進(jìn)入大數(shù)據(jù)時(shí)代,用戶信息需求在內(nèi)容表達(dá)和獲取渠道上都發(fā)生了很大的變化,傳統(tǒng)的信息獲取模式將更加難以捕捉并理解用戶的潛在需求,也不能及時(shí)地應(yīng)對用戶信息需求的變化。其實(shí)在大數(shù)據(jù)環(huán)境下,人們?nèi)粘5男畔⑿袨槿找骖l繁,會在圖書館各類系統(tǒng)中留下各種信息行為數(shù)據(jù),圖書館應(yīng)當(dāng)及時(shí)對這些零散的數(shù)據(jù)進(jìn)行整合與分析,通過數(shù)據(jù)挖掘了解用戶的行為習(xí)慣,準(zhǔn)確獲取用戶實(shí)時(shí)的信息需求[2]。
(三)缺乏專業(yè)人才隊(duì)伍。面對密集型的數(shù)據(jù)環(huán)境,高校圖書館信息服務(wù)內(nèi)容和模式發(fā)生很大的變化,快速增長的數(shù)據(jù)為圖書館開啟了新的領(lǐng)域,高校圖書館應(yīng)抓住這個(gè)機(jī)遇。但是,目前高校圖書館員普遍存在著缺乏數(shù)據(jù)意識和數(shù)據(jù)能力等問題,且館員專業(yè)背景較為單一,不能為學(xué)科服務(wù)提供強(qiáng)有力的支持,人才的匱乏使得高校圖書館在大數(shù)據(jù)時(shí)代無法為讀者提供更好的服務(wù)、無法滿足讀者的潛在需求。
(一)個(gè)性化信息服務(wù)。隨著大數(shù)據(jù)時(shí)代的來臨,讀者在檢索數(shù)目、借閱書籍、瀏覽網(wǎng)頁、檢索數(shù)據(jù)庫的過程中產(chǎn)生了海量的信息行為數(shù)據(jù),高校圖書館通過對這些非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行深入挖掘和分析,了解讀者的偏好和興趣,獲取讀者的實(shí)時(shí)信息需求,為高校圖書館提供個(gè)性化信息服務(wù)提供了強(qiáng)有力的支持。此外,高校圖書館的主要服務(wù)對象為在校師生,師生都在網(wǎng)站上完成個(gè)人信息登記手續(xù),非常容易識別目標(biāo)人群,解決了個(gè)性化服務(wù)所面臨的首要難題。高校圖書館的個(gè)性化服務(wù)可以分為個(gè)性化推薦、個(gè)性化檢索和個(gè)性化推送3種模式。個(gè)性化推薦服務(wù)在準(zhǔn)確預(yù)測讀者行為的基本上,為讀者提供可能感興趣但又不易發(fā)現(xiàn)的圖書、論文等資料,拓展讀者視野,具有一定的新穎性和驚喜性。個(gè)性化檢索服務(wù)是在讀者進(jìn)行模糊檢索時(shí),能夠根據(jù)讀者的身份信息以及搜索歷史提供讀者最為需要的文獻(xiàn)資料,對精準(zhǔn)性要求很高,同時(shí)還能夠優(yōu)化檢索結(jié)果排序。個(gè)性化推送服務(wù)則是利用技術(shù)手段推送讀者可能感興趣的內(nèi)容,比如通過手機(jī)APP向教師推送其感興趣的學(xué)術(shù)著作,或通過電子郵件向某專業(yè)學(xué)生推送新上線的數(shù)據(jù)庫等。
(二)信息資源建設(shè)。信息資源建設(shè)是圖書館工作的重要組成部分,如何最大限度地保障紙質(zhì)資源和電子資源采購的針對性和讀者滿意度,讓圖書館更好地服務(wù)讀者一直是圖書館面臨的問題。經(jīng)過多年發(fā)展,高校圖書館通過各類信息系統(tǒng)以及社交媒體,積累了大量的用戶行為數(shù)據(jù)。高校圖書館可以利用自建大數(shù)據(jù)平臺或企業(yè)大數(shù)據(jù)平臺,全面采集能夠反映用戶興趣、需求和意愿的各種數(shù)據(jù),對不同類型的數(shù)據(jù)進(jìn)行清洗和預(yù)處理,建立不同類型讀者群體的數(shù)據(jù)分析模型,從而有效評估讀者對資源的使用情況、準(zhǔn)確預(yù)測讀者關(guān)注的熱點(diǎn),為評估圖書館已有文獻(xiàn)的質(zhì)量以及讀者對未購資源的需求提供支持。例如,新加坡國家圖書館管理局(National Library Board,NLB)充分利用現(xiàn)有硬件資源,創(chuàng)新設(shè)計(jì)Hadoop平臺,深入挖掘分析多種類型數(shù)據(jù),盡可能通過數(shù)據(jù)分析了解用戶的需求,以此作為更新信息資源的重要依據(jù),改變以往根據(jù)個(gè)人經(jīng)驗(yàn)建設(shè)信息資源的模式,提高用戶對于館藏資源的滿意度和資源利用率。
(三)發(fā)散現(xiàn)有服務(wù)模式。計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、信息技術(shù)的快速發(fā)展對信息服務(wù)機(jī)構(gòu)的服務(wù)模式提出了挑戰(zhàn)。大數(shù)據(jù)環(huán)境下高校圖書館服務(wù)模式呈現(xiàn)智能化的趨勢,如清華大學(xué)聊天機(jī)器人“小圖”、南京大學(xué)配合RFID技術(shù)尋找圖書的新型智能機(jī)器人等都是發(fā)散圖書館信息服務(wù)模型的實(shí)例。圖書館智能化服務(wù)水平的提高,使得用戶能夠更加便捷地獲取信息、更加便于對知識進(jìn)行智能化管理,促進(jìn)知識流通和傳遞,利于信息挖掘和整理。此外,互聯(lián)網(wǎng)的重心正在向移動(dòng)互聯(lián)網(wǎng)方向發(fā)展,移動(dòng)設(shè)備作為人們生活中不可或缺的一部分,必將成為大數(shù)據(jù)時(shí)代圖書館信息服務(wù)的主導(dǎo)模式。高校圖書館應(yīng)在發(fā)展移動(dòng)圖書館的同時(shí),結(jié)合微博、微信等移動(dòng)互聯(lián)網(wǎng)應(yīng)用,拓展虛擬信息服務(wù)、在線咨詢服務(wù)、在線用戶教育等服務(wù)內(nèi)容,使讀者能夠第一時(shí)間獲得信息和數(shù)據(jù),豐富現(xiàn)有服務(wù)模式。
(四)學(xué)科服務(wù)。《普通高等學(xué)校圖書館規(guī)程(2015版)》規(guī)定,“高等學(xué)校圖書館應(yīng)積極拓展信息服務(wù)領(lǐng)域,提供數(shù)字信息服務(wù),嵌入教學(xué)和科研過程,開展學(xué)科化服務(wù),根據(jù)需求積極探索開展新服務(wù)”。大數(shù)據(jù)環(huán)境下,教學(xué)、科研需要更加專業(yè)化、系統(tǒng)化的數(shù)據(jù)資源支撐,而圖書館正是提供這種支撐的后臺保障。建立學(xué)科館員制度,配備具有專業(yè)知識背景和較強(qiáng)檢索能力的學(xué)科館員,通過新型數(shù)字工具,對數(shù)據(jù)進(jìn)行分類、分析、挖掘,提取有價(jià)值的信息,并以恰當(dāng)?shù)男问綄⒔Y(jié)果展示給用戶。建立學(xué)科信息導(dǎo)航,對已有數(shù)據(jù)庫、互聯(lián)網(wǎng)中的學(xué)科資源進(jìn)行收集、篩選、分類、整合,方便用戶更加快速、準(zhǔn)確地找到目標(biāo)信息,并且能夠輕松地對同類型信息進(jìn)行對比選擇,助力學(xué)校學(xué)科建設(shè)。完善學(xué)科服務(wù)平臺,提供在線溝通、資源共建共享等服務(wù),實(shí)現(xiàn)學(xué)科資源的一站式服務(wù)。
信息服務(wù)是高校圖書館主要工作職責(zé)之一,不斷創(chuàng)新信息服務(wù)模式,既是大數(shù)據(jù)時(shí)代的需要,也是高校圖書館發(fā)展的需要。本文在論述大數(shù)據(jù)內(nèi)涵與特征的基礎(chǔ)上,提出高校圖書館信息服務(wù)面臨著服務(wù)理念缺失、無法獲得用戶實(shí)時(shí)的需求等問題,面對大數(shù)據(jù)時(shí)代的挑戰(zhàn),高校圖書館的信息服務(wù)應(yīng)從個(gè)性化服務(wù)、信息資源建設(shè)、發(fā)散現(xiàn)有服務(wù)模式、提供學(xué)科服務(wù)等方面創(chuàng)新服務(wù)模式,為用戶提供內(nèi)容更豐滿、形式更豐富、結(jié)果更滿意的信息服務(wù),充分發(fā)揮高校圖書館的資源優(yōu)勢,為學(xué)校發(fā)展做出更大的貢獻(xiàn)。