關(guān)鍵詞:小數(shù)據(jù);圖書館;精準服務;述評
摘 要:小數(shù)據(jù)分析有利于提高圖書館個性化服務的精準度,但受觀念、知識、行動、經(jīng)驗等方面的制約,圖書館應用小數(shù)據(jù)還存在諸多問題。文章對有關(guān)小數(shù)據(jù)的研究成果進行了統(tǒng)計分析,介紹了國內(nèi)外的研究現(xiàn)狀,探究了小數(shù)據(jù)研究和應用的困境,提出了圖書館基于小數(shù)據(jù)開展精準服務的策略。
中圖分類號:G251.6文獻標識碼:A文章編號:1003-1588(2019)12-0103-04
1 數(shù)據(jù)統(tǒng)計與分析
1.1 中國知網(wǎng)相關(guān)研究數(shù)據(jù)
筆者在中國知網(wǎng)以圖書館和小數(shù)據(jù)為檢索詞,設置發(fā)文時間段為2015—2018年,共檢索到相關(guān)研究論文29篇,具體內(nèi)容如表1所示。
首先,從研究數(shù)量和發(fā)表刊物級別加以分析。本次檢索到的全部研究成果數(shù)據(jù)僅有29條,其中發(fā)表在核心期刊的有16篇,且論文作者比較集中。由此可見,關(guān)于該課題的研究數(shù)量極為有限,學界對該課題的關(guān)注度還不夠。但是,約55%的論文發(fā)表在核心期刊,在一定程度上肯定了該課題研究的學術(shù)價值和現(xiàn)實意義。其次,從研究主題加以分析。基于小數(shù)據(jù)的圖書館精準服務研究的重點問題包括:如何提升服務質(zhì)量;如何科學采集、管理小數(shù)據(jù);如何利用小數(shù)據(jù)準確發(fā)現(xiàn)和預測讀者的興趣和需求,實現(xiàn)精準服務;如何利用小數(shù)據(jù)進行學科服務、科研服務、創(chuàng)客教育等服務創(chuàng)新等。再次,從研究視角和宗旨加以分析。該課題的研究以圖書館個性化精準服務為目標,旨在提升服務質(zhì)量和水平;以讀者興趣發(fā)現(xiàn)與預測為目標,通過采集、管理和分析小數(shù)據(jù)了解讀者使用圖書館資源的態(tài)勢、把握讀者的閱讀興趣;以大數(shù)據(jù)與小數(shù)據(jù)的融合為基本方略,利用小數(shù)據(jù)分析個案,大數(shù)據(jù)把控全局,通過大、小數(shù)據(jù)的融合,整合資源,為讀者提供個性化精準服務,為圖書館建設提供科學的決策依據(jù)。
1.2 愛思唯爾、施普林格等數(shù)據(jù)庫相關(guān)研究數(shù)據(jù)
筆者在愛思唯爾數(shù)據(jù)庫中進行檢索,檢索步驟為在“Year(s)”中輸入“2014—2018”,在“Title,abstract or keywords”中輸入“small data”,共檢索到43,514條數(shù)據(jù),這些研究數(shù)據(jù)的類型分布情況如表2所示。
筆者還在施普林格數(shù)據(jù)庫中進行了檢索,檢索步驟為在“with the exact phrase”中輸入“small data”,在起止時間欄中輸入“2014”至“2018”,共檢索到5,802條數(shù)據(jù),這些研究數(shù)據(jù)的學科分布情況如表3所示。
從表2、表3可以看出:其一,近年來,關(guān)于小數(shù)據(jù)的研究保持穩(wěn)定增長態(tài)勢。其二,研究成果形式主要是學術(shù)論文(科研論文、文獻綜述等)、會議論文(會議紀要、會議報告等)、圖書章節(jié)、短篇報道等。其三,小數(shù)據(jù)研究主要分布于計算機科學、工程學、數(shù)學、生命科學、醫(yī)療與公共健康、物理學、地球科學等領(lǐng)域。這些數(shù)據(jù)凸顯了小數(shù)據(jù)研究的巨大潛力和廣闊前景,同時也反映出圖書館學領(lǐng)域內(nèi)的小數(shù)據(jù)研究還比較薄弱,尚需大力挖掘。
2 研究進展
2.1 國外研究動態(tài)
較早關(guān)注小數(shù)據(jù)重要性的是美國康奈爾大學計算機科學教授Estrin Deborah,他從醫(yī)學角度提出小數(shù)據(jù)源于個體的活動軌跡,通過提取和分析個體的活動軌跡能為患者創(chuàng)建個人健康畫像,從而為及時發(fā)現(xiàn)和預測健康問題提供重要的決策參考。隨后,關(guān)于小數(shù)據(jù)的研究在諸多學科領(lǐng)域迅速蔓延開來,其理論內(nèi)涵及應用實踐也得到不斷豐富和拓展。在圖書館服務實踐中,小數(shù)據(jù)和大數(shù)據(jù)各有所長。大數(shù)據(jù)的核心價值在于宏觀分析和總體控制,即對關(guān)系到圖書館發(fā)展規(guī)劃、圖書館服務模式選擇、讀者閱讀需求研判、用戶管理等問題進行宏觀分析和決策參考;而小數(shù)據(jù)的核心價值在于微觀分析和個別管理,即在讀者許可的范圍內(nèi)利用監(jiān)測技術(shù)、傳感器網(wǎng)絡技術(shù)等實時追蹤、采集、存儲、分析讀者個體的物理位置信息、社交活動、閱讀行為、網(wǎng)絡瀏覽痕跡等“數(shù)據(jù)面包屑”,為圖書館做出正確判斷和準確預測提供有價值的參考。因此,圖書館在決策過程中加強小數(shù)據(jù)與大數(shù)據(jù)應用的結(jié)合和共享,把小數(shù)據(jù)作為大數(shù)據(jù)的重要補充,能有效提高大數(shù)據(jù)決策的效率和精確度。
2.2 國內(nèi)研究動態(tài)
國內(nèi)研究者通常把小數(shù)據(jù)看作是針對個體用戶的全方位、多層次行為模式和情景感知的全部數(shù)據(jù)集合[1],進而把圖書館小數(shù)據(jù)看作是以讀者為中心的高價值、多類型、數(shù)量有限和即時更新的數(shù)據(jù)集[2],陳臣則進一步根據(jù)小數(shù)據(jù)的價值總量、密度、可靠性和可用性將其劃分為讀者個體特征數(shù)據(jù)、讀者行為監(jiān)控數(shù)據(jù)、第三方共享數(shù)據(jù)和外圍社會化數(shù)據(jù)四個層次[3]。概言之,學界對圖書館小數(shù)據(jù)的研究主要聚焦在小數(shù)據(jù)的采集、管理和應用三個方面。
2.2.1 小數(shù)據(jù)的采集。李志芳等認為,圖書館小數(shù)據(jù)的采集內(nèi)容包括用戶在使用圖書館過程中產(chǎn)生的一切與思維和行為相關(guān)的數(shù)據(jù),即包括與實際行為相關(guān)的物理行為數(shù)據(jù)、與思維相關(guān)的認知行為數(shù)據(jù)及用戶行為間的關(guān)聯(lián)數(shù)據(jù)等[4]。也有學者認為,采集內(nèi)容不僅包括用戶的基本特征數(shù)據(jù)和圖書館活動數(shù)據(jù),還包括社交活動數(shù)據(jù)和第三方開放數(shù)據(jù)等[5]。圖書館可通過用戶表達和行為感知兩種方式采集用戶數(shù)據(jù)[6],如:圖書館可借助個人移動終端、可穿戴設備、圖書館信息設備、社會信息服務設備等進行采集,也可通過相關(guān)軟件獲取用戶地理位置信息的小數(shù)據(jù),生成用戶旅游地理位置的熱圖等[7]。
2.2.2 小數(shù)據(jù)的管理。從小數(shù)據(jù)分析、決策流程看,圖書館需要對采集的小數(shù)據(jù)進行存儲、預處理及發(fā)現(xiàn)與預測讀者需求等。對小數(shù)據(jù)的存儲,較可靠又可行的做法是采用SQL與NoSQL融合的方式,即傳統(tǒng)數(shù)據(jù)庫技術(shù)與大數(shù)據(jù)技術(shù)相結(jié)合的形式[8],該方式可發(fā)揮二者的優(yōu)勢,對小數(shù)據(jù)進行有效存儲。小數(shù)據(jù)預處理方法通常有以下三種:一是小數(shù)據(jù)標準化——采用統(tǒng)一的數(shù)據(jù)管理模式、數(shù)據(jù)結(jié)構(gòu)及設備接口,提升小數(shù)據(jù)的規(guī)范性。二是過濾噪聲信號——提升信噪比,剔除干擾數(shù)據(jù),保證小數(shù)據(jù)的精確性。三是小數(shù)據(jù)清洗——補充殘缺數(shù)據(jù),糾正錯誤數(shù)據(jù),刪除重復數(shù)據(jù)及無效數(shù)據(jù),保障小數(shù)據(jù)的有效性[9]。圖書館還要對預處理后的小數(shù)據(jù)進行分析,發(fā)現(xiàn)和預測讀者需求,進而提高個性化服務的精準性。為此,有些學者專門設計了“讀者興趣發(fā)現(xiàn)模型”,如:劉慶麟設計了以標準標簽理論為工具對讀者閱讀興趣進行實時更新的模型[10],陳臣設計了讀者閱讀興趣的發(fā)現(xiàn)與個性化服務定制系統(tǒng)等[11]。
2.2.3 小數(shù)據(jù)的應用。圖書館采集、存儲、處理小數(shù)據(jù)是為了準確發(fā)現(xiàn)和預測讀者的真實需求,其最終目標是將館藏紙本、電子資源及數(shù)據(jù)、信息、知識資源與讀者需求相匹配,為讀者提供個性化精準服務。圖書館實現(xiàn)該目標的總框架是基于大數(shù)據(jù)配置資源,基于小數(shù)據(jù)提供服務[12],即利用大數(shù)據(jù)檢索、獲取、整合有用資源,利用小數(shù)據(jù)發(fā)現(xiàn)、預測讀者需求,并以此為基礎(chǔ)優(yōu)化配置館藏所有資源,為讀者提供精準服務。為了實現(xiàn)該目標,一些學者提出了以下措施:構(gòu)建完善的知識資源自動控制識別系統(tǒng);構(gòu)建讀者自我發(fā)現(xiàn)和自我管理平臺[13];構(gòu)建以讀者為中心的開放、平等和個性化的服務體系;構(gòu)建基于小數(shù)據(jù)的CRM系統(tǒng),與讀者建立忠誠的客戶關(guān)系體系[14];構(gòu)建一站式檢索服務平臺[15];利用小數(shù)據(jù)優(yōu)化電子文獻選購、讀者群體分析、信息咨詢等服務工作[16]等。
3 研究困境及突破
3.1 研究困境
小數(shù)據(jù)研究在圖書館界的應用難有突破,關(guān)鍵在于觀念、知識、行動、經(jīng)驗等方面存在著諸多障礙和局限:一是觀念障礙。圖書館引入新技術(shù)會產(chǎn)生兩種相反的效應:新技術(shù)的利用會給那些因循守舊、固步自封及學習能力弱的館員帶來壓力,致使其身心俱疲,加劇職業(yè)倦怠;而新技術(shù)的利用也會給那些善于學習、勇于開拓進取、敢于突破自我的館員帶來機遇,激發(fā)其工作熱情,增強其職業(yè)情感。圖書館應用小數(shù)據(jù)也面臨這一問題,如果視小數(shù)據(jù)為壓力,就容易滋生懷疑、恐懼、焦慮等消極心理和負面情緒,進而影響制度設計和實踐行動。二是知識局限。計算機技術(shù)、物聯(lián)網(wǎng)技術(shù)的發(fā)展及移動終端、可穿戴設備等的普及,推動了人類活動與信息空間、物理空間的深度融合和無縫銜接,進而使以讀者為中心的小數(shù)據(jù)的產(chǎn)生成為可能,小數(shù)據(jù)研究也在很大程度上依賴于圖書館利用先進技術(shù)實現(xiàn)數(shù)據(jù)的挖掘、采集、管理和應用,但廣大圖書館服務的踐行者——圖書館員和從事圖書館學研究的科研人員似乎還不具備對小數(shù)據(jù)開展研究的相關(guān)技術(shù)和知識。三是行動障礙。小數(shù)據(jù)專注于用戶的個性化,而圖書館服務則面向全體讀者,更關(guān)注共性、普遍性,雖然小數(shù)據(jù)具有一定的代表性,但圖書館要將它放大并應用于服務全體讀者則缺乏嚴謹性。如:圖書館在圖書采選的過程中不僅要考慮個別讀者的需求,還要考慮館藏情況、專業(yè)設置與發(fā)展情況、其他讀者的需求情況等。因此,如何利用小數(shù)據(jù)將個性化服務與普遍性服務相協(xié)同,如何將讀者個體小數(shù)據(jù)與圖書館大數(shù)據(jù)相銜接,這些問題是圖書館在實踐中面臨的切實困難,亟待加以解決。四是經(jīng)驗局限??v觀國內(nèi)外相關(guān)研究和實踐的現(xiàn)狀,雖然小數(shù)據(jù)研究在其他一些領(lǐng)域碩果累累,但在圖書館服務方面還沒有形成成熟的理論和可普遍推廣的模式,許多研究要么停留在“研究”階段,要么仍處于一種“建模”狀態(tài),尚未付諸實踐,因此,理論的不成熟和實踐的滯后阻礙了小數(shù)據(jù)在圖書館界的應用。
3.2 突破上述困境的策略
3.2.1 平臺開發(fā)與建設。以智慧服務為核心的智慧圖書館正在成為未來圖書館發(fā)展的新趨勢,智慧圖書館建設離不開集信息檢索、資源導航、參考咨詢、開放存取、應用下載等服務于一體的智能平臺,基于小數(shù)據(jù)的個性化精準服務也需要這種智能平臺,圖書館只有利用這種平臺,才能有效實現(xiàn)數(shù)據(jù)采集、管理和應用等諸多功能。因此,如何將小數(shù)據(jù)管理平臺嵌入或融入智慧圖書館的智能平臺,是一個值得圖書館深入探究的問題。
3.2.2 小數(shù)據(jù)的采集、管理和應用。小數(shù)據(jù)能否有效提高圖書館的服務質(zhì)量取決于三個因素:采集、管理和應用。首先,雖然學界對如何采集小數(shù)據(jù)提出了許多設想,但由于小數(shù)據(jù)包含了諸多個體的所有活動信息,這些設想是否能保證采集數(shù)據(jù)的全面性、真實性、可靠性則有待商榷。其次,活的個體使關(guān)于該個體的小數(shù)據(jù)處于實時更新中,對這些實時更新、靈活多變的信息進行標準化、降噪及清洗,使其在動態(tài)變化中保持一種相對穩(wěn)定的可用狀態(tài),這個過程充滿了許多不確定性。再次,小數(shù)據(jù)應用的最終目的是發(fā)現(xiàn)和預測讀者需求,并為讀者提供精準服務,但圖書館在利用小數(shù)據(jù)的過程中也存在一些疑慮,如:如何保護讀者隱私不受侵犯,確保圖書館提供的推介、推送等服務與讀者真實需求相吻合,做到個性化服務的“適度”,避免引起讀者反感,獲取讀者的實際需求,及時調(diào)整和優(yōu)化服務內(nèi)容等。
3.2.3 小數(shù)據(jù)與大數(shù)據(jù)的融合。小數(shù)據(jù)聚焦于對每個讀者的個別、具體的認知,關(guān)注的是特殊性、個體性;而大數(shù)據(jù)聚焦于對所有讀者的整體、共同的認知。此外,大數(shù)據(jù)還囊括了一切關(guān)乎圖書館建設和發(fā)展的數(shù)據(jù)信息,如館藏資源情況、館員情況、館舍情況、圖書館管理制度實施情況、圖書館與館外組織的協(xié)同情況等,因此,大數(shù)據(jù)關(guān)注的是普遍性、全局性。小數(shù)據(jù)與大數(shù)據(jù)的融合是圖書館提高服務精準度和決策有效性的重要途徑,一方面,圖書館可運用小數(shù)據(jù)發(fā)現(xiàn)和預測讀者的真實需求;另一方面,圖書館可運用大數(shù)據(jù)挖掘和整合與讀者需求相匹配的資源信息,通過小數(shù)據(jù)與大數(shù)據(jù)之間的融合與聯(lián)動,推動供需平衡,實現(xiàn)精準服務。但是,究竟如何實現(xiàn)小數(shù)據(jù)與大數(shù)據(jù)的融合與聯(lián)動還需要圖書館開展進一步探索和研究。
3.2.4 圖書館基于小數(shù)據(jù)的個性化精準服務模式與方法。雖然已有部分學者探討和設計了一些模式和路徑,但畢竟還只是理論,理論推向?qū)嵺`還需要滿足特定的主客觀條件。因此,圖書館應從自身實際出發(fā),以科學理論為指導,加強理論與實踐的結(jié)合,推動模式建構(gòu)和服務創(chuàng)新,并在實踐中不斷摸索、調(diào)整及推廣。
3.2.5 轉(zhuǎn)變館員觀念、提升館員技能的措施與手段。基于小數(shù)據(jù)的圖書館精準服務歸根結(jié)底還是人(館員)對人(讀者)的服務,小數(shù)據(jù)不過是工具和中介物。在數(shù)據(jù)挖掘、人工智能、虛擬現(xiàn)實等新技術(shù)不斷發(fā)展的大環(huán)境下,圖書館應轉(zhuǎn)變服務理念,提升服務技能,滿足讀者的多元化需求。一方面,圖書館要構(gòu)建完善的制度,指引和敦促館員轉(zhuǎn)變觀念,提升他們的服務技能;另一方面,館員要理性判斷形勢,主動提高自身的綜合素質(zhì)和服務能力。
參考文獻:
[1] 李立睿,鄧仲華.“互聯(lián)網(wǎng)+”背景下科研用戶的小數(shù)據(jù)融合研究[J].圖書情報工作,2016(3):58-63.
[2][14] 馬曉亭,陳臣.基于可信小數(shù)據(jù)的圖書館個性化服務研究[J].圖書情報工作,2015(4):70-75.
[3] 陳臣.基于小數(shù)據(jù)決策支持的圖書館個性化服務[J].圖書與情報,2015(1):82-86.
[4] 李志芳.“互聯(lián)網(wǎng)+”驅(qū)動下圖書館用戶的小數(shù)據(jù)行為研究[J].圖書館理論與實踐,2017(9):108-112.
[5][9] 王欣,張冬梅.大數(shù)據(jù)環(huán)境下基于高校讀者小數(shù)據(jù)的圖書館個性化智能服務研究[J].情報理論與實踐,2018(2):132-137.
[6] 陳廉芳.大數(shù)據(jù)環(huán)境下圖書館用戶小數(shù)據(jù)的采集、分析與應用[J].國家圖書館學刊,2016(3):69-74.
[7][8] 楊曉剛,姜毅,張璡,等.基于大數(shù)據(jù)技術(shù)的用戶小數(shù)據(jù)管理[J].情報理論與實踐,2018(3):29-33.
[10][13] 劉慶麟.基于小數(shù)據(jù)的圖書館精準服務研究[J].圖書館工作與研究,2017(5):45-50.
[11] 陳臣.圖書館小數(shù)據(jù)讀者個性化興趣預測與發(fā)現(xiàn)模型的構(gòu)建[J].圖書館論壇,2017(5):98-105.
[12] 牛勇.圖書館精準服務研究[J].圖書館學研究,2016(5):50-52.
[15] 于麗娟.大數(shù)據(jù)背景下高校圖書館小數(shù)據(jù)服務平臺的搭建[J].四川圖書館學報,2017(4):22-25.
[16] 王昊.基于小數(shù)據(jù)的圖書館個性化服務研究[J].圖書館學刊,2016(6):102-104.
(編校:孫新梅)
收稿日期:2019-11-06
作者簡介:陶海柱(1979— ),中原工學院圖書館館員。