林曉 方敏強(qiáng) 楊軍
摘要:“大數(shù)據(jù)”給人們帶來(lái)的改變呈現(xiàn)在生活的方方面面,在圖書館、美術(shù)館、科技館、文化館等公共文化服務(wù)機(jī)構(gòu)和場(chǎng)所,大數(shù)據(jù)也在逐步發(fā)揮其重要的作用。對(duì)圖書館的讀者大數(shù)據(jù)研究主要針對(duì)讀者流通數(shù)據(jù)、圖書借閱數(shù)據(jù)、媒體(自媒體)數(shù)據(jù)、人群軌跡及畫像數(shù)據(jù)等。這些研究對(duì)于統(tǒng)籌圖書資源、優(yōu)化活動(dòng)安排,提高服務(wù)效率均有積極的作用。
關(guān)鍵詞:圖書館;讀者大數(shù)據(jù);研究
隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,以及互聯(lián)網(wǎng)+時(shí)代的到來(lái),互聯(lián)網(wǎng)正迅速融入于社會(huì)的各行各業(yè)。2012年,《紐約時(shí)報(bào)》發(fā)文稱“大數(shù)據(jù)”時(shí)代已經(jīng)來(lái)臨,大數(shù)據(jù)將會(huì)給人們的工作、生活、思維帶來(lái)重大改變。維基百科將“大數(shù)據(jù)”的定義為“難以用現(xiàn)有的數(shù)據(jù)庫(kù)管理工具處理的兼具海量特征和復(fù)雜性特征的數(shù)據(jù)集成?!痹趫D書館、美術(shù)館、科技館、文化館等公共文化服務(wù)機(jī)構(gòu)和場(chǎng)所,大數(shù)據(jù)正在逐步發(fā)揮其重要的作用。
一、圖書館讀者大數(shù)據(jù)來(lái)源
圖書館的讀者大數(shù)據(jù)主要來(lái)源于館內(nèi)相關(guān)信息化服務(wù)平臺(tái)和外部數(shù)據(jù)供應(yīng)商,根據(jù)其不同特點(diǎn),可將數(shù)據(jù)來(lái)源具體分為管理數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)兩個(gè)部分。
(一)管理數(shù)據(jù)
管理數(shù)據(jù)指的是維護(hù)圖書館運(yùn)營(yíng)的相關(guān)管理系統(tǒng)所產(chǎn)生的數(shù)據(jù)。管理數(shù)據(jù)包括內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)兩個(gè)部分。內(nèi)部數(shù)據(jù)指的是辦公自動(dòng)化系統(tǒng)、財(cái)務(wù)系統(tǒng)等產(chǎn)生的數(shù)據(jù),這些數(shù)據(jù)多用于內(nèi)部管理,不與外部數(shù)據(jù)進(jìn)行交流,因此不可作為大數(shù)據(jù)加以使用。外部數(shù)據(jù)指的是與圖書館讀者相關(guān)的管理數(shù)據(jù),如圖書借閱數(shù)據(jù)、人流分析數(shù)據(jù)等。該部分?jǐn)?shù)據(jù)記錄的是讀者的閱讀內(nèi)容、閱讀周期、讀者停留時(shí)間、人流峰值峰谷等,對(duì)于分析閱讀人群、閱讀習(xí)慣等有著重要的意義。因此,管理數(shù)據(jù)中的外部數(shù)據(jù)應(yīng)成為圖書館讀者大數(shù)據(jù)中的一個(gè)主要數(shù)據(jù)加以分析。由于該部分?jǐn)?shù)據(jù)的來(lái)源較為直接,且數(shù)據(jù)量不大,因此對(duì)該部分?jǐn)?shù)據(jù)的提取較為簡(jiǎn)單,采用數(shù)據(jù)庫(kù)直接采集的方式即可。同樣,在后期的數(shù)據(jù)清洗中,也只需采用傳統(tǒng)的數(shù)據(jù)清洗方法。
(二)網(wǎng)絡(luò)數(shù)據(jù)
網(wǎng)絡(luò)數(shù)據(jù)指的是基于電腦、手機(jī)、閱讀器等網(wǎng)絡(luò)服務(wù)平臺(tái)所產(chǎn)生的與圖書館讀者相關(guān)的數(shù)據(jù)。該部分?jǐn)?shù)據(jù)的主要來(lái)源包括官方網(wǎng)站、官方微博、微信公眾號(hào)、館際互聯(lián)平臺(tái)、移動(dòng)圖書館、數(shù)字圖書館、電子閱覽室平臺(tái)等。和管理數(shù)據(jù)相比,網(wǎng)絡(luò)數(shù)據(jù)不僅數(shù)據(jù)量更加龐大,其數(shù)據(jù)信息也更加復(fù)雜,其中既有自建數(shù)據(jù)庫(kù)的數(shù)據(jù),也有大量外部數(shù)據(jù)庫(kù)的數(shù)據(jù),因此對(duì)該部分?jǐn)?shù)據(jù)的提取和清洗也顯得更加復(fù)雜。在數(shù)據(jù)提取方面,需要綜合運(yùn)用網(wǎng)絡(luò)爬蟲技術(shù)、網(wǎng)頁(yè)抓取策略和分析算法,來(lái)抓取來(lái)自不同平臺(tái)的數(shù)據(jù),并進(jìn)行整合。在后期的數(shù)據(jù)清洗中,還需要考慮采用基于Hadoop的分布式數(shù)據(jù)方法來(lái)對(duì)相關(guān)數(shù)據(jù)進(jìn)行清洗。
二、圖書館讀者大數(shù)據(jù)分析
在圖書館開啟信息化、網(wǎng)絡(luò)化新局面后,對(duì)關(guān)于讀者的相關(guān)大數(shù)據(jù)分析就成為圖書館管理和運(yùn)營(yíng)中的一個(gè)重要組成部分。以下本文將以閩江學(xué)院圖書館為例,對(duì)圖書館相關(guān)的讀者大數(shù)據(jù)進(jìn)行分析。
(一)讀者流通數(shù)據(jù)
對(duì)于圖書館的管理和運(yùn)營(yíng)來(lái)說(shuō),必須做到對(duì)讀者的流通數(shù)據(jù)做到“心中有數(shù)”,這關(guān)系到服務(wù)模式的改革甚至圖書館的整體發(fā)展。圖書館的讀者流通受讀者單位來(lái)源等因素影響較大,因此在本文的數(shù)據(jù)提取中,將流通數(shù)據(jù)根據(jù)不同讀者單位進(jìn)行分類。
經(jīng)統(tǒng)計(jì),閩江學(xué)院全年圖書館讀者流通數(shù)據(jù)為17466人次,讀者單位合計(jì)156個(gè),日均人流量為47.85人。上圖分別表示在2019年1月1日至2019年12月31日間,排名前15讀者單位的流通數(shù)據(jù)。圖1記錄的為讀者流通量排名前15且日均人流量大于1的讀者單位來(lái)源信息和全年讀者流通數(shù)據(jù),如圖所示,讀者流通數(shù)據(jù)排名前三的分別是海峽學(xué)院、福州墨爾本理工職業(yè)學(xué)院、海洋學(xué)院,全年讀者流通數(shù)據(jù)分別為:1684人、1543人、1543人,日均讀者流通數(shù)據(jù)為:4.61人、4.23人、4.23人。統(tǒng)計(jì)排名前15讀者單位的讀者流通數(shù)據(jù),合計(jì)為14834人,占總流通數(shù)據(jù)的84.93%,以上讀者單位全部為閩江學(xué)院下屬學(xué)院,這一數(shù)據(jù)也直接反映出學(xué)生是閩江學(xué)院圖書館的主要讀者群體之一。
(二)圖書借閱數(shù)據(jù)
圖書借閱數(shù)據(jù)是圖書館主要重點(diǎn)關(guān)注的數(shù)據(jù),該數(shù)據(jù)直接關(guān)系到后續(xù)圖書的采購(gòu)和相關(guān)資源的分配。以閩江學(xué)院圖書館2019年1月1日至2019年12月31日間的圖書借閱數(shù)據(jù)為例。
如圖2所示,在2019年,閩江學(xué)院圖書館借閱數(shù)排名前三分別是文學(xué)類圖書、工業(yè)技術(shù)類圖書和語(yǔ)言文字類圖書,借閱數(shù)分別為16102、5488、5004。借閱數(shù)排名最后三位分別是航空航天類圖書、交通運(yùn)輸類圖書和農(nóng)業(yè)科學(xué)類圖書,借閱數(shù)分別為2、15、25。圖書館書籍資源配置可借助借閱信息進(jìn)行完善。
(三)網(wǎng)絡(luò)輿情數(shù)據(jù)
“網(wǎng)絡(luò)輿情是指在互聯(lián)網(wǎng)上流行的對(duì)社會(huì)問(wèn)題不同看法的網(wǎng)絡(luò)輿論,是社會(huì)輿論的一種表現(xiàn)形式,是通過(guò)互聯(lián)網(wǎng)傳播的公眾對(duì)現(xiàn)實(shí)生活中某些熱點(diǎn)、焦點(diǎn)問(wèn)題所持的有較強(qiáng)影響力、傾向性的言論和觀點(diǎn)?!彪S著互聯(lián)網(wǎng)+時(shí)代的到來(lái),人們?cè)絹?lái)越習(xí)慣于在網(wǎng)絡(luò)上分享自己的工作、學(xué)習(xí)、生活,并在網(wǎng)絡(luò)上尋求相關(guān)的意見與建議。因此,必要的網(wǎng)絡(luò)輿情監(jiān)控對(duì)許多行業(yè)而言都是不可或缺的,對(duì)圖書館的管理和運(yùn)營(yíng)也是如此。通過(guò)福建省千億信息科技有限公司對(duì)閩江學(xué)院圖書館2019年1月1日至2019年12月31日間的輿情監(jiān)測(cè)可以看出,自習(xí)室占座現(xiàn)象、閱讀者食零食問(wèn)題等是讀者最為關(guān)心的話題。同樣,通過(guò)互聯(lián)網(wǎng)平臺(tái)反映的相關(guān)問(wèn)題,也得到了有效的解決,從而體現(xiàn)出網(wǎng)絡(luò)輿情監(jiān)控的有效性和必要性。
三、圖書館讀者大數(shù)據(jù)應(yīng)用
分析了解圖書館的大數(shù)據(jù)來(lái)源以及大數(shù)據(jù)信息,不僅在于這些數(shù)據(jù)能夠幫助工作人員了解圖書館的運(yùn)營(yíng)級(jí)管理情況,這些數(shù)據(jù)對(duì)于統(tǒng)籌圖書資源、優(yōu)化活動(dòng)安排,提高服務(wù)效率均有積極的作用。
(一)加強(qiáng)圖書采購(gòu)的針對(duì)性
圖書采購(gòu)工作是圖書館工作的基礎(chǔ),也是圖書館工作的重點(diǎn),直接關(guān)系到圖書館其它工作的開展。圖書館作為文化閱讀中心,對(duì)于提高群眾閱讀水平、營(yíng)造良好閱讀氛圍有著重要的作用?!斑x擇圖書,乃為閱讀者而選擇,故處處從閱讀者之程度、地位及需要著想?!彪m然在傳統(tǒng)的圖書采購(gòu)中,工作人員就會(huì)結(jié)合采購(gòu)經(jīng)費(fèi)、館藏書目的情況和讀者借閱的情況來(lái)勾選相應(yīng)圖書,但對(duì)于讀者借閱情況的考量往往只能從借閱數(shù)量這一個(gè)標(biāo)準(zhǔn)出發(fā)。而在大數(shù)據(jù)時(shí)代,圖書館所掌握的數(shù)據(jù)不僅有借閱量,還有較為準(zhǔn)確的借閱群體、借閱比例等相關(guān)數(shù)據(jù),因此在采購(gòu)選擇上就能夠更有針對(duì)性。此外,圖書館也可以結(jié)合大數(shù)據(jù)得出的不同區(qū)域借閱群體特點(diǎn),合理配置移動(dòng)圖書館的圖書資源,從而讓移動(dòng)圖書館能夠真正為普通民眾良好閱讀習(xí)慣的形成提供助力。
(二)優(yōu)化活動(dòng)安排的合理性
除了提供圖書閱覽和借閱服務(wù),多數(shù)的圖書館還積極參與到舉辦專題講座、主題展覽、讀書競(jìng)賽等活動(dòng)之中,并以此來(lái)塑造善圖書館的社會(huì)形象,傳遞圖書館的服務(wù)理念,協(xié)調(diào)圖書館的公共關(guān)系,從而推動(dòng)傳統(tǒng)圖書館完成向服務(wù)型、創(chuàng)新型圖書館的轉(zhuǎn)換。通過(guò)對(duì)圖書館人流數(shù)據(jù)的分析,能夠較為準(zhǔn)確地總結(jié)出每一類讀者群體出現(xiàn)的峰值時(shí)間。以此為依據(jù),在每一個(gè)峰值時(shí)間安排與該讀者群體相關(guān)的活動(dòng),能夠在很大程度上促進(jìn)活動(dòng)效果的最優(yōu)化。與此同時(shí),人群畫像大數(shù)據(jù)系統(tǒng)所提供的相關(guān)數(shù)據(jù),也能夠較為直觀地反映出讀者的興趣愛好以及對(duì)圖書館活動(dòng)的建議和期望,從而進(jìn)一步推動(dòng)相關(guān)活動(dòng)安排的合理性。
(三)提升網(wǎng)絡(luò)服務(wù)的有效性
大數(shù)據(jù)時(shí)代的圖書館不再是傳統(tǒng)的借書、還書的圖書館,互聯(lián)網(wǎng)推動(dòng)了圖書館的閱讀空間和服務(wù)空間不斷拓展,讀者大數(shù)據(jù)提升了網(wǎng)絡(luò)服務(wù)的有效性。目前圖書館的網(wǎng)絡(luò)服務(wù)主要包括聯(lián)機(jī)檢索查詢、特色資源數(shù)據(jù)庫(kù)建設(shè)、參考服務(wù)等。在當(dāng)前的網(wǎng)絡(luò)環(huán)境下,各種信息資源層出不窮,要精準(zhǔn)挑選到匹配的圖書并不是一件特別簡(jiǎn)單的事情。但如果你的閱讀習(xí)慣被大數(shù)據(jù)反饋給圖書館的系統(tǒng)平臺(tái)后,匹配的準(zhǔn)確度瞬間即會(huì)有所提升,隨之而來(lái)的則是讀者滿意度的攀升。同樣,在遇到惡劣天氣等特殊情況不便出門時(shí),圖書館也可以根據(jù)大數(shù)據(jù)的分析結(jié)果,對(duì)讀者進(jìn)行相關(guān)閱讀材料的推送,充分體現(xiàn)出“閉館不停服”的態(tài)度,不斷提升其網(wǎng)絡(luò)服務(wù)的有效性。
四、結(jié)語(yǔ)
早在2015年,國(guó)務(wù)院就在《關(guān)于加快構(gòu)建現(xiàn)代公共文化服務(wù)體系的意見》中提出了加快推進(jìn)公共文化服務(wù)數(shù)字化建設(shè)與現(xiàn)代傳播能力的要求,并明確提出加強(qiáng)公共文化大數(shù)據(jù)采集、存儲(chǔ)和分析處理的意見。圖書館的數(shù)據(jù)基礎(chǔ)較為薄弱,對(duì)讀者大數(shù)據(jù)的采樣與分析是其在運(yùn)用大數(shù)據(jù)上做出的初步探索,并取得一定的成效。日后,圖書館也將繼續(xù)采集、存儲(chǔ)和分析相關(guān)數(shù)據(jù),并以此為基礎(chǔ),構(gòu)建出未來(lái)發(fā)展的宏偉藍(lán)圖。
參考文獻(xiàn)
[1]轉(zhuǎn)引自嵇婷.公共文化服務(wù)大數(shù)據(jù)的來(lái)源、采集與分析研究[J].圖書館建設(shè),2015,(11):21-24.
[2]網(wǎng)絡(luò)輿情[EB/OL].[2020-06-03].https://baike.so.com/doc/5436975
-5675279.html.
[3]張文娟.讀者決策采購(gòu)(PDA)組織模式多樣性分析[J].河南師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2012,(05):267-269.
作者簡(jiǎn)介
林曉,1973年4月,福州,漢族,副研究館員,碩士研究生,研究方向:圖書資料。方敏強(qiáng),1977年10月,福州,漢族,工程師,大學(xué)本科,研究方向:情報(bào)工程。楊軍,1972年3月,安徽寧國(guó),漢,工程師,碩士,研究方向:政工。