胡芳 張慧
摘 要:大數(shù)據(jù)的概念自從誕生以來就因其獨具特色的前瞻性和實用性引起了各行各業(yè)的廣泛關(guān)注。屬于公共服務(wù)領(lǐng)域的圖書館,也不可避免的受到了大數(shù)據(jù)帶來的沖擊。圖書館因其始終以用戶為中心的特性,其發(fā)展自始自終都要圍繞著提高圖書館用戶滿意度。而面對大數(shù)據(jù)時代,圖書館也需要調(diào)整提高用戶滿意度的思路,合理規(guī)劃運用本身具有的大數(shù)據(jù)資源,提升核心的競爭力。本文在探討了大數(shù)據(jù)、一般用戶滿意度和圖書館用戶滿意度的基礎(chǔ)之上,分析了傳統(tǒng)方法的不足,提出了運用大數(shù)據(jù)提升圖書館用戶滿意度的方案,以期為更好地服務(wù)圖書館用戶做出相應(yīng)貢獻。
關(guān)鍵字:大數(shù)據(jù);圖書館;用戶滿意度
1 引言
隨著計算機的極速發(fā)展、存儲器性能的提升,還有物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、傳感器等新科技的發(fā)展,數(shù)據(jù)增長的數(shù)度已經(jīng)逐漸超出人們可以接受的范圍,而且這一速度還在不斷增長。這些大量的半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)是人類活動的最真實記錄。最早提出“大數(shù)據(jù)”概念的是全球著名咨詢公司麥肯錫,其發(fā)布的《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿領(lǐng)域》,首次提出了“大數(shù)據(jù)”,并指出“數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對于大數(shù)據(jù)的運用將預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。”[1]毫無疑問,通過合理的技術(shù)去挖掘、識別、分析大數(shù)據(jù),可以找到很多通過常規(guī)數(shù)據(jù)技術(shù)難以發(fā)現(xiàn)的財富。大數(shù)據(jù)分析已經(jīng)在很多商業(yè)領(lǐng)域得到應(yīng)用,本文站在圖書館用戶的視角上分析如何利用大數(shù)據(jù)分析提升圖書館用戶滿意度。
圖書館用戶滿意度是指用戶對圖書館提供服務(wù)的滿意程度,是用戶在接受圖書館一次或者多次服務(wù)后的內(nèi)心評價和主觀感受,是其預(yù)期效果和實際所接受服務(wù)效果的比較[2]。當(dāng)前對提升圖書館用戶滿意度的方法大多是通過發(fā)放問卷調(diào)查,建立相關(guān)模型,運用統(tǒng)計學(xué)和計量學(xué)的知識進行分析,最后通過定性和定量的方法來采取相應(yīng)的措施提高滿意度。但由于收集數(shù)據(jù)方法的局限性和理論模型本身就存在的缺陷,分析得出的結(jié)論和采取的措施未必都有效。圖書館歷來都是信息收集和管理的重要場所,長時間運營以來積累了大量的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)。通過對這些數(shù)據(jù)的管理和運用,圖書館可以建立其智能分析、輔助決策系統(tǒng),準(zhǔn)確、及時獲取用戶的數(shù)據(jù),為圖書館更好的了解用戶、分析用戶提高用戶滿意度提供支持,提高圖書館的核心競爭力。
圖書館日益增長的數(shù)據(jù),這本身就是一種資源,若不對其進行開采,那就是一種浪費。隨著大數(shù)據(jù)處理技術(shù)的逐漸成熟,圖書館也具備了運用大數(shù)據(jù)來提高用戶滿意度的可行性。因此本文研究的目標(biāo),就是利用大數(shù)據(jù)帶來的機遇,借助數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、商務(wù)智能、專家系統(tǒng)、人工智能等現(xiàn)代信息技術(shù)手段,提出一個能夠改善圖書館用戶服務(wù)、提升圖書用戶滿意度的解決方案。
2 文獻綜述
2.1 大數(shù)據(jù)
“大數(shù)據(jù)”(big data)是IT領(lǐng)域在“云計算”、“Web 2.0”、“移動互聯(lián)網(wǎng)”等之后,近兩年最流行的詞匯。根據(jù)著名咨詢公司IDC統(tǒng)計[3],2013年全球被創(chuàng)建和復(fù)制到數(shù)據(jù)總量為1.8ZB(10的21次方),F(xiàn)acebook每天有約1000萬張的照片更新和30億次的點擊率;Twitter每天有超過4億條Tweet發(fā)送;Google通過大規(guī)模集群和MapReduce,每月要處理超過400PB的數(shù)據(jù);淘寶會員超過3.7億,在線商品超過8.8億,每天交易數(shù)千萬筆,產(chǎn)生月20TB的數(shù)據(jù)。同時,隨著傳感器和物聯(lián)網(wǎng)的蓬勃發(fā)展,數(shù)據(jù)正在億前所未有的數(shù)度不斷的累積和增長。近幾年,《Nature》和《Science》等國際頂級學(xué)術(shù)期刊相繼出版??瘉韺iT探討對大數(shù)據(jù)的研究。2008年《Nature》推出了??癇ig Data”,從互聯(lián)網(wǎng)技術(shù)、網(wǎng)絡(luò)經(jīng)濟學(xué)、超級計算、環(huán)境科學(xué)、生物醫(yī)學(xué)等多個方面介紹了海量數(shù)據(jù)帶來的挑戰(zhàn)?!禨cience》與2011年推出了專刊“Dealing with Data”,主要圍繞著科學(xué)研究中大數(shù)據(jù)的問題展開討論,說明大數(shù)據(jù)對于科學(xué)研究的重要性。更加值得關(guān)注的是,2012年3月,奧巴馬政府發(fā)布了“大數(shù)據(jù)研究和發(fā)展倡議”[4],計劃在科學(xué)研究、環(huán)境、生物醫(yī)學(xué)等領(lǐng)域利用大數(shù)據(jù)技術(shù)進行突破。奧巴馬政府的這一計劃被認(rèn)為美國政府繼“信息高速公路(Information Highway)”計劃之后在信息科學(xué)領(lǐng)域的又一重大舉措。與此同時,包括IBM、Oracle、HP、Microsoft等IT行業(yè)巨頭都紛紛加入到大數(shù)據(jù)行列中,通過收購與大數(shù)據(jù)相關(guān)的軟硬件技術(shù)公司,來實現(xiàn)大數(shù)據(jù)軟硬件一體化技術(shù)整合,力求在新的信息競爭環(huán)境中處于更加主動的地位,獲取更有利的競爭優(yōu)勢。
面對各行各業(yè)海量的數(shù)據(jù),首先要面對的問題就是如何對這些結(jié)構(gòu)化、半結(jié)構(gòu)化甚至被結(jié)構(gòu)化的數(shù)據(jù)進行有效的組織和管理。長時間以來,人們研究的對象都是結(jié)構(gòu)化數(shù)據(jù),如目前占據(jù)絕對主流的關(guān)系數(shù)據(jù)庫,因而人們總希望在數(shù)據(jù)生成是就按照特有的結(jié)構(gòu)和模式對數(shù)據(jù)進行整理。而對于非結(jié)構(gòu)化甚至半結(jié)構(gòu)化的處理,則是在慢慢發(fā)展。海量的電子政務(wù)數(shù)據(jù)、移動終端數(shù)據(jù)、網(wǎng)站日志、社交網(wǎng)絡(luò)數(shù)據(jù)、來自物聯(lián)網(wǎng)傳感器的數(shù)據(jù)、企業(yè)和公共部門長期積累的數(shù)據(jù)等都是大數(shù)據(jù)的主要來源,將這些數(shù)據(jù)互惠共享、融會分析將會產(chǎn)生巨大的經(jīng)濟和社會效益。而目前大數(shù)據(jù)最顯著最直接的應(yīng)用就是市場營銷和信息公共服務(wù),如對企業(yè)或公共服務(wù)部門積累的數(shù)據(jù)進行利用、挖掘則可以從更多的角度了解用戶,從而針對存在的問題制定出相應(yīng)的解決方案,提升用戶對企業(yè)或服務(wù)部門的滿意度。
2.2 圖書館用戶滿意度
圖書館因用戶存在,服務(wù)是圖書館永恒的工作主題。雖然隨著信息技術(shù)的發(fā)展,信息環(huán)境和信息用戶的需求都在迅速改變,使得圖書館在職能定位、服務(wù)范圍、服務(wù)手段和服務(wù)內(nèi)容等方面都發(fā)生了很大的變化,但圖書館的使命從來沒有發(fā)生過改變,無論是最基本的文獻提供服務(wù)還是迅速發(fā)展的參考咨詢等新服務(wù),都是為了更好的滿足圖書館用戶的需求,是用戶能夠最大限度的利用圖書館資源,發(fā)揮圖書館應(yīng)有的價值。因此,探索提高服務(wù)質(zhì)量、提升服務(wù)效果的措施便是圖書館工作的重點。根據(jù)之前對一般用戶滿意度的定義“用戶對用戶接受產(chǎn)品或服務(wù)的實際感受值與其期望值的比較程度”,圖書館用戶滿意度也可認(rèn)為是:圖書館用戶在接受圖書館服務(wù)和使用圖書館設(shè)施的過程總的感受值與其期望值的比較程度,定量測量圖書館用戶滿意度的水平。
從文獻中,我們可以發(fā)現(xiàn)大多數(shù)對圖書館用戶滿意度的研究,其收集數(shù)據(jù)的方式仍然是以發(fā)放調(diào)查問卷為主,輔助以其他的調(diào)查方法,如電子郵件調(diào)查、受理投訴、電話訪問等方法。雖然問卷調(diào)查的科學(xué)性毋庸置疑,但其局限性也很明顯:被訪問者會受到很多外界的影響,而這些影響是幾乎不可能避免的。并且由于受到成本和時間的限制,其發(fā)放問卷的數(shù)量和抽樣選擇被訪者會受到制約。同時,采用問卷調(diào)查收集數(shù)據(jù)的方法已經(jīng)存在學(xué)術(shù)界多年,筆者認(rèn)為應(yīng)該嘗試新的方法。另外,用戶滿意度,即用戶要求被滿足的程度,這種高低大小不取決于企業(yè),而是取決于用戶的心理。用戶滿意度是一種主觀感知、自我體驗和情感判斷,這種“似是而非”的模糊情況,廣泛存在。同時,可能由于用戶的個人因素,如社會因素、消費因素、外部環(huán)境因素等,導(dǎo)致用戶對圖書館服務(wù)的感覺隨時都會發(fā)生變化。最后,用戶滿意度僅僅是用戶過去心理狀態(tài)的反應(yīng),而非當(dāng)前,這意味著,用戶滿意度存在著滯后的特點。這意味著最后得出的結(jié)論可能不能正確的為決策提供幫助。
綜上所述,在當(dāng)前的大數(shù)據(jù)時代,圖書館應(yīng)該利用好這個機遇,充分利用圖書館本身就是一個信息收集和利用的場所的天然優(yōu)勢,通過先進的數(shù)據(jù)分析技術(shù)從圖書館的大數(shù)據(jù)中提取有益的知識。大數(shù)據(jù)技術(shù)可以幫助圖書館獲得準(zhǔn)確、及時的用戶數(shù)據(jù),有助于管理者及時了解圖書館最新知識服務(wù)的趨勢并作出決策、調(diào)整服務(wù)方向,提高用戶的滿意度,提高圖書館的核心競爭力。同時,借鑒大數(shù)據(jù)在其他行業(yè)如互聯(lián)網(wǎng)行業(yè)、金融行業(yè)等已經(jīng)成功或者正在進行中的案例,結(jié)合合理的大數(shù)據(jù)處理技術(shù),開辟出一條針對圖書館用戶滿意度提升研究的新道路。
3 理論方案
從整體上看,當(dāng)前對于圖書館用戶滿意度的應(yīng)用研究主要還是將用戶滿意度作為中間變量,分析其與其他變量之間的關(guān)系,從而得出相應(yīng)的結(jié)論來支持決策。而隨著大數(shù)據(jù)概念的日益深入人心以及相關(guān)技術(shù)的迅猛發(fā)展,使得對圖書館用戶滿意度的提升有了新的方法。建立圖書館用戶滿意度的因素分析模型和對用戶滿意度進行大數(shù)據(jù)挖掘分析相比,前者是利用統(tǒng)計計量工具對用戶滿意度進行因素分析,是相對靜態(tài)的分析,分析模式是固定的;而后者則是通過分析來發(fā)現(xiàn)與用戶滿意度相關(guān)的、圖書館關(guān)心的模式,多進行的分析也是動態(tài)的、不規(guī)則的。因此也可以將利用大數(shù)據(jù)提升圖書館用戶滿意度看成是圖書館用戶滿意度模型分析的更深一層次的研究。
利用大數(shù)據(jù)提升圖書館用戶滿意度,其數(shù)據(jù)收集方式自然和以前靠發(fā)放問卷來收集數(shù)據(jù)不同,其來源主要有[5]:用戶借閱流通數(shù)據(jù)、館藏數(shù)目數(shù)據(jù)和電子數(shù)據(jù)、RFID(無線射頻識別)數(shù)據(jù)、社交網(wǎng)絡(luò)交互數(shù)據(jù)、移動互聯(lián)數(shù)據(jù)以及各種傳感器數(shù)據(jù)等。當(dāng)然,傳統(tǒng)提升圖書館用戶滿意度的數(shù)據(jù),如受理投訴、問卷調(diào)查等同樣可以加以利用。
隨著Hadoop開源框架及其相關(guān)技術(shù)的興起和完善,使得從技術(shù)的角度上來看,圖書館利用大數(shù)據(jù)進行用戶滿意度的提升研究成為了可能。一般來說,利用大數(shù)據(jù)提升圖書館用戶滿意度主要從以下幾個方面入手[5]:
(1)進行用戶流失分析,應(yīng)對圖書館用戶減少的尷尬局面。圖書館借助大數(shù)據(jù)數(shù)據(jù)對用戶需求的數(shù)據(jù)進行分析,不僅可以了解用戶的信息行為、需求意愿以及知識運用能力,還可以深度挖掘用戶在交互型知識服務(wù)中潛在的需求,從而針對性的展開服務(wù)吸引用戶。
(2)建立智能、靈活的社會網(wǎng)絡(luò)知識服務(wù)。圖書館通過分析各種數(shù)據(jù),從中發(fā)現(xiàn)有用的知識和關(guān)系,完善新的知識服務(wù)方式。
(3)建立知識服務(wù)導(dǎo)航機制??紤]用戶知識需求預(yù)測、多維數(shù)據(jù)資源的組織和分析、用戶行為智能分析、學(xué)術(shù)資源搜索以及推薦服務(wù)等。
3.1 方案和框架
隨著信息技術(shù)的發(fā)展,圖書館累積的數(shù)據(jù)越來越多。這些數(shù)據(jù)背后隱藏著虛度重要的信息,圖書館自然希望利用這些進行更高層次的分析。關(guān)系數(shù)據(jù)庫系統(tǒng)可以高效的數(shù)顯數(shù)據(jù)的錄入、修改、統(tǒng)計、查詢等,但在以非結(jié)構(gòu)化為主的大數(shù)據(jù)面前,無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,導(dǎo)致了“數(shù)據(jù)豐富而知識匱乏”的現(xiàn)象。而我們提出的利用大數(shù)據(jù)提升圖書館用戶滿意度的方案,則可以很好的解決這一問題。
3.1.1 擬定方案
隨著數(shù)據(jù)量的飛速增長,大數(shù)據(jù)管理全生命周期過程包括大數(shù)據(jù)的獲取、存儲、組織、分析和決策五個階段[6]。傳統(tǒng)的數(shù)據(jù)分析計算策略是將數(shù)據(jù)移動到數(shù)據(jù)分析工具中進行計算,但這對于大數(shù)據(jù)而言,顯然成本太高,于是便需要一種新的大數(shù)據(jù)解決方案。隨著Hadoop開源框架及其相關(guān)技術(shù)的興起和完善,為解決傳統(tǒng)大數(shù)據(jù)處理方式所面臨的難題打開了局面。Hadoop的兩項關(guān)鍵服務(wù)[6]:采用Hadoop文不是文件系統(tǒng)的可靠大數(shù)據(jù)存儲服務(wù)以及基于MapReduce變成模型的高性能并行大數(shù)據(jù)處理服務(wù)能夠提供對結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)快速、可靠的分析,并且可以整合傳統(tǒng)的數(shù)據(jù),從而是圖書館可以根據(jù)已有的信息和問題制定知識服務(wù)組合方式。在新的技術(shù)工具的支持下,運用數(shù)據(jù)挖掘的方法,對圖書館的大數(shù)據(jù)進行處理。數(shù)據(jù)挖掘使用的是基于發(fā)現(xiàn)的方法,運用模式匹配和其他算法決定數(shù)據(jù)之間的聯(lián)系,從數(shù)據(jù)中發(fā)現(xiàn)模式,致力于知識的自動發(fā)現(xiàn)。其一般有四種方法[7]:
(1)概念描述。是數(shù)據(jù)挖掘最基本的形式,是產(chǎn)生數(shù)據(jù)的特征化和比較描述。
(2)關(guān)聯(lián)分析[8]。從大量數(shù)據(jù)中個項集之間的引入重視的相互關(guān)聯(lián)和相互聯(lián)系。通過關(guān)聯(lián)分析來分析圖書館用戶滿意度,可以發(fā)現(xiàn)用戶滿意度和未知主題之間的關(guān)系,這種關(guān)系很多時候都具有很高的價值,可用于輔助決策。
(3)分類預(yù)測。分類預(yù)測技術(shù)通常包括神經(jīng)網(wǎng)絡(luò)、貝葉斯分類、判定樹歸納等。運用在用戶滿意度上可以對用戶進行分類,如高用戶滿意度的用戶、低滿意度的用戶等;也可以在一定條件下進行用戶滿意度的預(yù)測,由于數(shù)據(jù)的及時處理,其對于決策能夠提供很大的支持。
(4)聚類分析。聚類和分類不同,聚類要劃分的類型是未知的,也就是說更容易發(fā)現(xiàn)新的知識,在同一個類中的個體具有很高的相似度。對于圖書館用戶滿意度的分析,聚類分析可以在對用戶針對用戶滿意度進行分類的模式未知的情況下,對用戶進行聚類分析。
3.1.2 實施框架
從大數(shù)據(jù)管理生命周期角度來看,大數(shù)據(jù)綜合運用分為五個階段:獲取階段、存儲階段、組織階段、分析階段和決策階段[6]。據(jù)此,在運用大數(shù)據(jù)提升圖書館用戶滿意度時,我們制定的框架如下:
4 總結(jié)
大數(shù)據(jù)繼“云計算”、“物聯(lián)網(wǎng)”、“Web 2.0”、“移動互聯(lián)網(wǎng)”等之后,成為科技界、金融界甚至政府部門的熱門話題。雖然其定義尚不清晰,但由于其獨具的前瞻性和實用性已經(jīng)被運用在一些領(lǐng)域,尤其是IT界和市場營銷界。大數(shù)據(jù)帶來的全新的知識體系和服務(wù)模式,對圖書館不可避免的造成了沖擊。對以用戶為中心的圖書館來說,若仍然保持過去的服務(wù)和工作方式,無論對用戶而言還是對圖書館自身的發(fā)展而言,都沒有好處。抓住大數(shù)據(jù)帶來的機遇,從大量復(fù)雜的數(shù)據(jù)中分析、挖掘潛在的價值,從全新的角度研究用戶滿意度提升的新方法,從而有針對性的開展知識服務(wù),制定圖書館發(fā)展戰(zhàn)略將會是未來圖書館發(fā)展的方向。
參考文獻
[1]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):146-169
[2]武海東.基于結(jié)構(gòu)方程模型的圖書館讀者滿意度實證研究[D].重慶:重慶大學(xué),2009:7-9
[3]栗蔚,魏凱.大數(shù)據(jù)的技術(shù)、應(yīng)用和價值變革[J].電信網(wǎng)技術(shù),2013,7(7):6-10
[4]徐子沛. 大數(shù)據(jù)—正在到來的數(shù)據(jù)革命[M].桂林:廣西師范大學(xué)出版社,2012:128-132
[5]容春琳.公共圖書館應(yīng)用大數(shù)據(jù)的策略研究[J].圖書館建設(shè),2013,7:91-95
[6]郭自寬,張興旺,麥范金.大數(shù)據(jù)生態(tài)系統(tǒng)在圖書館中的應(yīng)用[J].情報資料工作,2013,2:23-28
[7]趙嘉凌.數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用研究[J].計算機網(wǎng)絡(luò),2005,10:44-45
[8]林海青,樓向英,夏翠娟.圖書館關(guān)聯(lián)數(shù)據(jù):機會與挑戰(zhàn)[J].中國圖書館學(xué)報,2012,38(1):58-67