王昊
(遼寧省圖書館,遼寧 沈陽 110015)
?
基于小數(shù)據(jù)的圖書館個(gè)性化服務(wù)研究
王昊
(遼寧省圖書館,遼寧 沈陽 110015)
[摘要]在現(xiàn)階段,大數(shù)據(jù)研究正在對(duì)各行各業(yè)在企業(yè)管理決策、組織和業(yè)務(wù)流程優(yōu)化起著重大作用,提出了將小數(shù)據(jù)應(yīng)用于圖書館管理決策中,構(gòu)建個(gè)性化服務(wù)體系,并對(duì)基于小數(shù)據(jù)的圖書館個(gè)性化服務(wù)策略進(jìn)行了深入地探討。
[關(guān)鍵詞]大數(shù)據(jù)個(gè)性化服務(wù)小數(shù)據(jù)應(yīng)用
在互聯(lián)網(wǎng)技術(shù)高速發(fā)展和智能終端廣泛普及的今天,行為數(shù)據(jù)、生活數(shù)據(jù)、金融數(shù)據(jù)以前所未有的速度迅速積累,基于這個(gè)生態(tài)鏈條孕育而生的大數(shù)據(jù)(Big Data)研究正在對(duì)各行各業(yè)在企業(yè)管理決策、組織和業(yè)務(wù)流程優(yōu)化起著越來越重要的作用。
在我們看到大數(shù)據(jù)應(yīng)用價(jià)值的同時(shí),應(yīng)該注意到大數(shù)據(jù)開發(fā)、保存和分析需要耗費(fèi)大量的資源和巨大的成本,以及面臨大數(shù)據(jù)結(jié)構(gòu)復(fù)雜、存儲(chǔ)成本高、數(shù)據(jù)處理龐大、隱私外泄和信息安全威脅等實(shí)際問題[1]。從而,小數(shù)據(jù)(small data)的研究應(yīng)運(yùn)而生,小數(shù)據(jù)是以個(gè)人為中心的全方位數(shù)據(jù),它是基于個(gè)體的數(shù)字化信息的一類新興數(shù)據(jù),若將小數(shù)據(jù)的研究應(yīng)用于圖書館,并以單個(gè)讀者作為研究對(duì)象,對(duì)讀者借閱等行為數(shù)據(jù)的采集和其他維度數(shù)據(jù)的分析和挖掘,對(duì)圖書館智慧化服務(wù)實(shí)現(xiàn)互聯(lián)、高效、便捷管理將產(chǎn)生重要的推動(dòng)作用。
1.1小數(shù)據(jù)及其特征
美國康佘奈爾大學(xué)Estrin教授于NIPS2013(智能信息處理國際)會(huì)議上,做了一篇題為《Small,n=me,Data》的報(bào)告。她提出使用者在使用移動(dòng)設(shè)備過程中會(huì)產(chǎn)生了大量用戶行為數(shù)據(jù),通過對(duì)這些廣泛并具有個(gè)性化的行為數(shù)據(jù)分析可以從中提取出反映個(gè)體行為的個(gè)體數(shù)據(jù),為總結(jié)個(gè)體行為模式規(guī)律提供了可能。將這些具有某些特定范圍內(nèi)的用戶行為數(shù)據(jù)稱之為大數(shù)據(jù)時(shí)代的“小數(shù)據(jù)”[2]。其具有以下特征:
1.1.1小數(shù)據(jù)以個(gè)體為中心,在特定事務(wù)中具有很強(qiáng)的針對(duì)性。小數(shù)據(jù)是對(duì)個(gè)體的行為信息和動(dòng)機(jī)信息通過不間斷持續(xù)地收集而產(chǎn)生的,這些信息受個(gè)體多層維度的影響,包括社會(huì)關(guān)系、民族信仰、家族背景、教育程度、社會(huì)地位、行為習(xí)慣、性格特點(diǎn)、個(gè)人喜好、財(cái)務(wù)狀況等等。通過對(duì)行為數(shù)據(jù)的捕捉、采集、分析和應(yīng)用,可以實(shí)現(xiàn)以個(gè)人為主體的數(shù)據(jù)系統(tǒng)的建設(shè)和實(shí)施,并為差異化服務(wù)與行為指引提供了決策依據(jù)。
1.1.2低成本,高收益。相比于大數(shù)據(jù)而言,小數(shù)據(jù)無需更廣維度的數(shù)據(jù)總量,但針對(duì)特定事務(wù)場(chǎng)景的數(shù)據(jù)描述并未隨之下降。由此產(chǎn)生的小數(shù)據(jù)應(yīng)用即在信息采集系統(tǒng)和資源的低成本配置下,亦可實(shí)現(xiàn)較深入的數(shù)據(jù)采集層次,在數(shù)據(jù)處理過程中也無需為了滿足復(fù)雜的優(yōu)化算法和數(shù)據(jù)部署邏輯而投入過多的硬件及高額的研發(fā)費(fèi)用,因此越來越多的組織及個(gè)人都開始嘗試使用小數(shù)據(jù)分析進(jìn)行管理提升和服務(wù)升級(jí)。
1.1.3安全性更高,可避免隱私性數(shù)據(jù)泄露。小數(shù)據(jù)分析是對(duì)用戶基本信息和生活行為信息的分析,對(duì)內(nèi)是個(gè)人數(shù)據(jù)的多維集合,對(duì)外是個(gè)人數(shù)據(jù)的整體表現(xiàn)。任何對(duì)外展示的數(shù)據(jù),都須通過預(yù)先設(shè)定的授權(quán)手續(xù)方可將分析結(jié)果輸出,絕不會(huì)涉及到個(gè)人的行為信息和基本信息的信息安全問題??梢赃@么說,小數(shù)據(jù)有效地保護(hù)了用戶信息安全,杜絕了大數(shù)據(jù)對(duì)個(gè)人信息進(jìn)行無止境地監(jiān)測(cè)和采集。從而避免了隱私性數(shù)據(jù)泄露的可能。
1.1.4小數(shù)據(jù)與大數(shù)據(jù)互為映射、相得益彰。近年來,隨著大數(shù)據(jù)應(yīng)用的迅速發(fā)展,與之相伴出現(xiàn)了一些應(yīng)用弊端和伴生問題,為了能夠規(guī)避這些弊端并解決這些問題,小數(shù)據(jù)的應(yīng)用才應(yīng)運(yùn)而生。從規(guī)模上看小數(shù)據(jù)的數(shù)據(jù)體量遠(yuǎn)遠(yuǎn)小于大數(shù)據(jù),但并非是大數(shù)據(jù)的縮微處理,更多的是對(duì)大數(shù)據(jù)信息的專項(xiàng)延伸與補(bǔ)充,二者互為映射,相得益彰。另外,二者在諸多屬性上也是對(duì)稱的,比如小數(shù)據(jù)的價(jià)值密度更高,但受數(shù)據(jù)噪音的影響較大,易被忽視。而大數(shù)據(jù)則反之。
1.2小數(shù)據(jù)應(yīng)用現(xiàn)狀
小數(shù)據(jù)主要以個(gè)體作為研究主體,通過對(duì)某方面深入準(zhǔn)確的挖掘,它是大數(shù)據(jù)的某個(gè)側(cè)面維度。事實(shí)上,對(duì)于個(gè)人而言,這個(gè)所謂的側(cè)面完全有可能是特定個(gè)體的全面。目前,小數(shù)據(jù)被廣泛應(yīng)用于數(shù)字醫(yī)療、運(yùn)動(dòng)檢測(cè)、環(huán)境監(jiān)測(cè)等行業(yè)和領(lǐng)域。
Emily Waltz曾在IEEE Spectrum的撰文指出,目前佩戴在運(yùn)動(dòng)員身上的生物傳感器,正在使運(yùn)動(dòng)員的訓(xùn)練方式發(fā)生著改變。這些裝有傳感器的裝備,可以實(shí)時(shí)提供運(yùn)動(dòng)員的生理機(jī)能參數(shù),可讓運(yùn)動(dòng)員更有韌性,可穿戴裝備能更有針對(duì)性地幫助運(yùn)動(dòng)員提高成績并避免身體受傷。傳感器每秒能夠產(chǎn)生100個(gè)感知數(shù)據(jù)。通過無線連接傳導(dǎo)到個(gè)人量化分析軟件中,對(duì)運(yùn)動(dòng)特征和特定位置進(jìn)行分析監(jiān)控,專家系統(tǒng)中的算法,可以剖析出運(yùn)動(dòng)員在運(yùn)動(dòng)過程中做對(duì)了什么、做錯(cuò)了什么,基于此信息,教練員可以給出更加具有針對(duì)性的訓(xùn)練。
還有,醫(yī)療單位利用電子病歷系統(tǒng)記錄的患者的癥狀、接受的檢查、醫(yī)生的診斷及處方、患者的治療、后期護(hù)理等多種就診信息,及對(duì)并發(fā)癥等發(fā)生規(guī)律進(jìn)行總結(jié)歸納,進(jìn)行相關(guān)的診療處理,提升了醫(yī)生對(duì)患者病情的了解程度,提高了治愈效率,降低了醫(yī)患糾紛等優(yōu)點(diǎn);通過對(duì)該患者病例、生活習(xí)慣的分析,再對(duì)于該疾病的易發(fā)人群進(jìn)行有效預(yù)防,減少發(fā)病機(jī)率??焖儆行У闹委煼椒?,通過例證加以傳播,為科研和教學(xué)提供了豐富的材料[3]。
2.1基于小數(shù)據(jù)特點(diǎn)提供服務(wù)
圖書館小數(shù)據(jù)應(yīng)用以讀者為中心,由圖書館數(shù)據(jù)分析人員對(duì)讀者在館期間發(fā)生的行為數(shù)據(jù)進(jìn)行采集、挖掘、分析等工作。小數(shù)據(jù)關(guān)注于讀者個(gè)性化閱讀和服務(wù)方式的重構(gòu),對(duì)讀者群或單個(gè)讀者進(jìn)行研究,分析其以往閱讀行為、個(gè)性化需求的數(shù)據(jù),從而得出讀者未來閱讀需求內(nèi)容且優(yōu)化圖書館個(gè)性化服務(wù)體系。
2.2小數(shù)據(jù)有利于過濾數(shù)據(jù)“噪聲”
在基于數(shù)據(jù)的分析與預(yù)測(cè)活動(dòng)中,能否有效過濾數(shù)據(jù)“噪聲”,關(guān)系到數(shù)據(jù)分析的準(zhǔn)確性與指引決策的科學(xué)性。在圖書館內(nèi)通過加設(shè)傳感器網(wǎng)絡(luò)、服務(wù)器監(jiān)測(cè)設(shè)備、個(gè)人移動(dòng)終端和可穿戴設(shè)備等數(shù)據(jù)監(jiān)測(cè)記錄設(shè)備,對(duì)讀者閱讀頻率、閱讀習(xí)慣、社會(huì)背景與交往等讀者個(gè)體小數(shù)據(jù)資料進(jìn)行采集,這些小數(shù)據(jù)具有信息量分散、價(jià)值密度低、噪聲影響大的特點(diǎn)。因此,如何通過有效過濾噪聲來提高數(shù)據(jù)價(jià)值的密度,是關(guān)系圖書館小數(shù)據(jù)應(yīng)用是否可行的重要問題。圖書館小數(shù)據(jù)具有數(shù)據(jù)采集對(duì)象有限、結(jié)構(gòu)簡單等特點(diǎn),因此,工作人員更易于處理數(shù)據(jù)的采集及分析出現(xiàn)的各種問題,避免數(shù)據(jù)”噪聲”與價(jià)值信息被同時(shí)采集,匯總在一起。通過人工整理的方式降低了數(shù)據(jù)“噪聲”的不良影響,從而可以將數(shù)據(jù)“噪聲”快速剔除,提取出有價(jià)值的讀者小數(shù)據(jù)信息。
2.3小數(shù)據(jù)可以提高數(shù)據(jù)質(zhì)量
在數(shù)據(jù)決策中,數(shù)據(jù)的體量是重要的,但絕不是衡量數(shù)據(jù)價(jià)值的唯一標(biāo)準(zhǔn)。數(shù)據(jù)的獲取途徑、價(jià)值準(zhǔn)確性、信息的完整性和數(shù)據(jù)采集有效性,是影響所采決策數(shù)據(jù)質(zhì)量的關(guān)鍵要素。圖書館進(jìn)行的小數(shù)據(jù)提取是針對(duì)讀者信息開展的信息采集、數(shù)據(jù)系統(tǒng)分析和分析結(jié)果采集決策的系統(tǒng)性操作,通過這些操作才能保證為讀者提供個(gè)性化閱讀服務(wù)。小數(shù)據(jù)在圖書館中的應(yīng)用從新的視角取代原有僵化的信息采集途徑,采用新的信息分析和管理決策的模式,為讀者提供更具針對(duì)性、指向性的服務(wù)。另外,圖書館小數(shù)據(jù)不同維度之間具有較高的關(guān)聯(lián)性和融合性。因此,基于該小數(shù)據(jù)基礎(chǔ)構(gòu)建的圖書館個(gè)性化服務(wù)模型,相比原有的服務(wù)模式服務(wù)針對(duì)性更強(qiáng),可利用率更高。同時(shí),基于圖書館小數(shù)據(jù)集匯總的數(shù)據(jù)倉庫將使多維的數(shù)據(jù)信息更加統(tǒng)一、準(zhǔn)確,有利于圖書館獲取高效信息,在對(duì)讀者閱讀行為加以記錄的前提下,構(gòu)建圖書館小數(shù)據(jù)的“歸因模型”,以實(shí)現(xiàn)對(duì)讀者閱讀行為過程科學(xué)的因果解釋和推論。
2.4小數(shù)據(jù)具有高安全性
小數(shù)據(jù)較大數(shù)據(jù)而言對(duì)讀者個(gè)人隱私可有效地進(jìn)行保護(hù),隨著無線設(shè)備、移動(dòng)終端和智能傳感器技術(shù)的高速發(fā)展,圖書館完全可以使用該類技術(shù)對(duì)讀者閱讀行為、閱讀習(xí)慣、閱讀方向和個(gè)人信息進(jìn)行可持續(xù)、全面地?cái)?shù)據(jù)采集。這些行為數(shù)據(jù)在指引管理人員為讀者提供差異化服務(wù)和科學(xué)決策的條件下,也使讀者的生活行為被監(jiān)測(cè),導(dǎo)致隱私泄露和侵權(quán)的風(fēng)險(xiǎn)。
2.5小數(shù)據(jù)應(yīng)用系統(tǒng)對(duì)硬件設(shè)備和系統(tǒng)資源要求較低
小數(shù)據(jù)以讀者行為數(shù)據(jù)為采集核心、可用于讀者個(gè)性化服務(wù)和指引科學(xué)決策的高價(jià)值信息。與大數(shù)據(jù)相比,二者在數(shù)據(jù)處理、分析決策過程中,對(duì)硬件的運(yùn)算性能、算法的優(yōu)化設(shè)計(jì)、數(shù)據(jù)體量的要求有著很大的區(qū)別。
3.1小數(shù)據(jù)在電子文獻(xiàn)選購的應(yīng)用
對(duì)于圖書館來說,電子文獻(xiàn)的選購是一項(xiàng)需要科學(xué)配置的工作。選購的電子文獻(xiàn)可謂是種類繁多,其中包括國內(nèi)的、國外的,不同學(xué)科的、不同層次的、不同價(jià)位的,要將這些因素與本圖書館學(xué)科設(shè)置、閱讀喜好層次、接受能力等情況相結(jié)合來取舍決定。首先,決策者必須要清楚本單位借閱人群狀況。一個(gè)電子文獻(xiàn)不管多有名,應(yīng)用多廣泛,如果不適合本單位讀者群就不是一個(gè)好的選購對(duì)象。例如,圖書館對(duì)于醫(yī)學(xué)博士論文庫的采購?fù)际且遄迷偃?,因?yàn)槌松贁?shù)幾個(gè)??茖W(xué)術(shù)(如醫(yī)學(xué))外,多數(shù)??频膶W(xué)術(shù)很難達(dá)到這一高度,如果購買勢(shì)必會(huì)造成曲高和寡、無人問津的局面。再如,讀者群如果外語水平尚未達(dá)到可無障礙地閱讀外國文獻(xiàn)的水平,那就不能大量采購?fù)馕碾娮游墨I(xiàn)。其次,還要考慮選購的電子文獻(xiàn)的相似性和重復(fù)性。另外,還可以根據(jù)瀏覽的讀者人次數(shù)、人員類型和時(shí)間,來判斷一種電子文獻(xiàn)的應(yīng)用前景和讀者接受的程度,最終決定是否購買。不合理的選購一方面會(huì)導(dǎo)致資源浪費(fèi),另一方面又會(huì)使合適的電子文獻(xiàn)因缺乏資金而失去未被選擇的機(jī)會(huì)。以上這些都要通過對(duì)小數(shù)據(jù)的精心分析才可能有最終正確的選擇[4]。
3.2小數(shù)據(jù)在讀者群體分析中的應(yīng)用
圖書館工作中看似毫無計(jì)劃性的安排,如果要想安排得當(dāng)其背后基于對(duì)小數(shù)據(jù)的分析必不可少。如每個(gè)圖書館基本上都有在固定時(shí)間閉館的規(guī)定,往往是根據(jù)連續(xù)幾個(gè)月中讀者到館人次最少一天的數(shù)據(jù)統(tǒng)計(jì)來分析得出的,這樣既可使圖書館進(jìn)行了休養(yǎng)生息又將閉館給讀者群帶來的影響降至最小。再如,智能系統(tǒng)為圖書館工作采集到了全面的實(shí)時(shí)數(shù)據(jù),其中,閘機(jī)系統(tǒng)對(duì)于進(jìn)入圖書館的讀者進(jìn)行了實(shí)時(shí)跟蹤,我們可以從這些人員的屬性,包括單位、專業(yè),甚至性別來進(jìn)行分析,從而得出我們需要的結(jié)論并加以應(yīng)用。另外,還可以通過查看圖書館自身館藏資源來判斷相關(guān)服務(wù)是否科學(xué)。利用這些小數(shù)據(jù)加以分析有利于圖書館工作很好地開展,既兼顧了讀者利益,也使圖書館工作安排提高了效率,這些應(yīng)用都是小數(shù)據(jù)統(tǒng)計(jì)的一種主動(dòng)選擇。
3.3小數(shù)據(jù)在信息服務(wù)中的應(yīng)用
信息檢索部門的服務(wù)很多時(shí)候?qū)儆谛?shù)據(jù)的服務(wù)內(nèi)容,為個(gè)別讀者提供具有針對(duì)性的個(gè)性化服務(wù),通常為被動(dòng)形式的服務(wù)。有需求的讀者會(huì)提出檢索范圍、主題等服務(wù)要求,信息檢索部門的工作人員會(huì)根據(jù)這些信息,提供檢索、查詢、推送等服務(wù)。因?yàn)檫@種小數(shù)據(jù)服務(wù)產(chǎn)生于個(gè)性化的需求,因此信息檢索部門結(jié)構(gòu)往往體現(xiàn)于多樣化,以滿足更多讀者個(gè)性化借閱的需求。工作人員將通過OPAC系統(tǒng)進(jìn)行圖書薦購,向讀者推薦自己認(rèn)為有閱讀價(jià)值的書籍;一些圖書館會(huì)將讀者所選書目訂單作為圖書采購的一部分;如果書商在本地,甚至還可以邀請(qǐng)部分讀者隨同采購;此外,通過對(duì)讀者借閱情況的小數(shù)據(jù)分析,以確認(rèn)圖書采購中是不是忽略了某些專業(yè)圖書,或者遺漏了某些讀者群的需求。這些措施的采用將會(huì)更大限度地發(fā)揮讀者的閱讀興趣。重視小數(shù)據(jù)的反饋,體現(xiàn)了對(duì)個(gè)體讀者的尊重,求同存異,讓任何一個(gè)有閱讀愛好的讀者均可在圖書館找到屬于他的那本書。
小數(shù)據(jù)作為大數(shù)據(jù)時(shí)代的重要組成部分,將以更加簡單、更有針對(duì)性、更易操作實(shí)施等特點(diǎn),通過對(duì)讀者知識(shí)需求變化的分析為圖書館的建設(shè)發(fā)展帶來了依據(jù),也對(duì)圖書館管理和業(yè)務(wù)研究指出了新的方向,對(duì)圖書館服務(wù)提升起到指向性作用。小數(shù)據(jù)精準(zhǔn)挖掘數(shù)據(jù)資源,為圖書館決策提供滿足個(gè)性化需求且高質(zhì)量的小數(shù)據(jù),深層次分離讀者信息及服務(wù)方向,確保圖書館服務(wù)更具價(jià)值,降低圖書館管理成本,并根據(jù)個(gè)性化需求及時(shí)調(diào)整圖書館發(fā)展格局??梢哉f,小數(shù)據(jù)的應(yīng)用將為圖書館的發(fā)展帶來了一個(gè)大的機(jī)遇。
參考文獻(xiàn):
[1]王碧琴,等.數(shù)字圖書館用戶信息隱私的安全威脅分析[J].圖書館學(xué)研究,2015(10):34-36.
[2]孫紅蕾,鄭建明.小數(shù)據(jù)思維驅(qū)動(dòng)下的數(shù)字文化治理路徑探析[J].圖書館學(xué)研究,2015(18):39-43.
[3]張小光.支持醫(yī)療過程管理的電子病歷系統(tǒng)研發(fā)及有意義應(yīng)用研究[D].浙江:浙江大學(xué),2012:43-45.
[4]陳臣,馬曉亭.基于小數(shù)據(jù)的圖書館個(gè)性化推送服務(wù)與服務(wù)質(zhì)量保證研究[J].情報(bào)理論與實(shí)踐,2015(38).
王昊女,1979年生。研究生學(xué)歷,碩士,館員。
[分類號(hào)]G252
收稿日期:(2016-03-27;責(zé)編:徐向東。)