鄭曉川
摘 要
在數(shù)字信息時代,一個人要想完全不泄露個人信息是不可能的,而我們利用數(shù)據(jù)挖掘技術(shù)獲取這些信息并進行分類整理和分析,就能為各領(lǐng)域的工作謀取相關(guān)的利益。本文僅從現(xiàn)代圖書館的建設(shè)出發(fā),詳細闡述數(shù)據(jù)挖掘技術(shù)在圖書館用戶資源管理、書籍采購及擺放、個性化推薦服務(wù)三方面的應(yīng)用,希望圖書館能在數(shù)據(jù)挖掘技術(shù)的輔助下吸引更多的讀者,為讀者提供更貼心、更優(yōu)質(zhì)的服務(wù)。
【關(guān)鍵詞】圖書館 暑假挖掘技術(shù) 應(yīng)用 管理
1 發(fā)現(xiàn)并管理用戶資源
用戶數(shù)據(jù)按數(shù)據(jù)類型可大致分為用戶描述類數(shù)據(jù)、用戶行為類數(shù)據(jù)、用戶需求類數(shù)據(jù)和用戶反饋類數(shù)據(jù)四個大類,隨著數(shù)字圖書館的不斷發(fā)展,圖書館在獲取用戶數(shù)據(jù)的渠道、速度、數(shù)量等方面也在不斷優(yōu)化,既可以通過傳統(tǒng)方式獲取,也可以通過現(xiàn)代化的方式即數(shù)據(jù)挖掘技術(shù)獲得。
在數(shù)字圖書館服務(wù)過程中獲取用戶進入圖書館借書都會辦理借閱卡,卡上除了有用戶的基本信息如姓名、聯(lián)系方式、借閱等級以外,還記錄了他們在持卡期間所借閱書籍的名稱、編號、分類、借閱時長等。
另外,現(xiàn)在的圖書館都配有電子檢索儀器,借閱者在檢索過程中所輸入的關(guān)鍵字也透露著他們的閱讀偏好,是一個有用的信息。但是搜索很多時候是匿名的,所以我們可以靈活地利用IP地址來代替讀者標識,統(tǒng)計每臺機器在相應(yīng)檢索時間內(nèi)各檢索字段的條數(shù)。所以在利用數(shù)據(jù)挖掘技術(shù)進行用戶信息挖掘和管理的時候,我們主要要做的工作就是將每一個用戶的基本信息與其所借閱的書目信息及檢索歷史一一匹配, 編輯入庫、定時更新。之后再將這一個個的信息聚合,做好詳細的分類,構(gòu)建起一個專門的用戶數(shù)據(jù)管理庫。針對數(shù)據(jù)庫中的用戶數(shù)據(jù),采用簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián)等關(guān)聯(lián)分析與序列規(guī)則等數(shù)據(jù)分析與挖掘方法,對圖書館用戶特征進行多維特征分析,挖掘用戶的隱性信息需求,從而為下文中將要談到的圖書采購、藏館布局、個性化推薦服務(wù)打好基礎(chǔ)。
2 優(yōu)化圖書館藏書和布局
圖書館的藏書可分為過往藏書和近期藏書,過往藏書的數(shù)量一般是近期藏書的數(shù)倍,占用的空間的大得多。但是根據(jù)借閱情況來看,過往藏書的借閱量遠不如近期藏書,查找起來也相對費時費力。但即使是在近期藏書中,也存在著熱門書刊和冷門書刊之分,圖書館每年的書刊購置費都是十分有限的,若盲目購置則會造成資金的浪費和書刊的閑置,資源得不到有效利用。
傳統(tǒng)的圖書館在采購時大多通過出版社、書店等渠道來了解新書書目和銷售情況,卻沒有實際針對本圖書館所面向的客戶群做一個專門的分析,采購的意見也多由館長或個別專家來決定,不可避免地帶有強烈的個人意志。而利用數(shù)據(jù)挖掘技術(shù),我們可以對網(wǎng)絡(luò)上無序的、非結(jié)構(gòu)的數(shù)據(jù)進行采集和分類,通過搜索量及輿論對新書的受歡迎程度做一個預(yù)計,同時根據(jù)本館借閱者的借閱偏好整理出他們所喜愛的圖書分類,加大該類目書刊的采購比例,利用有限的經(jīng)費科學(xué)采購。
除此之外,時間也會對讀者的借閱行為產(chǎn)生一定的導(dǎo)向性,比如在奧運會期間,運動、世界史、旅游等方面的書的借閱量就明顯上升,各類考試的前期,其相關(guān)的輔導(dǎo)書刊的借閱量也會隨著開考時間的臨近而逐漸上升,所以圖書館在采購時要綜合各方信息、充分考量,使經(jīng)費最大程度發(fā)揮效益
另一方面,為方便讀者查找書目、快速完成借閱,圖書館還可而利用數(shù)據(jù)挖掘技術(shù)對圖書館的借閱流通記錄、檢索請求、分類統(tǒng)計、文獻拒借集、頻繁借閱集、借閱時長、歸還時間等數(shù)據(jù)進行分析,得到同一類目下書籍被借閱頻率的高低并進行排序。那么我們就可以據(jù)此重新安排圖書館的書架布局,將借閱量大、借閱頻率高的書籍放在顯眼位置、靠近出入口的地方,這樣不僅能節(jié)省借閱者的查找時間,也能減輕圖書管理員的上下架強度, 一舉兩得。
3 為讀者提供個性化的推薦服務(wù)
在圖書館巨大館藏中,讀者感興趣的書目只有很小的一部分,雖然現(xiàn)代圖書館提供的檢索服務(wù)能夠幫助讀者在輸入關(guān)鍵詞后在查詢結(jié)果瀏覽到相關(guān)書目的信息,引發(fā)他們對其他書刊的興趣,臨時增加借閱量。但這行為的發(fā)生取決于借閱者的主動檢索,圖書館對其行為的導(dǎo)向幾乎不存在,處境十分被動。而圖書推薦服務(wù)就是為彌補這一局限性而采取的主動向讀者提供信息的方式,它降低了對讀者的要求,同時提供了更豐富的信息。圖書推薦服務(wù)是現(xiàn)代圖書館個性化信息服務(wù)中的一種,它旨在為讀者推薦他可能會感興趣的書目,以增加額外的借閱量,同時也可以起到引導(dǎo)讀者關(guān)注某一領(lǐng)域發(fā)展的作用,如在人民代表大會期間,圖書館就可為讀者推薦與革命歷史、政治制度、名人自傳等相關(guān)的圖書,與這一特殊的時間點相結(jié)合就有可能激發(fā)讀者本沒有的閱讀欲望,從而提高某類圖書的借閱量,增加活躍度。
為了提供個性化推薦服務(wù),我們可以通過對借閱記錄中讀者信息和書籍信息的關(guān)聯(lián)分析,找出讀者的閱讀偏好和借閱習(xí)慣,獲取“不同類型的讀者喜歡哪類書籍”,進而建立模型并提供推薦服務(wù),向讀者推薦相關(guān)的專題信息。但需要注意的是,越新的借閱記錄指導(dǎo)意義越大,因此我們可以在借閱記錄中加入權(quán)重,將權(quán)重定于為事務(wù)發(fā)生時間的函數(shù),設(shè)定當(dāng)前時間的借閱記錄的權(quán)重為1,越早的記錄權(quán)重越低,使得最近的記錄在挖掘中提供最多的知識。同時,我們還可以通過分類分析的方法,獲取各類讀者的特征,挖掘圖書館的潛在讀者,先免費為他們提供感興趣的信息或解決問題的知識,將其逐漸發(fā)展為穩(wěn)定讀者。
4 結(jié)語
圖書館承擔(dān)著為讀者提供閱讀材料的重要角色,是書刊儲藏的重要場所,但是在信息經(jīng)濟時代如何為讀者提供他們所真正需要的閱讀材料,吸引更多的借閱者來到圖書館,是圖書館管理者需要思考的問題。在數(shù)據(jù)挖掘技術(shù)的幫助下,圖書館對用戶信息的采集和整理變得簡單,這對圖書館采集經(jīng)費的合理化使用和館藏布局的優(yōu)化有都很大幫助,將推動圖書館業(yè)務(wù)與管理的全面進步。
參考文獻
[1]謝含.數(shù)據(jù)挖掘—未來圖書館參考咨詢工作的新方法[J].高校圖書館工作,2006(01).
[2]趙雷.數(shù)據(jù)挖掘技術(shù)在高校圖書館中的應(yīng)用[J].科技情報開發(fā)與經(jīng)濟,2009(07).
作者單位
南陽醫(yī)學(xué)高等專科學(xué)校 河南省南陽市 473000