雷禮群/武漢城市職業(yè)學(xué)院
基于信息推薦的圖書管理系統(tǒng)實(shí)踐分析
雷禮群/武漢城市職業(yè)學(xué)院
圖書館數(shù)字化需求以及信息科技的發(fā)展導(dǎo)致了圖書管理系統(tǒng)的出現(xiàn),它旨在通過網(wǎng)絡(luò)化信息管理為管理者和讀者提供更好的服務(wù),提高圖書管理效率。但是,在當(dāng)今大部分圖書管理系統(tǒng)中,其基礎(chǔ)服務(wù)較為簡單,一般只能提供基礎(chǔ)的圖書管理和信息檢索服務(wù)。隨著館藏日益龐大,針對每類圖書都存在成千上萬種版本,如何在海量的圖書信息中讓讀者找到需要的圖書已變得越來越困難。因此,為讀者提供個性化信息推薦成為讀者的迫切需求。
信息推薦;圖書管理系統(tǒng)
圖書管理系統(tǒng)是指通過計(jì)算機(jī)軟件的方式,對圖書進(jìn)行信息化組織和管理,它使得管理人員能夠高效地管理海量圖書,并能讓用戶快速搜索和定位圖書,從而為兩者都提供快捷、方便的信息化服務(wù)。這種服務(wù)模式具有傳統(tǒng)人工管理方式不可比擬的優(yōu)勢。因此,實(shí)現(xiàn)對圖書進(jìn)行智能化管理和服務(wù)是當(dāng)前一個必然的趨勢。
圖書館個性推薦是指以讀者的個人背景、專業(yè)、習(xí)慣、愛好和提出的特別要求等為依據(jù),對每一位讀者提供個性化推薦服務(wù)。
個性化推薦是信息的重組過程,是信息資源的再分配,是一種基于用戶需求的個性化信息服務(wù)模式。其原理是以充分挖掘用戶的個性化需求信息為前提,主動組織信息資源,并向用戶推送其感興趣的信息資源和信息服務(wù)。一方面是社會進(jìn)步與圖書館自身發(fā)展的需要,有利于提高圖書館的科技能力與服務(wù)水平。另一方面節(jié)省用戶獲取有效文獻(xiàn)信息時間,激發(fā)讀者閱讀興趣,提高圖書的使用效率,提高用戶的滿意度。
數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則方法,通過已經(jīng)評分或用戶的借閱記錄向用戶推薦新的圖書?;诟拍罘謱拥姆椒ǘx人口統(tǒng)計(jì)學(xué)屬性,人口統(tǒng)計(jì)學(xué)屬性再把用戶特征化。根據(jù)分類法把圖書分為不同的類別,特定類別的用戶對特定類別的圖書感興趣,這種方法稱為knowledge generalized profile association rules。針對協(xié)同過濾推薦的數(shù)據(jù)稀疏性、冷啟動問題,將關(guān)聯(lián)規(guī)則應(yīng)用到圖書推薦系統(tǒng)。利用聚類算法對圖書進(jìn)行聚類,得到同一簇內(nèi)圖書的相似性較高,不同簇相似性低,再結(jié)合余弦相似性計(jì)算用戶的相似性,得到目標(biāo)用戶的最終圖書推薦。
模糊語言學(xué)在推薦系統(tǒng)得到廣泛的應(yīng)用。等基于模糊語言學(xué),提出了多規(guī)則的推薦系統(tǒng),并應(yīng)用于大學(xué)圖書館。該系統(tǒng)為專門領(lǐng)域的研究人員推薦專門的資源,發(fā)現(xiàn)協(xié)同的可能性,并形成多規(guī)則群體。但表示用戶的興趣偏好需要大量復(fù)雜的信息,因而獲取用戶概貌比較難。研發(fā)模糊語言學(xué)的推薦系統(tǒng),幫助研究人員和公司自動獲取信息。不需要用戶直接提供用戶特征概貌的興趣偏好向量,而是通過計(jì)算用戶的不完整模糊語言興趣偏好關(guān)系,得到用戶的興趣偏好。
協(xié)同過濾分為基于用戶、基于項(xiàng)目、基于模型的算法。大致推薦過程為:
(1)建立m*n的用戶-評價模型。
(2)由皮爾森相關(guān)系數(shù)、余弦相似性或修正的余弦相似性等公式,計(jì)算目標(biāo)用戶與其他用戶的相似性,得到目標(biāo)用戶的最近鄰居N u=N1,N2…,N i。
(3)由最近鄰居計(jì)算目標(biāo)用戶對目標(biāo)項(xiàng)目的預(yù)測評分,將預(yù)測評分最高的TOP-N項(xiàng)目推薦給用戶。在有足夠的用戶數(shù)據(jù)的時候,可向具有相同興趣偏好的用戶推送受歡迎的推薦。但數(shù)據(jù)往往是稀疏的。針對此問題,研究人員提出基于鏈接預(yù)測的協(xié)同過濾、評價矩陣列向量的協(xié)同過濾,結(jié)合心理學(xué)的遺忘規(guī)律及用戶年齡、專業(yè)、職業(yè)、學(xué)歷、性別等特征向量,改進(jìn)了基于用戶的協(xié)同過濾。
基于內(nèi)容的推薦,在沒有足夠的數(shù)據(jù)下,可以向具有不同興趣偏好的用戶推薦非流行的項(xiàng)目。LIBRA是很早的基于內(nèi)容的圖書推薦系統(tǒng),由每位用戶提供的訓(xùn)練例子,使用貝葉斯學(xué)習(xí)算法,從Web提取圖書的標(biāo)題等信息,推薦圖書。
云模型是我國著名的李德毅院士提出的。云由期望值、熵、超熵表示,云模型轉(zhuǎn)換了定性概念和數(shù)值表示的不確定。一個云包含很多個云滴。云的整體形狀反映定性概念的特征。利用云計(jì)算模型計(jì)算項(xiàng)目間的相似性,解決數(shù)據(jù)稀疏性和算法的擴(kuò)展性問題,有效提高基于項(xiàng)目協(xié)同過濾推薦算法的推薦質(zhì)量。利用云模型計(jì)算知識層面的用戶相似性,有效克服傳統(tǒng)基于向量計(jì)算用戶相似性的缺點(diǎn)。
如圖1所示
圖1 圖書智能推薦系統(tǒng)框
這一部分是通過關(guān)聯(lián)規(guī)則的挖掘和數(shù)據(jù)的準(zhǔn)備來完成的。關(guān)聯(lián)規(guī)則的挖掘是由頻繁項(xiàng)集的掃描和關(guān)聯(lián)規(guī)則生成這兩部分組成,而數(shù)據(jù)準(zhǔn)備則是將圖書館的web服務(wù)器實(shí)時用戶文件和借閱歷史進(jìn)行掃描并生成相應(yīng)文件。
首先進(jìn)行的是數(shù)據(jù)準(zhǔn)備工作,這一工作過程中會對數(shù)據(jù)進(jìn)行必要的預(yù)先處理,規(guī)則挖掘的正確度和效率也受這一結(jié)果的影響。另外由于圖書的歷史數(shù)據(jù)和實(shí)時數(shù)據(jù)都存在大量冗余,也需要對數(shù)據(jù)進(jìn)行必要的去噪和整理。之后進(jìn)行的是關(guān)聯(lián)規(guī)則的挖掘,這里會利用關(guān)聯(lián)模式來發(fā)現(xiàn)用戶瀏覽模式,通過對模式的分析得到讀者的借閱規(guī)則,存儲之后為后面的online部分服務(wù)。
Online部分運(yùn)用Offline部分生成關(guān)聯(lián)規(guī)則的集合,并且在同一時間內(nèi)記錄和檢測用戶的瀏覽過程,動態(tài)地為用戶推薦相應(yīng)的鏈接或者書目操作等服務(wù)。由讀者推薦和圖書館服務(wù)器組成,服務(wù)器記錄用戶的操作數(shù)據(jù),讀者推薦服務(wù)通過匹配讀者行為數(shù)據(jù)和Offline部分產(chǎn)生的有趣規(guī)則,給用戶進(jìn)行圖書推薦服務(wù)。
隨著數(shù)字圖書館朝著越來越智能化的方向發(fā)展,圖書館需要提供給讀者更加有針對性的圖書自動推薦服務(wù)。通過本文的研究能夠得到,作為圖書智能推薦系統(tǒng)技術(shù),可以提高圖書館的服務(wù)水平和質(zhì)量,為圖書館管理提供數(shù)據(jù)支持。在今后的研究中還需要進(jìn)一步深入研究,以期能夠更好的改進(jìn)圖書館的服務(wù)質(zhì)量和效率。
[1]陳宇亮,沈奎林.基于讀者評論的圖書推薦系統(tǒng)研究[J].圖書情報導(dǎo)刊,2016(9):6-9.
[2]欒旭倫.大數(shù)據(jù)環(huán)境下高校圖書館個性化信息服務(wù)系統(tǒng)研究[J].圖書館學(xué)刊,2014(8):118-121.
[3]曾子明,陳貝貝.融合情境下智慧圖書館個性化服務(wù)研究[J].圖書館論壇,2016(1):57-63