馬東明
(山西財(cái)經(jīng)大學(xué),山西 太原 030006)
推薦系統(tǒng)在高校圖書館的應(yīng)用研究
馬東明
(山西財(cái)經(jīng)大學(xué),山西 太原 030006)
大數(shù)據(jù)時(shí)代,信息技術(shù)和網(wǎng)絡(luò)的不斷發(fā)展誘發(fā)了信息的過載問題。為了向師生提供跨數(shù)據(jù)源的信息推薦服務(wù),高校圖書館必須構(gòu)建數(shù)字圖書推薦系統(tǒng)。文章對國外較為成熟的圖書推薦系統(tǒng)進(jìn)行分析,對其推薦模型,關(guān)鍵技術(shù)等進(jìn)行了概括分析。最后對高校圖書推薦系統(tǒng)的研究難點(diǎn)和發(fā)展趨勢進(jìn)行展望。
推薦系統(tǒng);高校圖書館;個(gè)性化服務(wù)
隨著信息網(wǎng)絡(luò)的不斷發(fā)展,高校圖書館作為網(wǎng)絡(luò)信息資源與師生的橋梁,面對紛繁復(fù)雜的信息海洋,高校圖書館應(yīng)針對網(wǎng)絡(luò)信息與用戶閱讀體驗(yàn)等方面,為高校師生提供高質(zhì)量的信息服務(wù)來滿足用戶的閱讀要求。以用戶為中心,信息化與智能化的服務(wù)為基礎(chǔ)的智慧型圖書館成為圖書館發(fā)展的必然趨勢。
高校圖書館作為高校師生的文獻(xiàn)信息管理者,為教學(xué)科研工作提供信息服務(wù)。面對“信息過載”,讀者如何找出適合自己的信息資源,圖書館應(yīng)當(dāng)如何將其豐富的資源有效的利用成為目前傳統(tǒng)圖書館面臨的嚴(yán)峻挑戰(zhàn)。圖書館在其服務(wù)中應(yīng)當(dāng)突出其智慧性,為讀者提供個(gè)性化的閱讀體驗(yàn),提高其閱讀滿意度。推薦系統(tǒng)作為解決“信息過載”問題的主要手段,本文就推薦系統(tǒng)在高校圖書館的應(yīng)用進(jìn)行深入探討,并就其應(yīng)用前景以及研究難點(diǎn)進(jìn)行分析。
隨著教育水平的提高,國家對高校建設(shè)的力度不斷加大,使得目前高校圖書館館藏資源十分豐富,而信息資源的高速增長同樣使得高校圖書館電子信息資源越來越多。導(dǎo)致信息資源利用率偏低,甚至多數(shù)資源無人問津。而高校圖書館的服務(wù)對象主要是高校師生,其對于信息服務(wù)質(zhì)量要求較高,這就要求高校圖書館能夠?yàn)樽x者提供符合其專業(yè)程度以及專業(yè)方向的個(gè)性化信息服務(wù)。
亞馬遜作為應(yīng)用推薦系統(tǒng)最為廣泛的電子商務(wù)網(wǎng)站,在其網(wǎng)絡(luò)書店中采用了基于項(xiàng)目的協(xié)同過濾模型,獲得了較好的推薦效果。算法首先在用戶評分矩陣中利用相似性算法獲取項(xiàng)目之間的相似度,并以此得到與項(xiàng)目特征最為匹配的鄰居項(xiàng)目集合,為用戶推薦鄰居項(xiàng)目中評分最高的Top-N項(xiàng)目列表。
圖1 協(xié)同過濾推薦流程
圖1為協(xié)同過濾推薦算法的推薦流程,協(xié)同過濾思想自1992年由Goldberg等人提出后得到了廣泛的應(yīng)用。其目的在于為當(dāng)前用戶推薦符合用戶興趣的項(xiàng)目或者與測用戶對某一項(xiàng)目的評分。推薦系統(tǒng)中通常將用戶集合記為 U,其中 U={u1,u2……um},項(xiàng)目集合記為 I={i1,i2……im}。對于某一個(gè)用戶 ua,存在一個(gè)對系統(tǒng)項(xiàng)目評分向量Iaj來記錄用戶ua對項(xiàng)目ij的歷史評分。通常將基于協(xié)同過濾需要計(jì)算用戶如下內(nèi)容:1.為用戶 ua預(yù)測在 ij項(xiàng)目的評分值 Pa,j。2.以預(yù)測評分值的排序選取用戶評分值最高的N個(gè)項(xiàng)目作為用戶Top-N推薦列表供用戶選擇。
Amazon圖書推薦系統(tǒng)具有如下優(yōu)勢:
1.完備的推薦內(nèi)容:Amazon以其完備的用戶歷史信息和圖書資料能夠完成各種角度下的圖書相似度計(jì)算。包括:圖書的外部特征、圖書的出版特征、圖書銷售情況、圖書的關(guān)鍵詞標(biāo)簽等等通過側(cè)面信息對圖書進(jìn)行描述,為用戶提供全方位信息服務(wù)。
2.較高的自動(dòng)化推薦能力:Amazon通過記錄用戶歷史點(diǎn)擊、訪問記錄、購買記錄、頁面停留時(shí)間等等數(shù)據(jù),并以此建立用戶興趣模型。當(dāng)用戶查找圖書時(shí),能夠?yàn)樽x者實(shí)現(xiàn)實(shí)時(shí)的圖書推薦。
3.多種推薦方式:Amazon采用多種推薦方式結(jié)合的策略。其中最為突出的是其提供的書評推薦,以作者、讀者等人的角度交流提交書評,能夠讓讀者在選擇時(shí)從多種角度了解圖書,以便讀者與讀者,讀者與作者之間的交流。
斯坦福大學(xué)在數(shù)字圖書館研究中提出了Fab系統(tǒng),其主要作用是為了幫助讀者從海量資源信息中篩選出用戶需要的信息。系統(tǒng)采用基于內(nèi)容的推薦和基于協(xié)同過濾的推薦模型,利用混合推薦技術(shù)將其結(jié)合使用,有效的向用戶推送其感興趣的信息。系統(tǒng)通過用戶的歷史閱讀信息以及評分,利用協(xié)同過濾等推薦模型為提取用戶興趣方向,并將其喜好的書籍推薦給具有相同興趣偏好的用戶。Fab綜合基于內(nèi)容和基于協(xié)同過濾的推薦模型,能夠?yàn)橛脩敉扑]合適信息的同時(shí),混合推薦也有效緩解了推薦系統(tǒng)中存在的冷啟動(dòng)問題。實(shí)現(xiàn)了個(gè)性化推薦服務(wù)。
Citeseer是NEC建設(shè)的一個(gè)學(xué)術(shù)論文圖書館,利用自動(dòng)引文表示技術(shù)提供了通過連接檢索文獻(xiàn)的檢索方式。2000年NEC研究院的Kurt等人將個(gè)性化推薦功能引入Citeseer。通過收集用書簽,收藏等方式,得出用戶偏好與興趣方向。利用最近鄰方法方式計(jì)算用戶相似度,并將合適的網(wǎng)頁推薦給用戶。
2006年,加州大學(xué)圖書館為提高讀者閱讀體驗(yàn)以及圖書館服務(wù)退出了Melvyl推薦系統(tǒng)。其主要使用兩種推薦方式:第一種利用加利福尼亞大學(xué)的圖書館閱讀數(shù)據(jù)進(jìn)行推薦,根據(jù)圖書的被借閱歷史,將不同書目建立聯(lián)系。在模型中,以圖書作為節(jié)點(diǎn),以借閱相同書籍的用戶數(shù)作為權(quán)重,根據(jù)書籍權(quán)重排序?yàn)橛脩暨M(jìn)行推薦。
當(dāng)當(dāng)網(wǎng)將其推薦系統(tǒng)分布在各個(gè)角落。通過收集用戶在其網(wǎng)站上的點(diǎn)擊,收藏,購買等記錄。通過多種推薦模型的計(jì)算為用戶提供個(gè)性化推薦服務(wù)。憑借其大量用戶數(shù)據(jù)的優(yōu)勢,以及多層面的推薦算法,當(dāng)當(dāng)網(wǎng)的推薦系統(tǒng)實(shí)現(xiàn)了對于海量用戶數(shù)據(jù)挖掘,并為其提供了精確實(shí)時(shí)的推薦。利用用戶歷史數(shù)據(jù)發(fā)掘用戶潛在需求,提高其推送質(zhì)量,為用戶購買提供了便利,同時(shí)提升其網(wǎng)站的用戶忠實(shí)度。
其他的包括SERF推薦系統(tǒng),百度學(xué)術(shù)的訂閱等等都有著其各自的推薦方式??傮w來說,圖書推薦系統(tǒng)有著其明顯的特點(diǎn)。(1)推薦針對性較強(qiáng),尤其是高校圖書館推薦,主要的服務(wù)對象是高校的師生群體。有著較高的專業(yè)度與信息新穎度需求;(2)圖書推薦的自動(dòng)化程度較高,尤其是在讀者偏好采集困難地情況下,如何有效利用其他方式分析用戶興趣度,為其主動(dòng)推送符合讀者需求的信息,是圖書推薦的重要研究點(diǎn);(3)推薦方式豐富,由于圖書館推薦的基礎(chǔ)是推薦系統(tǒng),尤其近些年信息高速發(fā)展,推薦系統(tǒng)的研究不斷進(jìn)步,傳統(tǒng)的推薦系統(tǒng)與新型推薦方式的結(jié)合,為推薦系統(tǒng)的發(fā)展注入了新的活力;(4)實(shí)時(shí)性與載體多樣化,圖書推薦的實(shí)時(shí)性影響著讀者的閱讀體驗(yàn),在線推薦能夠及時(shí)滿足讀者閱讀需求。而載體的多樣化體現(xiàn)在推薦內(nèi)容,不僅包括圖書,還包括多媒體等網(wǎng)絡(luò)資源。
針對高校圖書館館藏豐富產(chǎn)生的“信息過載”問題和面對高專業(yè)度的服務(wù)對象,其推薦模型的難點(diǎn)與其他電子商務(wù)的推薦有著明顯的不同。
用戶偏好是推薦系統(tǒng)中的推薦前提。在電子商務(wù)領(lǐng)域中,用戶的偏好信息可以通過其登錄方式,好友推薦等其他方式獲取。而在高校圖書館的推薦系統(tǒng)中,由于多數(shù)高校圖書館的僅僅通過學(xué)號方式登錄系統(tǒng),根據(jù)其學(xué)號系統(tǒng)可以得到讀者的專業(yè)方向與班內(nèi)同學(xué)并為其進(jìn)行推薦。但由于圖書館借閱方式的獨(dú)特性,許多讀者僅僅在館內(nèi)進(jìn)行閱讀,并未借閱,這時(shí)系統(tǒng)將無法及時(shí)收集用戶的偏好變化。同理,由于其登錄方式的單一化,系統(tǒng)無法收集其在網(wǎng)站搜索歷史,好友信息,嚴(yán)重制約了高校圖書館推薦系統(tǒng)的信息收集能力,進(jìn)一步影響了讀者的偏好獲取從而使得推薦難以湊效。
在移動(dòng)推薦的發(fā)展下,多數(shù)圖書館可以在移動(dòng)終端為讀者進(jìn)行信息服務(wù)。通過顯示方式采集用戶信息會(huì)影響到用戶的閱讀體驗(yàn),如何利用隱式方式來獲取用戶偏好成為了移動(dòng)終端下圖書推薦的一大難點(diǎn)。
推薦系統(tǒng)中存在冷啟動(dòng)問題,在高校圖書館中應(yīng)用的圖書推薦系統(tǒng)同樣會(huì)出新讀者和新的書目等問題。尤其對于首次使用系統(tǒng)的新生或者教師,系統(tǒng)沒有用戶的信息,無法獲取用戶偏好。新項(xiàng)目問題是指當(dāng)圖書館購入新的書籍一段時(shí)間后才可能有讀者進(jìn)行借閱并對其評級,在使用協(xié)同過濾方式的圖書推薦系統(tǒng)中,對于新用戶和新書籍無法進(jìn)行有效的推薦。如何利用如讀者好友信息,書籍在其它圖書館或者網(wǎng)站的評分來解決冷啟動(dòng)問題值得研究人員的關(guān)注。
在推進(jìn)系統(tǒng)領(lǐng)域中,很少有研究者關(guān)注推薦結(jié)果的解釋性。但有效的推薦結(jié)果解釋性可以讓使用者能了解如何進(jìn)行推薦,可以提高用戶對推薦結(jié)果的信任度,提高用戶的系統(tǒng)忠實(shí)度。如在高校圖書館推薦中,為讀者推薦其導(dǎo)師或者專業(yè)領(lǐng)域中新的知識內(nèi)容,為讀者推薦其好友的閱讀書目等等,讓讀者了解系統(tǒng)推薦的機(jī)制,幫助讀者更好的做出決定,也是推薦系統(tǒng)中的一個(gè)重要研究方向。
多數(shù)推薦系統(tǒng)針對個(gè)人進(jìn)行個(gè)性化推薦,但在一些情況下,尤其在高校圖書選擇方面,對一組人,如一個(gè)導(dǎo)師和學(xué)生組成的團(tuán)體或者教師團(tuán)隊(duì)進(jìn)行圖書推薦。組推薦中需要均衡多用戶偏好,如何處理組內(nèi)用戶的偏好沖突,為一組讀者進(jìn)行有效高質(zhì)量的推薦,是組推薦的重點(diǎn)。目前,在推薦系統(tǒng)中對于組推薦的研究很少,但這一推薦方式在高校圖書館服務(wù)對象的特定情況下卻很有必要。
隨著知識信息時(shí)代的發(fā)展,人們對于知識和文化渴求愈發(fā)強(qiáng)烈。而信息資源的快速增長使得“信息過載”問題越來越嚴(yán)重。這一問題在高校圖書館中顯得更為突出,許多資源長期無人問津。近年來,隨著推薦系統(tǒng)在電子商務(wù)領(lǐng)域的快速發(fā)展,推薦系統(tǒng)引入高校圖書館能有效化解其面臨的困境。利用其館藏豐富的特點(diǎn),為高校學(xué)生和老師進(jìn)行圖書推薦,擔(dān)當(dāng)起促進(jìn)學(xué)術(shù)交流的使命和重任,并為讀者提供個(gè)性化的推薦服務(wù),為讀者創(chuàng)造良好的閱讀體驗(yàn),使圖書館資源得到更充分的利用。因此,高校圖書館推薦具有重要的研究意義和應(yīng)用前景,本文將該領(lǐng)域的研究進(jìn)展和發(fā)展趨勢進(jìn)行分析總結(jié),希望促進(jìn)圖書館推薦領(lǐng)域的研究工作。
[1]黃奇奇,鄧仲華.高校圖書館網(wǎng)絡(luò)信息資源利用現(xiàn)狀及評價(jià)體系研究——以推薦學(xué)術(shù)站點(diǎn)為例[J].圖書館學(xué)研究,2013(22):44-49.
[2]高媛.高校圖書館網(wǎng)絡(luò)信息資源共享現(xiàn)狀與對策探析[J].圖書館工作與研究,2009(12):102-103.
[3]王連喜.一種面向高校圖書館的個(gè)性化圖書推薦系統(tǒng)[J].現(xiàn)代情報(bào),2015,35(12):41-46.
[4]黃曉斌,張海娟.國外數(shù)字圖書館推薦系統(tǒng)評述[J].情報(bào)理論與實(shí)踐,2010,33(08):125-128.
[5]BalabanovicM,Shoham Y.Fab:Content-based,collaborative recommendation[J].Communications ofthe Acm,1997,40(3):66-72.
(責(zé)編:李 園)
G252
B
1008-8431(2017)05-0062-03
2017-08-11
馬東明(1964-),女,山西財(cái)經(jīng)大學(xué)南校區(qū)圖書館副研究館員。