牛翠屏??
關(guān)鍵詞:數(shù)字圖書館;個(gè)性化服務(wù);資源推薦模式
摘要:文章簡述了數(shù)字圖書館個(gè)性化資源推薦服務(wù),探討了數(shù)字圖書館的讀者興趣模型及推薦資源對(duì)象模型的建立,并分析了資源推薦模式,同時(shí)指出了數(shù)字圖書館的資源推薦服務(wù)應(yīng)用存在的問題。
中圖分類號(hào):G250.76文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2017)08-0119-03
數(shù)字圖書館是當(dāng)前社會(huì)信息基礎(chǔ)設(shè)施建設(shè)的重要組成部分,它以知識(shí)資源和信息資源為支撐,為讀者建立集知識(shí)服務(wù)與信息服務(wù)為一體的圖書館環(huán)境,為讀者提供優(yōu)質(zhì)的知識(shí)與信息服務(wù)。數(shù)字圖書館服務(wù)質(zhì)量和資源利用效率的有效提高以個(gè)性化服務(wù)為主要途徑,將讀者作為服務(wù)的中心,一切工作的展開都是為了滿足讀者的個(gè)性化需求,有很強(qiáng)的主動(dòng)性和針對(duì)性,是當(dāng)前我國數(shù)字圖書館主要應(yīng)用的服務(wù)模式。但隨著數(shù)字資源的不斷豐富,讀者個(gè)性化的需求受到了擠壓,圖書館越來越難以滿足讀者對(duì)圖書資源的個(gè)性化需求,如何為讀者提供更好的個(gè)性化服務(wù)成為各圖書館迫切需要解決的問題[1]。為了解決這一問題,圖書館對(duì)推薦技術(shù)進(jìn)行了研究和應(yīng)用,認(rèn)為以推薦技術(shù)為依據(jù)建立的個(gè)性化服務(wù)資源推薦模式能夠更好地適應(yīng)當(dāng)前數(shù)字圖書館的業(yè)務(wù)發(fā)展需求,具有較高的利用價(jià)值。
1 個(gè)性化服務(wù)資源推薦簡述
數(shù)字圖書館個(gè)性化服務(wù)資源推薦是指圖書館對(duì)讀者的閱讀特點(diǎn)、愛好及明顯的個(gè)人資源訪問行為進(jìn)行分析和挖掘,掌握讀者的閱讀興趣與愛好,以及和圖書資源、讀者群之間的關(guān)聯(lián),以便為他們提供更好的信息服務(wù)。圖書館在提供服務(wù)的過程中會(huì)過濾掉與該讀者無關(guān)的信息與資源,只提供和推薦那些與其興趣相關(guān)的信息與資源[2]。讀者興趣模型、資源推薦對(duì)象、推薦算法及讀者四大板塊共同構(gòu)成了數(shù)字圖書館個(gè)性化資源推薦服務(wù)系統(tǒng)(見圖1)。
從圖1可以看出,個(gè)性化資源推薦服務(wù)系統(tǒng)能夠基于資源推薦對(duì)象的特征信息及讀者興趣模型,判定讀者的需求信息并進(jìn)行相關(guān)性匹配;應(yīng)用推薦算法能計(jì)算和篩選與讀者興趣相關(guān)的知識(shí)資源,并向其推薦;而讀者興趣的獲取則是通過掌握讀者的資源訪問行為得到的。
2 讀者興趣模型的建立
為了保證推薦信息的準(zhǔn)確率、有效性和個(gè)性化,個(gè)性化資源推薦服務(wù)系統(tǒng)從讀者那里獲取的信息應(yīng)該是動(dòng)態(tài)和多方面的,并根據(jù)掌握的信息建立興趣模型,以便及時(shí)更新模型中讀者的興趣愛好(見圖2)。興趣模型以從讀者那里獲取的信息為數(shù)據(jù)基礎(chǔ),即個(gè)性化資源推薦服務(wù)系統(tǒng)對(duì)讀者的信息進(jìn)行獲取與記錄,同時(shí)根據(jù)讀者的興趣愛好做出分類,及時(shí)掌握讀者的需求,進(jìn)而生成具有描述功能的文件。
數(shù)字圖書館有三種數(shù)據(jù)類型對(duì)讀者的興趣愛好做出反映:①讀者屬性。該數(shù)據(jù)類型反映的是讀者的一些基本信息,主要是讀者的姓名、年齡、性別、專業(yè)、年級(jí)、院系、興趣等[3]。讀者興趣模型的初始構(gòu)建就是以這些基本信息為依據(jù)的。②業(yè)務(wù)管理系統(tǒng)。數(shù)字圖書館的業(yè)務(wù)管理系統(tǒng)對(duì)讀者的相關(guān)信息進(jìn)行記錄,有讀者的借閱信息、咨詢信息、學(xué)術(shù)成果信息等,這些信息在讀者的閱讀過程中被記錄下來,具有較高的準(zhǔn)確性。③歷史訪問信息。讀者在數(shù)字圖書館的搜索與訪問記錄反映了其閱讀興趣與愛好,數(shù)字圖書館對(duì)讀者的閱讀、下載、瀏覽、檢索等行為進(jìn)行記錄,可以實(shí)時(shí)掌握讀者的行為信息。
顯式、隱式、啟發(fā)式是讀者興趣模型中的三種輸入信息獲取模式,分別是:讀者主動(dòng)提供信息行為、系統(tǒng)跟蹤信息獲取行為、咨詢啟發(fā)讀者興趣并提供相關(guān)資源行為。讀者對(duì)資源的興趣會(huì)隨著時(shí)間的推移而發(fā)生變化,因此興趣模型分短期興趣、長期興趣及儲(chǔ)存記憶[4]。模型建立的對(duì)象既可以是個(gè)體讀者,也可以是群體讀者,即讀者群,是具有相同興趣愛好的讀者所組建的群體性組織。
3 推薦資源對(duì)象模型的建立
在資源推薦服務(wù)系統(tǒng)中會(huì)存在一些基于內(nèi)容和分類的方式對(duì)資源對(duì)象做出描述。非結(jié)構(gòu)化是網(wǎng)絡(luò)資源的一個(gè)特性,這一特性無法對(duì)標(biāo)準(zhǔn)做出統(tǒng)一的描述,因而描述的方式會(huì)采取以內(nèi)容為依據(jù)的從對(duì)象本身抽取信息的方式。資源對(duì)象文本信息的描述和提取是比較完善的,但是描述的對(duì)象常常會(huì)存在文本描述不足或者不具有文本特征現(xiàn)象。數(shù)字圖書館的文獻(xiàn)資源主要有期刊、學(xué)術(shù)論文、學(xué)位論文、專利、報(bào)刊、會(huì)議論文等。這些資源的分類與描述相對(duì)于網(wǎng)絡(luò)資源是比較成型的,著錄和描述的方式一般以MARC或者DC標(biāo)準(zhǔn)為基礎(chǔ),《科圖法》和《中圖法》是其主要使用的分類方法[5]。因此,推薦資源模型的建立可以對(duì)學(xué)科分類的方式進(jìn)行應(yīng)用,使每一個(gè)資源都能夠找到與其對(duì)應(yīng)的學(xué)科分類,并對(duì)應(yīng)讀者興趣模型中的興趣描述。
4 資源推薦模式分析
4.1 內(nèi)容資源推薦模式分析
資源對(duì)象內(nèi)容與讀者興趣相似性的推薦及讀者檢索結(jié)果相似性的推薦是內(nèi)容資源推薦模式的兩個(gè)組成部分。具體來說,是系統(tǒng)自動(dòng)提取并分析與資源對(duì)象相關(guān)的數(shù)據(jù)信息或文檔,并對(duì)讀者興趣模型中的讀者興趣愛好進(jìn)行計(jì)算匹配,然后根據(jù)匹配度的高低將資源向讀者推薦。讀者在數(shù)字圖書館進(jìn)行文獻(xiàn)搜索時(shí)輸入關(guān)鍵詞,會(huì)出現(xiàn)相關(guān)的文獻(xiàn)資源列表,資源推薦系統(tǒng)根據(jù)檢索詞相關(guān)程度從高到低依次排列,為讀者呈現(xiàn)直觀的文獻(xiàn)信息。
4.2 協(xié)同過濾推薦模式分析
個(gè)性化資源推薦服務(wù)系統(tǒng)中使用最廣泛的推薦方法是協(xié)同過濾推薦,這種方法以假設(shè)為前提,即假設(shè)具有相同興趣愛好的讀者會(huì)更容易相遇。協(xié)同過濾推薦模式由讀者的協(xié)同推薦、項(xiàng)目的協(xié)同推薦、模型的協(xié)同推薦三部分構(gòu)成:①讀者的協(xié)同推薦,即一個(gè)讀者選擇的內(nèi)容是基于其他讀者的推薦,而這種推薦需要找到與其有相同興趣愛好的其他讀者,然后對(duì)具有共同興趣的資源進(jìn)行推薦。②項(xiàng)目的協(xié)同推薦,即通過內(nèi)容相似性計(jì)算來取代讀者之間的相似性[6]。個(gè)性化資源推薦服務(wù)系統(tǒng)以所有讀者的資源訪問信息為依據(jù),發(fā)現(xiàn)讀者之間存在的相似點(diǎn),并對(duì)讀者的歷史搜索與偏好數(shù)據(jù)信息進(jìn)行分析,向讀者推薦相似的信息。③模型的協(xié)同推薦,即以讀者在數(shù)字圖書館的資源訪問信息為數(shù)據(jù)基礎(chǔ),為讀者建立一個(gè)有針對(duì)性的讀者興趣愛好模型,對(duì)讀者資源需求的預(yù)測建立模型,根據(jù)讀者的興趣相似性及資源內(nèi)容向讀者推薦資源信息。這種推薦模式的核心是讀者的訪問行為,統(tǒng)計(jì)模型、線性回歸模型、機(jī)器學(xué)習(xí)等是其常用的方法。endprint
4.3 混合模式的資源推薦模式分析
混合模式可以對(duì)多種推薦模式進(jìn)行優(yōu)化組合,揚(yáng)長避短,使圖書館提供的推薦服務(wù)更符合讀者要求。在混合模式中,最常用的也是運(yùn)用效果最好的混合模式,是內(nèi)容推薦和協(xié)同推薦的混合。因此,數(shù)字圖書館個(gè)性化服務(wù)資源推薦模式的應(yīng)用可以對(duì)這一組合進(jìn)行進(jìn)一步的研究與分析,使其發(fā)揮更大的作用。
5 數(shù)字圖書館個(gè)性化服務(wù)資源推薦應(yīng)用中的難點(diǎn)
5.1 對(duì)讀者身份進(jìn)行統(tǒng)一認(rèn)證
數(shù)字圖書館應(yīng)對(duì)讀者進(jìn)行身份統(tǒng)一認(rèn)證,以便更加及時(shí)、有效地獲取讀者的興趣與愛好。但目前數(shù)字圖書館應(yīng)用的服務(wù)系統(tǒng)對(duì)身份的統(tǒng)一認(rèn)證機(jī)制不同,如OPAC系統(tǒng)與資源檢索系統(tǒng)對(duì)讀者身份的驗(yàn)證機(jī)制就不同,致使讀者在資源搜索時(shí)需要頻繁輸入賬戶與密碼,降低了服務(wù)系統(tǒng)的有效性[7]。因此,實(shí)現(xiàn)讀者身份的統(tǒng)一認(rèn)證是數(shù)字圖書館亟待解決的問題。
5.2 讀者個(gè)人信息空間的參與
讀者參與是個(gè)性化推薦服務(wù)系統(tǒng)建立的關(guān)鍵。讀者特征與行為信息的獲取,可以通過各項(xiàng)業(yè)務(wù)的統(tǒng)一身份認(rèn)證、應(yīng)用與數(shù)據(jù)信息的集成獲得。個(gè)人基本信息、文獻(xiàn)收藏信息、資源訪問信息、成果信息等共同組成了讀者的個(gè)人信息空間。讀者的閱讀特征與行為被記錄在個(gè)人信息空間中,是讀者興趣愛好的反映[8]。如何對(duì)讀者的個(gè)人信息與訪問記錄進(jìn)行集成,是數(shù)字圖書館個(gè)性化資源推薦服務(wù)系統(tǒng)建設(shè)的重點(diǎn)內(nèi)容。
5.3 安全保障
圖書館為了更好地向讀者推薦有價(jià)值的資源,打造個(gè)性化資源推薦服務(wù),需要記錄與收集讀者的個(gè)人信息,但讀者因擔(dān)心信息泄漏而不愿提供。因此,數(shù)字圖書館個(gè)性化服務(wù)資源推薦模式還需要進(jìn)一步完善,加強(qiáng)安全保障。
6 結(jié)語
個(gè)性化服務(wù)資源推薦模式具有很高的實(shí)用價(jià)值,能夠?yàn)樽x者提供優(yōu)質(zhì)的服務(wù)和個(gè)性化定制服務(wù),能滿足不同讀者對(duì)閱讀的需求。但數(shù)字圖書館個(gè)性化服務(wù)資源推薦模式還存在一些問題,在未來的發(fā)展中迫切需要解決這些問題,為讀者提供更好的服務(wù)。
參考文獻(xiàn):
[1]吳志強(qiáng),王義翠,馬慧娟.協(xié)同信息推薦:一種數(shù)字圖書館個(gè)性化信息服務(wù)新模式[J].圖書館,2011(1):45-47.
[2]李詠梅.數(shù)字圖書館個(gè)性化信息服務(wù)研究[J].現(xiàn)代情報(bào),2010(3):51-54.
[3]龔光麗,李昌彩.數(shù)字圖書館個(gè)性化信息服務(wù)研究[J].長江大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2010(5):109-111.
[4]宋小錄.數(shù)字圖書館個(gè)性化信息服務(wù)研究[J].辦公室業(yè)務(wù),2012(1):35-36.
[5]馮新民.高校移動(dòng)數(shù)字圖書館個(gè)性化服務(wù)研究[J].圖書館論壇,2013(5):91-94.
[6]余金昌.基于知識(shí)挖掘的高校數(shù)字圖書館個(gè)性化服務(wù)模式[J].中國電化教育,2010(11):74-77.
[7]鄭偉,田野,奉國和.國內(nèi)外高校數(shù)字圖書館個(gè)性化信息服務(wù)研究[J].河北北方學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2012(6):66-69.
[8]姜雷,趙功群.數(shù)字圖書館系統(tǒng)中的個(gè)性化服務(wù)模型[J].圖書館學(xué)刊,2011(9):66-68.
(編校:徐黎娟)endprint