牛翠屏
關(guān)鍵詞:數(shù)字圖書館;個性化服務(wù);資源推薦模式
摘要:文章簡述了數(shù)字圖書館個性化資源推薦服務(wù),探討了數(shù)字圖書館的讀者興趣模型及推薦資源對象模型的建立,并分析了資源推薦模式,同時指出了數(shù)字圖書館的資源推薦服務(wù)應(yīng)用存在的問題。
中圖分類號:G250.76文獻標(biāo)識碼:A文章編號:1003-1588(2017)08-0119-03
數(shù)字圖書館是當(dāng)前社會信息基礎(chǔ)設(shè)施建設(shè)的重要組成部分,它以知識資源和信息資源為支撐,為讀者建立集知識服務(wù)與信息服務(wù)為一體的圖書館環(huán)境,為讀者提供優(yōu)質(zhì)的知識與信息服務(wù)。數(shù)字圖書館服務(wù)質(zhì)量和資源利用效率的有效提高以個性化服務(wù)為主要途徑,將讀者作為服務(wù)的中心,一切工作的展開都是為了滿足讀者的個性化需求,有很強的主動性和針對性,是當(dāng)前我國數(shù)字圖書館主要應(yīng)用的服務(wù)模式。但隨著數(shù)字資源的不斷豐富,讀者個性化的需求受到了擠壓,圖書館越來越難以滿足讀者對圖書資源的個性化需求,如何為讀者提供更好的個性化服務(wù)成為各圖書館迫切需要解決的問題[1]。為了解決這一問題,圖書館對推薦技術(shù)進行了研究和應(yīng)用,認(rèn)為以推薦技術(shù)為依據(jù)建立的個性化服務(wù)資源推薦模式能夠更好地適應(yīng)當(dāng)前數(shù)字圖書館的業(yè)務(wù)發(fā)展需求,具有較高的利用價值。
1 個性化服務(wù)資源推薦簡述
數(shù)字圖書館個性化服務(wù)資源推薦是指圖書館對讀者的閱讀特點、愛好及明顯的個人資源訪問行為進行分析和挖掘,掌握讀者的閱讀興趣與愛好,以及和圖書資源、讀者群之間的關(guān)聯(lián),以便為他們提供更好的信息服務(wù)。圖書館在提供服務(wù)的過程中會過濾掉與該讀者無關(guān)的信息與資源,只提供和推薦那些與其興趣相關(guān)的信息與資源[2]。讀者興趣模型、資源推薦對象、推薦算法及讀者四大板塊共同構(gòu)成了數(shù)字圖書館個性化資源推薦服務(wù)系統(tǒng)(見圖1)。
從圖1可以看出,個性化資源推薦服務(wù)系統(tǒng)能夠基于資源推薦對象的特征信息及讀者興趣模型,判定讀者的需求信息并進行相關(guān)性匹配;應(yīng)用推薦算法能計算和篩選與讀者興趣相關(guān)的知識資源,并向其推薦;而讀者興趣的獲取則是通過掌握讀者的資源訪問行為得到的。
2 讀者興趣模型的建立
為了保證推薦信息的準(zhǔn)確率、有效性和個性化,個性化資源推薦服務(wù)系統(tǒng)從讀者那里獲取的信息應(yīng)該是動態(tài)和多方面的,并根據(jù)掌握的信息建立興趣模型,以便及時更新模型中讀者的興趣愛好(見圖2)。興趣模型以從讀者那里獲取的信息為數(shù)據(jù)基礎(chǔ),即個性化資源推薦服務(wù)系統(tǒng)對讀者的信息進行獲取與記錄,同時根據(jù)讀者的興趣愛好做出分類,及時掌握讀者的需求,進而生成具有描述功能的文件。
數(shù)字圖書館有三種數(shù)據(jù)類型對讀者的興趣愛好做出反映:①讀者屬性。該數(shù)據(jù)類型反映的是讀者的一些基本信息,主要是讀者的姓名、年齡、性別、專業(yè)、年級、院系、興趣等[3]。讀者興趣模型的初始構(gòu)建就是以這些基本信息為依據(jù)的。②業(yè)務(wù)管理系統(tǒng)。數(shù)字圖書館的業(yè)務(wù)管理系統(tǒng)對讀者的相關(guān)信息進行記錄,有讀者的借閱信息、咨詢信息、學(xué)術(shù)成果信息等,這些信息在讀者的閱讀過程中被記錄下來,具有較高的準(zhǔn)確性。③歷史訪問信息。讀者在數(shù)字圖書館的搜索與訪問記錄反映了其閱讀興趣與愛好,數(shù)字圖書館對讀者的閱讀、下載、瀏覽、檢索等行為進行記錄,可以實時掌握讀者的行為信息。
顯式、隱式、啟發(fā)式是讀者興趣模型中的三種輸入信息獲取模式,分別是:讀者主動提供信息行為、系統(tǒng)跟蹤信息獲取行為、咨詢啟發(fā)讀者興趣并提供相關(guān)資源行為。讀者對資源的興趣會隨著時間的推移而發(fā)生變化,因此興趣模型分短期興趣、長期興趣及儲存記憶[4]。模型建立的對象既可以是個體讀者,也可以是群體讀者,即讀者群,是具有相同興趣愛好的讀者所組建的群體性組織。
3 推薦資源對象模型的建立
在資源推薦服務(wù)系統(tǒng)中會存在一些基于內(nèi)容和分類的方式對資源對象做出描述。非結(jié)構(gòu)化是網(wǎng)絡(luò)資源的一個特性,這一特性無法對標(biāo)準(zhǔn)做出統(tǒng)一的描述,因而描述的方式會采取以內(nèi)容為依據(jù)的從對象本身抽取信息的方式。資源對象文本信息的描述和提取是比較完善的,但是描述的對象常常會存在文本描述不足或者不具有文本特征現(xiàn)象。數(shù)字圖書館的文獻資源主要有期刊、學(xué)術(shù)論文、學(xué)位論文、專利、報刊、會議論文等。這些資源的分類與描述相對于網(wǎng)絡(luò)資源是比較成型的,著錄和描述的方式一般以MARC或者DC標(biāo)準(zhǔn)為基礎(chǔ),《科圖法》和《中圖法》是其主要使用的分類方法[5]。因此,推薦資源模型的建立可以對學(xué)科分類的方式進行應(yīng)用,使每一個資源都能夠找到與其對應(yīng)的學(xué)科分類,并對應(yīng)讀者興趣模型中的興趣描述。
4 資源推薦模式分析
4.1 內(nèi)容資源推薦模式分析
資源對象內(nèi)容與讀者興趣相似性的推薦及讀者檢索結(jié)果相似性的推薦是內(nèi)容資源推薦模式的兩個組成部分。具體來說,是系統(tǒng)自動提取并分析與資源對象相關(guān)的數(shù)據(jù)信息或文檔,并對讀者興趣模型中的讀者興趣愛好進行計算匹配,然后根據(jù)匹配度的高低將資源向讀者推薦。讀者在數(shù)字圖書館進行文獻搜索時輸入關(guān)鍵詞,會出現(xiàn)相關(guān)的文獻資源列表,資源推薦系統(tǒng)根據(jù)檢索詞相關(guān)程度從高到低依次排列,為讀者呈現(xiàn)直觀的文獻信息。
4.2 協(xié)同過濾推薦模式分析
個性化資源推薦服務(wù)系統(tǒng)中使用最廣泛的推薦方法是協(xié)同過濾推薦,這種方法以假設(shè)為前提,即假設(shè)具有相同興趣愛好的讀者會更容易相遇。協(xié)同過濾推薦模式由讀者的協(xié)同推薦、項目的協(xié)同推薦、模型的協(xié)同推薦三部分構(gòu)成:①讀者的協(xié)同推薦,即一個讀者選擇的內(nèi)容是基于其他讀者的推薦,而這種推薦需要找到與其有相同興趣愛好的其他讀者,然后對具有共同興趣的資源進行推薦。②項目的協(xié)同推薦,即通過內(nèi)容相似性計算來取代讀者之間的相似性[6]。個性化資源推薦服務(wù)系統(tǒng)以所有讀者的資源訪問信息為依據(jù),發(fā)現(xiàn)讀者之間存在的相似點,并對讀者的歷史搜索與偏好數(shù)據(jù)信息進行分析,向讀者推薦相似的信息。③模型的協(xié)同推薦,即以讀者在數(shù)字圖書館的資源訪問信息為數(shù)據(jù)基礎(chǔ),為讀者建立一個有針對性的讀者興趣愛好模型,對讀者資源需求的預(yù)測建立模型,根據(jù)讀者的興趣相似性及資源內(nèi)容向讀者推薦資源信息。這種推薦模式的核心是讀者的訪問行為,統(tǒng)計模型、線性回歸模型、機器學(xué)習(xí)等是其常用的方法。