●周玲元,段隆振
(1.南昌大學信息工程學院,南昌330063;2.南昌航空大學經(jīng)濟管理學院,南昌330063)
數(shù)字圖書館聯(lián)盟中基于情境感知的個性化推薦服務研究
●周玲元1,2,段隆振1
(1.南昌大學信息工程學院,南昌330063;2.南昌航空大學經(jīng)濟管理學院,南昌330063)
個性化推薦;情境感知;數(shù)字圖書館聯(lián)盟;本體
數(shù)字圖書館聯(lián)盟情境感知服務是圖書館在數(shù)字化、移動網(wǎng)絡環(huán)境下面臨的一個嶄新課題。本文對情境感知推薦進行了系統(tǒng)研究,探討了移動環(huán)境下情境感知計算流程,給出了基于本體的用戶情境偏好模型,在此基礎上提出了數(shù)字圖書館聯(lián)盟情境感知推薦模型,并對功能模塊進行了闡述,為數(shù)字圖書館聯(lián)盟個性化推薦應用提供了理論參考。
數(shù)字圖書館聯(lián)盟是對傳統(tǒng)圖書館聯(lián)盟功能的進一步繼承與深化,[1]以實現(xiàn)資源共享、互惠互利為目的而組織起來的、受共同認可的協(xié)議和合同制約的圖書館聯(lián)合體。其目的是通過數(shù)字圖書館聯(lián)盟門戶網(wǎng)站的形式將分布在不同信息源的內(nèi)容整合在一起集中實現(xiàn)統(tǒng)一檢索、推送服務等網(wǎng)絡服務。[2,3]
隨著數(shù)字資源的指數(shù)級增長,出現(xiàn)了“信息超載”問題,因此,如何集成數(shù)字圖書館聯(lián)盟的服務,為不同用戶提供個性化服務,是當前數(shù)字圖書館聯(lián)盟研究的熱點問題。焦玉英[4]等提出了基于用戶個性化需求的數(shù)據(jù)圖書館集成模型;牛亞真、祝忠明[5]對個性化服務中跨系統(tǒng)的用戶建模方法進行了系統(tǒng)研究,總結(jié)歸納跨系統(tǒng)的用戶建模方法;潘家武[6]等提出基于領(lǐng)域本體的數(shù)字圖書館跨系統(tǒng)用戶模型。沈嶸[7]提出數(shù)字圖書館聯(lián)盟的技術(shù)實現(xiàn)方案,利用企業(yè)技術(shù)聯(lián)盟引入現(xiàn)代圖書館數(shù)字化建設中,解決數(shù)字圖書館聯(lián)盟的信息資源共享問題。周明明[8]系統(tǒng)分析了“深圳文獻港”數(shù)字圖書館聯(lián)盟的數(shù)字門戶,對區(qū)域數(shù)字圖書館聯(lián)盟的門戶功能進行研究。為提高個性化服務的準確性,胡慕海[9]、袁靜[10]、潘旭偉[11,12]等分別提出基于情境感知的自適應個性化推薦服務方案。
目前對數(shù)字圖書館聯(lián)盟的研究主要集中在兩方面:一是數(shù)字圖書館聯(lián)盟機制構(gòu)建,主要研究對象為數(shù)字圖書館聯(lián)盟機制、組織結(jié)構(gòu)及功能、業(yè)務范圍和版權(quán)保護等;二是數(shù)字圖書館個性化服務技術(shù)改進方面,主要研究對象為單個數(shù)字圖書館的個性化搜索和個性化推薦技術(shù)。對中國知網(wǎng)、萬方論文檢索發(fā)現(xiàn)國內(nèi)還沒有學者對數(shù)字圖書館聯(lián)盟中的情境感知推薦服務進行研究。鑒于以上情況,筆者認為當前的數(shù)字圖書館聯(lián)盟缺乏有效的情境感知能力,從而無法保證個性化服務質(zhì)量。本文系統(tǒng)研究了情境感知及個性化推薦技術(shù),利用語義web描述語言OWL用戶情境偏好本體模型,在此基礎上給出了面向數(shù)字圖書館聯(lián)盟網(wǎng)絡門戶的情境感知推薦服務機制,并對推薦機制的核心模塊進行了詳細論述。
2.1 情境感知
在數(shù)字圖書館推薦系統(tǒng)領(lǐng)域,人們往往只關(guān)注“用戶—項目”之間的關(guān)聯(lián)關(guān)系,而較少考慮它們所處的情境(如時間、位置、周圍人員、情緒、活動狀態(tài)、網(wǎng)絡條件等)。但是,僅僅依靠“用戶—項目”二元關(guān)系并不能生成有效推薦。[13]例如,有的用戶喜歡在“早上”而不是“中午”被推薦合適的新聞信息,有的用戶在“心情愉悅”時更愿意被推薦一些輕松的雜志。情境感知推薦系統(tǒng)通過將情境信息引入推薦系統(tǒng),以進一步提高推薦精確度和用戶滿意度,兼具“普適計算”和“個性化”兩種優(yōu)勢,逐漸成為推薦系統(tǒng)研究領(lǐng)域最為活躍的分支之一,同時對于提高數(shù)字圖書館聯(lián)盟的服務質(zhì)量具有重要的理論及社會價值。
情境感知計算研究內(nèi)容主要有:(1)情境獲取,處于系統(tǒng)的數(shù)據(jù)收集階段,主要方式有顯示獲取、隱式獲取和推理獲取三種;(2)情境建模,形式化表示情境模型,主要方法有面向?qū)ο竽P汀D模型、標記語言模型和本體模型;(3)情境用戶偏好提取,將情境信息引入用戶偏好建模,主要分為定性分析、定量分析兩大類提取技術(shù)。
2.2 個性化推薦
為有效地解決“信息超載”問題,人們提出“個性化服務”的概念。推薦系統(tǒng)作為個性化服務研究領(lǐng)域的重要分支,幫助用戶從大量數(shù)據(jù)中發(fā)現(xiàn)其可能感興趣的項目,并生成個性化推薦以滿足個性化需求。其中應用最為成功的是協(xié)同過濾推薦技術(shù),但是該推薦技術(shù)依然存在著原始數(shù)據(jù)稀疏性、實時性、精確性等問題,特別是在移動網(wǎng)絡情況下,用戶所處的環(huán)境(如網(wǎng)絡狀況、位置等)易變,而這些因素影響用戶需求的表達,使得上述問題更加嚴重。為此,國內(nèi)外相關(guān)學者及研究機構(gòu)對情境感知推薦系統(tǒng)理論、方法及應用展開了深入研究工作。相對而言,目前我國主要關(guān)注的還是非情境化的推薦系統(tǒng)研究。
隨著3G網(wǎng)絡的發(fā)展,移動商務越來越普及,基于情境感知技術(shù)的移動商務在時間和位置上擁有更高的自由度。情景感知推薦服務是未來移動信息服務的一個方向,它是不同產(chǎn)業(yè)融合的產(chǎn)物,能夠有效的滿足人們的個性化需求,將使人們的生活更加便利。因此移動環(huán)境下個性化推薦中融入情境感知技術(shù)的研究具有現(xiàn)實的理論意義和應用價值。
3.1 跨系統(tǒng)用戶情境興趣建模
考慮到用戶偏好和需求會隨著時間、情境發(fā)生變化,本文將用戶情境劃分為:用戶情境、時間情境、設備情境和數(shù)字圖書館情境。其中,用戶情境包括用戶的個人信息、興趣偏好等,時間情境包括用戶登錄退出系統(tǒng)的時間、數(shù)據(jù)停留等,設備情境包括用戶終端顯示設備、網(wǎng)絡狀況等,數(shù)字圖書館情境為描述系統(tǒng)任務對應的領(lǐng)域本體概念和數(shù)字圖書館聯(lián)盟各館情況數(shù)據(jù)。本體與情境之間的聯(lián)系用元組H={O,C,R}來表示,其中,O表示本體的集合,C表示情境的集合,R表示本體與情境信息之間的關(guān)系。本體集合O={O1, O2,O3…},其中O1,O2,O3…等表示本體。情境集合C={C1,C2,C3…},其中C1,C2,C3…等表示情境信息。關(guān)系集合R={r1,r2,r3…},其中r1,r2,r3…表示情境信息直接的關(guān)系。在用戶使用數(shù)字圖書館聯(lián)盟門戶的過程中,所需感知的用戶信息主要包括登錄、退出系統(tǒng)的時間、訪問某場景的次數(shù)及在聯(lián)盟系統(tǒng)上駐留的時間等。下面以此為例,具體說明如何用本體來表示情境信息。具體程序段如下:
上述程序段中,OWL描述為用戶對數(shù)字圖書館聯(lián)盟門戶的訪問情境記錄,本文標記為一個本體類ⅤisitSZTSGLMSystem,它的屬性描述了用戶訪問數(shù)字圖書館聯(lián)盟門戶過程中感知的情境信息,其中一階謂詞邏輯是情境信息的形式化表示,上述程序中用情境實例的方式表述一階謂詞邏輯形式。同時對數(shù)字圖書館的資源進行科學組織,建立數(shù)字資源領(lǐng)域本體,在此基礎上構(gòu)建用戶偏好模型的空間向量表示。本文應用文獻辦法構(gòu)建用戶興趣模型,[14]表示為U={(,),(,),…,(,)};表達式中c為數(shù)字圖書館中數(shù)字資源領(lǐng)域本體的概念單元,w為權(quán)重,表示用戶對特征項C的興趣程度,對于用戶的n個興趣,都有相應的權(quán)重與之對應。為了減少系統(tǒng)在計算上的開銷,本文中選取m個權(quán)重較大的特征項組成特征向量表示用戶的興趣模型,如U={(,),(,),…,(,)}。
為實現(xiàn)跨系統(tǒng)的用戶模型,本文提出結(jié)合數(shù)字資源領(lǐng)域本體的空間向量偏好模型表示方法,建模過程包括用戶情境偏好概念的生成和用戶興趣度的計算,用戶偏好模型中權(quán)重越大表明用戶興趣度越大。在數(shù)字圖書館聯(lián)盟系統(tǒng)中,用戶模型的構(gòu)建步驟如下:(1)感知用戶情境以及瀏覽行為,獲取用戶建模的數(shù)據(jù);(2)參考數(shù)字圖書館聯(lián)盟系統(tǒng)的領(lǐng)域本體,從用戶訪問的情境中提取用戶興趣特征項,即用戶興趣概念;(3)通過數(shù)字資源與興趣概念的語義匹配算法計算用戶模型中概念權(quán)重。
3.2 數(shù)字圖書館聯(lián)盟情境感知推薦模型
數(shù)字圖書館聯(lián)盟情境感知推薦模型不僅需要實現(xiàn)用戶的無縫跨館訪問需求,而且需要滿足移動用戶動態(tài)情境環(huán)境下推薦服務實時性、準確性需求。推薦模型完成一個用戶的個性化需求的大致流程為:用戶情境知識獲取、用戶情境偏好提取、數(shù)字資源本體構(gòu)建、用戶情境偏好與數(shù)字資源匹配、發(fā)送檢索結(jié)果,更新用戶情境模型等任務。因此本文將數(shù)字圖書館聯(lián)盟情境感知推薦模型分為五個模塊:用戶情境信息的獲取與更新合成模塊、數(shù)字資源本體構(gòu)建模塊、用戶情境偏好模型構(gòu)建模塊、數(shù)字信息語義匹配模塊、基于情境感知的數(shù)字圖書館聯(lián)盟推薦服務模塊(如圖示)。
(1)用戶情境信息的獲取與更新合成。情境信息獲取模塊負責從分布廣泛的傳感器、工作流引擎、3G手機等終端設備中采集原始情境并進行初步處理,使情境感知與實際使用相分離,該模塊的主要功能有情境的建模、過濾、推斷和存儲,其目標是通過對原始情境進行過濾、推斷后得到各應用所需的高層情境。
(2)數(shù)字資源本體構(gòu)建。根據(jù)數(shù)字圖書館聯(lián)盟實際使用需要,構(gòu)建數(shù)字資源本體,它分為兩層:上層本體和數(shù)字資源領(lǐng)域本體。[15]上層本體有情境信息涉及的各種實體概念抽象而成,這些概念還可以各自細化成子類別;領(lǐng)域本體包含數(shù)字圖書館聯(lián)盟應用中數(shù)字資源領(lǐng)域的具體子類(圖書類別、出版社、作者等)。
圖數(shù)字圖書館聯(lián)盟情境感知推薦模型
(3)用戶情境偏好模型。上文3.1節(jié)重點介紹了如果構(gòu)建情境偏好模型,主要是對捕獲的情境信息進行分析并根據(jù)主題內(nèi)容進行分類,利用余弦相似度公式計算情境信息與領(lǐng)域本體中概念權(quán)重,權(quán)重越高表明用戶興趣越大,以產(chǎn)生模型實例進而描述用戶情境偏好。
(4)數(shù)字信息語義匹配模塊。該模塊通過匹配算法確定數(shù)字資源與特定情境下用戶偏好之間的匹配相似度,算法過程首先是將數(shù)字資源領(lǐng)域本體和用戶情境偏好本體中的概念與實例都映射到通用本體概念結(jié)構(gòu)樹中,然后在擴展的本體概念間計算兩者的匹配相似度,進而得到基于情境感知的個性化數(shù)字資源匹配結(jié)果集。
(5)數(shù)字資源情境感知推薦。結(jié)合用戶情境模型對數(shù)字信息語義匹配模塊產(chǎn)生的結(jié)果集進行重新排序等個性化處理操作,推薦給用戶以及具有相同或相似情境需求的其他用戶,實現(xiàn)用戶之間的協(xié)同過濾推薦。同時根據(jù)用戶的反饋及時更新情境模型,實現(xiàn)下一輪的個性化推薦。
[1]李富玲,盧振波.數(shù)字圖書館聯(lián)盟研究[J].大學圖書館學報,2005(2):11-15.
[2]陳定權(quán),等.數(shù)字圖書館門戶的個性化[J].新世紀圖書館,2009(2):30-32.
[3]ShiriA,Chase-KruszewskiS.Knowledge organization systems in North American digital library collections[J].Program:Electronic Library andⅠnformation Systems,2009,43(2):121-139.
[4]焦玉英,袁靜.基于情景模型的數(shù)字圖書館個性化服務研究[J].中國圖書館學報,2008(6):58-63.
[5]牛亞真,祝忠明.個性化服務中跨系統(tǒng)用戶建模方法研究綜述[J].現(xiàn)代圖書情報技術(shù),2012(5):1-6.
[6]潘家武.基于領(lǐng)域本體的數(shù)字圖書館動態(tài)用戶興趣模型的構(gòu)建[J].圖書情報工作,2010(8):64-67.
[7]沈嶸.技術(shù)聯(lián)盟:高校圖書館數(shù)字化建設的新方向[J].圖書情報工作,2010(5):71-74.
[8]周明明.區(qū)域數(shù)字圖書館聯(lián)盟的數(shù)字門戶構(gòu)建[J].大學圖書館學報,2010(4):64-67.
[9]胡慕海,等.面向移動數(shù)字圖書館的情境敏感型知識推薦研究[J].計算機科學,2011(8):92-95.
[10]袁靜,焦玉英.基于情景信息的學習資源個性化推薦[J].情報理論與實踐,2009(7):116-119.
[11]潘旭偉,等.自適應個性化信息服務:基于情境感知和本體的方法[J].中國圖書館學報2009(6):41-48.
[12]周莉,等.情境感知的電子商務個性化商品信息服務[J].圖書情報工作,2011(10):130-134,29.
[13]王立才,等.情境感知推薦系統(tǒng)[J].軟件學報,2012,23(1):1-20.
[14]陳國棟,等.基于情境感知的人體經(jīng)絡個性化信息服務研究[J].電視技術(shù),2012(13):78-82.
[15]嚴雋薇,等.基于本體用戶興趣模型的個性化推薦算法[J].計算機集成制造系統(tǒng),2010(6):2757-2782.
G250.76;G252.62
A
1005-8214(2014)07-0067-03
周玲元(1982-),男,博士研究生,南昌大學信息工程學院講師,研究方向:信息管理與信息系統(tǒng);段隆振(1961-),男,教授,南昌航空大學經(jīng)濟管理學院博導,研究方向:數(shù)據(jù)挖掘與知識發(fā)現(xiàn)。
2013-06-25
[責任編輯]邵晉蓉
本文系江西省社會科學規(guī)劃課題“手機圖書館情境感知服務研究”(項目編號:13TQ16),江西省藝術(shù)科學規(guī)劃項目“基于網(wǎng)格資源匹配的數(shù)字圖書館個性化推薦服務研究——以南昌市高校為例”(項目編號:DB201209393)的研究成果。