武慧娟 孫鴻飛 金永昌
摘要:[目的/意義]在社會化標注系統(tǒng)自組織運行的基礎上,構建個性化信息推薦的多維度融合與優(yōu)化模型.進而在大數據環(huán)境下.為用戶提供精準的個性化信息推薦服務.從而進一步豐富個性化信息推薦的理論體系以及拓展個性化信息推薦的研究方法。[方法/過程]首先,對每一種個性化信息推薦方法的優(yōu)點和不足進行深入分析;然后,將基于圖論(社會網絡關系)、基于協(xié)同過濾以及基于內容(主題)3種個性化信息推薦方法進行多維度深度融合,構建個性化信息推薦多維度融合模型:最后,對社會化標注系統(tǒng)中個性化信息推薦多維度融合模型進行優(yōu)化,從而解決個性化推薦過程中用戶“冷啟動”、數據稀疏性和用戶偏好漂移等問題。[結果/結論1通過綜合考慮現有的基于圖論(社會網絡關系)、基于協(xié)同過濾以及基于內容(主題)的個性化信息推薦方法各自的貢獻和不足,實現3種方法之間的多維度深度融合,并結合心理認知、用戶情境以及時間、空間等優(yōu)化因素,最終構建出社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型。
關鍵詞:個性化信息推薦;社會化標注;多維度融合;優(yōu)化模型
DOl:10.3969/j.issn.1008-0821.2019.01.005
[中圖分類號]G203;G252 [文獻標識碼]A [文章編號]1008-0821(2019)01-0037-06
社會化標注系統(tǒng)是一種由它組織向自組織漸進漸變的復雜系統(tǒng),其內部的信息組織并不是由外部力量直接安排的結果,而是在其內部規(guī)律支配下的自身演進發(fā)展的結果。因此,在遵循社會化標注系統(tǒng)自組織運行的基礎上,構建個性化信息推薦多維度融合模型,將目前現有的個性化信息推薦方法進行融合與優(yōu)化,從而發(fā)揮每種方法的優(yōu)點,回避它們的缺點,進而實現在大數據環(huán)境下,為用戶提供精準的個性化信息推薦服務。
開展社會標注系統(tǒng)中個性化信息推薦的研究具有十分重要的理論價值和應用價值,具體地主要體現在兩個方面:第一,從各類社會化標注系統(tǒng)的應用平臺角度出發(fā),機構可以掌握用戶行為和用戶偏好的特點,能夠從宏觀、中觀和微觀三個層次逐層向用戶推薦個性化的信息,從而為政府部門、圖書館等信息服務機構更好地為用戶提供個性化信息服務起到積極的理論與實踐指導意義。第二,從社會化標注系統(tǒng)的使用用戶角度出發(fā),面對海量數據,用戶可以更有效地享用自己需求和偏好的信息資源以及發(fā)現與自己需求和偏好相同的其他用戶,從而為更有效率地使用網絡信息平臺起到積極的理論與實踐指導意義。
1國內外相關研究現狀及研究趨勢
“社會化標注系統(tǒng)”最早引起國外學者的關注是在1999年,國內是在2008年?!皞€性化推薦”則是在20世紀90年代提出的這一概念??偨Y國內外關于社會化標注系統(tǒng)中個性化信息推薦方法,主要包括:基于內容(主題)的個性化推薦、基于協(xié)同過濾的個性化推薦、基于圖論(社會網絡關系)的個性化推薦以及其他個性化推薦方法(包括:基于知識的個性化推薦、基于關聯(lián)規(guī)則的個性化推薦、混合推薦等)。
1.1基于內容(主題)的個性化信息推薦
基于內容的個性化信息推薦是指通過對用戶的歷史行為信息進行分析,提取用戶需求和偏好特征并且構建相應的用戶需求和偏好模型,由此向用戶推薦與其需求和偏好模型相匹配的資源。該推薦方法的核心在于利用用戶需求和偏好與目標資源的相似性來過濾信息,進而實現個性化信息推薦?;趦热莸膫€性化信息推薦的不足之處在于雖然能夠較為準確地獲取用戶需求和偏好,但由于是根據用戶的歷史行為信息實現用戶需求和偏好的提取,而用戶的需求和偏好會隨著時間的推移發(fā)生變化和漂移,因此該推薦方法很難發(fā)現用戶潛在的需求和偏好以及難以實現所推薦資源的多樣性。
基于主題的個性化信息推薦是指從社會化標注系統(tǒng)的語義角度對信息資源進行深度挖掘,并且在此基礎之上再進行用戶需求和偏好和目標資源之間的相似性判斷,從而使得所推薦資源更加符合用戶的個性化需求和偏好?;谥黝}的個性化信息推薦的不足之處在于由于該推薦方法需要機器學習各種精確的數學匹配算法,以及需要機器分析語義的概念,從低維主題到高維主題進行用戶需求和偏好與目標資源之間的相似性檢索和匹配,因此為了實現更有效地從海量數據中進行相似性檢索和匹配,計算過程需要花費一定的時間才能夠挖掘出有價值的個性化信息。
1.2基于協(xié)同過濾的個性化信息推薦
基于協(xié)同過濾的個性化信息推薦是指根據具有相似興趣的用戶的歷史行為信息(例如以往的瀏覽記錄等)來預測目標用戶未來可能的需求和偏好,從而為之推薦相應的資源。類似地,用戶對于相似標簽的需求和偏好程度也在一定程度上反映了用戶之間的相似度??梢?,基于協(xié)同過濾的個性化信息推薦包括基于用戶的協(xié)同過濾方法和基于資源的協(xié)同過濾方法。
基于協(xié)同過濾的個性化信息推薦的不足之處在于以用戶過去的信息行為來計算相似度。因此需要大量的歷史數據才能較好地衡量相似性以及挖掘出用戶潛在的需求和偏好。同時,在海量數據的情況下計算相似度也是非常耗費時間的。此外,很多在線用戶的信息行為并不十分明顯(例如瀏覽過程中的關注和收藏行為等),甚至是“冷啟動”,從而導致初始推薦質量較低、可擴展性較差等問題出現,因此如何準確判斷這一類用戶的信息行為還是一個研究難題。
1.3基于圖論(社會網絡關系)的個性化信息推薦
由于社會化標注系統(tǒng)是一個復雜網絡,所以許多學者利用圖論的相關理論來描述和刻畫標簽,分別使用了3部分圖、超圖和社會網絡分析等方法來描述社會化標注系統(tǒng)中的各種組成要素。特別是隨著社會網絡分析理論和方法的發(fā)展,從社會網絡的角度分析社會化標注系統(tǒng)的網絡結構,對其中的資源、標簽、用戶三者各自的網絡結構進行數據挖掘。
基于圖論(社會網絡關系)的個性化信息推薦采用向量來表示用戶—資源、資源—標簽、用戶—標簽兩兩之間的關系,尤其是從社會網絡分析的角度分析社會化標注系統(tǒng)的網絡結構,分析用戶所在的群體特征,進行群體用戶行為的分析等。但是,其不足之處在于基于圖論(社會網絡關系)的個性化信息推薦是從宏觀的角度來劃分用戶群體,而對于每一個具體用戶行為的微觀分析略顯不足。
1.4其他個性化信息推薦
其他個性化信息推薦還包括基于知識的個性化推薦、基于關聯(lián)規(guī)則的個性化推薦以及混合推薦等等。其中,基于知識的個性化信息推薦是指利用特定領域的知識或規(guī)則進行推理,不是通過挖掘用戶的需求和偏好,而是通過用戶知識和資源知識實現個性化信息推薦;其主要缺點在于特定領域的知識或規(guī)則難以獲得而且屬于靜態(tài)推薦?;陉P聯(lián)規(guī)則的個性化信息推薦是指利用資源之間的某種關聯(lián)規(guī)則,通過數據挖掘技術挖掘出用戶已有資源與目標資源之間的相關性,從而實現個性化信息推薦;其主要缺點在于存在數據稀疏性以及用戶“冷啟動”等問題。
綜上所述,每一種個性化信息推薦方法都有其優(yōu)點和不足之處,因此如何選取每種方法的優(yōu)點,進行相互融合與補充,從而規(guī)避它們的缺點,實現更加精準的個性化信息推薦,就成為當前個性化信息推薦領域亟待解決的重要問題。
2社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的研究框架
本文在利用自組織理論深度挖掘社會化標注系統(tǒng)內部演化機理和個性化信息推薦機理的基礎上,多維度融合基于內容(主題)、基于協(xié)同過濾以及基于圖論(社會網絡關系)3種個性化信息推薦方法的優(yōu)點,構建社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型,以期解決社會化標注系統(tǒng)中個性化信息推薦的過程中有關用戶“冷啟動”、數據稀疏以及用戶偏好漂移等問題,最終實現更加精準的個性化信息推薦。
具體地說,開展社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型研究主要解決以下幾個關鍵問題:
1)在用戶沒有留下任何歷史記錄的情況下,個性化信息推薦多維度融合模型如何實現精準的信息推薦,即如何解決系統(tǒng)中用戶“冷啟動”問題。
2)隨著時間的推移,用戶的需求和偏好會發(fā)生漂移現象,個性化信息推薦多維度融合模型如何適應用戶的需求和偏好漂移現象,進而實現用戶的需求和偏好的動態(tài)跟蹤與信息推薦。
3)從現有的調研數據分析,目前的社會化標注系統(tǒng)中的標簽數據呈現出明顯的冪律分布,即大量的標簽用戶很少使用,而少量的標簽受到大量用戶的頻繁使用,同時用戶添加標簽的積極性并不高,這便產生了系統(tǒng)中數據的稀疏性問題。在這種情況下,個性化信息推薦多維度融合模型如何進行精準的信息推薦。
因此,本文首先提出社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的研究框架,如圖1所示。
從中可以看出,社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的研究主要包括以下3個方面的內容:
1)基于社會化標注系統(tǒng)演化的個性化信息推薦機理分析
通過對基于社會化標注系統(tǒng)演化的個性化信息推薦機理進行研究,分析社會化標注系統(tǒng)的自組織超循環(huán)演化形式和耗散結構,從個性化用戶行為和信息發(fā)現兩個角度進行探討。
第一,從系統(tǒng)演化的角度,分析社會化標注系統(tǒng)的結構特征,利用自組織理論分析社會化標注系統(tǒng)的自組織演化特性,借助超循環(huán)理論分析社會化標注系統(tǒng)以及3個集合(標簽集、資源集、用戶集)的自組織演化過程,構建社會化標注系統(tǒng)的自組織超循環(huán)演化形式。
第二,根據耗散結構理論,對社會化標注系統(tǒng)的耗散結構進行多層次研究,具體分析社會化標注系統(tǒng)的內部正熵和外部負熵之間的關系、系統(tǒng)整體熵的演化方向、系統(tǒng)的有序度和平衡態(tài),構建社會化標注系統(tǒng)的多層級耗散結構。
第三,利用社會化標注系統(tǒng)中蘊含的大數據,從中挖掘出用戶行為數據,進行深度分析,發(fā)現用戶行為特征,歸納用戶的個性化信息需求和偏好,揭示社會化標注系統(tǒng)中個性化信息推薦機理。
2)社會化標注系統(tǒng)中個性化信息推薦多維度融合模型的構建
對于現有的基于圖論(社會網絡關系)、基于協(xié)同過濾和基于內容(主題)的個性化信息推薦方法,通過深入分析這三種推薦方法各自的優(yōu)缺點,充分考慮它們的主要貢獻,規(guī)避它們的不足之處,尋找三者之間的融合點,采用適當的融合方法和融合工具,挖掘其內在的融合動因和融合機制,同時考慮社會化標注系統(tǒng)在結構演化過程中的時間因素,結合用戶、資源、標簽為一體的向量空間因素,充分發(fā)揮基于社會網絡分析、內容(主題)本體、協(xié)同過濾等方法的特點和優(yōu)點,實現3種方法的深度融合,最終構建社會化標注系統(tǒng)中個性化信息推薦的多維度融合模型,使其能夠解決社會化標注系統(tǒng)中個性化信息推薦的過程中有關用戶“冷啟動”、數據稀疏和用戶偏好漂移等問題,最終實現更加精準的個性化信息推薦。
3)社會化標注系統(tǒng)中個性化信息推薦多維度融合模型的優(yōu)化
將社會化標注系統(tǒng)中個性化信息推薦多維度融合模型進行靜態(tài)優(yōu)化和動態(tài)優(yōu)化,從而揭示構成個性化信息推薦多維度融合模型中各個要素之間的聯(lián)系以及動態(tài)變化。
第一,從系統(tǒng)學的角度,充分考慮所構建的個性化信息推薦多維度融合模型的系統(tǒng)結構是由許多要素組成的,要素是系統(tǒng)中對整體性質和體系結構起到主要和關鍵作用的主要元素,其中靜態(tài)優(yōu)化主要從功能要素、角色要素、組成要素3個方面對所構建模型展開優(yōu)化。
第二,從系統(tǒng)動力學的角度,充分考慮所構建的個性化信息推薦多維度融合模型的時間適用性、用戶偏好的漂移性,從模型的目標要求、適用條件,尤其是模型內部各個要素的運行機制,將靜態(tài)優(yōu)化轉換成為動態(tài)優(yōu)化,從而實現個性化信息推薦的動態(tài)適應性。
3社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型構建
結合前文所述社會化標注系統(tǒng)中個性化信息推薦領域存在的問題以及社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的研究框架及其內容,本文提出構建社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型。
首先,以個性化信息推薦領域存在的問題為導向,將基于圖論(社會網絡關系)、基于協(xié)同過濾和基于內容(主題)的個性化信息推薦方法相融合,從而發(fā)揮社會網絡分析的宏觀作用,協(xié)同過濾算法的中觀作用以及本體語義分析的微觀作用,彼此之間相互融合,以解決個性化信息推薦過程中用戶“冷啟動”的問題。
其次,在構建社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型的過程中需要著重考慮:在時間方面,需要考慮在社會化標注系統(tǒng)自組織演化的過程中,用戶信息行為以及用戶信息需求和偏好所發(fā)生的變化;在空間方面,需要考慮用戶、資源、標簽三者在空間某一點進行統(tǒng)一的問題,即如何構建用戶的個性化信息點。由此,使得所構建的社會化標注系統(tǒng)中個性化信息推薦多維度融合模型,能夠解決個性化信息推薦過程中用戶偏好漂移的問題。
再次,在實現將3種個性化信息推薦方法深度融合的過程中,需要發(fā)現社會化標注系統(tǒng)在自組織演化過程中的平衡極點。社會化標注系統(tǒng)在有序度最高的時候,平衡達到極點,在此時對社會化標注系統(tǒng)進行用戶行為分析、資源相似性分析以及用戶信息需求分析,將會準確地分析出用戶的行為特征和偏好特征,準確地實現資源與偏好相匹配,使得個性化信息推薦的準確率更高。
最后,對個性化信息推薦多維度融合模型進行靜態(tài)優(yōu)化與動態(tài)優(yōu)化,既要體現出多維度融合模型的運行機制,展示其結構特征——功能要素、角色要素、組成要素,以及各要素之間的內部本質聯(lián)系;又要體現出多維度融合的過程和個性化信息推薦的過程,遵循社會化標注系統(tǒng)自組織演化的過程,從而揭示出構成個性化信息推薦多維度融合模型中各要素之間的動態(tài)變化。同時,結合用戶標注過程中的偏好漂移、信息推薦的目標要求、融合模型的運行機制等因素,從而解決冪律分布問題,突破用戶“冷啟動”和用戶偏好漂移的問題。
綜上所述,本文所構建的社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型,具體如圖2所示。
從中可以看出,社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型主要包括以下幾個方面內容:
1)通過對目標用戶的歷史行為信息進行深度挖掘,根據基于資源主題的內容推薦方法形成資源主題模型,從中獲取用戶的歷史偏好;此外,對資源主題模型進行資源相似性分析,從中獲取用戶的當前偏好。利用基于資源主題的內容推薦方法,結合用戶的歷史偏好和當前偏好,從而有效解決個性化信息推薦過程中用戶“冷啟動”的問題。
2)通過對目標用戶的歷史行為信息進行深度挖掘,根據基于用戶行為的協(xié)同過濾推薦方法形成用戶偏好模型,同時進行用戶相似性計算,找出相似用戶群,從中獲取用戶的潛在偏好。利用基于用戶行為的協(xié)同過濾推薦方法,結合用戶的潛在偏好,從而有效解決個性化信息推薦過程中數據稀疏的問題。
3)將目標用戶的社會網絡關系中的社會化行為及其所產生的社會關系網絡引入信息推薦之中,根據基于用戶關系的社會化推薦方法,對用戶群、資源群和標簽群進行深度挖掘,找出相應的用戶子群和資源子群,從中獲取用戶的潛在偏好。利用基于用戶關系的社會化推薦方法,結合用戶的潛在偏好,從而有效解決個性化信息推薦過程中數據稀疏的問題。
4)結合用戶的歷史偏好、當前偏好以及潛在偏好,基于效用知識理論進行用戶偏好的融合與優(yōu)化,在以用戶心理認知為基礎、用戶所處情境為條件以及信息發(fā)布時間與當前之間的差值小于某個閾值、在特定空間范圍之內等優(yōu)化因素的作用下,形成推薦資源列表并且對目標用戶開展個性化信息推薦,從而有效解決個性化信息推薦過程中用戶偏好漂移的問題,最終實現更加精準的個性化信息推薦。
4結語
鑒于當前關于社會化標注系統(tǒng)中個性化信息推薦過程中所存在的主要問題:即用戶“冷啟動”問題、數據稀疏性問題以及用戶偏好漂移問題,本文深入探討了社會標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型研究的總體框架并且構建了社會標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型。
利用本文所提出的社會化標注系統(tǒng)中個性化信息推薦多維度融合與優(yōu)化模型,能夠有效解決個性化信息推薦過程中所存在的問題,不僅在一定程度上豐富了個性化信息推薦的理論體系,而且也將在一定程度上拓展了個性化信息推薦的方法,從而實現在大數據環(huán)境下,為用戶提供更加精準的個性化信息,為信息資源的有效開發(fā)與利用提供借鑒意義。