• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    融合社交關(guān)系與時(shí)間因素的主題模型推薦算法

    2020-03-19 12:24:48高茂庭
    計(jì)算機(jī)工程 2020年3期
    關(guān)鍵詞:復(fù)雜度物品標(biāo)簽

    高茂庭,王 吉

    (上海海事大學(xué) 信息工程學(xué)院,上海 201306)

    0 概述

    在Web2.0時(shí)代,互聯(lián)網(wǎng)上的信息過(guò)載現(xiàn)象進(jìn)一步加劇。 推薦系統(tǒng)作為解決信息過(guò)載問(wèn)題的一種有效手段,可以較好地過(guò)濾網(wǎng)上不斷產(chǎn)生的“噪聲”,方便人們獲取有用的信息。推薦系統(tǒng)的核心是推薦算法,目前,應(yīng)用最廣泛的推薦算法是協(xié)同過(guò)濾算法,其主要分為基于近鄰的協(xié)同過(guò)濾和基于模型的協(xié)同過(guò)濾[1]。然而,協(xié)同過(guò)濾算法存在冷啟動(dòng)、數(shù)據(jù)稀疏性等問(wèn)題。為解決上述問(wèn)題,研究人員提出基于多信息融合的社會(huì)化推薦算法,其已成為推薦算法的熱門(mén)研究領(lǐng)域之一[2-4]。

    一方面,每個(gè)人都可以在網(wǎng)絡(luò)上表達(dá)自己的想法,其在社會(huì)化標(biāo)簽系統(tǒng)(Social Tagging System,STS)中自由創(chuàng)建的關(guān)鍵詞被稱為標(biāo)簽。社會(huì)標(biāo)簽不僅在一定程度上反映了用戶的興趣行為偏好,也代表著物品本身所具有的特性。因此,許多學(xué)者開(kāi)始將標(biāo)簽信息融入到推薦系統(tǒng)中。結(jié)合社會(huì)化標(biāo)簽信息的推薦系統(tǒng)主要有協(xié)同過(guò)濾、基于排序的推薦和基于內(nèi)容的推薦。文獻(xiàn)[5]通過(guò)使用標(biāo)簽信息來(lái)擴(kuò)展用戶和物品的信息,提出基于標(biāo)簽擴(kuò)展的個(gè)性化推薦技術(shù)。文獻(xiàn)[6]提出基于標(biāo)簽和協(xié)同過(guò)濾的算法,利用標(biāo)簽信息計(jì)算用戶對(duì)資源的偏好程度和資源相似度,得到用戶偏好矩陣,根據(jù)排名產(chǎn)生推薦結(jié)果。文獻(xiàn)[7]通過(guò)用戶自身的反饋來(lái)更新標(biāo)簽的權(quán)重,重新產(chǎn)生用戶的個(gè)性化推薦列表。上述算法雖然考慮了標(biāo)簽信息,但是忽略了標(biāo)簽本身的語(yǔ)義問(wèn)題。潛在Dirichlet分布(Latent Dirichlet Allocation,LDA)[8]被證明是可以較好地建立標(biāo)簽的主題模型。文獻(xiàn)[9]使用LDA主題模型挖掘標(biāo)簽的語(yǔ)義特征,并根據(jù)物品的評(píng)分信息計(jì)算物品相似度,通過(guò)將兩者結(jié)合以有效地提高推薦的質(zhì)量。

    另一方面,人們?cè)谧鲞x擇時(shí)往往會(huì)更依賴朋友的建議[10]。社交網(wǎng)絡(luò)的發(fā)展使得人們獲取其社交朋友關(guān)系數(shù)據(jù)變得更容易,社交網(wǎng)絡(luò)系統(tǒng)不僅有向用戶進(jìn)行推薦的需要[11],而且在社會(huì)化標(biāo)簽系統(tǒng)中利用社交關(guān)系也能有效提高推薦的質(zhì)量。文獻(xiàn)[12]將用戶之間的信任和相似度融合在一起,增強(qiáng)了用戶領(lǐng)域的計(jì)算,通過(guò)矩陣分解方法處理后產(chǎn)生推薦結(jié)果。文獻(xiàn)[13]使用用戶的社交關(guān)系網(wǎng)絡(luò)計(jì)算信任關(guān)系矩陣,并結(jié)合用戶評(píng)分矩陣產(chǎn)生推薦結(jié)果。上述推薦算法在考慮用戶社交關(guān)系的影響后,有效提高了推薦的準(zhǔn)確率。

    此外,用戶的興趣是隨著時(shí)間一直變化的,用戶對(duì)物品打標(biāo)簽的時(shí)間越近,表明該行為越能準(zhǔn)確地反映用戶對(duì)該物品的喜好程度,而打標(biāo)簽行為的時(shí)間越久遠(yuǎn),則其反映用戶對(duì)該物品的喜好程度就越低。因此,結(jié)合上下文時(shí)間信息構(gòu)建用戶興趣模型也成為一個(gè)新的研究熱點(diǎn)[14-16]。文獻(xiàn)[17]采用每個(gè)用戶當(dāng)前偏好的轉(zhuǎn)移速率來(lái)衡量時(shí)間對(duì)用戶的影響,并通過(guò)使用用戶的側(cè)面數(shù)據(jù)來(lái)提高基于矩陣分解的推薦準(zhǔn)確性。文獻(xiàn)[18]基于近鄰的協(xié)同過(guò)濾算法考慮了評(píng)分的時(shí)間上下文影響,降低預(yù)測(cè)誤差。

    上述推薦算法根據(jù)少數(shù)幾種信息來(lái)計(jì)算用戶或者物品的相似度,通過(guò)協(xié)同過(guò)濾思想產(chǎn)生推薦結(jié)果。由于標(biāo)簽主題語(yǔ)義、朋友社交關(guān)系以及時(shí)間因素都會(huì)對(duì)用戶行為產(chǎn)生影響,因此對(duì)這3種因素綜合考慮可以更加全面地構(gòu)建用戶的興趣偏好模型,提高推薦的質(zhì)量。本文在上述研究的基礎(chǔ)上進(jìn)行改進(jìn),提出一種結(jié)合用戶社交關(guān)系和時(shí)間加權(quán)的主題模型推薦算法。使用LDA主題模型發(fā)現(xiàn)標(biāo)簽之間潛在的語(yǔ)義關(guān)系,得到用戶對(duì)物品的偏好概率,同時(shí)結(jié)合時(shí)間權(quán)重和用戶標(biāo)簽行為計(jì)算用戶相似度,在此基礎(chǔ)上融合用戶社交關(guān)系對(duì)用戶偏好概率進(jìn)行處理,從而更全面地反映用戶對(duì)物品的真實(shí)偏好。

    1 相關(guān)工作

    1.1 相似度計(jì)算

    相似度的計(jì)算是傳統(tǒng)協(xié)同過(guò)濾算法的重要步驟,其結(jié)果直接影響推薦的準(zhǔn)確性能[19]。常用的相似度計(jì)算方法有余弦相似度、改進(jìn)的余弦相似度和皮爾遜相似度3種。

    文獻(xiàn)[20]指出:在基于用戶的推薦系統(tǒng)中,皮爾遜相似度僅考慮了用戶評(píng)價(jià)物品交集的標(biāo)準(zhǔn)差,比其他相似度度量方法效果更好。

    1.2 LDA主題模型

    LDA模型[8]是一個(gè)具有3層結(jié)構(gòu)的貝葉斯概率模型,它可以將文檔集中每篇文檔的主題以概率分布的形式表現(xiàn),從而得到文檔的主題分布。在LDA建模過(guò)程中,使用條件概率p(z|d)表示一篇文檔d中的主題z分布概率,使用條件概率p(w|z)表示每個(gè)主題z中一個(gè)單詞w的分布概率,則單詞w在文檔d中的分布概率為:

    (1)

    其中,K表示主題的個(gè)數(shù)。不同的主題個(gè)數(shù)會(huì)對(duì)整個(gè)LDA模型產(chǎn)生影響。

    2 結(jié)合用戶關(guān)系和時(shí)間加權(quán)的主題模型推薦

    本文使用LDA主題模型對(duì)用戶-標(biāo)簽-物品信息進(jìn)行處理,得到基于標(biāo)簽的主題模型,在考慮時(shí)間因素和用戶社交關(guān)系的基礎(chǔ)上,提出一種融合用戶社交關(guān)系和時(shí)間加權(quán)的主題模型推薦算法(UTLDA),其分為以下4個(gè)步驟:

    1)將用戶類比為文檔,用戶使用過(guò)的標(biāo)簽類比為文檔中的單詞,得到用戶-標(biāo)簽矩陣。將標(biāo)簽類比為文檔,標(biāo)簽所標(biāo)記的物品類比為文檔中的單詞,得到標(biāo)簽-物品矩陣。使用LDA主題模型處理上述2個(gè)矩陣,挖掘標(biāo)簽潛在的語(yǔ)義,分別得到用戶-標(biāo)簽概率矩陣和標(biāo)簽-物品概率矩陣,計(jì)算用戶-物品概率矩陣。

    2)考慮時(shí)間對(duì)用戶興趣的影響。使用用戶-物品矩陣,結(jié)合時(shí)間因素計(jì)算用戶之間的相似度。

    3)考慮用戶社交網(wǎng)絡(luò)關(guān)系。結(jié)合用戶的社交朋友關(guān)系對(duì)用戶相似度進(jìn)行處理,得到用戶間的權(quán)重。

    4)考慮每個(gè)用戶之間的潛在影響和用戶對(duì)每個(gè)物品的潛在偏好,結(jié)合用戶權(quán)重矩陣和概率矩陣,得到最終的用戶-物品偏好權(quán)重矩陣,并根據(jù)偏好矩陣產(chǎn)生Top-N推薦。

    本文算法流程如圖1所示。其中,標(biāo)簽、時(shí)間以及社交關(guān)系處理屬于數(shù)據(jù)處理部分,可以離線進(jìn)行,推薦部分在線完成。

    圖1 UTLDA推薦算法流程Fig.1 Flowchart of UTLDA recommendation algorithm

    2.1 基于標(biāo)簽信息的用戶-物品概率矩陣計(jì)算

    在STS中,用戶使用的一種標(biāo)簽代表用戶的一種行為,用戶使用標(biāo)簽的頻率反映用戶對(duì)該標(biāo)簽的喜愛(ài)程度,用戶對(duì)物品標(biāo)注標(biāo)簽的次數(shù)反映用戶對(duì)該物品的喜愛(ài)程度。使用四元組(U,I,T,TS)代表用戶對(duì)物品打標(biāo)簽的行為,其中,U代表用戶,I代表物品,T代表標(biāo)簽,TS代表用戶對(duì)物品打標(biāo)簽的時(shí)間。假設(shè)用戶集合U=(u1,u2,…,un),物品集合I=(i1,i2,…,im),標(biāo)簽集合T=(t1,t2,…,tl),n、m、l分別代表用戶、物品以及標(biāo)簽的總數(shù)。用戶-標(biāo)簽矩陣X是一個(gè)n×l的矩陣,第i行第j列的元素xij定義為:

    (2)

    其中,w代表用戶i使用過(guò)標(biāo)簽j的次數(shù)。

    標(biāo)簽-物品矩陣Y是一個(gè)l×m的矩陣,第i行第j列的元素yij定義為:

    (3)

    其中,w代表標(biāo)簽i標(biāo)記過(guò)物品j的次數(shù)。

    LDA常用的求解方法有Gibbs采樣算法和變分推斷EM算法,本文采用Gibbs采樣算法。首先利用LDA模型對(duì)用戶-標(biāo)簽矩陣X進(jìn)行LDA建模處理,得到用戶的主題分布概率矩陣p(z|u)和每個(gè)主題下的標(biāo)簽概率分布矩陣p(t|z),根據(jù)式(1)求得用戶-標(biāo)簽概率矩陣p(t|u);然后利用LDA模型對(duì)標(biāo)簽-物品矩陣Y進(jìn)行LDA建模處理,得到標(biāo)簽的主題分布概率矩陣p(z|t)和每個(gè)主題下的物品概率分布矩陣p(i|z),同樣根據(jù)式(1)求得標(biāo)簽-物品概率矩陣p(i|t)。利用用戶使用某個(gè)標(biāo)簽的概率p(tk|u)乘以這個(gè)標(biāo)簽標(biāo)注一個(gè)物品的概率p(i|tk),就可以得到在這個(gè)標(biāo)簽下,用戶對(duì)該物品的偏好概率??紤]所有的標(biāo)簽,將每個(gè)標(biāo)簽下得到的偏好概率累加,就可以得到用戶對(duì)該物品完整的偏好概率。用戶-物品偏好概率矩陣計(jì)算公式為:

    (4)

    其中,l是標(biāo)簽的總數(shù)量。

    2.2 結(jié)合時(shí)間因素的用戶相似度矩陣計(jì)算

    (5)

    其中,τ表示權(quán)重參數(shù)。

    在計(jì)算用戶相似度時(shí)考慮到用戶標(biāo)注物品的時(shí)間權(quán)重,將會(huì)減少用戶相似度的誤差。用戶對(duì)物品的評(píng)分使用用戶對(duì)物品標(biāo)注的次數(shù)來(lái)代替,根據(jù)皮爾遜相似度計(jì)算公式,結(jié)合時(shí)間因素的用戶相似度計(jì)算公式為:

    (6)

    2.3 結(jié)合社交關(guān)系和時(shí)間因素的用戶權(quán)重矩陣計(jì)算

    使用社交關(guān)系可以計(jì)算每個(gè)用戶與其他用戶之間的親密度。若用戶之間是朋友關(guān)系,其親密度為1,否則使用用戶社交關(guān)系來(lái)計(jì)算用戶的余弦相似度,以相似度衡量用戶間的親密度。用戶親密度計(jì)算公式為:

    (7)

    其中,s表示用戶u和用戶v之間的余弦相似度,該相似度由用戶社交關(guān)系計(jì)算得到。

    比起陌生人,自己朋友的建議讓人更愿意相信,基于朋友關(guān)系的推薦讓人更有可能接受,推薦結(jié)果也更具有解釋性。在本文算法中,若用戶有朋友,則優(yōu)先考慮用戶朋友的影響,否則就將其當(dāng)成普通用戶處理。結(jié)合用戶的社交關(guān)系矩陣以及用戶之間的相似度矩陣,得到用戶的權(quán)重矩陣Q,計(jì)算公式為:

    qu,v=S(u,v)+I(u,v)

    (8)

    其中,S(u,v)表示用戶u和用戶v的相似度,I(u,v)表示用戶u和用戶v的親密度。

    2.4 基于用戶-物品偏好矩陣的推薦

    (9)

    根據(jù)得到的用戶偏好矩陣,按用戶最終偏好值對(duì)物品進(jìn)行排序,取排名靠前的N個(gè)物品推薦給用戶??紤]到冷啟動(dòng)問(wèn)題,對(duì)于推薦系統(tǒng)中的新用戶推薦熱門(mén)物品。

    2.5 UTLDA算法時(shí)間復(fù)雜度分析

    設(shè)用戶數(shù)為n,物品數(shù)為m,標(biāo)簽數(shù)為l,LDA迭代次數(shù)為g,主題數(shù)為t,用戶對(duì)物品進(jìn)行標(biāo)記的行為數(shù)為h。

    在算法處理標(biāo)簽信息的階段,2次LDA建模的時(shí)間復(fù)雜度分別為O(nlgt)和O(mlgt),由于物品數(shù)一般是遠(yuǎn)大于用戶數(shù),因此LDA主題建模的時(shí)間復(fù)雜度為O(mlgt)。式(4)計(jì)算用戶的偏好概率矩陣主要是根據(jù)LDA模型得到的2個(gè)語(yǔ)義概率矩陣,相當(dāng)于矩陣相乘,其時(shí)間復(fù)雜度為O(nmt)。因此,2.1節(jié)算法處理標(biāo)簽信息的時(shí)間復(fù)雜度為O(mlgt+nmt)。

    在算法處理時(shí)間信息的階段,根據(jù)時(shí)間信息計(jì)算用戶時(shí)間權(quán)值的時(shí)間復(fù)雜度為O(h),利用時(shí)間信息計(jì)算用戶相似度矩陣時(shí)間復(fù)雜度為O(n2m),因此,其時(shí)間復(fù)雜度為O(n2m+h)。

    在算法處理用戶社交信息的階段,利用用戶社交關(guān)系計(jì)算用戶相似度的時(shí)間復(fù)雜度為O(n2m),計(jì)算用戶親密度矩陣的時(shí)間復(fù)雜度為O(n2),因此,其時(shí)間復(fù)雜度為O(n2m)。

    綜上,離線數(shù)據(jù)處理的時(shí)間復(fù)雜度為O(lmgt+n2m+h)。

    在線推薦根據(jù)偏好矩陣產(chǎn)生推薦,相當(dāng)于先查找后排序,其時(shí)間復(fù)雜度為O(nmlbn)。

    對(duì)比文獻(xiàn)[6]算法和文獻(xiàn)[9]算法,本文算法由于考慮的因素較多,因此在離線階段其時(shí)間復(fù)雜度較高,但在在線階段,3種算法都是在根據(jù)計(jì)算得到的偏好矩陣進(jìn)行推薦,其時(shí)間復(fù)雜度相同。

    3 實(shí)驗(yàn)與結(jié)果分析

    3.1 實(shí)驗(yàn)數(shù)據(jù)與實(shí)驗(yàn)環(huán)境

    本文實(shí)驗(yàn)采用Last.fm-2K數(shù)據(jù)集,其包含用戶雙向的朋友關(guān)系、用戶收聽(tīng)藝術(shù)家(物品)信息、用戶對(duì)藝術(shù)家的標(biāo)簽信息、藝術(shù)家標(biāo)簽信息,具體數(shù)據(jù)如表1所示。

    表1 Last.fm-2K數(shù)據(jù)集信息Table 1 Last.fm-2K dataset information

    在進(jìn)行實(shí)驗(yàn)之前,先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。為了減少噪聲數(shù)據(jù)對(duì)推薦結(jié)果的影響,首先刪除數(shù)據(jù)集中標(biāo)注物品數(shù)小于20的用戶,然后根據(jù)時(shí)間對(duì)數(shù)據(jù)集進(jìn)行排序,找到位于數(shù)據(jù)集前20%的時(shí)間點(diǎn),將該時(shí)間點(diǎn)之前的數(shù)據(jù)作為測(cè)試集,在剩余數(shù)據(jù)中隨機(jī)選取80%的數(shù)據(jù)作為訓(xùn)練集,進(jìn)行多次實(shí)驗(yàn)后計(jì)算平均值。

    本文實(shí)驗(yàn)環(huán)境為Windows 10操作系統(tǒng),Intel Core i7處理器,16 GB內(nèi)存,實(shí)驗(yàn)主要用Python語(yǔ)言實(shí)現(xiàn)。

    3.2 評(píng)估指標(biāo)

    文獻(xiàn)[21]給出準(zhǔn)確度衡量標(biāo)準(zhǔn),主要有分類準(zhǔn)確率、預(yù)測(cè)準(zhǔn)確度和排名準(zhǔn)確性等。本文采用分類準(zhǔn)確率,包括準(zhǔn)確率、召回率和F1衡量指標(biāo)。

    準(zhǔn)確率表示項(xiàng)目物品被成功推薦的比例,其計(jì)算公式為:

    (10)

    其中,Nhits(u)表示在推薦物品中用戶u標(biāo)注過(guò)的物品總數(shù),Nrecset(u)表示推薦給用戶u的物品集合的總數(shù)。

    召回率表示命中物品數(shù)在理論上可達(dá)到的最大值中所占的比例,其計(jì)算公式為:

    (11)

    其中,Ntestset(u)表示用戶u在測(cè)試集中標(biāo)注過(guò)的物品總數(shù),也就是命中數(shù)理論上可以達(dá)到的最大值。

    F1衡量指標(biāo)能夠有效地平衡準(zhǔn)確率和召回率之間的誤差,其計(jì)算公式為:

    (12)

    F1值越大,模型的效果越好。

    3.3 參數(shù)選取

    本文需要確定的參數(shù)包括LDA建模的主題數(shù)目和Top-N推薦時(shí)排名前N的物品數(shù)。根據(jù)實(shí)驗(yàn)經(jīng)驗(yàn),本文將LDA主題模型中的超參數(shù)α和η分別設(shè)置為0.1和0.01,迭代次數(shù)設(shè)置為500次。

    3.3.1 最優(yōu)的推薦物品數(shù)

    為了確定合適的推薦物品數(shù)目N,分別將數(shù)目N設(shè)置為35,40,…,75進(jìn)行實(shí)驗(yàn),并且為了消除LDA主題數(shù)對(duì)算法效果的影響,在實(shí)驗(yàn)過(guò)程中將主題數(shù)目分別設(shè)置為20,30,…,90,共進(jìn)行8組實(shí)驗(yàn),結(jié)果如圖2所示。

    圖2 不同N值下F1值的變化Fig.2 Change of F1 value under different N values

    從圖2可以看出,無(wú)論LDA模型的主題數(shù)是多少,UTLDA算法的F1衡量指標(biāo)隨著N值變化的趨勢(shì)基本相同,隨著N值增加,F1值總體上呈現(xiàn)出先增后降的趨勢(shì)。當(dāng)N=50或N=55時(shí),UTLDA算法的F1衡量指標(biāo)達(dá)到最大值。而隨著主題數(shù)目的增加,當(dāng)N=55時(shí),F1衡量指標(biāo)達(dá)到最大值。因此,本文算法選擇N=55進(jìn)行實(shí)驗(yàn)。

    3.3.2 LDA模型的主題數(shù)目

    為了確定合適的LDA模型主題數(shù)目,將主題數(shù)目T分別設(shè)置為20,30,…,90,比較在不同N值情況下,算法的F1衡量指標(biāo)隨著主題數(shù)目的變化情況,實(shí)驗(yàn)結(jié)果如圖3所示。

    圖3 不同主題數(shù)下F1值的變化Fig.3 Change of F1 value under different topic numbers

    從圖3可以看出,隨著主題數(shù)目的變化,算法的F1衡量指標(biāo)總體上升,但一直上下波動(dòng)。F1衡量指標(biāo)在主題數(shù)為80時(shí)基本達(dá)到最大值,但LDA模型的建模時(shí)間隨著主題數(shù)目的增長(zhǎng)而增加。以Top-55為例,算法的運(yùn)行時(shí)間如表2所示??紤]到建模時(shí)間,本文對(duì)比算法中使用LDA模型時(shí)采用的主題數(shù)目統(tǒng)一為60。

    表2 N=55時(shí)算法的運(yùn)行時(shí)間Table 2 Operation time of algorithm when N=55

    3.4 對(duì)比實(shí)驗(yàn)

    為了驗(yàn)證UTLDA算法的有效性,本文將與以下算法進(jìn)行對(duì)比實(shí)驗(yàn):傳統(tǒng)基于用戶的協(xié)同過(guò)濾推薦算法(UCF),基于標(biāo)簽的協(xié)同過(guò)濾推薦算法(TCF)[6],基于標(biāo)簽主題的協(xié)同過(guò)濾推薦算法(ColLDA)[9],基于LDA模型推薦算法,本文算法在未考慮時(shí)間和社交因素的情況下得到的推薦結(jié)果PreLDA。

    根據(jù)3.3.2節(jié)內(nèi)容,本文使用LDA模型時(shí)采用的主題數(shù)目統(tǒng)一設(shè)置為60,參數(shù)α和η分別設(shè)置為0.1和0.01,迭代次數(shù)設(shè)置為500次。各對(duì)比算法在不同的推薦數(shù)目下的召回率和準(zhǔn)確率結(jié)果如表3和表4所示。

    表3 各算法在不同推薦數(shù)目下的召回率Table 3 Recall of each algorithm under differentrecommended numbers %

    表4 各算法在不同推薦數(shù)目下的準(zhǔn)確率Table 4 Precision of each algorithm under differentrecommended numbers %

    從表3和表4可以看出,在Last.fm數(shù)據(jù)集上,各對(duì)比算法的召回率都是隨著推薦數(shù)目的增加而增大,而準(zhǔn)確率則隨著推薦數(shù)目的增加而減小,并且本文算法在召回率和準(zhǔn)確率上均高于其他對(duì)比算法。

    由于召回率和準(zhǔn)確率一定程度上相互制約,為了更好地衡量各個(gè)算法的效果,本文進(jìn)一步使用F1值來(lái)衡量推薦的質(zhì)量。各對(duì)比算法在不同的推薦數(shù)目下的F1值如圖4所示。從圖4可以看出,不同的算法在F1衡量指標(biāo)上的趨勢(shì)基本一致。

    圖4 各算法在不同推薦數(shù)目下的F1值Fig.4 F1 value of each algorithm under differentrecommended numbers

    各對(duì)比算法在相同環(huán)境下的運(yùn)行時(shí)間如表5所示。從表5可以看出,傳統(tǒng)的協(xié)同過(guò)濾算法產(chǎn)生推薦的時(shí)間較長(zhǎng),ColLDA和UTLDA因?yàn)槭褂昧薒DA模型,所以離線部分要比TCF算法的時(shí)間要長(zhǎng);ColLDA算法使用物品信息對(duì)模型進(jìn)行處理,而物品信息遠(yuǎn)大于用戶信息,所以在離線部分時(shí)間略高于UTLDA。但是在線部分,TCF、ColLDA和UTLDA 3種算法都是根據(jù)偏好矩陣產(chǎn)生推薦,所以產(chǎn)生推薦的時(shí)間基本一致。

    表5 4種算法運(yùn)行時(shí)間Table 5 Operation time of four algorithms s

    對(duì)比不同的算法可知,本文算法在準(zhǔn)確率、召回率以及F1值上均較優(yōu)。LDA算法構(gòu)建主題模型,挖掘了用戶-物品的潛在信息,相對(duì)于傳統(tǒng)的協(xié)同過(guò)濾推薦算法,提高了推薦的質(zhì)量;TCF算法將用戶的標(biāo)簽行為與推薦算法相結(jié)合,優(yōu)化了推薦效果;ColLDA算法使用LDA算法挖掘標(biāo)簽的語(yǔ)義信息,進(jìn)一步提高了推薦質(zhì)量。本文綜合使用用戶社交關(guān)系和時(shí)間因素來(lái)對(duì)主題模型得到的概率矩陣進(jìn)行處理,可以更加全面地衡量用戶對(duì)物品的偏好程度,實(shí)驗(yàn)結(jié)果表明,UTLDA算法能更有效地提高推薦的質(zhì)量。

    4 結(jié)束語(yǔ)

    在社會(huì)標(biāo)簽系統(tǒng)中,用戶的社交關(guān)系以及用戶隨時(shí)間變化的興趣偏好都會(huì)對(duì)推薦質(zhì)量產(chǎn)生影響。本文提出一種融合社交關(guān)系和時(shí)間因素的主題模型推薦算法,將時(shí)間因素加入到用戶的相似度計(jì)算模型中,使用主題模型建立用戶的興趣偏好,同時(shí)考慮用戶朋友以及其他用戶的影響,從而提高推薦的質(zhì)量和可解釋性。實(shí)驗(yàn)結(jié)果表明,該算法的召回率、準(zhǔn)確率以及F1值均高于對(duì)比算法。后續(xù)將采用自然語(yǔ)言處理技術(shù)對(duì)標(biāo)簽進(jìn)行聚類,減少標(biāo)簽的數(shù)量,并結(jié)合用戶的評(píng)論提取情感關(guān)鍵詞,建立更準(zhǔn)確的用戶興趣偏好模型,進(jìn)一步提高推薦結(jié)果的質(zhì)量。

    猜你喜歡
    復(fù)雜度物品標(biāo)簽
    稱物品
    “雙十一”,你搶到了想要的物品嗎?
    誰(shuí)動(dòng)了凡·高的物品
    一種低復(fù)雜度的慣性/GNSS矢量深組合方法
    無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
    車迷(2018年11期)2018-08-30 03:20:32
    不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
    海峽姐妹(2018年3期)2018-05-09 08:21:02
    求圖上廣探樹(shù)的時(shí)間復(fù)雜度
    標(biāo)簽化傷害了誰(shuí)
    某雷達(dá)導(dǎo)51 頭中心控制軟件圈復(fù)雜度分析與改進(jìn)
    找物品
    太湖县| 曲松县| 株洲市| 怀仁县| 宁陕县| 尼勒克县| 太和县| 阿荣旗| 海晏县| 马龙县| 长宁县| 麻城市| 乌苏市| 昌都县| 沁阳市| 溆浦县| 敦化市| 逊克县| 雷山县| 桐乡市| 金坛市| 揭东县| 江口县| 湘西| 横峰县| 庆元县| 姜堰市| 云和县| 进贤县| 玛曲县| 东安县| 温宿县| 类乌齐县| 婺源县| 蒲江县| 米林县| 富民县| 日照市| 白城市| 曲周县| 博白县|