汪祥舜 鄭孝遙 朱德義 章玥 孫麗萍
摘要 傳統(tǒng)的推薦系統(tǒng)主要針對(duì)單個(gè)用戶,但隨著社會(huì)和電子商務(wù)的快速發(fā)展,人們?cè)絹碓蕉嗟匾远鄠€(gè)用戶的形式一起參與活動(dòng),而群組推薦旨在為多個(gè)用戶組成的群組提供服務(wù),已成為當(dāng)前研究的熱點(diǎn)之一.針對(duì)目前群組推薦準(zhǔn)確率低,群組成員之間偏好沖突難以融合的問題,本文提出了一種新的共識(shí)模型策略,融合了群組領(lǐng)袖影響因子和項(xiàng)目熱度影響因子,基于K近鄰為目標(biāo)群組尋找鄰居群組,借鑒鄰居群組的偏好,設(shè)計(jì)了基于偏好融合的群組推薦算法.在MovieLens數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,本文所提的融合策略較傳統(tǒng)的偏好融合策略有著更優(yōu)越的表現(xiàn),推薦準(zhǔn)確率(nDCG)的總體平均性能約提高13%,推薦列表多樣性指標(biāo)的總體平均性能約提高10%.
關(guān)鍵詞 群組推薦;推薦系統(tǒng);偏好融合;協(xié)同過濾;數(shù)據(jù)挖掘;偏好預(yù)測
中圖分類號(hào) TP311
文獻(xiàn)標(biāo)志碼 A
0 引言
隨著社會(huì)和經(jīng)濟(jì)的飛速發(fā)展,尤其是近年互聯(lián)網(wǎng)的廣泛應(yīng)用,人類進(jìn)入了大數(shù)據(jù)時(shí)代.面對(duì)紛繁復(fù)雜的商品信息,僅依靠搜索引擎很難準(zhǔn)確獲得滿足自身需求和個(gè)性化的信息資源,用戶往往難以發(fā)現(xiàn)最需要或最適合的項(xiàng)目,越來越多的在線服務(wù)不可避免地受到“信息過載”問題的困擾,這使得用戶難以發(fā)現(xiàn)他們所需要的信息,推薦系統(tǒng)為解決這一問題應(yīng)運(yùn)而生.
傳統(tǒng)的推薦系統(tǒng),如上下文感知推薦系統(tǒng)、移動(dòng)推薦系統(tǒng)、實(shí)時(shí)推薦系統(tǒng)等,都是向單個(gè)用戶提供個(gè)性化推薦,但是隨著社會(huì)的發(fā)展和人們聯(lián)系的緊密,人們經(jīng)常以多個(gè)用戶所組成的群組形式參與某項(xiàng)活動(dòng),例如人們會(huì)組團(tuán)出去度假、進(jìn)餐、看電影等,因此進(jìn)行群組推薦的研究有著十分重要的意義.群組推薦已經(jīng)成為近些年來推薦系統(tǒng)領(lǐng)域一個(gè)研究熱點(diǎn).
群組推薦系統(tǒng)得到了國內(nèi)外研究人員和開發(fā)工作者的廣泛重視.文獻(xiàn)[1-2]結(jié)合模型融合和推薦融合的優(yōu)點(diǎn),提出了一種改進(jìn)的偏好融合方法,提高了組推薦的整體推薦性能.Yuan等[3]提出了一個(gè)稱為COM的共識(shí)模型,考慮用戶在群組中的行為變化,依賴于主題的影響和內(nèi)容信息,有效地提高了組推薦的準(zhǔn)確率.Tang等[4]提出了一種基于用戶交互行為的偏好融合策略,但該策略未考慮群組內(nèi)已消費(fèi)項(xiàng)目的影響因素.Sabrine等[5]用基于用戶的協(xié)同過濾算法為群組成員生成推薦列表,用Borda規(guī)則來生成群組推薦,但是該方法的融合策略過于簡單,導(dǎo)致推薦準(zhǔn)確率相對(duì)較低.
群組推薦系統(tǒng)與很多領(lǐng)域(如數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等)都有著緊密的聯(lián)系.Chen等[6]將遺算法應(yīng)用于組推薦中,用來預(yù)測群組成員之間存在的相互作用,提高了群組成員的滿意度.文獻(xiàn)[7-10]將數(shù)據(jù)挖掘的很多方法與組推薦相結(jié)合,提升了群組推薦系統(tǒng)在多方面的作用效益.機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的很多理論和方法也被廣泛應(yīng)用到組推薦系統(tǒng)[11-14]中,Wang等[15]提出了一種用于組推薦的雙向張量分解模型,采用貝葉斯個(gè)性化排序技術(shù)來學(xué)習(xí)所提出的BTF-GR模型的參數(shù).群組內(nèi)的成員之間包含豐富的行為作用信息,挖掘用戶之間的相互作用規(guī)律可大幅度提高推薦質(zhì)量,文獻(xiàn)[16-17]通過用戶之間的信任關(guān)系和社交信息來提高組推薦的準(zhǔn)確率.盡管國內(nèi)外研究在群組推薦領(lǐng)域做出了很多有益的探索,但是現(xiàn)有方法的偏好融合策略都相對(duì)較簡單,群組成員之間的分歧度較高,推薦準(zhǔn)確率仍有待提高.因此本文針對(duì)群組偏好建模問題,提出一種新的共識(shí)模型策略,融合群組領(lǐng)袖影響因子和項(xiàng)目熱度影響因子,并基于K近鄰設(shè)計(jì)了一種新的基于偏好融合的群組推薦算法,實(shí)驗(yàn)表明,本文提出的改進(jìn)算法效能較傳統(tǒng)的策略推薦性能有著更優(yōu)越的表現(xiàn).
1 相關(guān)工作
1.1 群組推薦系統(tǒng)的形式化定義
到目前為止,群組推薦系統(tǒng)仍沒有統(tǒng)一的定義形式.文獻(xiàn)[18-19]詳細(xì)闡述了群組推薦的語義和效率,并提出了一種使用共識(shí)分?jǐn)?shù)的方法來定義群組推薦系統(tǒng),該定義主要由共識(shí)函數(shù)和分歧度組成,具體的形式化定義如下:
1)群組預(yù)測評(píng)級(jí).群組G對(duì)項(xiàng)目i的預(yù)測評(píng)級(jí)RG(G,i)是對(duì)每個(gè)群組成員的預(yù)測評(píng)級(jí)的融合結(jié)果.使用的融合策略不一樣,得到的群組的預(yù)測評(píng)級(jí)也不一樣,如均值策略的群組預(yù)測分?jǐn)?shù)的計(jì)算公式為
2)群組分歧度.群組G對(duì)項(xiàng)目i的分歧,表示為dis(G,i),反映了群組成員之間預(yù)測評(píng)級(jí)的分歧程度.文獻(xiàn)[1-2]考慮了以下兩種主要的計(jì)算分歧度的方法:
1.2 群組推薦偏好融合策略
群組推薦系統(tǒng)有多種不同的偏好融合策略,文獻(xiàn)[20]對(duì)常見的融合策略做了詳細(xì)闡述.到目前為止,在群組推薦系統(tǒng)的研究中,常用的策略有最小痛苦策略、均值策略和最開心策略.具體定義如下:
1)最小痛苦策略(Least Misery Strategy,LM):以群組成員最低的個(gè)人評(píng)級(jí)作為該群組的評(píng)級(jí).設(shè)RGi,j表示群組Gi對(duì)項(xiàng)目j的評(píng)分,RUl,j為群組中成員ul對(duì)項(xiàng)目j的評(píng)分,則可用下述式(5)表示:
2)均值策略(Average Strategy,AVG):以群組成員的評(píng)級(jí)的平均值作為該群組的評(píng)級(jí).若用avg表示求平均值運(yùn)算,則可用下述式(6)表示:
3)最開心策略(Most Pleasure Strategy,MP):以群組成員最高的個(gè)人評(píng)級(jí)作為該群組的評(píng)級(jí).若用max表示求最大值運(yùn)算,則可用下述式(7)表示:
2 問題定義和模型構(gòu)建
2.1 相關(guān)定義
為了更好的描述本文對(duì)群組推薦系統(tǒng)所做的研究,將本文所做的研究工作定義如下:
定義1 群組領(lǐng)袖:一個(gè)群組由多個(gè)用戶組成,群組內(nèi)的成員各有差異,消費(fèi)的項(xiàng)目及其數(shù)量各不相同,對(duì)推薦的決策產(chǎn)生的影響也有所不同.因此,本文根據(jù)群組成員的作用大小為其分配不同的權(quán)重,將群組內(nèi)對(duì)推薦決策起到關(guān)鍵作用的用戶定義為該組的群組領(lǐng)袖.群組領(lǐng)袖可以是一個(gè),也可以是多個(gè),群組領(lǐng)袖的排名按照影響大小逐步遞減的次序依次確定.群組領(lǐng)袖往往是該群組內(nèi)活躍度最大、消費(fèi)項(xiàng)目數(shù)量最多的用戶.
定義2 群組領(lǐng)袖影響因子:為了精確衡量群組內(nèi)成員作用程度的大小,本文定義群組領(lǐng)袖影響因子為αi.設(shè)用戶ui消費(fèi)的項(xiàng)目總數(shù)記為Ni,項(xiàng)目種類數(shù)為Ci,群組G消費(fèi)的項(xiàng)目總數(shù)和種類數(shù)分別為NG和CG,則αi定義如下:
定義3 熱度項(xiàng)目:推薦系統(tǒng)更傾向于向用戶推薦消費(fèi)次數(shù)多的項(xiàng)目,項(xiàng)目被消費(fèi)的次數(shù)越多,在一定程度上表明其受歡迎的程度越高.本文定義消費(fèi)數(shù)量排名靠前的k個(gè)項(xiàng)目為熱度項(xiàng)目.
定義4 項(xiàng)目熱度影響因子:為了量化項(xiàng)目熱度的高低,本文定義項(xiàng)目熱度影響因子為βj,設(shè)m為消費(fèi)該項(xiàng)目的用戶個(gè)數(shù),M為群組G內(nèi)的用戶總數(shù),則βj定義如下:
定義5 鄰居群組:群組之間也具有相似性,例如學(xué)生群組、球迷群組、旅游群組等,群組之間彼此都有著緊密的聯(lián)系或相同的興趣愛好等.相似的群組在很大程度上會(huì)有著相同的偏好,可以根據(jù)相似群組的偏好為目標(biāo)群組提供推薦參考,本文將這樣相似的群組定義為鄰居群組.鄰居群組的尋找,可首先計(jì)算該群組與目標(biāo)群組之間的相似度,根據(jù)群組之間相似度的大小為其合理歸類到相應(yīng)的目標(biāo)群組.一個(gè)目標(biāo)群組可找到多個(gè)鄰居群組,這些鄰居群組可構(gòu)成一個(gè)鄰居群組集合.
2.2 共識(shí)模型
為進(jìn)一步提高群組推薦的準(zhǔn)確率,本文融合了群組領(lǐng)袖影響因子和項(xiàng)目熱度影響因子,為目標(biāo)群組尋找近鄰組,并借鑒鄰居群組的偏好.本文用F(Gi,Ij)表示群組Gi對(duì)項(xiàng)目j的預(yù)測評(píng)分,αi表示群組領(lǐng)袖影響因子,βj表示項(xiàng)目熱度影響因子,I表示群組的項(xiàng)目集,j表示需要預(yù)測的項(xiàng)目,RCF(ui,Ij)表示單個(gè)用戶之間協(xié)同過濾產(chǎn)生的預(yù)測評(píng)級(jí),RNG(Gi,Ij)表示基于群組間的K近鄰?fù)扑]產(chǎn)生的預(yù)測評(píng)級(jí),則本文的共識(shí)模型定義如下:
3 算法設(shè)計(jì)與分析
本文的算法在訓(xùn)練集上對(duì)共識(shí)模型進(jìn)行訓(xùn)練,在測試集上驗(yàn)證推薦結(jié)果,本文算法的主要思想流程如圖1所示.
3.1 劃分群組
為了確定兩個(gè)用戶之間的關(guān)聯(lián)程度,可以通過計(jì)算兩個(gè)用戶之間相似度的方法度量兩個(gè)用戶之間的親密程度.設(shè)u和v表示任意兩個(gè)用戶,u和v分別為由用戶u和用戶v評(píng)分信息所組成的評(píng)分向量,用scos(u,v)表示兩個(gè)用戶之間的余弦相似度,則計(jì)算式為
為合理劃分群組,本文首先通過計(jì)算任意2個(gè)用戶之間的余弦相似度,將相似度高的用戶構(gòu)造成一個(gè)群組,并且總是優(yōu)先選擇有相同或相似偏好的用戶加入該群組,以減少群組成員之間的分歧度.
3.2 基于偏好融合的K近鄰組推薦
基于偏好融合的K近鄰(K Nearest Nighborhood,KNN)組推薦,其基本思想是根據(jù)鄰居群組的偏好為目標(biāo)群組提供推薦,如圖2所示.設(shè)Group-m為需要推薦的目標(biāo)群組,Group-n和Group-s是和目標(biāo)群組相似的2個(gè)群組,可借鑒近鄰組的偏好,為目標(biāo)群組生成Top-k推薦列表.
基于偏好融合的K近鄰組推薦,首先計(jì)算任意2個(gè)群組之間的相似度,然后挑選合適的鄰居,最后完成推薦過程.挑選合理的鄰居集合規(guī)模是基于K近鄰?fù)扑]最重要的一步.
3.2.1 領(lǐng)域的選擇
領(lǐng)域數(shù)量和選擇領(lǐng)域的規(guī)則會(huì)對(duì)推薦結(jié)果產(chǎn)生重要的影響,傳統(tǒng)基于K近鄰的推薦可用如圖3左圖所示.在選定目標(biāo)群組以后,首先選定K個(gè)鄰居,然后根據(jù)歐式距離或者計(jì)算2個(gè)群組之間的相似度來挑選鄰居,然而由于K的值是人為事先選定,如果挑選的不合理,加入了關(guān)聯(lián)程度較差的群組,這樣反而會(huì)大大降低推薦的精度.例如圖3左圖所示,若事先選定6個(gè)鄰居,從圖中可以看出,群組G8和目標(biāo)群組G1的距離較遠(yuǎn),并不適合挑選出來作為目標(biāo)群組G1的鄰居,如果把G8挑選出來當(dāng)做鄰居反而降低了推薦的準(zhǔn)確度,此時(shí)的推薦質(zhì)量不如挑選G2、G3、G5、G7、G9這5個(gè)鄰居更合適.
與選擇固定數(shù)量的鄰居數(shù)目的做法不同,本文首先設(shè)定一個(gè)閾值過濾,保留相似度權(quán)重?cái)?shù)大于設(shè)定閾值的近鄰,在算法執(zhí)行時(shí),過濾掉相似度低的群組,如下方右圖所示,閾值的過濾效果相當(dāng)于在目標(biāo)群組G1的周邊畫了一個(gè)圓,可以合理舍棄掉周邊相似度低的離散的點(diǎn),這樣便可以去掉G8這個(gè)偏離中心的點(diǎn).
閾值的合理選取會(huì)影響預(yù)測的精度,如果閾值設(shè)置過高,會(huì)降低可供選擇的近鄰的數(shù)量,這會(huì)降低很多群組的覆蓋率;相反,如果閾值設(shè)置太低,鄰居數(shù)量會(huì)很多,如果鄰居群組中有很多關(guān)聯(lián)度低的群組,也會(huì)對(duì)推薦結(jié)果產(chǎn)生消極的影響.當(dāng)所需要的鄰居數(shù)量較少的時(shí)候,2種方法產(chǎn)生的結(jié)果幾乎一致,但當(dāng)可供挑的鄰居數(shù)量較多時(shí),第二種方案對(duì)推薦結(jié)果更能起到更好的作用.
3.2.2 算法實(shí)現(xiàn)
基于偏好融合的K近鄰組推薦算法,首先需要確定相似的鄰居群組集,本文首先采用Pearson相關(guān)系數(shù)來計(jì)算2個(gè)群組之間的相似度,用sPearson(G,G′)表示群組G和群組G′之間的Pearson相似度,計(jì)算式如下:
在確定好近鄰組的集合以后,對(duì)于N個(gè)最相似的鄰居群組,設(shè)RG,i值表示群組G后對(duì)項(xiàng)目i的預(yù)測評(píng)分,則目標(biāo)群組G對(duì)項(xiàng)目i的預(yù)測評(píng)分可用下式表示:
具體的算法描述如下所示.
算法1 基于偏好融合的K近鄰群組推薦算法
輸入:需要預(yù)測的群組編號(hào)id和項(xiàng)目編號(hào)id
輸出:該群組對(duì)該項(xiàng)目的預(yù)測評(píng)分
1.divide Groups
2.calculate GroupJaccardSim
3.while(Current Nearest Neighbor Groups!=required Neighbor Groups) do
4.for each k in GroupNum∥k表示計(jì)數(shù)器
5. if (k!=G&&GroupJaccardSim>max) then
∥G為群組id,max用來臨時(shí)保存GroupJaccardSim所得的最大值
6. for each j< Current NearestNeighborGroups
7.if(k==flaG[j]) then
∥flaG[]表示已存在的與群組G相似度最大的群組id的數(shù)組
8.Break;
9. end if
10. if(j==Current Nearest Neighbor Groups)
11. max←GroupJaccardSim;
12. flaG[i2]←k
13.end if
14. end for
15.end if
16. end for
17. utill find required K Neighbor Groups
18.end while
19.caculate GroupPearsonSim
20.return G on Item i Predicted Rating Based on KNN Groups
4 實(shí)驗(yàn)結(jié)果與分析
4.1 數(shù)據(jù)集和實(shí)驗(yàn)設(shè)置
本文實(shí)驗(yàn)采用的是MoviesLens 100K數(shù)據(jù)集,MovieLens數(shù)據(jù)集是由明尼蘇達(dá)大學(xué)的GroupLens研究項(xiàng)目收集,該數(shù)據(jù)集包括943名用戶對(duì)1 682部電影的100 000點(diǎn)評(píng)分,評(píng)分范圍是1~5分,評(píng)分越大表示用戶越喜歡該電影,其中每位用戶至少點(diǎn)評(píng)了20部電影.該數(shù)據(jù)集被廣泛應(yīng)用于推薦系統(tǒng)相關(guān)的實(shí)驗(yàn)或科研項(xiàng)目中.為了有效對(duì)推薦結(jié)果和算法進(jìn)行衡量,本文將MoviesLens數(shù)據(jù)集隨機(jī)選擇80%作為訓(xùn)練集,剩余20%作為測試集,算法在訓(xùn)練集中進(jìn)行測試,然后將推薦結(jié)果與測試集中的數(shù)據(jù)進(jìn)行驗(yàn)證,對(duì)比分析論證實(shí)驗(yàn)結(jié)果.
4.2 評(píng)價(jià)指標(biāo)
1)歸一化折損累計(jì)增益
歸一化折損累計(jì)增益指標(biāo)(normalized Discounted Cumulative Gain,nDCG)是基于排序的評(píng)價(jià)方法,是衡量組推薦準(zhǔn)確率的一種重要指標(biāo).本文使用nDCG來作為推薦準(zhǔn)確率的評(píng)價(jià)標(biāo)準(zhǔn).由于群組推薦列表是由群組內(nèi)成員若干偏好得到,要反應(yīng)該群組成員對(duì)推薦結(jié)果的滿意程度,可對(duì)比驗(yàn)證測試集中的數(shù)據(jù),度量預(yù)測的排序與實(shí)際排序的準(zhǔn)確程度.
設(shè)p1,p2,…,pk為算法產(chǎn)生的有序推薦結(jié)果列表,u表示某一個(gè)用戶,rupi表示用戶u對(duì)項(xiàng)目pi的真實(shí)評(píng)分,i為列表中的位置.DCG(Discounted Cumulative Gain)的計(jì)算公式為
其中,GuIDC,k 表示用戶u的最大DCG值,可根據(jù)用戶真實(shí)評(píng)分高低,將k個(gè)項(xiàng)目按照最理想情況進(jìn)行排序計(jì)算出IDCG的值.nDCG等于真實(shí)DCG值與IDCG的商,nDCG的數(shù)值越大,表明推薦準(zhǔn)確率越高.本文的nDCG是群組成員的平均nDCG值.
2)多樣性
推薦項(xiàng)目的多樣性是衡量組推薦系統(tǒng)的推薦性能高低的一個(gè)重要評(píng)價(jià)指標(biāo),本文用Divers衡量推薦項(xiàng)目的多樣性.首先采用Jaccard相關(guān)系數(shù)來計(jì)算兩個(gè)項(xiàng)目之間的相似度,然后按照公式(17)計(jì)算推薦列表項(xiàng)目的多樣性.
計(jì)算兩個(gè)項(xiàng)目之間的Jaccard相似度用下式表示:
推薦列表多樣性Divers可用下式計(jì)算:
其中sJac(Ii,Ij)表示項(xiàng)目i和項(xiàng)目j之間的Jaccard相關(guān)系數(shù),k表示推薦列表的項(xiàng)目的個(gè)數(shù).Divers的數(shù)值越大,表明推薦結(jié)果的多樣性越高.
3)均方根誤差
均方根誤差被廣泛應(yīng)用于推薦系統(tǒng)的實(shí)驗(yàn)評(píng)估指標(biāo),可衡量預(yù)測結(jié)果的精確度,本文所用的群組推薦的均方根誤差公式RMSE如下:
設(shè)RG,i表示群組G對(duì)項(xiàng)目i的預(yù)測評(píng)分,G,i表示群組G對(duì)項(xiàng)目i的真實(shí)評(píng)分,T表示群組G中的參與預(yù)測的項(xiàng)目個(gè)數(shù),IRMSE的值越小表明推薦的準(zhǔn)確度越高.
4.3 敏感性分析
4.3.1 參數(shù)權(quán)重對(duì)推薦性能的影響
為達(dá)到最佳的推薦效果,選取最佳的參數(shù),通過實(shí)驗(yàn)對(duì)參數(shù)a和b進(jìn)行靈敏度分析.
從圖4中可以看出,當(dāng)a=0.6,b=0.4時(shí),RMSE取得最小值,此時(shí)推薦準(zhǔn)確度最好,這也從側(cè)面說明在推薦過程中起決定性因素的是群組內(nèi)的用戶偏好.
4.3.2 近鄰組個(gè)數(shù)對(duì)推薦精度的影響
本文在MoiveLens數(shù)據(jù)集上,改變近鄰組的個(gè)數(shù),采用本文所提的共識(shí)模型,完成對(duì)預(yù)測精度的測試實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖5所示.
從實(shí)驗(yàn)結(jié)果可以看出:預(yù)測的準(zhǔn)確度受近鄰組數(shù)量的影響,RMSE隨著近鄰組的數(shù)量的增加總體呈下降的趨勢,當(dāng)近鄰組達(dá)到一定的數(shù)量的時(shí)候,RMSE的值開始上下波動(dòng)、維持動(dòng)態(tài)平衡.實(shí)驗(yàn)結(jié)果表明預(yù)測的精度隨著近鄰組的個(gè)數(shù)的增加總體呈上升的趨勢;當(dāng)近鄰組的個(gè)數(shù)比較少的時(shí)候,預(yù)測的準(zhǔn)確度不是很高;當(dāng)近鄰組達(dá)到一定數(shù)量的時(shí)候,我們會(huì)發(fā)現(xiàn)預(yù)測的精確度總體趨勢幾乎保持不變.我們更換不同的群組,多次進(jìn)行重復(fù)實(shí)驗(yàn),發(fā)現(xiàn)當(dāng)近鄰組的個(gè)數(shù)在9左右的時(shí)候,群組推薦的預(yù)測準(zhǔn)確度受近鄰組的個(gè)數(shù)敏感較小,預(yù)測的準(zhǔn)確度可穩(wěn)定在一定的范圍內(nèi).實(shí)驗(yàn)發(fā)現(xiàn)并不是近鄰組越多,預(yù)測的準(zhǔn)確度就越高,而是到達(dá)一定數(shù)量的時(shí)候,預(yù)測的準(zhǔn)確度基本維持不變.
4.4 實(shí)驗(yàn)結(jié)果
在本節(jié)中我們改變?nèi)航M規(guī)模來驗(yàn)證本文所提共識(shí)模型的推薦準(zhǔn)確率和推薦列表多樣性.
1)推薦準(zhǔn)確率
實(shí)驗(yàn)結(jié)果如下圖所示,其中橫軸表示群組規(guī)模,群組規(guī)模為5表示該群組成員的個(gè)數(shù)為5,依次類推;縱軸表示nDCG.GROUP-CF表示群組間協(xié)同過濾算法策略;PROPOSED表示本文所提的共識(shí)模型策略.從圖6中可以看出,在相同的群組規(guī)模下,本文所提的模型策略在推薦準(zhǔn)確率上有所提高;當(dāng)群組規(guī)模為15和25時(shí),本文所提共識(shí)模型有更著較為優(yōu)良的表現(xiàn);實(shí)驗(yàn)也表明在其他的分組規(guī)模下,本文所提的融合模型策略也明顯優(yōu)于另外常見的4種策略,在推薦準(zhǔn)確率上總體的平均性能約提高13%.
2)推薦項(xiàng)目的多樣性
實(shí)驗(yàn)結(jié)果如圖7所示,其中縱軸Divers表示群組推薦項(xiàng)目的多樣性.實(shí)驗(yàn)結(jié)果表明,當(dāng)群組成員的個(gè)數(shù)較少的時(shí)候,推薦列表的多樣性相對(duì)較低;隨著群組成員個(gè)數(shù)的增加,群組推薦列表的多樣性有一定的增加.同時(shí)實(shí)驗(yàn)結(jié)果也驗(yàn)證了本文所提的共識(shí)模型的多樣性優(yōu)于前4種融合策略,本文所提的共識(shí)模型在多樣性指標(biāo)上總體平均性能上約提高10%.
5 總結(jié)和展望
現(xiàn)有的大多數(shù)推薦系統(tǒng)主要是針對(duì)單個(gè)用戶進(jìn)行推薦,隨著人們聯(lián)系的緊密和社會(huì)的發(fā)展,群組推薦已成為研究熱點(diǎn).如何為群組提供精準(zhǔn)的推薦仍然是一個(gè)開放性的問題,也是一個(gè)挑戰(zhàn).群組推薦系統(tǒng)研究的難點(diǎn)在于是找出一個(gè)合理的偏好融合策略,盡可能的降低群組成員的之間的分歧度,使推薦結(jié)果能夠滿足群組內(nèi)大多數(shù)成員的偏好.本文提出了一種新的共識(shí)模型,提出了群組領(lǐng)袖影響因子和項(xiàng)目熱度影響因子等概念,融合群組內(nèi)和群組間的多種因素,提高了群組推薦的準(zhǔn)確率;并設(shè)計(jì)了基于偏好融合的K近鄰群組推薦算法,為目標(biāo)群組尋找鄰居群組,并借鑒鄰居群組的偏好,在MoviesLens數(shù)據(jù)集上也驗(yàn)證了本文所提的共識(shí)模型的優(yōu)越性,相較幾種常見的偏好融合策略,本文所提的共識(shí)模型策略在推薦準(zhǔn)確率nDCG上總體的平均性能約提高13%,在多樣性上總體的平均性能約提高10%.接下來的工作擬打算從群組成員之間的信任關(guān)系和社交關(guān)系等展開進(jìn)一步的研究.
參考文獻(xiàn)References
[1] 張玉潔,杜雨露,孟祥武.組推薦系統(tǒng)及其應(yīng)用研究[J].計(jì)算機(jī)學(xué)報(bào),2016,39(4):745-764
ZHANG Yujie,DU Yulu,MENG Xiangwu.Research on group recommender systems and their applications[J].Chinese Journal of Computers,2016,39(4):745-764
[2] 胡川,孟祥武,張玉潔,等.一種改進(jìn)的偏好融合組推薦方法[J].軟件學(xué)報(bào),2018,29(10):3164-3183
HU Chuan,MENG Xiangwu,ZHANG Yujie,et al.Enhanced group recommendation method based on preference aggregation[J].Journal of Software,2018,29(10):3164-3183
[3] Yuan Q,Cong G,Lin C Y.COM:a generative model for group recommendation[C]∥ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2014:163-172
[4] Tang F,Liu K,F(xiàn)eng L,et al.Research on the integration strategy of group recommendation based on user's interactive behaviors[C]∥2016 IEEE International Conference on Cloud Computing and Big Data Analysis,2016:367-372
[5] Abdrabbah S B,Ayadi M,Ayachi R,et al.Aggregating top-K lists in group recommendation using Borda rule[M]∥Advances in Artificial Intelligence:From Theory to Practice.Cham:Springer International Publishing,2017:325-334
[6] Chen Y L,Cheng L C,Chuang C N.A group recommendation system with consideration of interactions among group members[J].Expert Systems with Applications,2008,34(3):2082-2090
[7] Guo Z W,Tang C W,Tang H,et al.A novel group recommendation mechanism from the perspective of preference distribution[J].IEEE Access,2018,6:5865-5878
[8] Seo Y D,Kim Y G,Lee E,et al.An enhanced aggregation method considering deviations for a group recommendation[J].Expert Systems with Applications,2018,93:299-312
[9] Feng S S,Cao J,Wang J,et al.Group recommendations based on comprehensive latent relationship discovery[C]∥2016 IEEE International Conference on Web Services,2016:9-16
[10] Boratto L,Carta S,F(xiàn)enu G,et al.Influence of rating prediction on group recommendation's accuracy[J].IEEE Intelligent Systems,2016,31(6):22-27
[11] Guo Z W,Zeng W R,Wang H,et al.An enhanced group recommender system by exploiting preference relation[J].IEEE Access,2019,7:24852-24864
[12] Yin H,Wang Q,Zheng K,et al.Social influence-based group representation learning for group recommendation[C]∥2019 IEEE 35th International Conference on Data Engineering,2019:566-577
[13] Du Y L,Meng X W,Zhang Y J.CVTM:a content-venue-aware topic model for group event recommendation[J].IEEE Transactions on Knowledge and Data Engineering,2019.DOI:10.1109/TKDE.2019.2904066
[14] Zhang W,Wang J,F(xiàn)eng W.Combining latent factor model with location features for event-based group recommendation[C]∥ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2013:910-918
[15] Wang J K,Jiang Y C,Sun J S,et al.Group recommendation based on a bidirectional tensor factorization model[J].World Wide Web,2018,21(4):961-984
[16] Guo C,Tian X M.Flickr group recommendation using content interest and social information[C]∥Proceedings 2014 IEEE International Conference on Security,Pattern Analysis,and Cybernetics,2014:405-410
[17] Santos E B,Manzato M G,Goularte R.A conceptual architecture with trust consensus to enhance group recommendations[C]∥2014 IEEE/ACIS 13th International Conference on Computer and Information Science,2014:137-142
[18] Amer-Yahia S,Roy S B,Chawlat A,et al.Group recommendation:semantics and efficiency[J].Proceedings of the VLDB Endowment,2009,2(1):754-765
[19] Roy S B,Amer-Yahia S,Chawla A,et al.Space efficiency in group recommendation[J].The VLDB Journal,2010,19(6):877-900
[20] Masthoff J.Group modeling:selecting a sequence of television items to suit a group of viewers[J].User Modeling and User-Adapted Interaction,2004,14(1):37-85