黃蘭,錢育蓉
(新疆大學(xué)軟件學(xué)院,烏魯木齊 830008)
結(jié)合評分可信度和動態(tài)時間加權(quán)的推薦算法
黃蘭,錢育蓉
(新疆大學(xué)軟件學(xué)院,烏魯木齊 830008)
為了解決電子商務(wù)推薦系統(tǒng)在推薦新項目方面的冷啟動問題,同時提高用戶與推薦項目的相似度,通過對比當(dāng)前的推薦算法,提出一種結(jié)合可信度和動態(tài)時間加權(quán)的推薦算法。該算法引入用戶評分可信度來計算用戶和項目的相似性,將新項目推薦給可信度高的用戶;分析用戶興趣、項目受歡迎度和時間的關(guān)系構(gòu)造動態(tài)時間加權(quán)函數(shù),將項目推薦給用戶興趣度高且項目受歡迎度高的用戶。通過實驗驗證該算法與傳統(tǒng)的基于用戶的推薦UBCF算法相比能夠提高近7%的推薦準(zhǔn)確度,與基于項目的推薦IBCF算法相比能夠提高近4.7%的推薦準(zhǔn)確度,同時解決新項目推薦的冷啟動問題。
推薦系統(tǒng);協(xié)同過濾;可信度;時間加權(quán)
近年來,隨著互聯(lián)網(wǎng)數(shù)字信息的爆炸式增長,推薦系統(tǒng)[1]已成為個性化服務(wù)重要的研究熱點,通過預(yù)測用戶的偏好給用戶推薦商品、服務(wù)及個性化的信息,幫助用戶解決信息過載問題。推薦系統(tǒng)的主要推薦技術(shù)有基于內(nèi)容的推薦、協(xié)同過濾推薦、組合推薦[2-7]等,其中協(xié)同過濾推薦算法是推進(jìn)系統(tǒng)中應(yīng)用最廣泛和最成功的推薦技術(shù)之一[8]、在許多領(lǐng)域取得較好的發(fā)展,如電子商務(wù)(阿里巴巴,Amazon、京東等)、信息檢索(百度、Google、Yahoo等)、社交網(wǎng)絡(luò)(騰訊QQ、微信、Facebook等)等。協(xié)同過濾推薦算法現(xiàn)面臨著兩個主要的挑戰(zhàn):(1)冷啟動問題,由于新項目沒有評分記錄,如何推薦新項目。(2)概念漂移問題,用戶興趣和項目受歡迎度總是在不斷變化,如何找到它們與時間之間的變化關(guān)系。這兩個問題不僅影響了用戶相似度和項目相似度的計算精度,還影響了預(yù)測推測的準(zhǔn)確度,導(dǎo)致推薦質(zhì)量下降。
本文提出了一種結(jié)合用戶評分可信度的相似性方法度量,從用戶等級和商品時間特效兩方面來及計算用戶評分的可信度,對傳統(tǒng)的相似性度量方法進(jìn)行改進(jìn),提高相似的準(zhǔn)確度;計算用戶評分的可信度結(jié)果按從大到小排列,將新項目推薦給前N個可信度高的用戶,提高新項目的推薦準(zhǔn)確度,解決新項目推薦的冷啟動問題。本文還提出了基于用戶興趣的時間加權(quán)和基于項目受歡迎度的時間加權(quán),來解決用戶興趣和項目受歡迎程度隨時間動態(tài)變化的問題。
1.1 用戶-項目評分矩陣
推薦系統(tǒng)通過使用m×n階的用戶-項目評分矩陣來表示用戶對項目的評價信息。通常,m個用戶集合用集合U={u1,u2,...,um}表示,n個項目集合用集合I={i1,i2,...,in}表示,用戶i對項目j的評分值用rij表示(rij值越大,表示用戶i對項目j越喜歡)。關(guān)于m×n階的用戶-項目評分矩陣如表1所示。
1.2傳統(tǒng)協(xié)同過濾推薦算法
根據(jù)用戶-項目評分矩陣可以計算用戶之間的相似度或項目之間的相似度,目前常用的相似度計算度量方法有3種:皮爾森相關(guān)相似性(Pearson Correlation Codffient,PC),余弦相似性(Cosine Similarity,COS),修正的余弦相似性(Adjusted Cosine Similarity,ACOS)[9]。
表1 用戶-項目評分矩陣表
公式(3)中,rvi表示用戶v對項目i的評分,表示用戶u對其所評價過所有項目的均值,表示用戶v對其所評價過所有項目的均值,sim(u,v)用戶u和用戶v的相似度,NBsu表示用戶u的所有最近鄰居集合,Pui表示用戶u對項目i偏愛的預(yù)測評分值。其中,Pui值越大,說明用戶u對項目i越喜歡。
本文使用皮爾森相關(guān)相似性PC方法作為用戶之間的相似性計算,表達(dá)式如下:
公式(1)中:rui表示用戶u對項目i的評分,rvi表示用戶v對項目i的評分;表示用戶u對其所評價過所有項目的均值,表示用戶v對其所評價過所有項目的均值;Puv表示用戶u和用戶v評價過所有項目的公共項目集合。其中,sim(u,v)值越大,說明兩個用戶之間的相似度越高。
本文使用皮爾森相關(guān)相似性PC方法作為項目之間的相似性計算,表達(dá)式如下:
2.1 用戶時間權(quán)重
(1)用戶評分可信度時間權(quán)重
本文使用m×n階的用戶評價時間矩陣來表示用戶對項目的評價信息。其中,m個用戶集合用集合U={u1,u2,…,um}表示,n個項目集合用集合I={i1,i2,…,in}表示,用戶i對項目j評分時間用gij表示,用戶i對項目j購買時間用bij表示(項目的購買時間及項目的評價時間都為為年月日,時間單位為天)。關(guān)于m×n階的用戶評價時間矩陣如表2所示。
表2 用戶評價時間矩陣表
①用戶等級因素:
公式(2)中:rui表示用戶u對項目i的評分,ruj表示用戶u對項目j的評分;表示評價過項目i的所有用戶的評分均值表示評價過項目j的所有用戶的評分均值;Uij表示項目i和項目j共同評價用戶的公共用戶集合。其中,sim(i,j)值越大,說明兩個項目之間的相似度越高。
使用公式(1)計算預(yù)測評分值,即目標(biāo)用戶對項目的預(yù)測評分值,將項目月評分值的前TOP-N項目推薦給用戶,預(yù)測評分公示如下:
公式(4)中:Lu為用戶u等級的可信度,lu為用戶u的會員級別。本文用戶級別分為5個級別,用戶級別越高其評分信用度也就越高(用戶級別:鐵牌1、銅牌2、銀牌3、金牌4、鉆石5)。
②商品時間特效因素:
公式(5)中:Tu表示用戶u的時間權(quán)值(Tu∈[0,1]),sum表示用戶u評價項目的總數(shù),gui表示用戶u對項目i的評分時間,bui表示用戶u對項目i的購買時間。(gui-bui)的值越大,Tu越大,即用戶評價項目時間與用戶購買項目時間差越大,說明該用戶的評論是比較客觀而可信的,其評價過的項目也是可信的;反之,(guibui)的值越小,Tu越小,說明該用戶的評論是比較主觀而不可信的,其評價過的項目也是不可信的。公式(5)反映了用戶評價項目的平均可信程度。
Wu為用戶u的評分可信度,用戶評分可信度公式如下:
(2)用戶興趣時間權(quán)重
在日常生活中,用戶的興趣會隨著時間而發(fā)生變化,而用戶的興趣對商品的銷售量是有很大影響的。通常,用戶近期所購買的商品為用戶的短期興趣,用戶短期興趣對項目可能未來受關(guān)注程度較為重要;而用戶長期所購買的商品為用戶的長期興趣,用戶的長期興趣對項目可能未來受關(guān)注程度也有一定的影響。因此,本文通過將用戶短期興趣和長期興趣相結(jié)合,引入用戶興趣時間權(quán)重的方法,提高項目的受關(guān)注程度,從而提高項目的推薦準(zhǔn)確率。
用戶短期興趣時間權(quán)重公式定義如下:
公式(7)中,sP(u,i,tx)表示短時間內(nèi)用戶u對項目i在tx時刻的喜歡程度,tx表示某時刻時間值,ti表示用戶u購買項目i的時間值(時間單位都為月)。其中(txti)值越小,因而sP(u,i,tx)值就越大,用戶興趣隨時間的變化呈非遞減性。說明項目i離現(xiàn)在的時間越近,則用戶u越喜歡項目i。
用戶長期興趣時間權(quán)重公式定義如下:
公式(8)中,lP(u,i,tx)表示長時間內(nèi)用戶u對項目i在tx時刻的喜歡程度(tx∈T,T為定義的一個時間窗口集合),|IuT|表示用戶u在T時刻時喜歡項目集合I的個數(shù),C(x,y)表示項目x和項目y是否是同類型商品(C(x,y)=0不是相似類型項目,C(x,y)=1是相似類型項目,y∈|IuT|)。其中,C(x,y)值越大,因而lP(u,i,tx)值就越大,用戶的長期興趣受用戶購買同類項目的總數(shù)影響。說明用戶購買同類項目越多,用戶越喜歡這類項目。
結(jié)合用戶短期興趣和長期興趣時間權(quán)重公式定義如下:
公式(9)中,η∈[0,1],影響因子η隨著的取值不同,用戶u對項目i的興趣程度也會隨之變化。
2.2 項目受歡迎度時間權(quán)重
在推薦系統(tǒng)中,由于受時間的影響,項目的受歡迎程度會發(fā)生改變,因此推薦的準(zhǔn)確度也會被影響。一般項目隨時間的變化呈現(xiàn)非遞減性,而一些項目對不同的季節(jié)也比較敏感,如服裝類產(chǎn)品、電器類產(chǎn)品、護(hù)膚類產(chǎn)品等,項目的受歡迎程度會隨季節(jié)的變化而發(fā)生改變。
設(shè)集合T={t1,t2,…,tn},ti表示項目在i時刻賣出的項目總數(shù)(時間單位按月計算)。本文將受時間影響和受季節(jié)變化的這兩種因素進(jìn)行加權(quán)結(jié)合,項目時間權(quán)重公式定義如下:
公式(10)中,f(ix)表示項目i在x時刻的受歡迎程度,max(T)表示賣出項目總數(shù)最多的時間值(T是從產(chǎn)品發(fā)布時間到現(xiàn)在的時間段集合),tx表示x時刻的時間值。Kij項目i在j季度是否敏感(Kij=0時項目對季節(jié)不敏感,Kij=1項目對季節(jié)敏感,j=1,2,3,4)。當(dāng)tx-max(T)值越小,說明在tx時刻離受歡迎時刻越近,則在tx時刻項目i就越受歡迎。其中,λ∈[0,1],當(dāng)影響因子λ變化時,項目受歡迎程度也會變換。
2.3 結(jié)合用戶評分可信度時間權(quán)重的用戶相似性算法
在皮爾森相關(guān)相似性PC算法中,用戶相似性是對兩個用戶過去評論過的公共項目集合進(jìn)行相似性計算。該算法在一定程度上實現(xiàn)了對用戶之間的相似性計算,然而并未考慮用戶在評論項目時該評價值是否可信。如果兩個用戶評價項目值都是可信的,兩用戶的相似度值較為可靠;如果兩個用戶評價項目值是不可信的,則兩用戶的相似度值就不會準(zhǔn)確。為了提高兩個用戶之間相似性的準(zhǔn)確度,本文將用戶時間權(quán)重與皮爾森相關(guān)相似性PC算法相結(jié)合,公式定義如下:
公式(11)中:min(wu,wv)表示用戶u和用戶v評分可信度小的那個用戶,|ru∩rv|/|ru∪rv|表示用戶u、v公共評價項目集合與總評價項目集合的比值,用戶評分可信度越大,用戶之間公共評價項目越多,兩個用戶越相似。
2.4 結(jié)合用戶興趣時間權(quán)重的項目相似性算法
在皮爾森相關(guān)相似性PC算法中,項目相似性是對兩項目過去被用戶評論過的公共用戶集合進(jìn)行相似性計算。該算法在一定程度上實現(xiàn)了對項目之間的相似性計算,然而并未考慮用戶對項目興趣的改變。本文將用戶興趣時間權(quán)重與皮爾森相關(guān)相似性PC算法相結(jié)合,公式定義如下:
2.5 結(jié)合用戶評分可信度和動態(tài)時間加權(quán)的預(yù)測推薦算法
公式(3)為用戶u對項目i的預(yù)測評分值,由于該預(yù)測評分是根據(jù)用戶之間的相似性來計算的,用戶對項目的評分值是較為主觀的,為提高預(yù)測分值的準(zhǔn)確度,本文在考慮用戶評分的可信度的變化情況下,對預(yù)測算法進(jìn)行了修改,公式定義如下:
公式(13)中,sim(u,v)是公式(9)中基于用戶時間權(quán)重后的用戶相似性。
2.6 結(jié)合時間權(quán)重的協(xié)同過濾算法描述
輸入:目標(biāo)用戶u,用戶-項目評分矩陣R,用戶時間評價矩陣T
輸出:推薦給目標(biāo)用戶u的集合top-N
①根據(jù)用戶時間評價矩陣使用公式(6),計算用戶評分的可信度。
②根據(jù)用戶-項目評分矩陣公式(12),計算項目的相似性。
③根據(jù)用戶-項目評分矩陣使用公式(11),計算項用戶間似性,然后根據(jù)計算出來的結(jié)果找到目標(biāo)用戶u的鄰居集合U。根據(jù)用戶u的鄰居集合計算出用戶未評分的項目集合Unot。
④判斷推薦給用戶的項目是否是新項目,如果是,執(zhí)行⑤;如果不是,執(zhí)行⑥。
⑤根據(jù)①,將用戶未評分的項目集合Unot按可信度值從大到小排列,取前N個值推薦給用戶u。
⑥將用戶未評分的項目集合Unot用公式(13)計算出用戶對項目的預(yù)測值,按從小到大排列,取前N個值推薦給用戶u。
3.1 實驗數(shù)據(jù)集
本實驗采用某國內(nèi)知名購物網(wǎng)站的數(shù)據(jù)集,由國內(nèi)數(shù)據(jù)堂在線公布的數(shù)據(jù)集(http://www.datatang.com/ data/15516),可用于評論分析、情感計算、用戶行為分析等研究領(lǐng)域。該數(shù)據(jù)集包含該網(wǎng)站上31萬用戶對18000件商品的165萬條用戶評論數(shù)據(jù)。其中評分值分為5個等級,評分值越高表示用戶越喜愛(評分值范圍1-5),0表示用戶未買此商品或未對此商品進(jìn)行評分。本實驗數(shù)據(jù)集的數(shù)據(jù)稀疏性為:1-1650000/(310000× 18000)=99.97%,由此可知此用戶評分?jǐn)?shù)據(jù)的稀疏性是非常高。
3.2 評估標(biāo)準(zhǔn)
(1)預(yù)測質(zhì)量方面
本文使用的是統(tǒng)計精度評價方法中一種常用的衡量預(yù)測結(jié)果的度量方法,即平均絕對誤差(Mean Absolute Error,MAE),該方法就是通過統(tǒng)計用戶對項目的實際評分和預(yù)測評分之間的差值,來判斷預(yù)測的準(zhǔn)確性(MAE越小,說明預(yù)測質(zhì)量越高)。MAE計算公式如下:
Rui,m表示用戶u對項目i的真實評分,Pui,m表示用戶u對項目i的預(yù)測評分。
(2)推薦質(zhì)量方面
本文是從薦全率(Precision)和薦準(zhǔn)率(Recall)兩個方面來評估推薦質(zhì)量的準(zhǔn)確度,即推薦質(zhì)量標(biāo)準(zhǔn)F1。薦全率是評估推薦項目的全面性,薦準(zhǔn)率是評估推薦項目的準(zhǔn)確性,F(xiàn)1越大,則說明推薦質(zhì)量越高。F1計算公式如下:
其中薦全率(Precision)和薦準(zhǔn)率(Recall)的計算公式如下:
T為測試數(shù)據(jù)集中獲得推薦的項目集合,V為推薦集合中推薦正確的項目集合,W為測試集中用戶喜歡的所有項目集合。
3.3 實驗結(jié)果
(1)調(diào)整用戶興趣時間權(quán)值參數(shù)
圖1為基于時間用戶興趣度的不同取值對預(yù)測質(zhì)量的影響(η=0.5,0.3,0.7)。當(dāng)η=0.3時,用戶興趣度受長期興趣度影響比短期興趣度影響大;當(dāng)η=0.5時,用戶興趣受長期興趣度影響與短期興趣度影響相同;當(dāng)η=0.7時,用戶興趣受長期興趣度影響比短期興趣度影響小。根據(jù)圖1呈現(xiàn)的結(jié)果可以看出,η不同取值對MEA值影響不同。根據(jù)圖1中曲線可以求得不同影響因子η的MEA平均值,當(dāng)η=0.3時,MEA平均值為0.766;當(dāng)η=0.5時,MEA平均值為0.738;當(dāng)η=0.7時,MEA平均值為0.771。由此可知,當(dāng)η=0.5時,說明用戶興趣度對MEA值的影響最準(zhǔn)確。在現(xiàn)實生活中,用戶興趣度受用戶近期訪問項目的影響和以前早期訪問項目數(shù)據(jù)的影響是相同的。
結(jié)論(1):當(dāng)用戶長期興趣度和用戶短期興趣度對用戶興趣度影響相同時,預(yù)測質(zhì)量準(zhǔn)確度最好。
(2)調(diào)整項目時間權(quán)值參數(shù)
圖2為基于時間項目受歡迎度的不同取值對預(yù)測質(zhì)量的影響(λ=0.5,0.3,0.7)。當(dāng)λ=0.3時,項目受歡迎度受時間度影響度影響比受季節(jié)變化影響度影響大;當(dāng)λ=0.5時,項目受歡迎度受時間度影響度影響與受季節(jié)變化影響度影響相同;當(dāng)λ=0.7時,項目受歡迎度受時間度影響度影響比受季節(jié)變化影響度影響小。根據(jù)圖2呈現(xiàn)的結(jié)果可以看出,λ不同取值對MEA值影響不同。根據(jù)圖2中曲線可以求得不同影響因子λ的MEA平均值,當(dāng)λ=0.3時,MEA平均值為0.775;當(dāng)λ= 0.5時,MEA平均值為0.748;當(dāng)λ=0.7時,MEA平均值為0.783。由此可知,當(dāng)λ=0.5時,說明項目受歡迎度對MEA值的影響最準(zhǔn)確。在現(xiàn)實生活中,隨著時間變化,項目的受歡迎程度成非線性減弱。對項目長時間而言,大部分商品總會從受歡迎到淘汰;對項目季節(jié)而言,許多項目受季節(jié)影響,在特定的某個季節(jié)才會受歡迎,比如說受夏季的影響,電風(fēng)扇需求量會比其他季節(jié)的需求量都大。
圖1 參數(shù)η對MEA的影響
結(jié)論(2):當(dāng)項目受時間影響度和項目受季節(jié)影響度對項目受歡迎度影響相同時,預(yù)測質(zhì)量準(zhǔn)確度最好。
圖2 參數(shù)λ對MEA的影響
(3)調(diào)整新項目推薦的用戶評分可信度參數(shù)
圖3為基于用戶評分可信度的新項目推薦不同取值對推薦質(zhì)量的影響(β>=0.6,0.7,0.8)。當(dāng)β=0.6時,將新項目推薦給用戶評分可信度大于0.6的用戶;當(dāng)β=0.7時,將新項目推薦給用戶評分可信度大于0.7的用戶;當(dāng)β=0.8時,將新項目推薦給用戶評分可信度大于0.8的用戶。根據(jù)圖3呈現(xiàn)的結(jié)果可以看出,β不同取值對MEA值影響不同。根據(jù)圖3中曲線可以求得不同影響因子β的MEA平均值,當(dāng)β=0.6時,MEA平均值為0.382;當(dāng)β=0.7時,MEA平均值為0.347;當(dāng)β=0.8時,MEA平均值為0.333。由此可知,當(dāng)β=0.8時,說明推薦新項目的F1值最準(zhǔn)確。在現(xiàn)實生活中,因為評分可信度高的用戶會員等級高,購買東西多,信用度也高,所以將新項目推薦給用戶評分可信度高的用戶,推薦的新項目的準(zhǔn)確率越好。因此通過使用用戶評分可信度標(biāo)準(zhǔn)來解決新項目的冷啟動問題。
結(jié)論(3):當(dāng)推薦新項目時,用戶評分可信度與新項目推薦準(zhǔn)確率呈正相關(guān)性,即用戶評分可信度越大,推薦準(zhǔn)確率越高。
圖3 參數(shù)β對F1的影響
(4)相似性模型比較
圖4為相似性模型PC,COS,ACOS的MEA比較。如圖4所示,本文從Jaccard系數(shù)和評分可信度進(jìn)行優(yōu)化,使用MEA進(jìn)行比較。從圖4可以看出,在PC相似性模型中,評分可信度相似性模型比Jaccard系數(shù)相似性高3%,比為優(yōu)化相似性模型相似性高7%;在COS相似性模型中,評分可信度相似性模型比Jaccard系數(shù)相似性高4%,比為優(yōu)化相似性模型相似性高9%;在ACOS相似性模型中,評分可信度相似性模型比Jaccard系數(shù)相似性高3%,比為優(yōu)化相似性模型相似性高7%。由此可知,,評分可信度相似性模型的相似度比較好。與未優(yōu)化的相似模型相比,Jaccard系數(shù)優(yōu)化的模型可以根據(jù)用戶/項目的公共集合自動調(diào)整大小,因此提高了相似性計算的準(zhǔn)確度。但是由于用戶評分的主觀性,模型的性能會在一定程度上受到約束。評分可信度相似性模型是對Jaccard系數(shù)相似性模型進(jìn)行優(yōu)化,將Jaccard系數(shù)與用戶評分可信度相結(jié)合,對用戶的過去評分行為進(jìn)行評分可信度的計算,通過降低用戶評分的主觀性誤差,改善這種約束,從而提高相似性計算的準(zhǔn)確度。
結(jié)論(4):與未優(yōu)化相似性模型相比,評分可信度相似性模型提高了近7%的相似性計算;與Jaccard系數(shù)相似性模型相比,評分可信度相似性模型提高了近3%的相似性計算。因此可信度相似性模型對提高相似性計算是有效的。
(5)推薦模型比較
圖5為不同推薦模型的F1比較。如圖5所示,將本文的結(jié)合用戶評分信用度和動態(tài)時間加權(quán)的協(xié)同過濾算法(UCTCF)與基于用戶的系統(tǒng)過濾算法(UBCF)和基于項目的協(xié)同過濾算法相比較(IBCF)(UCTCF的F1值取最優(yōu))。根據(jù)圖5可以求得不同推薦模型的F1平均值,IBCF的F1平均值為0.307,UBCF的F1平均值為0.284,UCTCF的F1平均值為0.354,由此可知,結(jié)合用戶評分信用度和動態(tài)時間加權(quán)的協(xié)同過濾算法比傳統(tǒng)推薦算法推薦性能好。
結(jié)論(5):與UBCF推薦模型相比,UCTCF推薦模型提高了近7%的推薦準(zhǔn)確度;與IBCF推薦模型相比,UCTCF推薦模型提高了近4.7%的推薦準(zhǔn)確度。因此UCTCF推薦模型對提高推薦準(zhǔn)確度是有效的。
本研究結(jié)果發(fā)現(xiàn),結(jié)合評分可信度和動態(tài)時間加權(quán)推薦算法能有效地提高推薦準(zhǔn)確率;當(dāng)用戶長期興趣度和用戶短期興趣度對用戶興趣度影響相同時,預(yù)測質(zhì)量準(zhǔn)確度最好;當(dāng)項目受時間影響度和項目受季節(jié)影響度對項目受歡迎度影響相同時,預(yù)測質(zhì)量準(zhǔn)確度最好;當(dāng)推薦新項目時,用戶評分可信度與新項目推薦準(zhǔn)確率呈正相關(guān)性。本研究解決了新項目推薦的冷啟動問題和時間概念漂移問題,優(yōu)化了傳統(tǒng)的相似性模型和推薦模型。由于本研究數(shù)據(jù)集是購物網(wǎng)站的數(shù)據(jù)集,根據(jù)用戶的購買特點對原有的模型進(jìn)行優(yōu)化的,因此比較適合電子商務(wù)購物網(wǎng)站。
圖5 推薦模型的F1比較
[1]Isinkaye FO etal.,Recommendation Systems:Principles,Methods and Evaluation,Egyptian Informatics(2015),http://dx.doi.org/ 10.1016/j.eij.2015.06.005.
[2]Silvia Puglisi,Javier Parra-Arnau,Jordi Forné,On Content-Based Recommendation and User Privacy in Social-Tagging Systems,Computer Standards&Interfaces 41(2015)17-27.
[3]Dong-sheng Li etal.Item-Based Top-N Recommendation Resilient to Aggregated Information Revelation.Knowledge-Based Systems,2014,67:290-304.
[4]Alper Bilge etal.Robustness Analysis of Privacy-Preserving Model-Based Recommendation Schemes.Expert Systems with Applications,2014,:3671-3681.
[5]Jing Zhang,Qin-ke Peng etal.Collaborative Filtering Recommendation Algorithm Based on User Preference Derived from Item Domain Features,Physica A,2014,:66-76.
[6]Nitin Pradeep Kumar,Zhen-zhen Fan.Hybrid User-Item Based Collaborative Filtering.Procedia Computer Science,2015,60:1453-1461.
[7]Ahmad A.Kardan,Mahnaz Ebrahimi.A Novel Approach to Hybrid Recommendation Systems Based on Association Rules Mining for Content Recommendation in Asynchronous Discussion Groups,Information Sciences,2013,219:93-110.
[8]Su Xiaoyuan,Khoshgoftaar T M.A Suervey of Collaborative Filtering Techniques[C].Proc.of Conference on Advances in Artificial Intelligence.[S.1.]:IEEE Press,2009:421-425.
[9]Chou AY.The Analysis of Online Social Networking:How Technology is Changing E-Commerce Purchasing Decision.Int'l Journal of Information Systems and Change Management,2010,4(4):353-365.[doi:10.1504/IJISCM.2010.036917]
Recommendation Algorithm Combining Score's Credibility and Dynamic Time Weighted
HUANG Lan,QIAN Yu-rong
(School of Software,Xinjiang University,Urumqi Xinjiang 830008)
To solve cold start problem which the new project recommends in e-commerce recommendation system and improve the similarity of user-user and item-item.Proposes a recommendation algorithm combining score's credibility and dynamic time weighted by contrasting the current recommendation algorithm.The proposed method introduces the credibility of users'ratings to compute the similarity of user-user and item-item.Then the new items are recommended to the user of high credibility.Dynamic time weighted function is constructed by analyzing the relationship between time and users'interests or the popularity of the project.Then the items are recommended to the user of high interests and the item of high popularity.The algorithm is verified by experiment that it compared with the traditional user-based collaborative filtering UBCF algorithm can improve the accuracy of nearly 7%of the recommended,and it compared with item-based collaborative filtering IBCF algorithm can improve the accuracy of nearly 4.7%of the recommended.At the same time,the algorithm solves the problem of cold start in recommendation of new project.
Recommendation System;Collaborative Filtering;Credibility;Time Weighted
國家自然科學(xué)基金項目(No.61562086、No.61462079、No.61363083、No.61262088)
1007-1423(2016)35-0013-08
10.3969/j.issn.1007-1423.2016.35.003
黃蘭(1988-),女,四川遂寧人,碩士研究生,研究方向為大數(shù)據(jù)
錢育蓉(1980-),女,山東武城人,博士,副教授,研究方向為網(wǎng)絡(luò)計算和遙感圖像處理,E-mail:qyr@xju.edu.cn
2016-10-20
2016-11-25