• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于深度隨機(jī)游走的協(xié)同過濾推薦算法

      2021-03-28 04:29:48劉靖凱
      關(guān)鍵詞:余弦物品向量

      劉靖凱

      (廣東工業(yè)大學(xué),廣東 廣州510006)

      推薦算法是一種根據(jù)用戶興趣,為用戶推薦一系列其感興趣的物品的算法。推薦算法分為召回和排序兩個步驟,其中,召回步驟常用的算法有協(xié)同過濾算法、隱語義算法等。協(xié)同過濾算法利用所有用戶的歷史行為信息,特別是用戶對物品的正反饋行為,計(jì)算出特定用戶對物品的興趣偏好,從而達(dá)到個性化推薦的目的。由于協(xié)同過濾算法具有魯棒性強(qiáng)、計(jì)算復(fù)雜度低等特點(diǎn),所以已經(jīng)被廣泛應(yīng)用于各種實(shí)際的推薦場景之中。

      常用的協(xié)同過濾算法有基于用戶的協(xié)同過濾算法和基于物品的協(xié)同過濾算法,基于用戶的協(xié)同過濾算法通過推薦與用戶興趣相近的其他用戶感興趣的物品,從而達(dá)到精確推薦的目的。最近的一些研究嘗試將協(xié)同過濾算法和基于模型的推薦算法結(jié)合,來提高推薦算法的性能。為了保持模型的時(shí)效性,一些在線學(xué)習(xí)的模型通過學(xué)習(xí)新產(chǎn)生的用戶行為數(shù)據(jù)來保持模型參數(shù)的質(zhì)量。在線學(xué)習(xí)的推薦模型能夠從持續(xù)更新的數(shù)據(jù)流中訓(xùn)練模型參數(shù)。常用的模型有增量式的協(xié)同過濾模型[1]和增量式的矩陣分解模型。

      深度隨機(jī)游走[2]是一種將圖結(jié)構(gòu)轉(zhuǎn)化為向量表示的算法。算法采用無監(jiān)督的深度學(xué)習(xí)方法[3],這一方法已廣泛地運(yùn)用于自然語言處理當(dāng)中。深度隨機(jī)游走算法可以學(xué)習(xí)到用戶節(jié)點(diǎn)之間的社交關(guān)系,包括相鄰用戶節(jié)點(diǎn)的鄰域信息和同一用戶群體的成員關(guān)系。利用圖結(jié)構(gòu)來代替用戶的歷史行為信息矩陣,可以有效地表示不同用戶群體的距離。利用向量來表示用戶節(jié)點(diǎn)可以有效地解決圖數(shù)據(jù)稀疏性的問題。

      本文基于此背景提出了一種基于深度隨機(jī)游走的協(xié)同過濾推薦算法(Collaborative Filtering Algorithm Based on Deepwalk,DW-CF),利用用戶的歷史行為,構(gòu)建用戶圖結(jié)構(gòu),計(jì)算用戶嵌入向量,計(jì)算各用戶向量間的余弦相似度,從而計(jì)算用戶的推薦列表,算法在實(shí)驗(yàn)中體現(xiàn)了其有效性。

      1 基于深度隨機(jī)游走的協(xié)同過濾推薦算法

      1.1 問題定義

      推薦算法利用用戶的歷史行為數(shù)據(jù)為用戶推薦排序好的物品。在本文的實(shí)驗(yàn)中使用到公開數(shù)據(jù)集MovieLens-1M。其中包含用戶(u1,u2,…,um)和物品(C1,C2,…,Cn)之間的交互信息。本文提出的推薦算法根據(jù)用戶對物品的正反饋行為和用戶之間的社交信息,預(yù)測每一個用戶對物品的興趣偏好得分ru,c,從而將預(yù)測得分最高的N 個物品推薦給該用戶。傳統(tǒng)的用戶協(xié)同過濾算法通過計(jì)算任意兩個用戶的行為相似度來表示用戶之間的興趣相似度。而本文的深度隨機(jī)游走算法是通過計(jì)算用戶的表示向量,計(jì)算任意兩個向量的余弦距離來表示用戶之間的相似度,進(jìn)而計(jì)算用戶對物品的興趣偏好。

      1.2 深度隨機(jī)游走算法

      圖1 深度隨機(jī)游走算法流程

      1.3 基于用戶向量的協(xié)同過濾算法

      基于用戶向量的協(xié)同過濾算法是利用上文方法計(jì)算得到的用戶向量,計(jì)算任意兩個用戶之間的余弦相似度,找到與該用戶相似的用戶,計(jì)算用戶對各物品的興趣得分,為用戶推薦物品。與用戶k 最相似的N 個用戶L(uK)可以通過以下公式求得:

      2 實(shí)驗(yàn)與結(jié)果分析

      2.1 數(shù)據(jù)集

      圖2 基于用戶向量的協(xié)同過濾算法流程

      2.2 評價(jià)指標(biāo)

      本文采用召回率作為評價(jià)推薦算法質(zhì)量的指標(biāo),其中Recall@N 表示給用戶推薦的物品里,評分排名前N 的物品中,占測試集中所有中樣本的比重,可以衡量推薦系統(tǒng)的查全率。

      2.3 參數(shù)設(shè)置

      在深度隨機(jī)游走算法中,重復(fù)次數(shù)γ 為80,單次隨機(jī)游走步長k 為40,SkipGram 模型中滑動窗口大小w 為10,重復(fù)訓(xùn)練次數(shù)為20,用戶向量維度d 為128 維。

      2.4 比較方法

      為了驗(yàn)證本文提出算法的表現(xiàn),我們將其與傳統(tǒng)的用戶協(xié)同過濾算法[5](User-CF)進(jìn)行比較。用戶協(xié)同過濾算法利用用戶對物品的評分矩陣計(jì)算兩個用戶的余弦相似度,為用戶推薦其未有過評分行為的物品。

      2.5 比較結(jié)果

      本文評估算法效果的指標(biāo)為Recall@10,Recall@15 和Recall@20。實(shí)驗(yàn)結(jié)果如表1 所示。

      表1 MovieLen 測試數(shù)據(jù)上的性能比較

      從實(shí)驗(yàn)結(jié)果可以看出使用DW-CF 算法產(chǎn)生的用戶向量可以有效度量任意兩個用戶的相似度,且度量的精度比傳統(tǒng)的用戶協(xié)同過濾算法更好。同時(shí),隨著召回列表規(guī)模的增加,DW-CF算法的優(yōu)勢越大,這說明興趣相似的用戶其在低維空間的余弦距離相近。

      3 結(jié)論

      DW-CF 算法可以有效地學(xué)習(xí)用戶之間的隱向量表示。將用戶圖結(jié)構(gòu)中產(chǎn)出的隨機(jī)游走序列作為輸入,我們的算法可以有效地學(xué)習(xí)出包含不同用戶群體興趣偏好的向量表示。將所得向量用于計(jì)算用戶的推薦列表,可以有效地得到用戶對各物品的興趣偏好,這可以更好的提升推薦系統(tǒng)的準(zhǔn)確性。然而,本文提出的算法只適用于靜態(tài)的用戶和物品的數(shù)據(jù)中,在實(shí)際的場景中,用戶節(jié)點(diǎn)是處于不斷變化當(dāng)中的,如何歸納計(jì)算動態(tài)的用戶向量,是此類推薦算法下一步研究的重點(diǎn)。

      猜你喜歡
      余弦物品向量
      稱物品
      向量的分解
      聚焦“向量與三角”創(chuàng)新題
      “雙十一”,你搶到了想要的物品嗎?
      誰動了凡·高的物品
      兩個含余弦函數(shù)的三角母不等式及其推論
      向量垂直在解析幾何中的應(yīng)用
      分?jǐn)?shù)階余弦變換的卷積定理
      圖像壓縮感知在分?jǐn)?shù)階Fourier域、分?jǐn)?shù)階余弦域的性能比較
      向量五種“變身” 玩轉(zhuǎn)圓錐曲線
      遂昌县| 虞城县| 新余市| 娄烦县| 铜鼓县| 五家渠市| 霍城县| 长春市| 兴山县| 大新县| 清流县| 科技| 兴海县| 南汇区| 平邑县| 黄浦区| 安泽县| 竹溪县| 吕梁市| 昌宁县| 盐边县| 济阳县| 鸡西市| 屯昌县| 柘城县| 资兴市| 佛坪县| 蒙城县| 河源市| 大兴区| 顺义区| 崇左市| 赫章县| 玉树县| 静宁县| 启东市| 扶余县| 安阳县| 宣武区| 田阳县| 平利县|