• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于項目屬性分類的協(xié)同過濾算法研究

    2018-08-24 07:48:04吳佳婧賀嘉楠王越群董立巖
    吉林大學學報(信息科學版) 2018年4期
    關鍵詞:指數(shù)函數(shù)相似性協(xié)同

    吳佳婧, 賀嘉楠, 王越群, 董立巖

    (1. 哈爾濱工程大學 計算機科學與技術學院, 哈爾濱 150001; 2. 吉林大學 計算機科學與技術學院, 長春 130012)

    0 引 言

    隨著計算機技術的飛速發(fā)展, 人類社會已經(jīng)逐步進入到電子信息時代。電子信息技術雖然改變了人們的生活方式, 提高了人們的工作效率, 但同時也給人們帶來了新的問題。隨著信息量的飛速增長, 使人們在信息檢索過程中很難找到正在需要的信息。推薦系統(tǒng)可以在一定程度上解決信息過載的問題, 因為其實用性, 推薦系統(tǒng)被國內外大多數(shù)的電子商務平臺所青睞。因此對推薦系統(tǒng)的研究和改進得到了越來越多研究者的關注, 而推薦算法則是推薦系統(tǒng)的核心。根據(jù)推薦的生成方式, 推薦算法大致可以分為基于內容的推薦系統(tǒng)以及基于協(xié)同過濾的推薦系統(tǒng)。

    協(xié)同過濾[1]推薦算法主要根據(jù)用戶或項目的相似度進行推薦, 其首要條件是需要找到目標用戶[2]的相似用戶或目標用戶喜好項目的近鄰項目, 進而可以為目標用戶推薦其興趣值較高的未產(chǎn)生評分行為的項目[3,4]。由此可見用戶間相似性的計算以及項目間相似性的計算對推薦系統(tǒng)的推薦準確率起到了重要的作用。對于傳統(tǒng)的相似性計算[5,6]并沒有考慮用戶以及項目自身的屬性, 僅僅將用戶項目評分矩陣[7-9]作為唯一的參考因素。

    傳統(tǒng)的相似性計算過程中只關注于用戶項目評分矩陣, 而忽略了用戶或項目本身的屬性特征, 筆者將項目自身的屬性標簽[10]結合到相似性計算公式中, 給出了基于權重調節(jié)的矩陣補全協(xié)同過濾推薦算法。

    1 基于權重調節(jié)的矩陣補全協(xié)同過濾

    1.1 算法思想

    項目的標簽不只有一種, 可以有很多種類, 對于一部電影而言, 既可以屬于喜劇, 也可以屬于情感類型, 所以在進行相似度計算時, 需要考慮每個項目的所有標簽類別[11,12], 項目的標簽重合度與項目的相似性成正比。

    如表1所示, 《女兒國》和《前任3》都屬于喜劇、 愛情類型, 與《紅海行動》類型相比, 這兩部電影的類型更為相似, 因此可以斷定這兩部電影的相似度更高。

    表1 基于項目屬性的協(xié)同過濾推薦算法基本原理

    定義1 項目屬性值Ii,x表示項目i是否具有屬性x。如果項目i具有屬性x, 則項目屬性值Ii,x的值為1, 如果項目i不具有屬性x, 則Ii,x置為0。

    定義2Ci,j表示項目i與項目j之間的屬性差異度, 即項目i和項目j所具有的不同屬性個數(shù)??赏ㄟ^項目i中的每個屬性值減去項目j中與之對應的每個屬性值獲得。計算方法如下

    其中n值由項目屬性種類個數(shù)決定。項目差異度Ci,j的值與項目之間的相同屬性標簽個數(shù)成反比。項目差異度的值越小, 代表兩個項目之間相同的屬性標簽

    表2 項目屬性統(tǒng)計表

    越多, 進而可以推測出兩個項目越相似。因此可以得出項目差異度與項目之間的相似性成反比。

    項目屬性如表2所示, 假設具有A、B、C 3個項目, 并給出S1到S5等5個屬性。每個項目都具有其相應的屬性值。可以通過項目屬性統(tǒng)計表獲得項目A、B、C之間的屬性差異度。

    3個項目之間的項目屬性差異度CA,B、CA,C、CB,C可由式(1)計算

    CA,B=|1-1|+|0-1|+|1-0|+|1-1|+|0-1|=3

    CA,C=|1-1|+|0-1|+|1-1|+|1-1|+|0-0|=1

    CB,C=|1-1|+|1-1|+|0-1|+|1-1|+|1-0|=2

    由計算可知CA,C

    圖1 指數(shù)函數(shù)y=e-x的圖像Fig.1 The image of the exponential function

    由于項目屬性差異度與項目之間的相似性有相關性, 所以將項目屬性差異度應用到計算相似度的person相關系數(shù)[8]中。由于項目屬性差異度的取值均為大于等于0的整數(shù), 所以需要對權值進行修正, 故引入指數(shù)函數(shù)y=e-x, 由指數(shù)函數(shù)圖像(見圖1)可知, 當自變量取值為非負時, 函數(shù)的值域區(qū)間為0~1。

    將項目屬性差異度與指數(shù)函數(shù)相結合, 作為屬性差異度的指數(shù)函數(shù), 并在計算兩個項目的相似度時, 引入屬性差異度的指數(shù)函數(shù)y=e-Ci,j, 并將差異度指數(shù)函數(shù)融入到person相關系數(shù)中, 進行相似度計算的優(yōu)化。改進后的person相關系數(shù)公式如下

    1.2 算法流程

    步驟1 獲得目標用戶u的已評分項目集合IRated, 通過與所有項目集進行差運算, 獲得目標用戶u的未評分但將要進行評分的項目集合IunRated。為目標

    表3 項目用戶統(tǒng)計表

    用戶u所推薦的項目將在IunRated中產(chǎn)生, 所以IunRated也是目標項目集合。

    步驟2 在評分矩陣中查詢對IunRated項目集合中的項目進行評分過的用戶集合與對IRated項目集合中的項目進行評分過的用戶集合, 二者求并集, 形成用戶集合U, 如表3所示。

    步驟3 利用

    即改進的person相關系數(shù)進行相似度計算, 主要計算目標用戶的目標項目j(j∈IunRated)與目標用戶已評分項目i(i∈IRated)之間的相似度。

    步驟4 獲得未評分項目j與已評分項目i的相似度后, 進行為評分項目j的評分預測, 評分預測公式如下

    Ru,j=Ru,iSsim(i,j)

    (4)

    所示。通過式(4)可以為目標用戶進行未評分項目的評分矩陣補全。

    步驟5 通過步驟4獲取目標用戶的目標項目集中所有項目的預測評分, 將評分按照由大致小的順序進行排列。

    步驟6 從步驟5中的項目集合序列中, 選取TopK個項目作為推薦結果, 推送給目標用戶。

    2 算法實現(xiàn)

    基于權重調節(jié)的矩陣補全協(xié)同過濾算法。

    輸入: 用戶評分矩陣Rmn, 分類差距矩陣Cnn, 目標用戶u, 目標用戶未評分項目k。

    輸出:u對k的預測評分score。

    1 ratsimTotal←0

    2 simTotal←0

    3 fori←1∶n4 if (Rui!=0)//用戶u對項目i有評分

    5Vi←?,Vk←?

    >6 forj←1∶m

    7 if (Rji!=0&&Rjk!=0)//用戶j對項目i、 項目k均有評分

    8Vi←Vi∪{Rji}

    9Vk←Vk∪{Rjk}

    10 end if

    11 end for

    12 similarity←sim(Vi,Vk)·eCki

    13 simTotal←simTotal+similarity

    14 ratSimTotal←ratSimTotal+similarity*Rui15 end if

    16 end for

    17 score←ratSimTotal/simTotal

    18 return score

    3 實驗結果與分析

    3.1 前期準備

    該實驗采用的數(shù)據(jù)集來自MovieLens ml-1M數(shù)據(jù)集, 由6 040個用戶以及3 900個電影組成, 并包含用戶對這些電影的評分記錄, 每個評分包括用戶評分的時間并以Timestamp形式表示, 其中評分是由5個等級構成, 分數(shù)越高代表用戶對電影的喜愛程度越高。

    以上數(shù)據(jù)記錄在3張信息表中, user表記錄了用戶的信息, movies表記錄了電影信息, ratings表記錄了評分信息。

    3.2 實驗結果與分析

    實驗1 在同一個數(shù)據(jù)集下, 比較添加了項目屬性因素的協(xié)同過濾算法與傳統(tǒng)協(xié)同過濾算法之間平均絕對值偏差MAE[13,14]的值, 測試改進的算法是否在推薦精度上有所提高。結果如圖2所示。

    實驗結果表明, 在傳統(tǒng)協(xié)同過濾算法中, 考慮項目屬性分類因素, 將項目屬性差異度指數(shù)函數(shù)融入到person相關系數(shù)中后獲得的基于項目的(Item-based)協(xié)同過濾算法, 其平均值絕對誤差值更小, 由此可以推斷, 改進的算法在推薦精度上有較大的提高。

    實驗2 在同一個數(shù)據(jù)集下, 比較添加了項目屬性因素的協(xié)同過濾算法與傳統(tǒng)協(xié)同過濾算法之間準確率Precision, 測試改進的算法是否在推薦準確率上有所提高, 得到如圖3所示的實驗結果。

    圖2 項目屬性分類對Item-based 圖3 項目屬性分類對Item-based 協(xié)同過濾MAE的影響 協(xié)同過濾命中率的影響 Fig.2 The item properties classified influence Fig.3 The item properties classified influence of Item-based CF on the MAE of Item-based CF on the hit rate

    由圖3可知, 改進的基于項目推薦的協(xié)同過濾算法, 在命中率上有很大的提高, 由原60%的命中率提升到80%。實驗結果表明, 結合了項目屬性分類的基于項目的(Item-based)協(xié)同過濾算法, 可以提高推薦的準確率, 證明改進的算法具有一定的優(yōu)勢。

    4 結 語

    筆者針對傳統(tǒng)的協(xié)同過濾算法進行了改進, 在傳統(tǒng)的協(xié)同過濾算法上, 考慮了項目屬性分類的因素。算法改進主要體現(xiàn)在算法的相似度計算上。通過構建項目屬性統(tǒng)計表, 對項目評分矩陣進行權重調節(jié), 并將項目屬性差異度以指數(shù)函數(shù)的形式作為改進的person相關系數(shù)的計算參數(shù)。通過實驗證明了改進算法的有效性, 在提升推薦準確度上有很大的突破。

    猜你喜歡
    指數(shù)函數(shù)相似性協(xié)同
    一類上三角算子矩陣的相似性與酉相似性
    冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)(2)
    冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)(1)
    蜀道難:車與路的協(xié)同進化
    科學大眾(2020年23期)2021-01-18 03:09:08
    冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)(1)
    冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)(2)
    淺析當代中西方繪畫的相似性
    河北畫報(2020年8期)2020-10-27 02:54:20
    “四化”協(xié)同才有出路
    汽車觀察(2019年2期)2019-03-15 06:00:50
    三醫(yī)聯(lián)動 協(xié)同創(chuàng)新
    低滲透黏土中氯離子彌散作用離心模擬相似性
    和田市| 奉化市| 新宁县| 云林县| 平顶山市| 甘德县| 永年县| 焉耆| 沂南县| 丽江市| 宜川县| 古交市| 铁力市| 鹤壁市| 小金县| 留坝县| 鄢陵县| 巴林左旗| 芜湖县| 界首市| 遂昌县| 莱州市| 新田县| 卢氏县| 邮箱| 贵南县| 独山县| 德阳市| 靖安县| 克山县| 盐山县| 洛南县| 苍梧县| 讷河市| 安化县| 巴楚县| 安丘市| 保定市| 化州市| 安国市| 江源县|