• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      引入用戶情感偏好矩陣的ItemCF算法研究

      2019-07-08 03:41:08岳強(qiáng)郭強(qiáng)李仁德
      軟件導(dǎo)刊 2019年6期
      關(guān)鍵詞:推薦算法

      岳強(qiáng) 郭強(qiáng) 李仁德

      摘 要:傳統(tǒng)基于物品的協(xié)同過(guò)濾算法(ItemCF)利用物品間的相似性為用戶提供個(gè)性化推薦,然而該方法僅考慮了評(píng)分?jǐn)?shù)據(jù),而未關(guān)注用戶情感偏好?;趶脑u(píng)論中的emoji表情提煉出的用戶情感偏好,提出一種引入用戶情感編號(hào)矩陣的ItemCF算法。該方法利用物品共現(xiàn)矩陣與用戶情感偏好矩陣計(jì)算物品相似度,進(jìn)而進(jìn)行個(gè)性化推薦。根據(jù)某在線互聯(lián)網(wǎng)教育實(shí)證數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,該方法相比于傳統(tǒng)基于物品的協(xié)同過(guò)濾算法,在準(zhǔn)確率和召回率上都有所提升,在Top1-5推薦均值上分別提高了0.02和0.03。

      關(guān)鍵詞:推薦算法;ItemCF;用戶情感偏好;emoji表情

      DOI:10. 11907/rjdk. 182557

      中圖分類號(hào):TP312

      文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-7800(2019)006-0056-04

      Abstract: The traditional item-based collaborative filtering (ItemCF) algorithm makes use of similarity between items to make individual recommendation to users. However, ItemCF only considers rating data and does not pay attention to usersemotional preferences. Based on user emotional preferences extracted from emoji expressions in reviews, an ItemCF algorithm with user emotional numbering matrix is proposed. This method uses the item co-occurrence matrix and the users affective preference matrix to calculate the item similarity, and then carries on the personalized recommendation. Experimental results on an online Internet education data set show that the proposed method outperforms the traditional item-based collaborative filtering algorithm in terms of accuracy and recall, and improves by 0.02 and 0.03 respectively on the average of Top1-5 recommendation.

      Key Words: recommendation algorithms; ItemCF; user emotional preferences; emoji exprersions

      0 引言

      推薦是解決當(dāng)今互聯(lián)網(wǎng)信息過(guò)載問(wèn)題的主要途徑之一[1],為此國(guó)內(nèi)外眾多專家、學(xué)者們研究了各類推薦算法。其中,協(xié)同過(guò)濾(Collaboration Filtering)推薦是目前應(yīng)用最廣泛的個(gè)性化推薦算法[2]。其核心思想是,利用目標(biāo)用戶的相似用戶對(duì)特定物品的評(píng)價(jià),產(chǎn)生該用戶對(duì)此物品的評(píng)價(jià)預(yù)測(cè)[3-5]。協(xié)同過(guò)濾算法的最大優(yōu)點(diǎn)是對(duì)推薦對(duì)象沒(méi)有特殊要求,能處理電影、音樂(lè)等難以進(jìn)行文本結(jié)構(gòu)化表示的對(duì)象[6-7]。但協(xié)同過(guò)濾算法存在評(píng)分?jǐn)?shù)據(jù)稀疏性等問(wèn)題,并且只考慮了用戶評(píng)分?jǐn)?shù)據(jù),卻忽略了用戶本身的情感偏好[8]。

      與此同時(shí),emoji表情已成為當(dāng)今世界人們相互溝通的一個(gè)必不可少的工具[9-10],幾乎所有社交平臺(tái)都在廣泛使用emoji表情符號(hào)[11-12]。Novak等[13]認(rèn)為emoji表情是用于表達(dá)情感和想法,并將情感可視化的一種符號(hào);Vidal等[14]研究發(fā)現(xiàn),在推特上12 260條關(guān)于早餐、午餐和晚餐的推文中,emoji表情比文字更頻繁地用來(lái)表達(dá)用戶情感。對(duì)emoji表情的分析與研究是未來(lái)的趨勢(shì)[15],為此本文嘗試從評(píng)論的emoji表情中提煉出用戶情感偏好,提出一種引入用戶情感偏好矩陣的ItemCF推薦算法。通過(guò)提取評(píng)論中的emoji表情,依據(jù)情感分成積極、中立和消極3類,并分別給每類情感賦予不同權(quán)重;然后計(jì)算不同類emoji表情數(shù)量的加權(quán)和以表征用戶情感,構(gòu)建出用戶情感偏好矩陣;最后利用物品同現(xiàn)矩陣計(jì)算物品間的相似度,進(jìn)而進(jìn)行個(gè)性化推薦。

      1 情感計(jì)算

      本文采用某在線互聯(lián)網(wǎng)教育中的用戶評(píng)論數(shù)據(jù)集,評(píng)估本文算法的性能。該數(shù)據(jù)集包含2017年1~3月間共1 324 501條用戶評(píng)論記錄,其中用戶評(píng)論是指用戶在選擇過(guò)的某一社團(tuán)刊物(下文簡(jiǎn)稱為“社刊”)上發(fā)表的評(píng)論,一個(gè)用戶可對(duì)某一社刊進(jìn)行多次評(píng)論。本文定義上述實(shí)證數(shù)據(jù)為原始數(shù)據(jù),在原始數(shù)據(jù)中不難發(fā)現(xiàn)用戶會(huì)在社刊上發(fā)表帶有emoji表情的評(píng)論。經(jīng)統(tǒng)計(jì)可知,有emoji表情評(píng)論記錄的社刊占所有社刊數(shù)量的89%。

      1.1 emoji表情提取

      在計(jì)算用戶情感之前,需要對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與emoji表情提取。首先刪除不含emoji表情的評(píng)論記錄;其次,用戶在評(píng)論中發(fā)表的不同emoji表情數(shù)量通常不大于3種,為防止用戶灌水,即在一條評(píng)論中發(fā)送很多不同的emoji表情,刪除表情種類多于3種的記錄;接下來(lái)考慮到極少社刊擁有的用戶數(shù)小于3個(gè),其中擁有用戶數(shù)為1的社刊,唯一一個(gè)用戶為社刊創(chuàng)刊者,為保證社刊品質(zhì),刪除擁有用戶數(shù)小于3個(gè)的社刊記錄。

      本文定義原始數(shù)據(jù)在經(jīng)過(guò)上述3個(gè)步驟后保留下來(lái)的數(shù)據(jù)為篩選數(shù)據(jù)。為了獲得更稠密的數(shù)據(jù),本文在篩選數(shù)據(jù)上構(gòu)造了投影網(wǎng)絡(luò)[16],即將某用戶評(píng)論過(guò)某一社刊視作一個(gè)新單元節(jié)點(diǎn),若與其它單元節(jié)點(diǎn)存在相同用戶或社刊則產(chǎn)生連邊。最后,在投影網(wǎng)絡(luò)上應(yīng)用k核分解[17]。實(shí)驗(yàn)中k取最大值3 442,便可得到最核心的單元節(jié)點(diǎn)。

      從上述最大k值所對(duì)應(yīng)的單元節(jié)點(diǎn)中,保留用戶和社刊信息,并分別定義該部分用戶與社刊為核心用戶和核心社刊,再?gòu)暮Y選數(shù)據(jù)中篩選出包含該部分核心用戶與社刊的評(píng)論數(shù)據(jù),即篩選后的評(píng)論數(shù)據(jù)是由核心用戶對(duì)核心社刊所發(fā)表的包含emoji表情的評(píng)論數(shù)據(jù),本文定義該部分?jǐn)?shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù)。至此,數(shù)據(jù)清洗及emoji表情提取工作全部結(jié)束。

      1.2 用戶情感計(jì)算

      經(jīng)過(guò)數(shù)據(jù)清洗,得到15 370條數(shù)據(jù)記錄。在這些記錄中共提取出126種emoji表情,并由7名志愿者將所有表情主觀地分成3類,分別為:積極、中立和消極。為了檢驗(yàn)志愿者主觀分類結(jié)果的一致性,避免出現(xiàn)某個(gè)志愿者胡亂分類的情況,本文對(duì)分類結(jié)果進(jìn)行了Krippendorff's alpha檢驗(yàn)[18]。當(dāng)Alpha值大于基準(zhǔn)值0.6時(shí),表明不同志愿者分類結(jié)果間的差異是可以被接受的[19]。文中實(shí)驗(yàn)的Alpha值為0.706 9,大于基準(zhǔn)值0.6,所以志愿者的分類結(jié)果是可取的。之后,對(duì)7名志愿者的分類結(jié)果取眾數(shù),即獲得相應(yīng)emoji表情的所屬分類。

      4 結(jié)語(yǔ)

      emoji表情已成為互聯(lián)網(wǎng)時(shí)代必不可少的元素之一,是人們表達(dá)情感的重要載體。通過(guò)分析海量emoji表情信息,可以了解用戶情緒狀況、對(duì)某個(gè)社會(huì)現(xiàn)象的觀點(diǎn),以及對(duì)某款產(chǎn)品的偏好等。本文從用戶情感角度入手,將emoji表情引入到ItemCF推薦算法中,但推薦效果依賴于評(píng)論中emoji 表情轉(zhuǎn)化成用戶情感的準(zhǔn)確性。因此,未來(lái)工作可對(duì)文中emoji表情進(jìn)行更加細(xì)致的分類,使提煉出的用戶情感更為精確,從而提高推薦效果。

      參考文獻(xiàn):

      [1] 劉建國(guó),周濤,郭強(qiáng),等. 個(gè)性化推薦系統(tǒng)評(píng)價(jià)方法綜述[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2009, 6(3): 1-10.

      [2] 周軍鋒,湯顯,郭景峰. 一種優(yōu)化的協(xié)同過(guò)濾推薦算法[J]. 計(jì)算機(jī)研究與發(fā)展,2004, 41(10): 1842-1847.

      [3] 鄧曉懿,金淳, 韓慶平,等. 基于情境聚類和用戶評(píng)級(jí)的協(xié)同過(guò)濾推薦模型[J]. 系統(tǒng)工程理論與實(shí)踐,2013,33(11): 2945-2953.

      [4] 熊聰聰,鄧瀅,史艷翠,等. 基于協(xié)同過(guò)濾的美食推薦算法[J]. 計(jì)算機(jī)應(yīng)用研究,2017,34(7):1985-1988.

      [5] 鄧愛(ài)林,左子葉,朱揚(yáng)勇. 基于項(xiàng)目聚類的協(xié)同過(guò)濾推薦算法[J]. ?小型微型計(jì)算機(jī)系統(tǒng),2004,25(9):1665-1670.

      [6] 羅辛,歐陽(yáng)元新,熊璋,等. 通過(guò)相似度支持度優(yōu)化基于K近鄰的協(xié)同過(guò)濾算法[J]. 計(jì)算機(jī)學(xué)報(bào), 2010,33(8): 1437-1445.

      [7] 榮輝桂,火生旭,胡春華,等. 基于用戶相似度的協(xié)同過(guò)濾推薦算法[J]. 通信學(xué)報(bào),2014,13(2):16-24.

      [8] 馬宏偉,張光衛(wèi),李鵬. 協(xié)同過(guò)濾推薦算法綜述[J]. 小型微型計(jì)算機(jī)系統(tǒng),2009,30(7):1282-1288.

      [9] 趙屹星垚. Emoji表情中的受眾心理研究[J]. 設(shè)計(jì)藝術(shù)研究, 2016,6(1):46-49.

      [10] 金芊芊. Emoji表情符號(hào)的藝術(shù)價(jià)值[J]. 常州工學(xué)院學(xué)報(bào):社科版,2017,35(3): 52-55.

      [11] 楊莞桐. 青年群體emoji表情符號(hào)使用情況調(diào)查與研究[J]. 人間,2016,217(22):17-19.

      [12] TANG D, QIN B, LIU T. Document modeling with gated recurrent neural network for sentiment classification[C]. Conference on Empirical Methods in Natural Language Processing,2015: 1422-1432.

      [13] NOVAK P K, SMAILOVI? J, SLUBAN B, et al. Sentiment of emojis[J]. ?PloS one, 2015, 10(12): e0144296.

      [14] VIDAL L, ARES G, JAEGER S R. Use of emoticon and emoji in tweets for food-related emotional expression[J]. Food Quality & Preference, 2015, 49(6): 119-128.

      [15] 許雅. 移動(dòng)社交語(yǔ)境下Emoji表情的傳播態(tài)勢(shì)與功能探究[J]. ?新媒體研究,2016, 2(8): 24-28.

      [16] J?SCHKE R,MARINHO L,HOTHO A,et al. Tag recommendations in folksonomies[M]. Knowledge Discovery in Databases:PKDD 2007. Springer Berlin Heidelberg, 2007:506-514.

      [17] BATAGELJ V, ZAVER?NIK M. Generalized cores[J]. arXiv preprint cs/0202039,2002.

      [18] KRIPPENDORFF K. Agreement and information in the reliability of coding[J]. Communication Methods and Measures,2011,5(2): 93-112.

      [19] HAYES A F. SPSS macro for computing Krippendorff's alpha[J]. ?Retrieved September, 2006, 6(4):17-20.

      [20] 項(xiàng)亮. 推薦系統(tǒng)實(shí)踐[M]. 北京:人民郵電出版社,2012.

      (責(zé)任編輯:黃 ?。?/p>

      猜你喜歡
      推薦算法
      基于內(nèi)容的互聯(lián)網(wǎng)推薦算法
      一種改進(jìn)用戶相似度的協(xié)同過(guò)濾推薦算法
      XGBoost算法在電子商務(wù)商品推薦中的應(yīng)用
      基于二分Kmeans的協(xié)同過(guò)濾推薦算法
      校園社交平臺(tái)中標(biāo)簽系統(tǒng)的研究
      基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過(guò)濾推薦算法研究
      社交網(wǎng)絡(luò)推薦系統(tǒng)
      混合推薦算法在電影推薦中的研究與評(píng)述
      一種改進(jìn)的基于位置的推薦算法
      基于情景感知的高校移動(dòng)社交網(wǎng)絡(luò)平臺(tái)設(shè)計(jì)與開(kāi)發(fā)
      张家口市| 珠海市| 乃东县| 庐江县| 拜城县| 准格尔旗| 郴州市| 化德县| 永德县| 容城县| 宣武区| 鹤庆县| 老河口市| 咸丰县| 丘北县| 濉溪县| 肥西县| 香河县| 淮北市| 疏附县| 延吉市| 六枝特区| 桃园县| 遂宁市| 三穗县| 松溪县| 普格县| 朔州市| 台中市| 巴彦淖尔市| 林周县| 伽师县| 荥经县| 彭泽县| 醴陵市| 雅安市| 屯门区| 都昌县| 罗江县| 邹平县| 台北县|