• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于用戶重復(fù)購(gòu)買(mǎi)記憶的推薦策略研究

      2018-07-25 06:13:34張沁哲
      電腦與電信 2018年5期
      關(guān)鍵詞:艾賓浩斯概率協(xié)同

      張沁哲

      1 引言

      隨著互聯(lián)網(wǎng)不斷深入人們的日常生活,已經(jīng)成為生活中不可或缺甚至最重要的組成部分。但同時(shí),信息量的井噴式增長(zhǎng),也給數(shù)據(jù)的處理帶來(lái)前所未有的困擾,尤其在電子商務(wù)推薦方面,商品的種類(lèi)不斷被創(chuàng)新,商品的數(shù)量不斷增長(zhǎng),用戶的交易量以指數(shù)級(jí)的速度爆發(fā)式增加。當(dāng)用戶面對(duì)如此之多的信息量時(shí),難以尋找到自身需求并且滿意的商品,因此電子商務(wù)推薦系統(tǒng)便應(yīng)運(yùn)而生,同時(shí)高質(zhì)量高精準(zhǔn)的推薦系統(tǒng)更是有助于用戶在海量商品中進(jìn)行選擇,并且縮短了用戶購(gòu)買(mǎi)商品所消耗的時(shí)間,同時(shí)提升用戶對(duì)電商網(wǎng)站的忠誠(chéng)度以及體驗(yàn)感,對(duì)于電商領(lǐng)域的商業(yè)利益最大化起到了至關(guān)重要的作用。

      傳統(tǒng)協(xié)同過(guò)濾算法主要基于項(xiàng)目[1]和用戶[2]進(jìn)行推薦,然而在對(duì)用戶重復(fù)購(gòu)買(mǎi)商品方面存在推薦弊端,經(jīng)常存在錯(cuò)誤推薦,并沒(méi)有合理地依據(jù)用戶近期的興趣愛(ài)好的變化進(jìn)行相關(guān)的推薦。本文則對(duì)用戶已經(jīng)購(gòu)買(mǎi)過(guò)的商品進(jìn)行分析,通過(guò)用戶重復(fù)購(gòu)買(mǎi)的記憶函數(shù),預(yù)測(cè)用戶對(duì)曾經(jīng)購(gòu)買(mǎi)過(guò)商品的再次購(gòu)買(mǎi)意圖進(jìn)行判斷,并在不同的記憶概率執(zhí)行相應(yīng)的推薦,以解決目前電子商務(wù)推薦系統(tǒng)存在的推薦不精確的問(wèn)題。

      2 相關(guān)工作

      2.1 傳統(tǒng)的協(xié)同過(guò)濾算法

      傳統(tǒng)的基于用戶的協(xié)同過(guò)濾算法使用與目標(biāo)用戶有關(guān)聯(lián)且行為以及交易記錄具有較高相似度的用戶群進(jìn)行匹配,通過(guò)相似用戶群購(gòu)買(mǎi)的商品進(jìn)行分析,將相似用戶購(gòu)買(mǎi)過(guò)且目標(biāo)用戶未曾購(gòu)買(mǎi)過(guò)的商品對(duì)目標(biāo)用戶進(jìn)行推薦。傳統(tǒng)的基于項(xiàng)目的協(xié)同過(guò)濾算法將目標(biāo)用戶購(gòu)買(mǎi)過(guò)的商品類(lèi)目進(jìn)行分析,分析出購(gòu)買(mǎi)此類(lèi)商品的用戶仍購(gòu)買(mǎi)其他哪些商品,并將已購(gòu)買(mǎi)此類(lèi)商品的用戶群仍購(gòu)買(mǎi)的商品對(duì)目標(biāo)用戶進(jìn)行推薦。與基于用戶和項(xiàng)目的推薦方式不同,基于模型的推薦算法則采用用戶對(duì)商品的評(píng)分和評(píng)價(jià)進(jìn)行推薦,并利用搭建的模型對(duì)用戶未來(lái)可能購(gòu)買(mǎi)的商品進(jìn)行預(yù)測(cè)評(píng)分。當(dāng)前基于模型的主要推薦算法有聚類(lèi)模型[3]、概率模型[4]等。

      傳統(tǒng)的協(xié)同過(guò)濾推薦在執(zhí)行相應(yīng)的推薦時(shí)對(duì)于用戶的評(píng)分信息過(guò)于依賴(lài),對(duì)于用戶重復(fù)購(gòu)買(mǎi)商品的時(shí)間信息以及記憶留存則存在一定的忽略,因此分析并掌握用戶重復(fù)購(gòu)買(mǎi)商品的記憶留存對(duì)推薦并預(yù)測(cè)用戶再次購(gòu)買(mǎi)此類(lèi)商品具有較高的價(jià)值。

      2.2 基于遺忘函數(shù)的推薦算法

      用戶興趣和商品類(lèi)別以及商品的屬性有著密不可分的關(guān)系,用戶對(duì)商品的喜好隨著年齡、職業(yè)、地區(qū)、時(shí)間等信息都不是固定不變的,尤其用戶在日常實(shí)際消費(fèi)的過(guò)程是一個(gè)動(dòng)態(tài)變化的過(guò)程,因此當(dāng)用戶的記憶或遺忘融入推薦算法中將對(duì)推薦的精確性有很重要的影響。

      鄭先榮等[5]借鑒心理學(xué)遺忘規(guī)律,提出了線性逐步遺忘協(xié)同過(guò)濾算法來(lái)解決協(xié)同過(guò)濾算法沒(méi)有考慮用戶興趣變化的問(wèn)題,并且主要通過(guò)依據(jù)用戶的評(píng)價(jià)時(shí)間點(diǎn)信息,通過(guò)逐步減小沒(méi)想評(píng)分的權(quán)重進(jìn)行推薦。邢曉春等[6]提出兩種改進(jìn)度量,包括采用時(shí)間的數(shù)據(jù)權(quán)重和項(xiàng)目相似度的數(shù)據(jù)權(quán)重,并通過(guò)融合策略,提出匹配用戶興趣變化的協(xié)同過(guò)濾推薦算法。

      2.3 艾賓浩斯記憶遺忘曲線

      德國(guó)心理學(xué)家艾賓浩斯(Ebbinghaus)對(duì)遺忘現(xiàn)象做了系統(tǒng)的研究,得出人對(duì)于事物的遺忘過(guò)程是非線性的,如圖1所示。

      圖1 艾賓浩斯遺忘曲線

      艾賓浩斯遺忘曲線,敘述了人對(duì)現(xiàn)實(shí)事件的記憶隨著時(shí)間的流逝逐漸降低的過(guò)程??梢詫⒂脩魧?duì)一類(lèi)事物的興趣愛(ài)好看作記憶,并根據(jù)圖像得出用戶對(duì)一類(lèi)事件的感興趣程度逐漸降低。

      運(yùn)用艾賓浩斯曲線的過(guò)程主要是在每一個(gè)時(shí)間點(diǎn)上,都存在對(duì)應(yīng)的興趣的熱度,記為h。有學(xué)者將艾賓浩斯曲線總結(jié)為一個(gè)持續(xù)量的函數(shù),如式(1):

      式中t為自變量,e為自然底數(shù),t、c為常數(shù),t0=0.00255,t0的值采用文獻(xiàn)[7]中通過(guò)實(shí)驗(yàn)所得到的值。

      3 融合記憶函數(shù)的協(xié)同過(guò)濾算法

      3.1 用戶重復(fù)購(gòu)買(mǎi)記憶函數(shù)

      用戶近期內(nèi)頻繁購(gòu)買(mǎi)同一類(lèi)型的商品受第一次購(gòu)買(mǎi)的行為有很大影響。而且隨著時(shí)間的消磨,用戶的購(gòu)買(mǎi)記憶同樣在一定程度上衰減,對(duì)用戶下一次購(gòu)買(mǎi)商品的影響也不斷消減,因此對(duì)用戶重復(fù)購(gòu)買(mǎi)時(shí)我們需要將重復(fù)購(gòu)買(mǎi)的記憶考慮到推薦中。

      尤其是在電商網(wǎng)購(gòu)中存在數(shù)據(jù)丟失的現(xiàn)象,例如用戶第一次在網(wǎng)上購(gòu)買(mǎi)零食后,用戶下一次也許會(huì)去另一家電商進(jìn)行購(gòu)買(mǎi),也可能在線下的商場(chǎng)進(jìn)行購(gòu)買(mǎi),因此對(duì)用戶重復(fù)購(gòu)買(mǎi)記憶函數(shù)進(jìn)行計(jì)算時(shí)我們需要考慮以上情況。

      11月30日,由北京市商務(wù)局主辦,北京烹飪協(xié)會(huì)承辦,北京各兄弟協(xié)會(huì)、餓了么星選及有關(guān)新聞媒體協(xié)辦的為期3個(gè)月的第二屆中國(guó)京菜美食文化節(jié)活動(dòng)落下帷幕。北京市區(qū)和郊區(qū)累計(jì)有100多個(gè)餐飲品牌、3000多家餐飲門(mén)店參加文化節(jié)。據(jù)不完全統(tǒng)計(jì),有近兩億人次關(guān)注與參與,總消費(fèi)收入達(dá)到61億元,占北京市同期餐飲總收入的21%,京菜引領(lǐng)作用明顯,中國(guó)京菜美食文化節(jié)的覆蓋范圍和傳播力顯著提升。

      為此我們將預(yù)測(cè)目標(biāo)用戶u在時(shí)間點(diǎn)t對(duì)y類(lèi)商品的購(gòu)買(mǎi)記憶函數(shù),如式(2)所示:

      其中,Rm(y)是指目標(biāo)用戶對(duì)曾經(jīng)已經(jīng)購(gòu)買(mǎi)過(guò)的y類(lèi)型商品之后仍有購(gòu)買(mǎi)可能性的記憶程度,代表著目標(biāo)用戶已購(gòu)買(mǎi)后仍重復(fù)購(gòu)買(mǎi)y類(lèi)商品的概率,通過(guò)公式(3)對(duì)Rm(y)進(jìn)行計(jì)算:

      其中,M(y)代表用戶群中第一次購(gòu)買(mǎi)y類(lèi)商品的數(shù)量,Mt(y*)代表第一次購(gòu)買(mǎi)y類(lèi)商品后仍然再次購(gòu)買(mǎi)y*(y*是指與y同類(lèi)型的商品)類(lèi)商品的用戶數(shù)。

      Rm(u,t,y)代表用戶群對(duì)y類(lèi)商品在不同間隔時(shí)間段內(nèi)的購(gòu)買(mǎi)記憶函數(shù),并且使用指數(shù)函數(shù)對(duì)記憶函數(shù)存在的遺忘以及衰弱性進(jìn)行估算,因此購(gòu)買(mǎi)記憶函數(shù)為:

      其中,Y代表時(shí)間點(diǎn)t到來(lái)的瞬間已經(jīng)執(zhí)行完購(gòu)買(mǎi)記錄的集合,指數(shù)函數(shù)的概率參數(shù)值用Y表示。

      因此通過(guò)式(2),我們可以得出用戶購(gòu)買(mǎi)商品的記憶函數(shù)圖像,通過(guò)圖像可以得到不同重復(fù)購(gòu)買(mǎi)時(shí)間點(diǎn)上用戶尚留存的記憶概率,同時(shí)可以通過(guò)y軸所對(duì)應(yīng)的數(shù)據(jù)得到用戶對(duì)y類(lèi)商品的最高留存記憶時(shí)間點(diǎn)對(duì)應(yīng)的概率。最后通過(guò)歸一化來(lái)對(duì)所有的用戶重復(fù)購(gòu)買(mǎi)記憶時(shí)間點(diǎn)所對(duì)應(yīng)的概率進(jìn)行計(jì)算,如式(5)所示:

      其中,Dit代表用戶對(duì)y類(lèi)商品不同時(shí)間點(diǎn)t所對(duì)應(yīng)的購(gòu)買(mǎi)記憶留存的概率,通過(guò)式(5),可以將購(gòu)買(mǎi)記憶留存的概率值歸一化為介于(0,1)之間。

      3.2 融合于協(xié)同過(guò)濾算法

      傳統(tǒng)的協(xié)同過(guò)濾算法主要基于用戶對(duì)于商品的評(píng)分進(jìn)行推薦,本文則將用戶在已購(gòu)買(mǎi)商品后,在不同時(shí)間點(diǎn)重復(fù)購(gòu)買(mǎi)商品的記憶留存概率與傳統(tǒng)協(xié)同過(guò)濾算法進(jìn)行融合,并在不同間隔時(shí)間執(zhí)行相應(yīng)的推薦排序集,使得推薦更加精確。

      步驟一:創(chuàng)建用戶和商品類(lèi)別矩陣;

      步驟二:采用Pearson[8]計(jì)算用戶之間的相似性sim(a,b):

      其中,R為用戶a和b購(gòu)買(mǎi)并評(píng)分的商品;-Ra、-Rb代表用戶a和b的交易記錄中的平均評(píng)分。

      步驟三:選取前K個(gè)評(píng)分較高的用戶,并根據(jù)相似度和用戶購(gòu)買(mǎi)商品評(píng)分,預(yù)測(cè)目標(biāo)用戶對(duì)商品c的購(gòu)買(mǎi)評(píng)分Pc。

      通過(guò)式(7)得出評(píng)分前10作為商品推薦集P。

      步驟四:通過(guò)計(jì)算用戶重復(fù)購(gòu)買(mǎi)不同時(shí)間點(diǎn)所留存的記憶概率與推薦預(yù)測(cè)評(píng)分的相乘得出新的評(píng)分排序,并且得到最終的推薦集P*,如式(8):

      4 實(shí)驗(yàn)

      4.1 實(shí)驗(yàn)數(shù)據(jù)

      本文實(shí)驗(yàn)數(shù)據(jù)采用2014年阿里巴巴集團(tuán)舉辦的“天池”大數(shù)據(jù)競(jìng)賽所用的數(shù)據(jù),數(shù)據(jù)包括六個(gè)月內(nèi)851名用戶對(duì)9456件商品的購(gòu)買(mǎi)以及評(píng)分記錄。本文使用用戶購(gòu)買(mǎi)商品屬性、購(gòu)買(mǎi)時(shí)間和對(duì)商品的評(píng)分進(jìn)行實(shí)驗(yàn)并分析。前四個(gè)月的數(shù)據(jù)作為訓(xùn)練集,后兩個(gè)月的數(shù)據(jù)作為測(cè)試集進(jìn)行預(yù)測(cè)并對(duì)照傳統(tǒng)的協(xié)同過(guò)濾推薦算法。

      4.2 生成推薦集P*

      如表1,通過(guò)將用戶重復(fù)購(gòu)買(mǎi)記憶函數(shù)與傳統(tǒng)的基于協(xié)同過(guò)濾推薦算法進(jìn)行融合,生成最終的推薦集P*。

      表1 推薦集P與P*

      4.3 商品推薦準(zhǔn)確性的評(píng)價(jià)標(biāo)準(zhǔn)

      本文提出基于用戶記憶函數(shù)的協(xié)同過(guò)濾推薦算法,采用推薦準(zhǔn)確率(Precision)作為該算法的評(píng)價(jià)標(biāo)準(zhǔn)。它是一個(gè)最基礎(chǔ)的衡量推薦系統(tǒng)精確度的評(píng)價(jià)方式,表示在推薦的所有商品中,用戶點(diǎn)擊并訪問(wèn)或者用戶成功購(gòu)買(mǎi)所占的比例,比例越大則證明推薦精確度越高。

      其中Hits代表推薦集中被用戶所產(chǎn)生購(gòu)買(mǎi)的數(shù)量,N則表示推薦的總數(shù)量。

      4.4 實(shí)驗(yàn)結(jié)果

      圖2 改進(jìn)協(xié)同過(guò)濾與傳統(tǒng)協(xié)同過(guò)濾推薦算法比較

      通過(guò)圖2我們可以看出,與傳統(tǒng)協(xié)同過(guò)濾推薦算法相比,融合了重復(fù)購(gòu)買(mǎi)記憶函數(shù)的協(xié)同過(guò)濾算法在推薦精確度方面有明顯的提高,同時(shí)能夠給用戶更適合的推薦體驗(yàn)。

      5 結(jié)論

      與傳統(tǒng)的協(xié)同過(guò)濾算法相比,考慮了用戶購(gòu)買(mǎi)記憶的協(xié)同過(guò)濾推薦算法,在推薦時(shí)更能夠了解用戶的實(shí)時(shí)興趣愛(ài)好的動(dòng)態(tài)變化,針對(duì)個(gè)性化推薦更有效,避免了一些錯(cuò)誤的推薦,不僅為電子商務(wù)系統(tǒng)節(jié)省了推薦資源,同時(shí)減少了對(duì)用戶不必要的困擾,在一定程度上提升了推薦的精確度。

      猜你喜歡
      艾賓浩斯概率協(xié)同
      第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
      第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
      概率與統(tǒng)計(jì)(一)
      概率與統(tǒng)計(jì)(二)
      蜀道難:車(chē)與路的協(xié)同進(jìn)化
      試析艾賓浩斯記憶法在中小學(xué)音樂(lè)教學(xué)中的應(yīng)用
      黃河之聲(2019年1期)2019-12-16 02:09:22
      “四化”協(xié)同才有出路
      三醫(yī)聯(lián)動(dòng) 協(xié)同創(chuàng)新
      到底誰(shuí)大誰(shuí)小
      從艾賓浩斯遺忘曲線談德語(yǔ)教學(xué)
      巴林左旗| 基隆市| 淮阳县| 潜山县| 当雄县| 武强县| 蓝山县| 太谷县| 左权县| 阳朔县| 大关县| 天全县| 宁津县| 虹口区| 德州市| 合肥市| 徐汇区| 阳曲县| 湾仔区| 夏河县| 沾益县| 安宁市| 昆明市| 安图县| 利川市| 六盘水市| 曲阜市| 临朐县| 高清| 霍邱县| 云南省| 马公市| 滨海县| 晋宁县| 循化| 镇赉县| 景洪市| 金塔县| 芮城县| 四子王旗| 晋宁县|