• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    推薦算法研究進(jìn)展

    2022-03-03 13:46:24李孟浩趙學(xué)健余云峰宋學(xué)永孫知信
    關(guān)鍵詞:冷啟動卷積神經(jīng)網(wǎng)絡(luò)

    李孟浩,趙學(xué)健,余云峰,宋學(xué)永,孫知信

    1(南京郵電大學(xué) 現(xiàn)代郵政學(xué)院,南京 210003) 2(國基北盛(南京)科技發(fā)展有限公司,南京 210001)

    1 引 言

    互聯(lián)網(wǎng)信息的爆炸性增長是當(dāng)今時(shí)代蓬勃發(fā)展的標(biāo)志.人們每天都可以輕松獲得足夠的信息,大數(shù)據(jù)時(shí)代讓人們在生活、學(xué)習(xí)、工作等方方面面都收獲了巨大的便利.但如今每天新增的數(shù)據(jù)量字節(jié)數(shù)達(dá)到了驚人的1018量級,信息數(shù)據(jù)量增長速度之快已經(jīng)大大超出了人們的接受范圍,人們在面對廣泛的,各種各樣的信息時(shí)時(shí)常會感到無助.“信息過載”甚至將用戶淹沒在信息的海洋中[1,2].到底該如何獲得自己真正想要的信息成了一個(gè)主要問題.

    搜索引擎可以幫助人們在廣闊的信息海中搜索并找到他們想要的東西,但是,搜索引擎只是接受命令并被動地服從命令,不會主動而獨(dú)立的提供用戶感興趣的信息.推薦系統(tǒng)在此背景下初顯鋒芒.推薦系統(tǒng)可以幫助用戶避免信息超載,為其提供符合自身需求的推薦,提高信息的有效利用.因此,推薦系統(tǒng)已經(jīng)成為了社會各界研究的熱點(diǎn)問題.在社交網(wǎng)絡(luò)、音樂電影推薦[2,3]以及電商平臺等各個(gè)領(lǐng)域都能看見推薦系統(tǒng)的應(yīng)用[4].

    本文將目前的主流推薦算法進(jìn)行分類,并對推薦算法涉及的評價(jià)指標(biāo)進(jìn)行了總結(jié)歸納.在此基礎(chǔ)上,分別介紹了傳統(tǒng)推薦算法以及基于神經(jīng)網(wǎng)絡(luò)的推薦算法的最新研究進(jìn)展,對推薦算法的未來的發(fā)展方向以及研究熱點(diǎn)進(jìn)行了總結(jié)展望.

    2 推薦算法分類

    推薦算法是推薦系統(tǒng)的核心,傳統(tǒng)推薦算法主要分為3類:基于內(nèi)容的推薦算法,協(xié)同過濾(CF)的推薦算法和混合推薦算法[5,6].

    基于內(nèi)容的推薦是搜尋用戶過去偏好的項(xiàng)目,通過產(chǎn)生與之類似相似的項(xiàng)目來進(jìn)行推薦.協(xié)同過濾算法主要分成兩大類,一種是基于記憶的協(xié)同過濾,另外一種是基于模型的協(xié)同過濾,而基于用戶以及基于項(xiàng)目的協(xié)同過濾都屬于基于記憶的協(xié)同過濾[7],并且在推薦算法中應(yīng)用是最廣泛的.混合推薦是通過將多種單一的算法相結(jié)合形成推薦性能高于原單一算法的多融合算法,下文也會對混合算法也可以進(jìn)行更細(xì)致的分類.與協(xié)同過濾算法相比,基于內(nèi)容的推薦算法對用戶的歷史數(shù)據(jù)沒有過多要求,也很少出現(xiàn)數(shù)據(jù)稀疏和冷啟動的問題.但是,該算法的可擴(kuò)展性很差,該方法不適合多媒體數(shù)據(jù)的推薦也是由于其特征提取方法的局限性.協(xié)同過濾算法具有豐富的推薦結(jié)果,易于找到用戶的興趣和愛好.但是,協(xié)同過濾算法有嚴(yán)重的數(shù)據(jù)稀疏性和冷啟動問題.混合推薦算法在某種程度上改善了稀疏性和冷啟動問題,但其框架復(fù)雜且難以實(shí)現(xiàn).

    深度學(xué)習(xí)在機(jī)器學(xué)習(xí)領(lǐng)域扮演著重要的角色,近幾十年來,深度學(xué)習(xí)憑借其技術(shù)優(yōu)勢在計(jì)算機(jī)視覺等眾多領(lǐng)域取得了巨大的成功[8].學(xué)術(shù)界和工業(yè)界正在競相將深度學(xué)習(xí)應(yīng)用到更廣泛的應(yīng)用領(lǐng)域,這是因?yàn)樗心芰鉀Q許多復(fù)雜的任務(wù),同時(shí)提供最先進(jìn)的成果,推薦系統(tǒng)就是其中之一,將深度學(xué)習(xí)應(yīng)用到推薦系統(tǒng)中也是現(xiàn)在的研究熱點(diǎn).

    本文主要介紹的算法分類如圖1所示.

    圖1 文章介紹的算法分類圖Fig.1 Classification diagram of recommendation algorithms

    3 算法理論基礎(chǔ)

    推薦算法的評價(jià)方法主要包含在線和離線兩種方式,如表1所示.在線評價(jià)方式可以通過調(diào)查問卷或者在線實(shí)驗(yàn)的方式實(shí)現(xiàn);離線方式主要是指離線實(shí)驗(yàn)分析.推薦算法的評價(jià)指標(biāo)主要包括用戶滿意度、評分預(yù)測、準(zhǔn)確率、平均準(zhǔn)確率、召回率、覆蓋率、多樣性、新穎性、驚喜度、實(shí)時(shí)性、健壯性等.

    表1 推薦算法重要評價(jià)指標(biāo)表Table 1 Evaluation index of recommendation algorithms

    評分預(yù)測的預(yù)測準(zhǔn)確度一般根據(jù)均方根誤差(RMSE)和平均絕對誤差(MAE)計(jì)算.RMSE定義如下式:

    (1)

    MAE采用絕對值計(jì)算預(yù)測誤差,定義如下:

    (2)

    推薦算法的準(zhǔn)確率是指根據(jù)用戶在訓(xùn)練集上的行為為用戶做出的推薦列表與用戶在測試集上的行為列表的交集與為用戶做出的推薦列表的比值,計(jì)算如公式(3)所示:

    (3)

    推薦算法的召回率是指根據(jù)用戶在訓(xùn)練集上的行為為用戶做出的推薦列表與用戶在測試集上的行為列表的交集與用戶在測試集上的行為列表的比值,計(jì)算如公式(4)所示:

    (4)

    其中,用戶在測試集上表現(xiàn)出的行為列表用T(u)表示,R(u)表示根據(jù)訓(xùn)練數(shù)據(jù)集推薦系統(tǒng)給用戶提供的推薦列表.

    覆蓋率描述的是給每個(gè)用戶進(jìn)行Top(N)推薦時(shí),推薦物品數(shù)占物品總數(shù)的比例.推薦算法的覆蓋率高并不代表該算法一定有精確的推薦能力,但覆蓋率作為一個(gè)重要的推薦系統(tǒng)性能評價(jià)指標(biāo)一樣不容忽視.覆蓋率定義如公式(5)所示:

    (5)

    其中I表示總物品集合,R(u)表示經(jīng)過推薦算法生成的長度為N的商品推薦列表,用戶集合則用U來表示.

    多樣性是指推薦算法生成的推薦列表不能只是滿足用戶的單個(gè)興趣點(diǎn),而是要能夠滿足用戶的多個(gè)興趣點(diǎn),從而能夠提高用戶滿意度.多樣性計(jì)算公式如下:

    (6)

    其中,s(i,j)表示的是不同物品之間的相似度,s(i,j)∈[0,1];R(u)表示經(jīng)過推薦算法生成的商品推薦列表.

    新穎性用來描述算法能夠給用戶提供新穎商品,即用戶未知商品能力的技術(shù)指標(biāo).推薦算法的新穎性指標(biāo)很難通過實(shí)驗(yàn)的方法進(jìn)行定量分析,往往是通過調(diào)查問卷的方式獲得.

    驚喜度是近年來推薦算法評價(jià)指標(biāo)中最熱門的話題,驚喜度和新穎性有相似之處,都是推薦與用戶歷史瀏覽商品不相似的商品,但是驚喜度指的是用戶在接受推薦后對此商品很滿意.簡單來說新穎性是推薦讓用戶覺得耳目一新的商品,而驚喜度則是讓用戶覺得耳目一新的同時(shí)還給予了高度評價(jià).目前驚喜度的度量方式可以通過定義相似度區(qū)分推薦商品和用戶歷史喜歡的商品,再經(jīng)過線上的問卷調(diào)查得知用戶的滿意程度,如果最后被用戶接受則這就成為了驚喜度高的推薦.

    實(shí)時(shí)性顧名思義就是要在某些商品還具有時(shí)效性的時(shí)候及時(shí)的推薦給用戶,例如新聞這種時(shí)效性作為最高屬性的物品.推薦算法的實(shí)時(shí)性要求能夠?qū)崟r(shí)的更新推薦給用戶的列表,用戶的需求存在變化性,此時(shí)的推薦就要實(shí)時(shí)分析用戶需求并給出相應(yīng)推薦.另一方面實(shí)時(shí)性要求將新加入系統(tǒng)的商品能夠成為推薦商品,也是一定程度上要求算法解決冷啟動的問題.

    健壯性是指推薦算法承受被攻擊的能力,通過作弊改變推薦算法推薦性能的例子屢見不鮮,很多“刷分”行為屢見不鮮,電影網(wǎng)站中電影評分是推薦算法中的重要數(shù)據(jù),但存在一種情況就是讓一批人給自己的電影評高分,這樣就相當(dāng)于攻擊了推薦算法.選擇健壯性高的算法是提高算法被攻擊能力的基礎(chǔ),此外還可以通過使用代價(jià)高的用戶行為或使用數(shù)據(jù)前對數(shù)據(jù)進(jìn)行清理等一系列方法.

    4 推薦算法研究進(jìn)展

    4.1 基于內(nèi)容的推薦算法研究進(jìn)展

    基于內(nèi)容推薦(Content-based Recommendations)可以說是推薦算法中的“元老”,它為用戶推薦項(xiàng)目的依據(jù)是該項(xiàng)目與用戶之前偏好的項(xiàng)目一定有相似之處[9].

    孫曉[10]等針對信息的擴(kuò)展使學(xué)習(xí)者難以檢索相關(guān)信息這一難題,提出了一種基于內(nèi)容的個(gè)性化知識服務(wù)推薦優(yōu)化算法,如圖1所示.首先建立特征向量模型,其中每個(gè)項(xiàng)目信息均由特定單詞表示,而關(guān)鍵信息則通過加權(quán)突出顯示.其次建立動態(tài)用戶矢量模型以捕獲用戶的最新偏好信息.最后將特征向量模型與多用戶比較結(jié)果組合在一起從而獲得推薦列表.知識服務(wù)的個(gè)性化推薦機(jī)制主要包括數(shù)據(jù)預(yù)處理、生成特征向量模型、生成候選特征向量模型、生成動態(tài)角色模型以及生成推薦列表.首先要對數(shù)據(jù)進(jìn)行清理、分類和存儲.清理后的數(shù)據(jù)將根據(jù)已建立的規(guī)則進(jìn)行處理,然后建立特征向量模型.候選項(xiàng)目集合也有自己的規(guī)則,建立用于對齊的候選特征向量模型.建立特征向量模型后,提取用戶數(shù)據(jù)信息,了解用戶偏好特征,并建立用戶動態(tài)偏好列表,最后生成推薦列表.

    圖2 一種基于內(nèi)容的個(gè)性化知識服務(wù)推薦優(yōu)化算法Fig.2 A content-based personalized knowledge service recommendation optimization algorithm

    Afoudi[11]等因?yàn)閭鹘y(tǒng)的協(xié)同過濾算法在數(shù)據(jù)稀疏性以及具有上下文數(shù)據(jù)方面均未顯示令人滿意的性能,選擇了基于內(nèi)容的推薦,通過特征選擇模塊、向量空間模型和餐廳之間的相似性度量模塊組成推薦系統(tǒng),根據(jù)餐廳的眾多功能對餐廳進(jìn)行分類.Laura[12]等提出一種基于內(nèi)容的推薦系統(tǒng)模型,一方面依賴于基于內(nèi)容的方法模型能夠解決冷啟動問題,另一方面,對于處理高度不確定性問題很有價(jià)值,因?yàn)樗鼉H取決于用戶提供的可用項(xiàng)目和等級,不依賴于項(xiàng)目和用戶的數(shù)量.Nikolaos[13]等針對求職問題提出了一種基于內(nèi)容的推薦算法,該方法可以擴(kuò)展和更新閔氏距離,通過對非求職者形式的內(nèi)容分析得出結(jié)果,以更加靈活的方式量化人員對職位的適應(yīng)性,解決了匹配人員和工作的難題.

    但隨著用戶需求的日益增長,基于內(nèi)容的推薦算法遇到了一些難題,例如項(xiàng)目的特征難抽取、無法挖掘出用戶的潛在興趣、無法為新用戶產(chǎn)生推薦等.基于內(nèi)容的推薦算法作為第1代個(gè)性化應(yīng)用中最流行的推薦算法,由于它的缺點(diǎn)難以解決加上精度不足,目前大多用來輔助其他的推薦算法使用,最常見的就是用它來過濾其他算法的候選集,常與協(xié)同過濾算法結(jié)合使用.

    4.2 協(xié)同過濾推薦算法研究進(jìn)展

    4.2.1 協(xié)同過濾推薦算法思路及原理介紹

    協(xié)同過濾是推薦系統(tǒng)中最早提出且使用最廣泛的方法,最早由Goldberg等人提出,應(yīng)用于Tapestry[14]等小范圍系統(tǒng)中.協(xié)同過濾的推薦核心是相似度,先依據(jù)相似度對用戶和物品進(jìn)行分類隨后再進(jìn)行推薦[15].協(xié)同過濾推薦算法的思想描述如下:根據(jù)用戶分類時(shí),屬于同一類別的用戶會對同一項(xiàng)目感興趣,這種分類稱為基于用戶的協(xié)同過濾:假設(shè)用戶A、C有相似的偏好,則系統(tǒng)會將用戶C喜歡的物品D推薦給用戶A;如果根據(jù)項(xiàng)目分類,那么屬于同一種類的項(xiàng)目將受到同一用戶的喜愛,這就是基于項(xiàng)目的協(xié)同過濾:因?yàn)槲锲稟、D類似,所以物品D會被推薦給用戶C.

    4.2.2 傳統(tǒng)協(xié)同過濾推薦算法局限性

    如今協(xié)同過濾算法在電子商務(wù)領(lǐng)域取得了巨大的成功,但是隨著互聯(lián)網(wǎng)的發(fā)展,推薦系統(tǒng)規(guī)模也變得越來越大,加上海量的注冊用戶和數(shù)以億計(jì)的物品對推薦系統(tǒng)的要求越來越高,傳統(tǒng)的協(xié)同過濾推薦算法開始面臨冷啟動[16-18],數(shù)據(jù)稀疏性[19],可伸縮性等問題.

    由于缺少有關(guān)進(jìn)入系統(tǒng)的新用戶或新項(xiàng)目的信息,推薦系統(tǒng)和基礎(chǔ)算法的任務(wù)變得越來越困難,并且預(yù)測的準(zhǔn)確性也會降低.在推薦系統(tǒng)中,冷啟動是不可避免的問題,只有將冷啟動影響降到最低才能提高系統(tǒng)推薦性能.冷啟動可以分為3個(gè)部分:

    ·用戶冷啟動:系統(tǒng)中的新用戶尚未對許多項(xiàng)目進(jìn)行評分或與之交互.

    ·物品冷啟動:用戶尚未對系統(tǒng)中的新物品進(jìn)行評分.

    ·用戶和項(xiàng)目的冷啟動:用戶和項(xiàng)目都是系統(tǒng)中的新對象.

    協(xié)同過濾算法的數(shù)據(jù)稀疏性是是由于矩陣的稀疏性質(zhì)而產(chǎn)生的.在計(jì)算評分矩陣時(shí),無法實(shí)現(xiàn)準(zhǔn)確的預(yù)測導(dǎo)致了數(shù)據(jù)稀疏問題.

    協(xié)同過濾算法還存在可伸縮性問題,隨著網(wǎng)絡(luò)用戶急劇增加以及商品的不斷更新,算法要分析的數(shù)據(jù)量也會隨之增長,此時(shí)算法的可伸縮性就面臨著極大的挑戰(zhàn).如果不能根據(jù)數(shù)據(jù)的變化對算法進(jìn)行改進(jìn),推薦結(jié)果勢必會受到影響,推薦精度會大打折扣,協(xié)同過濾推薦的相關(guān)問題亟待解決.

    4.2.3 協(xié)同過濾推薦算法最新研究進(jìn)展

    為了消除冷啟動、數(shù)據(jù)稀疏性等問題帶來的影響,學(xué)術(shù)界提出了許多有效的方法改進(jìn)協(xié)同過濾算法,得到優(yōu)于傳統(tǒng)協(xié)同過濾算法的推薦精度.Lumauag[20]等提出了一種改進(jìn)的基于用戶的協(xié)同過濾增強(qiáng)推薦算法,改進(jìn)算法預(yù)測誤差小、精度高、召回率高,可以在解決數(shù)據(jù)稀疏性和過擬合問題的同時(shí)提供更準(zhǔn)確的預(yù)測和更好的推薦性能.張磊[21]等認(rèn)為推薦列表中不同的數(shù)據(jù)集,不同的用戶屬性,不同的最近鄰居數(shù)量和不同數(shù)量的項(xiàng)目對推薦結(jié)果有重要影響,提出了一種優(yōu)化的基于用戶的協(xié)同過濾推薦系統(tǒng),針對不同的用戶評估尺度問題,對原始用戶數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化.通過引入具有權(quán)重的用戶屬性與用戶等級線性組合在一起從而提高綜合的用戶相似度,實(shí)驗(yàn)結(jié)果表明該算法有效減少了冷啟動等問題帶來的影響并能給出準(zhǔn)確的推薦.

    聚類和降維技術(shù)也經(jīng)常用于輔助實(shí)現(xiàn)推薦系統(tǒng),Zarzour[22]等提出了一種基于降維和聚類技術(shù)的協(xié)同過濾推薦算法,使用k-means[23]算法和奇異值分解(SVD)分別對相似的用戶進(jìn)行聚類并降低維數(shù),生成準(zhǔn)確且高效的推薦.吳賓[24]等提出了一種面向多源異構(gòu)數(shù)據(jù)的協(xié)同過濾推薦算法,提出了一個(gè)融合視覺信息和多關(guān)系數(shù)據(jù)來緩解數(shù)據(jù)稀疏問題的推薦模型,用于評分預(yù)測任務(wù),并設(shè)計(jì)了高效算法,很好的緩解了冷啟動問題,更有助于預(yù)測不同類型物品的實(shí)際評分.

    周偉柏[25]等分析了傳統(tǒng)相似度方法的不足之處,提出了一種提高相似度的方法.為了能夠有效的計(jì)算用戶之間的相似度,提出了在用戶相似度計(jì)算中引入了共同得分中項(xiàng)目數(shù)的權(quán)重,從而解決傳統(tǒng)相似度計(jì)算方法中存在的一些問題.其算法由4部分構(gòu)成,首先讀取用戶的評分?jǐn)?shù),從而建立用戶模型,然后計(jì)算出用戶之間的相似度后找出某個(gè)k用戶的最近鄰居以形成最終推薦列表.

    周偉柏等提出了一種新的相似度計(jì)算方法,加權(quán)由皮爾遜相關(guān)系數(shù)計(jì)算出的相似度,并加權(quán)共同評定項(xiàng)目的數(shù)量.計(jì)算公式如公式(7)所示:

    (7)

    其中,Sim(u,v)表示的是皮爾遜相似度,xu是用戶u的評分項(xiàng)目數(shù),xv是用戶v的評分項(xiàng)目數(shù),xuv是用戶u、v公共評分的項(xiàng)目數(shù).

    同時(shí)建立了兩個(gè)一維矩陣.一個(gè)是UserCount[],它存儲每個(gè)用戶評級項(xiàng)目的總數(shù).另一個(gè)是Threshold[],它存儲用戶與其他用戶一起評價(jià)的項(xiàng)目數(shù)的平均值,如果兩個(gè)用戶的共同得分項(xiàng)y的數(shù)量分別大于或等于他們的平均得分項(xiàng),即,如果滿足公式(8),則認(rèn)為這兩個(gè)可信度較高;否則,認(rèn)為他們信任度較低.

    if(y≥Threshold[u]&&y≥Threshold[v])

    (8)

    其中y是用戶u和用戶v的共同評分項(xiàng)目.Threshold[u]是用戶u和其他用戶所評分的項(xiàng)目數(shù)的平均值.Threshold[v]是用戶v和其他用戶評分的項(xiàng)目數(shù)的平均值.

    如果滿足公式(8),將計(jì)算與公式(7)的相似度.如果沒有,將對皮爾遜相關(guān)系數(shù)進(jìn)行加權(quán)以生成新的相似度(NSim),以保留皮爾遜相關(guān)系數(shù)的優(yōu)點(diǎn)并改善其缺點(diǎn).加權(quán)如公式(9)所示:

    (9)

    其中Pu=|y-UserCount[u]|,Pv=|y-UserCount[v]|,y是用戶u和用戶v常見的評分項(xiàng)目數(shù).最后該算法找出某用戶的最近鄰居以形成推薦列表.

    基于矩陣分解的協(xié)同過濾推薦算法能夠提供很高的預(yù)測精度,基于矩陣分解的推薦會先對用戶商品進(jìn)行矩陣分解,然后利用分解后的矩陣預(yù)測原始矩陣中的未打分項(xiàng),由此產(chǎn)生推薦.吳賓[26]等針對物品之間的關(guān)聯(lián)關(guān)系經(jīng)常被忽略的問題,提出了一種聯(lián)合正則化的矩陣分解推薦算法,通過證明聯(lián)合正則化是一種加權(quán)的原子范式,以及度量物品之間的關(guān)聯(lián)程度,獲取物品之間的關(guān)聯(lián)關(guān)系,將它與社會關(guān)系相結(jié)合,構(gòu)造出了一種新的推薦算法.與主流推薦算法相比,聯(lián)合正則化的矩陣分解算法可以更好的緩解冷啟動問題同時(shí)能夠更有效的預(yù)測不同類型用戶的評分.劉洪濤[27]等提出了一種基于用戶特征的合理矩陣分解算法,以解決在保持用戶偏好特征的同時(shí)尋求全局最優(yōu)解的問題.使用項(xiàng)目信息將具有項(xiàng)目類別的用戶標(biāo)記為用戶特征矩陣.同時(shí),為了反映項(xiàng)目的特征,添加了項(xiàng)目偏好向量.該算法提高了推薦精度,針對細(xì)數(shù)數(shù)據(jù)評分的環(huán)境減少了迭代次數(shù),提高了算法效率.

    4.3 混合推薦算法研究進(jìn)展

    混合推薦算法是指通過混合兩種或者兩種以上的推薦方法進(jìn)行推薦,從而達(dá)到取長補(bǔ)短,提高推薦精度,提高系統(tǒng)性能的目的.混合推薦算法包括加權(quán)式、切換式、混雜式、層疊式和級聯(lián)式等形式.

    加權(quán)式混合推薦算法是指加權(quán)多種推薦方法的結(jié)果.Mathew[28]等提出了一種基于內(nèi)容推薦,協(xié)同過濾和關(guān)聯(lián)規(guī)則挖掘的組合特征的圖書推薦系統(tǒng),以產(chǎn)生有效和有效的推薦.張偉[29]等提出了一種基于協(xié)同過濾和視頻基因的混合推薦算法.該算法首先構(gòu)造用戶項(xiàng)目矩陣,計(jì)算用戶相似度,然后通過k均值聚類進(jìn)行聚類以獲得推薦列表.通過分析視頻的遺傳結(jié)構(gòu),組合樣式偏好和區(qū)域偏好來形成基因偏好,通過線性回歸確定基因的權(quán)重,將對象按基因偏好程度排序,選取排在前列的對象最終形成推薦.最后,將形成的兩個(gè)推薦結(jié)果進(jìn)行加權(quán)帶給用戶最終的推薦.

    切換式混合推薦算法是指根據(jù)問題背景和實(shí)際情況或要求決定變換采用不同的推薦方法.武傳明[30]等基于不同的混合策略,提出了兩種不同的混合推薦系統(tǒng)的設(shè)計(jì)方案:切換式和特征補(bǔ)充式,研究了混合策略對推薦性能的影響.曹昱翔[31]等認(rèn)為單個(gè)的推薦方法明顯存在不足,其首先歸納了3種混合推薦類別,然后以簡單Slope One這樣的評分預(yù)測算法作為基礎(chǔ),實(shí)現(xiàn)了并行式混合推薦技術(shù)和流水線切換式混合推薦技術(shù).

    混雜式混合推薦算法采用融合推薦方法給出推薦結(jié)果供用戶參考.王永貴[32]等提出了一種融合內(nèi)容與協(xié)同矩陣分解技術(shù)混合推薦算法.該算法實(shí)現(xiàn)了在共同的低維空間中分解內(nèi)容和協(xié)同矩陣,同時(shí)保留數(shù)據(jù)的局部結(jié)構(gòu).在參數(shù)優(yōu)化方面利用一種基于多重更新規(guī)則的交替方法,從而提高了學(xué)習(xí)能力.Pal[33]等提出了一種改進(jìn)的基于內(nèi)容的電影推薦協(xié)同過濾算法,該方法可在基于內(nèi)容的過濾中使用集合交集找到兩個(gè)特征之間的相關(guān)性,并找到兩個(gè)項(xiàng)目之間的相似性.在這種法中,使用了由不同用戶分配的每部電影的標(biāo)簽,并將其轉(zhuǎn)換為單個(gè)列表.每部電影的類型都附加到相同的標(biāo)簽列表中.最終列表稱為特定電影的對象.將每個(gè)活動電影的對象集與數(shù)據(jù)集中每個(gè)其他電影的對象集進(jìn)行比較,并將匹配對象的數(shù)量分配給一個(gè)集合.該集合的長度用于預(yù)測收視率,如下所示:

    H=M*(Hr/M′)

    (10)

    其中,H是活動電影的評級,M表示公共對象的數(shù)量,M′是數(shù)據(jù)集中任意兩部電影之間的最大匹配對象數(shù)量,Hr是我們可以分配給電影的最高評分.如果評分大于2.5(閾值等于可能的最低和最高評分的平均值),則可以分配該電影及其對活動電影中類似電影的評分.王沖[34]等提出了一種基于內(nèi)容和其他用戶評分向用戶推薦科學(xué)文章的算法.該方法結(jié)合了傳統(tǒng)協(xié)同過濾和概率主題建模的優(yōu)點(diǎn),為用戶和項(xiàng)目提供了可解釋的潛在結(jié)構(gòu),該方法與傳統(tǒng)的矩陣分解方法相比是有效的,并能很好地預(yù)測完全未評級的文章,可以對現(xiàn)有的和新發(fā)布的文章形成推薦.此外,該算法提供了可解釋的用戶配置文件,如果一個(gè)用戶在配置文件中設(shè)置不同的主題,便可以選擇特點(diǎn)的主題得到自己需要的推薦.

    級聯(lián)式混合推薦算法將兩種推薦方法作為一個(gè)系統(tǒng)使用,以前者生成的模型作為后者的輸入.程家民[35]等提出了一種新的基于內(nèi)容的混合短視頻推薦算法,同時(shí)使用了多種模型,采用兩種混合策略的組合策略進(jìn)行學(xué)習(xí),為用戶返回短片推薦高質(zhì)量的效果.其每個(gè)模型的分?jǐn)?shù)都作為特征,并輸入到新的分類器中以訓(xùn)練結(jié)果,在堆疊了復(fù)雜模型之后得分更高的模型,最終得分被視為最終結(jié)果.陳志怡[36]等介紹了如何使用線性混合模型進(jìn)行電影推薦,以解決很少有用戶歷史評分可用于數(shù)據(jù)分析的冷啟動問題,該算法模型可以根據(jù)用戶在不同組級別的特征來探索其評分行為的一般模式,經(jīng)過仔細(xì)分析后可以從數(shù)百萬個(gè)評分?jǐn)?shù)據(jù)中挖掘出一些隱式信息或有趣的社會行為.

    層疊式混合推薦算法是指兩種推薦方法先后使用,先用一種算法生成初步的推薦結(jié)果,在這基礎(chǔ)上用第二種推薦算法精確化初步推薦結(jié)果,從而生成最后推薦.徐湘申[37]等針對傳統(tǒng)的協(xié)同過濾算法稀疏導(dǎo)致推薦不明顯的問題,提出了一種用于混合相似度的協(xié)同過濾算法.算法主要集中在用戶等級相似度和社會相似度的融合上,首先通過協(xié)同過濾算法生成初步推薦結(jié)果,然后融合社會可信度和得分進(jìn)行推薦以使推薦更適合用戶,提高推薦算法的質(zhì)量.

    4.4 基于神經(jīng)網(wǎng)絡(luò)的推薦算法研究進(jìn)展

    現(xiàn)階段隨著深度學(xué)習(xí)技術(shù)研究在眾多領(lǐng)域取得突破性的進(jìn)展,將深度學(xué)習(xí)技術(shù)融入到推薦算法已經(jīng)成為研究熱點(diǎn),其目的是為了提高推薦精度和系統(tǒng)推薦性能.接下來文章會對深度學(xué)習(xí)中神經(jīng)網(wǎng)絡(luò)在推薦算法中的研究進(jìn)展進(jìn)行簡要概括.

    4.4.1 基于深度神經(jīng)網(wǎng)絡(luò)的推薦算法研究進(jìn)展

    Hinton[38]教授在2006年提出通過增加人工神經(jīng)網(wǎng)絡(luò)的層數(shù)和神經(jīng)元數(shù)量來構(gòu)建深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN),深度神經(jīng)網(wǎng)絡(luò)也是深度學(xué)習(xí)的基礎(chǔ).

    目現(xiàn)階段深度神經(jīng)網(wǎng)絡(luò)已被廣泛應(yīng)用于個(gè)性化推薦,Mokdara[39]等提出的模型從使用系統(tǒng)之前給出的用戶最喜歡的菜譜中提取感興趣的成分,從喜歡的成分分析中提取特征,通過深度神經(jīng)網(wǎng)絡(luò)模型評估用戶個(gè)人資料,分析了推薦的準(zhǔn)確性和多樣性.肖旭[40]等為了建立關(guān)于復(fù)雜用戶項(xiàng)生成交互函數(shù)所需要的非線性模型,提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的推薦算法,融合深度神經(jīng)網(wǎng)絡(luò)并且通過矩陣分解的方式進(jìn)一步提高評分預(yù)測中憑借單一矩陣分解方式預(yù)測結(jié)果的準(zhǔn)確性.黃振華等[41]提出了一種深度混合推薦模型DMFL(深度度量分解學(xué)習(xí)),將深度學(xué)習(xí)與改進(jìn)的機(jī)器學(xué)習(xí)模型相結(jié)合,以從多個(gè)角度學(xué)習(xí)用戶與項(xiàng)目之間的交互.這種深度混合學(xué)習(xí)有助于更全面地反映用戶的偏好,并增強(qiáng)模型的泛化能力.深度度量分解學(xué)習(xí)結(jié)構(gòu)體系圖如圖3所示.

    圖3 深度度量分解學(xué)習(xí)結(jié)構(gòu)體系圖Fig.3 Depth metric decomposition learning structure system diagram

    特征學(xué)習(xí)部分由兩個(gè)并行的深度神經(jīng)網(wǎng)絡(luò)組成,分別提取靜態(tài)項(xiàng)目潛在特征向量和動態(tài)用戶潛在特征向量.偏好生成部分包括3個(gè)子模塊,分別是SDAE-FM模塊,深度神經(jīng)網(wǎng)絡(luò)模塊和度量學(xué)習(xí)模塊.同時(shí)將在特征學(xué)習(xí)部分中為用戶和物品學(xué)習(xí)的潛在特征向量輸入到3個(gè)模塊中作為輸入,并將由3個(gè)子模塊生成的結(jié)果組合為物品的最終用戶偏好預(yù)測結(jié)果.

    4.4.2 基于卷積神經(jīng)網(wǎng)絡(luò)的推薦算法研究進(jìn)展

    LeCun[42]等1987年提出了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN),其模型由主要應(yīng)用于計(jì)算機(jī)視覺和圖像處理等研究領(lǐng)域.CNN的本質(zhì)就是個(gè)多層感知機(jī),它一方面通過減少權(quán)值的數(shù)量來簡易優(yōu)化網(wǎng)絡(luò)的過程,另一方面對模型進(jìn)行改進(jìn),降低了復(fù)雜度,同時(shí)也就意味著過擬合的風(fēng)險(xiǎn)大大減小了.同時(shí)CNN網(wǎng)絡(luò)還可以直接輸入圖像,避免了傳統(tǒng)識別算法中復(fù)雜的特征提取和數(shù)據(jù)重建的過程,在二維圖像的處理過程中有很大的優(yōu)勢.

    卷積神經(jīng)網(wǎng)絡(luò)取得了巨大的成就和廣泛的應(yīng)用,大量研究也證明了基于CNN推薦算法的有效性.馮永[43]等提出了基于卷積神經(jīng)網(wǎng)絡(luò)的汽車推薦模型,設(shè)計(jì)了卷積網(wǎng)絡(luò)模型學(xué)習(xí)汽車評論文本的隱特征,最后通過在多個(gè)數(shù)據(jù)集上的對比實(shí)驗(yàn),得到了良好的推薦結(jié)果.李樹東等[44]提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的電影推薦算法,并在IMDB上對其進(jìn)行了評估以用于電影推薦.王松等[45]開發(fā)了基于CNN的算法,用于圖像分類,并獲得了很好的推薦效果.巖池[46]等提出了一種基于CNN的位置推薦算法,該算法可以組合各種功能并了解它們對用戶的入住記錄的共同影響.

    張易文[47]等提出了一種基于多卷積神經(jīng)網(wǎng)絡(luò)的推薦方法,用于推薦電影給相關(guān)用戶.該方法以關(guān)系數(shù)據(jù)作為回歸訓(xùn)練的基礎(chǔ).卷積神經(jīng)網(wǎng)絡(luò)除了提取項(xiàng)目和用戶數(shù)據(jù)的深層特征外,還提取項(xiàng)目或用戶的文本數(shù)據(jù)的特征,并構(gòu)建可以挖掘用戶和項(xiàng)目的深層功能的推薦模型.該方法用CNN處理3個(gè)部分的特征,分別是文本數(shù)據(jù)、項(xiàng)的非文本屬性以及用戶屬性,對每個(gè)部分的特征進(jìn)行深度提取,從而進(jìn)行預(yù)測評分,提高了推薦準(zhǔn)確度.

    基于多卷積神經(jīng)網(wǎng)絡(luò)的推薦方法模型如圖4所示.

    圖4 基于多卷積神經(jīng)網(wǎng)絡(luò)的推薦方法模型Fig.4 Recommendation method model based on multi-convolutional neural network

    馮浩[48]等提出了一種基于深度學(xué)習(xí)的混合興趣點(diǎn)推薦模型(MFM-HNN).該模型通過評價(jià)信息和用戶簽到信息作為輔助信息,將其融合進(jìn)神經(jīng)網(wǎng)絡(luò),以此達(dá)到提高推薦興趣點(diǎn)性能的目的.其中,用戶簽到信息是評價(jià)信息的特征表示通過卷積神經(jīng)網(wǎng)絡(luò)和降噪自動編碼初始化得來的.總的來說,通過基于擴(kuò)展的矩陣分解模型,融合評論信息特征以及用戶簽到信息的初始值達(dá)到推薦興趣點(diǎn)的功能.基于混合神經(jīng)網(wǎng)絡(luò)矩陣分解的興趣點(diǎn)推薦模型如圖5所示.

    圖5 基于混合神經(jīng)網(wǎng)絡(luò)矩陣分解的興趣點(diǎn)推薦模型圖Fig.5 Point-of-interest recommendation model diagram based on matrix decomposition of hybrid neural network

    4.4.3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的推薦算法研究進(jìn)展

    1990年,Michael I.Jordan提出了Elman[49]網(wǎng)絡(luò),這是第一個(gè)全連接循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),RNN是一類遞歸神經(jīng)網(wǎng)絡(luò)[50],它以序列數(shù)據(jù)作為輸入,所有循環(huán)單元按鏈?zhǔn)芥溄硬⑶以谛蛄械难葸M(jìn)方向進(jìn)行遞歸.

    一個(gè)典型的RNN網(wǎng)絡(luò)包含一個(gè)輸入Xt,一個(gè)輸出ht和一個(gè)神經(jīng)網(wǎng)絡(luò)單元At.循環(huán)神經(jīng)網(wǎng)絡(luò)中任意時(shí)刻的輸入Xt都會根據(jù)當(dāng)前狀態(tài)At來提供不同的輸出ht.和普通的神經(jīng)網(wǎng)絡(luò)不同的是,循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)單元A不僅僅與輸入和輸出存在聯(lián)系,其與自身也存在一個(gè)回路.這種網(wǎng)絡(luò)結(jié)構(gòu)就揭示了RNN的實(shí)質(zhì):上一個(gè)時(shí)刻的網(wǎng)絡(luò)狀態(tài)信息將會作用于下一個(gè)時(shí)刻的網(wǎng)絡(luò)狀態(tài).

    從循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖可以看出,它擅長解決的就是時(shí)間序列相關(guān)問題.在最近幾年的時(shí)間里,循環(huán)神經(jīng)網(wǎng)絡(luò)在語音識別、機(jī)器翻譯等領(lǐng)域中發(fā)揮了很大的作用,同樣在推薦系統(tǒng)中,我們可以發(fā)揮循環(huán)神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,基于循環(huán)神經(jīng)網(wǎng)絡(luò)來對整個(gè)時(shí)序進(jìn)行建模,這樣可以充分分析用戶的歷史瀏覽數(shù)據(jù),而不是只根據(jù)最終的產(chǎn)品進(jìn)行推薦.

    武興[51]等提出了一種基于RNN的時(shí)間感知推薦算法,它使用矩陣分解提取用戶偏好和服務(wù)功能,并應(yīng)用LSTM單元進(jìn)行時(shí)間感知服務(wù)推薦,用于學(xué)習(xí)和預(yù)測偏好和功能.江苗[52]等針對不同歌曲之間的相似度,提出一種基于深度神經(jīng)網(wǎng)絡(luò)的改進(jìn)算法,同時(shí)搭建了一個(gè)基于遞歸神經(jīng)網(wǎng)絡(luò)的終端模型,該模型通過相似性來預(yù)測用戶的下一首最可能的歌曲.Kwon[53]等將權(quán)重捆綁技術(shù)應(yīng)用于基于RNN的推薦模型,提出了一種基于RNN推薦的嵌入權(quán)重綁定方法,以提高電影推薦系統(tǒng)的性能.

    李太松[54]等對RNN做出了改進(jìn),提出了多維度序列建模算法循環(huán)時(shí)間卷積網(wǎng)絡(luò)(RTCN),該循環(huán)時(shí)間網(wǎng)絡(luò)通過從序列項(xiàng)中提取局部信息,從而把項(xiàng)目信息映射到潛在空間中,得到的結(jié)果就是生成細(xì)粒度的特征向量.通過將特征向量饋入門控循環(huán)單元(GRU),進(jìn)行宏觀角度探索項(xiàng)目之間的聯(lián)系.RTCN可以通過適應(yīng)時(shí)間卷積網(wǎng)絡(luò)從輸入中提取長期,多維,細(xì)粒度的局部特征.遞歸時(shí)間卷積網(wǎng)絡(luò)結(jié)構(gòu)中將輸入層作為第1層,其作用是用來定義序列長度.第2層是時(shí)序卷積層,時(shí)序卷積層能夠通過卷積來提取局部關(guān)聯(lián)特征,從而實(shí)現(xiàn)了局部感知序列流數(shù)據(jù).序列層是構(gòu)成該網(wǎng)絡(luò)的第3層結(jié)構(gòu),此處作為建模單元的是門限循環(huán)單元.因?yàn)镚RU本身的時(shí)間傳遞性并且同時(shí)能夠吻合人們選擇物品時(shí)的興趣變化,所以選用GRU集成序列的特征向量,這也極大改善了循環(huán)神經(jīng)網(wǎng)絡(luò)在長序列建模時(shí)引發(fā)梯度消失等問題所帶來的影響.

    4.4.4 基于圖神經(jīng)網(wǎng)絡(luò)的推薦算法研究進(jìn)展

    傳統(tǒng)的機(jī)器學(xué)習(xí)所用到的數(shù)據(jù)是歐式空間數(shù)據(jù),歐式空間數(shù)據(jù)的特點(diǎn)就是它有規(guī)則的空間結(jié)構(gòu).比如語音數(shù)據(jù)是一維序列,圖片是規(guī)則的正方形網(wǎng)格.但是,在現(xiàn)實(shí)生活中許多數(shù)據(jù)都不具備規(guī)則的空間結(jié)構(gòu),比如電子交易、推薦系統(tǒng)等抽象出來的圖譜,圖譜中每個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)的連接是不固定的.圖神經(jīng)網(wǎng)絡(luò)可以對非歐式空間數(shù)據(jù)進(jìn)行建模,捕獲數(shù)據(jù)的內(nèi)部依賴關(guān)系.

    圖是一種結(jié)構(gòu)化數(shù)據(jù),圖由一組對象(節(jié)點(diǎn))及其關(guān)系(邊)組成.作為一種非歐幾里得形數(shù)據(jù),圖分析被應(yīng)用到節(jié)點(diǎn)分類、鏈路預(yù)測和聚類等方向.

    圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Network,GNN)的可以進(jìn)行高效大規(guī)模的計(jì)算[55],經(jīng)常用于推薦系統(tǒng),動作識別,語義分析和異常檢測[56,57]等領(lǐng)域.

    趙莉[58]等提出了一種采用分層二分圖神經(jīng)網(wǎng)絡(luò)(HiGNN)的新穎方法來處理大規(guī)模電子商務(wù)任務(wù).通過堆疊多個(gè)GNN模塊并交替使用確定性聚類算法,算法能夠有效地同時(shí)獲取分層的用戶和項(xiàng)目嵌入,并有效地大規(guī)模預(yù)測用戶的偏好.

    張明閣等[59]等提出了一種基于圖卷積的推薦系統(tǒng),該系統(tǒng)具有基于圖卷積運(yùn)算的不同時(shí)間關(guān)注機(jī)制.該算法以GCN為模型基礎(chǔ),抽象出用戶偏好在整個(gè)應(yīng)用場景中的實(shí)際角色,由于GCN的低階近似反映了短期偏好過程的特征,引用了ConvLSTM[60],以確保模型可以考慮更多情況,為了增強(qiáng)模型對各種偏好的分層學(xué)習(xí),引入了一種更加注重分層和神經(jīng)元排序的網(wǎng)絡(luò)結(jié)構(gòu),通過構(gòu)建會話圖、學(xué)習(xí)模型內(nèi)部時(shí)空信息產(chǎn)生最終排名和推薦結(jié)果.

    葛堯[61]等提出了一種面向推薦系統(tǒng)的圖卷積網(wǎng)絡(luò)(GCN).推薦系統(tǒng)中用戶與商品之間的交互稱之為同質(zhì)頂點(diǎn)交互,用戶(商品)與用戶(商品)之間的交互為同質(zhì)頂點(diǎn)交互.由于現(xiàn)有的圖卷積操作都停留在同質(zhì)頂點(diǎn)或異質(zhì)頂點(diǎn)之間的交互,沒有將兩者的優(yōu)勢結(jié)合,從而影響了推薦結(jié)果的最優(yōu)化.文章提出了一種新的機(jī)遇圖卷積網(wǎng)絡(luò)的推薦算法GCN4RS.搭建算法模型.利用同質(zhì)頂點(diǎn)間交互、異質(zhì)頂點(diǎn)之間交互,進(jìn)行兩組圖卷積共同操作.其中,同質(zhì)頂點(diǎn)卷積用于使相似頂點(diǎn)具有相近的表現(xiàn),異質(zhì)頂點(diǎn)卷積用于挖掘交互圖譜域中存在的鏈接信息.GCN4RS框架如圖6所示.

    圖6 GCN4RS框架Fig.6 GCN4RS framework

    為了解決現(xiàn)有的基于嵌入和基于路徑的知識圖譜感知推薦方法的局限性,王宏偉[62]等提出了一個(gè)將知識圖自然地整合到推薦系統(tǒng)中的端到端框架-RippleNet,該框架通過引入偏好傳播,并且自動迭代地沿著知識圖譜中的鏈接擴(kuò)展用戶的潛在興趣,刺激了用戶偏好在知識實(shí)體集合上的傳播.引入了“漣漪圖”的概念,圖中中心位置和周圍實(shí)體之間的相似度與距離成正相關(guān),即距離越遠(yuǎn)相似度越低.用戶激活多個(gè)漣漪圖后,歷史上被點(diǎn)擊的項(xiàng)目就會被疊加以形成用戶相對于候選項(xiàng)目的偏好分布,這樣就可以被用來預(yù)測最終的點(diǎn)擊概率.該框架克服了現(xiàn)有基于嵌入和基于路徑的知識圖譜感知推薦方法的局限性,在多種場景下都取得了有效的推薦結(jié)果.

    由于傳統(tǒng)推薦方法容易忽視實(shí)體與項(xiàng)目之間的具體關(guān)系,導(dǎo)致無法從用戶集中提取有效信號.王翔[63]等提出了一種稱為知識圖注意力網(wǎng)絡(luò)(KGAT)的新方法,該方法以端到端的方式顯式地建模知識圖中的高階連通性,以遞歸方式傳播來自節(jié)點(diǎn)鄰居(可以是用戶,項(xiàng)目或?qū)傩?的嵌入,以精煉節(jié)點(diǎn)的嵌入并采用關(guān)注機(jī)制來區(qū)分鄰居的重要性,從而完善了將兩個(gè)具有一個(gè)或多個(gè)鏈接屬性的項(xiàng)目連接在一起的高階關(guān)系,實(shí)現(xiàn)了對現(xiàn)有基于知識圖推薦算法的優(yōu)化,進(jìn)一步證明了嵌入傳播對于高階關(guān)系建模的有效性以及注意力機(jī)制帶來的可解釋性好處,實(shí)驗(yàn)結(jié)果表明KGAT甚至優(yōu)于RippleNet之類的最新方法.

    王翔[64]等開發(fā)了神經(jīng)圖協(xié)同過濾(NGCF)這一新的推薦框架,通過利用用戶-項(xiàng)目集成圖中進(jìn)行的高階連通性的建模來實(shí)現(xiàn)將協(xié)同信號有效的注入到嵌入過程中.用戶和項(xiàng)目的矢量表示(又稱嵌入)是現(xiàn)代推薦系統(tǒng)的核心,現(xiàn)有的方法一般通過映射描述用戶(或項(xiàng)目)的現(xiàn)有特征(例如ID和屬性)來獲得用戶(或項(xiàng)目)的嵌入,而這種方法的缺點(diǎn)是用戶-項(xiàng)目交互過程中潛在的協(xié)同信號未在嵌入過程中進(jìn)行編碼,導(dǎo)致協(xié)同過濾效果一般.NGCF提出了嵌入傳播層,允許嵌入的用戶和項(xiàng)目交互,從而有效的解決了這一問題.由于圖卷積網(wǎng)絡(luò)中的特征轉(zhuǎn)換和非線性激活對協(xié)同過濾的性能幾乎沒有影響,并且更有可能會因?yàn)樵黾佑?xùn)練難度而降低推薦性能.為了簡化圖卷積網(wǎng)絡(luò)的設(shè)計(jì),使其更簡潔,更適合推薦,何湘南[65]等提出了一個(gè)名為LightGCN的新模型,該模型只包含GCN中最重要的用來進(jìn)行協(xié)同過濾的領(lǐng)域聚合部分,通過在用戶-項(xiàng)目交互圖上線性傳播用戶和項(xiàng)目嵌入來學(xué)習(xí)它們,并將在所有層上學(xué)習(xí)的嵌入的加權(quán)總和用作最終嵌入.這種簡單,線性,整潔的模型更易于實(shí)施和訓(xùn)練,擁有更好的泛化能力.

    4.5 其他推薦算法研究進(jìn)展

    基于標(biāo)簽的方法的本質(zhì)是引入標(biāo)簽,標(biāo)簽可用于描述商品的特征和用戶對商品的態(tài)度.通過串聯(lián)標(biāo)簽、用戶的標(biāo)簽偏好以及物品的標(biāo)簽特征,形成用戶-標(biāo)簽-物品三者之間的關(guān)系,最終主要是通過計(jì)算用戶標(biāo)簽偏好和物品標(biāo)簽特征之間相似度為用戶進(jìn)行推薦.王夢沙[66]等提出了一種基于標(biāo)簽的個(gè)性化音樂推薦算法,通過發(fā)現(xiàn)曲目和作曲家對標(biāo)簽都有不同的權(quán)重,并且這些標(biāo)簽可以不同程度地反映相關(guān)內(nèi)容,從而為用戶設(shè)置音樂類型首選項(xiàng)矢量,構(gòu)造用戶的相似度矩陣,并根據(jù)來自幾個(gè)最近鄰居的歌曲的加權(quán)得分向目標(biāo)用戶推薦音樂.姜遠(yuǎn)春[67]等提出了一種基于標(biāo)簽偏好的貝葉斯個(gè)性化排名算法,算法首先為每個(gè)用戶和每個(gè)商品構(gòu)造一個(gè)用戶標(biāo)簽集和一個(gè)商品標(biāo)簽集.然后基于用戶標(biāo)簽組和項(xiàng)目標(biāo)簽組之間的一致度,計(jì)算用于對用戶未與之交互的項(xiàng)目進(jìn)行優(yōu)先級排序的匹配度,從而實(shí)現(xiàn)對用戶的推薦.孔欣欣[68]等提出了一種基于標(biāo)簽權(quán)重評分的推薦系統(tǒng)模型,首先通過數(shù)據(jù)源分解算法對數(shù)據(jù)進(jìn)行預(yù)處理,然后分析了基于矩陣填充的離線計(jì)算推薦、基于聚類的在線計(jì)算推薦以及基于標(biāo)簽權(quán)重評分的反饋計(jì)算推薦算法3種推薦方式在該模型下解決問題的優(yōu)越性,證明了該模型具有較高的準(zhǔn)確度.

    信任的建立使用戶之間的社交關(guān)系向更廣的范圍傳遞,而推薦算法中基于信任的推薦關(guān)鍵就在于挖掘相應(yīng)的信任信息.陳婷[69]等提出了一種基于信任的推薦算法,首先將局部信任與全局信任相結(jié)合,深入研究信任的傳播性質(zhì)從而對信任關(guān)系進(jìn)行建模.隨后通過設(shè)置推薦權(quán)重,將相似度和信任度作為關(guān)鍵點(diǎn)構(gòu)建用戶的偏好關(guān)系來篩選鄰居.最后使用自適應(yīng)權(quán)重動態(tài)決定信任關(guān)系與基于記憶的協(xié)同過濾融入概率矩陣分解模型間各部分的影響程度,形成了高效率的推薦模型.朝陽[70]等提出了一種基于啟發(fā)式相似度和信任度的混合協(xié)同過濾推薦算法,該算法首先通過對從評價(jià)矩陣中獲得的多個(gè)相似度影響因子進(jìn)行加權(quán)融合,實(shí)現(xiàn)了一種新的相似度度量,使得相似度度量變得更加準(zhǔn)確.然后通過基于信任傳播理論構(gòu)建用戶信任網(wǎng)絡(luò),實(shí)現(xiàn)用戶信任關(guān)系計(jì)算模型,在此基礎(chǔ)上設(shè)計(jì)了一種SIMT協(xié)同過濾算法,該算法融合了信任和相似度,而不是傳統(tǒng)協(xié)同過濾算法中的相似度,進(jìn)一步實(shí)現(xiàn)了基于聚類算法的改進(jìn)的K最近鄰?fù)扑],用于生成更好的推薦列表.該算法提高了推薦的質(zhì)量和準(zhǔn)確性,從而在一定程度上克服了數(shù)據(jù)稀疏,冷啟動和信任措施的問題.

    基于評論的推薦依靠評論信息更細(xì)致的刻畫用戶對物品的偏好成為一種主流的推薦方法,利用評論的有用性有助于訪問長尾商品,為用戶提供更好的個(gè)性化推薦.Omamah[71]等發(fā)現(xiàn)現(xiàn)有的旅游推薦系統(tǒng)提供的誤導(dǎo)性建議實(shí)際上并沒有達(dá)到游客的期望,出現(xiàn)此問題的主要原因之一是這些系統(tǒng)中的大多數(shù)都忽略了以前的用戶評論,從而提出了一個(gè)整合了用戶評論元素的旅游推薦系統(tǒng).基于評論數(shù)量,評價(jià)和情感3個(gè)因素,對用戶評論進(jìn)行分析,然后將其用于推薦給游客的酒店.

    Rahul[72]等提出了一種使用用戶評論來改善推薦系統(tǒng)性能的方法,通過設(shè)定一種針對用戶和項(xiàng)目的基于評論的配置文件,該配置文件使用各種文本分析和情感分析技術(shù)從用戶評論中提取有價(jià)值的信息.通過預(yù)處理用戶對產(chǎn)品的詳細(xì)反饋的原始評論數(shù)據(jù)集,然后獲得情感強(qiáng)度得分,最后通過比較召回得分和均方根誤差,改善了推薦系統(tǒng)的性能.

    知識圖譜(Knowledge Graph)因其自身的精準(zhǔn)性可以引入更多的語義關(guān)系,更深層次的發(fā)現(xiàn)用戶興趣.知識圖譜的多樣性也使得可以通過圖譜中不同的關(guān)系鏈接種類來發(fā)散推薦結(jié)果,同時(shí)知識圖譜為緩解推薦系統(tǒng)中的稀疏性問題提供了前所未有的機(jī)會,所以基于知識圖譜的推薦算法也得到了高程度的重視.然而,現(xiàn)有的基于知識圖譜的推薦方法主要依靠手工制作的元路徑特征或簡單的3層實(shí)體嵌入,這不能自動捕獲實(shí)體對推薦的長期關(guān)系依賴性.雷桑[73]等將知識圖譜結(jié)構(gòu)和用戶-項(xiàng)目交互功能合并到一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行推薦,提出了一種名為“知識圖”的帶有殘差遞歸網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)協(xié)同過濾兩通道神經(jīng)交互方法,該方法利用了長期關(guān)系依賴性知識圖譜上下文和用戶項(xiàng)交互來生成最后的推薦結(jié)果同時(shí)驗(yàn)證了模型的有效性.

    溫雨帆[74]等針對大多數(shù)服裝推薦系統(tǒng)中冷啟動和數(shù)據(jù)稀疏問題構(gòu)建了用戶知識圖,服裝知識圖和情境知識圖,利用Apriori算法捕獲服裝屬性與情境屬性之間的內(nèi)在聯(lián)系.此外,根據(jù)用戶需求搜索并匹配已建立的知識圖,并結(jié)合Top-N算法直接生成推薦結(jié)果,有效的解決了冷啟動問題并且具有較高的推薦質(zhì)量.

    跨領(lǐng)域推薦總的來說是將不同領(lǐng)域中的用戶偏好特征相結(jié)合,針對不同用戶的特點(diǎn)進(jìn)行智能化感知,從而實(shí)現(xiàn)對用戶推薦的多樣性,滿足用戶個(gè)性化需求.跨領(lǐng)域推薦利用領(lǐng)域之間存在的相關(guān)性來彌補(bǔ)目標(biāo)領(lǐng)域所面臨的信息不足的問題,如用戶、用戶興趣和項(xiàng)目特征等因子在不同領(lǐng)域之間有一定的相似程度,便可以對其進(jìn)行知識遷移,從而補(bǔ)足輔助信息,達(dá)到改善推薦性能的目的.金雅如[75]等提出了一種具有回顧意識的跨域推薦算法,以解決產(chǎn)品推薦領(lǐng)域中的冷啟動問題.首先,通過使用鄰接矩陣來動態(tài)選擇評論.其次,通過遷移模型提取冷啟動用戶的特定于域的偏好向量和共享域的偏好向量.另一方面,通過編碼器和解碼器從評論文本生成的目標(biāo)域中的產(chǎn)品特征向量與冷啟動用戶的偏好向量相結(jié)合以進(jìn)行評級預(yù)測,實(shí)驗(yàn)結(jié)果表明該算法的性能優(yōu)越,一定程度上解決了冷啟動問題.

    江一音[76]等為了在高度稀疏的情況下提高推薦性能,改進(jìn)傳統(tǒng)跨領(lǐng)域推薦算法,提出了一種基于異構(gòu)信息網(wǎng)絡(luò)嵌入的跨域推薦框架,通過搭建“立交橋”式的元路徑嵌入方式傳遞更多的知識來達(dá)到充分利用跨域信息并避免在實(shí)際數(shù)據(jù)集中觀察到的來自不同元路徑的知識之間的知識沖突的目的,同時(shí)引入輔助域數(shù)據(jù)可以幫助擴(kuò)展有用信息的范圍,該框架降低了平均絕對誤差以及均方根誤差,有效提高了推薦準(zhǔn)確性.

    5 推薦算法研究熱點(diǎn)展望

    推薦算法的研究的熱點(diǎn)依舊很多,例如社交屬性信息的確定與量化[77].社交屬性信息主要是指影響社交網(wǎng)絡(luò)推薦系統(tǒng)中用戶行為偏好的個(gè)人屬性信息和社交關(guān)系信息.其中,個(gè)體屬性信息通常相對清晰.在現(xiàn)實(shí)生活中,社會關(guān)系可以分為多種,例如親戚,同學(xué),朋友和同事.但是在虛擬網(wǎng)絡(luò)環(huán)境中,用戶之間的社交關(guān)系通常很模糊.通??梢愿鶕?jù)網(wǎng)絡(luò)交互內(nèi)容的語義確定一些社會關(guān)系.但是到目前為止,大多數(shù)現(xiàn)有的社交推薦系統(tǒng)都使用用戶的依存關(guān)系并完全直接鏈接,低估了用戶的觀點(diǎn)和口味的多樣性,所以量化和確定社交屬性信息有待研究.

    跨媒體數(shù)據(jù)指的是用戶通常在社交媒體上擁有多個(gè)賬戶,并且在不同站點(diǎn)上存在的時(shí)間可能有所不同.當(dāng)用戶在一個(gè)新的社交媒體上注冊時(shí),可以指定該用戶之前在其他網(wǎng)站上的賬戶作為系統(tǒng)提供推薦的依據(jù),這種方法有助于幫助解決冷啟動問題,這就是整合跨媒體數(shù)據(jù)[78].通過集成多個(gè)網(wǎng)站的用戶信息提供解決冷啟動問題的有效方法,同時(shí)也提高了用戶滿意度和網(wǎng)站利潤,跨媒體數(shù)據(jù)也是現(xiàn)在推薦算法研究熱點(diǎn)之一.

    隱私和安全問題對于所有推薦系統(tǒng)都是不可避免的問題[79].在社交推薦系統(tǒng)中,隱私和安全問題尤為重要,因?yàn)樯缃煌扑]系統(tǒng)不僅涉及用戶屬性信息,還涉及用戶的社交關(guān)系信息.雖然現(xiàn)有的社交標(biāo)簽系統(tǒng)中的標(biāo)簽推薦可以非常準(zhǔn)確和個(gè)性化,但由于社交標(biāo)簽是由用戶提供的,將其偏好暴露給其他聯(lián)系用戶會對用戶個(gè)人資料的私密性產(chǎn)生影響,隱私和安全問題作為現(xiàn)在推薦算法要考慮的要素之一也會引起巨大的討論和深入的研究.

    可伸縮性等問題作為協(xié)同過濾算法長期存在的問題始終是推薦算法研究的熱點(diǎn)問題[80].隨著用戶和項(xiàng)目數(shù)量的增加,相似度的計(jì)算也會增加.目前主要通過聚類,維度分解和線性模型解決了協(xié)同過濾的可擴(kuò)展性問題.在社交網(wǎng)絡(luò)中的任何時(shí)候,用戶之間的信息交互都會產(chǎn)生大量數(shù)據(jù)集,將數(shù)據(jù)信息輸入到推薦系統(tǒng)中,將進(jìn)一步增加推薦算法的計(jì)算復(fù)雜度,并使問題變得更加嚴(yán)重.當(dāng)下用戶對推薦結(jié)果的要求不再局限于內(nèi)容的準(zhǔn)確性,而是對時(shí)間,地點(diǎn)等有要求.社會關(guān)系會隨著時(shí)間而改變.例如,已添加新的社交關(guān)系,而現(xiàn)有的社交關(guān)系已變得不活動或已刪除,這些問題都對推薦算法的可伸縮性提出了更高的要求.

    將深度學(xué)習(xí)整合到推薦系統(tǒng)中也為推薦系統(tǒng)的研究帶來了新的機(jī)遇[81].深度學(xué)習(xí)方法用于將社交網(wǎng)絡(luò)的社會化關(guān)系整合到推薦系統(tǒng)中,有助于解決推薦系統(tǒng)的數(shù)據(jù)稀疏和冷啟動問題,并提高推薦系統(tǒng)的質(zhì)量.同時(shí),深度學(xué)習(xí)模型可以適應(yīng)大規(guī)模數(shù)據(jù)并且具有高可擴(kuò)展性.但是總的來說,深度學(xué)習(xí)在基于社交網(wǎng)絡(luò)的推薦系統(tǒng)中很少使用,在如何區(qū)分關(guān)系強(qiáng)度,如何有效地建立對推薦系統(tǒng)的社會化影響理論等方面,還有待進(jìn)一步研究.

    6 總 結(jié)

    由于提出時(shí)間早、推薦效果好,協(xié)同過濾毋庸置疑是推薦系統(tǒng)中應(yīng)用最多推薦算法,但為了進(jìn)一步提高推薦精度,許多研究人員都改進(jìn)協(xié)同過濾算法來提高算法性能,基于信任度的協(xié)同過濾、基于矩陣分解的協(xié)同過濾、基于標(biāo)簽的協(xié)同過濾等以協(xié)同過濾算法為主的改進(jìn)算法層出不窮.基于內(nèi)容的推薦算法大多被利用作為輔助算法,未來對基于內(nèi)容的推薦進(jìn)行改進(jìn)可以在細(xì)節(jié)方面提高推薦算法的性能.隨著對不同推薦算法的改進(jìn)以及提出更多新算法,混合推薦算法也將會迎來新的生命,但是依舊要針對混合推薦難以實(shí)現(xiàn)、框架復(fù)雜的問題進(jìn)行深入的研究改進(jìn).

    雖然深度學(xué)習(xí)技術(shù)目前還處在發(fā)展階段,但已經(jīng)被廣泛推廣使用,其在推薦算法領(lǐng)域中的發(fā)展也已經(jīng)發(fā)軔,相信深度學(xué)習(xí)技術(shù)與推薦系統(tǒng)的融越來越成功.由于基于深度學(xué)習(xí)的推薦算法與傳統(tǒng)的推薦算法有著本質(zhì)性的不同,尤其是深度學(xué)習(xí)在推薦系統(tǒng)中的應(yīng)用還處在起步階段,存在著許多不足,未來還將面臨很多挑戰(zhàn),相信利用深度學(xué)習(xí)技術(shù)解決推薦算法難題指日可待.

    本文對推薦算法進(jìn)行了大致分類,同時(shí)介紹了評價(jià)推薦算法的幾種重要指標(biāo),分別介紹了傳統(tǒng)推薦算法以及神經(jīng)網(wǎng)絡(luò)在推薦算法領(lǐng)域的研究進(jìn)展.本文存在的不足之處是沒有系統(tǒng)的對推薦算法進(jìn)行分類,對傳統(tǒng)推薦算法的研究進(jìn)展不夠詳細(xì),針對深度學(xué)習(xí)技術(shù)在推薦系統(tǒng)上的應(yīng)用總結(jié)還不夠全面,只介紹了神經(jīng)網(wǎng)絡(luò)部分與推薦算法的結(jié)合應(yīng)用.在未來的學(xué)習(xí)中,我會更加注重有關(guān)深度學(xué)習(xí)技術(shù)更深層次的研究,對其在推薦算法領(lǐng)域進(jìn)行更深一步的理解.

    猜你喜歡
    冷啟動卷積神經(jīng)網(wǎng)絡(luò)
    輕型汽油車實(shí)際行駛排放試驗(yàn)中冷啟動排放的評估
    基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
    基于學(xué)習(xí)興趣的冷啟動推薦模型
    客聯(lián)(2021年2期)2021-09-10 07:22:44
    神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
    電子制作(2019年19期)2019-11-23 08:42:00
    從濾波器理解卷積
    電子制作(2019年11期)2019-07-04 00:34:38
    基于傅里葉域卷積表示的目標(biāo)跟蹤算法
    基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
    復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
    基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
    一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法
    无棣县| 寿阳县| 湘潭县| 大连市| 常德市| 邵东县| 靖江市| 海原县| 灵武市| 杂多县| 南康市| 广灵县| 英德市| 师宗县| 绥棱县| 安丘市| 上犹县| 广饶县| 阜康市| 四川省| 屏南县| 阿图什市| 华安县| 敖汉旗| 大宁县| 乐安县| 合水县| 喜德县| 惠水县| 九龙坡区| 吐鲁番市| 南充市| 卓资县| 慈利县| 昌邑市| 大渡口区| 九龙坡区| 平罗县| 吴江市| 巴南区| 黑河市|