錢(qián)玉婷
(桂林理工大學(xué)商學(xué)院 廣西桂林 541004)
關(guān)鍵字:推薦系統(tǒng);推薦多樣性;推薦方法
隨著大數(shù)據(jù)時(shí)代的到來(lái)[1],人們逐步從信息匱乏時(shí)代跨越到信息過(guò)載時(shí)代[2]。如今人們面臨的信息問(wèn)題大多是由爆炸式增長(zhǎng)的數(shù)據(jù)帶來(lái)的[3],比如難以在紛繁的數(shù)據(jù)中找到符合自己需求的信息。推薦系統(tǒng)由此孕育而生,其憑借信息過(guò)濾和信息篩選能力成為有效解決信息過(guò)載問(wèn)題的工具。21世紀(jì)初,史密斯等人提出在推薦過(guò)程中引入多樣性概念。推薦多樣性通過(guò)增加推薦列表中物品之間的種類(lèi),使得推薦物品的覆蓋范圍和用戶(hù)興趣的偏好覆蓋范圍更加廣泛,但是目前推薦系統(tǒng)相關(guān)綜述類(lèi)文章研究的側(cè)重點(diǎn)主要集中在提高推薦的準(zhǔn)確性,缺乏對(duì)推薦多樣性的研究。所以,本文從推薦多樣性的角度出發(fā),對(duì)提高推薦多樣性的方法進(jìn)行梳理和總結(jié)。
基于長(zhǎng)尾效應(yīng)的推薦多樣性方法的基本思想是通過(guò)增加推薦列表中長(zhǎng)尾產(chǎn)品的數(shù)量實(shí)現(xiàn)推薦多樣性。研究表明,增加長(zhǎng)尾物品的推薦會(huì)提高總體多樣性,多樣性強(qiáng)的推薦會(huì)給企業(yè)帶來(lái)好處[4]。在基于長(zhǎng)尾效應(yīng)的推薦多樣性方法中,根據(jù)長(zhǎng)尾效應(yīng)增加推薦多樣性方法的不同,又可分為多標(biāo)準(zhǔn)推薦多樣性方法和尾部聚類(lèi)推薦多樣化方法。
多標(biāo)準(zhǔn)推薦多樣性方法是引入物品流行度、用戶(hù)偏好度或用戶(hù)間相似關(guān)系多個(gè)推薦標(biāo)準(zhǔn)對(duì)物品重新排序,從而調(diào)節(jié)長(zhǎng)尾物品的推薦比例、提高長(zhǎng)尾物品的推薦率,進(jìn)而生成最終推薦列表的方法。謝修娟等(2019)[5]在預(yù)測(cè)評(píng)分時(shí),使用物品流行度權(quán)重來(lái)恰當(dāng)?shù)貐f(xié)調(diào)長(zhǎng)尾商品與流行商品,懲罰物品流行度對(duì)物品推薦期望的影響。劉業(yè)政等(2018)[6]提出一種推薦方法,用戶(hù)偏好相似度用余弦相似性來(lái)衡量,以達(dá)到優(yōu)化推薦多樣性算法的目的。鄧樂(lè)樂(lè)等(2021)[7]在結(jié)合熱門(mén)物品評(píng)分和物品流行度的基礎(chǔ)上,進(jìn)一步優(yōu)化協(xié)同過(guò)濾算法,動(dòng)態(tài)調(diào)整物品權(quán)重,綜合衡量了推薦結(jié)果的多樣性和覆蓋率問(wèn)題。劉浩翰等[8]通過(guò)計(jì)算出的用戶(hù)間相關(guān)關(guān)系來(lái)計(jì)算長(zhǎng)尾分布約束推薦的推薦權(quán)重,對(duì)長(zhǎng)尾商品的推薦表現(xiàn)良好。
尾部聚類(lèi)推薦多樣性方法[9]先將整個(gè)物品集分成頭部和尾部,再對(duì)尾部物品進(jìn)行聚類(lèi),最后基于此進(jìn)行多樣性推薦。史明哲等(2018)[10]通過(guò)分詞獲取長(zhǎng)尾尾部物品信息,抽象出物品主題,再結(jié)合用戶(hù)的最終偏好主題進(jìn)行相似度計(jì)算,并對(duì)相似度進(jìn)行排名,可發(fā)現(xiàn)用戶(hù)的未來(lái)偏好趨勢(shì),進(jìn)而對(duì)尾部商品推薦??紤]到長(zhǎng)尾商品大部分缺少評(píng)分?jǐn)?shù)據(jù)這一特點(diǎn),吳國(guó)棟(2020)[11]在選取分割點(diǎn)后,將形成的尾部運(yùn)用Kmeans++進(jìn)行聚類(lèi),在長(zhǎng)尾推薦帶來(lái)多樣性的同時(shí),以有效提高長(zhǎng)尾物品推薦的準(zhǔn)確性。徐小菁(2019)[12]以物品流行度作為標(biāo)準(zhǔn)進(jìn)行長(zhǎng)尾推薦是存在有偏性的問(wèn)題,提出ITCC雙聚類(lèi)和Kmeans聚類(lèi)算法,在尾部聚類(lèi)下用戶(hù)物品矩陣的稠密度得以提高,優(yōu)化長(zhǎng)尾物品的推薦效果。Sinha等(2019)[13]表示通過(guò)尾部聚類(lèi)的方法把相似的用戶(hù)聚類(lèi)到同一個(gè)聚類(lèi)中,可以克服協(xié)同過(guò)濾帶來(lái)的數(shù)據(jù)稀疏問(wèn)題,從而提高推薦多樣性。
基于二部圖的推薦多樣性方法的基本思想是在二部圖的基礎(chǔ)上,結(jié)合物質(zhì)擴(kuò)散和熱傳導(dǎo)思想來(lái)提高推薦多樣性。在推薦方法中,二部圖可表示為G(U,O,E),U為用戶(hù)的集合={u,u,u,…,um},o是物品的集合={o,o,o,…,on},E是二部圖中的邊所構(gòu)成的集合,其中用戶(hù)集合U和物品集合I是兩個(gè)互不相交的集合。塔赫基于二部圖推薦提出了著名的基于圖的推薦算法,能夠緩解冷啟動(dòng)和數(shù)據(jù)稀疏問(wèn)題,提高推薦結(jié)果的多樣性。鄧松等(2017)[14]在區(qū)分用戶(hù)高低評(píng)分的基礎(chǔ)上,改進(jìn)二部圖中初始資源分配,從而解決推薦多樣性問(wèn)題。蘇健民、郭付超(2018)[15]在調(diào)整兩次資源分配方式后,成功向用戶(hù)推薦更多符合用戶(hù)偏好的產(chǎn)品。王冉等(2018)[16]提出一種基于加權(quán)二部圖的斜坡算法推薦算法,在一定程度上增加推薦結(jié)果的多樣性。劉忠寶等(2018)[17]提出了一種基于二部圖的學(xué)習(xí)資源混合推薦模型,將熱傳導(dǎo)提高推薦多樣性的特點(diǎn)和物質(zhì)擴(kuò)散能提高推薦準(zhǔn)確性的特點(diǎn)結(jié)合起來(lái),并通過(guò)設(shè)定可調(diào)參數(shù)λ進(jìn)行調(diào)整。黃繼婷等(2019)[18]提出融合偏好度和二部圖的推薦算法,降低熱門(mén)物品推薦概率和提高冷門(mén)物品推薦概率,從而達(dá)到提高推薦多樣性的目的。
基于行列式點(diǎn)過(guò)程的推薦多樣性方法[19]的基本思想是最大化抽取推薦給用戶(hù)的物品集的概率來(lái)實(shí)現(xiàn)推薦多樣性。DPP是一種用求解行列式來(lái)計(jì)算概率的方法。Hulu在2018年提出了基于行列式點(diǎn)過(guò)程的推薦多樣性提升算法,能同時(shí)衡量相關(guān)性和多樣性,并在提高推薦系統(tǒng)多樣性中表現(xiàn)良好。他將基于DPP的推薦多樣性問(wèn)題轉(zhuǎn)化為MAP問(wèn)題求解,從而達(dá)到提高推薦多樣性的目的。李金龍基于DPP在求解多目標(biāo)問(wèn)題時(shí),雖然在核矩陣的定義上與Hulu不同,但其同樣可以綜合評(píng)價(jià)收斂性和多樣性。李金龍還在求解DPP問(wèn)題過(guò)程中,將DPP轉(zhuǎn)化為k-DPP,借助矩陣的特征值分解降低其時(shí)間復(fù)雜程度。行列式點(diǎn)過(guò)程推薦多樣化方法,不僅能同時(shí)度量物品的多樣性和相關(guān)性,還能簡(jiǎn)化計(jì)算,提高推薦效率和效果。
基于注意力機(jī)制的推薦多樣性方法的基本思想是利用注意力機(jī)制覆蓋更加全面的用戶(hù)興趣范圍,從而提高推薦多樣性。傳統(tǒng)的序列推薦模型重點(diǎn)關(guān)注用戶(hù)過(guò)去的偏好,所以預(yù)測(cè)結(jié)果偏向以往類(lèi)似或補(bǔ)充的物品,在結(jié)果多樣性上表現(xiàn)不佳。基于注意力機(jī)制的推薦多樣性方法對(duì)用戶(hù)以往的歷史行為分配權(quán)重,更加全面和有針對(duì)性地抓取用戶(hù)的興趣點(diǎn),消除一定程度的“頭部效應(yīng)”,從而在多樣性上表現(xiàn)良好。Hu等(2021)提出了一個(gè)多目標(biāo)LPR框架,使用卷積神經(jīng)網(wǎng)絡(luò)捕捉學(xué)習(xí)者之間的動(dòng)態(tài)交互,建立注意力機(jī)制來(lái)根據(jù)內(nèi)容的特點(diǎn)調(diào)整交互行為的權(quán)重,優(yōu)化由交互強(qiáng)度、多樣性和新穎性三個(gè)相互沖突的指標(biāo)組成的多目標(biāo)函數(shù)。曲昕彤(2020)[20]在NeuMF的模型基礎(chǔ)上,對(duì)多層感知機(jī)部分進(jìn)行改進(jìn)。在權(quán)衡多樣性和有側(cè)重性的精準(zhǔn)推薦前提下,新增注意力機(jī)制來(lái)實(shí)現(xiàn)局部激活單元。用戶(hù)歷史行為向量與物品嵌入向量的外積構(gòu)成前饋神經(jīng)網(wǎng)絡(luò),從而輸出其激活權(quán)重,即
綜上所述,推薦多樣性可以提高推薦質(zhì)量,并且提高推薦多樣性的方法主要基于長(zhǎng)尾效應(yīng)、二部圖、行列式點(diǎn)過(guò)程及注意力機(jī)制四個(gè)方面。本文從性能特點(diǎn)和局限性?xún)蓚€(gè)方面對(duì)推薦多樣性方法進(jìn)行比較和總結(jié)。(1)基于長(zhǎng)尾效應(yīng)的推薦多樣性方法能比較全面地覆蓋利基產(chǎn)品種類(lèi),但準(zhǔn)確性表現(xiàn)不佳。(2)基于二部圖的推薦多樣性方法可在不考慮內(nèi)容特征的前提下,達(dá)到緩解冷啟動(dòng)和數(shù)據(jù)稀疏等問(wèn)題,但存在大量信息浪費(fèi)的缺點(diǎn)。(3)基于行列式點(diǎn)過(guò)程的推薦多樣性方法,用簡(jiǎn)單的行列式計(jì)算替換復(fù)雜的概率計(jì)算,從而降低時(shí)間復(fù)雜度,但粗排序階段需要有相應(yīng)的多樣性策略,否則無(wú)法保證其多樣性。(4)基于注意力機(jī)制的推薦多樣性方法,對(duì)用戶(hù)以往的歷史行為分配權(quán)重,更加全面和有針對(duì)性地抓取用戶(hù)的興趣點(diǎn),消除一定程度的“頭部效應(yīng)”,從而在多樣性上表現(xiàn)良好,但計(jì)算過(guò)程需要大量資源與儲(chǔ)存空間,增加多樣性推薦模型的復(fù)雜度。
大數(shù)據(jù)時(shí)代下,推薦多樣性逐步成為推薦領(lǐng)域的熱點(diǎn),推薦多樣性彌補(bǔ)了以準(zhǔn)確率為目標(biāo)進(jìn)行優(yōu)化的推薦算法所導(dǎo)致的“信息繭房”問(wèn)題,對(duì)信息提供方、用戶(hù)和商家而言,都具有重要意義。本文經(jīng)過(guò)論文梳理將推薦多樣性方法主要總結(jié)為以下四個(gè):基于長(zhǎng)尾效應(yīng)的推薦多樣性方法、基于二部圖的推薦多樣性方法、基于行列式點(diǎn)過(guò)程的推薦多樣性方法和基于注意力機(jī)制的推薦多樣性方法,并對(duì)這四種推薦多樣性方法的性能特點(diǎn)和局限性做了詳細(xì)比較。但是,提高推薦多樣性的方法還存在不少挑戰(zhàn),例如推薦多樣性的感知是主觀的,相關(guān)性與多樣性之間的權(quán)衡等,這些都是提高推薦多樣性方法未來(lái)需要解決的難題。