張宏升
摘要:本文通過介紹推薦算法的概念入手,根據(jù)推薦算法的劃分分類,從分類中選擇4中推薦算法應(yīng)用到圖書管理系統(tǒng)中進(jìn)行對(duì)比,發(fā)現(xiàn)組合推薦技術(shù)避免或彌補(bǔ)其他推薦技術(shù)的弱點(diǎn),更適合應(yīng)用系統(tǒng)中,最后本文總結(jié)了4方法的優(yōu)劣,提供大家更準(zhǔn)確的選擇推薦算法,形成組合推薦算法。
關(guān)鍵詞:推薦算法;圖書管理系統(tǒng);組合推薦
1.推薦算法的概念
推薦算法通過一些數(shù)學(xué)算法,推測(cè)出用戶可能喜歡的東西,目前應(yīng)用推薦算法比較好的地方主要是網(wǎng)絡(luò)。所謂推薦算法就是利用用戶的一些行為,通過一些數(shù)學(xué)算法,推測(cè)出用戶可能喜歡的東西。[1]
2.推薦算法的劃分
推薦算法基本可劃分基于內(nèi)容、基于協(xié)同、基于關(guān)聯(lián)規(guī)則、基于效用、基于知識(shí)、組合推薦,下面我們就將基于內(nèi)容、基于協(xié)調(diào)、基于關(guān)聯(lián)規(guī)則的這三種算法應(yīng)用到圖書管理系統(tǒng)中進(jìn)行研究分析。
2.1基于內(nèi)容
基于內(nèi)容的推薦是在項(xiàng)目的內(nèi)容信息上建立的推薦應(yīng)用,并沒有考慮用戶的需求也就是用戶對(duì)項(xiàng)目的評(píng)價(jià)意見,其實(shí)它就信息過濾技術(shù)的延續(xù)和發(fā)展,更多地是從內(nèi)容的特征描述的事例中得到用戶的興趣資料,使用機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)。
在圖書管理推薦系統(tǒng)中,基于內(nèi)容的推薦算法依據(jù)項(xiàng)目或?qū)ο笫怯上嚓P(guān)特征的屬性定義的,系統(tǒng)通過用戶評(píng)價(jià)對(duì)象的特征來進(jìn)行機(jī)器學(xué)習(xí)用戶的興趣,常用的學(xué)習(xí)方法有決策樹、神經(jīng)網(wǎng)絡(luò)和基于向量,再對(duì)比用戶資料與待預(yù)測(cè)項(xiàng)目的匹配程度。基于內(nèi)容的用戶資料需要有用戶的歷史數(shù)據(jù),用戶資料模型可能隨著用戶的偏好改變而發(fā)生變化,這一推薦算法能很好的建立用戶的喜好模型,但同時(shí)對(duì)歷史數(shù)據(jù)提出要求,當(dāng)數(shù)據(jù)越多用于的喜好模型的準(zhǔn)確度就會(huì)提高。
2.2基于協(xié)同
基于協(xié)同過濾的推薦算法推薦采用最近鄰技術(shù),在圖書管理推薦系統(tǒng)中我們是先通過用戶的歷史喜好信息來計(jì)算用戶之間的距離,然后利用目標(biāo)用戶的最近鄰居用戶對(duì)商品評(píng)價(jià)的加權(quán)評(píng)價(jià)值來預(yù)測(cè)目標(biāo)用戶對(duì)特定商品的喜好程度,從而根據(jù)這一喜好程度來對(duì)目標(biāo)用戶進(jìn)行推薦。[2]這一算法是對(duì)推薦對(duì)象沒有特殊的要求,能處理如音樂、電影等這些非結(jié)構(gòu)化的復(fù)雜對(duì)象。
基于協(xié)同過濾的推薦算法的基本思想非常易于理解就像人和人之間,人們往往會(huì)利用好朋友的推薦來進(jìn)行一些選擇,該算法在圖書系統(tǒng)中若想要為一用戶找到他真正感興趣的內(nèi)容的好方法的時(shí)候,首先找到與此用戶有相似興趣的其他用戶,然后將他們感興趣的內(nèi)容推薦給此用戶。這一算法是從用戶的角度來進(jìn)行相應(yīng)推薦的,不需要用戶努力地找到適合自己興趣的推薦信息。
2.3基于關(guān)聯(lián)規(guī)則
基于關(guān)聯(lián)規(guī)則的推薦是以關(guān)聯(lián)規(guī)則為基礎(chǔ),應(yīng)用在圖書管理系統(tǒng)進(jìn)行推薦時(shí)候,采用一種基于關(guān)聯(lián)規(guī)則的標(biāo)簽推薦方法,包括以下步驟:步驟1:建立窗口模型采集每個(gè)用戶所使用過的標(biāo)簽,并添加到標(biāo)簽事務(wù)集合,形成標(biāo)簽事務(wù)集合T;步驟2:利用最大頻繁項(xiàng)挖掘算法對(duì)標(biāo)簽事務(wù)集合T進(jìn)行頻繁項(xiàng)挖掘,得到頻繁共現(xiàn)的標(biāo)簽集集合F;步驟3:對(duì)所得頻繁共現(xiàn)的標(biāo)簽集集合F進(jìn)行挖掘找出標(biāo)簽集之間的關(guān)系,得到關(guān)于所找到標(biāo)簽集之間的關(guān)聯(lián)規(guī)則集合R,所述關(guān)聯(lián)規(guī)則集合R包括先導(dǎo)標(biāo)簽集及與其關(guān)聯(lián)的后繼標(biāo)簽集;步驟4:收集每個(gè)待推薦的用戶使用過的所有標(biāo)簽,得到關(guān)于每個(gè)用戶的標(biāo)簽集合;判斷所述標(biāo)簽關(guān)聯(lián)規(guī)則集合R中的先導(dǎo)標(biāo)簽集是否存在于用戶的標(biāo)簽集合中,當(dāng)判斷為存在時(shí),將該條規(guī)則中先導(dǎo)標(biāo)簽集關(guān)聯(lián)的后繼標(biāo)簽集推薦給對(duì)應(yīng)用戶。其中,設(shè)置標(biāo)簽頻繁地同時(shí)出現(xiàn)的支持度和置信度;將滿足所設(shè)置的標(biāo)簽頻繁地同時(shí)出現(xiàn)的支持度和置信度的標(biāo)簽之間關(guān)聯(lián)及加入關(guān)聯(lián)規(guī)則集合R。
2.4組合推薦
基于各種推薦方法的優(yōu)缺點(diǎn),在實(shí)際中組合推薦便成為人們較為青睞的使用方法,大部分應(yīng)用研究和應(yīng)用都是將內(nèi)容推薦于協(xié)同過濾推薦進(jìn)行組合,形成一個(gè)推薦的預(yù)測(cè)結(jié)果。在圖書管理系統(tǒng)我們就采取了這樣的推薦方式,就是分別用基于內(nèi)容的方法和協(xié)同過濾推薦方法組合形成一個(gè)推薦預(yù)測(cè)結(jié)果,然后用協(xié)同過濾推薦方法組合形成的推薦預(yù)測(cè)結(jié)果。這個(gè)思路是基于研究人員提出的元級(jí)別的組合思路完成的。
關(guān)于組合推薦的組合方式上,研究人員門得出了一下7種組合思路:
1)加權(quán)(Weight):加權(quán)多種推薦技術(shù)結(jié)果。[2]
2)變換(Switch);根據(jù)問題背景和實(shí)際情況或要求決定變換采用不同的推薦技術(shù)。[2]
3)混合(Mixed):同時(shí)采用多種推薦技術(shù)給出多種推薦結(jié)果,為用戶提供參考。[2]
4)特征組合(Feature Combination):組合來自不同推薦數(shù)據(jù)源的特征被另一種推薦算法所采用。[2]
5)層疊(Cascade):先用一種推薦技術(shù)產(chǎn)生一種粗糙的推薦結(jié)果,第二種推薦技術(shù)在此推薦結(jié)果的基礎(chǔ)上進(jìn)一步做出更精確的推薦。[2]
6)特征擴(kuò)充(Feature Augmentation):將一種技術(shù)產(chǎn)生附加的特征信息嵌入另一種推薦技術(shù)的特征輸入中。[2]
7)元級(jí)別(Meta-Ievel):用一種推薦方法產(chǎn)生的模型作為另一種推薦方法的輸入。[2]
3.總結(jié)
綜上所述,將4中推薦算法應(yīng)用到圖書管理系統(tǒng)中我們發(fā)現(xiàn)組合推薦就是通過組合來避免或彌補(bǔ)各自推薦技術(shù)的弱點(diǎn),它可以彌補(bǔ)了其他推薦技術(shù)的各種問題,達(dá)到了我們預(yù)設(shè)的結(jié)果,提高了系統(tǒng)的在推薦技術(shù)上的信任度和準(zhǔn)確度。因此,本文先給出各個(gè)推薦算法的詳細(xì)對(duì)比,讓讀者可以更準(zhǔn)確地有效地去應(yīng)用組合推薦算法。各個(gè)推薦算法的對(duì)比如下圖所示:
本文將4中推薦算法應(yīng)用到圖書管理系統(tǒng),并給出了這四種推薦算法的優(yōu)缺點(diǎn)的詳細(xì)對(duì)比表,方便大家更準(zhǔn)確的選擇推薦算法,形成組合推薦算法,將組合算法的優(yōu)勢(shì)發(fā)揮到最大,做到通過組合各種推薦算來避免或者彌補(bǔ)各推薦技術(shù)的弱點(diǎn)。
基金項(xiàng)目:
項(xiàng)目編號(hào):B2018400,項(xiàng)目名稱:圖書推薦系統(tǒng)徑向信任傳遞算法的應(yīng)用研究,項(xiàng)目類型:2018年湖北省教育廳科學(xué)研究計(jì)劃指導(dǎo)性項(xiàng)目
參考文獻(xiàn):
[1]趙守香,唐胡鑫,熊海濤著.大數(shù)據(jù)分析與應(yīng)用:航空工業(yè)出版社,2015.12:第182頁.
[2]楊旭,湯海京,丁剛毅編著.數(shù)據(jù)科學(xué)導(dǎo)論 第2版:北京理工大學(xué)出版社,2017.01:第58頁.
(作者單位:武漢晴川學(xué)院)