摘 要:通常,為了構(gòu)建一個(gè)推薦系統(tǒng),一般都會(huì)考慮使用兩種最常見(jiàn)的推薦算法:基于內(nèi)容過(guò)濾算法和協(xié)同過(guò)濾算法[1,2]。然而,這兩種推薦算法都有各自的技術(shù)缺點(diǎn)。解決特征提取是內(nèi)容過(guò)濾的困難之處,同時(shí)預(yù)測(cè)用戶的興趣趨勢(shì)也難以很好處理。協(xié)同過(guò)濾算法則需要面臨冷啟動(dòng)問(wèn)題和矩陣稀疏性問(wèn)題。本文結(jié)合內(nèi)容推薦,協(xié)同推薦,采用本體這一新工具,構(gòu)建出一種全新的混合推薦算法。新的推薦算法可以解決傳統(tǒng)的推薦算法面臨的冷啟動(dòng)、數(shù)據(jù)稀疏性、興趣趨向預(yù)測(cè)等一些問(wèn)題。
關(guān)鍵詞:內(nèi)容過(guò)濾;協(xié)同過(guò)濾;混合推薦;本體;推薦系統(tǒng)
中圖分類號(hào):TP391.3
內(nèi)容過(guò)濾主要取決于表征項(xiàng)目的內(nèi)容(或特征)之間的相似度,其優(yōu)點(diǎn)是它不需要額外的其他用戶的數(shù)據(jù),它只需要用戶的使用歷史記錄以及相關(guān)項(xiàng)目的信息。然而,這種推薦算法的缺點(diǎn)卻是:隨著系統(tǒng)當(dāng)中項(xiàng)目數(shù)量的增多,計(jì)算項(xiàng)目(或特征)間的相似度將變成棘手的問(wèn)題。協(xié)同過(guò)濾算法是基于用戶之間相似性的,它不需要項(xiàng)目的其他信息。然而,協(xié)同過(guò)濾卻面臨冷啟動(dòng)問(wèn)題[1],此外矩陣稀疏性問(wèn)題也是傳統(tǒng)協(xié)同過(guò)濾推薦算法的另一個(gè)嚴(yán)重的問(wèn)題[3]。同時(shí),傳統(tǒng)的這兩種推薦算法不能很好的挖掘和預(yù)測(cè)用戶的興趣,并且它們對(duì)于用戶興趣的變化做出的反應(yīng)非常慢。
1 主要的推薦算法
1.1 協(xié)同過(guò)濾(簡(jiǎn)稱CF)。是目前使用和研究最多的推薦算法[4],協(xié)同過(guò)濾通過(guò)鄰居用戶的信息來(lái)計(jì)算得到目標(biāo)用戶的推薦。其認(rèn)為:一個(gè)用戶會(huì)與和他有相同興趣的用戶喜歡相同的項(xiàng)目。任意給定兩個(gè)用戶u和v,用N(u)表示用戶u的特征集合,N(v)表示用戶v的特征集合,則u和v的相似度可以使用如下公式進(jìn)行描述:
接下來(lái)的步驟是以上算法都可以繼續(xù)的步驟,它是以上算法的推薦步驟。
對(duì)剛剛評(píng)分的項(xiàng)目按評(píng)分排序,將評(píng)分最高的前N個(gè)項(xiàng)目推薦給用戶。
因此,在實(shí)際系統(tǒng)當(dāng)中我們的算法即可以各自單獨(dú)的運(yùn)行,也可以兩種組合起來(lái)運(yùn)行。
4 結(jié)束語(yǔ)
在基于本體的協(xié)同過(guò)濾和內(nèi)容過(guò)濾算法中,本文將傳統(tǒng)的基于向量模型的相似度計(jì)算公式改為了基于本體模型的語(yǔ)義相似度計(jì)算公式,因此在計(jì)算鄰居和項(xiàng)目匹配時(shí),我們的算法都考慮了關(guān)鍵詞在語(yǔ)義層面的關(guān)系[3,6]。傳統(tǒng)的協(xié)同過(guò)濾算法中尋找用戶鄰居時(shí)都是使用評(píng)分向量算相似性的,相似性低,本文則采用用戶興趣來(lái)計(jì)算用戶相似性,使得協(xié)同過(guò)濾中找到的鄰居可以更可靠,也可以簡(jiǎn)單協(xié)同過(guò)濾的矩陣稀疏性和冷啟動(dòng)問(wèn)題。本體的應(yīng)用可以使得項(xiàng)目的特征提取更具規(guī)范,同時(shí)用戶興趣的自動(dòng)更新也可以較好的解決用戶興趣的預(yù)測(cè)問(wèn)題。當(dāng)然,由于算法的改良在實(shí)際應(yīng)該過(guò)程中算法的時(shí)間復(fù)雜度將大大增加。
參考文獻(xiàn):
[1]Y Deng, Z Wu, C Tang, et al.A Hybrid Movie Recommender Based on Ontology and Neural Networks.GREENCOM-CPSCOM '10 Proceedings of the 2010 IEEE/ACM Int'l Conference on Green Computing and Communications Int'l Conference on Cyber,Physical and Social Computing,2010:846-851.
[2]G Adomavicius,A Tuzhilin. Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art and Possible Extensions.Knowledge and Data Engineering,2005:734-749.
[3]H Kapusuzoglu,SGO?guducu. A Relational Recommender System Based on Domain Ontology.Emerging Intelligent Data and Web Technologies (EIDWT),2011:36-41.
[4]F Wu, L He, W Xia, L Ren. A Collaborative Filtering Algorithm Based on Users’Partial Similarity. Control, Automation, Robotics and Vision,2008:1072-1077.
[5]N. F.Noy, D.L.McGuiness,“Ontology Development 101:A Guide to Creating Your First Ontology”,Stanford Knowledge Systems Laboratory Technical Report KSL-01-05,March,2001.
[6]Y Naudet,A Aghasaryan,Y Toms.An Ontology-based Profiling and Recommending System for Mobile TV.Semantic Media Adaptation and Personalization,2008:94-99.
[7]林森.基于Tag技術(shù)的知識(shí)個(gè)性化及系統(tǒng)[D].華中科技大學(xué),2006.
[8]許海玲,吳瀟,李曉東.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報(bào),2009(02).
[9]劉建國(guó),周濤,汪秉宏.個(gè)性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009(01).
作者簡(jiǎn)介:鄭元平(1988.05-),男,湖南新田縣人,碩士研究生,研究方向:計(jì)算機(jī)軟件與理論。
作者單位:浙江師范大學(xué) 數(shù)理與信息工程學(xué)院,浙江金華 321004