潘璇 王雨嫣
摘要:從旅游推薦系統(tǒng)的研究與應(yīng)用現(xiàn)狀出發(fā),發(fā)現(xiàn)本異地差異的特點并沒有在國內(nèi)的旅游推薦系統(tǒng)中普及應(yīng)用。因此依據(jù)用戶的個性化偏好,以川渝的部分城市景點為基礎(chǔ),改進的基于物品的協(xié)同過濾推薦為核心,搭建了考慮用戶是否來自于川渝地區(qū)這一本異地差異的個性化旅游推薦APP。
關(guān)鍵詞:旅游推薦;協(xié)同過濾;本異地差異。
1.背景
在新冠病毒疫情的爆發(fā)導(dǎo)致國人對國內(nèi)旅游需求不斷增長,大數(shù)據(jù)時代信息爆炸與用戶對信息的利用率反而下降的雙重背景下[1],提出了一種具有現(xiàn)實意義的個性化旅游推薦系統(tǒng),實現(xiàn)了一種更能符合用戶需求來進行旅游景點推薦的APP。
2.算法介紹
2.1優(yōu)化的基于物品的協(xié)同過濾推薦算法
2.1.1 傳統(tǒng)的協(xié)同過濾推薦算法的缺點[2]
(1)用戶對物品評分非常稀疏,可能無法得到精準的用戶相似性;
(2)隨著使用者和物品數(shù)目增多,計算復(fù)雜性也會增加導(dǎo)致系統(tǒng)性能變差;
(3)如果一個產(chǎn)品從來沒有被任何一個系統(tǒng)使用者進行過評估,這個產(chǎn)品就不會成為被推薦的依據(jù)。
2.1.2 個性化環(huán)境下改進的協(xié)同過濾推薦算法
在實際應(yīng)用中傳統(tǒng)的推薦算法通常會遇到冷啟動問題。為此我們提出建立初始用戶必填的個性化表單,可有效解決冷啟動問題。此外考慮到用戶的地域差異會導(dǎo)致相似用戶對同類型旅游景點產(chǎn)生不同程度的期望,該系統(tǒng)為每位用戶增添了地域?qū)傩?,以提高每位用戶對推薦景點的滿意度。
3.系統(tǒng)設(shè)計
3.1系統(tǒng)需求分析
主要以川渝地區(qū)的部分城市景點構(gòu)建旅游推薦系統(tǒng),以改良的基于物品的協(xié)同過濾推薦算法為核心,設(shè)計一個更能符合用戶需求的個性化旅游推薦APP。
3.2系統(tǒng)總體功能設(shè)計
具體的系統(tǒng)功能結(jié)構(gòu)圖如圖3.1所示。
3.3系統(tǒng)詳細設(shè)計
3.3.1 功能模塊詳細設(shè)計
具體的功能流程設(shè)計如圖3.2所示。
3.3.2 改進的協(xié)同過濾推薦算法設(shè)計
解決冷啟動問題的具體做法如下。
(1)給用戶和旅游景點增加標簽
每位用戶擁有風(fēng)格屬性和是否為川渝用戶屬性;每個旅游景點均有風(fēng)格屬性和是否火熱屬性。
(2)新用戶注冊后必須填寫個性化表單
該個性化表單的內(nèi)容為是否為川渝用戶和風(fēng)格屬性。隨后系統(tǒng)將內(nèi)容保存到服務(wù)器數(shù)據(jù)庫的用戶表里的相應(yīng)字段。
(3)按照表單內(nèi)容排序呈現(xiàn)旅游景點
根據(jù)當前登錄用戶填寫的風(fēng)格類型對旅游景點進行排序,與當前登錄用戶風(fēng)格相同的景點排序靠前,優(yōu)先呈現(xiàn)給用戶。
下面依次闡明本文在具體實現(xiàn)改進的基于物品推薦時的做法。
(1)尋找相似偏好用戶
本系統(tǒng)所使用的偏好信息是用戶“收藏”這一行為所產(chǎn)生的數(shù)據(jù)集,即協(xié)同過濾推薦中的隱性數(shù)據(jù)。當用戶瀏覽到喜歡的景點時可對該景點進行“收藏”;當用戶不再喜歡該景點時可對其“取消收藏”,上述行為分別會增加、減少本系統(tǒng)所收集的該用戶偏好信息數(shù)據(jù)集中的數(shù)據(jù)。
(2)計算物品相似度
1)查看系統(tǒng)是否有當前登錄用戶的偏好數(shù)據(jù)集。請求當前登錄用戶的信息,然后遍歷數(shù)據(jù)庫中的用戶收藏表。若遍歷完成發(fā)現(xiàn)當前登錄用戶沒有收藏,代表沒有刻畫該用戶偏好的數(shù)據(jù)集,則退出推薦流程;反之,則繼續(xù)推薦流程。
2)根據(jù)每位用戶收藏的景點,先進行分類計數(shù)再以類別為單位對其降序排序。連接數(shù)據(jù)庫中的用戶表,獲取每位用戶的UID,并保存到自定義的數(shù)組中。依次從數(shù)組里取出UID,遍歷收藏表,計數(shù)每位用戶收藏的各類型景點;若當前計數(shù)用戶就是現(xiàn)在的登錄用戶,那么在降序后把降序的結(jié)果單獨保存,作為一會兒對該用戶進行推薦的依據(jù)。
3)根據(jù)每位用戶的top1和top2收藏,計算出最具有關(guān)聯(lián)性的物品組合。根據(jù)上一步得出的每位用戶收藏的景點的排序結(jié)果,依次統(tǒng)計top1和top2收藏的不同組合的個數(shù),計算完成后再對其進行排序,得到最火熱的組合。
4)給用戶推薦景點。若用戶收藏的景點中有屬于最火熱組合里的其中一個類別,則為用戶推薦一個該組合中另外一個類別的景點,其余情況則不推薦景點。在呈現(xiàn)時,若用戶是川渝屬性,那么推薦的景點不僅滿足計算出的風(fēng)格后,還應(yīng)屬于非火熱屬性;反之則應(yīng)屬于火熱屬性。
4.結(jié)論
本系統(tǒng)考慮了本異地差異,對基于物品的推薦結(jié)果再次進行了優(yōu)化。傳統(tǒng)的基于物品的協(xié)同過濾推薦算法,是一種大眾化的相似,如景點A和景點B相似,是因為整個用戶群體中有很多用戶同時收藏這兩個景點,假設(shè)目標用戶收藏了景點A雖然推薦景點B看似合理,但是這個用戶是否真的有喜歡這個景點其實有待考量;在算法最后加入了本異地差異就考慮到了這一點,在最后不僅合理的理由推薦給用戶,而且這個推薦的物品確實也考慮到了是否真的適合他。
References
[1]Milicevic,A.K.,Nanopoulos,A.&Ivanovic,M.Social tagging in recommender systems:a survey of the state-of-the-art and possible extensions.Artif Intell Rev 33,187–209(2010).
[2]Jia,Z.,Yang,Y.,Gao,W.,Chen,X.:User-based collaborative filtering for tourist attraction recommendations.In:International Conference on Computational Intelligence&Communication Technology,Ghaziabad,India(2015).
來源:訓(xùn)練計劃 + 項目編號S202010615101