??崱〈拗覀ァ≮w晨潔 王永金 吳戀
摘 要:該文首先分析了個性化旅游推薦系統(tǒng)的數(shù)據(jù)來源,并介紹了用戶行為數(shù)據(jù)、用戶標簽數(shù)據(jù)、上下文信息和基于社交網(wǎng)絡數(shù)據(jù)等推薦技術(shù)近年來的研究進展。其次,分析了能提升推薦性能的混合推薦技術(shù)以及滿足多約束場景的基于約束的推薦技術(shù),介紹了相關(guān)領域的最新研究成果。最后,展望了個性化旅游推薦技術(shù)研發(fā)的發(fā)展方向。
關(guān)鍵詞:個性化旅游;推薦系統(tǒng);協(xié)同過濾;混合推薦;標簽數(shù)據(jù);多約束場景
中圖分類號:TP316文獻標識碼:A文章編號:2095-1302(2020)03-00-03
0 引 言
隨著信息技術(shù)的迅猛發(fā)展,旅游行業(yè)與信息技術(shù)深度融合的需求越發(fā)強烈。在信息過載(Information Overload)的大數(shù)據(jù)時代,用戶經(jīng)常會感到無法快速獲取自己所感興趣的信息。因此,根據(jù)用戶的偏好,向用戶推薦其感興趣的個性化旅游推薦技術(shù)孕育而生。
個性化旅游推薦技術(shù)就是將推薦系統(tǒng)融入旅游行業(yè),通過個性化的推薦,可以向用戶提供輔助決策,更高效、更精準地向用戶推薦其感興趣的旅游產(chǎn)品[1-2],因此,具有廣闊的應用空間和研究價值。
1 推薦系統(tǒng)及相關(guān)技術(shù)
推薦系統(tǒng)(Recommender System)在分析用戶行為數(shù)據(jù)的基礎上,建立對應的興趣模型(Interest Model),基于模型向用戶推薦滿足其興趣的偏好信息。
推薦技術(shù)可以按數(shù)據(jù)來源進行分類,這些數(shù)據(jù)包括:用戶行為數(shù)據(jù)、用戶標簽數(shù)據(jù)、上下文信息和社交網(wǎng)絡數(shù)據(jù)等。近年來,為進一步提升推薦系統(tǒng)技術(shù)的性能、滿足多約束場景下的應用,眾多研究人員分別提出了混合推薦技術(shù)[2-6]和基于約束的推薦技術(shù)[7-9]。
2 利用用戶行為數(shù)據(jù)的推薦技術(shù)
網(wǎng)站等平臺在運行過程中會記錄大量的日志(Log)數(shù)據(jù),這些日志數(shù)據(jù)包含的用戶行為數(shù)據(jù),包括:頁面瀏覽、購買、點擊、評分和評論等。利用用戶行為數(shù)據(jù)的推薦技術(shù)正是借助用戶行為數(shù)據(jù)實現(xiàn)推薦的一種推薦技術(shù),可分為基于鄰域(Neighborhood-Based)的推薦技術(shù)、基于隱語義模型(Latent Factor Model)的推薦技術(shù)以及基于混合模型(Hybrid Model)的推薦技術(shù)等。
2.1 基于鄰域的推薦技術(shù)
基于鄰域推薦的核心是協(xié)同過濾(Collaborative Filtering,CF)。單純的CF受限于其性能,較少應用于旅游推薦。
文獻[10]為解決傳統(tǒng)協(xié)同過濾中存在的數(shù)據(jù)稀疏性、冷啟動等問題,提出了面向旅游產(chǎn)品推薦的基于不確定近鄰(Uncertain Neighbors)的協(xié)同過濾算法(IUNCF)。IUNCF算法首先利用K-means聚類技術(shù)實現(xiàn)用戶信息的動態(tài)分類篩選并分配推薦權(quán)重,然后結(jié)合內(nèi)容信息,實現(xiàn)協(xié)同過濾推薦。實驗結(jié)果顯示,IUNCF算法能夠更有效地實現(xiàn)旅游產(chǎn)品推薦,其推薦準確度也相應提升。
2.2 基于隱語義模型的推薦技術(shù)
基于隱語義模型的推薦技術(shù)由于性能良好,源自文本挖掘領域的、旨在抽取文字中隱含語義的模型成為主要的推薦技術(shù)之一。
文獻[11]改進了經(jīng)典Apriori算法,提出了融合矩陣聚類(Matrix Cluster)的MC-Apriori算法,同時,對用戶行為進行頻繁集挖掘,最終實現(xiàn)符合用戶搜索偏好的推薦。通過分析實驗結(jié)果,驗證了MC-Apriori算法的準確性高于Apriori算法。
孫彥鵬等提出了基于多重隱語義的MLSTR-RM模型用以表達旅游路線[12]。借助MLSTR-RM模型提取上下文的隱語義數(shù)據(jù),采用負采樣方式將來自隱語義數(shù)據(jù)的訓練集數(shù)據(jù)用于模型參數(shù)的訓練,并設計個性化景點推薦算法。經(jīng)過在真實數(shù)據(jù)集上的測試,驗證了MLSTR-RM模型的有效性。
朱桂祥等提出面向旅游產(chǎn)品推薦的基于主題序列模式的SECT引擎[13]。SECT引擎首先挖掘日志的主題以發(fā)現(xiàn)用戶行為范式,然后構(gòu)建序列模式數(shù)據(jù)庫。最后,用Markov N-gram模型完成點擊流與序列模式數(shù)據(jù)庫的匹配。經(jīng)過真實旅游數(shù)據(jù)集的測試,SECT引擎較之傳統(tǒng)算法,其性能更優(yōu)越。針對冷啟動用戶,SECT引擎的推薦率和準確率也更高。
文獻[1]以眾源地理數(shù)據(jù)集合為對象,研發(fā)了面向熱門路線推薦的路線可視化平臺。其技術(shù)路線是,首先,借助標簽化技術(shù)實現(xiàn)路線數(shù)據(jù)的剪枝和篩選;然后,以Apriori算法挖掘數(shù)據(jù)集中的頻繁景點序列;其次,利用協(xié)同過濾尋找相似度高的路線;最后,根據(jù)頻繁序列項的綜合收益進行推薦排序。實驗數(shù)據(jù)顯示,該平臺能提升F-Measure、召回率和準確率等性能指標。
2.3 基于混合模型的推薦技術(shù)
混合模型即采用兩種及以上的模型來設計推薦算法,由于其性能優(yōu)良,近年來已成為研究熱點。
文獻[3]利用在線評論數(shù)據(jù)設計出一種景點個性化推薦算法。該算法通過對用戶景點評論進行情感偏好分析,并運用領域本體構(gòu)建技術(shù),計算用戶的需求和滿意度,結(jié)合群體智慧,向用戶推薦符合其偏好的個性化旅游策略。
針對標記數(shù)據(jù)不足影響推薦效果的問題,文獻[4]提出一種基于域適應的個性化景點推薦算法。該算法使用域適應技術(shù),并將標記數(shù)據(jù)設置為輔助數(shù)據(jù),運用訓練數(shù)據(jù)來訓練推薦模型。實驗結(jié)果表明,該算法能較好地解決標記數(shù)據(jù)不足的問題。
陳君同等提出一種協(xié)同過濾與用戶偏好相融合的旅游組推薦算法[5]。該算法將相似性影響和關(guān)聯(lián)性兩種因子加入到協(xié)同過濾中用以評分預測,結(jié)合均值和最小痛苦兩種策略提出綜合組內(nèi)局部和整體兩種滿意度的滿意度平衡策略。從實驗結(jié)果來看,該算法能提升推薦的準確率。
文獻[2]提出一種基于混合推薦策略的旅游推薦系統(tǒng)。首先,建立基于用戶靜態(tài)和動態(tài)兩種信息的混合用戶興趣模型,模型包含短期興趣和長期興趣兩種模型;然后,設計啟發(fā)式旅游行程規(guī)劃算法,該算法是基于多維度景點評分的;最后,通過實驗驗證了旅游行程規(guī)劃算法的有效性,并在服務器端和iOS端部署了系統(tǒng)。
Fenza等改進了協(xié)同過濾,并提出一種上下文感知推薦算法[6]。該算法利用游客和景點構(gòu)建模糊分類器,通過分類器對新游客進行分類,然后利用上下文信息對比用戶感興趣的景點并生成類別匹配結(jié)果,最終對同一類別中的景點進行推薦排序。
3 利用用戶標簽數(shù)據(jù)的推薦技術(shù)
借助物品和用戶的特征(Feature)或標簽實現(xiàn)推薦也是重要的推薦技術(shù),常見的標簽是普通用戶賦予物品和用戶的,稱為用戶生成的內(nèi)容(User Generated Content,UGC)標簽。
文獻[14]將深度學習(Deep Learning)技術(shù)應用于旅游服務推薦系統(tǒng)。首先,在預處理階段,利用詞嵌入法對評論等數(shù)據(jù)進行處理,以實現(xiàn)詞匯的低維和稠密表示,同時,詞匯中還融入了語義;其次,采用CNN網(wǎng)絡和DNN網(wǎng)絡對用戶在線評論信息進行處理并提取其特征;再次,采用因子分解機技術(shù)構(gòu)建共同作用層來連接三個網(wǎng)絡,以提升特征的提取精度,降低數(shù)據(jù)稀疏的影響;最后,通過實驗結(jié)果證實,提出的旅游服務推薦系統(tǒng)比傳統(tǒng)推薦技術(shù)更為有效。
基于深度挖掘出的用戶畫像(Users'Demographic)是抽象的標簽化畫像,能有效反映用戶行為特征。因此,用戶畫像已成為提升推薦算法性能的重要依據(jù)之一。文獻[15]提出一種旅游情境化推薦模型,該模型是基于用戶畫像的。通過構(gòu)建的測試系統(tǒng)對旅游情境化推薦模型進行測試,結(jié)果表明,該推薦模型的推薦性能更優(yōu)。
4 利用上下文信息的推薦技術(shù)
常見的上下文(Context)信息(前述技術(shù)沒有采用)包括:用戶的訪問時間、所在地點、情感等,而這些上下文對于提升推薦系統(tǒng)性能來說是至關(guān)重要的。
常用的基于位置的推薦主要涉及三個方面的內(nèi)容,包括:數(shù)據(jù)集、評價方法及評價指標。文獻[16]在發(fā)現(xiàn)特殊評價方法及指標的基礎上,提出一種面向移動推薦系統(tǒng)的四層評價體系,該體系能有機結(jié)合基于位置的移動推薦的模型、數(shù)據(jù)集和評價要素,有助于提升評價的效用。
文獻[17]在抽取融合多源數(shù)據(jù)建立知識圖譜和挖掘游記的基礎上,創(chuàng)建旅游路線數(shù)據(jù)庫,結(jié)合數(shù)據(jù)庫、游客類型和頻繁序列挖掘算法產(chǎn)生大量候選路線。最終,利用多維度路線搜索算法及評分機制向用戶推薦旅游個性化路線。綜合考慮旅行天數(shù)、用戶類型及偏好,上述推薦能有效提升用戶體驗。
沈記全等提出一種融合情景上下文和用戶信任關(guān)系的景點推薦算法[18]。該算法在協(xié)同過濾中引入用戶信任度而非相似度以緩解數(shù)據(jù)稀疏的問題,并融合情景上下文來表征不同用戶的不同需求,以此建設景點推薦模型和算法。通過在模擬數(shù)據(jù)集上的對比,相比傳統(tǒng)方法,該景點推薦算法表現(xiàn)最優(yōu)。
5 基于社交網(wǎng)絡數(shù)據(jù)的推薦技術(shù)
Facebook、微信以及新浪微博等社交網(wǎng)絡平臺發(fā)展迅猛,積累了數(shù)十億計的用戶,社交網(wǎng)絡越來越多地融入眾多游客的生活中。因此,在基于地理位置服務的社交網(wǎng)絡(Location Based Social Networks,LBSNs)[19]中發(fā)現(xiàn)用戶的興趣點(Point of Interest,POI)已經(jīng)成為優(yōu)化推薦算法的重要研究領域。
文獻[20]提出一種基于LBSNs的景點知識發(fā)現(xiàn)與推薦算法。在該算法中,設計了POI關(guān)系網(wǎng)絡的構(gòu)建模型以提取POI的特征,并建立跨LBSN的POI特征聯(lián)合學習方法以便融合和推理多維信息,建構(gòu)基于時間特征的POI推薦模式。
文獻[21]提出一種基于LBSN的多目標個性化POI序列推薦框架。在該框架中,選擇游客的簽到數(shù)據(jù)作為提取其偏好的依據(jù),綜合考慮游客偏好、POI流行度和時空信息等因素,并利用多目標優(yōu)化算法挖掘POI以形成個性化POI序列(即個性化線路)。實驗結(jié)果表明,該框架能提升推薦的命中率,滿足多樣性需求。
6 基于約束的推薦技術(shù)
由于現(xiàn)實條件的限制,游客的選擇無法做到隨心所欲,通常受到空間和時間等因素的約束,因此,基于約束條件的推薦技術(shù)更符合現(xiàn)實的應用場景需求。
文獻[8]提出了一種基于時空約束的旅游路徑推薦算法。該算法從地理學的視域,分析游客空間行為和時間行為約束條件,包括:時間距離和個人偏好等,并改進最短路徑算法,構(gòu)建決策行為個性化應用場景下的高評分景點集合并規(guī)劃相對應的旅游路徑。通過在實驗區(qū)域的模擬測試,驗證了該算法在約束條件下的有效性。
由于節(jié)假日大量游客的集中涌入,導致游客滿意度的大幅下降,將基于事件社會網(wǎng)絡(Event-based Social Networks,EBSN)及其推薦策略引入到個性化旅游推薦中,是一個值得關(guān)注的新領域。文獻[9]提出在EBSN中的一種考慮約束的全局推薦策略。該策略的全局推薦優(yōu)化目標是,在滿足事件接納用戶容量和時間沖突等約束的基礎上,使得不滿意度最小化,并建立約束對應的單一目標函數(shù),借助二進制粒子群優(yōu)化算法BPSO提升推薦優(yōu)化的性能。文中的策略可以有效地應用于旅游推薦技術(shù)中。
7 結(jié) 語
個性化旅游推薦技術(shù)已成為學術(shù)界和產(chǎn)業(yè)界的研究熱點,本文分析了典型的推薦技術(shù),包括:利用用戶行為數(shù)據(jù)、用戶標簽數(shù)據(jù)、上下文信息和基于社交網(wǎng)絡數(shù)據(jù)等,并介紹了近年來的研究進展。同時,介紹了能提升性能效果的混合推薦技術(shù)和滿足多約束應用場景的基于約束的推薦技術(shù),研究了相關(guān)領域的最新成果。
總的來說,個性化旅游推薦技術(shù)的研究趨勢大致如下:
(1)用戶數(shù)據(jù)是研究的基礎。如何從多源的、大量的、龐雜的數(shù)據(jù)中提取有效數(shù)據(jù),如何從數(shù)據(jù)中提取出相關(guān)的上下文信息,發(fā)現(xiàn)偏好特征,已成為推薦技術(shù)的共性問題之一;
(2)融合多種推薦技術(shù)的混合推薦技術(shù)是進一步的研究方向之一;
(3)基于游客空間行為約束、時間行為約束和EBSN約束等的推薦技術(shù)更符合實際應用需求,是值得深入研究的領域。
參 考 文 獻
[1]陳旭.基于眾源地理數(shù)據(jù)的熱門旅游路線推薦算法及實證研究
[D].上海:上海師范大學,2018.
[2]李多加. 基于混合推薦算法的旅游推薦系統(tǒng)的設計與實現(xiàn)[D].杭州:浙江大學,2018.
[3]王少兵,吳升.采用在線評論的景點個性化推薦[J].華僑大學學報(自然科學版),2018,39(3):467-472.
[4]鄭恩讓,韓國鋒,劉晨.基于域適應的旅游景點個性化推薦算法研究[J].陜西科技大學學報,2019,37(1):135-139.
[5]陳君同,古天龍,常亮,等.融合協(xié)同過濾與用戶偏好的旅游組推薦方法[J].智能系統(tǒng)學報,2018,13(6):999-1005.
[6] FENZA G ,F(xiàn)ISCHETTI E ,F(xiàn)URNO D ,et al. A hybrid context aware system for tourist guidance based on collaborative filtering [C]// FUZZ-IEEE 2011,IEEE International Conference on Fuzzy Systems. [S.l.]:IEEE,2011: 27-30.
[7]王顯飛,陳梅,李小天.基于約束的旅游推薦系統(tǒng)的研究與設計
[J].計算機技術(shù)與發(fā)展,2012,22(2):141-145.
[8]陳媛,吳勝潔,董春玲.旅游者個人時空間行為約束下的旅游線路推薦[J].綠色科技,2018(21):229-232.
[9]廖國瓊,黃志偉.基于事件社會網(wǎng)絡中考慮約束全局推薦策略[J].南京大學學報(自然科學版),2018,54(1):11-22.
[10]趙雅楠,王育清.基于不確定近鄰的旅游產(chǎn)品協(xié)同過濾推薦算法研究[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2018,2(7):63-71.
[11]徐宏,陳焰,支艷利,等.基于Apriori改進算法的旅游個性化推薦[J].微型電腦應用,2018,34(1):74-79.
[12]孫彥鵬,古天龍,賓辰忠,等.基于多重隱語義表示模型的旅游路線挖掘[J].模式識別與人工智能,2018,31(5):462-469.
[13]朱桂祥,曹杰.基于主題序列模式的旅游產(chǎn)品推薦引擎[J].計算機研究與發(fā)展,2018,55(5):920-932.
[14]鄧旭明. 基于深度學習的旅游服務推薦系統(tǒng)研究[D].西安:西北大學,2018.
[15]劉海鷗,孫晶晶,蘇妍嫄,等.基于用戶畫像的旅游情境化推薦服務研究[J].情報理論與實踐,2018,41(10):87-92.
[16]孟祥武,梁弼,杜雨露,等.基于位置的移動推薦系統(tǒng)效用評價研究[J].計算機學報,2019(2):1-24.
[17]孫文平,常亮,賓辰忠,等.基于知識圖譜和頻繁序列挖掘的旅游路線推薦[J].計算機科學,2019,46(2):56-61.
[18]沈記全,王磊,侯占偉,等.基于情景上下文與信任關(guān)系的旅游景點推薦算法[J].計算機應用研究,2018,35(12):3640-3643.
[19] BAO J ,ZHENG Y ,WILKIE D ,et al. Recommendations in location-based social networks: a survey [J]. GeoInformatica,2015,19(3):525-565.
[20]徐向陽.基于LBSNs的城市景點知識發(fā)現(xiàn)與推薦優(yōu)化[D].成都:電子科技大學,2018.
[21]李迎. 基于LBSN的個性化多目標旅游路線推薦[D].長沙:湖南大學,2018.
[22] HAO Q,CAI R,WANG C,et al. Equip tourists with knowledge mined from travelogues [C]// Proceedings of the 19th International Conference on World Wide Web. Raleigh,North Carolina: IEEE,2010:26-30.
[23]孟祥武,李瑞昌,張玉潔,等.基于用戶軌跡數(shù)據(jù)的移動推薦系統(tǒng)研究[J].軟件學報,2018,29(10):3111-3133.
[24] YING J C,LEE W C,TSENG V S. Mining geographic-temporal-semantic patterns in trajectories for location prediction [J]. ACM transactions on intelligent systems and technology,2013,5(1): 1-33.
[25] NILASHI M,BIN LBRAHIM O,LTHNIN N,et al. A multi-criteria collaborative filtering recommender system for the tourism domain using Expectation Maximization(EM)and PCA-ANFIS [J]. Electronic commerce research and applications,2015,14(6): 126-140.