• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于游客好奇心的旅游信息推薦系統(tǒng)

    2021-04-29 08:40:50劉娜
    微型電腦應(yīng)用 2021年4期
    關(guān)鍵詞:景點(diǎn)旅游算法

    劉娜

    (陜西工業(yè)職業(yè)技術(shù)學(xué)院 財(cái)經(jīng)與旅游學(xué)院, 陜西 咸陽 71200)

    0 引言

    隨著我國(guó)旅游市場(chǎng)的逐漸擴(kuò)大,景區(qū)、景點(diǎn)層出不窮,增加了游客在海量旅游信息中的篩選難度[1]。因此,設(shè)計(jì)一款按照游客興趣進(jìn)行主動(dòng)推薦的旅游信息系統(tǒng)十分必要,能夠極大程度為游客服務(wù)。推薦系統(tǒng)的核心為推薦算法,例如在各個(gè)領(lǐng)域都有廣泛應(yīng)用的上下文感知推薦算法、協(xié)同過濾推薦算法、混合推薦算法和興趣點(diǎn)算法等[2]。但現(xiàn)有算法各自的缺點(diǎn)也十分明顯,不適合旅游信息的推薦。因此,本文結(jié)合游客好奇心設(shè)計(jì)一種個(gè)性化推薦算法,并開發(fā)旅游信息推薦系統(tǒng),以期為游客提供更好的旅游信息服務(wù)。

    1 個(gè)性化推薦算法設(shè)計(jì)

    由于游客評(píng)分、景點(diǎn)信息、訪問記錄等信息數(shù)據(jù)量龐大,本設(shè)計(jì)采用爬蟲技術(shù)從旅游及景點(diǎn)相關(guān)網(wǎng)站上爬取數(shù)據(jù)。經(jīng)過數(shù)據(jù)分析發(fā)現(xiàn),不同游客訪問景點(diǎn)的分布具有很大差異,訪問時(shí)期也存在差異。結(jié)合游客興趣將其分為三種,即興趣單調(diào)游客、興趣多樣性游客和興趣變化游客。其中,興趣單調(diào)游客喜歡景點(diǎn)的類別比較單一,大多旅游目的地都是該類景點(diǎn),具有固定興趣點(diǎn);興趣多樣化游客喜歡的景點(diǎn)類別多樣,分布差別不大,也屬于固定興趣點(diǎn)的游客;興趣變化游客會(huì)隨著時(shí)間改變?cè)L問景點(diǎn),興趣變化存在很大不確定性,難以預(yù)測(cè)。

    由此可見,無論是按照游客興趣點(diǎn)還是群體進(jìn)行推薦算法設(shè)計(jì),都不能對(duì)游客情況進(jìn)行很好地描述。因此,本設(shè)計(jì)引入游客好奇心作為描述游客情況的特征參數(shù),利用新穎度分布來描述好奇心,能夠有效解決游客興趣點(diǎn)不確定的問題。經(jīng)過調(diào)查分析,新穎度高的景點(diǎn)類型被游客選擇次數(shù)明顯高于其他,說明游客對(duì)該類景點(diǎn)具有很大好奇心。因此,針對(duì)興趣固定的游客推薦新穎度低的景點(diǎn),對(duì)興趣不固定的游客推薦新穎度高的景點(diǎn)。

    本設(shè)計(jì)將游客歷史行為轉(zhuǎn)化為可描述好奇心的新穎度公式,設(shè)計(jì)推算算法流程,如圖1所示。

    步驟一:新穎度分布構(gòu)建,通過游客歷史訪問記錄得到游客所去景點(diǎn)的新穎度,經(jīng)過統(tǒng)計(jì)得到游客新穎度選擇分布情況,即游客好奇心。

    圖1 推薦算法流程

    (1)

    (2)

    最后,建立新穎度計(jì)算式,如式(3)。

    (3)

    步驟二:構(gòu)建新穎度區(qū)間分?jǐn)?shù)。每個(gè)游客的新穎度選擇分布存在一定的差異,可依據(jù)分布情況計(jì)算景點(diǎn)的新穎度個(gè)性化推薦分?jǐn)?shù),以描述游客好奇心與景點(diǎn)的匹配程度。

    步驟三:集合協(xié)同過濾分?jǐn)?shù)和個(gè)性化推薦分?jǐn)?shù)生成景區(qū)推薦列表。其中,協(xié)同過濾分?jǐn)?shù)可描述游客度對(duì)景點(diǎn)的評(píng)分,個(gè)性化推薦分?jǐn)?shù)可描述游客對(duì)該類景點(diǎn)的傾向,兩者結(jié)合即可得到推薦策略。

    2 推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

    旅游信息推薦系統(tǒng)按照層級(jí)結(jié)構(gòu)進(jìn)行設(shè)計(jì),分為四個(gè)層次,即業(yè)務(wù)應(yīng)用層、模型層、數(shù)據(jù)處理層和數(shù)據(jù)采集層,如圖2所示。

    圖2 推薦系統(tǒng)架構(gòu)

    2.1 數(shù)據(jù)采集層

    數(shù)據(jù)是推薦系統(tǒng)的基礎(chǔ),因此系統(tǒng)首先要對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行大量地采集。本系統(tǒng)采用python語音實(shí)現(xiàn)分布式爬蟲功能,抓取互聯(lián)網(wǎng)上的網(wǎng)頁信息。通過與旅游相關(guān)類網(wǎng)站的特定連接,實(shí)現(xiàn)對(duì)HTML信息的獲取。系統(tǒng)使用xpath網(wǎng)頁解析包對(duì)HTML網(wǎng)頁階段進(jìn)行數(shù)據(jù)發(fā)現(xiàn),通過內(nèi)容節(jié)點(diǎn)來鎖定數(shù)據(jù)路徑,最終獲得海量旅游相關(guān)數(shù)據(jù)流程,如圖3所示。

    圖3 數(shù)據(jù)采集實(shí)現(xiàn)流程

    2.2 數(shù)據(jù)處理層

    數(shù)據(jù)采集完成后需要按照特定需求對(duì)數(shù)據(jù)進(jìn)行處理,使其能夠運(yùn)用到模型層和業(yè)務(wù)應(yīng)用層。數(shù)據(jù)處理層分為數(shù)據(jù)清洗和存儲(chǔ)兩個(gè)部分。其中,數(shù)據(jù)清洗是刪除不屬于景點(diǎn)的一類信息,如沒有相關(guān)描述的小景點(diǎn)數(shù)據(jù)(缺乏項(xiàng)目介紹),或者不屬于景點(diǎn)的數(shù)據(jù),如酒店、洗浴等信息。以此來提高推薦的準(zhǔn)確度。此外,數(shù)據(jù)清洗還要?jiǎng)h除游客訪問記錄中不屬于國(guó)內(nèi)的景點(diǎn)信息。

    完成數(shù)據(jù)清洗后將數(shù)據(jù)存儲(chǔ)到系統(tǒng)的Postgre數(shù)據(jù)庫中,通過該數(shù)據(jù)庫的外鍵設(shè)置完成對(duì)某些數(shù)據(jù)重要屬性的限制,并利用SQL語言對(duì)其進(jìn)行操作,最后按照屬性不同生成景點(diǎn)列表和用戶訪問列表。景點(diǎn)列表主要記錄了景點(diǎn)信息,如景點(diǎn)介紹、所處省份、城市等。用戶訪問列表是推薦系統(tǒng)的主要數(shù)據(jù)來源,通過自增加ID作為主鍵,包括用戶ID、景點(diǎn)評(píng)分、訪問時(shí)間、景點(diǎn)名稱等,如圖4所示。

    圖4 數(shù)據(jù)處理實(shí)現(xiàn)界面

    2.3 模型層

    該層主要是利用上文設(shè)計(jì)的推薦算法對(duì)數(shù)據(jù)進(jìn)行計(jì)算,實(shí)現(xiàn)旅游信息的主動(dòng)推薦功能。該層與系統(tǒng)數(shù)據(jù)庫進(jìn)行協(xié)調(diào)工作,提取推薦算法和景點(diǎn)分類的數(shù)據(jù),最終得到推薦結(jié)果,如圖5所示。

    圖5 推薦列表實(shí)現(xiàn)過程

    景點(diǎn)分類部分,首先提取景點(diǎn)描述分詞,篩選出關(guān)鍵詞后構(gòu)建詞向量,輸入至分類型進(jìn)行可能性計(jì)算,最后得到分類結(jié)果。將結(jié)果按照順序進(jìn)行排列并增加ID主鍵后,更新至景點(diǎn)列表中。利用前文的推薦算法對(duì)新穎度分布進(jìn)行計(jì)算,結(jié)合協(xié)同過濾得到推薦結(jié)果列表。

    2.4 業(yè)務(wù)應(yīng)用層

    業(yè)務(wù)應(yīng)用層主要展示系統(tǒng)的推薦結(jié)果,該層框架采用Django框架進(jìn)行設(shè)計(jì),方便網(wǎng)站后期的維護(hù)和安全,采用Python語言編寫,該設(shè)計(jì)方法不受特定服務(wù)器平臺(tái)的限制,可使該系統(tǒng)作為一個(gè)模塊融入到旅游網(wǎng)站現(xiàn)有的平臺(tái)中,可為更多旅游信息網(wǎng)站進(jìn)行服務(wù)。該系統(tǒng)與某智慧旅游網(wǎng)站融合后的推薦結(jié)果,如圖6所示。

    圖6 旅游信息推薦系統(tǒng)用戶頁面展示

    3 系統(tǒng)應(yīng)用對(duì)比

    為了驗(yàn)證本文設(shè)計(jì)的旅游信息推薦系統(tǒng)的有效性和優(yōu)越性,選擇三種主流的旅游信息推薦系統(tǒng)進(jìn)行對(duì)比,分別為基于用戶協(xié)同過濾的旅游信息推薦系統(tǒng)(系統(tǒng)A)[3]、基于景點(diǎn)標(biāo)簽的旅游信息推薦系統(tǒng)(系統(tǒng)B)[4]和基于景區(qū)內(nèi)容的旅游信息推薦系統(tǒng)(系統(tǒng)C)[5]。采用爬蟲技術(shù)收集攜程網(wǎng)上的用戶歷史訪問記錄,包括用戶ID、景點(diǎn)名稱、訪問時(shí)間和評(píng)分,共計(jì)320萬條記錄,其中包括61 284個(gè)景點(diǎn)和41 368個(gè)用戶。將該系統(tǒng)與三種主流系統(tǒng)的推薦結(jié)果進(jìn)行對(duì)比,分布比對(duì)推薦準(zhǔn)確率、用戶召回率和景點(diǎn)覆蓋率。對(duì)比過程中,將近鄰數(shù)作為控制變量,通過改變用戶推薦時(shí)使用的近鄰個(gè)數(shù)來比對(duì)不同系統(tǒng)的推薦效果。

    推薦準(zhǔn)確率、用戶召回率和景點(diǎn)覆蓋率對(duì)比結(jié)果,如圖7—圖9所示。

    圖7 推薦準(zhǔn)確率對(duì)比結(jié)果

    由圖7—圖9可知,各系統(tǒng)準(zhǔn)確率隨著近鄰數(shù)的增加都有所提升,在近鄰數(shù)相同的情況下本文設(shè)計(jì)的系統(tǒng)準(zhǔn)確率更高,即使在近鄰數(shù)較小的情況下本系統(tǒng)的推薦準(zhǔn)確率也明顯高于其他系統(tǒng)。各系統(tǒng)的用戶召回率隨著近鄰數(shù)的增加而增大,即用戶可能感興趣的景點(diǎn)所得分?jǐn)?shù)越高。各系統(tǒng)景點(diǎn)覆蓋率隨著近鄰數(shù)的增大而有所降低,這是因?yàn)橛脩粼L問的景點(diǎn)大多為熱門景點(diǎn),推薦過程中會(huì)向流行度較高的景點(diǎn)靠攏,導(dǎo)致冷門景點(diǎn)覆蓋率降低。對(duì)比結(jié)果發(fā)現(xiàn),本文系統(tǒng)無論是在近鄰數(shù)較小還是較大的情況下,均有不錯(cuò)的表現(xiàn),具有一定的優(yōu)勢(shì)。

    圖8 用戶召回率對(duì)比結(jié)果

    圖9 景點(diǎn)覆蓋率對(duì)比結(jié)果

    4 總結(jié)

    針對(duì)當(dāng)前推薦系統(tǒng)的問題,提出了基于游客好奇心行為的旅游信息推薦系統(tǒng)。該系統(tǒng)將景點(diǎn)游客訪問頻率和時(shí)間間隔作為構(gòu)建參數(shù),設(shè)計(jì)了新穎度計(jì)算公式來反映游客好奇心,并將該算法融入到推薦系統(tǒng)中。該系統(tǒng)結(jié)合爬蟲技術(shù)爬取互聯(lián)網(wǎng)中旅游相關(guān)信息,通過數(shù)據(jù)清洗和存儲(chǔ)利用推薦算法生成推薦結(jié)果,在業(yè)務(wù)應(yīng)用層直觀地展示給游客。經(jīng)過與三種主流的旅游信息推薦系統(tǒng)對(duì)比可知,本文系統(tǒng)在推薦準(zhǔn)確率、用戶召回率和景點(diǎn)覆蓋率方面均存在一定的優(yōu)勢(shì)。該算法及系統(tǒng)設(shè)計(jì)為旅游信息推薦方式的研究提供了參考。

    猜你喜歡
    景點(diǎn)旅游算法
    基于MapReduce的改進(jìn)Eclat算法
    Travellng thg World Full—time for Rree
    進(jìn)位加法的兩種算法
    打卡名校景點(diǎn)——那些必去朝圣的大學(xué)景點(diǎn)
    旅游
    英格蘭十大怪異景點(diǎn)
    海外星云(2016年7期)2016-12-01 04:18:07
    一種改進(jìn)的整周模糊度去相關(guān)算法
    沒有景點(diǎn) 只是生活
    Coco薇(2015年11期)2015-11-09 13:19:52
    景點(diǎn)個(gè)股表現(xiàn)
    旅游的最后一天
    卢氏县| 怀安县| 万安县| 屏山县| 平昌县| 萨迦县| 景宁| 天水市| 巴林右旗| 莆田市| 徐闻县| 高邮市| 石狮市| 孟村| 望都县| 喀喇沁旗| 那曲县| 营山县| 东兰县| 曲松县| 浪卡子县| 雅江县| 原平市| 阜康市| 江津市| 贵溪市| 涟水县| 浑源县| 玉田县| 江川县| 蕲春县| 十堰市| 华容县| 田阳县| 烟台市| 于田县| 南靖县| 遵义市| 灵石县| 醴陵市| 鄂伦春自治旗|