• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于協(xié)同過濾算法的旅游景點推薦模型研究

      2020-07-14 08:37:05陳思田敬陽
      現(xiàn)代電子技術(shù) 2020年11期
      關(guān)鍵詞:旅游景點

      陳思 田敬陽

      摘? 要: 傳統(tǒng)基于關(guān)聯(lián)規(guī)則的旅游景點推薦模型,不能綜合其他相似用戶的喜好數(shù)據(jù),缺少推薦新信息的能力。為此,設(shè)計基于協(xié)同過濾算法的旅游景點推薦模型。采用DOM技術(shù)搜索目標(biāo)用戶的歷史記錄,并利用DOMNode類中提供的方法訪問并采集頁面信息,將采集的數(shù)據(jù)傳送至推薦算法模塊,利用協(xié)同過濾算法計算用戶相似度,求出目標(biāo)用戶的近鄰集合。經(jīng)過推薦綜合處理模塊剔除掉目標(biāo)用戶已經(jīng)旅行過的旅游景點,形成最終推薦集推薦給目標(biāo)用戶。至此,模塊設(shè)計完成。測試結(jié)果表明,對于同一目標(biāo)用戶,與傳統(tǒng)的推薦模型相比,基于協(xié)同過濾算法的旅游景點推薦模型推薦的結(jié)果存在一定的新信息,推薦內(nèi)容更全面,該推薦模型更優(yōu)于傳統(tǒng)的推薦模型。

      關(guān)鍵詞: 協(xié)同濾波; DOM; 用戶相似度; 近鄰集合; 旅游景點; 推薦模型

      中圖分類號: TN911.1?34; TP391? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)11?0132?04

      Research on tourist attraction recommendation model

      based on collaborative filtering algorithm

      CHEN Si1, TIAN Jingyang2

      (1. Tianfu College of SWUFE, Chengdu 610052, China; 2. Chengdu Tengyuan Dachuang Technology Co., Ltd., Chengdu 610000, China)

      Abstract: The data of user preference of other similar users cannot be integrated by the traditional tourist attraction recommendation model based on association rules. Therefore, the model is lack of the ability to recommend new information. For this reason, a recommendation model based on collaborative filtering algorithm is designed. The DOM technology is used to search the history records of target users, and the method provided in DOMNode class is used to access and collect the page information. The collected data are transmitted to the recommendation algorithm module. The collaborative filtering algorithm is used to calculate the user similarity and get the neighborhood set of target users. The tourist attractions that the target users have already traveled are removed by the recommendation comprehensive processing module to form the final recommendation sets and recommend them to the target users. The above achieve the module design. The test results show that, for the same target user, there are certain new information in the recommendation results of the tourist attraction recommendation model based on the collaborative filtering algorithm and the recommendation content is more comprehensive in comparison with the traditional recommendation model. The designed model is better than the traditional recommendation model.

      Keywords: collaborative filtering; DOM; user similarity; neighborhood set; tourist attraction; recommendation model

      0? 引? 言

      隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和普及,旅游愛好者能夠通過各種不同的渠道隨時隨地了解各地旅游信息,選擇喜愛的旅游產(chǎn)品,制定滿足自身需求的旅游計劃。推薦模型能夠幫助用戶更快地發(fā)現(xiàn)有用信息,通過采集用戶歷史信息和相似用戶的喜好,篩選出用戶最感興趣的信息,主動推薦給用戶[1]。近年,由于推薦模型所具有的特性方便用戶將無用的信息過濾掉,而被應(yīng)用在各行各業(yè)中,但是大部分的推薦方式集中在打包式服務(wù),缺少推薦新信息的能力。

      協(xié)同過濾算法是向用戶推薦用戶潛在的感興趣的內(nèi)容,同時,過濾掉不完全或不精確的內(nèi)容[2]。簡單來說,協(xié)同過濾就是利用有共同興趣、擁有共同經(jīng)驗的群體的喜好來推薦用戶感興趣的信息,通過合作機(jī)制給予信息回應(yīng)并記錄,達(dá)到過濾的目的,幫助別人篩選信息[3]。在旅游景點推薦模型中引入?yún)f(xié)同過濾算法,可改善傳統(tǒng)推薦模型中存在的問題,實現(xiàn)更準(zhǔn)確、更全面的旅游景點推薦。

      1? 旅游景點推薦模型設(shè)計

      本文設(shè)計的旅游景點推薦模型主要包括三個模塊,分別是推薦算法模塊、用戶信息采集模塊和推薦結(jié)果處理模塊,結(jié)構(gòu)如圖1所示。

      1.1? 用戶行為信息采集模塊

      通過用戶行為信息采集模塊采集目標(biāo)用戶信息與旅游景點相關(guān)屬性信息[4]。當(dāng)用戶通過不同的終端瀏覽旅游景點相關(guān)信息時,利用DOM技術(shù)搜索目標(biāo)用戶的歷史瀏覽數(shù)據(jù),初步獲取該用戶瀏覽的旅游相關(guān)信息,如旅游攻略、景區(qū)路線、特色小吃等,從而獲取與旅游景點相關(guān)的各項屬性[5]。

      該模塊主要包括數(shù)據(jù)分析單元、數(shù)據(jù)存儲單元。采集數(shù)據(jù)首先需要找到用戶目標(biāo)網(wǎng)頁,分析網(wǎng)頁中的源碼,確定采集的旅游景點數(shù)據(jù)信息,經(jīng)過轉(zhuǎn)碼等處理方式,將信息整理至Excel文件中,再以文件形式保存至數(shù)據(jù)庫中[6]。一般的瀏覽器頁面都是HTML文件,利用DOM技術(shù)將瀏覽器頁面上的數(shù)據(jù)和結(jié)構(gòu)轉(zhuǎn)換成樹形結(jié)構(gòu)表示,用樹形結(jié)構(gòu)能夠準(zhǔn)確描述元素之間的相對位置關(guān)系,方便文件解析[7]。在HTML文件中,是樹的根節(jié)點,其他組件為樹的一般節(jié)點,該節(jié)點包含需要采集的用戶行為信息數(shù)據(jù)。

      樹形結(jié)構(gòu)如圖2所示。

      其中,葉節(jié)點是網(wǎng)頁內(nèi)的內(nèi)容,如旅游景點相關(guān)圖片和文本信息等,利用DOM技術(shù)遍歷樹中的節(jié)點,使用DOMNode類中提供的方法訪問HTML文檔中全部內(nèi)容,并從中提取需要的信息[8]。DOMNode類部分信息獲取方法如表1所示。

      用戶在使用不同的終端瀏覽網(wǎng)頁時,網(wǎng)頁結(jié)構(gòu)基本相似,使用相對路徑的信息抽取方法在網(wǎng)頁中抽取信息[9],其核心就是深度遍歷DOM樹后,利用抽取規(guī)則篩選出用戶感興趣的旅游景點相關(guān)數(shù)據(jù),得到符合條件的信息后暫存起來,當(dāng)完成整個對象的遍歷后,重新整理暫存的數(shù)據(jù)信息,存入數(shù)據(jù)庫中[10]。

      1.2? 基于協(xié)同過濾的推薦算法模塊設(shè)計

      當(dāng)用戶行為信息采集完成后,相關(guān)數(shù)據(jù)傳送至推薦算法模塊,利用協(xié)同過濾算法分析目標(biāo)用戶行為信息,以此為基礎(chǔ),搜索與其喜好相似的用戶,組成鄰居集,從中篩選出集中感興趣的旅游景點推薦給目標(biāo)用戶[11]。假設(shè)用戶?項目評分矩陣為[t=tij],[tij]表示第[i]個用戶是否評價第[j]個項目,設(shè)置0或1來表示,0表示該用戶沒有評價該項目,1表示該用戶已評價該項目[12]。用戶之間的相似性計算公式為:

      [ri,iε=i=1Nij&iεjti?tiε]? (1)

      式中:[ti]表示其他用戶已評分的項目集的個數(shù);[tiε]表示待預(yù)測評分用戶的項目評分集個數(shù);[i=1Nij&iεj]表示其他用戶和待測用戶所共有的項目的個數(shù)。當(dāng)[ri,iε=1],[i=1Nij&iεj≥λ]([λ]表示共有項目的極大值)時,說明用戶之間存在絕對相似。

      相似性計算公式如下:

      [simia,ibε=iε∈Iabia-iaib-ib×ri,iεiε∈Iabia-ia2×iε∈Iabib-ib2] (2)

      式中[simia,ibε]表示基于目標(biāo)用戶[iε]的[a],[b]用戶的相似性。確定相似度后,建立[i]的近鄰列表[i1,i2,…,in],按照用戶相似度從小到大排列,從近鄰的列表中選取一定數(shù)量的用戶作為目標(biāo)用戶[iε]的最近鄰居。

      利用閾值法選取一個固定的相似度數(shù)值作為閾值,規(guī)定目標(biāo)用戶最近的鄰居大于此閾值[13]。最近鄰居的形成過程如圖3所示。

      圖3中,黑色的圓表示目標(biāo)用戶,白色的圓表示其他用戶,通過計算目標(biāo)用戶與其他用戶之間的相似度,以目標(biāo)用戶為中心的5個最近用戶被選為目標(biāo)用戶的最近鄰居[14]。

      獲取最近鄰居信息后,計算用戶對項目的綜合評分,公式如下:

      [Qε=simia,ibε×qizjsimia,ibε] (3)

      式中[qizj]表示最近鄰居[iz]對旅游景點[j]的評分值,評分值越大表示目標(biāo)用戶感興趣的程度越大,其形成的推薦列表也就是top?[N]推薦。將結(jié)果傳送至推薦結(jié)果綜合處理模塊。

      1.3? 推薦結(jié)果綜合處理

      獲得top?[N]推薦列表后,按照評分值的大小排序,同時,根據(jù)旅游景區(qū)熱度值,計算列表中每個景點的推薦值,取前[N]項組成用戶興趣矩陣,作為最終推薦結(jié)果[15]。其中,景點推薦值通過目標(biāo)用戶要旅游的月份和城市決定。若目標(biāo)用戶是已注冊的用戶,將目標(biāo)用戶已經(jīng)旅行過的旅游景點信息從推薦集中剔除,將最終結(jié)果記作top?[S]。通過程序代碼將結(jié)果推送至頁面上,以便目標(biāo)用戶瀏覽和發(fā)現(xiàn)。至此,基于協(xié)同過濾的旅游景點推薦模型設(shè)計完成。

      2? 旅游景點推薦模型測試

      2.1? 測試環(huán)境及數(shù)據(jù)集選擇

      旅游景點推薦模型測試在CPU為AMD 2.0 GHz,內(nèi)存為8 GB,硬盤為500 GB的PC機(jī)上執(zhí)行,其配置的系統(tǒng)為Windows 10。測試使用的數(shù)據(jù)集采用GroupLens小組提供的數(shù)據(jù)集,該數(shù)據(jù)集的大小約為1 000K,包含大約1萬條評分信息,1 079個用戶,124個旅游景點。

      2.2? 測試設(shè)計

      測試旅游景點推薦模型,從數(shù)據(jù)集中隨機(jī)選擇一位目標(biāo)用戶作為測試對象,使用基于協(xié)同過濾的旅游景點推薦模型向用戶推薦旅游景點,同時,引用傳統(tǒng)的基于關(guān)聯(lián)規(guī)則的推薦模型,對同一用戶推薦旅游景點。該用戶的歷史瀏覽信息記錄如圖4所示。

      2.3? 測試結(jié)果及分析

      利用不同的推薦模型向目標(biāo)用戶推薦結(jié)果在HTML頁面中顯示出來,為了便于對比分析,利用軟件將推薦結(jié)果頁面的信息提取出來,結(jié)果如圖5所示。圖中右側(cè)為基于協(xié)同過濾算法的推薦模型推薦結(jié)果中提取的關(guān)鍵詞,左側(cè)為傳統(tǒng)的基于關(guān)聯(lián)規(guī)則的推薦模型推薦結(jié)果提取的關(guān)鍵詞。

      觀察圖5,左側(cè)為推薦結(jié)果1,右側(cè)為推薦結(jié)果2。左側(cè)結(jié)果中顯示的關(guān)鍵詞都是與目標(biāo)用戶重點關(guān)注信息相關(guān)的詞匯,為用戶提供了最感興趣的內(nèi)容,但是這些內(nèi)容只是用戶已經(jīng)關(guān)注的相關(guān)信息,缺少新信息的推薦,具有一定的局限性。而使用基于協(xié)同過濾的推薦模型推薦結(jié)果中,關(guān)鍵詞不僅包括推薦結(jié)果1中的關(guān)鍵詞,而且還存在目標(biāo)用戶歷史瀏覽信息中未有的關(guān)鍵詞,向用戶推薦了新的內(nèi)容。

      這是由于使用協(xié)同過濾算法,結(jié)合了相似用戶的喜好數(shù)據(jù),利用 DOM技術(shù)篩選并采集相關(guān)信息,并通過計算評分向目標(biāo)用戶提供其深層次感興趣的旅游景點信息。綜上所述,基于協(xié)同過濾算法的推薦模型能夠向目標(biāo)用戶提供更多更優(yōu)質(zhì)的內(nèi)容,具有更好的發(fā)展空間,更適合應(yīng)用在實際項目中。

      3? 結(jié)? 語

      本文在旅游景點推薦模型中引入?yún)f(xié)同過濾算法,利用該算法結(jié)合相似用戶喜好數(shù)據(jù),推薦新信息的特點,彌補(bǔ)傳統(tǒng)基于關(guān)聯(lián)規(guī)則的推薦模型中的不足之處,向目標(biāo)用戶推薦更多、更詳細(xì)的旅游景點。通過與傳統(tǒng)推薦模型的對比測試,證明了該推薦模型在推薦旅游景點能力上存在一定的優(yōu)勢。

      注:本文通訊作者為田敬陽。

      參考文獻(xiàn)

      [1] 劉靜,劉耀龍,段錦.基于5A景區(qū)最大承載量和游客接待量的旅游供需關(guān)系模型研究[J].科技通報,2017,33(7):264?268.

      [2] 沈記全,王磊,侯占偉,等.基于情景上下文與信任關(guān)系的旅游景點推薦算法[J].計算機(jī)應(yīng)用研究,2018,35(12):3640?3643.

      [3] 劉海鷗,孫晶晶,蘇妍嫄,等.基于用戶畫像的旅游情境化推薦服務(wù)研究[J].情報理論與實踐,2018,41(10):87?92.

      [4] 李雅美,王昌棟.基于標(biāo)簽的個性化旅游推薦[J].中國科學(xué)技術(shù)大學(xué)學(xué)報,2017,47(7):547?555.

      [5] 孟桓羽,劉真,王芳,等.基于圖和改進(jìn)K近鄰模型的高效協(xié)同過濾推薦算法[J].計算機(jī)研究與發(fā)展,2017,54(7):1426?1438.

      [6] 宋愷濤,彭甫镕,陸建峰.基于多核學(xué)習(xí)的協(xié)同濾波算法[J].數(shù)據(jù)采集與處理,2018,33(3):496?503.

      [7] 毛寧,楊德東,楊福才,等.多特征融合的多模板協(xié)同相關(guān)跟蹤[J].液晶與顯示,2017,32(2):153?162.

      [8] 姚靜天,王永利,侍秋艷,等.基于聯(lián)合物品搭配度的推薦算法框架[J].上海理工大學(xué)學(xué)報,2017,39(1):45?53.

      [9] 楊興雨,李華平,張宇波.基于聚類和隨機(jī)森林的協(xié)同過濾推薦算法[J].計算機(jī)工程與應(yīng)用,2018,54(16):152?157.

      [10] 李瑞遠(yuǎn),洪亮,曾承.多層聚簇中基于協(xié)同過濾的跨類推薦算法[J].小型微型計算機(jī)系統(tǒng),2017,38(4):657?663.

      [11] 李劍鋒,秦拯.一種基于局部近鄰Slope One協(xié)同過濾推薦算法[J].計算機(jī)工程與科學(xué),2017,39(7):1346?1351.

      [12] 于陽,于洪濤,黃瑞陽.基于多重信任的協(xié)同過濾推薦算法[J].計算機(jī)科學(xué),2018,45(5):108?115.

      [13] 郭寧寧,王寶亮,侯永宏,等.融合社交網(wǎng)絡(luò)特征的協(xié)同過濾推薦算法[J].計算機(jī)科學(xué)與探索,2018,12(2):208?217.

      [14] 孔欣欣,蘇本昌,王宏志,等.基于標(biāo)簽權(quán)重評分的推薦模型及算法研究[J].計算機(jī)學(xué)報,2017,40(6):1440?1452.

      [15] 王瑜,武延軍,吳敬征,等.基于異構(gòu)網(wǎng)絡(luò)面向多標(biāo)簽系統(tǒng)的推薦模型研究[J].軟件學(xué)報,2017,28(10):2611?2624.

      猜你喜歡
      旅游景點
      貧民窟也能成旅游景點?
      美人魚
      貧民窟也能成旅游景點
      瑪雅金字塔重新開放
      敦煌古跡旅游景點與《周易》
      西夏研究(2020年1期)2020-04-01 11:54:36
      旅游景點文史缺失八例辨析
      課程教學(xué)大綱《旅游文化》
      順應(yīng)論角度下旅游景點解說的英譯原則與實例分析*——以福州鼓嶺旅游景點為例
      Have a Good Trip
      從生態(tài)翻譯學(xué)視角看韶關(guān)旅游景點的再譯
      惠水县| 金阳县| 丹东市| 中西区| 漯河市| 安溪县| 罗山县| 齐齐哈尔市| 当阳市| 化德县| 呼玛县| 尉犁县| 郓城县| 巴林右旗| 巴里| 田林县| 元江| 伊吾县| 弋阳县| 太湖县| 邵阳市| 桓台县| 甘谷县| 扶余县| 三明市| 泸定县| 定州市| 临桂县| 五寨县| 襄城县| 青神县| 乌什县| 裕民县| 乾安县| 汶川县| 辉南县| 上栗县| 常熟市| 马龙县| 潼关县| 恩平市|