黃 敏 閆思賢
河南地處中原,有著優(yōu)越的區(qū)位條件和豐富的旅游資源,發(fā)展旅游業(yè)有著得天獨厚的優(yōu)勢[1]。截至2018 年底,河南在建旅游項目已有544 個,投資高達806.68 億元,2018 年全年河南旅游人數(shù)已超8.9 億人次,實現(xiàn)旅游總收入9362 億元,由旅游大省逐步向旅游強省邁進[2]?,F(xiàn)今,旅游業(yè)已經成了國民經濟中第三產業(yè)的重要支柱[3],不僅能讓人們在繁忙的工作之余取得身心上的放松,精神上的愉悅,更是國民經濟快速發(fā)展的重要推手,中堅力量[4]。
對比網(wǎng)上各大旅游APP 的受眾范圍和受歡迎指數(shù),本研究選取攜程、去哪兒旅行、貓途鷹三個旅游APP 作為數(shù)據(jù)來源,經過網(wǎng)站對景區(qū)的綜合分析和熱度排名,最終通過網(wǎng)絡爬蟲技術獲取河南少林寺、龍門石窟、清明上河園、云臺山、殷墟等5A 級景區(qū)的用戶評價,以此來推斷河南5A 級景區(qū)的特點和綜合口碑。為了保證評論的時效性及體現(xiàn)景區(qū)近年來的發(fā)展程度和趨勢走向,本研究選取的采集對象為2015- 2020 年的用戶評價,如表1 所示,共采集到21033 條評論數(shù)據(jù)。
(1)剔除與主題相關性低的評論。由于游客群體較大,評論意見錯綜復雜,許多評論涉及別的景點或者是一些商業(yè)廣告網(wǎng)頁鏈接等,與評論主題不符。
(2)剔除重復評論。游客評論時可能會出現(xiàn)重復點擊導致重復評論的情況,為了提高分析的準確率,需剔除。
(3)修正數(shù)據(jù)。刪除評論中出現(xiàn)的錯別字,替換容易混淆的詞語,刪除空格,整理格式,最后將數(shù)據(jù)另存為.txt 文件以待后續(xù)分析。
表1 網(wǎng)絡數(shù)據(jù)來源Table.1 Network data source
隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,結構化數(shù)據(jù)變少,半結構化數(shù)據(jù)愈來愈多,非結構化數(shù)據(jù)更是激增。其中,網(wǎng)絡文本便是非結構化數(shù)據(jù)的代表,運用文本分析法挖掘網(wǎng)絡文本中的內容尤具價值。文本分析方法可以透過文本的表層深入理解文本編撰者的心理狀態(tài)和情感態(tài)度[5]。比傳統(tǒng)的問卷走訪調查及變量分析更加客觀準確且能獲得編撰者完整的心路歷程與情感傾向。
文本分析包含很多種方法,本研究使用詞頻分析,語義網(wǎng)絡分析和情感分析對游客的用戶評價進行研究。詞頻分析主要用于統(tǒng)計文本中相同詞語的出現(xiàn)頻數(shù),以高頻詞的含義推測文本中隱藏的潛在核心信息。
通過ROST CM6.0 文本挖掘軟件對用戶評論做詞頻分析。將評論內容分詞后進行高頻詞統(tǒng)計。高頻詞能從一定程度上再現(xiàn)用戶對景區(qū)的直觀感受,并能較好體現(xiàn)景區(qū)的景點特色。分別選取5 個景區(qū)排名前二十的高頻詞進行統(tǒng)計,刪除景點、景區(qū)等無用名詞,最終統(tǒng)計結果如表2 所示。“武術”“塔林”“功夫”“寺廟”說明少林寺是佛家修行圣地和中國功夫的發(fā)源地,這里可見廟宇層巒疊嶂,功夫層出不窮,是佛教和功夫的代表。“講解”“導游”可見龍門石窟內有導游介紹石窟文化,給游客更加直觀感受和深刻印象?!胺鹣瘛薄按蠓稹薄八囆g”“雕刻”看出石窟是中國雕刻藝術的源泉,刻像多為佛祖菩薩,是鐘愛石雕游客的不二選擇?!氨硌荨薄八未薄按笮汀薄熬省斌w現(xiàn)了清明上河園建造的是大型宋代歷史文化公園,園內充滿宋代的文化氣息且多有表演,大多數(shù)人覺得表演精彩讓人耳目一新?!凹t石”“風景”“茱萸”“玻璃”“棧道”體現(xiàn)出云臺山景色宜人,茱萸峰和紅石峽更具特色。玻璃棧道能讓游客在觀景之余體驗刺激。從“甲骨文”“遺址”“文化”“宮殿”可看出安陽殷墟是我國古代商朝末的都城遺址,甲骨文是當時的特色,體現(xiàn)了我國源遠流長的歷史文化。
語義網(wǎng)絡分析是詞頻分析的深層次遞進,詞頻分析只能從詞語的屬性推斷景區(qū)的特征和形象,不能準確無誤的表示出各個詞語之間的關聯(lián)結構,依存關系。語義網(wǎng)絡分析通過可視化的方式將各個詞語之間的關聯(lián)規(guī)則以語義網(wǎng)絡圖的形式展現(xiàn)出來,可清晰看出各元素之間的聯(lián)系及文本的深層次結構。
情感態(tài)度分析是進行游客旅游評價研究的重中之重,情感態(tài)度的喜惡間接代表了游客對景區(qū)的評價好壞。將爬取到的5 個景點的.txt 文件導入ROST CM6.0 進行情感分析,得到游客對各個景點的情感態(tài)度分析表,如表3 所示。積極情緒占比最高的為龍門石窟和云臺山,均超過了70%。消極情緒占比最高的為少林寺,近30%。而殷墟的中性情緒占比超過了40%,與積極情緒相當??傮w來說,龍門石窟與云臺山受歡迎程度較高,而少林寺和殷墟還有較大的改進和提升空間。
對景區(qū)進行綜合評價時并不單單是游客的情感態(tài)度傾向,各景點所在地區(qū)的經濟發(fā)展程度與政府重視程度不同會導致景點的投資建設力度有所差異。因此,本研究建立模糊綜合評價模型,以旅游業(yè)所屬的各景點所在市的第三產業(yè)的發(fā)展和游客的情感態(tài)度傾向綜合為河南省5A 級景區(qū)進行評價打分。
本文以文本挖掘的方式對河南省5 個5A 級景區(qū)的用戶評論進行旅游評價研究。研究了游客對各個景點的形象認知和情感傾向,并結合經濟投資對5 個景點進行綜合評價研究,得到河南省5A 級景區(qū)的綜合評分。針對上文各景點暴露出來的問題,現(xiàn)給出幾點建議。首先,注重文化內涵,展現(xiàn)自身魅力。少林寺近幾年商業(yè)趨勢明顯,各種香火店鋪林立,不再像是追逐心靈寄托的佛家寧靜之地,應突出自身佛教文化和中國功夫的特色,從根本上吸引游客。其次,保護歷史文物,建立投訴機制。龍門石窟的石刻被破壞,讓很多鐘情于中國石刻文化的人痛心疾首,應建立投訴機制,呼吁游客共同保護這一文化瑰寶。