劉鑫玥 邱燦華
(同濟大學經濟與管理學院,上海 200092)
“互聯(lián)網+”推動傳統(tǒng)產業(yè)轉型升級,掀起數(shù)字化浪潮,大量在線旅游平臺也應運而生。越來越多的游客會撰寫評論記錄旅行體驗,表達真實想法與直觀感受。隨著在線評論影響力的增加與文本分析技術的發(fā)展,很多學者開始研究評論文本。然而,在旅游領域,通過文本評論追蹤游客滿意度的研究較少,并且影響游客滿意度的因素是不同的,每個方面都需要單獨考慮。已有研究大多只關注了促使游客滿意的相關因素,很少關注造成游客不滿意的因素。針對這些局限,本研究旨在利用用戶生成內容發(fā)現(xiàn)促使游客滿意和造成游客不滿意的關鍵因素,為景區(qū)發(fā)展提供明確方向。
已有眾多研究關注影響游客滿意度的因素,亞伯拉罕·皮扎姆(Abraham Pizam)首先將顧客滿意概念應用到旅游領域研究中,提出游客滿意度是游客對旅游目的地的預期和真實體驗進行比較后而產生的綜合評價[1]。大衛(wèi)·鮑文(David Bowen)將期望、績效、特征、情緒、公平、不一致6 個方面作為影響因素納入游客滿意度的研究[2]。索文·哈恩(Sowon Hahn)等采取實地調查方法對游客滿意度進行研究,結果表明,在旅游項目開始之前提供額外的信息可以提高游客滿意度[3]。
已有研究大多通過設置滿意度綜合評價指數(shù)檢測游客滿意度,將低得分視為不滿意,而忽略了不滿意因素,這就使得研究將導致游客滿意度低的因素視為不滿意影響因素。根據弗雷德里克·赫茲伯格(Fredrick Herzberg)的雙因素激勵理論[4],滿意和不滿意是兩個獨立的因素,可能同時存在于顧客體驗中。由于造成顧客滿意和不滿意的因素并不相同,分別研究造成游客滿意與不滿意的因素十分必要。目前,只有少數(shù)旅游領域研究分別討論滿意與不滿意因素,這一領域還存在很大的局限性,需要進一步研究[1]。
本文以上海市為例,根據《上海旅游資源圖志》對上海旅游資源的分類標準[5],結合景區(qū)的實際特征,將上海市景區(qū)分為5 類,并從5 個類別中選擇熱門景區(qū)進行研究(見表1)。
表1 上海市景區(qū)分類信息
本文選擇在攜程旅行網獲得景區(qū)評論。在2022年4 月通過八爪魚采集器,選取表1 中的25 個景區(qū)為研究對象,對其在攜程旅行網上的評論內容進行爬取,最終收集24 788 條評論。使用Python 進行數(shù)據預處理。首先,過濾掉所有非中文評論,去除重復的評論文本;其次,過濾文本中出現(xiàn)的數(shù)字、標點符號、停用詞等;最后,使用jieba 庫對文本數(shù)據進行分詞處理。
情感分析是自然語言處理領域的一項重要任務,利用計算機程序自動分析文本內容的情感極性,包含積極、消極與中性。情感極性可以反映顧客滿意度,本文認為積極評論表示游客滿意,而消極評論則代表游客不滿意。使用Python 的SnowNLP 情感分析工具包對評論文本進行情感分析。在進行情感分析時,輸出的情感極性值范圍為0 ~1,取值在0.5 及以上的為積極評論,0.5 以下的為消極評論,且數(shù)值越接近1 表示評論越積極,越接近0 則越消極。為確保樣本均衡,應使積極與消極評論數(shù)量相等。由于積極評論數(shù)量遠遠大于消極評論數(shù)量,應先確定每個景區(qū)中的消極評論數(shù)量,之后隨機選擇該景區(qū)同等數(shù)量的積極評論。
使用LDA 主題模型進行分析時,需要確定最優(yōu)主題數(shù)量。本文選擇困惑度和一致性作為評價指標。困惑度指標量化了文本所屬主題的不確定程度,困惑度越低則主題數(shù)量越優(yōu)[6]。一致性指標衡量了模型生成的每個主題所對應的高頻率詞語在語義上的一致性,數(shù)值越高則模型效果越好[7]。使用Python的Gensim 庫得到不同主題數(shù)量的模型評價結果(見圖1)。綜合比較兩個指標,最終選擇積極評論的主題數(shù)量為15,消極評論的主題數(shù)量為12。
圖1 LDA 主題數(shù)量
使用Python 的Gensim 庫分別對積極評論與消極評論構建主題模型,得到積極評論的15 個主題和消極評論的12 個主題分布。根據各主題的高頻率關鍵詞,以及各主題最具代表性的前15 條評論文本,采用人工方式總結各主題名稱,結果如表2 所示。
表2 主題分析結果
參照國內外游客滿意度評價指標研究,將得到的主題進一步分為4 類,包括旅游吸引物、景區(qū)服務與設施、景區(qū)管理和旅游體驗,具體如表3 所示。
表3 主題分類
積極評論中,游客更多評論旅游吸引物,即旅游吸引物可以帶來滿意的旅游經歷。消極評論中游客更多提及景區(qū)服務與設施,即景區(qū)服務與設施是造成游客不滿意的主要因素。
旅游吸引物方面,上海有眾多具有人文內涵的歷史文化景區(qū),游客能體會到傳統(tǒng)文化的魅力。此外,觀賞自然風光也是游客主要的旅游動機。上海商業(yè)氛圍濃厚,可以滿足游客吃喝玩樂的需求。游客還提到建筑樓群。例如,上海外灘上佇立著眾多古典復興大樓,給游客帶來了獨特體驗。消極評論中,一些網紅景區(qū)的過度營銷造成實景與照片不符,密集的人流會導致游客抱怨。游客還評論到一些景區(qū)缺乏特色亮點,千篇一律的項目會造成游客不滿。
景區(qū)服務與設施方面,積極和消極評論中都包含服務態(tài)度。積極評論中,游客強調了工作人員熱情好客的服務態(tài)度;相反,消極評論中,游客抱怨工作人員服務質量低下。此外,游客表明景區(qū)內明顯的引導標志可以減少時間浪費,增加游覽觀光的舒適度。設施方面,消極評論中尤其提到設施老舊問題,嚴重影響了參觀體驗。換票方面,游客認為在換票時需要長時間排隊很麻煩。餐飲方面,游客抱怨景區(qū)內餐廳味道一般而價格很高。
對于5 個不同的景區(qū)類型,本文構建了積極評論和消極評論主題分布特征圖(見圖2 和圖3),據此得出促進游客滿意和導致游客不滿意影響的評論側重點有何不同。
圖2 積極評論主題分布特征
積極評論中,參觀名勝古跡的游客更多評論了歷史文化和交通便利,而較少評論價格水平與親子同樂。游覽城市觀光類景區(qū)的游客更多寫到交通便利和景區(qū)的商業(yè)化水平。在主題樂園游玩的游客更加在意體驗感和價格水平,很少關注建筑樓群。在動植物園游玩的游客更多評論了自然風光和服務態(tài)度,很少評論歷史文化和體驗感。參觀展館展覽的游客明顯寫到了親子同樂和環(huán)境衛(wèi)生帶來的滿意經歷。
消極評論中,參觀名勝古跡的游客較少提到設施老舊問題,更多在意景區(qū)餐飲問題。游覽城市觀光類景區(qū)的游客更多抱怨了項目排隊和網紅地打卡的不愉快經歷,而很少評論景區(qū)餐飲問題。在主題樂園游玩的游客更多抱怨了工作人員的服務態(tài)度和項目關閉問題,很少關注樂園的特色亮點。在動植物園游玩的游客更多評論了意外天氣狀況帶來的遺憾經歷,較少寫到景區(qū)氛圍相關內容。參觀展館展覽的游客更多評論了設施老舊問題,對價格水平和景區(qū)氛圍不滿意,而很少提到項目關閉與天氣狀況。
本文基于游客評論,根據情感得分將評論劃分為積極評論與消極評論,之后運用LDA 模型挖掘游客評論中的關鍵信息,得到了積極評論的15 個主題和消極評論的12 個主題,再通過分析5 個不同類型景區(qū)的評論主題分布特征,得到了不同類型游客的側重點,為游客滿意度研究提供更全面的見解。
從文本挖掘的結果可以看出,積極評論的主題更多集中在旅游吸引物,證明旅游吸引物可以帶來滿意的旅游經歷。消極評論的主題主要集中在景區(qū)服務與設施,可見景區(qū)服務與設施是造成游客不滿意的主要因素。因此,景區(qū)應重視旅游吸引物建設,利用景區(qū)的歷史文化內涵、優(yōu)美的自然風光等提升游客滿意度。同時,景區(qū)應加強工作人員培訓,提高服務質量,注重景區(qū)內設施的更新維護工作,以減少造成游客不滿意的因素。