楊靖
摘 要:本文在對景區(qū)、景點等進行基于網(wǎng)絡(luò)語境定義的前提下,以張家界為例,對網(wǎng)絡(luò)游記文本信息進行挖掘,以此更加客觀地描述和分析游客對旅游目的地的整體感知和節(jié)點偏好。這種無預(yù)設(shè)的數(shù)據(jù)來源和文本信息特征要求首先厘清傳統(tǒng)數(shù)據(jù)來源背景下被忽視的相關(guān)概念之間的邏輯關(guān)系,運用詞頻分析法和語義分析法等進行主觀感知與其偏好研究,從而體現(xiàn)人本視角下景區(qū)規(guī)劃與景點開發(fā)對微觀個體的關(guān)注。
關(guān)鍵詞:網(wǎng)絡(luò)游記;游客節(jié)點偏好;張家界市
中圖分類號:F592.7 文獻標志碼:A
基金項目:吉首大學學成返校博士科研資助經(jīng)費研究項目“基于多源數(shù)據(jù)的旅游者微觀時空行為及其應(yīng)用研究”。
利用大數(shù)據(jù)開展城市空間與人群活動分析已成為當前學術(shù)界的研究熱點。與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)具有精度高、覆蓋廣和更新快等特點,是基于“人”的尺度的開放數(shù)據(jù),可以反映人群行為特征[1]。近年來,隨著智能手機、移動互聯(lián)網(wǎng)和全球定位系統(tǒng)等技術(shù)的成熟與普及,人們在社交媒體平臺上留下了大量照片、文本和音頻等信息。與此同時,對這些海量的帶有地理位置信息的大數(shù)據(jù)的挖掘、提取和分析已逐步成為旅游研究中的重要手段。其中,網(wǎng)絡(luò)游記的應(yīng)用研究目前主要集中在旅游空間網(wǎng)絡(luò)結(jié)構(gòu)、游客時空行為、形象感知、體驗感知、滿意度、關(guān)注偏好等領(lǐng)域[2-6]。根據(jù)網(wǎng)絡(luò)數(shù)據(jù)的表達特征,挖掘文本信息與概念背后隱藏的內(nèi)涵,在此基礎(chǔ)上分析得出網(wǎng)絡(luò)游記反映出的真實客觀規(guī)律,對于探究大數(shù)據(jù)的分析與應(yīng)用具有重要意義。
網(wǎng)絡(luò)游記語境是由網(wǎng)絡(luò)游記所提供的文本信息構(gòu)成的語言環(huán)境,可通過旅游節(jié)點真實反映游客時空行為的選擇偏好。網(wǎng)絡(luò)游記語境下深度分析旅游節(jié)點特征反映的游客偏好,需要在分析網(wǎng)絡(luò)環(huán)境下的涉及環(huán)境的詞匯和詞匯語義特征的基礎(chǔ)上,厘清其中的邏輯關(guān)系,重新定義相關(guān)概念。比如,網(wǎng)絡(luò)游記中“景區(qū)”和“景點”交替出現(xiàn),彼此纏繞,同時也經(jīng)常出現(xiàn)記載的景區(qū)不包含景點的情況。目前的研究常常忽略了二者的區(qū)別,根據(jù)需要往往以景點指代景區(qū),以景區(qū)帶過景點,這在旅游流網(wǎng)絡(luò)結(jié)構(gòu)和宏觀層面的游客時空行為特征分析等研究領(lǐng)域是沒有問題的,但是具體到微觀層面的游客偏好選擇就顯得過于籠統(tǒng)。游記語境中的景區(qū)與景點在微觀領(lǐng)域并非簡單的互替關(guān)系,厘清這種錯綜復(fù)雜的文本表達關(guān)系與其背后隱含的節(jié)點邏輯關(guān)系,對于研究游客偏好選擇規(guī)律、景區(qū)類型識別及景點布局規(guī)劃具有重要意義。因此,筆者在深入分析網(wǎng)絡(luò)游記中各類詞匯特征的前提下,分別從頻數(shù)、節(jié)點和指標3個方面來重新認識和定義相關(guān)概念。
(一)記載頻數(shù)與到訪頻數(shù)
同一篇游記中對到訪的旅游節(jié)點往往有多次記錄。對于某一節(jié)點在同一篇游記中記載一次記作“1”,記載兩次記作“2”,以此類推,把該節(jié)點在所有有效游記中被提及的次數(shù)相加之和定義為該節(jié)點的記載頻數(shù);單篇游記中的某一節(jié)點無論被提及多少次均算作“1”;把所有提及該節(jié)點的游記篇數(shù)相加之和定義為到訪頻數(shù);對于某一景區(qū)而言,如一篇游記中只出現(xiàn)該景區(qū)包含的景點而未出現(xiàn)該景區(qū),則該景點和景區(qū)的到訪頻數(shù)各加“1”。
(二)嵌套節(jié)點與獨立節(jié)點
本文把網(wǎng)絡(luò)游記中出現(xiàn)的,在空間和管理兩個層面與其他旅游節(jié)點具有從屬關(guān)系的旅游節(jié)點稱為嵌套節(jié)點,嵌套節(jié)點實質(zhì)上是有著嵌套關(guān)系的景區(qū)與景點的集合;把在空間上和管理上與其他節(jié)點都沒有從屬和包含關(guān)系的旅游節(jié)點稱為獨立節(jié)點,獨立節(jié)點也是景區(qū)與其包含的景點的集合,但這些景點沒有在網(wǎng)絡(luò)游記中出現(xiàn)。為方便數(shù)據(jù)分析,進一步作如下定義:把嵌套節(jié)點中的景區(qū)分為一級景區(qū)和二級景區(qū),其中一級景區(qū)由存在關(guān)聯(lián)的全部嵌套節(jié)點組成,是一個完整集合;一級景區(qū)可分為若干二級景區(qū),二級景區(qū)是一級景區(qū)的真子集,彼此之間沒有交集,其內(nèi)部節(jié)點之間關(guān)聯(lián)較其外部更為緊密。
(三)可達景點與眺望景點
網(wǎng)絡(luò)游記雖然提及部分景點,但是峰林錯落形成的景觀多屬隔空對望,不是真正的到達。在挖掘網(wǎng)絡(luò)游記的過程中,根據(jù)游記提供的信息客觀甄別到達與非到達,對游客關(guān)注偏好的深度分析和景區(qū)類型歸屬的精準識別具有重要意義。本文根據(jù)游客能否通過步行到達,把景點分為可達景點和眺望景點,游客可置身可達景點中游玩、參與和體驗,而眺望景點只能借助觀景臺、眺望點和其他可達景點觀看和遠眺,在觀光型旅游中,眺望景點一般占有較大比重。為表達嚴謹,本文中眺望景點的到訪頻數(shù)又稱為關(guān)注頻數(shù)。
(四)Ⅰ型節(jié)點、Ⅱ型節(jié)點與Ⅲ型節(jié)點
根據(jù)網(wǎng)絡(luò)游記語境下的數(shù)據(jù)挖掘和研究需要,將上述旅游節(jié)點歸納到Ⅰ型節(jié)點、Ⅱ型節(jié)點與Ⅲ型節(jié)點3類研究范疇。其中,Ⅰ型節(jié)點包括嵌套節(jié)點中的一級景區(qū)和二級景區(qū),二者均可再細分為若干景點,是“面”的概念;Ⅱ型節(jié)點包括可達景點和獨立節(jié)點,二者均可達但不可再分,是“點”的概念;Ⅲ型節(jié)點指嵌套節(jié)點中的眺望節(jié)點,也是“點”的概念。
(五)關(guān)注集聚度
對某個一級景區(qū)而言,把高頻可達節(jié)點個數(shù)之和與游記中出現(xiàn)的該景區(qū)所有可達節(jié)點個數(shù)之和的比值定義為關(guān)注集聚度。關(guān)注集聚度揭示了較多景點的游客到訪集中程度,反映的是游客對于該景區(qū)可達景點的最優(yōu)偏好選擇分布特征,用公式表示:α=P/Z (1)
其中,α為關(guān)注集聚度,P為游記中高頻可達節(jié)點個數(shù)之和,Z為游記中出現(xiàn)的所有可達節(jié)點個數(shù)之和。把頻數(shù)排名位于前50%的節(jié)點定義為高頻可達節(jié)點。
(一)研究區(qū)域概況
張家界市位于湖南省西北部的武陵山區(qū)腹地,以獨特的石英砂巖峰林著稱,全域內(nèi)旅游資源稟賦上乘,是首批世界地質(zhì)公園和享譽全球的風景旅游城市之一。近年來,張家界旅游成效顯著,旅游經(jīng)濟高位速增長,被國內(nèi)各大主要旅游網(wǎng)站列為國內(nèi)熱門旅游目的地之一。
(二)數(shù)據(jù)來源與處理
本文選擇攜程網(wǎng)、去哪兒和馬蜂窩3個旅游網(wǎng)站作為網(wǎng)絡(luò)樣本采集平臺,利用計算機編程語言(Python)實現(xiàn)網(wǎng)絡(luò)游記的數(shù)據(jù)爬取。在網(wǎng)站輸入“張家界”進行搜索,搜索結(jié)果根據(jù)網(wǎng)友的游記更新時間排列,即從2018年1月1日至2018年12月31日,以張家界為目的地的網(wǎng)絡(luò)游記共830篇,并依據(jù)一定的標準經(jīng)過嚴格細致的數(shù)據(jù)清洗,最終篩選出474篇游記。在獲取有效游記的基礎(chǔ)上,運用Excel工具對有效游記的數(shù)據(jù)進行結(jié)構(gòu)化處理;利用文本分析軟件ROST Content Mining提取游記正文中詞頻排名靠前的高頻特征詞,構(gòu)建游客文本信息庫;在此基礎(chǔ)上運用內(nèi)容分析法對高頻特征詞進行顯性主題和語義網(wǎng)絡(luò)分析,對各旅游節(jié)點進行多元頻數(shù)比對統(tǒng)計。
(一)旅游感知
利用Python的分詞組件Jieba,從游客文本信息庫中將全部句子精確切開,對長詞進行二次切分,提取每篇游記中線路軌跡的文本屬性,整理剔除如“的”“到”“沒有”“說”等停用詞;利用ROST Content Mining選取詞頻不小于500次的關(guān)鍵詞,最終形成36個高頻特征詞(見表1),根據(jù)共詞矩陣生成游記語義網(wǎng)絡(luò)圖。游記反映了游客對張家界旅游的記憶、體驗與感受,顯性主題與語義網(wǎng)絡(luò)疊加了“游客”的主體認識、情緒和情感,反映了游客對張家界的集體感知。旅游感知的顯性主題和語義網(wǎng)絡(luò)分析均依據(jù)各旅游節(jié)點在網(wǎng)絡(luò)游記中的記載頻數(shù)。
1.顯性主題分析
如表1所示,頻數(shù)排名前五的有“張家界”“景區(qū)”“森林公園”“索道”“天門山”,可知景區(qū)較大程度上代指了游客到達的各個旅游節(jié)點,也間接說明了張家界旅游節(jié)點的自然觀光屬性特征,其中,最熱門的景區(qū)有森林公園、天門山等;索道是游客實現(xiàn)上下山旅程的重要交通工具,因而成為關(guān)注熱點?!熬频辍薄翱蜅!焙汀白∷蕖背霈F(xiàn)頻率排名依次為12、13和26,表明游客在張家界較為關(guān)注“住”,帶有鄉(xiāng)土氣息和地域特色的客棧成為游客選擇的主要住宿形式。地名中除了“張家界”,“鳳凰”和“長沙”分別位于第6位和20位,表明在區(qū)域旅游線路組合中,鳳凰、長沙與張家界關(guān)聯(lián)最為緊密?!帮L景”一詞頻數(shù)高達764,結(jié)合下文分析,可知游客對張家界的感知印象以風景秀美、奇特最為突出。
2.語義網(wǎng)絡(luò)分析
中心節(jié)點詞表明最受關(guān)注的旅游節(jié)點分別是森林公園、天門山、天子山、金鞭溪和袁家界?!熬皡^(qū)”“景點”與“張家界”“門票”和“森林公園”三者距離最近,且均為網(wǎng)絡(luò)核心詞,表明風景旅游作為張家界的最大特色,熱度較高,且森林公園在一定程度上代表了張家界的風景旅游特征?!熬皡^(qū)”與“景點”兩者距離亦較近,表明景區(qū)與景點關(guān)聯(lián)密切,也印證了游記中兩者相互纏繞的事實;“索道”和“門票”是游客在張家界行程安排中較為關(guān)注的要點,表明張家界上下山交通多依賴索道,森林公園采用的聯(lián)票制使門票所涵蓋的游覽景點和時間與游客行程安排密切相關(guān)。在非中心節(jié)點詞中,“下山”“上山”“火車”“百龍?zhí)焯荨薄碍h(huán)?!钡缺砻饔慰洼^關(guān)注旅游交通方式;“十里畫廊”與中心詞“袁家界”距離較近,“楊家界”與中心詞“天子山”距離較近,表明十里畫廊與袁家界、楊家界與天子山在旅游線路中捆綁較為頻繁;“百龍?zhí)焯荨薄笆锂嬂取本嚯x“風景”均較近,表明游客通過前者觀看風景的熱度較高。
(二)節(jié)點偏好
1.統(tǒng)計結(jié)果
通過清洗和整理,本次數(shù)據(jù)挖掘共采集到70個有效旅游節(jié)點。根據(jù)網(wǎng)絡(luò)語境下的景區(qū)與景點分類,參照張家界景區(qū)管理規(guī)定與節(jié)點空間分布,統(tǒng)計得出嵌套節(jié)點共60個,其中,一級景區(qū)6個,二級景區(qū)6個,可達景點30個,眺望景點18個(見表2);獨立節(jié)點10個,包括土家風情園、溪布街、魅力湘西、老院子、賀龍故居、朝陽地縫、九天洞、五雷山、江埡溫泉和老道灣。
2.Ⅰ型節(jié)點
Ⅰ型節(jié)點包括嵌套節(jié)點中的一級景區(qū)和二級景區(qū)。一級景區(qū)中,森林公園到訪頻數(shù)為401,即約有84.60%的游客到訪過森林公園,其以絕對優(yōu)勢領(lǐng)先于其他5個一級景區(qū),其次為天門山、天子山、楊家界,三者頻數(shù)相差不大,再次為大峽谷,頻數(shù)約為森林公園的1/4,最后為索溪峪最低。
如表2、表3所示,森林公園的3個二級景區(qū)中,袁家界為最高頻景區(qū)。其中,袁家界可達類型頻次顯著高于眺望類型頻次,可認為袁家界為體驗型景區(qū);黃石寨景區(qū)出現(xiàn)在游記中的只有1個可達景點,即南天門,結(jié)合游記全文內(nèi)容和其區(qū)位地形特征可知,黃石寨更多是作為武陵源核心景區(qū)中的最大凌空觀景臺,具有顯著的遠眺外向型特征,觀光價值比體驗價值更大,是典型的開放觀光型旅游節(jié)點;金鞭溪景區(qū)只出現(xiàn)5個眺望節(jié)點,無可達節(jié)點,但金鞭溪作為二級景區(qū)在游記中出現(xiàn)的到訪頻數(shù)高達181,遠高于前者,游客在這里除觀賞封閉狹長山谷中的兩岸景點,還能戲水、游樂,因此可認為其兼有體驗和觀光特征,且體驗型更強。除3個二級景區(qū)外,分散于森林公園中的5個旅游節(jié)點均為可達景點,大氧吧廣場因其良好的區(qū)位和集散作用,相對頻數(shù)較高,但整體頻數(shù)仍然較低。
十里畫廊和黃龍洞頻數(shù)均高于索溪峪,且十里畫廊頻數(shù)約為黃龍洞的3倍、寶峰湖的8倍,表明十里畫廊由于與森林公園鄰近,其門票又包含在森林公園四天聯(lián)票中而成為到訪較多的景區(qū),而黃龍洞、寶峰湖均需單獨購票,空間上也與森林公園更遠,因此游客到訪較少。十里畫廊、寶峰湖和黃龍洞分別是以山谷、湖泊和巖溶為主要特征的觀光型景區(qū),但寶峰湖和黃龍洞除其本身外,未挖掘到有效節(jié)點表征游客偏好和印象,說明其內(nèi)部節(jié)點的特征感知度不高。十里畫廊景區(qū)有采藥老人和食指峰來表征。分散景點中可達景點水繞四門的頻次約為眺望景點西海峰林的5倍,與其所處的地理位置和獨特的體驗有關(guān)。
楊家界和天子山均以分散型節(jié)點為主,其中可達景點和眺望景點在數(shù)量和頻數(shù)上均相差不大,可認為二者均是兼具體驗與觀光的綜合型景區(qū);天門山和大峽谷均是可達景點占絕對優(yōu)勢,尤其大峽谷與玻璃橋的頻數(shù)一致,二者都是典型的體驗型景區(qū)。其中,天門山位于市區(qū),距離機場、火車站等交通門戶較近,具有較深印象的可達景點多達9個,遠多于大峽谷玻璃橋的單一型可達景點。
3.Ⅱ型節(jié)點
Ⅱ型節(jié)點包括可達景點和獨立節(jié)點兩大類,共40個,其中排名前20的高頻Ⅱ型節(jié)點如表4所示。在排名前10的Ⅱ型節(jié)點中,水繞四門和百龍?zhí)焯萁煌⒐δ芡怀?,百龍?zhí)焯萁鉀Q了袁家界的垂直交通問題,并以其獨特的體驗感而受到歡迎;天下第一橋、天門洞均以罕見的自然地理特征與良好的可達性成為游客關(guān)注的熱門景點;玻璃橋、烏龍寨、玻璃棧道和鬼谷棧道給予游客充分和特別的體驗感;賀龍公園和賀龍故居均為紅色主題旅游節(jié)點,前者位于天子山景區(qū)內(nèi),因其良好的交通集散功能和紅色主題特征,留給游客較深的感知,后者因其較高的知名度、影響力,以及與鄉(xiāng)村旅游的結(jié)合,成為游客在桑植縣的偏好節(jié)點。
將排名前20的Ⅱ型節(jié)點作為高頻節(jié)點,依據(jù)公式1測算一級景區(qū)的關(guān)注集聚度(見表5),表征游客的旅游節(jié)點選擇集聚特征。大峽谷關(guān)注集聚度為1.00為最大值,即記載可達型節(jié)點與高頻可達型節(jié)點均為玻璃橋;其次為天子山和天門山,均超過50%;楊家界和索溪峪關(guān)注集聚度均為50%;森林公園高頻可達型節(jié)點偏少,以致關(guān)注集聚度不高。張家界網(wǎng)絡(luò)游記單一型節(jié)點共10個,但高頻可達型節(jié)點排名中僅賀龍故居、溪布街入圍,且排名相對靠后,表明單一型節(jié)點的認知度、關(guān)注度、感知度均有待提升。
4.Ⅲ型節(jié)點
張家界網(wǎng)絡(luò)游記記載的Ⅲ型節(jié)點共18個,對這些節(jié)點進行關(guān)注頻數(shù)統(tǒng)計,并與Ⅱ型節(jié)點作統(tǒng)計特征對比分析,結(jié)果如表6、表7所示。最高頻數(shù)為天波府78,低于Ⅱ型節(jié)點最高頻數(shù)101,頻數(shù)均值和標準差也低于Ⅱ型節(jié)點,表明與Ⅱ型節(jié)點相比,游客對Ⅲ型節(jié)點的總體偏好變化幅度更趨于平緩,關(guān)注頻數(shù)也有待進一步提升。
前10名的Ⅲ型節(jié)點中,森林公園金鞭溪有3個,袁家界有2個,楊家界有1個,天子山有3個,索溪峪有1個。結(jié)合表2可知,森林公園整體關(guān)注度較高,金鞭溪和袁家界的體驗和觀光特征均較突出;天子山景點觀光品質(zhì)較高,游客印象深刻;天門山以良好的體驗感廣受歡迎,眺望節(jié)點個數(shù)和頻數(shù)則非常低;楊家界和索溪峪的Ⅲ型節(jié)點關(guān)注頻數(shù)不顯著,觀光特色在整體層面上有待進一步打造。
基于網(wǎng)絡(luò)游記挖掘的高頻統(tǒng)計結(jié)果呈現(xiàn)出的景點熱度表征客觀而全面,除了傳統(tǒng)認知中的經(jīng)典景區(qū)外,筆者還發(fā)現(xiàn)了Ⅱ型節(jié)點如烏龍寨、天下第一橋、賀龍故居和溪布街等到訪較多,Ⅲ節(jié)點如天波府、迷魂臺、神兵聚會和采藥老人等廣受關(guān)注,前者反映了新奇體驗、名人效應(yīng)、鄉(xiāng)村旅游和設(shè)施服務(wù)等對游客偏好具有引導性;后者則表明區(qū)位優(yōu)良、風景奇特的觀光節(jié)點能為游客留下更深刻印象。頻數(shù)、節(jié)點和指標方面相關(guān)概念的提出對科學區(qū)分和深度挖掘網(wǎng)絡(luò)語境下的游記文本信息具有重要意義,能夠更加深刻地反映游客節(jié)點選擇偏好規(guī)律。
[1] 龍瀛,毛其智.城市規(guī)劃大數(shù)據(jù)理論與方法[M].北京:中國建筑工業(yè)出版社,2019:23-25.
[2] 張妍妍,李君軼,楊敏.基于旅游數(shù)字足跡的西安旅游空間網(wǎng)絡(luò)結(jié)構(gòu)研究[J].人文地理,2014(4):111-118.
[3] 張鮮鮮,李婧晗,左穎,等.基于數(shù)字足跡的游客時空行為特征分析:以南京市為例[J].經(jīng)濟地理,2018(12):226-233.
[4] 田逢軍,吳珊珊,胡海勝,等.江西省城市旅游形象的網(wǎng)絡(luò)化呈現(xiàn)[J].經(jīng)濟地理,2019(6):214-222.
[5] 趙春艷,陳美愛.基于網(wǎng)絡(luò)文本分析的游客滿意度影響因素分析[J].統(tǒng)計與決策,2019(13):115-118.
[6] 梁保爾,潘植強.基于旅游數(shù)字足跡的目的地關(guān)注度與共線效應(yīng)研究:以上海歷史街區(qū)為例[J].旅游學刊,2015(7):80-90.
2730501186388