李 薇,楊東山
(重慶郵電大學(xué) 經(jīng)濟(jì)管理學(xué)院,重慶 400065)
大數(shù)據(jù)給傳統(tǒng)餐飲行業(yè)帶來了巨大的挑戰(zhàn),它改變了傳統(tǒng)餐飲行業(yè)的管理模式和營銷方式,推動(dòng)著餐飲行業(yè)的發(fā)展。第46次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》統(tǒng)計(jì),截至2020年6月,我國網(wǎng)民的規(guī)模達(dá)到9.40億,互聯(lián)網(wǎng)的普及率達(dá)到67.0%,其中,我國網(wǎng)上訂餐規(guī)模達(dá)到4.09億,占網(wǎng)民規(guī)模的43.5%且占比增速較快。
據(jù)中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)數(shù)據(jù)顯示,2019年,全國餐飲收入達(dá)到46 721億元,同比增長9.4%。但是,餐飲行業(yè)的競爭壓力大,線上餐飲平臺(tái)的興起帶動(dòng)線下餐飲向線上餐飲轉(zhuǎn)變,現(xiàn)在大多數(shù)餐飲商家都和第三方平臺(tái)如美團(tuán)、餓了么和大眾點(diǎn)評(píng)等進(jìn)行合作。餐飲商家通過這些餐飲平臺(tái),提供美食的信息以供消費(fèi)者選購。
但是,消費(fèi)者很難依據(jù)餐飲商家提供的美食信息做出購買行為,因?yàn)樯碳姨峁┑男畔⑹蔷哂凶岳院兔阑Ч模蠖鄶?shù)消費(fèi)者只能通過其他消費(fèi)者的評(píng)論來判斷美食的味道、服務(wù)的質(zhì)量和環(huán)境的好壞。商家也可以通過這些文本評(píng)論來了解消費(fèi)者的消費(fèi)偏好,從而對自己的菜品進(jìn)行改善,提升競爭力。因此,如何在眾多的在線評(píng)論中挖掘出背后隱含的信息就顯得非常重要。
本文基于美團(tuán)網(wǎng)站回頭客的餐飲消費(fèi)評(píng)論,通過網(wǎng)絡(luò)爬蟲技術(shù)抓取美食中甜點(diǎn)飲品、火鍋、自助餐、小吃快餐和燒烤烤肉五類有關(guān)的50 000條在線評(píng)論,找出消費(fèi)者滿意度的影響因素。
1960年,Maron等發(fā)表了第一篇有關(guān)自動(dòng)分類的論文[1],此后,這一領(lǐng)域的研究成果開始逐漸增加。Baek等使用Web數(shù)據(jù)搜尋器從Amazon.com收集了75 226條在線消費(fèi)者評(píng)論數(shù)據(jù),對評(píng)論文本進(jìn)行情感分析,其結(jié)果表明,包括評(píng)論等級(jí)和評(píng)論者信譽(yù)的外圍提示,以及諸如評(píng)論內(nèi)容之類的核心提示,都會(huì)影響評(píng)論的有用性?;陔p重過程理論,我們發(fā)現(xiàn)消費(fèi)者將重點(diǎn)放在不同的評(píng)論信息源上,這取決于他們閱讀評(píng)論的目的:在線評(píng)論可用于信息搜索或評(píng)估替代方案,為在線市場所有者提供了有關(guān)如何在其網(wǎng)站上管理在線評(píng)論的新觀點(diǎn)[2]。Cao等考察了在線評(píng)論的各種功能(即基本風(fēng)格和語義特征),將文本挖掘技術(shù)用于從評(píng)論文本中提取語義特征,得出語義特征在影響投票評(píng)論比其他特征更具影響力這一結(jié)論[3]。Reyes等在亞馬遜網(wǎng)站收集了具有“諷刺”意味的評(píng)論,并使用三個(gè)分類器進(jìn)行了評(píng)估,初步結(jié)果表明,這些評(píng)論在很大程度上是積極的,并提供了對諸如情感分析、觀點(diǎn)挖掘和決策之類的語言的相關(guān)建議[4]。Pu等利用多個(gè)特征來識(shí)別相關(guān)的意見句子,然后利用支持向量機(jī)(support vector machines,SVM)對總體意見句子進(jìn)行編碼,以進(jìn)行文檔情感分類,用產(chǎn)品評(píng)論和電影評(píng)論證明了其有效性[5]。
相對于英語而言,中文詞語在不同的語境中有著不同的寓意,中文詞語的復(fù)雜性導(dǎo)致了我國文本挖掘發(fā)展速度相對較慢。但隨著互聯(lián)網(wǎng)、電子商務(wù)的迅速發(fā)展,線上餐飲業(yè)產(chǎn)生了大量的評(píng)論信息,如何利用文本挖掘技術(shù)從海量的評(píng)論中獲取有用的信息也成為眾多學(xué)者研究的熱點(diǎn)。關(guān)菲等利用三層貝葉斯概率模型(latent dirichlet allocation,LDA)主題模型對評(píng)論主題進(jìn)行劃分,通過高頻詞和語義網(wǎng)分析消費(fèi)者的關(guān)注點(diǎn)[6]。范寧利用攜程網(wǎng)民宿的評(píng)論文本數(shù)據(jù)進(jìn)行可視化分析(詞云圖和語義網(wǎng)絡(luò))和LDA主題模型分析,最后利用層次聚類分析得出客房硬件、總體服務(wù)、餐飲、地理位置和性價(jià)比是其重要的五個(gè)因素這一結(jié)論[7]。王海宇以Apriori算法為基礎(chǔ),通過R語言探尋服裝品類重復(fù)購買影響因素與重復(fù)購買行為間的關(guān)聯(lián)強(qiáng)弱關(guān)系[8]。伊秀娟通過改進(jìn)Single-pass算法的相似度計(jì)算方式,解決了其聚類對于文檔輸入順序敏感的問題[9]。司利紅利用LDA主題提取不同類別主題詞,再用詞頻和共現(xiàn)度篩選出一級(jí)主題詞,利用Word2vec相似詞提取得到二級(jí)主題詞,從而保證了主題詞的全面性[10]。對食客的評(píng)論數(shù)據(jù),宋悅用扎根理論進(jìn)行開放性編碼、選擇性編碼和理論性編碼,分析不同類型餐廳的核心影響因素[11]。張紅霞通過對生鮮產(chǎn)品評(píng)論數(shù)據(jù)的文本挖掘,探尋消費(fèi)者關(guān)注的因素,運(yùn)用內(nèi)容分析方法進(jìn)行編碼分析,并用回歸和四分圖模型分析影響消費(fèi)者滿意度的因素[12]。張華泉等結(jié)合服務(wù)質(zhì)量理論和消費(fèi)者滿意度理論,構(gòu)建生鮮電商消費(fèi)者滿意度影響因素概念模型,并以消費(fèi)者的評(píng)論數(shù)據(jù)為對象,使用雙樣本Z檢驗(yàn)和結(jié)構(gòu)方程模型對模型中各影響因素進(jìn)行驗(yàn)證,研究結(jié)果表明“物流因素”和“平臺(tái)因素”對消費(fèi)者正面滿意度產(chǎn)生直接影響,而“產(chǎn)品因素”與消費(fèi)者負(fù)面滿意度之間具有顯著的正向影響作用[13]。何薇等提出了一套基于文本挖掘的客戶服務(wù)滿意度分析框架,實(shí)現(xiàn)了對不滿意工單和原因的識(shí)別[14]。董爽等通過對購物網(wǎng)站在線評(píng)論高頻詞的特征分析,發(fā)現(xiàn)消費(fèi)者更多關(guān)注手機(jī)的商品特征和情感表達(dá),關(guān)注服務(wù)特征的則相對較少[15]。王濤等通過Rostcm軟件將LDA主題模型生成的特征主題詞與所修飾的情感詞生成語義網(wǎng)絡(luò),從而緩解了挖掘文本信息的復(fù)雜性[16]。劉敏等以手機(jī)在線評(píng)論為基礎(chǔ),引入評(píng)論對象和評(píng)論觀點(diǎn),通過社會(huì)語義網(wǎng)絡(luò)構(gòu)建和情感分析兩種方法進(jìn)行分析[17]。賈璇通過對求職軟件的評(píng)論進(jìn)行特征詞提取、制作詞云圖、語義網(wǎng)絡(luò)分析和情感極性特征分析,得出了用戶對各求職軟件使用的情感極性分布[18]。何立峰采用Word2Vec方法訓(xùn)練詞向量模型,從在線評(píng)論中提取酒店服務(wù)的屬性特征,構(gòu)建情感詞典,運(yùn)用情感詞典匹配的方法對酒店服務(wù)屬性特征進(jìn)行情感分析,從而將非結(jié)構(gòu)化的評(píng)論數(shù)據(jù)轉(zhuǎn)化為可利用的結(jié)構(gòu)數(shù)據(jù)[19]。熊偉等通過文本挖掘技術(shù)的批量處理功能,對酒店顧客的在線評(píng)論進(jìn)行詞頻和情感分析,并結(jié)合時(shí)間序列分析法預(yù)測其未來的發(fā)展趨勢[20]。
目前,互聯(lián)網(wǎng)上存在眾多的線上餐飲平臺(tái),比如美團(tuán)、餓了么和大眾點(diǎn)評(píng)等。這些平臺(tái)在線評(píng)論的數(shù)量和質(zhì)量各不相同,需從眾多餐飲平臺(tái)中選擇最合適的。在綜合考慮網(wǎng)站訪問量和網(wǎng)站知名度、獲取數(shù)據(jù)是否便捷兩個(gè)因素后,本文最終選擇美團(tuán)網(wǎng)作為數(shù)據(jù)樣本來源平臺(tái)。
1.根據(jù)網(wǎng)站訪問量和網(wǎng)站知名度等情況,通過Alexa網(wǎng)站排名對美團(tuán)網(wǎng)、餓了么和大眾點(diǎn)評(píng)進(jìn)行綜合排名(更新于2020年3月11日),詳見表1所示。
表1 各個(gè)餐飲平臺(tái)排名匯總表
從表1中可以看出,美團(tuán)網(wǎng)的Alexa全球排名在其余兩個(gè)網(wǎng)站之上,且美團(tuán)網(wǎng)在行業(yè)排名中也位居第一。
2.本文以回頭客在線評(píng)論作為研究數(shù)據(jù)樣本,觀察各大餐飲平臺(tái)的在線評(píng)論,發(fā)現(xiàn)評(píng)論體系各不相同。由于美團(tuán)網(wǎng)有回頭客在線評(píng)論這一欄,爬取數(shù)據(jù)時(shí)相對便捷,這也使本文選取的數(shù)據(jù)更具有針對性。同時(shí),美團(tuán)網(wǎng)的評(píng)價(jià)體系相對其他網(wǎng)站也較為成熟,在回頭客評(píng)論頁面的文本描述也較清晰。
根據(jù)以上分析,美團(tuán)網(wǎng)站的回頭客在線評(píng)論在回頭客研究中具有良好的代表性,可以從其文本評(píng)論內(nèi)容中挖掘出對餐飲行業(yè)有用的信息。因此,本文選取美團(tuán)網(wǎng)的回頭客評(píng)論作為研究對象。
餐飲種類的選擇包含兩個(gè)方面,一是餐飲所在地區(qū),二是餐飲類別。本文主要研究的是基于回頭客的消費(fèi)滿意度影響因素,考慮到所需在線評(píng)論數(shù)量多且對質(zhì)量要求較高,所以選擇美團(tuán)網(wǎng)美食頁面所給的熱門城市進(jìn)行數(shù)據(jù)爬取。在餐飲類別的選擇上,根據(jù)平臺(tái)排列順序及是否常見,選取了甜點(diǎn)飲品、火鍋、自助餐、小吃快餐和燒烤烤肉五個(gè)餐飲類別。本文選取各個(gè)熱門城市銷量較高和好評(píng)較多的餐飲商家來爬取評(píng)論內(nèi)容。
本文需要的數(shù)據(jù)為美團(tuán)網(wǎng)站上甜點(diǎn)飲品、火鍋、自助餐、小吃快餐和燒烤烤肉五類美食回頭客的在線文本評(píng)論。由于Python語言在數(shù)據(jù)爬取方面較其他編程語言優(yōu)勢明顯,可以運(yùn)用于眾多的擴(kuò)展庫來實(shí)現(xiàn)數(shù)據(jù)的獲取。Python語言爬取回頭客評(píng)論數(shù)據(jù)的規(guī)則如圖1所示。
圖1 數(shù)據(jù)爬取規(guī)則圖
Python語言爬取數(shù)據(jù)的步驟流程如圖2所示。
圖2 數(shù)據(jù)爬取流程圖
對詞語在整個(gè)文本中出現(xiàn)的頻率進(jìn)行統(tǒng)計(jì)具有重要意義,從詞頻統(tǒng)計(jì)中可以大致預(yù)測到回頭客的滿意因素,五類美食的詞頻統(tǒng)計(jì)如表2至表6所示。
表2 火鍋詞頻統(tǒng)計(jì)表
表3 燒烤烤肉詞頻統(tǒng)計(jì)表
表4 甜點(diǎn)飲品詞頻統(tǒng)計(jì)表
表5 小吃快餐詞頻統(tǒng)計(jì)表
表6 自助餐詞頻統(tǒng)計(jì)表
從表2至表6中,可以看出每一類美食評(píng)論的詞頻數(shù),排在前面的大都為味道、菜品、服務(wù)、環(huán)境和實(shí)惠等,但是這些詞在每一類美食中的排序又各不相同,比如火鍋詞頻統(tǒng)計(jì)表中以味道、菜品、服務(wù)和環(huán)境為次序排序,而在小吃快餐中卻以味道、顧客、實(shí)惠和環(huán)境為次序排列,從中可以看出每一類美食對于回頭客的影響因素有些許的不同。
語義網(wǎng)絡(luò)基于詞語的出現(xiàn)頻率、詞語間的共現(xiàn)頻率和間隔距離來探索文本的含義。本文通過ROST CM6.0對回頭客文本評(píng)論進(jìn)行語義網(wǎng)絡(luò)可視化分析,得出五類美食的語義網(wǎng)絡(luò)圖和語義網(wǎng)絡(luò)頻數(shù)表。通過語義網(wǎng)絡(luò)圖分析詞與詞之間的關(guān)系是否密切,其中線條密集程度越高表示兩者的關(guān)系越緊密[21]。
火鍋美食的語義網(wǎng)絡(luò)圖和語義網(wǎng)絡(luò)頻數(shù)表分別如圖3和表7所示。從圖3可以看出,味道、菜品、服務(wù)和環(huán)境是重要的節(jié)點(diǎn),大部分分支都從這四個(gè)節(jié)點(diǎn)出發(fā)。以味道節(jié)點(diǎn)為例,與之距離較近的關(guān)鍵詞有新鮮、菜品、服務(wù)、好吃和環(huán)境。因此,可以看出,回頭客對于火鍋美食的味道、服務(wù)、菜品和環(huán)境最為關(guān)注。
圖3 火鍋語義網(wǎng)絡(luò)圖
表7 火鍋語義網(wǎng)絡(luò)頻數(shù)表
燒烤烤肉美食的語義網(wǎng)絡(luò)圖和語義網(wǎng)絡(luò)頻數(shù)表分別如圖4和表8所示。從圖4中可以看出,味道、菜品、服務(wù)、環(huán)境是其重要的節(jié)點(diǎn)。以菜品節(jié)點(diǎn)為例,與其距離較近的關(guān)鍵詞有味道、服務(wù)、環(huán)境和態(tài)度,可以看出燒烤烤肉的菜品、味道、服務(wù)和環(huán)境是影響回頭客是否再次選擇的重要因素。
表8 燒烤烤肉語義網(wǎng)絡(luò)頻數(shù)表
圖4 燒烤烤肉語義網(wǎng)絡(luò)圖
甜點(diǎn)飲品美食的語義網(wǎng)絡(luò)圖和語義網(wǎng)絡(luò)頻數(shù)表分別如圖5和表9所示。從圖5中可以看出,味道、菜品、服務(wù)、環(huán)境、蛋糕是其重要的節(jié)點(diǎn)。以味道節(jié)點(diǎn)為例,與其距離較近的關(guān)鍵詞有好吃、蛋糕、態(tài)度和環(huán)境等,可以看出回頭客對于甜點(diǎn)飲品的味道及服務(wù)更為關(guān)注。
圖5 甜點(diǎn)飲品語義網(wǎng)絡(luò)圖
表9 甜點(diǎn)飲品語義網(wǎng)絡(luò)頻數(shù)表
小吃快餐美食的語義網(wǎng)絡(luò)圖和語義網(wǎng)絡(luò)頻數(shù)表分別如圖6和表10所示。從圖6中,可以看出味道是最重要的節(jié)點(diǎn)。與味道節(jié)點(diǎn)距離較近的關(guān)鍵詞有環(huán)境、好吃和劃算,可以看出回頭客最為關(guān)注小吃快餐的味道。
圖6 小吃快餐語義網(wǎng)絡(luò)圖
表10 小吃快餐語義網(wǎng)絡(luò)頻數(shù)表
自助餐美食的語義網(wǎng)絡(luò)圖和語義網(wǎng)絡(luò)頻數(shù)表分別如圖7和表11所示。從圖7中,可以看出環(huán)境、服務(wù)和菜品是其重要的節(jié)點(diǎn)。以環(huán)境節(jié)點(diǎn)為例,與其距離較近的關(guān)鍵詞有菜品、服務(wù)員、味道,從中可以看出回頭客最為關(guān)注的是自助餐的環(huán)境、服務(wù)和菜品。
表11 自助餐語義網(wǎng)絡(luò)頻數(shù)表
圖7 自助餐語義網(wǎng)絡(luò)圖
聚類分析是一個(gè)基于信息相似性和差異性、將信息劃分成一些簇的過程,同簇之間對象的相似性較高,非同簇之間的相似性較低。數(shù)據(jù)對象之間的相似程度受其取值范圍的影響,在進(jìn)行聚類分析的過程中以不同的聚類方法進(jìn)行聚類,得到的結(jié)果也有所不同。
對于文本聚類而言,聚類方法有很多,常用的有K-means聚類[22]和系統(tǒng)聚類。本文采用系統(tǒng)聚類,因其相對于K-means聚類而言,在選擇初始K值和聚類中心點(diǎn)上具有優(yōu)勢,限制的條件較少,也不用提前確定聚類的數(shù)量[23]。
在初始狀態(tài)下,系統(tǒng)聚類將每一個(gè)樣本都當(dāng)成獨(dú)立的一類,如含n個(gè)樣本的數(shù)據(jù)集就有n類。通過計(jì)算類別與類別之間的距離,系統(tǒng)聚類將距離最小的兩類合成新的一類,這時(shí)數(shù)據(jù)集中就剩下n-1類。系統(tǒng)聚類進(jìn)一步找出距離最小的兩類,并將它們合成一類,這時(shí)數(shù)據(jù)集中就剩下n-2類。以此類推,數(shù)據(jù)集最終只剩下一類,即包括全體數(shù)據(jù)的類。
本文通過R語言進(jìn)行系統(tǒng)聚類,對文本數(shù)據(jù)進(jìn)行分詞處理之后生成語料庫,進(jìn)行降維處理[24],再轉(zhuǎn)換成數(shù)據(jù)庫格式,進(jìn)行系統(tǒng)聚類。
以自助餐的系統(tǒng)聚類結(jié)果圖8為例,從中可看出,熱情和服務(wù)態(tài)度歸為一類,熱情和服務(wù)態(tài)度所形成的新類和味道又歸為一大類,依次歸類,最后歸為一大類。結(jié)合實(shí)際情況對聚類結(jié)果進(jìn)行分析,概括回頭客選擇自助餐美食的影響因素。分析所得的聚類圖可概括為五大類別,分別是服務(wù)態(tài)度、菜品味道、菜品新鮮度、菜品種類和環(huán)境。并由此得出表12的五類美食的系統(tǒng)聚類結(jié)果。
表12 系統(tǒng)聚類結(jié)果表
圖8 自助餐的聚類結(jié)果
通過前文對回頭客數(shù)據(jù)的特征分析和聚類分析可知,火鍋美食對于回頭客而言,火鍋味道、菜品種類、服務(wù)態(tài)度和環(huán)境整潔是回頭客最為關(guān)注的因素,其中火鍋的味道是影響回頭客再次選擇的最重要的因素。燒烤烤肉美食對于回頭客而言,燒烤烤肉的菜品種類、味道、服務(wù)態(tài)度和環(huán)境整潔是回頭客最為關(guān)注的因素,其中菜品種類和味道是影響回頭客再次選擇的重要因素。甜點(diǎn)飲品美食對于回頭客而言,甜點(diǎn)飲品的味道、甜點(diǎn)是否以蛋糕為主、服務(wù)態(tài)度和環(huán)境整潔是回頭客最為關(guān)注的因素,其中甜點(diǎn)飲品的味道是影響回頭客再次選擇的重要因素。小吃快餐美食對于回頭客而言,小吃快餐的味道、環(huán)境整潔和價(jià)格是否實(shí)惠是回頭客最為關(guān)注的因素,其中小吃快餐的味道是影響回頭客再次選擇的重要因素。自助餐美食對于回頭客而言,自助餐食品的味道、菜品種類、食品新鮮度、環(huán)境整潔和服務(wù)態(tài)度是否實(shí)惠是回頭客最為關(guān)注的因素,尤其是自助餐的環(huán)境整潔和食品味道是影響回頭客再次選擇的重要因素。從五類美食的綜合分析得出,味道、環(huán)境和服務(wù)都是影響回頭客再次選擇的重要因素,但因美食種類的不同又有所差異,如小吃快餐美食對于回頭客而言,價(jià)格是否實(shí)惠也是其重要因素。
1.改善食品味道
從五類美食的關(guān)鍵詞提取和詞頻統(tǒng)計(jì)分析,可以看出回頭客在五類美食評(píng)論中,味道都是出現(xiàn)較多的詞。從實(shí)際情況出發(fā),味道是美食商家經(jīng)營的核心,只要美食的味道得到了消費(fèi)者的肯定,消費(fèi)者就極有可能成為商家的回頭客。商家可以通過嘗試設(shè)計(jì)多種味道的美食并讓消費(fèi)者進(jìn)行選擇,提升消費(fèi)者的回頭率。
2.打造多樣菜品
菜品在美食中的詞頻較高,在關(guān)鍵詞提取中,菜品也排在前面。尤其在火鍋、燒烤烤肉和自助餐美食分析中,菜品對于回頭客的影響極大。在這三類美食中,菜品的多樣可以吸引消費(fèi)者成為回頭客,滿足更多的消費(fèi)者對不同菜品的喜好。因此,美食商家應(yīng)該在成本可控的范圍內(nèi)盡可能使菜品多樣化。
3.提高服務(wù)水平
在詞頻統(tǒng)計(jì)分析和關(guān)鍵詞中,服務(wù)也是回頭客所關(guān)注的重要因素,服務(wù)對于消費(fèi)者用餐體驗(yàn)影響較大,無形服務(wù)[25]也是美食商家提升競爭力的重要途徑,相比研發(fā)美食味道和增加菜品的多樣性而言,提高服務(wù)水平帶來的成本相對較低,也較容易改變。因此,美食商家應(yīng)該加強(qiáng)對服務(wù)人員的培訓(xùn),熱情的服務(wù)態(tài)度會(huì)增加消費(fèi)者的幸福感。
4.改善用餐環(huán)境
環(huán)境在五類美食的詞頻統(tǒng)計(jì)和關(guān)鍵詞中都較靠前。隨著人們生活水平的提高,用餐的環(huán)境成為人們所關(guān)注重點(diǎn),因此環(huán)境因素對顧客滿意度影響較大[26],用餐環(huán)境包括店鋪的衛(wèi)生環(huán)境[27]和設(shè)計(jì)環(huán)境,良好的環(huán)境更容易吸引消費(fèi)者,提高消費(fèi)者的回頭率。因此,美食商家應(yīng)該針對所經(jīng)營的美食進(jìn)行環(huán)境設(shè)計(jì),并保證消費(fèi)者用餐環(huán)境的衛(wèi)生,讓消費(fèi)者有舒適感。
重慶郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2021年2期