張子衿
摘 ? 要:2014年5月起,百度推出了外賣平臺,現(xiàn)平臺注冊用戶量已經(jīng)達(dá)到了3 000萬人以上,至今積累了大量的數(shù)據(jù)。然而這些數(shù)據(jù)具備很高的實(shí)際應(yīng)用價值。為此,該文隨機(jī)抽取了百度外賣平臺上五家外賣餐館的數(shù)據(jù),分別從商家訂餐量、訂餐用戶、用戶評價和訂餐時間4個維度進(jìn)行了數(shù)據(jù)分析,從而找出百度外賣平臺數(shù)據(jù)的價值,引發(fā)大家對數(shù)據(jù)使用的思考與關(guān)注。
關(guān)鍵詞:百度外賣;數(shù)據(jù)價值;文本分析
中圖分類號:TP399 ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A
0 引言
2014年5月百度推出了外賣平臺,現(xiàn)平臺注冊用戶量已經(jīng)達(dá)到了3 000多萬人,在白領(lǐng)外賣市場實(shí)現(xiàn)份額第一,且平臺上積累了大量的數(shù)據(jù)。如何合理使用這些數(shù)據(jù),是外賣平臺、平臺商家以及外賣用戶值得思考的問題。為此,該文隨機(jī)抽取了百度外賣平臺上5家餐館數(shù)據(jù),并進(jìn)行了分析。
1 研究思路及方法
1.1 研究思路
研究按如下思路展開:1)數(shù)據(jù)采集;2)數(shù)據(jù)分析,分別從商家訂餐量、訂餐用戶、用戶評價、訂餐時間4個維進(jìn)行分析;3)數(shù)據(jù)價值,通過分析結(jié)果找到數(shù)據(jù)價值。
1.2 研究方法
研究主要使用了數(shù)據(jù)統(tǒng)計(jì)分析方法,在用戶評價的文本分析中,使用了社會網(wǎng)絡(luò)分析軟件ROST CM 6對數(shù)據(jù)進(jìn)行分析,并對用戶評價的文本信息進(jìn)行自動分詞、高頻詞統(tǒng)計(jì)、云圖生成、共詞社會網(wǎng)絡(luò)及語義分析。
1.3 數(shù)據(jù)采集
利用國內(nèi)網(wǎng)絡(luò)爬蟲制作工具——八爪魚軟件獲取數(shù)據(jù)。從百度外賣平臺上,隨機(jī)抽取上海中山公園商圈的5個外賣商家的數(shù)據(jù),商家在百度外賣的ID分別為:1645228165、1557526832、15280021074、1439935781、1835243683。
2 數(shù)據(jù)分析
2.1 商家訂餐量
數(shù)據(jù)一顯示了2017年5家商家所有訂餐量。由全年數(shù)據(jù)可以看出,ID號為1439935781的商家經(jīng)營情況最好。平均年訂餐量為2 160份。按平均每份20元計(jì),一年該商家的外賣營業(yè)額在43 200元。如果按行業(yè)平均利潤20%計(jì)量,平均每家外賣利潤僅為8 640元。由此可見,雖然百度外賣平臺有較大的影響力,但外賣餐館如果僅依托一個百度外賣平臺的銷量,是難以生存的。
數(shù)據(jù)一。
2017年五家外賣餐館的訂餐量(共計(jì)10 841)。
商家ID號:1835243683;訂餐數(shù)量:613商家ID號:1645228165;訂餐數(shù)量:2438。
商家ID號:1557526832;訂餐數(shù)量:2932商家ID號:1557526832;訂餐數(shù)量:2932。
商家ID號:1528021074;訂餐數(shù)量:1090商家ID號:1439935781;訂餐數(shù)量:3768。
2.2 訂餐用戶分析
百度外賣平臺上95%以上的用戶是以手機(jī)號作為用戶名注冊的。訂餐用戶的分析得出以下2個結(jié)論。
2.2.1 發(fā)現(xiàn)外賣餐館的核心用戶
如數(shù)據(jù)二所示,可以看到用戶尾號831、814、013、557、521為餐飲1439935781最忠誠的客戶,了解這點(diǎn),便于餐館維護(hù)核心客戶,并從核心客戶進(jìn)行調(diào)研及分析,研發(fā)更適合客戶需要的菜品及服務(wù)。
2.2.2 進(jìn)行商圈競爭對手的分析
如某用戶在某個時間段內(nèi)在A餐館訂餐了18次,而在B餐館中訂餐16次,且餐館A與B的用戶重疊度較高,說明A、B餐館具有較大的競爭關(guān)系,可以幫助商家了解競爭對手,提升自己的競爭力。
數(shù)據(jù)二。
訂餐用戶一年訂餐次數(shù)。
用戶ID:1391****831/訂餐63次/訂餐餐館ID:1439935781
用戶ID:1391****210/訂餐48次/訂餐餐館ID:1645228165
用戶ID:1391****814/訂餐36次/訂餐餐館ID:1439935781
用戶ID:1391****013/訂餐33次/訂餐餐館ID:1439935781
用戶ID:1861****557/訂餐26次/訂餐餐館ID:1439935781
用戶ID:1381****631 /訂餐25次/訂餐餐館ID:1645228165(1次),1439935781(24次)
用戶ID:1381****521 /訂餐24次/訂餐餐館ID:1439935781
用戶ID:1560****050 /訂餐21次/訂餐餐館ID:1557526832
2.3 用戶評價文本分析
通過分詞發(fā)現(xiàn)高頻詞,是文本分析最重要也是基礎(chǔ)的研究。該部分利用ROST CM6軟件,對5家外賣餐館的點(diǎn)評數(shù)據(jù)進(jìn)行分詞,得到用戶評價的高頻詞(如數(shù)據(jù)三所示),從排序表可以看出,與配送相關(guān)的詞:配送、服務(wù)、保存等都是高頻詞,對于外賣來說,外賣的及時到達(dá)是消費(fèi)者特別關(guān)心的問題;其次是食品本身的質(zhì)量,如味道、好吃等。
數(shù)據(jù)三。
用戶評價高頻詞。
配送快:336次;服務(wù)態(tài)度好:311次;保存完好:261次;味道贊:172次;風(fēng)雨無阻:154次;分量足:128次;味道:122次;很好:117;包裝精美:105次;好吃:100;價格實(shí)惠:85次。
通過共詞進(jìn)行語義分析可以進(jìn)行文本信息的進(jìn)一步挖掘,共詞是對每一條點(diǎn)評信息進(jìn)行分詞后,發(fā)現(xiàn)同一條點(diǎn)評信息共同出現(xiàn)的詞,如這家炸雞太難吃,分詞后分出來的結(jié)果是炸雞、難吃。通過ROST CM6的社會網(wǎng)絡(luò)及語義分析模塊,可分析出炸雞難吃的語義,同時,將炸雞與難吃建立一條連線,連線的粗細(xì)表示共詞次數(shù)的多寡。對樣本數(shù)據(jù)中的點(diǎn)評信息進(jìn)行社會網(wǎng)絡(luò)及語義分析。通過分析可以得出,“味道”與“很好”,“外賣”與“小哥”,“態(tài)度”與“很好”線條比較粗,說明用戶點(diǎn)評中,評價認(rèn)為味道很好、態(tài)度很好,對外賣小哥的評價比較多。
2.4 訂餐時間分析
百度外賣中顯示了從用戶下單時間、用戶收到外賣的時間以及兩者相減所用的訂餐時間。但是系統(tǒng)顯示的時間信息有錯誤,在該研究樣本數(shù)據(jù)中顯示,最高的訂餐時出不一致的信息,如顯示訂餐時間是308分鐘的用戶在抱怨:三刻鐘才送到,說明系統(tǒng)顯示的部分訂餐時間并不準(zhǔn)確。而用戶收到外賣的時間與用戶下單時間相關(guān)得到的數(shù)據(jù),有時與系統(tǒng)顯示的訂餐時間也不一致。
3 百度外賣數(shù)據(jù)價值
通過以上分析可以看到,百度外賣的數(shù)據(jù)具有極高的應(yīng)用價值,對于外賣平臺來說,數(shù)據(jù)能幫助其了解平臺上外賣餐館運(yùn)營及服務(wù)的情況及變化。對于外賣平臺上的商家來說,能了解用戶反饋和需求以及競爭對手的情況;對于普通訂餐用戶來說,能了解商家的排名、推薦菜品、性價比、和配送情況。但目前大多數(shù)餐館還沒有真正認(rèn)識到數(shù)據(jù)的價值并利用起來。不過相信隨著人們利用大數(shù)據(jù)的意識以及能力的提高,該數(shù)據(jù)的價值將會得到更為充分的重視和應(yīng)用。
參考文獻(xiàn)
[1]蔡溢,楊洋,殷紅梅.基于ROST文本挖掘軟件的貴陽市城市旅游品牌受眾感知研究[J].重慶師范大學(xué)學(xué)報(自然科學(xué)版),2015(1):126-134.
[2]馬向陽,魏文文,白寅.老品牌餐廳感知真實(shí)性的線索類型及其作用機(jī)理[J].華東經(jīng)濟(jì)管理,2017(8):176-184.