朱道平,張燦鳳
(廣東工業(yè)大學(xué)管理學(xué)院,廣東 廣州510520)
隨著人們的消費(fèi)升級,價(jià)格儼然不再是影響需求的唯一因素,產(chǎn)品銷量到底受到哪些因素的影響,一直是學(xué)者們研究的熱點(diǎn)。 電商交易存在著信息不對稱問題,信息較少的消費(fèi)者為了減少交易風(fēng)險(xiǎn),在做出購買決策之前通常會(huì)在網(wǎng)絡(luò)平臺(tái)收集產(chǎn)品的相關(guān)信息。 根據(jù)社會(huì)認(rèn)同原則,Trusov 等發(fā)現(xiàn),電子商務(wù)活動(dòng)中歷史消費(fèi)者體驗(yàn)后生成的信息在消費(fèi)者決策中起著至關(guān)重要的作用。 此外,學(xué)者們研究也發(fā)現(xiàn)歷史購買記錄、在線評論和買家的反饋評分等消費(fèi)者行為的統(tǒng)計(jì)結(jié)果,會(huì)對產(chǎn)品銷量產(chǎn)生影響。 相關(guān)數(shù)據(jù)顯示,98%的客戶在消費(fèi)前會(huì)參考不同網(wǎng)絡(luò)平臺(tái)的評論內(nèi)容。 可見,用戶評論在消費(fèi)者購買決策中占據(jù)重要地位。
在線客戶評論是消費(fèi)者使用產(chǎn)品后發(fā)表的感想,形式可以是圖片、文字甚至視頻。 在線客戶評論來源可以分成兩類:一類是電商網(wǎng)站,例如京東商城、淘寶、亞馬遜商城等;另一類是第三方網(wǎng)站,這類網(wǎng)站不銷售商品,但是提供產(chǎn)品資訊和用戶交流信息,比如中關(guān)村在線、太平洋電腦網(wǎng)等,也包括社交媒體平臺(tái)如微博。 有學(xué)者指出這兩類網(wǎng)站對于產(chǎn)品的評論存在內(nèi)容、數(shù)量、可信度的差異。 當(dāng)前關(guān)于在線客戶評論對銷量影響的研究主要集中于電商平臺(tái),如崔香梅和黃京華通過采集淘寶數(shù)據(jù),使用相關(guān)性分析和多元線性回歸,發(fā)現(xiàn)好評數(shù)對交易數(shù)有顯著的正向影響。 何喜軍等針對京東商城的聯(lián)想ZUK Z2 手機(jī)產(chǎn)品,綜合考慮影響電商產(chǎn)品銷量的多維指標(biāo)(在線搜索、在線評論、情緒指數(shù)等)并利用熵值法融合同類指標(biāo),進(jìn)行銷量預(yù)測。 除此之外,少量學(xué)者把第三方網(wǎng)站與電商平臺(tái)的在線客戶評論進(jìn)行整合研究,如袁海霞等對比電商平臺(tái)評論與微博口碑對新產(chǎn)品銷售的動(dòng)態(tài)影響,雖然較單一電商平臺(tái)研究進(jìn)行了補(bǔ)充,但僅從評論數(shù)量上進(jìn)行研究,沒有探索評論內(nèi)容的影響。
梳理現(xiàn)有電商銷量預(yù)測研究可以發(fā)現(xiàn),學(xué)者們除了關(guān)注傳統(tǒng)預(yù)測因子外,也逐漸把在線客戶評論作為影響因子。 在線客戶評論作為預(yù)測因子,主要是利用了電商平臺(tái)評論的數(shù)量特征,也嘗試?yán)迷u論情緒,但是很少探索第三方平臺(tái)評論情緒對銷量的影響。 因此,論文在銷量預(yù)測時(shí),加入第三方平臺(tái)的評論情緒指標(biāo)。 同時(shí),考慮到電商銷量的影響因素眾多,論文也選取了傳統(tǒng)的預(yù)測因子,探索這些因素對于銷量預(yù)測的重要性。 論文選取了回歸分析和神經(jīng)網(wǎng)絡(luò)算法進(jìn)行對比和預(yù)測,以期尋找到合適的電商銷量預(yù)測模型。
在線客戶評論的數(shù)量龐大、非結(jié)構(gòu)化,處理起來煩瑣,有時(shí)會(huì)被研究者忽略,將關(guān)注點(diǎn)放在評分、評論數(shù)量及長度、價(jià)格等顯性因素上,較少考慮評論情緒這種隱性因素對銷售預(yù)測的作用。 論文將把電商平臺(tái)和第三方平臺(tái)的評論情緒作為影響因素,進(jìn)行銷量預(yù)測。 具體的研究路線如圖1 所示:
圖1 研究路線
論文選擇手機(jī)作為實(shí)驗(yàn)對象,因?yàn)殡娚啼N售預(yù)測研究主要集中在電子產(chǎn)品類別上。 依據(jù)論文研究假設(shè),數(shù)據(jù)集來源于兩部分:一部分是電商平臺(tái)內(nèi)部數(shù)據(jù),選取京東商城上銷量前300 的手機(jī),并使用八爪魚采集器提取其銷售詳情頁的價(jià)格、促銷、評論、產(chǎn)品上市時(shí)長等信息;另一部分是第三方平臺(tái)的外部數(shù)據(jù),論文選用了新浪網(wǎng)微熱點(diǎn)提供的熱度指數(shù)和情緒指數(shù),該平臺(tái)實(shí)時(shí)分析海量數(shù)據(jù),可以客觀反映某事的熱度和情緒傾向。 研究采集了2020 年6 月1 日至6 月30日為期30 天數(shù)據(jù)量。
收集的原始數(shù)據(jù)存在諸多噪音或不可量化,需要經(jīng)過預(yù)處理,才能用于預(yù)測建模。 去除缺失值和異常值,有效數(shù)據(jù)集有3973 條記錄。 進(jìn)一步,還需對數(shù)值數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理以及對文本數(shù)據(jù)進(jìn)行情感指數(shù)計(jì)算。
對于數(shù)值數(shù)據(jù),如價(jià)格、促銷等,變量之間的量差非常大,為了減小數(shù)據(jù)的可變性,論文采取了標(biāo)準(zhǔn)化處理,經(jīng)過處理的數(shù)據(jù)的均值為0,標(biāo)準(zhǔn)差為1,這是目前用得最多的數(shù)據(jù)標(biāo)準(zhǔn)化方法,其公式為:
其中,和sj分別為第j指標(biāo)觀測值的均值和標(biāo)準(zhǔn)差。
對于文本數(shù)據(jù),如評論屬于非結(jié)構(gòu)化數(shù)據(jù),需要轉(zhuǎn)換成可以計(jì)算的數(shù)值。 論文利用文本處理工具Python 中的Jieba進(jìn)行預(yù)處理,具體步驟包括:文本去重、句子切分、文本分詞、去停用詞等內(nèi)容。 評論文本經(jīng)過預(yù)處理后,利用知網(wǎng)HowNet情感詞典的擴(kuò)充版本對文本進(jìn)行情感分析,并計(jì)算出每條評論的情緒評分。 對于每條評論,首先計(jì)算分句的情感得分,具體公式如下:
其中,Di為程度副詞得分;Sj為程度副詞后的情感詞得分;Nk為否定詞得分。
得到分句的評論情緒得分后,將這條評論的所有分句得分求和,得出此評論的總得分scroet,然后將一款產(chǎn)品一天采集的T條評論進(jìn)行匯總并求均值
對收集的數(shù)據(jù)進(jìn)行適當(dāng)?shù)奶幚砗?,最終選擇的變量有:當(dāng)前價(jià)格、促銷金額、上市時(shí)長、好評率、好評數(shù)、差評數(shù)、差評回復(fù)占比、會(huì)員占比、好評情緒得分、差評情緒得分(來源于京東商城),以及微博熱度、微博情緒(來源于微博),這些基礎(chǔ)變量與現(xiàn)有電商和在線銷售研究相吻合。
首先探索各因素對銷量的影響,同時(shí)也分析這些變量之間的交互效應(yīng)對銷量的影響,論文分別用線性回歸、BP 神經(jīng)網(wǎng)絡(luò)兩種方法進(jìn)行九組實(shí)驗(yàn),具體的實(shí)驗(yàn)設(shè)計(jì)如表1。
表1 實(shí)驗(yàn)方案
以上的差評情緒得分×好評數(shù)、好評情緒得分×差評數(shù)、價(jià)格×好評數(shù)、會(huì)員數(shù)×差評數(shù)和促銷金額×差評數(shù)5 個(gè)交互效應(yīng)新變量是通過參考相關(guān)文獻(xiàn)研究結(jié)論并進(jìn)行變量間的相關(guān)性分析得到的,表2 為部分變量之間的相關(guān)性。 其中價(jià)格、促銷金額、好評情緒得分、差評情緒得分、會(huì)員數(shù)與銷量和好評數(shù)及差評數(shù)的相關(guān)性都很小,于是在這幾個(gè)獨(dú)立變量的基礎(chǔ)上構(gòu)造5 個(gè)交互效應(yīng)新變量。
表2 部分變量之間的相關(guān)性分析結(jié)果
1. 線性回歸分析是采取逐步的方式,首先僅考慮電商平臺(tái)的預(yù)測因素,接下來引入微博平臺(tái)采集的微博情緒和微博熱度兩個(gè)預(yù)測因素,最后添加交互效應(yīng)的五個(gè)因素,具體的回歸結(jié)果如表3 所示。
表3 線性回歸中各變量的表現(xiàn)情況(回歸系數(shù))
續(xù)表
2. BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行商品銷售預(yù)測前,將數(shù)據(jù)集的70%作為訓(xùn)練集,剩余的30%作為測試集。 首先將12 個(gè)基礎(chǔ)變量作為BP 神經(jīng)網(wǎng)絡(luò)的輸入,訓(xùn)練出第一個(gè)人工神經(jīng)網(wǎng)絡(luò)模型。 然后將五個(gè)交互項(xiàng)引入第一個(gè)人工神經(jīng)網(wǎng)絡(luò)模型,圖2給出了基于人工神經(jīng)網(wǎng)絡(luò)模型輸入變量的預(yù)測重要性排行。
圖2 BP 神經(jīng)網(wǎng)絡(luò)模型中各變量的重要性排名
研究的主要目的:一是探索不同平臺(tái)評論情緒對銷量的影響情況,同時(shí)探索其他變量的重要性;二是探索線性回歸、BP 神經(jīng)網(wǎng)絡(luò)對銷量的預(yù)測能力。 表4 總結(jié)了兩類模型的實(shí)驗(yàn)結(jié)果,除了R2以外,還選用了均方根誤差RMSE,對9 個(gè)模型進(jìn)行比較,結(jié)果如表4 所示。
表4 兩種預(yù)測模型的結(jié)果對比
比較實(shí)驗(yàn)一和二可以發(fā)現(xiàn),R2和RMSE 都有所改善,說明第三方社交平臺(tái)的評論情緒對銷量具有一定的影響。 其次在實(shí)驗(yàn)二模型的基礎(chǔ)上加入交互項(xiàng),R2和RMSE 也同樣發(fā)生了改變并優(yōu)化,說明這幾個(gè)變量本身雖然對銷量的影響不顯著,但是其可能會(huì)通過調(diào)節(jié)其他重要預(yù)測因子與銷售的相互作用來影響銷售。 這一現(xiàn)象通過對比加入5 個(gè)交互項(xiàng)的BP 神經(jīng)網(wǎng)絡(luò)模型所帶來的RMSE 改善得到證實(shí)。
除了比較銷量與預(yù)測因子的關(guān)系和重要性以外,從表4可以發(fā)現(xiàn),機(jī)器學(xué)習(xí)模型在自變量維度較復(fù)雜的時(shí)候會(huì)顯現(xiàn)一定的優(yōu)越性(BP 神經(jīng)網(wǎng)絡(luò)模型的RMSE 小于線性回歸模型),并且可以解決線性和非線性問題,不會(huì)受變量相關(guān)性影響。
論文對線性回歸、人工神經(jīng)網(wǎng)絡(luò)兩種建模技術(shù)進(jìn)行比較分析,探討電子商務(wù)背景下,不同平臺(tái)評論情緒和其他預(yù)測變量及其相互作用的重要性、建模技術(shù)的適用性等問題,首先通過比較各種預(yù)測因素的重要性,得出了如下的一些結(jié)論:
第一,論文的研究重點(diǎn)是調(diào)查評論情緒與銷量的關(guān)系,然而線性回歸模型中,電商平臺(tái)的情緒因子都沒有被視為重要的預(yù)測指標(biāo),BP 神經(jīng)網(wǎng)絡(luò)模型也只是將它們的重要性劃分在0~0.05 之間。 與之前不少學(xué)者指出的差評比好評更重要的結(jié)論相矛盾。 關(guān)于評論情緒對銷量預(yù)測的重要性,結(jié)合現(xiàn)有的一些研究結(jié)論,論文給出了兩點(diǎn)解釋:
(1)因?yàn)榇嬖谝恍┧?、刷評論的操作,買家對評論的真實(shí)性懷有半信半疑的態(tài)度,所以他們不太在意這些評論的情緒。
(2)京東商城自營的商品可能因?yàn)槠放菩?yīng)收獲了客戶一定的信任,就不會(huì)過多地考慮評論情緒。
盡管與情感相關(guān)的因素不能作為獨(dú)立因素,但是在兩類模型中好評情緒得分×差評數(shù)、差評情緒得分×好評數(shù)的回歸系數(shù)顯示其為銷量的重要交互預(yù)測因子。 這表明,積極的情緒會(huì)緩和差評數(shù)帶來的負(fù)面影響,而消極的情緒也會(huì)干擾好評數(shù)對銷售的促進(jìn)作用,所以店鋪不能忽視評論內(nèi)容的重要性,而且需要鼓勵(lì)買家撰寫好評來提高評論數(shù)量。
第二,第三方平臺(tái)的微博熱度和微博情緒是兩類模型的預(yù)測變量,這說明第三方平臺(tái)也會(huì)傳播產(chǎn)品的正負(fù)面信息。實(shí)驗(yàn)二比實(shí)驗(yàn)一的R2增大了0.005,可見加入第三方平臺(tái)的預(yù)測變量后預(yù)測效果更好,因此適當(dāng)?shù)膮⒖计渥兓部梢詫︿N量預(yù)測帶來幫助,熱度越高,銷量越高,積極情緒越強(qiáng),銷量越高。
第三,觀察其他變量顯示,價(jià)格與好評數(shù)、促銷金額與差評數(shù)的相互作用被認(rèn)為是兩類預(yù)測模型的重要預(yù)測因子,因此證明了好評數(shù)和差評數(shù)的效果,在三個(gè)回歸模型中,這兩個(gè)變量均被認(rèn)為是重要的獨(dú)立預(yù)測因子,而價(jià)格和促銷金額對它們與銷量的關(guān)系產(chǎn)生了調(diào)節(jié)效應(yīng),并是不可忽視的指標(biāo)。