王裕菲 趙軍
(1.寧夏大學(xué)信息工程學(xué)院 寧夏回族自治區(qū)銀川市 750021 2.寧夏大學(xué)商學(xué)院 寧夏回族自治區(qū)銀川市 755000)
改革開放以來,我國(guó)的消費(fèi)模式發(fā)生巨大轉(zhuǎn)變。計(jì)算機(jī)網(wǎng)絡(luò)及電商的發(fā)展,使消費(fèi)者更加敏捷地加入網(wǎng)絡(luò),成為信息的使用者和創(chuàng)造者[1]。網(wǎng)購是一種特殊的消費(fèi)模式,而商品評(píng)論作為已購消費(fèi)者對(duì)商品的看法、觀點(diǎn),蘊(yùn)含著巨大的商業(yè)價(jià)值。消費(fèi)者在線購買的決策過程中,如何在諸多同類產(chǎn)品且預(yù)算受限的情況下選擇令自己滿意的服務(wù)或商品,由此便引出問題,如何簡(jiǎn)便高效地利用雜亂無章的商品評(píng)論數(shù)據(jù),生成對(duì)消費(fèi)者有用的信息,如進(jìn)行決策推薦[2],本文就此問題,開展研究。
消費(fèi)者處于社會(huì)化營(yíng)銷的環(huán)境中,其決策會(huì)受到諸多因素影響。張曉飛驗(yàn)證了“意見領(lǐng)袖”從外圍路徑造成的影響并未對(duì)最終決策造成作用;產(chǎn)品與服務(wù)營(yíng)銷的“出入”也成為了Sandra Godinho 等研究人員關(guān)注的問題;品牌可行度等對(duì)消費(fèi)者決策也存在一定的影響[20];情境因素也成為了學(xué)者Chen 等人著重研究的問題,其中,在線評(píng)論對(duì)消費(fèi)者決策的影響成為眾多學(xué)者研究的重點(diǎn)。
學(xué)者針對(duì)在線評(píng)論,從不同的角度開展研究,覃伍整合包括在線評(píng)論在內(nèi)引出構(gòu)成網(wǎng)上沖動(dòng)購買意愿的整合模型,為營(yíng)銷者提供相關(guān)建議;高楠選擇若干消費(fèi)者購買決策的影響因素,構(gòu)建影響模型;唐曉莉等人開展2 評(píng)論類型(主觀vs 客觀)*2 認(rèn)知需求(高vs 低)的眼動(dòng)實(shí)驗(yàn),探索消費(fèi)者對(duì)于在線評(píng)論有用性的感知過程和感知結(jié)果;張媛媛用功能價(jià)值等建立模型并完善,得出影響因素與價(jià)值之間的相關(guān)關(guān)系;錢佩雨建立在線不一致對(duì)消費(fèi)者決策影響的的動(dòng)態(tài)模型并驗(yàn)證其可行性;韋荷琳構(gòu)建在線網(wǎng)絡(luò)口碑對(duì)于跟團(tuán)游在線產(chǎn)品預(yù)定的影響模型;許犇,徐國(guó)慶等人提出記憶圖卷積神經(jīng)網(wǎng)絡(luò)(MGCNN)引入注意力機(jī)制的商品評(píng)論情感分析方法。馮勇等人提出了融合近鄰評(píng)論的GRU 商品推薦模型實(shí)現(xiàn)商品推薦,并驗(yàn)證其有效性和優(yōu)越性。本文基于上述研究,實(shí)現(xiàn)消費(fèi)者基于評(píng)論數(shù)據(jù)情感產(chǎn)生的決策推薦。
針對(duì)評(píng)論數(shù)據(jù)的情感分析,焦夢(mèng)蕾等人將情感特征分為極性和強(qiáng)度兩個(gè)方面進(jìn)行計(jì)算[3];高統(tǒng)超提出了兩種特征選擇方法和基于層次關(guān)系的復(fù)雜方面短語提取算法用于提高評(píng)價(jià)精確度;尤天慧等人通過計(jì)算備選方案的效用值進(jìn)行決策[4];余本功等人將情感分析和關(guān)注點(diǎn)結(jié)合起來分析得出每款產(chǎn)品的平均得分;王琳等人研究了不同極性情感對(duì)消費(fèi)者決策的影響差異;學(xué)者李春江設(shè)計(jì)了一個(gè)情感分析系統(tǒng),用于從商品評(píng)論中自動(dòng)抽取商品屬性。評(píng)論數(shù)據(jù)情感的研究,成為評(píng)論數(shù)據(jù)的研究方向。
據(jù)中國(guó)互聯(lián)網(wǎng)信息中心發(fā)布的第45 次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,我國(guó)網(wǎng)民規(guī)模達(dá)9.04 億,網(wǎng)絡(luò)購物用戶規(guī)模達(dá)7.10 億,手機(jī)上網(wǎng)比例更達(dá)99.3%。在如此大規(guī)模的消費(fèi)背景下,網(wǎng)購成為消費(fèi)模式中不可或缺的一部分,消費(fèi)者要通過在線平臺(tái)購買手機(jī),作為單一的購買用戶,對(duì)于雜亂無章的評(píng)論數(shù)據(jù)無從下手,本文就此問題,針對(duì)獲得的商品評(píng)論數(shù)據(jù),為消費(fèi)者進(jìn)行商品推薦。解決問題的流程如圖1 所示。
圖1:消費(fèi)者決策推薦流程圖
為了從雜亂的商品評(píng)論中提取有用的信息,需要對(duì)評(píng)論數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。去除有缺失值的評(píng)論(人工填充)、無格式亂碼的評(píng)論、無意義評(píng)論、符號(hào)過多評(píng)論、重復(fù)評(píng)論,整理為若干條評(píng)論組成的word 文檔。為了從商品評(píng)論中提取出商品特征,使用TF-IDF 算法,進(jìn)行詞頻分析。詞頻計(jì)算公式如下:
詞頻(TF)=某詞詞數(shù)/評(píng)論的總詞數(shù)
逆文檔頻率是一個(gè)詞普遍重要性的度量。評(píng)論數(shù)據(jù)中某一個(gè)特定詞的IDF 可以由評(píng)論條數(shù)除以包含該詞語的評(píng)論條數(shù)與1 的和,再將得到的商取對(duì)數(shù)得到。
逆文檔頻率(IDF)=log[評(píng)論總條數(shù)/(包含該詞的評(píng)論條數(shù)+1)]
TF-IDF=詞頻(TF)×逆文檔頻率(IDF)
得到詞頻(TF)和逆文檔頻率(IDF)以后,將這兩個(gè)值相乘,TF-IDF 與一個(gè)詞在文檔中的出現(xiàn)次數(shù)成正比。所以,計(jì)算出文檔的每個(gè)詞的TF-IDF 值,可在此基礎(chǔ)上,根據(jù)排名順序,從排在前面的若干關(guān)鍵詞中,提取商品特征提取出商品特征。
引入Boson 情感詞典,Boson 詞典是基于微博、新聞、論壇等數(shù)據(jù)來源構(gòu)建的情感詞典,所以詞典適用于處理社交媒體的情感分析。對(duì)于每個(gè)商品特征得到的情感詞集,分別取它與Boson 情感詞典的交集,并區(qū)分正負(fù)情感傾向,得到與評(píng)論對(duì)應(yīng)的包含特征值的各特征情感詞典,
本文采用改進(jìn)過的林杰情感計(jì)算的算法計(jì)算每種商品每條評(píng)論每個(gè)特征的的情感傾向。
2.4.1 林杰的情感計(jì)算方法
林杰在自己的研究當(dāng)中,計(jì)算商品評(píng)論的情感傾向的步驟如下:
(1)根據(jù)Boson 詞典與評(píng)論數(shù)據(jù)的交集得出各個(gè)特征的情感詞詞典(正負(fù)詞典);
(2)當(dāng)一條評(píng)論當(dāng)中
A.正向情感詞數(shù)>負(fù)向情感詞數(shù),本條評(píng)論情感傾向?yàn)檎?/p>
B.正向情感詞數(shù)<負(fù)向情感的數(shù),本條評(píng)論情感傾向?yàn)樨?fù);
C.正向情感詞數(shù)=向情感詞數(shù)時(shí),本條評(píng)論情感傾向?yàn)橹行浴?/p>
2.4.2 改進(jìn)的情感計(jì)算方法
事實(shí)上,每一條評(píng)論當(dāng)中的多個(gè)情感詞,表達(dá)的情感程度都是不同的,因此,提出了改進(jìn)的情感計(jì)算方法,步驟如下:
Step1:jieba 分詞后,去除評(píng)論當(dāng)中的停用詞;
Step2:讀取情感詞、程度副詞、否定詞文件,將句子中的情感詞、程度副詞轉(zhuǎn)為程度副詞字典對(duì)象,key 為程度副詞,value為對(duì)應(yīng)的程度值;
Step3:更新權(quán)重,如果有程度副詞,分值乘以程度副詞的程度分值,如果有否定詞,取反;Step4:判斷當(dāng)前的情感詞與下一個(gè)情感詞之間是否有程度副詞或否定詞,計(jì)算得分,得出每一句評(píng)論的情感值。(score 取值代表情感傾向)
2.5.1 直覺模糊數(shù)
基于直覺模糊集理論,備選商品在線評(píng)論的情感傾向可以通過直覺模糊數(shù)簡(jiǎn)單而完整的表示[13],利用直覺模糊數(shù)Yij=[pij(+),pij(-)]表示,其中pij(+)和pij(-)分別為根據(jù)商品評(píng)論數(shù)據(jù)得到的商品i 特征j 的正負(fù)向情感傾向的百分比。
pij(+)=Mij(+)/(Mij(+)+Mij(-))
pij(-)=Mij(-)/(Mij(+)+Mij(-))
2.5.2 決策推薦
使用TOPSIS 算法,獲得各備選商品與最優(yōu)方案之間的接近程度,作為評(píng)價(jià)優(yōu)劣的依據(jù)[13]。
本實(shí)驗(yàn)擬為預(yù)計(jì)購買1500-2000 范圍內(nèi)手機(jī)的消費(fèi)者進(jìn)行輔助決策,爬取了京東iphone 8p、華為榮耀x、oppor15 及魅族M3 四種手機(jī)手機(jī)評(píng)論作為本次實(shí)驗(yàn)的數(shù)據(jù),設(shè)定為用戶購買手機(jī)的四種備選方案,共爬取4 款手機(jī)數(shù)據(jù)各2000 條(共8000 條),然后對(duì)商品評(píng)論進(jìn)行數(shù)據(jù)處理,進(jìn)行數(shù)據(jù)清洗,去除無意義評(píng)論(無效評(píng)論)如“此用戶未填寫評(píng)價(jià)”、垃圾評(píng)論、符號(hào)多的評(píng)論、評(píng)論字?jǐn)?shù)小于15 字的評(píng)論,最終獲得數(shù)據(jù)集共2000 條,每個(gè)手機(jī)各500 條。
3.2.1 評(píng)論數(shù)據(jù)詞頻分析
使用TF-IDF 算法進(jìn)行詞頻分析,得到影響手機(jī)的特征因素共5 個(gè),分別是使用、價(jià)格、品牌、物流、外觀。
3.2.2 構(gòu)建情感詞典
為了計(jì)算評(píng)論的情感傾向,我們引入Boson 情感詞典,根據(jù)TF-IDF 算法結(jié)果構(gòu)建情感詞典,如表1:(舉例)
根據(jù)引入的包含情感值的Boson 情感詞典,得到Boson 詞典與各特征的情感詞詞典的交集,生成各特征情感詞的包含情感值的正負(fù)向情感詞詞典。
分別是:
質(zhì)量的正向use1,負(fù)向use2;.品牌的正向brand1,負(fù)向brand2;物流的正向logistics1,負(fù)向logistics2;.價(jià)格的正向price1,負(fù)向price2;外觀的正向appearance1,負(fù)向appearance2;
其中use、brand、logistics、price、appearance 為各特征正負(fù)向情感值總表。
3.2.3 推薦排序
使用TOPSIS 方法,對(duì)商品進(jìn)行排序。
3.2.3 .1 構(gòu)建直覺模糊決策矩陣
根據(jù)以上得到的4 種手機(jī)5 種特征的正負(fù)向情感傾向比率,得到相應(yīng)的直覺模糊決策矩陣:
[[[0.790,0.210],[0.687,0.132],[0.138,0.276],[0.318,0.012],[0.157,0.084]],
[[0.837,0.163],[0.162,0.028],[0.676,0.090],[0.275,0.148],[0.556,0.0 31]],
[[0.774,0.226],[0.234,0.132],[0.362,0.085],[0.576,0.108],[0.726,0.0 90]],
[[0.818,0.182],[0.114,0.132],[0.293,0.087],[0.437,0.054],[0.732,0.0 84]]]
3.2.3 .2 構(gòu)建加權(quán)直覺模糊決策矩陣
假定消費(fèi)者給出的各因素權(quán)重為{0.4,0.2,0.1,0.2,0.1},對(duì)矩陣進(jìn)行歸一化,根據(jù)權(quán)重得到加權(quán)規(guī)范矩陣,如表2。
表1:構(gòu)建情感詞典(示例)
表2:加權(quán)規(guī)范矩陣
本文提出了一種改進(jìn)的基于商品評(píng)論進(jìn)行消費(fèi)者推薦決策的研究方法,使用改進(jìn)的情感計(jì)算方法、TOPSIS 算法,得到基于商品評(píng)論進(jìn)行的消費(fèi)者推薦決策結(jié)果。
本文的創(chuàng)新之處在于:
(1)引入全新的包含情感值的詞典,生成各備選方案各特征的情感詞典;
(2)改進(jìn)情感計(jì)算方法計(jì)算評(píng)論數(shù)據(jù)情感傾向;
本文的研究也有一定的不足之處:
(1)對(duì)于計(jì)算得到的評(píng)論情感傾向結(jié)果(數(shù)值)利用太過簡(jiǎn)略,是否可以在此基礎(chǔ)上進(jìn)行再進(jìn)一步的研究;
(2)可擴(kuò)充數(shù)據(jù)量,使用海量數(shù)據(jù)得到更具說服力的正負(fù)理想點(diǎn),以便求解推薦結(jié)果。