張樂民 王鑫 王寧宇 柳慶新*
(1河海大學計算機與信息學院 江蘇省南京市 211100 2河海大學理學院 江蘇省南京市 211100)
在電子商務中,商家經(jīng)常使用產(chǎn)品售后評價機制,了解公眾對特定產(chǎn)品的評價。在一般的評估機制中,被稱為“星級”的個人評級使購買者能夠使用1分(低評級,低滿意度)到5分(高評級,高滿意度)來表示他們對產(chǎn)品的滿意度。此外,客戶可以提交基于文本的消息(稱為“評論”)來表達更多關于產(chǎn)品的意見和信息[2]。
顯然,這些用戶反饋會影響產(chǎn)品在其他購物者心中的印象,最終形成產(chǎn)品的聲譽[3]。本文收集了亞馬遜的上市場上三類產(chǎn)品(吹風機、微波爐、奶嘴)的用戶評級和評論數(shù)據(jù),通過識別與其他競爭產(chǎn)品相關的過去客戶評級和評論的關鍵模式、關系、指標和參數(shù),構建出特定商品在時間測度上的聲譽模型,并更改銷售策略,并識別潛在的重要設計功能,以增加產(chǎn)品吸引力。
一般來說,買方給出的評級代表著對產(chǎn)品的整體評價,但對評級具體含義的解釋因人而異,即每一個星評級的標準是不同的。但評論不同。每個人用的詞都能準確地表達情感。例如,如果人們認為一個產(chǎn)品是一般水平的,則一般會用“不差”而不是“優(yōu)秀”,也就是說,日常的交流讓我們形成了一個公認的詞義標準。此外,由于假設沒有人在撒謊,當買方不喜歡產(chǎn)品時,他不會寫一篇表達滿意的評論,因此我們給出以下前提:
前提:所有三個數(shù)據(jù)集中出現(xiàn)的形容詞評論將代表客戶的真實情緒。
沒有形容詞的評論大多是事實陳述,不能輕易判斷顧客的情緒,這里不討論。我們知道沒有數(shù)字可以直接定義評論所傳達的情感。換言之,只能通過衡量詞語的效果來間接確定本文作者所表達的情感。
本文認為,真實情感以某種不確定的方式影響評級,評級也在一定程度上反映了真實情感,真實情感可以通過評論直接表達[4]。如果知道評論是如何影響星級評級的,就可以大致衡量真實的情緒,并對給出具體的解釋。因為評級數(shù)據(jù)是確定的,所以客戶的總體評級可以通過解釋星級評級來反映。
對于評論中的形容詞,我們把它們分為兩類:褒義詞和貶義詞。我們使用Flink批處理過濾出評論中最常用的形容詞,得到的一組褒義詞A是:
由此產(chǎn)生的一組貶義詞D是:
根據(jù)這兩種情況,將客戶分為“滿意”和“不滿意”兩大情緒陣營。超過80%的評論使用了給定兩個集合里的詞,出現(xiàn)同時使用兩個集合的評論時通過閱讀確定其陣營。
兩個陣營都有自己的評分規(guī)則,對于集合中的k個詞,假設“滿意”陣營的平均評分是“不滿意”陣營的平均評分是我們有:
其中Ai和Di表示集合中第i個單詞的加權評分值。找到所有包含第i個單詞的評論(這些評論屬于同一陣營),并建立一個評論集,假設這些評論中給出的n星級評級占總評論集的百分比為Pn,Ai的計算公式(Di的計算方法相同):
到目前為止還沒有對這兩個陣營的評級進行明確的劃分。可以假定兩個陣營的理論評級分離點為并給出的定義:
由于評價范圍是固定的,評價中點的選取必然使評價范圍不均勻??梢钥闯觯壳皟纱箨嚑I的比例關系是:
希望星級評級越極端,對應的情緒越強烈,兩個陣營的情緒測量最好保持對稱關系。因此對星級進行縮放。對于的評級,更新的評級分數(shù)為:
表1:綜合評價值
表2:吹風機不同顏色的滿意情況
表3:吹風機不同內(nèi)部材料的滿意情況
結果是:1星->-1,2星->-0.65,3星->-0.15,4星->0.17,5星->1,此時,我們可以在一個標準上最大程度地測量所有客戶對產(chǎn)品的看法。
1.3.1 評論主體分析
從數(shù)據(jù)集中可以看出,每個客戶反饋包含多個參數(shù),我們將這些參數(shù)分為三個部分:
產(chǎn)品信息:產(chǎn)品類別、產(chǎn)品描述;
用戶信息:“有幫助”投票數(shù),是否為受邀評論員,是否低價購買;
評價信息:評論文本主體,星級評級。
產(chǎn)品信息是被評價的對象,用戶信息是反饋信息作者的身份,評價信息是評價的內(nèi)容主體。關于數(shù)據(jù)中的“總票數(shù)”和“有幫助票數(shù)”,我們認為總票數(shù)由兩部分組成,即被認為有幫助的票數(shù)(同意)和沒有幫助的票數(shù)(不同意):
1.3.2 產(chǎn)品類型分析
三個數(shù)據(jù)集中的產(chǎn)品信息主要是通過三個角度來描述:產(chǎn)品品牌、產(chǎn)品類型和產(chǎn)品特征。同一行業(yè)不同品牌之間可能存在相同的產(chǎn)品特征。
因此,選擇按產(chǎn)品品牌和特征對數(shù)據(jù)進行分類。經(jīng)篩選,吹風機數(shù)據(jù)中有19個品牌,13.6%的數(shù)據(jù)沒有準確的品牌信息;奶嘴數(shù)據(jù)中有13個品牌,23.6%的數(shù)據(jù)沒有品牌信息;微波爐數(shù)據(jù)中有9個品牌,8%的數(shù)據(jù)沒有品牌信息。選擇三個在每個行業(yè)反饋最多的品牌進行分析。
主要分為產(chǎn)品信譽評價和產(chǎn)品潛在成功預測兩個階段來解決。在聲譽評價中,將評論和評級融入個人情感價值觀,將各類客戶信息融入評價影響,進而對產(chǎn)品在一段時間內(nèi)的聲譽進行預測。
在潛在成功預測中,通過對產(chǎn)品在不同情況下的品牌和產(chǎn)品特征的分析,預測不同情況下的聲譽變化,預測在一定時間內(nèi)最具潛在成功的產(chǎn)品。
2.1.1 聲譽函數(shù)
假設本文所討論的聲譽價值R只受到在線顧客反饋的影響,每條顧客反饋對R的影響可以從兩個角度來分析,一個是個人視角的情感表達,另一個是對顧客群體的影響。
具體來說,一條顧客反饋信息所表達的情感只代表了對客戶的個人評價,而這種反饋信息將影響其發(fā)布后其他顧客的反應[5],人們對這種反饋的認同度越高,也越專業(yè),它對整個客戶群的影響越大,最終決定了個人評價在聲譽體系中的權重。
第i條顧客反饋的個人評價因子定義為Ei,反饋影響因子定義為Mi,如果考慮的信息集C中有Kc條信息,則特定集c的整體聲譽值Rc如下:
在此基礎上,我們討論了如何將評論文本與星級評分相結合,以反映顧客對產(chǎn)品的感知程度和情感強度。因此,這里的Ei值可以用重新分配的星級表示。我們將在以下章節(jié)中深入探討影響Mi的決定因素。
2.1.2 用戶反饋影響力函數(shù)
如前所述,第i條顧客反饋的影響因素主要由投票人對信息的態(tài)度和該信息的專業(yè)性構成。這兩個方面主要體現(xiàn)在客戶信息上。
(1)權威值。對于反饋信息i的專業(yè)性,我們使用權威的價值來描述它。權威值Ui與此反饋的作者是否是亞馬遜特邀專員直接相關,我們給出了定義:
其中,vinei代表反饋中的“vine”值。
(2)其他用戶的幫助值。關于投票者對反饋i的態(tài)度,我們用幫助值Ti來描述。它應該準確反映投票結果。具體來說, 的值范圍可以完美地表示和區(qū)分所有不同的投票情況。我們分析了這種投票機制,認為投票結果可以從兩個方面來區(qū)分:一方面是得票還是失票,即哪一方得票多,還是平手,另一方面是雙方的比例。我們給出了以下算法。
(3)評論長度值。當人們看評論時,他們通常會對較長的評論感到好奇,因此他們更容易受到長評論的影響[6]。設置長度因子Li。我們使用Flink來計算評論文本的長度,發(fā)現(xiàn)長度范圍為1到1899,我們將每個區(qū)間賦值為:
圖 1:吹風機品牌聲譽隨時間的變化
(4)購買參數(shù)。此外,我們發(fā)現(xiàn),雖然基本上亞馬遜vine會員將通過折扣購買,普通客戶將以全價購買。但仍有一些情況,如亞馬遜Vine會員以全價購買,因此我們設置購買參數(shù)Bi,并認為以全價購買的客戶會更認真地寫評論:
(5)主成分分析[7]。對三類產(chǎn)品的反饋信息進行集中處理,計算出四個因素的相關值。首先,對所考慮的四個因素進行標準化,以獲得標準化指數(shù)和標準化指數(shù)向量(xj)。
其中rqq=1,rqj是第q個指數(shù)和第j個指數(shù)之間的相關系數(shù),k是反饋的數(shù)量。這是三類產(chǎn)品的總反饋,共27500條。
然后你可以得到特征值和特征向量。我們選擇前三個主要組成部分,并基于三個向量的權重,綜合評價值可計算得結果如表1所示。
反饋影響因素函數(shù)現(xiàn)在可以通過四個因素的計算得出:
如果想知道在當前時間段一個產(chǎn)品是否為未來的潛在成功產(chǎn)品,應該總結出最近時間段內(nèi)該產(chǎn)品表現(xiàn)出的“潛在成功因素”。本節(jié)中,將產(chǎn)品品牌和產(chǎn)品特征知名度作為一個組合來預測潛在的成功性。
3.2.1 商品受歡迎特性的提取
對于一個行業(yè)來說,沒有大規(guī)模技術的改進,其生產(chǎn)的產(chǎn)品特性不會發(fā)生重大變化,在長期的市場運作中,特定的產(chǎn)品特性往往會占據(jù)市場份額和用戶群。以吹風機的專業(yè)特點為例,大部分具有專業(yè)性能的吹風機都是由理發(fā)師等專業(yè)人士購買的。
本文認為,流行的產(chǎn)品特性并不意味著具有此類特性的產(chǎn)品銷售最多,但具有此類特性的產(chǎn)品在特定客戶群中具有較高的聲譽,因此也更成功。
通過以上分析可知,在判斷有一定特征的產(chǎn)品潛在成功性時,不需要在時間維度上分析產(chǎn)品的特性,所以我們考慮整個數(shù)據(jù)集,篩選出不同特性的產(chǎn)品進行受歡迎度分析。
為了將客戶的相關評價和評論結合起來,我們將具有一定特征的產(chǎn)品的受歡迎程度定義為“滿意”陣營中的評論數(shù)與集合中的總評論數(shù)之比,即:
其中Kri表示在方面r中第i件產(chǎn)品特性的“滿意”評價的數(shù)量。篇幅受限,這里僅給出吹風機的特性分析結果。吹風機的特點考慮到顏色、內(nèi)置材料。
從表2和表3可以看出,黑色、非電離客戶群最大。但就受歡迎度而言,這三個方面里,粉色、非電離有著更高的受歡迎程度。但其實,紫色和粉紅色的受歡迎程度差別不大。
3.2.2 品牌的受歡迎值
與產(chǎn)品特性不同,產(chǎn)品的品牌知名度會隨著時間的推移而變化。這個性質(zhì)很容易理解。各品牌的市場份額并不是一成不變的。廣告投資、產(chǎn)品研發(fā)、品牌效應都會影響品牌的聲譽。根據(jù)聲譽評價模型,我們可以顯示出三四大品牌吹風機、奶嘴和微波爐的聲譽變化。
從圖1中可以看出,同一品牌在不同階段的聲譽價值與其他品牌不同,因此在一段時間內(nèi)有熱門品牌。我們假設吹風機的目標品牌是b。對于時間間隔T,有:
其中bi為第i個品牌在T時間段內(nèi)的好評率,可按(15)計算。
假設客戶反饋信息的數(shù)量大致代表產(chǎn)品銷售,那么很容易知道每種類型的功能所占的用戶組的比例。本文認為,在市場需求不變的情況下,簡單地購買具有一定特點的產(chǎn)品是不明智的。如果你想在倉庫里更好地銷售產(chǎn)品,就應該保持每一個特點的數(shù)量,合理調(diào)整產(chǎn)品的品牌比例結構,才能制定出最佳的銷售策略。
以吹風機為例。從2016年到2017年,時間間隔T=1年的數(shù)據(jù)集中,Conair品牌是四個吹風品牌受歡迎程度最高的??梢缘贸鼋Y論,這段時間Conair品牌中具有“粉色/紫色、陶瓷/非陶瓷和非離子材料”特點的產(chǎn)品最受歡迎。因此在2018年,商場老板可以考慮擴大具這個品牌中具有一定特性的商品的進貨量。
利用文本的形容詞處理方法提取了關于評論本身的元信息,并將用戶情緒劃分為兩大陣營。將星級評定轉化為星級評定,使星級評定的標準統(tǒng)一。在分析產(chǎn)品的潛在成功因素時,通過比較不同產(chǎn)品類型和不同屬性的兩個層次,有效地篩選出有可能成功的產(chǎn)品。
在判斷評論的情緒時,由于不能處理一般句子的確切意思,刪除了沒有形容詞的評論,但這種情況通常表示對產(chǎn)品的不滿。因此,不同詞匯的統(tǒng)計數(shù)據(jù)可能存在一定的誤差。微波爐產(chǎn)品統(tǒng)計數(shù)據(jù)過少也可能影響統(tǒng)計結果。