王召義,薛晨杰,劉玉林
安徽商貿(mào)職業(yè)技術(shù)學(xué)院經(jīng)濟(jì)貿(mào)易系,安徽蕪湖,241002
痛點營銷是互聯(lián)網(wǎng)界非常熱的一個營銷術(shù)語?;ヂ?lián)網(wǎng)企業(yè)和借助互聯(lián)網(wǎng)的傳統(tǒng)企業(yè)都期盼找準(zhǔn)痛點,采取相應(yīng)的策略,給企業(yè)帶來巨大的市場回報或者高度的品牌黏度。所謂找痛點就是在發(fā)現(xiàn)消費(fèi)者需求的基礎(chǔ)上,滿足需求,以獲得青睞。要了解消費(fèi)者的需求,就要先了解消費(fèi)者,因為購物的主體是他們。找用戶痛點是一個長期觀察、分析、挖掘的過程,不可能一蹴而就?;诖耍瑸榱藥椭髽I(yè)準(zhǔn)確、便捷的發(fā)現(xiàn)痛點、應(yīng)用痛點,本文嘗試從用戶評論中挖掘有關(guān)因素,并借助情感分析方法,提出用戶痛點量化模型。
在營銷學(xué)中,用戶痛點是指用戶在體驗產(chǎn)品或服務(wù)過程中原本的期望沒有得到滿足而造成的心理落差或不滿,這種不滿最終在用戶心智模式中形成負(fù)面情緒爆發(fā),讓用戶感覺到痛[1]。這是目前被眾多學(xué)者所接受的概念描述之一,但不斷有研究者在此基礎(chǔ)上對用戶痛點的概念進(jìn)行補(bǔ)充和拓展。盧蒙從用戶體驗角度出發(fā),把用戶在體驗過程中遇到的問題稱為痛點,即消費(fèi)者在使用產(chǎn)品或享受服務(wù)過程中因期望沒有得到滿足而造成的心理落差或不滿[2]。張亮以供需矛盾為切入點,強(qiáng)調(diào)用戶痛點就是用戶多樣化的需求,呼喚個性化、精確化的服務(wù),傳統(tǒng)紙媒,難以滿足這樣的要求[3]。高星妍等認(rèn)為痛點指的是用戶使用后就無法跳脫的、極具黏性的點,比如微信的朋友圈,相對而言,痛點可能更偏重功能性需求一些[4]。
借鑒美國的行為科學(xué)家弗雷德里克·赫茨伯格(Fredrick Herzberg)提出來的雙因素激勵理論[5],把用戶痛點歸納兩個方面:保健痛點和激勵痛點。保健痛點(Hygiene Customer Pain Points,HP)是指用戶的期望沒有得到滿足而造成的不滿或心理落差的痛點,表現(xiàn)為令用戶感到失望、抱怨,從而出現(xiàn)給予差評、投訴等行為,此刻,用戶的情緒是消極的、負(fù)面的,是隨著失望、抱怨程度增加而反向加強(qiáng)的。激勵痛點(Motivation Customer Pain Points,MP)是指已經(jīng)被產(chǎn)品或服務(wù)化解或弱化的痛點又或者是為了獲得滿足感而承受的痛點,表現(xiàn)為令用戶感到驚奇、愉快和滿足,從而出現(xiàn)網(wǎng)絡(luò)曬單、好評、炫耀等行為,此刻,用戶情緒是積極的、正面的,是隨著滿足程度增加而正向加強(qiáng)的。
情緒是用戶把痛點充分表達(dá)出來的最簡單有效的手段。用戶表達(dá)情緒的方式有語言、行為、文字等。但在電子商務(wù)活動中,用戶大多是通過文字表達(dá)情緒的,例如淘寶的累計評價模塊、京東商城的商品評價模塊等。評價內(nèi)容往往包含了用戶滿意點和不滿意點,例如“衣服收到了,試穿了尺碼很合適,衣服面料手感也好,穿著舒適,下水后不縮水就掉點浮色,長度在長點就更好了”,其中尺碼、面料和不縮水是用戶滿意點,令用戶感到舒心、消費(fèi)體驗佳,即激勵痛點;掉色和長度就是不滿意點,沒有滿足用戶的期望,即保健痛點。這就給本文提供了解決問題的思路:通過分析用戶商品評論,判斷用戶情感傾向并量化痛點,情感強(qiáng)度越強(qiáng)烈,痛點值就越大,痛點值越大,越可能是商品關(guān)鍵點。
由前文分析得知,解決問題的思路是以情感分析為基礎(chǔ),所以構(gòu)建用戶痛點量化模型,應(yīng)從用戶情感傾向判斷入手,再結(jié)合情感詞典計算情感值。研究過程的關(guān)鍵處理環(huán)節(jié)有:數(shù)據(jù)采集、數(shù)據(jù)處理、指標(biāo)提取、情感分析和量化分析等。
使用數(shù)據(jù)采集軟件或Python爬蟲程序,選擇電子商務(wù)平臺的商品評論模塊,抓取目標(biāo)商品的商品評論。采集的評論數(shù)據(jù)至少包括:商品名稱、評價內(nèi)容等。
對采集到的數(shù)據(jù)進(jìn)行清洗,刪除無效語句。采用Python的結(jié)巴分詞,對評價內(nèi)容進(jìn)行分詞、詞性標(biāo)注、詞頻統(tǒng)計等預(yù)處理,為后續(xù)研究提供基礎(chǔ)。
用戶對某項特征指標(biāo)的關(guān)注表現(xiàn)為其在評論中對該產(chǎn)品某些功能或特征的提及或評價,某項特征指標(biāo)在評論中出現(xiàn)的次數(shù)越多,其成為用戶關(guān)注點可能性越大[6]。考慮到有一些常見的關(guān)鍵詞頻繁出現(xiàn),但卻無任何意義,擬采用TF-IDF自動提取關(guān)鍵詞。然后,人工篩選這些關(guān)鍵詞,并結(jié)合詞性歸納出若干個指標(biāo)。每個指標(biāo)都包含多個關(guān)鍵詞。
本文借鑒劉玉林、王召義等設(shè)計的一種新的情感分析方法[7],具體步驟如下:
步驟1:構(gòu)建情感詞典,情感詞典包括正面情感詞語集合、負(fù)面情感詞語集合、否定詞集合和程度詞集合。情感詞典主要由基礎(chǔ)情感詞典和拓展情感詞典構(gòu)成。基礎(chǔ)情感詞典包括知網(wǎng)(Hownet)情感詞典和臺灣大學(xué)簡體中文情感極性詞典(NTSUSD)。把知網(wǎng)(Hownet)里面的正面評價詞語、正面情感詞語和ntusd的positive詞典消重之后組合在一起,成為基礎(chǔ)積極情感詞典。把知網(wǎng)的負(fù)面評價詞語、負(fù)面情感詞語和ntusd的negative詞典消重之后組合在一起,成為基礎(chǔ)消極情感詞典。而拓展情感詞典其實就是把基礎(chǔ)情感詞典通過同義詞詞典(哈工大同義詞詞林拓展版)找到情感詞的同義詞,這樣就拓展了基礎(chǔ)情感詞典。最后把兩個詞典與常見的否定詞集、程度詞集結(jié)合起來,形成了完整的情感詞典。
步驟2:對評論文本進(jìn)行預(yù)處理,對文本分段分句得到句子,通過標(biāo)點符號將句子劃分為句子單元,然后對句子單元中的文字進(jìn)行分詞,形成詞組。
步驟3:對步驟2中得到的詞組進(jìn)行n-gram處理,利用n-gram中的2元語法對句子單元中的詞組組合形成2元詞組,結(jié)合情感詞典計算句子單元的情感基本值p。
步驟3.1:2元語法對句子單元中的詞組進(jìn)行組合,形成2元詞組,處以前面位置的稱為前位詞,處以后面位置的稱為后位詞。
步驟3.2:后位詞結(jié)合情感詞典中正面情感詞語集合和負(fù)面情感詞語集合進(jìn)行情感值p的計算判斷;前位詞結(jié)合否定詞集合判斷情感值p是否*(-1),前位詞結(jié)合程度詞集合判斷情感值p是否*(-1);結(jié)果對于每個2元詞組均獲得一個情感值pi。
步驟3.3:將整個句子單元中2元詞組的情感值pi相加匯總后得到句子單元的基本值p。
步驟4:評論文本被切分為句子,句子又被切分為句子單元,故每個商品評論根據(jù)每個句子單元的情感基本值p,生成一個情感值p列表即p-list。
步驟5:根據(jù)p-list,找出對應(yīng)關(guān)鍵詞所在單元句的情感值。
(1)構(gòu)建指標(biāo)詞集合
對用戶評論進(jìn)行指標(biāo)提取操作,構(gòu)建指標(biāo)詞集合K。
kij表示第i個指標(biāo)的第j個關(guān)鍵詞。
(2)構(gòu)建TF-IDF集合
針對每一個指標(biāo)詞,計算其TF-IDF值,即該詞在全文中的權(quán)重,得到TF-IDF集合W。
wij表示第i個指標(biāo)的第j個關(guān)鍵詞的TF-IDF值。
(3)計算情感值
計算每一個指標(biāo)詞所在單元句的情感值。情感值有三種情況:正數(shù)、負(fù)數(shù)和0,負(fù)數(shù)表示消極,0表示中性,正數(shù)表示積極。
設(shè)每個指標(biāo)詞,會出現(xiàn)在h個單元句內(nèi),就有h個情感值。則指標(biāo)詞K所在單元句的情感值集合S,sh表示指標(biāo)詞K在第h個單元句的情感值。
S集合有這樣兩個子集:正數(shù)集合Splus、負(fù)數(shù)集合Sminus。
其中a+b≤h。
分別取Splus和Sminus的算術(shù)平均值作為指標(biāo)詞最終情感值,計算公式如下:
(4)量化痛點
根據(jù)前文所述,指標(biāo)詞的痛點(P)包括兩個方面:已滿足痛點(SP)和未滿足痛點(UP)。
公式中出現(xiàn)的負(fù)號,是為了保證痛點值為正數(shù)。
照此計算每一個指標(biāo)詞的痛點值,得到痛點集合C。
cij表示第i個指標(biāo)的第j個關(guān)鍵詞的痛點值。
第i個指標(biāo)的痛點值為:
根據(jù)公式易知:用戶情感反應(yīng)越強(qiáng)烈,用戶痛點越高;痛點越高,該指標(biāo)越有可能成為商品的關(guān)鍵點。
京東是中國電子商務(wù)領(lǐng)域深受消費(fèi)者歡迎和具有影響力的電子商務(wù)網(wǎng)站之一,選擇京東的手機(jī)類商品的商品評價為實證研究的數(shù)據(jù)來源。同時,考慮到手機(jī)品牌影響力、手機(jī)發(fā)行時間、手機(jī)銷量以及商品評論數(shù)量等因素,選取華為手機(jī)(京東商品名稱:華為HUAWEIP10 Plus6 GB+64 GB草木綠移動聯(lián)通電信4 G手機(jī)雙卡雙待)、小米手機(jī)(京東商品名稱:小米8全面屏游戲智能手機(jī)6 GB+128 GB黑色全網(wǎng)通4 G雙卡雙待)、OPPO手機(jī)(京東商品名稱:OPPO A57 3 GB+32 GB內(nèi)存版 玫瑰金色 全網(wǎng)通4 G手機(jī) 雙卡雙待)作為研究對象,采集商品評論數(shù)據(jù)。數(shù)據(jù)采集時間為2018年6月27日,采集華為、小米、OPPO手機(jī)評論數(shù)分別為:1 120、1 000、1 499條,內(nèi)容包括會員名稱、會員級別、評價星級、評價內(nèi)容、評價時間等11項。
原始商品評論數(shù)據(jù)中存在著不完整、有異常的數(shù)據(jù),嚴(yán)重影響到數(shù)據(jù)挖掘建模的執(zhí)行效率,可能會導(dǎo)致挖掘結(jié)果的偏差。因此,借助python的“結(jié)巴”中文分詞包對商品評論內(nèi)容進(jìn)行過濾、分詞、詞性標(biāo)注和詞頻統(tǒng)計,并計算每一個關(guān)鍵詞的TF-IDF值。再從名詞、感嘆詞、形容詞中篩選出具有情感傾向的詞語,構(gòu)建華為、小米、OPPO手機(jī)產(chǎn)品情感詞集合。情感詞典包括正面情感詞語集合、負(fù)面情感詞語集合、否定詞集合和程度詞集合[8]。
分別選擇TF-IDF值排名前1 000的關(guān)鍵詞,在數(shù)據(jù)處理的基礎(chǔ)上,分別篩選出名詞和動詞。人工對這些名詞和動詞進(jìn)行篩選,排除非描述手機(jī)功能或特征的詞語,得到一個描述手機(jī)功能或特征的關(guān)鍵詞集合。人工再對這些關(guān)鍵詞進(jìn)行識別歸類,最后得到5個指標(biāo)類別:價格、性能、電池、外觀、拍照。具體歸類情況見表1、表2、表3。
表1 華為手機(jī)特征指標(biāo)分類表
表2 小米手機(jī)特征指標(biāo)分類表
表3 OPPO手機(jī)特征指標(biāo)分類表
采用2.4情感分析方法,計算商品評論單元句的情感值。按照2.5中的量化公式,計算3款手機(jī)5個指標(biāo)類的痛點量化值,詳見表4。
表4 3款手機(jī)的痛點值
從表4分析每款手機(jī)各指標(biāo)類之間的聯(lián)系與區(qū)別,再橫向比較各款手機(jī)之間的聯(lián)系與區(qū)別。
(1)華為手機(jī)(P10 Plus)。價格指標(biāo)類痛點值最大(0.055 7),其它四類痛點值均比較小,說明價格是華為手機(jī)的關(guān)鍵點。再看價格指標(biāo)類的HP(0.157 3)和 MP(0.232 9)值,激勵痛點值較大,表明大部分價格痛點被弱化或化解,痛點已轉(zhuǎn)化為驚奇、愉悅等積極態(tài)度。但是,保健痛點依然大量存在,會強(qiáng)化消費(fèi)者的消極態(tài)度,出現(xiàn)差評、投訴等行為,痛點會更痛。
(2)小米手機(jī)(小米8)。價格指標(biāo)類痛點值最大(0.117 9),遠(yuǎn)大于其它四類值,且 HP值為0.311 1,MP值為0.160 3。表明雖然價格是其銷售關(guān)鍵點,但因保健痛點值占主要方面,故大部分價格痛點沒有被弱化或化解,即用戶認(rèn)為價格太高,不符合消費(fèi)需求。另外,華為手機(jī)與小米手機(jī)雖然都把價格作為銷售關(guān)鍵點,但兩者有本質(zhì)上的區(qū)別,華為價格被認(rèn)可,而小米手機(jī)價格認(rèn)可度不高。
(3)OPPO手機(jī)(OPPO A57)。拍照指標(biāo)類痛點值最大(0.079 0),且保健痛點值(0.267 1)和激勵痛點值(0.286 1)基本相當(dāng),說明OPPO手機(jī)吸引用戶的關(guān)鍵點是拍照,但做的還不夠好,還有很大的發(fā)展空間。
(4)橫向比較。通過圖1的雷達(dá)圖,可以直觀的看到:價格指標(biāo)類和性能指標(biāo)類中,小米手機(jī)最“痛”,且“遠(yuǎn)”大于其它手機(jī),這與小米的產(chǎn)品概念“為發(fā)燒而生”相吻合的;在電池指標(biāo)類中,三種手機(jī)“痛”的程度差不多,再一次證明了“手機(jī)技術(shù)發(fā)展的再快,電池始終是軟肋”;外觀指標(biāo)類中,小米手機(jī)和OPPO手機(jī)最“痛”,這兩款手機(jī)的外觀設(shè)計更符合年輕人的“高顏值”需求;在拍照指標(biāo)類中,OPPO手機(jī)最“痛”,OPPO手機(jī)更適合喜歡拍照的消費(fèi)者。
圖1 痛點雷達(dá)圖
為了驗證痛點量化值的大小能否體現(xiàn)商品的關(guān)鍵點,以當(dāng)前最受歡迎的拍照指標(biāo)類為例進(jìn)行有效性驗證。表5是摘抄3款手機(jī)拍照指標(biāo)類的宣傳廣告語以及品牌理念。
從以上宣傳資料就可以發(fā)現(xiàn)OPPO把拍照功能作為一個核心賣點來宣傳的,且秉承“為自拍和顏值而生”的理念,專注于手機(jī)拍照領(lǐng)域的技術(shù)創(chuàng)新,開創(chuàng)了手機(jī)自拍美顏時代,而年輕人最喜歡的手機(jī)就是拍照手機(jī),恰恰OPPO最擅長做拍照手機(jī),迎合了青年消費(fèi)者喜好,特別是女性消費(fèi)者;小米同樣把拍照功能作為一個非常重要的賣點來宣傳,以此吸引年輕消費(fèi)者,但強(qiáng)調(diào)的是“發(fā)燒”即價格低、性能高;華為在宣傳賣點時,僅有一句話“后置雙攝像頭,萊卡前置鏡頭”,略顯單薄,再看攝像頭的像素,都比小米、OPPO低很多。這與計算出來的拍照指標(biāo)類痛點值大小排序相一致。其它方面也可以采用此類方法進(jìn)行有效性驗證,不再贅述。
表5 手機(jī)廣告語
綜上所述,以情感分析為基礎(chǔ),構(gòu)建的痛點量化模型,識別出了華為、小米、OPPO的產(chǎn)品關(guān)鍵點,并計算出保健痛點和激勵痛點,得到的結(jié)果與實際情況相吻合。
找準(zhǔn)用戶痛點可以幫助企業(yè)改良產(chǎn)品提供決策依據(jù),也為制定更完善的營銷策略提供了支持。本文在已有的用戶痛點理論基礎(chǔ)上,提出用戶痛點應(yīng)包括保健痛點和激勵痛點兩個方面的內(nèi)容,并以情感分析為基礎(chǔ),構(gòu)建用戶痛點量化模型。為驗證模型的有效性,以京東的3款手機(jī)產(chǎn)品的商品評論數(shù)據(jù)為數(shù)據(jù)源,分別計算機(jī)出各款手機(jī)指標(biāo)類的痛點值,并進(jìn)行了有效性驗證,結(jié)果表明該模型具有一定的實用性和有效性。但是研究過程仍然存在一些不足:一是商品評論負(fù)面信息量少,正面信息量多,對實驗結(jié)果有何影響,需要進(jìn)一步論證;二是僅用手機(jī)商品進(jìn)行了模型驗證,有待進(jìn)一步驗證其它類型產(chǎn)品,以進(jìn)一步確定模型的適用性和效果。