高學(xué)東, 王 艾
(北京科技大學(xué) 東凌經(jīng)濟管理學(xué)院,北京100083)
網(wǎng)絡(luò)輿情作為新媒體環(huán)境下網(wǎng)絡(luò)用戶對于特定社會現(xiàn)象所持有的不同觀點、態(tài)度、情緒和行為傾向的總和,隨著社交網(wǎng)絡(luò)用戶數(shù)量的激增而呈現(xiàn)出內(nèi)容自由度高、傳播速度快、覆蓋范圍廣等特征,并在我國經(jīng)濟社會的生產(chǎn)、生活中扮演著日益重要的角色[1,2]。
網(wǎng)絡(luò)輿情監(jiān)測問題一直是政府相關(guān)管理部門和企業(yè)相關(guān)組織機構(gòu)的研究熱點之一[3]。政府監(jiān)測網(wǎng)絡(luò)輿情的目的是對網(wǎng)絡(luò)輿情進行引導(dǎo)或干預(yù),避免負面網(wǎng)絡(luò)輿情的病毒式傳播[4,5];而企業(yè)監(jiān)測網(wǎng)絡(luò)輿情的目的是在激烈的市場競爭中快速獲取競爭情報、擴大企業(yè)優(yōu)勢[6]。
現(xiàn)有企業(yè)網(wǎng)絡(luò)輿情的研究工作主要集中于輿情的預(yù)警機制設(shè)計、傳播過程識別、危機應(yīng)對策略分析等問題[7~9],而關(guān)于企業(yè)如何利用網(wǎng)絡(luò)輿情來豐富原有客戶關(guān)系管理內(nèi)涵、并從而提升企業(yè)競爭優(yōu)勢的研究較少。
本研究針對網(wǎng)絡(luò)輿情環(huán)境下的企業(yè)客戶關(guān)系管理問題,利用文本挖掘技術(shù)和聚類方法,實現(xiàn)基于企業(yè)網(wǎng)絡(luò)輿情的客戶滿意度預(yù)測,并根據(jù)預(yù)測結(jié)果為企業(yè)銷售戰(zhàn)略的制定提供決策支持。
在網(wǎng)絡(luò)輿情環(huán)境中,存在三個關(guān)鍵實體,即企業(yè)客戶、網(wǎng)絡(luò)用戶和企業(yè)網(wǎng)絡(luò)輿情[10]。企業(yè)客戶是指在現(xiàn)實社會中,購買或體驗過企業(yè)提供的產(chǎn)品(或服務(wù))的真實消費者。因而,企業(yè)與客戶確立了以產(chǎn)品為中心的銷售關(guān)系。
網(wǎng)絡(luò)輿情的熱點話題深入到經(jīng)濟社會生產(chǎn)、生活的方方面面,例如國內(nèi)外政治經(jīng)濟局勢、社會突發(fā)事件、文化娛樂生活等[11]。企業(yè)網(wǎng)絡(luò)輿情特指以企業(yè)或企業(yè)所經(jīng)營的具體業(yè)務(wù)為話題的網(wǎng)絡(luò)輿情,如產(chǎn)品網(wǎng)絡(luò)輿情等,它能夠直接影響企業(yè)的生產(chǎn)經(jīng)營效益。所以,企業(yè)可以通過獲取與其主營業(yè)務(wù)相關(guān)的網(wǎng)絡(luò)輿情,來改善經(jīng)營現(xiàn)狀,特別是拓展與客戶互動的渠道。
社交網(wǎng)絡(luò)平臺由于其自身使用便捷、信息傳播速度快等優(yōu)勢,是企業(yè)網(wǎng)絡(luò)輿情傳播的重要渠道,如微博、微信朋友圈、QQ空間等[12]。網(wǎng)絡(luò)用戶作為社交網(wǎng)絡(luò)世界的締造者和參與者,其活躍度對企業(yè)網(wǎng)絡(luò)輿情的傳播產(chǎn)生重要影響。
(1)企業(yè)客戶與網(wǎng)絡(luò)用戶間的關(guān)系
DONG[13]在研究移動社交網(wǎng)絡(luò)用戶對聯(lián)系人產(chǎn)品推薦信息反應(yīng)意象的影響因素中,明確了企業(yè)客戶與網(wǎng)絡(luò)用戶的關(guān)系。實證研究表明,網(wǎng)絡(luò)用戶一旦建立對企業(yè)產(chǎn)品或服務(wù)的購買意愿,就轉(zhuǎn)化為企業(yè)客戶,且聯(lián)系人產(chǎn)品推薦模式對網(wǎng)絡(luò)用戶轉(zhuǎn)化為企業(yè)客戶起到較大的促進作用。而企業(yè)客戶一旦在社交網(wǎng)絡(luò)平臺上發(fā)布或瀏覽信息,就直接成為網(wǎng)絡(luò)用戶。所以,社交網(wǎng)絡(luò)平臺的發(fā)展使得企業(yè)客戶向網(wǎng)絡(luò)用戶的轉(zhuǎn)化速率快速提升,甚至對于銷售手機等同類電子產(chǎn)品的企業(yè),客戶就是網(wǎng)絡(luò)用戶。
因此,企業(yè)客戶與網(wǎng)絡(luò)用戶具有雙向可達聯(lián)系,并且隨著網(wǎng)絡(luò)基礎(chǔ)設(shè)施的普及、社交網(wǎng)絡(luò)平臺的完善,聯(lián)系將會向緊密化、穩(wěn)固化發(fā)展。
(2)網(wǎng)絡(luò)用戶與企業(yè)網(wǎng)絡(luò)輿情的關(guān)系
LI et al.[14]研究了面向輿情主題的微博用戶行為,明確了網(wǎng)絡(luò)用戶與企業(yè)網(wǎng)絡(luò)輿情的關(guān)系。實驗結(jié)果表明,信息傳播中的網(wǎng)絡(luò)用戶存在三種類型,即一般關(guān)注型、主動參與型、以及信息傳播型用戶。其中,主動參與型用戶以自身為中心,向周圍聯(lián)系人主動散播輿情信息,且用戶行為特征對輿情主題敏感。而信息傳播型用戶在企業(yè)網(wǎng)絡(luò)輿情傳播過程中活躍度最高,是重要輿情信息轉(zhuǎn)發(fā)、創(chuàng)造者,甚至是輿情領(lǐng)袖。所以,主動參與型和信息傳播型網(wǎng)絡(luò)用戶均可以通過在社交網(wǎng)絡(luò)平臺上對企業(yè)產(chǎn)品進行評論、意見反饋來營造企業(yè)網(wǎng)絡(luò)輿情。同時,企業(yè)網(wǎng)絡(luò)輿情又可以通過社交網(wǎng)絡(luò)平臺傳播并影響所有類型用戶。
因此,主動參與型和信息傳播型用戶與企業(yè)網(wǎng)絡(luò)輿情具有雙向可達關(guān)系。
綜上,大量企業(yè)客戶已經(jīng)將其對于企業(yè)產(chǎn)品的意見主動反饋到了社交網(wǎng)絡(luò)平臺上,甚至參與了該產(chǎn)品網(wǎng)絡(luò)輿情的構(gòu)建及傳播。這無形中開發(fā)出一條由客戶推動的意見反饋渠道,為企業(yè)獲取產(chǎn)品情報、實踐客戶關(guān)系管理提供了新模式。
(3)網(wǎng)絡(luò)用戶-企業(yè)網(wǎng)絡(luò)輿情關(guān)系的穩(wěn)定性
GAO[15]在研究網(wǎng)絡(luò)輿情形成機理及信息受眾觀點測度中,進一步明確了網(wǎng)絡(luò)用戶與企業(yè)網(wǎng)絡(luò)輿情的關(guān)系。依據(jù)網(wǎng)絡(luò)輿情場理論,將網(wǎng)絡(luò)輿情場內(nèi)信息受眾觀點測度分解為三個維度,即個體維度、群體維度、以及整體維度。個體維度觀測范圍為場域內(nèi)每一位網(wǎng)絡(luò)用戶,在實踐過程中面臨信息失真、個體行為滯后等問題。群體維度觀測范圍為具有信息交互的同質(zhì)網(wǎng)絡(luò)用戶個體群落(類),網(wǎng)絡(luò)用戶類往往處于明晰場域中,并具有一定的魯棒性。整體維度觀測范圍為全部網(wǎng)絡(luò)用戶,測度的目的由網(wǎng)絡(luò)用戶本身轉(zhuǎn)向網(wǎng)絡(luò)輿情場的極性與強度。因此,由于網(wǎng)絡(luò)用戶群體行為具有魯棒性特征,只有主觀參與型和信息傳播型網(wǎng)絡(luò)用戶類到達企業(yè)網(wǎng)絡(luò)輿情的單向聯(lián)系具有穩(wěn)定性。
所以,本研究僅考察主觀參與型和信息傳播型網(wǎng)絡(luò)用戶(簡稱網(wǎng)絡(luò)用戶)類至企業(yè)網(wǎng)絡(luò)輿情的單向聯(lián)系。并且針對具有清晰話題的企業(yè)網(wǎng)絡(luò)輿情,網(wǎng)絡(luò)用戶與企業(yè)客戶在群體行為上具有等效性。
客戶滿意度作為反映企業(yè)競爭力的重要因素,企業(yè)會根據(jù)自身所處行業(yè)、以及經(jīng)營的產(chǎn)品或服務(wù)的特征,識別客戶滿意度的影響因素,從而構(gòu)建符合企業(yè)實際的客戶滿意度評價指標體系[16]。進而,依據(jù)評價指標體系得到客戶滿意度的定量化結(jié)果后,通常采用主觀設(shè)定閾值的方式,將客戶滿意度劃分為3~7個不同的等級,例如不滿意、一般、滿意等[17]。
現(xiàn)有客戶滿意度指標體系數(shù)據(jù)來源往往還是依靠對企業(yè)客戶展開抽樣滿意度調(diào)查的方法,例如借助客戶投訴系統(tǒng)、客戶滿意度調(diào)查問卷等,在現(xiàn)實環(huán)境中人為設(shè)置數(shù)據(jù)采集點[18]。企業(yè)不僅需要承擔(dān)較高的調(diào)研和數(shù)據(jù)統(tǒng)計分析成本,也無法準確掌握開展客戶滿意度分析工作的時機。
然而,由于社交網(wǎng)絡(luò)平臺的出現(xiàn),企業(yè)客戶已經(jīng)將涵蓋滿意度信息的文本評論發(fā)布到了網(wǎng)絡(luò)環(huán)境中,即客戶推動式意見反饋渠道,企業(yè)可以直接獲取相關(guān)評論數(shù)據(jù),并通過文本挖掘的方式得到最終的客戶滿意度。
不同于具有清晰空格分隔的英文句法結(jié)構(gòu),中文文本因其自身復(fù)雜性,往往需要參考中文情感詞典或中文情感預(yù)料庫來實現(xiàn)文本情感極性分類[19,22]。現(xiàn)有研究中,中文文本情感分析方法日趨成熟,除文本數(shù)據(jù)外,社交網(wǎng)絡(luò)評論中常見的表情符號也是研究熱點之一,已有大量研究探索利用表情符號提升情感分類效果[20,21]。
相較于現(xiàn)實環(huán)境,網(wǎng)絡(luò)環(huán)境具有更高的開放度、包容度,用戶可以更加自由地在網(wǎng)絡(luò)平臺上進行信息交流、意見表達。所以,網(wǎng)絡(luò)評論文本除了能夠反映用戶對某一具體產(chǎn)品、服務(wù)的意見、滿意程度之外,還會流露更多個性化信息,如近期關(guān)注熱點、興趣愛好等,可以為企業(yè)制定銷售戰(zhàn)略提供具有較高參考價值的有利信息。
針對網(wǎng)絡(luò)輿情環(huán)境下的企業(yè)客戶關(guān)系管理問題,現(xiàn)有研究的不足主要表現(xiàn)為沒有將企業(yè)產(chǎn)品(或服務(wù))的真實消費者與社交網(wǎng)絡(luò)用戶之間建立關(guān)聯(lián),忽略了企業(yè)客戶自發(fā)建立的意見反饋網(wǎng)絡(luò)渠道,因而無法真正發(fā)揮企業(yè)網(wǎng)絡(luò)輿情在客戶關(guān)系管理中的價值。
歷史研究成果對本研究的理論支撐主要體現(xiàn)在:①在具有清晰主題的企業(yè)網(wǎng)絡(luò)輿情約束下,企業(yè)客戶與網(wǎng)絡(luò)用戶在群體行為上等效;②對于與企業(yè)產(chǎn)品或服務(wù)相關(guān)的文本評論內(nèi)容,情感分析結(jié)果能夠得到網(wǎng)絡(luò)用戶滿意度;③文本評論內(nèi)容中蘊含大量企業(yè)銷售戰(zhàn)略制定過程中期望參考的個性化信息。
傳統(tǒng)企業(yè)運營過程中,企業(yè)通過生產(chǎn)經(jīng)營產(chǎn)品并銷往客戶,形成了經(jīng)典的“企業(yè)-客戶”產(chǎn)銷業(yè)務(wù)渠道。隨著社交網(wǎng)絡(luò)平臺的快速發(fā)展,網(wǎng)絡(luò)用戶在平臺上主動對企業(yè)提供的產(chǎn)品進行評論、意見反饋,進而產(chǎn)生以產(chǎn)品為話題的網(wǎng)絡(luò)輿情。多數(shù)企業(yè)已經(jīng)意識到網(wǎng)絡(luò)輿情的價值,并設(shè)立輿情監(jiān)測部門或崗位,通過監(jiān)測、獲取企業(yè)網(wǎng)絡(luò)輿情,嘗試挖掘競爭情報、擴大企業(yè)優(yōu)勢,這同時也建立了“網(wǎng)絡(luò)用戶-企業(yè)”信息傳播渠道。此時,產(chǎn)銷業(yè)務(wù)渠道與信息傳播渠道表現(xiàn)為以企業(yè)為核心的單向串行結(jié)構(gòu)。
然而,本研究通過第1.1節(jié)分析結(jié)果,發(fā)現(xiàn)企業(yè)客戶與網(wǎng)絡(luò)用戶在企業(yè)網(wǎng)絡(luò)輿情和群體測度兩個約束條件下,能夠形成行為等價關(guān)系,由此提出企業(yè)客戶推動式信息反饋模型(圖1)。企業(yè)客戶與網(wǎng)絡(luò)用戶的等價關(guān)系一旦建立,網(wǎng)絡(luò)用戶關(guān)于企業(yè)產(chǎn)品的態(tài)度、情緒、意見就等效于客戶的態(tài)度、情緒、意見,只是通過文本評論的方式表達出來??梢?,該模型呈現(xiàn)為一個具有穩(wěn)定性的閉環(huán)結(jié)構(gòu)。
依據(jù)企業(yè)客戶推動式信息反饋模型,企業(yè)若想獲取反映企業(yè)競爭力的客戶滿意度情報,除了傳統(tǒng)方式進行客戶滿意度實地調(diào)查外,又增添了新的渠道,即相關(guān)文本評論的情感分析。
所以,本研究的主要任務(wù)是建立企業(yè)網(wǎng)絡(luò)輿情約束和群體測度約束的求解方法,以利用網(wǎng)絡(luò)用戶與企業(yè)用戶的等價關(guān)系來實現(xiàn)客戶滿意度預(yù)測。
圖1 企業(yè)客戶推動式信息反饋模型
分析企業(yè)客戶推動式信息反饋模型發(fā)現(xiàn),網(wǎng)絡(luò)用戶與企業(yè)和客戶均具有可達關(guān)系。
企業(yè)網(wǎng)絡(luò)輿情約束對網(wǎng)絡(luò)用戶的具體要求為:①網(wǎng)絡(luò)用戶必須真實參與了企業(yè)網(wǎng)絡(luò)輿情的傳播過程;②網(wǎng)絡(luò)用戶的觀點、態(tài)度具有準確性,即與輿情內(nèi)容相符合。群體測度約束對網(wǎng)絡(luò)用戶的具體要求為:①以網(wǎng)絡(luò)用戶群體(類)為研究對象;②網(wǎng)絡(luò)用戶群體(類)應(yīng)具有明顯特征,以便實現(xiàn)銷售決策支持。
根據(jù)上述要求,確立本研究的技術(shù)路線(圖2)。首先,構(gòu)建網(wǎng)絡(luò)用戶輿情敏感性指數(shù)來實現(xiàn)輿情檢驗工作,從而得到初始網(wǎng)絡(luò)用戶。其次,提出變尺度聚類算法,通過廣度尺度變換,完成關(guān)鍵網(wǎng)絡(luò)用戶識別;通過深度尺度變換,完成用戶—客戶關(guān)系建立。最后,針對不同客戶群體(類)的客戶滿意度預(yù)測結(jié)果匹配最佳銷售戰(zhàn)略,并結(jié)合客戶群體的特征制定銷售戰(zhàn)術(shù)。(具體研究方法見第3節(jié))
圖2 研究框架
“尺”是所有可能用于觀測對象的角度、“度”是對象在尺上的所有可能取值,“尺度”共同構(gòu)成了丈量事物的客觀準則。尺度是人的一種先驗知識,與其被用于觀測的對象無關(guān)。只有當(dāng)尺度被用于衡量具體對象后,才會形成包含對象、屬性的數(shù)據(jù)結(jié)構(gòu),并實現(xiàn)數(shù)據(jù)存儲。
“尺度變換”是為滿足某種對于特定對象的觀測需求,如獲取對象特征,通過調(diào)整、選取合適的尺度來得到期望數(shù)據(jù)的過程。這種觀測需求既可能是初始明確的,也可能是初始模糊而在尺度變換過程中逐漸清晰的。尺度變換則與被觀測對象有著緊密關(guān)聯(lián),主觀人為尺度變換也正是人類智能的重要體現(xiàn)。
傳統(tǒng)聚類算法是在單一尺度上的挖掘過程,即在一次完整的聚類任務(wù)中,初始數(shù)據(jù)集不發(fā)生任何變化[24]。尺度本身就體現(xiàn)類結(jié)果的特征。由于初始數(shù)據(jù)的尺度并不一定是最佳觀測尺度,且同一組尺度應(yīng)用于不同數(shù)據(jù)集的結(jié)果表現(xiàn)往往不同,所以傳統(tǒng)聚類算法在實踐應(yīng)用中經(jīng)常會出現(xiàn)只有少部分類的特征較為明顯的問題,并隨著數(shù)據(jù)量增大而問題加劇。
在問題求解理論中,尺度通常是以概念的形式存在于人的知識體系中[25]。由于概念間本身具有聯(lián)系,本研究將概念(尺度)間的擴展聯(lián)系引入聚類分析方法中,提出概念空間模型(圖3)。
圖3 概念空間
概念空間由概念鏈和值空間兩部分構(gòu)成,概念空間的層次結(jié)構(gòu)具有特征:①低層級概念偏序于高層級概念,即CHi?CH(i+1)(i∈N);②每一個概念都可決定同層級的值空間取值;即Vij∈CHi(j∈N+);③同層級的值空間取值遵循該概念鏈的偏序關(guān)系,即CHi?CHk→(j∈N+)。
依據(jù)概念空間模型,尺度變換分為兩個類型:①深度尺度變換,以概念鏈中的概念為觀測尺(屬性)、以此概念所對應(yīng)的同層值空間取值為觀測度。深度尺度變換過程中,觀測度隨觀測尺的層級變化而變化,也被視為同步尺度變換模式;②廣度尺度變換,以值空間中的取值為觀測尺(屬性),以對象與觀測尺的范數(shù)關(guān)系為觀測度。廣度尺度變換過程中,不同觀測尺可以處于不同的層級,也被視為異步尺度變換模式。
依據(jù)粗糙集理論中的決策表結(jié)構(gòu)[26],定義深度、廣度尺度變換的多尺度數(shù)據(jù)集。
定義1(多尺度數(shù)據(jù)集)對于任一數(shù)據(jù)集D=DO=(U,AO,VO,f O),多尺度數(shù)據(jù)集DS=(U,AT,VT,f T),其中,U是DO和DS的共同論域,AO是D的原始屬性(原始尺度),AT是D的目標尺度,且AO?AT,AT={t|(a∈A0)∧(t=CH(a))}。對于深度多尺度數(shù)據(jù)集,CH(a)是屬性a的概念鏈中任一概念;對于廣度多尺度數(shù)據(jù)集,CH(a)是屬性a的值空間中任一取值。
由于概念空間的離散特征,深度多尺度數(shù)據(jù)集較為常見且屬性均為分類屬性。而廣度尺度變換數(shù)據(jù)集較為特殊,文本挖掘中的詞袋模型就是一種廣度多尺度數(shù)據(jù)集,本研究中僅考慮所有的屬性均為二值屬性的廣度多尺度數(shù)據(jù)集。
定義1表明,尺度變換就是針對某一數(shù)據(jù)集D,依據(jù)概念空間中屬性的偏序關(guān)系,將原始尺度AO轉(zhuǎn)化為目標尺度AT的過程。
定義2(尺度變換率) 尺度變換率用于度量尺度變換所引起的數(shù)據(jù)分布變化:
其中,U/AO={,…,},U/AT={,…,}。
傳統(tǒng)聚類結(jié)果有效性評價指標[27]均是從聚類結(jié)果的整體出發(fā),得到所有類表現(xiàn)的一個綜合評價值,并不適用于關(guān)注個體類表現(xiàn)的變尺度聚類算法。
定義3(粒度偏差)令CI代表一個含有n個對象、m個屬性的類(xij∈CI),a是CI中的一個屬性,粒度偏差為:
其中,對于由分類屬性構(gòu)成的深度多尺度數(shù)據(jù)集,x Ij為類CI在每個屬性中的眾數(shù);對于由二值屬性構(gòu)成的廣度多尺度數(shù)據(jù)集,只有全0屬性時x Ij=0,其他情況x Ij=1。如果xij=x Ij,δ(xij,x Ij)=0,否則δ(xij,x Ij)=1。G(U/a)是商U/a的知識粒度。
粒度偏差GrD(CI)度量了類CI的離散程度,GrD(CI)取值的減小代表類內(nèi)對象xij間相似度的提升。給定某一觀測尺度上的閾值R0,只有當(dāng)GrD(CI)≤R0,表明類CI滿足質(zhì)量要求、結(jié)果可接受。
本研究假設(shè)每一次變尺度聚類過程只實現(xiàn)單一屬性的尺度變換。
依據(jù)假設(shè),深度尺度變換是將一個原始觀測尺轉(zhuǎn)化為一個目標觀測尺,而廣度尺度變換是將多個原始觀測尺轉(zhuǎn)化為一個目標觀測尺。
雖然深度與廣度尺度變換在多尺度數(shù)據(jù)集和粒度偏差評價度量上存在差異,但其尺度變換本質(zhì)相同。由此,提出面向廣度和深度尺度變換的變尺度聚類算法:
輸入:多尺度數(shù)據(jù)集D,概念空間CS,尺度變換率閾值S0,初始聚類參數(shù)k;
輸出:滿意類Cj及其尺度Aj。
Step 1對于初始數(shù)據(jù)集D,應(yīng)用聚類參數(shù)k進行初始聚類。
Step 2主觀判定出滿意類Ci,將Ci及其尺度Ai輸出,同時在數(shù)據(jù)集D中刪除Ci中包含的所有對象。
Step 3計算Step 2中所有滿意類的粒度偏差GrD(Ci),并將最大粒度偏差作為閾值R0。
Step 4選取屬性Aj進行尺度變換,若尺度轉(zhuǎn)化率STR(Aj,CH(Aj))<S0成立,則更新多尺度數(shù)據(jù)集D,用CH(Aj)替代Aj。
Step 5更新閾值R0,計算上一次聚類結(jié)果中最小未滿意類Cj在新尺度CH(Aj)的粒度偏差,取GrD(Cj)與R0的較大值。
Step 6對于當(dāng)前數(shù)據(jù)集D,應(yīng)用參數(shù)k與上一次輸出的滿意類個數(shù)的差值進行聚類。
Step 7計算所有類的粒度偏差,小于R0的類作為滿意類,連同當(dāng)前尺度一起輸出,并在數(shù)據(jù)集D刪除輸出類的所有對象。
Step 8重復(fù)Step 4,直到數(shù)據(jù)集D為空。
變尺度聚類算法的時間復(fù)雜度為O(nmkt),其中n為對象個數(shù),m為屬性個數(shù),k是類個數(shù),t是迭代次數(shù)。
本實驗?zāi)康脑谟谕暾故酒髽I(yè)利用網(wǎng)絡(luò)輿情來獲取客戶滿意度情報,從而提升客戶關(guān)系管理水平的全過程。同時,驗證變尺度聚類算法在處理高維度、稀疏、大量數(shù)據(jù)時的準確性和運算效率。實驗設(shè)計見圖4。
本實驗共包含5個實驗環(huán)節(jié),即數(shù)據(jù)采集及預(yù)處理、網(wǎng)絡(luò)用戶群體識別、網(wǎng)絡(luò)用戶輿情敏感性評價、企業(yè)客戶滿意度預(yù)測、以及企業(yè)銷售戰(zhàn)略戰(zhàn)術(shù)制定;7種數(shù)據(jù)分析方法和技術(shù),即網(wǎng)絡(luò)爬蟲、文本分詞、情感分析、輿情監(jiān)測、廣度尺度變換聚類算法、輿情敏感性指數(shù)、深度尺度變換聚類算法;以及2個目標數(shù)據(jù)輸出結(jié)果,即企業(yè)客戶分類結(jié)果、以及銷售戰(zhàn)略和戰(zhàn)術(shù)。
由于數(shù)據(jù)采集及預(yù)處理并不是本研究的重點,所以直接采用成熟的方法和軟件實現(xiàn)(本文第4.2節(jié)詳述)。
網(wǎng)絡(luò)用戶群體識別和網(wǎng)絡(luò)用戶輿情敏感性評價,分別用戶實現(xiàn)企業(yè)客戶推動式信息反饋模型(圖1)中的群體測度約束、以及企業(yè)網(wǎng)絡(luò)輿情約束。
網(wǎng)絡(luò)用戶輿情敏感性評價的基本思想為將企業(yè)網(wǎng)絡(luò)輿情的關(guān)鍵詞熱度排序轉(zhuǎn)化為詞語權(quán)重,結(jié)合網(wǎng)絡(luò)用戶文本分詞結(jié)果中的詞頻數(shù),計算每個用戶的輿情表現(xiàn)得分,從而判斷網(wǎng)絡(luò)用戶的輿情敏感度。由此,定義網(wǎng)絡(luò)用戶輿情敏感度指數(shù):
其中,tfik為網(wǎng)絡(luò)用戶xi的文本內(nèi)容中出現(xiàn)第k個詞語的頻數(shù),Hk為第k個詞語在某特定網(wǎng)絡(luò)輿情環(huán)境的權(quán)重,可以通過熱度數(shù)值標準化來求得。
圖4 實驗設(shè)計
(1)數(shù)據(jù)采集
本實驗選取7天內(nèi)新浪微博上所有個人認證用戶發(fā)布的關(guān)于“iPhone X”的原創(chuàng)微博作為數(shù)據(jù)源,利用Python中的網(wǎng)絡(luò)爬蟲框架Scrapy,總共采集到4350條符合表1中數(shù)據(jù)采集要求的文本數(shù)據(jù)。
企業(yè)客戶數(shù)據(jù)來源于一個電子產(chǎn)品銷售公司營業(yè)部(含手機),隨機抽取625條真實客戶數(shù)據(jù)作為分析樣本,其數(shù)據(jù)結(jié)構(gòu)能夠匹配表1中企業(yè)客戶滿意度預(yù)測環(huán)節(jié)的網(wǎng)絡(luò)用戶數(shù)據(jù)結(jié)構(gòu)。
圖5 輿情關(guān)鍵詞及熱度
此外,利用公開網(wǎng)絡(luò)輿情監(jiān)測軟件,得到了“iPhone X”在表1研究時段的網(wǎng)絡(luò)輿情關(guān)鍵詞及熱度排序(圖5)。
(2)數(shù)據(jù)預(yù)處理
數(shù)據(jù)清洗是通過限定原創(chuàng)微博的最低點贊數(shù)、評論數(shù)、轉(zhuǎn)發(fā)數(shù)來去除掉信息價值較低微博,如手機營銷廣告、手機功能介紹等。本研究中,設(shè)定最低點贊數(shù)為12、評論數(shù)為8、轉(zhuǎn)發(fā)數(shù)為6(三者滿足其一即可),最終保留微博580條。
用戶過濾是通過微博影響力指數(shù)[28]來為研究時段內(nèi)發(fā)布多條原創(chuàng)微博的用戶擇一代表。原創(chuàng)微博影響力指數(shù)為點贊數(shù)、評論數(shù)、轉(zhuǎn)發(fā)數(shù)、新鮮度(發(fā)布時長)的綜合表現(xiàn)。最終,得到了300條原創(chuàng)微博,分別對應(yīng)了300個不同的網(wǎng)絡(luò)用戶。
情感分析是將每條微博(網(wǎng)絡(luò)用戶)的情感強度劃分為與目標客戶滿意度相一致的等級分布,如“滿意、一般、不滿意”。本情感分析工作得到積極情感類(滿意)網(wǎng)絡(luò)用戶160個、中立類(一般)網(wǎng)絡(luò)用戶69個、消極情感類網(wǎng)絡(luò)用戶(不滿意)71個。
文本分詞是將各類用戶的微博內(nèi)容進行細粒度切分,并構(gòu)建詞袋模型。最終,得到滿意類用戶研究時段內(nèi)的熱點關(guān)注原始詞1404個、一般類用戶研究時段內(nèi)的熱點關(guān)注原始詞719個、不滿意類用戶研究時段內(nèi)的熱點關(guān)注原始詞515個。
表1 網(wǎng)絡(luò)用戶數(shù)據(jù)采集要求
至此,完成全部數(shù)據(jù)預(yù)處理工作,結(jié)果見表2。
表2 數(shù)據(jù)預(yù)處理結(jié)果
網(wǎng)絡(luò)用戶群體識別是利用廣度尺度變換聚類算法,對網(wǎng)絡(luò)用戶進行群體劃分,即得到具有明顯特征的網(wǎng)絡(luò)用戶類(圖6)。
圖6中,每一個矩形色塊代表一個用戶類,矩形在類坐標橫軸上的寬度代表該類中的用戶數(shù)量,矩形在尺度縱軸上的長度代表用于觀測該類的觀測尺個數(shù)。矩形對應(yīng)粒度偏差橫軸上的數(shù)值代表該類在當(dāng)前尺度下的粒度偏差。
可見,廣度尺度聚類變換是在保證結(jié)果有效性的前提下的一個觀測尺逐漸遞減的過程。網(wǎng)絡(luò)用戶群體識別環(huán)節(jié)一共得到了7個滿意用戶類、6個一般用戶類和2個不滿意用戶類。
圖6(a) 滿意類網(wǎng)絡(luò)用戶聚類結(jié)果
網(wǎng)絡(luò)用戶輿情敏感性評價是通過計算網(wǎng)絡(luò)用戶輿情敏感性指數(shù),在每一個網(wǎng)絡(luò)用戶類中篩選出真正參與企業(yè)網(wǎng)絡(luò)輿情傳播過程的關(guān)鍵網(wǎng)絡(luò)用戶。
圖6中,具有加粗邊框的色塊代表該類中含有一個通過輿情檢驗的用戶。網(wǎng)絡(luò)用戶輿情敏感性評價最終得到6個關(guān)鍵滿意用戶、1個關(guān)鍵一般用戶和2個關(guān)鍵不滿意用戶。
企業(yè)客戶滿意度預(yù)測正式將這些關(guān)鍵網(wǎng)絡(luò)用戶與企業(yè)客戶進行深度尺度變換聚類,建立網(wǎng)絡(luò)用戶與企業(yè)客戶的相似關(guān)系,從而能夠?qū)⒕W(wǎng)絡(luò)用戶的情感分類及尺度特征賦值給屬于同一類的企業(yè)客戶,實現(xiàn)客戶滿意度預(yù)測。
圖6(b) 一般類網(wǎng)絡(luò)用戶聚類結(jié)果
圖6(c) 不滿意類網(wǎng)絡(luò)用戶聚類結(jié)果
表3 企業(yè)銷售決策支持
因此,企業(yè)可以根據(jù)表3中3種不同的企業(yè)客戶滿意度等級,匹配不同的銷售戰(zhàn)略。然后,在每一種銷售戰(zhàn)略下,結(jié)合每一個企業(yè)客戶類的具體特征,制定更具有針對性的銷售戰(zhàn)術(shù),從而提升企業(yè)的客戶關(guān)系管理水平。
隨著社交網(wǎng)絡(luò)平臺的迅速發(fā)展,網(wǎng)絡(luò)輿情在我國經(jīng)濟社會的生產(chǎn)、生活中扮演著日益重要的角色,企業(yè)更是期望通過挖掘網(wǎng)絡(luò)輿情來獲取有價值的信息情報,使其在激烈的市場競爭中擴大企業(yè)優(yōu)勢。由此,本文針對網(wǎng)絡(luò)輿情環(huán)境下的企業(yè)客戶關(guān)系管理問題展開深入研究,通過識別企業(yè)客戶、網(wǎng)絡(luò)用戶、企業(yè)網(wǎng)絡(luò)輿情間的關(guān)系,梳理出一條廣泛存在與網(wǎng)絡(luò)社交平臺上的、由企業(yè)客戶推動的意見反饋渠道,為企業(yè)提供了一種成本更低、效率更高的獲取客戶滿意度的方法。
本研究最后通過數(shù)據(jù)實驗,從數(shù)據(jù)采集與預(yù)處理、網(wǎng)絡(luò)用戶群體識別、網(wǎng)絡(luò)用戶輿情敏感性評價、企業(yè)客戶滿意度預(yù)測、以及企業(yè)銷售戰(zhàn)略戰(zhàn)術(shù)制定這五個環(huán)節(jié),完整展示了企業(yè)如何利用網(wǎng)絡(luò)輿情實現(xiàn)客戶滿意度等級分類,并依據(jù)變尺度聚類結(jié)果實現(xiàn)銷售決策支持。
本研究的理論價值主要體現(xiàn)在:
(1)構(gòu)建企業(yè)客戶推動式信息反饋模型。該模型表明,在企業(yè)網(wǎng)絡(luò)輿情和群體測度的約束下,網(wǎng)絡(luò)用戶與企業(yè)客戶具有等價關(guān)系,為深入研究網(wǎng)絡(luò)輿情的運作機理提供理論基礎(chǔ)。
(2)提出變尺度聚類算法。該算法將尺度變換理論引入聚類研究中,將傳統(tǒng)聚類方法的求解過程由單一尺度分析擴展到多尺度分析,克服了實際數(shù)據(jù)聚類應(yīng)用過程中的聚類結(jié)果特征不顯著問題,具有較高的實際應(yīng)用價值。
(1)企業(yè)可以利用文本挖掘技術(shù),通過獲取與其主營業(yè)務(wù)相關(guān)網(wǎng)絡(luò)輿情,預(yù)測當(dāng)前客戶的滿意度,減少傳統(tǒng)求取客戶滿意度時的實地調(diào)研成本。
(2)企業(yè)可以通過檢測網(wǎng)絡(luò)輿情的變化情況,依據(jù)輿情本身的傳播學(xué)特征,確立開展客戶滿意度預(yù)測工作的最佳時點,并判斷現(xiàn)有客戶滿意度結(jié)果的有效性,而非完全依賴于領(lǐng)導(dǎo)的主觀經(jīng)驗判斷。
(3)企業(yè)可以利用變尺度聚類技術(shù),在客戶劃分的過程中,保證對聚類結(jié)果質(zhì)量要求的同時,獲取到與當(dāng)前類最匹配的尺度特征,利用尺度為銷售策略制定提供決策支持。