李睿穎 柳炳祥 萬義成
摘要:客戶投訴是客戶對(duì)企業(yè)管理和服務(wù)不滿的表達(dá)方式,是企業(yè)最有價(jià)值的信息來源,因此,如何分析處理客戶投訴的數(shù)據(jù),掌握投訴客戶的基本特征,進(jìn)而把客戶的不滿轉(zhuǎn)化客戶滿意,鎖定他們對(duì)企業(yè)和產(chǎn)品的忠誠(chéng),贏得客戶的信任,是企業(yè)核心競(jìng)爭(zhēng)優(yōu)勢(shì)所在。論文將K-means算法應(yīng)用于移動(dòng)客戶的聚類分析中,針對(duì)某企業(yè)某段時(shí)間的移動(dòng)通信投訴數(shù)據(jù)進(jìn)行聚類分析,目的是根據(jù)移動(dòng)公司投訴數(shù)據(jù)進(jìn)行聚類,找到對(duì)每個(gè)類別客戶應(yīng)該采取的營(yíng)銷策略,以提升公司對(duì)客戶的價(jià)值,改善客戶關(guān)系管理工作。實(shí)驗(yàn)結(jié)果驗(yàn)證了方法的可行性和有效性,為移動(dòng)客戶聚類分析提供了一種分析的方法。
關(guān)鍵詞:K-means算法 移動(dòng)客戶 聚類分析
中圖分類號(hào):TP309 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2016)08-0157-02
1 引言
客戶投訴是每一個(gè)企業(yè)不可避免遇到的問題,它是客戶對(duì)企業(yè)管理和服務(wù)不滿的表達(dá)方式,也是企業(yè)有價(jià)值的信息來源,它為企業(yè)創(chuàng)造了許多機(jī)會(huì)。因此,如何利用處理客戶投訴的時(shí)機(jī)而贏得客戶的信任,把客戶的不滿轉(zhuǎn)化客戶滿意,鎖定他們對(duì)企業(yè)和產(chǎn)品的忠誠(chéng),獲得競(jìng)爭(zhēng)優(yōu)勢(shì),已成為企業(yè)營(yíng)銷實(shí)踐的重要內(nèi)容之一。論文將K-means算法應(yīng)用于移動(dòng)客戶的聚類分析中,目的是根據(jù)移動(dòng)通信公司投訴數(shù)據(jù)進(jìn)行聚類,找到對(duì)每個(gè)類別客戶應(yīng)該采取的營(yíng)銷策略。
2 K-Means算法
K-Means算法,也稱為K-平均算法,是最常用普遍的基于劃分的聚類方法,是根據(jù)數(shù)據(jù)樣本中的屬性值之間的相似度來對(duì)數(shù)據(jù)樣本進(jìn)行區(qū)分。它把最終分類的個(gè)數(shù)k隨機(jī)地選取k個(gè)初始的聚類中心而且不斷地迭代,直到取得目標(biāo)函數(shù)的最小值或無法取得更進(jìn)一步的優(yōu)化,則生成最后的模型,即為聚類的最終結(jié)果。在K-means算法中,每一個(gè)簇當(dāng)中都有一個(gè)中心,即為“質(zhì)心”,k個(gè)簇同樣就會(huì)有k個(gè)質(zhì)心。任何一個(gè)樣本被劃到哪個(gè)簇中,就看它和哪個(gè)質(zhì)心的“相似度”最大。K-means算法當(dāng)中,權(quán)衡相似度的標(biāo)準(zhǔn)就是“距離”。一個(gè)數(shù)據(jù)樣本為什么劃分到這個(gè)簇,就是看這個(gè)樣本是這個(gè)簇的質(zhì)心的距離是最小,則是由樣本的每一個(gè)屬性的取值來共同參與決定。
K-Means算法的流程首先是選擇k個(gè)簇的質(zhì)心,由用戶選定樣本中的簇的數(shù)量k,然后生成k個(gè)質(zhì)心;其次是計(jì)算每一個(gè)樣本與k個(gè)質(zhì)心的距離,把他歸納到距離最短的類別去;第三,計(jì)算出新的聚類質(zhì)心,由于在指派樣本的過程中,一個(gè)簇的某些樣本可能會(huì)被劃分到另一個(gè)簇,同時(shí)也可能其他的簇中的樣本轉(zhuǎn)移到這個(gè)簇中,則需要重新確定新的質(zhì)心;最后,制定算法停止規(guī)則,輸出最終結(jié)果。其中停止規(guī)則分為最大迭代次數(shù)和差異容忍度兩種,最大迭代次數(shù)是指算法將不斷重復(fù)“計(jì)算每一個(gè)樣本與k個(gè)質(zhì)心的距離---計(jì)算出一個(gè)新的聚類質(zhì)心”,直達(dá)到“最大迭代次數(shù)”。當(dāng)?shù)竭_(dá)了極限后,算法停止計(jì)算,產(chǎn)生新的簇。差異容忍度是在每一次迭代介紹后,計(jì)算出每個(gè)簇計(jì)算前后質(zhì)心的距離差,小于預(yù)先設(shè)定的差異容忍度,則算法停止,否則繼續(xù)迭代。
3 K-Means算法在移動(dòng)客戶投訴數(shù)據(jù)聚類分析中的應(yīng)用
3.1 實(shí)驗(yàn)數(shù)據(jù)集
實(shí)驗(yàn)數(shù)據(jù)集包含2711個(gè)樣本,有6個(gè)屬性(投訴內(nèi)容,故障行政區(qū),使用網(wǎng)絡(luò)類型,責(zé)任原因,終端描述,客戶品牌)組成,如表1所示。其中投訴內(nèi)容A1-A9分別代表wifi問題、短信問題、寬帶問題、國(guó)際漫游問題、手機(jī)上網(wǎng)問題、通話質(zhì)量問題、網(wǎng)絡(luò)設(shè)備故障、網(wǎng)絡(luò)數(shù)據(jù)問題、信號(hào)問題。故障區(qū)B1-B20分別代表寶山區(qū)、崇明區(qū)、奉賢區(qū)、虹口區(qū)、黃浦區(qū)、嘉定區(qū)、金山區(qū)、靜安區(qū)、長(zhǎng)寧區(qū)、閔行區(qū)、浦東新區(qū)、普陀區(qū)、青浦區(qū)、松江區(qū)、徐匯區(qū)、楊浦區(qū)、閘北區(qū)、其他區(qū)域、外省、國(guó)外。使用網(wǎng)絡(luò)類型C1代表2G網(wǎng)絡(luò),C2代表3G網(wǎng)絡(luò)。責(zé)任原因D1代表客戶問題,D2代表網(wǎng)絡(luò)部門。終端描述E1-E15分別代表HTC、IPHONE、OPPO、步步高、華為、酷派、聯(lián)想、中興、小米、諾基亞、三星、索尼、其他。
客戶品牌F1代表全球通,F(xiàn)2代表全球通VIP,F(xiàn)3代表動(dòng)感地帶,F(xiàn)4代表神州行。
3.2 實(shí)驗(yàn)過程
選取移動(dòng)通信公司投訴數(shù)據(jù)excel表格導(dǎo)入SPPS-Modeler軟件當(dāng)中,首先選擇“源”下方“excel”確保數(shù)據(jù)導(dǎo)入軟件當(dāng)中,其次選擇“字段選項(xiàng)”下方“類型”確定模型的類型,最后選擇“建?!毕路奖姸嗄P椭械摹癒-means”算法,完整的數(shù)據(jù)流如圖1所示。
在實(shí)驗(yàn)過程中,選擇模型使用分區(qū)數(shù)據(jù)時(shí),確定選擇聚類為幾類,選取K-Means模型節(jié)點(diǎn),分別選取k均值為2,3,4,5,6等多個(gè)參數(shù)進(jìn)行實(shí)驗(yàn)分析,經(jīng)過一系列k均值比較,比較得出選取k均值為5,即聚為5類;選用專家模式,選取最大迭代數(shù)10,其余參數(shù)均為默認(rèn),聚類結(jié)果如圖2所示。
從圖2中看出,聚類-1占訓(xùn)練集樣本62.6%,聚類-2占6.0%,聚類-3占2.3%,聚類-4占11.0%,聚類-5占18.1%。最大聚類(聚類-1)與最小聚類(聚類-2)的比例為1:26.95。
3.3 實(shí)驗(yàn)結(jié)果分析
通過實(shí)驗(yàn)結(jié)果可知,聚類1中,投訴內(nèi)容大致為信號(hào)問題、短信問題、通話質(zhì)量差,通常這個(gè)投訴點(diǎn)發(fā)生在2G網(wǎng)絡(luò)使用情況下,公司旗下每個(gè)品牌都有這些投訴現(xiàn)象。聚類2中,投訴點(diǎn)主要集中“神州行”用戶對(duì)短信接收問題,以及對(duì)短信計(jì)費(fèi)問題。聚類3中,投訴點(diǎn)在信號(hào)以及wifi問題。這類的wifi問題指在無線熱點(diǎn)沒法連接或者信號(hào)微弱,以及無法登錄。聚類4中,在“神州行”品牌客戶中,2G的網(wǎng)絡(luò)手機(jī)網(wǎng)絡(luò)數(shù)據(jù)會(huì)出現(xiàn)問題,建議所有的使用2G網(wǎng)絡(luò)的客戶,可以到移動(dòng)營(yíng)業(yè)廳或者網(wǎng)上營(yíng)業(yè)廳進(jìn)行網(wǎng)絡(luò)免費(fèi)手機(jī),免費(fèi)換3G卡的業(yè)務(wù),并且資費(fèi)不變。聚類5中,責(zé)任原因歸屬在網(wǎng)絡(luò)部門自己。移動(dòng)客戶投訴所用的問題中,責(zé)任都出現(xiàn)在網(wǎng)絡(luò)部門沒有經(jīng)常性的維護(hù)和發(fā)現(xiàn)問題。加強(qiáng)內(nèi)部管理,加大檢修力度,將信號(hào)問題有效的解決掉,這樣客戶的滿意度才會(huì)增長(zhǎng)。
4 結(jié)語
通過移動(dòng)通信公司投訴數(shù)據(jù)聚類分析的實(shí)驗(yàn)表明,K-Means算法表現(xiàn)出相對(duì)良好的聚類性能。經(jīng)過k取值的不同進(jìn)行不斷的比較,大大提高了聚類的優(yōu)越性,從而實(shí)現(xiàn)良好的聚類性能。利用K-Means算法對(duì)移動(dòng)通信公司投訴數(shù)據(jù)進(jìn)行聚類,找到對(duì)每個(gè)類別客戶應(yīng)該采取的營(yíng)銷策略,提升客戶價(jià)值,改善客戶關(guān)系管理工作。
參考文獻(xiàn)
[1]劉堯坤.顧客投訴管理與處理技巧[M].廣州:廣東經(jīng)濟(jì)出版社,2005.
[2]徐遠(yuǎn)純,盛昭瀚.一種基于決策樹算法的客戶流失分析方法[J].計(jì)算機(jī)與現(xiàn)代化,2004 (8).
[3]趙小寧,李鳳霞.因子分析法和聚類分析法在網(wǎng)上銀行客戶滿意度研究中的應(yīng)用[J].時(shí)代金融,2015(3).
[4]蔣斌.數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的運(yùn)用[J].云南大學(xué)學(xué)報(bào)(自然科學(xué)版),2006 (12).