胡長青, 黃研利, 吳潔, 朱珂, 張利鵬
(1. 國網(wǎng)陜西省電力公司, 西安 710048; 2. 北京國網(wǎng)信通埃森哲信息技術(shù)有限公司, 北京 100032)
電力體制改革深入推進(jìn),配售電業(yè)務(wù)縱深推進(jìn),電力市場營銷管理工作己經(jīng)成為電網(wǎng)公司的中心工作,直接影響其經(jīng)濟(jì)和社會效益。價值客戶作為供電企業(yè)最重要的載體,滿足不同客戶的差異化需求,是電力企業(yè)營銷工作的中心。電網(wǎng)公司根據(jù)當(dāng)前形勢,逐步開展價值客戶分類管理工作[1-3],然而對理論研究與實踐相對匱乏,因此在客戶行為和價值分類等研究方面,仍然不夠深入,造成一部分差異化營銷策略維度單一、實施困難,客戶管理工作并不理想。
隨著電力市場日益完善,客戶的需求也會隨之改變,電網(wǎng)公司應(yīng)時刻關(guān)注客戶需求變化,采取及時、有效的細(xì)分對策。數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,國內(nèi)外出現(xiàn)了應(yīng)用數(shù)據(jù)挖掘分析客戶行為,以此實現(xiàn)價值客戶細(xì)分的方法研究[4-6]。劉芝怡[7]等人依托基于K-means改進(jìn)算法的RFAT模型,對客戶進(jìn)行了聚類分析,并提出差異化營銷策略,充分反映了客戶的當(dāng)前價值和增值潛能。王荇[8]等人基于中小批發(fā)企業(yè),設(shè)計了客戶價值與客戶關(guān)系質(zhì)量的客戶細(xì)分模型,模型使數(shù)據(jù)在不完備的情況下,仍能夠?qū)崿F(xiàn)客戶的有效細(xì)分。郭崇慧[9]等人基于CRISP-DM模型提出了一種YKFM模型,該模型適用于4S店的客戶細(xì)分,有助于企業(yè)在進(jìn)行市場調(diào)研及制定不同分市場的營銷戰(zhàn)略時能夠以盡量小的營銷費用獲得更大的利潤。韓明華[10]將主成分分析(PCA)、BP神經(jīng)網(wǎng)絡(luò)(BPNN)算法加一結(jié)合,構(gòu)建了一種基于消費者行為分析的零售業(yè)客戶細(xì)分模型,基于零售業(yè)客戶消費行為的實際數(shù)據(jù),應(yīng)用Matlab驗證了模型的實用性。
本文將定性與定量分析相結(jié)合,基于完善的指標(biāo)體系和改進(jìn)的分類算法,構(gòu)建動態(tài)的價值客戶細(xì)分模型,根據(jù)不同客戶需求和行為特點進(jìn)行分群,以此提出差異化營銷策略,提升供電公司市場競爭力。
(1)細(xì)分維度單一。從用于對客戶進(jìn)行分類的技術(shù)來看,有定性和定量客戶分類兩種方法。但是,定性方法受限于管理者的主觀因素,缺乏對客戶的全面了解,對于客戶的劃分很粗糙,定量方法不考慮客戶的靜態(tài)屬性,細(xì)分結(jié)果解釋性往往較差。隨著更豐富和更復(fù)雜數(shù)據(jù)的產(chǎn)生,只有采用數(shù)據(jù)挖掘手段,才能更好地貼近人類思維,使其便于理解,并使分類更科學(xué)和標(biāo)準(zhǔn)化。
(2)行為細(xì)分缺失??蛻粜袨榈募?xì)分是一切營銷活動的前提,依托龐大客戶行為數(shù)據(jù)的客戶行為細(xì)分早已是西方發(fā)達(dá)國家炙手可熱的應(yīng)用范疇。因此,從電力客戶行為出發(fā)細(xì)分電力客戶,對于更好的認(rèn)識客戶,增強(qiáng)企業(yè)營銷服務(wù)和營銷管理能力都具有重要意義。
(3)細(xì)分實用性差。目前,電力客戶細(xì)分結(jié)果可操作性較差,體現(xiàn)在兩個方面。首先,客戶細(xì)分脫離市場,無法滿足現(xiàn)代電網(wǎng)公司營銷活動的需求;其次,客戶細(xì)分結(jié)果模糊不清,無法全面指導(dǎo)電網(wǎng)公司的市場營銷活動。傳統(tǒng)的電力行業(yè)細(xì)分方法已經(jīng)不能滿足現(xiàn)在電力行業(yè)客戶管理和客戶營銷工作的需要,現(xiàn)在的客戶價值分析法還不成熟,可操作性較差,不能反應(yīng)電力客戶的經(jīng)濟(jì)行為,實際的操作意義不大。
本文的電力客戶在分類前的結(jié)果都是未知的,即并不知道分到了哪一類別,所以我們需要對無標(biāo)記的訓(xùn)練樣本進(jìn)行學(xué)習(xí),揭示數(shù)據(jù)的內(nèi)在性質(zhì)及規(guī)律,我們將這種學(xué)習(xí)稱為無監(jiān)督學(xué)習(xí)。無監(jiān)督學(xué)習(xí)的訓(xùn)練樣本為{x(1),x(2),…,x(m)}形式,僅包含有特征量?;陟刂捣椒ê椭鞒煞址治龅姆椒?,確定影響分類結(jié)果因素,并使用無監(jiān)督的改進(jìn)K-means算法對客戶數(shù)據(jù)進(jìn)行分割,最后運用K近鄰算法對細(xì)分模型進(jìn)行檢驗同時可以對指定客戶進(jìn)行分類。
熵值法是指用來判斷某個指標(biāo)的離散程度的數(shù)學(xué)方法,作為一種客觀賦權(quán)的方法,在實際中得到了較為廣泛的應(yīng)用,信息熵的數(shù)學(xué)表達(dá)式為式(1)。
(1)
根據(jù)熵值法的原理,假設(shè)存在m個待評對象和n項評價指標(biāo),將待評對象和評價指標(biāo)形成原始指標(biāo)數(shù)據(jù)矩陣X=(xij)m×n,其中0≤i≤m,0≤j≤n。熵值法計算過程如下。
(1)無量綱化處理。由于不同指標(biāo)的量綱和數(shù)量級的差異,因此在利用熵值法進(jìn)行賦權(quán)前,需對所有指標(biāo)進(jìn)行無量綱化處理,本文選擇極值處理法對指標(biāo)數(shù)據(jù)進(jìn)行無量綱化處理。
(2)計算第j項指標(biāo)下第i個樣本占該指標(biāo)的比例:
(3)計算第j項指標(biāo)的信息熵如式(2)。
(2)
(4)計算第j項指標(biāo)的權(quán)重。某項指標(biāo)的權(quán)重與指標(biāo)的效用有關(guān)。消息效用的值取決于該指標(biāo)的信息熵與1之間的差值(信息熵越大,效用越小),其直接影響權(quán)重的大小,信息效用的值越大,對評價的重要性越大,權(quán)重亦越大。第j項指標(biāo)權(quán)重為式(3)。
(3)
(5)最后指標(biāo)的權(quán)重和對象值計算各評價對象的得分式(4)。
(4)
利用降維的思想,在失去少量信息的前提下,將多個指標(biāo)轉(zhuǎn)化為若干綜合指標(biāo)的算法。目標(biāo)是在研究復(fù)雜問題時,只考慮少數(shù)幾個主要成分而不會丟失太多信息,從而更容易抓住主要矛盾,揭示事物內(nèi)部變量之間的規(guī)律性,同時使問題得到簡化,具體過程為:
(1)選取各項指標(biāo),若度量或取值范圍相同,則構(gòu)建協(xié)方差陣;若不同,則構(gòu)建相關(guān)矩陣;
(2)求出協(xié)方差陣或相關(guān)陣的特征根和相應(yīng)標(biāo)準(zhǔn)特征向量;
(3)判斷是否存在共線性,若存在共線性,可以將其暫時剔除,重新返回第(1)步;
(4)得到主成分表達(dá)式并選取主成分,確定其權(quán)重。
K-means聚類是一種劃分的而非分層的聚類方法,該算法是將數(shù)據(jù)對象劃分為k個聚類,通常使用某一劃分標(biāo)準(zhǔn)(稱為相似度函數(shù)),以使同一簇中的對象相似,而在不同簇中的對象是相異的。本文基于K-means算法,對初始聚類中心和迭代種子的選擇做了優(yōu)化,使分類結(jié)果更加精準(zhǔn)可靠。具體步驟:
(1)給定一組包含n個數(shù)據(jù)的數(shù)據(jù)集,每個數(shù)據(jù)包含m個屬性,將數(shù)值進(jìn)行標(biāo)準(zhǔn)化處理。并基于距離法移除孤立點。
(2)對于數(shù)據(jù)集U,令m=1。Am={xp,xq},(xp,xq)=min(distance(xi,xj)),i,j∈U。循環(huán)找到在U中與Am中每個點最近的數(shù)據(jù)對象,優(yōu)先歸到Am中,直到Am中的數(shù)據(jù)對象個數(shù)到達(dá)一定閾值,然后令m=m+1。循環(huán)上述過程直到形成k個對象集合。最后對k個對象集合分別進(jìn)行算術(shù)平均計算,形成k初始聚類中心。
(3)應(yīng)用類中與聚類種子相似度大于某一閾值的數(shù)據(jù),組成每個類的一個子集并計算子集中的均值點,該均值點作為下一輪聚類的聚類種子。即在第k-1輪聚類獲得的類,計算該類中所有數(shù)據(jù)與該類聚類中心的平均距離S,每個類的一個子集選擇類中與聚類種子且相似度大于2S的數(shù)據(jù),子集的均值點作為第k輪聚類的聚類種子。不斷重復(fù)這一過程直到準(zhǔn)則函數(shù)開始收斂為止。
訓(xùn)練數(shù)據(jù)集為{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))},利用樣本數(shù)據(jù)對特征向量空間進(jìn)行劃分,并作為分類的模型,K近鄰算法的工作步驟具體如下:
(1)根據(jù)給定的距離度量規(guī)則,在訓(xùn)練集T中找出與x最近鄰的k個點,涵蓋這k個點的x的鄰域記作Nk(x);
模型構(gòu)建思路如圖1所示。
圖1 建模思路
首先確定客戶價值細(xì)分的目標(biāo)及要求,應(yīng)用熵權(quán)法和主成分分析法,完成價值客戶評分指標(biāo)體系;其次,應(yīng)用指標(biāo)體系,計算客戶價值得分,根據(jù)價值得分曲線篩選價值客戶范圍?;诜秶鷥?nèi)的價值客戶數(shù)據(jù),使用經(jīng)濟(jì)貢獻(xiàn)得分、發(fā)展?jié)摿Φ梅?、信用貢獻(xiàn)得分,應(yīng)用K-means聚類算法實現(xiàn)客戶價值細(xì)分,完成細(xì)分客戶的特征解釋。
收集某省A市區(qū)2015年-2017年電力營銷系統(tǒng)數(shù)據(jù),開展模型訓(xùn)練。價值客戶都是大客戶,因此最終以非居民用戶數(shù)據(jù)作為數(shù)據(jù)樣本,共收集非居民用戶18.94萬戶?;谑占降臄?shù)據(jù),應(yīng)用R軟件,以用戶編碼為唯一標(biāo)識,對客戶基本信息、用電信息、繳費信息、電價信息等數(shù)據(jù)進(jìn)行關(guān)聯(lián)計算,剔除或填充異常樣本數(shù)據(jù)。同時基于對業(yè)務(wù)的理解,將明顯具有相關(guān)性的指標(biāo)進(jìn)行相關(guān)分析,展示了部分指標(biāo)如圖3,保留其中一個指標(biāo)變量,避免建模時受到多重共線性的影響。最終得到有效數(shù)據(jù)為篩選出34個指標(biāo)共96 274個樣本。
基于數(shù)據(jù)集中的34個指標(biāo),構(gòu)建客戶價值模型指標(biāo)體系。由于沒有客戶價值歷史類別標(biāo)簽,因此客戶價值分析結(jié)合實際業(yè)務(wù),應(yīng)用無監(jiān)督學(xué)習(xí)方法,進(jìn)行指標(biāo)篩選。熵權(quán)法是無監(jiān)督學(xué)習(xí)中,被行業(yè)廣泛應(yīng)用的指標(biāo)客觀權(quán)重計算的典型方法,因此首先利用熵權(quán)法對指標(biāo)重要性進(jìn)行初步判定,包括數(shù)據(jù)指標(biāo)歸一化、熵值計算和權(quán)重計算。對一些明顯與客戶價值分析無關(guān)的指標(biāo)實行剔除,最終選取用戶屬性、經(jīng)濟(jì)貢獻(xiàn)、發(fā)展?jié)摿Α⑿庞秘暙I(xiàn)四個維度指標(biāo)初步構(gòu)建客戶價值指標(biāo)體系如圖2所示。
分析目標(biāo)側(cè)重客戶的經(jīng)濟(jì)價值、增長情況(發(fā)展?jié)摿?以及客戶信用,因此使用R軟件,利用主成分分析法將基本屬性的影響權(quán)重分?jǐn)偟狡渌?個維度指標(biāo)上去,構(gòu)成由經(jīng)濟(jì)貢獻(xiàn)、發(fā)展?jié)摿Α⑿庞秘暙I(xiàn)3個維度7個指標(biāo)組成的價值客戶評分指標(biāo)體系,如圖3所示。
圖3 用戶價值建模最終指標(biāo)體系
通過對3個維度指標(biāo)的加權(quán)求和,計算出每個客戶價值的總得分,同時根據(jù)得分曲線的變化斜率制定價值客戶標(biāo)準(zhǔn)。如圖4所示。
圖4 價值客戶得分
價值得分曲線在分?jǐn)?shù)為13.666 761 04出現(xiàn)明顯拐點,將高于這個閾值的客戶作為價值客戶。
同時對合同容量、用電量、電壓等級、用電量年平均增長率單一數(shù)據(jù)再次進(jìn)行描述性分析,如圖5所示。
可以看出合同容量在100 KWA以后明顯上升,因此合同容量邊界定位100 KWA;用電量曲線與趨勢線交叉點在10萬度點,因此電量邊界定位10萬度,且該數(shù)值也與實際相符;在實際數(shù)據(jù)分析過程中,81 282(只統(tǒng)計用電量為正數(shù))家供電電壓在1 KV以下的用電客戶,用電量在10萬度以上的只有187家,占比0.2%,樣本數(shù)極低,因此分析價值客客戶過程中,1 KV以下客戶認(rèn)定為非價值客戶;用電年增長率圖拐點出現(xiàn)在-0.5,且實際計算年增長率低于-0.5的客戶僅占0.11%,樣本數(shù)極低,因此年增長率設(shè)定為-50%以上的客戶。
綜上所述,最終確定電壓在10 KV以上、合同容量在100 KVA、年用電量10萬度以上、增長率-50%以上、信用年違規(guī)3次以下的客戶為最終的價值客戶,共計12 638戶。
基于以上價值客戶數(shù)據(jù)和三個維度指標(biāo),使用改進(jìn)后K-means聚類算法對價值客戶進(jìn)行類型劃分。得出當(dāng)聚類個數(shù)為4時效果較好,在每個分類類別中各價值客戶的經(jīng)濟(jì)貢獻(xiàn)、發(fā)展?jié)摿托庞玫梅址植既鐖D6所示。
圖6 價值客戶特征
最終結(jié)合業(yè)務(wù),將四類價值客戶分為不同特征群體,如圖7所示。
圖7 價值客戶分類
將分類結(jié)果加以應(yīng)用,給定新的測試樣本客戶指標(biāo)數(shù)值為:用電量98 984 469度,應(yīng)收電費81 643 830元,綜合單價為0.824 8元/度,年用電量增長率為45.2%,年應(yīng)收電費增長率為44.7%,欠費次數(shù)為1次,欠費時長為1小時。
基于數(shù)據(jù)挖掘中的分類方法得到了四類電力價值客戶,共制定3項共性類策略和14項差異化營銷策略。共性類策略除提出更加合理的優(yōu)質(zhì)服務(wù)策略外,創(chuàng)新的提出積分制,有償為價值客戶提供增值服務(wù)。差異化策略針對不同的群組特征,提出個性化賬單、客戶俱樂部、發(fā)放“貴賓卡”等服務(wù)策略,有層次、多角度的支撐公司營銷工作的開展。