• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)客戶關(guān)系管理

      2018-09-28 02:30:30李雪菁
      計算機與數(shù)字工程 2018年9期
      關(guān)鍵詞:客戶關(guān)系細分決策樹

      李雪菁

      (1.上海杉達學(xué)院信息科學(xué)與技術(shù)學(xué)院 上海 201209)(2.上海大學(xué)機電工程與自動化學(xué)院 上海 200072)

      1 引言

      過對大數(shù)據(jù)的深入挖掘會給金融領(lǐng)域的業(yè)務(wù)模式帶來巨大的改變,進而對為企業(yè)提供了從其他視角解決問題的可能性。與此同時,也可能使企業(yè)新的商業(yè)機會和重構(gòu)新的商業(yè)模式。電子商務(wù)作為當(dāng)代主要的商業(yè)模式更希望借助先進的信息技術(shù)發(fā)現(xiàn)潛在的新客戶以及保持并改善與老客戶的關(guān)系,從而整體上提高企業(yè)的市場競爭力。

      所謂數(shù)據(jù)挖掘在客戶關(guān)系管理(Customer Relationship Management CRM)中的應(yīng)用,實質(zhì)就是通過提取企業(yè)數(shù)據(jù)倉庫中的業(yè)務(wù)數(shù)據(jù)作為建模樣本[2]。利用各種數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進一步建模并分析優(yōu)化,從而為企業(yè)經(jīng)營決策和市場策劃進行指導(dǎo)[1]?;跀?shù)據(jù)挖掘技術(shù),本文將針對三方面問題即客戶細分、客戶保持及客戶滿意度,對客戶關(guān)系管理問題進行分析研究。

      本文對基于聚類和決策樹的客戶細分模型,采用聚類方法對具有相似購買行為的用戶進行聚類,再利用決策樹分析根據(jù)各類客戶的屬性的差別將客戶細分為不同的類別,并利用K-means算法對該模型進一步研究,取得了很好的效果。

      2 客戶數(shù)據(jù)特點分析

      電子商務(wù)經(jīng)營流程包括企業(yè)的T(交貨期),Q(質(zhì)量),C(成本),S(服務(wù)),E(環(huán)保)等方面。電子商務(wù)是一個有機的整體,其集成了人員、技術(shù)、經(jīng)營管理及企業(yè)的物流、資金流、信息流等方面的信息[3]??蛻絷P(guān)系管理(CRM)同生產(chǎn)管理、庫存管理、成本控制等相同,也是電子商務(wù)的一個應(yīng)用系統(tǒng)。從整體看,CRM提供了基于客戶的企業(yè)管理的綜合信息?;谄髽I(yè)管理,本文總結(jié)CRM有如下特點:

      1)數(shù)據(jù)量大面廣

      其包括財務(wù)管理、員工管理、能源管理、材料儲備管理、訂單管理、生產(chǎn)進度管理和成本管理等。信息的來源是多方位的。具體來說,有自企業(yè)內(nèi)部數(shù)據(jù)庫的;也有源于原始單據(jù)、手工報表等;更有部分信息來源于因特網(wǎng)或合作伙伴的業(yè)務(wù)數(shù)據(jù)庫??梢娖鋽?shù)據(jù)量是非常大的。

      2)數(shù)據(jù)形式多樣

      其數(shù)據(jù)形式是非常多樣化的。既有傳統(tǒng)的文件及數(shù)據(jù)庫數(shù)據(jù);同時也有因特網(wǎng)/企業(yè)內(nèi)部網(wǎng)數(shù)據(jù);甚至有聲音、圖像等多媒體數(shù)據(jù)。而同一類型的數(shù)據(jù)也有可能存在完全不同的存儲格式。

      3)面向不同的業(yè)務(wù)

      對于不同的業(yè)務(wù),其可能提供不同的信息。通常不同的業(yè)務(wù)對信息需求的側(cè)重點不同,因此數(shù)據(jù)需要與其它管理直接相關(guān)的信息,同時也需要其他大量的輔助信息。

      4)信息集成

      各種系統(tǒng)的信息有機地集成在一起構(gòu)成整個企業(yè)的CRM系統(tǒng)。

      CRM在整個生命周期中都以客戶為中心,客戶信息是CRM存在的基石。為了進行有效的客戶分析,這些信息必須在整個企業(yè)范圍都是一致的、可靠的,并且具有便于使用的格式。然而,針對上述企業(yè)客戶數(shù)據(jù)的以上特點,如果簡單地將它們復(fù)制過來,而不進行清洗、集成和綜合,則對客戶分析和市場營銷是無效的。因此,建立一個企業(yè)范圍內(nèi)全局一致的客戶數(shù)據(jù)倉庫就非常必要,這是CRM成功的基礎(chǔ)。通過建立客戶數(shù)據(jù)倉庫,把原來分散在企業(yè)內(nèi)外的關(guān)于客戶的數(shù)據(jù)集成起來面向主題進行組織,向企業(yè)及其員工提供了關(guān)于客戶的總體的、統(tǒng)一的看法建立基于數(shù)據(jù)倉庫的客戶關(guān)系管理,具有數(shù)據(jù)挖掘和在線分析等分析功能,高質(zhì)量地實現(xiàn)了客戶關(guān)系管理的目標,充分發(fā)揮了客戶關(guān)系管理的作用。

      3 基于數(shù)據(jù)挖掘的CRM應(yīng)用流程

      數(shù)據(jù)挖掘在CRM中的應(yīng)用,實質(zhì)上就是通過提取企業(yè)數(shù)據(jù)倉庫中的業(yè)務(wù)數(shù)據(jù)、營銷數(shù)據(jù)以及客戶數(shù)據(jù)作為建模樣本,再利用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進行挖掘。進而,對挖掘的結(jié)果進行分析和建模并不斷對模型進行優(yōu)化,從而為企業(yè)經(jīng)營決策和市場策劃進行指導(dǎo)[4]。數(shù)據(jù)挖掘在客戶關(guān)系管理中應(yīng)用的流程如圖1所示。

      數(shù)據(jù)采集過程收集到數(shù)據(jù)為源數(shù)據(jù)。源數(shù)據(jù)中與CRM有關(guān)的數(shù)據(jù),包括了服務(wù)器日志數(shù)據(jù)、客戶注冊信息及交易數(shù)據(jù)信息等。這其中的客戶信息與服務(wù)器日志數(shù)據(jù)相結(jié)合分析,就能更好地理解客戶行為。

      所謂的數(shù)據(jù)處理過程,是指對采集到的各種不同類型的數(shù)據(jù)進行預(yù)處理。數(shù)據(jù)清洗過程目的是消除噪聲的數(shù)據(jù),以便對數(shù)據(jù)進行再組織,進而建立數(shù)據(jù)倉庫。

      數(shù)據(jù)存儲過程是指,將處理后的數(shù)據(jù)按照要求以一定的形式保存起來,方便日常對數(shù)據(jù)的管理。常見的數(shù)據(jù)存儲方式有包括,關(guān)系數(shù)據(jù)庫和事務(wù)數(shù)據(jù)庫及數(shù)據(jù)倉庫。

      CRM中常用的數(shù)據(jù)挖掘算法有關(guān)聯(lián)規(guī)則挖掘、序列模式挖掘,聚類和分類分析等。

      模式分析的含義是:在模式發(fā)現(xiàn)中,獲得的模式進行分析。通過濾掉用戶不感興趣的規(guī)則和模式,獲得更多有用的信息。進而可以結(jié)合客戶的注冊信息,將這些信息用于對客戶進行忠誠度、滿意度等分析。

      圖1 客戶關(guān)系數(shù)據(jù)挖掘過程

      4 基于數(shù)據(jù)挖掘技術(shù)的CRM

      數(shù)據(jù)挖掘能夠幫助企業(yè)確定客戶的特點,從而為客戶提供針對性的服務(wù)。具體來說,通過數(shù)據(jù)挖掘發(fā)現(xiàn)使用某一業(yè)務(wù)的客戶特征,這樣就可以向其他同樣具有類似特征,但沒有使用該業(yè)務(wù)的客戶進行有目的推送。甚至可以找到流失客戶的特征,這樣便于采取針對性的措施,以便保持客戶群。本節(jié)將從客戶細分、客戶忠誠度保持,客戶滿意度這三個方面研究數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用。

      4.1 客戶細分

      所謂的“客戶細分”是指把大量客戶分。保證每一類里的客戶具有類似的屬性,而與其他類里的客戶具有不同屬性[5]??蛻艏毞謱ζ髽I(yè)的經(jīng)營策略有很大益處。根據(jù)聚類和決策樹的客戶細分模型,本文基于K-means算法采用了聚類方法對具有相似購買行為的用戶進行聚類,進而利用決策樹法,根據(jù)各類客戶的屬性的差別將客戶細分為不同的類別,提高了算法效率,使分析更準確。

      以某國際食品連鎖超市為例,將客戶分為普通客戶和會員兩種??蛻糍Y料有10281條客戶信息,銷售記錄表中存儲了一年當(dāng)中所有的銷售記錄。對兩張表進行了查詢、隨機取樣處理后,得到一個數(shù)據(jù)集(540條記錄),將其用于數(shù)據(jù)挖掘如表1(部分數(shù)據(jù))。

      挖掘步驟為

      通貨膨脹對錢多的人有害,還是對錢少的人有害?我的答案是對錢少的人有害。因為錢多的人,一般都把錢變成了資產(chǎn),資產(chǎn)保值,抵御了通脹。而錢少的人,一般是存款或持有現(xiàn)金。

      1)將Average-Expend和Time作聚類變量,反映客戶的貢獻度和忠誠度。K-means算法實現(xiàn)過程中采用隨機選擇法選擇聚點。再利用最近歸類法進行初始劃分,采用逐個修改法來更新聚點;

      2)根據(jù)客戶屬性構(gòu)建決策樹。屬性選取標準用增益比例代替增益。如式(1)。

      表1 挖掘數(shù)據(jù)集示例樣本

      其中,SplitInfo(X,a)為屬性a的熵值。Gain(X,a)為增益。計算表明,不同屬性提供相同的增益時,SplitInfo(X,a)的取值越小越好。這是因為值越小說明為獲取關(guān)于屬性a的取值所需付出的代價就越小。若有一個屬性a,根據(jù)其不同取值a1,a2,…,an將實例集 X 分成集合 X1,X2…Xn,且有 X1+X2+…+Xn=X,則有:

      數(shù)據(jù)挖掘結(jié)果將客戶按照Average-Expend、Time分為4類,如表2。

      表2 聚類挖掘結(jié)果

      將 C1、C2、C3和 C4屬性寫入到挖掘庫中,將年收入、孩子個數(shù)等作為輸入列,創(chuàng)建如圖2所示的決策樹。以客戶貢獻度和客戶忠誠度為標準,對客戶進行聚類,根據(jù)輔助屬性進行決策樹分類。對客戶群進行如圖2的分析。

      圖2 客戶細分決策樹

      C1這類客戶對企業(yè)價值很小,雖然這類客戶中不乏有高收入人群,但各類促銷活動都未能提高他們的消費額,可能是受收入或其他主客觀因素影響。其貢獻度與忠誠度都較低,屬于劣質(zhì)客戶群。這類客戶很難向更高級客戶轉(zhuǎn)變。因此在今后營銷中,不應(yīng)花太多成本。

      C2是值得珍惜,具有潛力的資源,是企業(yè)最應(yīng)該實施影響的客戶群體。應(yīng)該為這類客戶提供更加個性化服務(wù),提升該類客戶的忠誠度,使該類客戶轉(zhuǎn)變?yōu)辄S金客戶。這是因為這類客戶群貢獻度高,忠誠度較低,屬于潛力客戶群。

      C3這類客戶多為己婚且孩子較多的高收入家庭。消費次數(shù)較多,消費額較固定,且在總消費額中所占比例很大,屬于黃金客戶。企業(yè)要穩(wěn)定該類客戶的消費。比如進一步了解這類客戶的消費需求和消費傾向,重視他們的消費反饋信息。

      C4客戶多為收入較高,貢獻度低,但忠誠度較高,屬于理性客戶群。理性客戶一般比較注重商品的質(zhì)量、承諾和價格??梢酝ㄟ^促銷手段,提高其對商品各方面的認可,使其轉(zhuǎn)變?yōu)辄S金客戶。

      對客戶進行細分能夠幫助企業(yè)理解客戶行為,更好地進行客戶識別。

      4.2 客戶保持

      客戶保持包括對客戶流失和客戶忠誠度的分析。當(dāng)前行業(yè)競爭日益激烈,獲得新的客戶的成本是保留老客戶成本的5倍[6]??梢?,保持客戶,尤其是對優(yōu)質(zhì)客戶的保持,對于企業(yè)來說非常重要。本節(jié)著重研究客戶流失問題,以對客戶保持提供對策,提出挽留方案,避免流失持續(xù)發(fā)生。結(jié)合表1中的交易數(shù)據(jù)庫,本小節(jié)探討神經(jīng)網(wǎng)絡(luò)中的BP算法在客戶流失中的應(yīng)用。

      通過對交易數(shù)據(jù)庫中歷史交易數(shù)據(jù)的分析,將判斷客戶流失的條件設(shè)置為:半年內(nèi)沒有記錄的會員客戶;一年內(nèi)交易額僅為原來的1/3,且最近三個月沒有交易的客戶。神經(jīng)網(wǎng)絡(luò)輸入因子屬性為會員卡類別、年收入、月交易額、月交易率,教育背景和年齡等6個量化因子。提取以上兩類客戶數(shù)據(jù)作為分析對比樣本。部分原始數(shù)據(jù)如表3所示。

      表3 部分原始數(shù)據(jù)示例

      進行多因子分析常遇到的問題是各類指標類型、量綱等的不同。若要消除這些差異對計算結(jié)果的影響,就要對數(shù)據(jù)做規(guī)范化處理[7]。

      BP算法是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,其輸入與輸出層的單元數(shù)根據(jù)所求解問題的任務(wù)而定。輸入層有6個輸入因子。輸出層有一個輸出單元。采用布爾型變量表示,1代表流失,0代表未流失。本小節(jié)在權(quán)值調(diào)整算式中加入動量變步長η項對算法進行改進,以提高收斂效率。

      變步長算法基本思想為先設(shè)一個初步步長η,若一次迭代后誤差增大,則η取較大值;若一次迭代后誤差減小,則η取較小值,即

      其中

      N為學(xué)習(xí)樣本容量,E稱為全局平均誤差。權(quán)值調(diào)整改進算法:在權(quán)值調(diào)整算式中加入動量項,即

      式中,a為動量因子,一般取0.1~0.8。權(quán)值修正量加上了有關(guān)上一時刻權(quán)值修改方向的記憶,使每次誤差的迭代誤差有所下降。這樣做的目的是加速收斂。隱藏層層數(shù)越多,誤差反向傳播的計算過程就越復(fù)雜,這樣會增加訓(xùn)練時間。單隱層神經(jīng)網(wǎng)絡(luò)可以逼近任何連續(xù)函數(shù)。采用一個隱藏層。確定好神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)之后,在Matlab下,設(shè)置最大學(xué)習(xí)次數(shù)為100000,目標誤差為0.001,隨機選取的30000個訓(xùn)練樣本。經(jīng)過135001步運算之后,網(wǎng)絡(luò)精度達到要求,SEE=0.00999939。

      以上初步完成了一個客戶流失預(yù)測分析的BP網(wǎng)絡(luò)模型的建立,然后利用訓(xùn)練好的網(wǎng)絡(luò)對10000個檢驗樣本進行預(yù)測,將模型輸出值與期望輸出值進行對比見表4。1為流失,小于0.5視為非流失。

      表4 模型輸出值與期望輸出值

      表5表明數(shù)據(jù)模型輸出值與期望輸出值吻合度較高,該訓(xùn)練模型已具有良好的學(xué)習(xí)能力,使用該BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型對客戶數(shù)據(jù)進行分析,能夠?qū)蛻袅魇нM行比較準確的預(yù)測。

      表5 模型輸出值與期望輸出值對比

      4.3 客戶滿意度分析

      對企業(yè)十分滿意的客戶再次購買產(chǎn)品為滿意客戶的6倍[8~10]。把有價值客戶長期保持在高滿意度內(nèi),可以保證企業(yè)持續(xù)盈利。而客戶的滿意度是一種主觀感受。其受到產(chǎn)品甚至客戶自身影響,很難具體數(shù)據(jù)化。當(dāng)前只能大致的分為十分滿意、比較滿意、滿意、不滿意、非常不滿意[11]。利用數(shù)據(jù)挖掘技術(shù),將客戶根據(jù)以上滿意度標準分類。根據(jù)分類結(jié)果結(jié)合客戶的價值度分析,進而保證高價值客戶的滿意度。

      5 結(jié)語

      本文從客戶細分、客戶保持,客戶滿意度三個方面闡述了數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用?;诰垲惡蜎Q策樹的客戶細分模型,利用K-means算法對模型進行分析,進而提高了算法效率,使分析更準確。另外,本文對客戶的忠誠度進行了研究,提出了一種基于探討神經(jīng)網(wǎng)絡(luò)的BP算法在客戶流失中的應(yīng)用,取得了很好的效果。

      猜你喜歡
      客戶關(guān)系細分決策樹
      潤滑油行業(yè)大客戶關(guān)系建立與維護策略探討
      石油商技(2021年1期)2021-03-29 02:36:10
      關(guān)于客戶關(guān)系管理的思考
      深耕環(huán)保細分領(lǐng)域,維爾利為環(huán)保注入新動力
      華人時刊(2020年23期)2020-04-13 06:04:12
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      八大策略增進客戶關(guān)系
      基于決策樹的出租車乘客出行目的識別
      1~7月,我國貨車各細分市場均有增長
      專用汽車(2016年9期)2016-03-01 04:17:02
      整體低迷難掩細分市場亮點
      專用汽車(2015年2期)2015-03-01 04:05:42
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      洛宁县| 许昌市| 灵川县| 海口市| 肃北| 恩施市| 灵璧县| 开平市| 温州市| 南陵县| 平利县| 扎赉特旗| 灵山县| 滦南县| 津市市| 铜山县| 达孜县| 溆浦县| 宁阳县| 西盟| 通许县| 崇信县| 金坛市| 裕民县| 临泽县| 丹寨县| 红河县| 关岭| 泸定县| 桑日县| 房产| 淅川县| 定南县| 马边| 会昌县| 得荣县| 舒城县| 宜丰县| 洛宁县| 上蔡县| 确山县|