蔡玖琳,張 磊,張秋三
(青島大學(xué)管理科學(xué)與工程學(xué)院,山東 青島 266001)
一種基于數(shù)據(jù)挖掘的零售業(yè)客戶細(xì)分方法研究*
蔡玖琳,張 磊**,張秋三
(青島大學(xué)管理科學(xué)與工程學(xué)院,山東 青島 266001)
針對(duì)零售業(yè)客戶細(xì)分指標(biāo)粗糙和方法精準(zhǔn)性低的問(wèn)題,提出一種基于數(shù)據(jù)挖掘聚類分析的零售業(yè)客戶細(xì)分方法;方法構(gòu)建了一套基于RFM的多指標(biāo)客戶細(xì)分指標(biāo)體系,采用熵值法賦予指標(biāo)權(quán)重,進(jìn)而使用K-Means算法進(jìn)行客戶細(xì)分;實(shí)證研究結(jié)果表明:方法在客戶行為特征區(qū)分能力和聚類緊湊性方面均優(yōu)于傳統(tǒng)基于RFM的細(xì)分方法,方法可行、有效,能夠更好地解決零售業(yè)客戶細(xì)分問(wèn)題,提升客戶關(guān)系管理和營(yíng)銷決策質(zhì)量.
客戶細(xì)分;RFM;熵值法;K-Means
作為國(guó)民經(jīng)濟(jì)的重要組成部分,零售業(yè)發(fā)展迅猛.但是隨著競(jìng)爭(zhēng)的加劇和開(kāi)放的深入,零售業(yè)的利潤(rùn)日漸微薄,迫切需要尋找新的利潤(rùn)增長(zhǎng)點(diǎn).對(duì)于現(xiàn)在供過(guò)于求的零售業(yè)來(lái)說(shuō),如何贏得和保留客戶并將客戶價(jià)值最大化變得尤為重要,也日漸成為企業(yè)最為關(guān)注的問(wèn)題之一.零售業(yè)存在大量的客戶數(shù)據(jù)和銷售數(shù)據(jù),這些數(shù)據(jù)的數(shù)量隨著時(shí)間的推移呈現(xiàn)爆炸式增長(zhǎng).信息技術(shù)的飛速發(fā)展和大數(shù)據(jù)時(shí)代的到來(lái)使企業(yè)能夠借助數(shù)據(jù)挖掘等技術(shù),充分利用這些海量數(shù)據(jù)對(duì)客戶進(jìn)行細(xì)分,幫助企業(yè)制定決策,在更好地滿足客戶需求的同時(shí),為企業(yè)獲取持續(xù)忠誠(chéng)的客戶和更高的利潤(rùn).
企業(yè)自身資源的局限性,一定程度上決定了企業(yè)不可能達(dá)到讓所有客戶都滿意的目標(biāo).依據(jù)80/20法則,企業(yè)最具贏利性的20%的客戶創(chuàng)造了企業(yè)80%的利潤(rùn)[1].通過(guò)對(duì)會(huì)員客戶進(jìn)行細(xì)分,制定更加貼近客戶需求的營(yíng)銷策略,能夠使企業(yè)更有效地利用自身資源,提升客戶滿意度和客戶收益.相對(duì)其他細(xì)分方法,數(shù)據(jù)挖掘方法更加準(zhǔn)確和科學(xué),在傳統(tǒng)基于RFM(Recency,F(xiàn)requency,Monetary)的方法基礎(chǔ)上,提出一種基于聚類算法的多指標(biāo)客戶細(xì)分方法,并結(jié)合具體零售企業(yè)實(shí)例驗(yàn)證其有效性.
客戶細(xì)分方法主要有基于經(jīng)驗(yàn)的方法、統(tǒng)計(jì)分析方法以及非統(tǒng)計(jì)分析方法3種.前兩種方法只能進(jìn)行相對(duì)簡(jiǎn)單的客戶細(xì)分,已經(jīng)無(wú)法滿足企業(yè)的需求.隨著20世紀(jì)90年代數(shù)據(jù)挖掘技術(shù)的興起,復(fù)雜的零售業(yè)客戶細(xì)分有了全新的非統(tǒng)計(jì)分析方法.?dāng)?shù)據(jù)挖掘技術(shù)中應(yīng)用于客戶細(xì)分最為廣泛的是聚類技術(shù),使用聚類分析來(lái)對(duì)客戶進(jìn)行分組,使組內(nèi)成員具有類似的特征,而組間成員之間的差異較大,以此加強(qiáng)客戶關(guān)系管理的商務(wù)策略,幫助改進(jìn)服務(wù)質(zhì)量,提高顧客滿意度和忠誠(chéng)度[2].葉孝明、黃祖慶[3](2006)、周穎[4](2007)、Cheng[5](2009)、徐翔斌[6](2012)等在研究中都采用了聚類技術(shù)來(lái)進(jìn)行客戶細(xì)分,衡量客戶價(jià)值,效果顯著.其中,最常用到的算法是基于劃分的K-Means聚類算法.
現(xiàn)有客戶細(xì)分方法中所用指標(biāo)體系的構(gòu)建經(jīng)歷了傳統(tǒng)客戶細(xì)分和基于客戶價(jià)值的細(xì)分兩大階段.傳統(tǒng)客戶細(xì)分更多基于地理位置和社會(huì)經(jīng)濟(jì)學(xué)等特征進(jìn)行細(xì)分.Lazer(1964)提出以生活方式為背景識(shí)別和細(xì)分客戶,Mitchell(1983)提出了一種基于社會(huì)階層、生活方式和個(gè)人特征的可概括的心理細(xì)分模型.隨著社會(huì)發(fā)展和經(jīng)濟(jì)全球化的推進(jìn),這些因素不足以區(qū)分客戶行為,細(xì)分效果也大打折扣.于是客戶細(xì)分指標(biāo)的構(gòu)建進(jìn)入基于客戶價(jià)值的細(xì)分階段,最具代表性的就是Hughes提出的RFM分析方法[7].其中,R(recency,近度),指的是客戶最后一次交易行為與當(dāng)前的時(shí)間間隔,間隔時(shí)間越短,R賦值越大;F(frequency,頻度),指的是某一特定的時(shí)期內(nèi)客戶的交易次數(shù);M(monetary,額度),指的是某一特定時(shí)期內(nèi)客戶的交易金額.Chang等人指出,R越大,F(xiàn)越大的客戶與企業(yè)達(dá)成新交易的可能性也越大,M越大的客戶再次響應(yīng)企業(yè)的產(chǎn)品和服務(wù)的可能性越大[8].傳統(tǒng)的RFM分析方法依據(jù)以上3個(gè)行為變量對(duì)每個(gè)客戶打分,然后計(jì)算3個(gè)指標(biāo)的乘積,根據(jù)最后的結(jié)果對(duì)所有的客戶進(jìn)行排序,再按照一定的比例進(jìn)行分類,最后針對(duì)不同的客戶群體制定不同的服務(wù)策略.RFM所涉及的變量都與客戶的行為相關(guān),容易從相關(guān)數(shù)據(jù)庫(kù)中提取,并且能夠預(yù)測(cè)客戶的購(gòu)買行為[9].但是RFM分析過(guò)程復(fù)雜,耗時(shí)長(zhǎng),細(xì)分結(jié)果可能會(huì)產(chǎn)生過(guò)多的客戶群體,如果給每一種變量賦予5個(gè)值,就會(huì)得到125個(gè)細(xì)分客戶群.
不同的客戶細(xì)分指標(biāo)對(duì)于聚類結(jié)果的重要性可能不同,因此需要視情況對(duì)指標(biāo)賦予不同的權(quán)重.國(guó)內(nèi)外學(xué)者對(duì)于細(xì)分指標(biāo)的權(quán)重問(wèn)題進(jìn)行了諸多研究,其中主要分為兩大類:以層次分析法、特征值法為代表的主觀評(píng)價(jià)賦值法和以極差法、熵值法為代表的客觀評(píng)價(jià)賦值法.兩類賦權(quán)方法各有千秋,主觀評(píng)價(jià)以人的主觀判斷為依據(jù),受到參與評(píng)價(jià)者自身判別能力和傾向的影響,可能在評(píng)價(jià)結(jié)果中產(chǎn)生一定的隨意性;而客觀評(píng)價(jià)更加注重?cái)?shù)學(xué)理論知識(shí)的應(yīng)用,不受決策者主觀意識(shí)的影響,對(duì)于結(jié)果的產(chǎn)生也可能存在偏差[10].
2.1 客戶細(xì)分指標(biāo)體系構(gòu)建
傳統(tǒng)的RFM分析方法在每一個(gè)維度上只有一個(gè)指標(biāo),不能全面衡量客戶的行為特征,結(jié)合未來(lái)客戶細(xì)分所呈現(xiàn)的多維度趨勢(shì),在傳統(tǒng)RFM分析的基礎(chǔ)上,對(duì)RFM進(jìn)行多指標(biāo)化處理,構(gòu)建刻畫(huà)客戶消費(fèi)行為特征的指標(biāo)體系,如表1所示.
表1 客戶細(xì)分指標(biāo)體系
客戶細(xì)分指標(biāo)體系將RFM每個(gè)維度擴(kuò)充為兩個(gè)指標(biāo),分別從宏觀和微觀兩個(gè)角度來(lái)觀察客戶行為,另外增加了對(duì)已消費(fèi)物品種類的考慮.表1中,R1,F(xiàn)1和M1為從宏觀角度刻畫(huà)客戶的長(zhǎng)期行為的指標(biāo),R2,F(xiàn)2和M2為從微觀角度來(lái)刻畫(huà)客戶的近期動(dòng)態(tài)的指標(biāo),C為“已消費(fèi)物品種類”指標(biāo).從宏觀角度來(lái)講,將客戶自身指標(biāo)與全體客戶對(duì)應(yīng)指標(biāo)的平均值比較,可以更清楚地確定客戶在整體中的相對(duì)位置;從微觀角度來(lái)講,將客戶的最近一年指標(biāo)與歷史指標(biāo)對(duì)照,可以從自身的角度觀察客戶的近期行為取向;而已消費(fèi)物品種類代表了對(duì)客戶進(jìn)行交叉銷售的可能性,從一定程度上反映了客戶的潛在價(jià)值.同時(shí)考慮以上3個(gè)方面,該客戶細(xì)分指標(biāo)體系可以更全面地觀察客戶的行為特征.
2.2 客戶細(xì)分指標(biāo)賦權(quán)
從細(xì)分目的和所構(gòu)建的細(xì)分指標(biāo)體系角度考慮,為了消除主觀差異,采用客觀的賦權(quán)方法——熵值法為客戶細(xì)分指標(biāo)體系的各個(gè)指標(biāo)賦予權(quán)重,具體步驟如下:
1)原始數(shù)據(jù)標(biāo)準(zhǔn)化.假設(shè)存在m個(gè)客戶,n個(gè)細(xì)分指標(biāo),那么原始數(shù)據(jù)集為
對(duì)于其中值越大越好的正向指標(biāo)而言,其標(biāo)準(zhǔn)化公式為
對(duì)于其中值越小越好的負(fù)向指標(biāo)而言,其標(biāo)準(zhǔn)化公式如下
2)計(jì)算第i個(gè)客戶第j個(gè)指標(biāo)的特征比重:
3)計(jì)算指標(biāo)j的信息熵:
其中k>0,設(shè)定k=1/Lnm,m為包含的客戶人數(shù),即整個(gè)數(shù)據(jù)矩陣的行數(shù).
4)計(jì)算指標(biāo)的信息效用度.對(duì)于給定的指標(biāo)j,x'ij的差異越小,則ej的值越大,指標(biāo)的作用也越小,x'ij的差異越大,則ej的值越小,指標(biāo)的作用也越大.如果x'ij的值相等,則ej達(dá)到最大值1,這種情況下,這個(gè)指標(biāo)的存在就沒(méi)有意義,應(yīng)該從指標(biāo)體系中剔除[10].因此,定義指標(biāo)的信息效用度為dj=1-ej
(5)信息效用度的值越大,應(yīng)該越重視這個(gè)指標(biāo)在整個(gè)指標(biāo)體系當(dāng)中的作用.
5)確定各指標(biāo)的權(quán)重,重新計(jì)算各指標(biāo)賦權(quán)之后的值各指標(biāo)的權(quán)重構(gòu)成的權(quán)重向量為
2.3 客戶細(xì)分聚類算法
K-Means算法是在實(shí)踐中常用的聚類算法之一,廣泛應(yīng)用于多個(gè)行業(yè)中,大量研究表明該算法在處理海量數(shù)據(jù)上可以取得不錯(cuò)的效果.算法的核心思想,是通過(guò)迭代“質(zhì)心”并根據(jù)樣本與質(zhì)心的距離把各個(gè)樣本指派到各個(gè)簇當(dāng)中去.將該算法應(yīng)用到前面所得到的加權(quán)后的新數(shù)據(jù)集X',主要步驟如下:
1)確定初始質(zhì)心.首先,由用戶指定聚類結(jié)果中簇的個(gè)數(shù)K,然后選取第一個(gè)樣本,作為第一個(gè)質(zhì)心;然后,計(jì)算其余所有樣本到質(zhì)心的歐氏距離,選擇距離最大的那個(gè)樣本作為第二個(gè)質(zhì)心,重復(fù)以上步驟直至選出K個(gè)質(zhì)心.
2)將樣本指派到不同的簇.在算法迭代過(guò)程中,樣本被指派到離自己最近的質(zhì)心所代表的簇,距離用歐氏距離的平方來(lái)表示,即樣本i到質(zhì)心j的距離為
其中,Xi是樣本i所有指標(biāo)形成的向量,Cj是簇j的質(zhì)心對(duì)應(yīng)這些指標(biāo)的向量,n是指標(biāo)的個(gè)數(shù).
3)更新質(zhì)心.在迭代過(guò)程中,重新計(jì)算每個(gè)簇的質(zhì)心,所得到的第k個(gè)簇的質(zhì)心向量為
其中,指派樣本后,第k個(gè)簇中的樣本數(shù)量為mk,向量的第j個(gè)分量xkj為
xmj(k)指的是簇k中樣本m的第j個(gè)指標(biāo)的值.
4)停止準(zhǔn)則.K-Means算法一般采用最大迭代次數(shù)或者差異容忍度作為控制算法是否終止的條件,此處采用前者,即通過(guò)設(shè)定最大迭代次數(shù)閾值作為算法終止條件.
為了評(píng)估以上所提出的客戶細(xì)分方法,選用謝邦昌編著的《數(shù)據(jù)挖掘基礎(chǔ)與應(yīng)用》一書(shū)所附某連鎖超市VIP會(huì)員客戶數(shù)據(jù)集進(jìn)行測(cè)試[11].?dāng)?shù)據(jù)集包含32 810條會(huì)員信息,379 824條消費(fèi)記錄.對(duì)存在多個(gè)屬性值缺失的會(huì)員信息予以刪除,并對(duì)數(shù)據(jù)進(jìn)行清洗等預(yù)處理,最終保留了32 699條會(huì)員信息記錄以及378 744條消費(fèi)記錄.
1)指標(biāo)值計(jì)算.通過(guò)計(jì)算,得到所構(gòu)建的客戶細(xì)分指標(biāo)體系中各指標(biāo)值的描述統(tǒng)計(jì)如表2所示,其中R1,R2為負(fù)向指標(biāo),其余指標(biāo)均為正向指標(biāo).
表2 指標(biāo)特征描述統(tǒng)計(jì)
2)指標(biāo)賦權(quán).應(yīng)用指標(biāo)賦權(quán)方法計(jì)算各指標(biāo)賦權(quán)之后的值,通過(guò)熵值法計(jì)算得到各個(gè)指標(biāo)的權(quán)重為w= (0.032 095 9,0.005 318,0.073 507,0.028 624,0.326 765,0.003 548,0.241 279)將得到的權(quán)重賦予各自的屬性,按式(7)計(jì)算得到新的數(shù)據(jù)集.
3)對(duì)新數(shù)據(jù)集進(jìn)行聚類,將客戶分為4類,并根據(jù)客戶的個(gè)人特征和消費(fèi)特征對(duì)聚類結(jié)果進(jìn)行分析,如表3所示.
表3 多指標(biāo)客戶細(xì)分結(jié)果
其中,會(huì)籍長(zhǎng)度采用眾數(shù)而非平均值來(lái)刻畫(huà),是因?yàn)闀?huì)籍長(zhǎng)度集中在單一的幾個(gè)數(shù)值,差異性不大,采用眾數(shù)來(lái)衡量更能體現(xiàn)聚類之間的差別.
第一類客戶(C2),VIP客戶,是企業(yè)的生力軍.他們的總?cè)藬?shù)只占到整體客戶的4%,購(gòu)買總額占了整個(gè)企業(yè)總額的16%,并且消費(fèi)種類繁多,購(gòu)買頻率高,購(gòu)買金額非常大.但是,該類客戶的年購(gòu)買頻率和年購(gòu)買金額與其歷史消費(fèi)記錄相比呈現(xiàn)一種緩慢下降的趨勢(shì).從客戶與企業(yè)的交互特征來(lái)看,他們中大多數(shù)入會(huì)時(shí)間較長(zhǎng),企業(yè)在客戶關(guān)系管理的過(guò)程中,應(yīng)著重關(guān)注這部分能給企業(yè)帶來(lái)巨大收益的客戶,必要的時(shí)候可以為其進(jìn)行個(gè)性化設(shè)計(jì),進(jìn)一步提升客戶的忠誠(chéng)度.例如將VIP客戶作為交叉銷售的重點(diǎn)對(duì)象,他們的平均消費(fèi)種類在27種以上,對(duì)這類客戶進(jìn)行交叉銷售可以獲得相當(dāng)不錯(cuò)的結(jié)果.
第二類客戶(C1),重要客戶.這類客戶人數(shù)占到整體的14.2%,購(gòu)買額度達(dá)到企業(yè)整體銷售額度的27%,平均消費(fèi)種類高于整體水平,平均購(gòu)買金額較高,頻率較高.雖然購(gòu)買力略遜于VIP客戶,但是整體來(lái)說(shuō)屬于企業(yè)的忠誠(chéng)客戶,他們的會(huì)籍長(zhǎng)度在3年及以上的達(dá)到了66%,表明他們與企業(yè)之間建立了一種長(zhǎng)久牢固的關(guān)系,企業(yè)在營(yíng)銷活動(dòng)中應(yīng)該注重保持與這類重要客戶關(guān)系的維系,刺激客戶消費(fèi),以求為企業(yè)帶來(lái)更為長(zhǎng)遠(yuǎn)穩(wěn)定的收益.
第三類客戶(C3),一般重要客戶.整體表現(xiàn)為平均消費(fèi)金額和消費(fèi)種類接近全體客戶的平均水平,占總體26%的客戶購(gòu)買金額占了企業(yè)銷售總額的28.4%,是銷售收益貢獻(xiàn)最高的群體.然而這個(gè)群體中,一半左右的客戶的購(gòu)買時(shí)間間隔較長(zhǎng),流失的可能性比較高.另一方面,這類客戶中68%的人入會(huì)時(shí)間不超過(guò)3年,與企業(yè)建立聯(lián)系的時(shí)間相對(duì)較短,但是作為貢獻(xiàn)率最高的客戶群,企業(yè)應(yīng)該重點(diǎn)發(fā)展此類客戶,減少流失可能性.
第四類客戶(C4),一般客戶.這類客戶在總?cè)藬?shù)中占據(jù)了半壁江山,雖然最近一年的購(gòu)買頻率和購(gòu)買金額相對(duì)其歷史消費(fèi)而言有走高的趨勢(shì),但是消費(fèi)總額只占所有客戶消費(fèi)總額的28%,其中79%的客戶入會(huì)時(shí)間不超過(guò)3年,整體表現(xiàn)為最后一次購(gòu)買時(shí)間久遠(yuǎn),購(gòu)買金額小、頻率低,會(huì)齡較短.企業(yè)可以適當(dāng)降低在這類客戶身上的資源投入,轉(zhuǎn)移到其他客戶群體身上來(lái)達(dá)到企業(yè)有限資源的有效利用.
采用前面同一個(gè)數(shù)據(jù)集,依據(jù)傳統(tǒng)RFM細(xì)分指標(biāo)對(duì)客戶進(jìn)行細(xì)分得到的結(jié)果如表4所示.從表4可以看出,只依據(jù)RFM分析方法對(duì)客戶進(jìn)行細(xì)分,得到的結(jié)果中C1,C3和C4的各項(xiàng)特征中除了平均間隔時(shí)間差異較大,其余特征差異相對(duì)較小,總的來(lái)說(shuō)可以將客戶分為兩大類:C2為一類,即企業(yè)的重要價(jià)值客戶,C1,C3和C4為一類,即一般客戶.并且聚類結(jié)果顯示各個(gè)類內(nèi)距離相對(duì)較大,而通過(guò)與表3對(duì)比發(fā)現(xiàn),采用多指標(biāo)客戶細(xì)分方法得到的各個(gè)類之間差異較大,類內(nèi)差異非常小,聚類效果更為緊湊.這表明所提出的方法在區(qū)分客戶行為特征,進(jìn)行客戶細(xì)分方面明顯優(yōu)于傳統(tǒng)基于RFM的細(xì)分方法,能夠更好地為企業(yè)區(qū)分不同類型客戶,制定差異化營(yíng)銷策略,使企業(yè)合理利用有限資源來(lái)提高客戶忠誠(chéng)度,提升企業(yè)自身價(jià)值.
表4 傳統(tǒng)RFM細(xì)分結(jié)果
提出了一種新的客戶細(xì)分方法,從宏觀和微觀兩個(gè)角度考慮,將傳統(tǒng)指標(biāo)擴(kuò)充為4個(gè)類型7個(gè)指標(biāo),通過(guò)熵值法為指標(biāo)賦權(quán),并采用K-Means聚類算法進(jìn)行客戶細(xì)分.對(duì)某連鎖超市會(huì)員客戶進(jìn)行細(xì)分的實(shí)證研究表明,方法在特征區(qū)分能力和聚類緊湊性方面比傳統(tǒng)基于RFM的分析方法具有更佳的效果,可以幫助企業(yè)做出更準(zhǔn)確高效的決策.但是,研究工作仍然存在一些不足的地方,例如K-Means聚類算法在初始聚類中心的選取上具有隨機(jī)性、對(duì)離群點(diǎn)敏感等,這都將是下一步研究需要解決的問(wèn)題.
[1]DUBOFF R S.Marketing to Maximize Profitability[J].The Journal of Business Strategy,1992,13(6):10-13
[2]JIAWEI H,MICHELINE K.Data Mining:Concepts and Techniques[M].San Francisco:Morgan Kaufmann,2000
[3]葉孝明,黃祖慶.基于數(shù)據(jù)挖掘的零售業(yè)客戶細(xì)分研究[J].現(xiàn)代管理科學(xué),2006(6):63-64
[4]周穎,呂巍,井淼.基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)通信行業(yè)客戶細(xì)分[J].上海交通大學(xué)學(xué)報(bào),2007(7):1142-1145
[5]CHING H C,YOU S C.Classifying the Segmentation of Customer Value via RFM Model and RS Theory[J].Expert Systems with Application,2009(36):4176-4184
[6]徐翔斌,王佳強(qiáng).基于改進(jìn)RFM模型的電子商務(wù)客戶細(xì)分[J].計(jì)算機(jī)應(yīng)用,2012,32(5):1439-1442
[7]HUGHES A.Strategic Database Marketing:the Master Plan for Starling and Managing a Profitable Customer-based Marketing Program[M].New York:McGraw-Hill Professional,1994
[8]CHANG H C,TSAI H P.Group RFM Analysis as a Novel Framework to Discover Better Customer Consumption Behavior[J].Expert System with Application,2011,38(12):57-63
[9]劉英姿,吳昊.客戶細(xì)分方法研究綜述[J].管理工程學(xué)報(bào),2006,20(1):53-56
[10]陸添超,康凱.熵值法和層次分析法在權(quán)重確定中的應(yīng)用[J].電腦編程技巧與維護(hù),2009(22):19-20
[11]謝邦昌.?dāng)?shù)據(jù)挖掘基礎(chǔ)與應(yīng)用[M].北京:機(jī)械工程出版社,2012
[12]HSU F M,LU L P,LIN C M.Segmenting Customers by Transaction Data with Concept Hierarchy[J].Expert System with Application,2012,39(6):6221-6228
[13]MAHBOUBEH K,KIYANA Z.Estimating Customer Lifetime Value Based on RFM Analysis of Customer Purchase Behavior:Case Study[J].Procedia Computer Science,2011(3):57-63
[14]曾小青.基于消費(fèi)數(shù)據(jù)挖掘的多指標(biāo)客戶細(xì)分新方法[J].計(jì)算機(jī)應(yīng)用研究,2013,30(10):2944-2947
Research on Customer Segmentation Method in Retail Industry Based on Data Mining
CAI Jiu-lin,ZHANG Lei,ZHANG Qiu-lan
(School of Management Science and Engineering,Qingdao University,Qingdao 266001,China)
Due to the problem in the roughness of customer segmentation indicator and low accuracy in retail industry,a customer segmentation method in retail industry is propoesed on the basis of clustering analysis of data mining,and a set of RFM based on multi-indicator customer segmentation index system is constructed by using entropy value method to give indicator weight and then by using K-Means algorithm to conduct customer segmentation.Empirical research results show that this method is better than the traditional RFM based on segmentation method in the perspective of distinguishing capacity for customer behaviors feature and clustering compactness,and this method,with feasibility and validity,can better solve the problem in customer segmentation in retail industry and improves the customer relation management and marketing decision-making quality.
customer segmentation;RFM;entropy value method;K-Means
TP392
A
1672-058X(2015)02-0043-06
10.16055/j.issn.1672-058X.2015.0002.009
責(zé)任編輯:田 靜
校 對(duì):李翠薇
2014-06-30;
2014-09-10.
國(guó)家自然科學(xué)基金資助(71273148).
蔡玖琳(1990-),女,湖北黃岡人,碩士研究生,從事數(shù)據(jù)挖掘與數(shù)據(jù)分析研究.
**通訊作者:張磊(1978-),男,山東即墨人,副教授,博士,從事數(shù)據(jù)挖掘研究.E-mail:qduzhanglei@qdu.edu.cn.