郭楊暉 王順毅 林少杰 張宇輝 李仁鐘
摘要:本文首先介紹了論文的研究背景和數據挖掘中聚類分析的發(fā)展現狀。然后從用戶群體分析出發(fā),采用RFM、k-means、決策樹進行建模。建立了會員信息的相關表格,根據所建的不同維表分析需求商品,對每個群體進行細分,分析與其最有關聯(lián)的商品。通過決策樹從時間和金額兩個角度對超市銷售商品的需求進行了詳細的分析。最后對高價值顧客、忠實顧客、潛力顧客、流失顧客分別進行相應的改進措施及建議。
關鍵詞:數據挖掘;超市客群營銷;決策樹;K-Means;RFM
中圖分類號 TP301.6? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)15-0242-06
1引言
1.1研究背景
隨著消費者購買喜好、市場大環(huán)境等的變遷,價格不如量販店便宜、通路也不及便利商店多的超市卻日漸興盛,如全聯(lián)超市銷售額已超越量販店第二的大潤發(fā),甚至擴大市場占有率,并吞了松青超市,在市場上逐漸穩(wěn)占龍頭。但此行業(yè)競爭激烈且市場日趨飽和,消費者逐漸掌握主導權,商家無不想掌握顧客的喜好與需求,來追求最大收益。因此,如何發(fā)掘并滿足顧客需求,進行針對性的營銷策略,以提高顧客人數和消費金額,是超市要獲利的首要任務。綜合以上因素,我對此項議題相當感興趣,故選擇超市營銷分析作為研究主題[1]。
1.2研究目的
本研究個案為超市營銷分析,通過個案中提供的公司會員基本數據、交易數據、小分類代碼等信息,作為分析數據來源,并結合數據挖掘技術的聚類分析,深入了解個案中公司的交易形態(tài),進而找出有助于個案公司的決策信息,掌握不同的四項客群,提供各自專門的營銷策略,通過針對性營銷,鎖定不同客群喜愛的商品,使消費者提高忠誠度,以達到最有效的營銷模式[2]。
1.3問題討論
根據此超市的原始數據,僅能夠看出會員的基本數據以及交易紀錄,無法直接看出會員數據與交易、購買行為的關系連結,其主要問題如下:
1)數據僅以原始呈現且尚未處理,包括許多項目,如:年份、交易金額與交易筆數等,必須多項比較才能找出其中的變化與重要的影響變量;
2)無法單純根據數據進行有效的超市策略擬定,因數據面向廣泛,是否應從暢銷商品、店面或是會員來制定最佳營銷策略仍有待分析;
3)僅以基本敘述統(tǒng)計可能無法找出最佳的營銷方向。本研究期望通過數據的挖掘與分析,以區(qū)隔客群的方式,使超市能有明確且容易制定策略的方向,并簡要探討有效提升銷售金額、銷售量,甚至提升顧客滿意度等策略[3]。
1.4創(chuàng)新點
在營銷分析中K-means運用得比較廣泛,而且相對其他算法稍簡單,決策樹的可解釋性比較高,應用廣泛,可以轉化為規(guī)則[4]。本論文創(chuàng)新點就在于我們是通過RFM模型結合K-means和決策樹來對超市客群進行分析的。有學者將K-means 算法和 RFM 模型相結合,將顧客進行聚類,由大數據挖掘和企業(yè)客戶細分結合研究,可以針對細分結果的不同,對不同的顧客類型采取不同的策略,使客戶擁有更好產品體驗。K-means 算法和 RFM 模型結合做法的確能夠很好地對這個顧客模型進行聚類,但是這個缺乏了解釋和驗證手段[5]。也有學者使用基于RFM模型采用K-means聚類和四分位法對客戶進行細分,幫助企業(yè)找到優(yōu)質客戶、潛在客戶,對客戶價值進行識別。企業(yè)可以通過自己的需要選擇相應的方法來找到最優(yōu)和有潛力客戶等,進行針對性策略吸引客戶,形成長期購買行為,提高客戶忠誠度。但是這個方法不能夠清晰反映出不同客戶的區(qū)別,從而進行顧客細分,而建立決策樹卻能很好地解決這一點[6]。所以我們在本論文中結合了決策樹,以決策樹來將聚類出的結果轉換為規(guī)則,再算出它的準確率。在通過多次聚類之后,發(fā)現聚成四類時用決策樹能夠更好地解釋我們的分群,最后算出來的準確度也最高。
2 研究方法與步驟
2.1 數據預處理
本文的數據來源為中華統(tǒng)計應用學會所提供,使用超市的數據集進行分析,會員數據檔共計4377筆,交易記錄檔在2017年1月1日至2018年12月31日期間數據共計105170筆,產品數據檔共計11171筆,小分類編碼表共計432筆,各數據集的數據總筆數、屬性個數如下表1所示。
由于原始數據須經過數據的轉換及梳理,才可符合數據挖掘分析的需要,故此階段將交易記錄檔提取出來,移除重復數據,以便建立RFM模型,并進行數據挖掘[7]。
2.2 顧客價值分析
本文顧客價值采用RFM模型計算,說明如下:
最近購買日(Recency):顧客最近一次購買到分析時的天數,計算數值越小,表示顧客近期有至超市購買商品,反之,數值越大,表示顧客有一段長時間沒有到超市購買商品[8]。
購買頻率(Frequency):顧客在2017年1月1日至2018年12月31日期間購買超市商品的次數,計算數值越大,表示顧客較常購買,反之,數值越小,表示顧客不常購買。
購買金額(Monetary):顧客在2017年1月1日至2018年12月31日期間購買超市商品的平均總金額,計算數值越大,表示顧客消費能力高,反之計算數值越小,表示顧客消費能力不高。
2.3聚類分析結合決策樹
此節(jié)分為三部分,先是在R軟件上執(zhí)行階層式聚類法中的華德法,找出聚類數,接著使用k-means算法產生聚類結果,最后則是以聚類出的結果執(zhí)行決策樹找出其決策的規(guī)則。
使用k-means算法時,載入分析數據,設定聚類數后,所得出的聚類結果代入到RFM模型中,并開始執(zhí)行決策樹,以便顯示聚類規(guī)則。
通過上述的方法,利用決策樹找出四群的規(guī)則,總計六條規(guī)則,如圖1所示,決策樹的準確度為98.49%。
依據決策樹的規(guī)則,本文歸納出四群客戶類別,分別為高價值顧客群、忠實顧客群、潛力顧客群和流失顧客群,其規(guī)則對照,如表2所示[9]。
依據所分析出的顧客類別及規(guī)則,提供出超市營銷建議[10]。
3 結果分析與討論
3.1 全體顧客
3.2 聚類討論
3.2.1 決策樹
忠實顧客群:
1)忠實顧客群相較于整體顧客忠實顧客群也就是聚類一,無論在人數或者購買金額上,所占整體顧客群比例不高,大約一成左右。
2)忠實顧客群的消費者數據分析結果顯示在2017年到2018年間,忠實顧客群的主要客層:
A.男性消費者比例有顯著增加(23.5%,2018),但是主要消費者還是女性(76.5%,2018)
B.學歷在2017年主要是高中以下(54.7%,2017),2018年則轉變?yōu)榇髮W(64.4%,2018)
C.消費者多為已婚(92.0%,2018)
D.家庭人口2017年主要集中在7人以上(66.8%,2017),2018則被3~4人家庭取代(54.0%,2018)
E.2017年職業(yè)以服務業(yè)居多(63.8%,2017),2018年則分散于商業(yè)(40.2%,2018)、服務業(yè)(32.0%,2018)以及家庭主婦(21.7%,2018)
F. 家庭月收入則集中在1~1.5萬元(30.6%,2018)和1.5萬元以上(53.5%,2018)
3)忠實顧客群的暢銷商品
基于忠實顧客群是全體顧客群中,較頻繁來消費且消費有一定金額以上的人,因此所購買的暢銷商品與全部顧客群中的暢銷商品相差不遠,主要也都是一些家庭生活用品。
3.2.2 潛力顧客群
潛力顧客群指的是最近一次購買距計算時點<312.5天,但平均交易金額<939.6元者,即其對超市有一定活躍程度,但購買力不夠強,可制定適當的營銷策略,提高其消費,將其培養(yǎng)為忠實顧客群。
1)潛力顧客群相較于整體顧客
潛力客群有以下特性:
A.以性別來看,在2017年和2018年,女性都占多數(約76%)
B.以學歷來看,在兩年內學歷皆以大學為主
C.從婚姻狀態(tài)來看,皆以已婚者占多數,但已婚者從82%降為69%
D.以家庭人口來看,3~4人占了半數,其次是7人以上(接近30%)
E.從職業(yè)來看,皆以家庭主婦為最大宗,其次為商業(yè)人士
F.從家庭月收入來看,扣除(其他),2017年最多的是0.5萬~1萬者,2018年則變?yōu)?.5萬元以上者
2)潛力顧客群依據會員特性分項比較其暢銷商品
先看潛力顧客群的總消費在件數與金額上占大部分的分別是那些商品:
接著以各項會員特性來分項,比較潛力顧客群與全體顧客在暢銷商品件數、金額上的差異,有以下幾點值得一提:
就收入而言,與所有客戶相比,潛力客戶的傾向較為不同的是:
收入0.5萬~1萬的消費者,購買的白蘭地金額非常大,其次是鮮奶與進口香煙;收入1~1.5萬的消費者,購買金額則以葡萄酒占比最大。
以各店鋪而言,1051是潛力客戶群中營收最多的店,在2017、2018年皆約占35%;若以全部客戶來看,則4店營收相差不大。因此僅就1051做探討。
以消費總金額看,1051的潛力客戶消費了大額的白蘭地。
以性別而言,從消費總金額來看,女性購買的白蘭地占總營收最大部分,男性則是葡萄酒,且若以所有顧客的消費金額來看,白蘭地與葡萄酒皆不是營收前幾名。
以職業(yè)而言,在消費總金額上,工業(yè)消費的白蘭地非常多,鮮奶與進口香煙也相當多;商業(yè)人士消費的葡萄酒消費金額多。
3)購買暢銷商品的會員共同特性
交叉比對各個會員個性分項下的暢銷商品件數、金額,可總結出幾項具推廣價值的結論:
白蘭地與葡萄酒單價高,占潛力客群中消費金額的一大部分,然而在所有顧客的消費金額分析中卻未看到此一結果,故可作為對潛力客群的重點商品營銷。
其中又發(fā)現,白蘭地在潛力客群中主要消費者有(碩士學位、家庭月收入0.5萬~1萬、工業(yè)、女性)這些共同特色,且在此商品有高消費的客群,常伴隨(進口香煙)的高消費。
葡萄酒在潛力客群中的主要消費者,則有(家庭月收入1~1.5萬、商業(yè)、男性)的共同特色。
而上面討論過,店號1051又是所有店鋪在潛力客群中營收最大的,其營收就有極大部分來自高單價酒類。
5.2.3 流失顧客群
1)流失顧客群相較于整體顧客
流失顧客群為聚類三,無論在人數或者購買金額上,所占整體顧客群比例最少,大約2%左右,也是店家最不希望產生的客群。
結果顯示在2017年到2018年間,流失顧客群的主要客層:
A.女性消費者比例有最多(76.37%,2018)
B.學歷在2017年與2018年主要是大學生最多(30.92%,2017)(37.66%,2018)
C.消費者多為已婚,但有減少的趨勢(63.7%,2018)
D.家庭人口皆主要集中在3~4人(49.92%,2017),但是1~2人與7人以上皆有增加趨勢(29.46%,2018)(28.96%,2018)
E.職業(yè)在2017年與2018年皆以商業(yè)占最多(35.39%,2018)
F.家庭月收入由2017年1~1.5萬元(24.29%,2017)最多,改為2018年0.5萬~1萬最多(28.31%,2018)
2)特殊分項說明
從性別暢銷商品來看,女性購買最多的商品與男性差不多,但是次項后便有差異,男性暢銷商品有包括米酒、電池軟品等,女性暢銷商品則以蔬果類、雞蛋、豆腐等生鮮食品為主,可見性別的暢銷商品類別仍有不同。
從職業(yè)暢銷商品來看,最暢銷商品仍為一般白米、家庭用品等等,但是從次項分析仍可發(fā)現不同。無業(yè)/退休者的次項暢銷商品包括味素、葡萄酒、日本點心食品等等,可能與生活飲食習慣及金錢較不用煩惱,因此有意愿嘗試外國高價食品。學生的次項暢銷商品則為酸奶、冷凍面食、冷凍輕松料理等等,由此可發(fā)現學生族群的飲食習慣以快速、方便為導向。
3)流失顧客群暢銷商品
流失顧客群所購買的暢銷商品與全部顧客群所購買的商品種類相差不大,皆為一般白米、家庭用品、鮮奶等等。而在暢銷商品總金額方面,流失顧客群全體顧客群也差異不大,以一般白米、鮮奶、油類等金額較高商品為主。顯示雖為流失顧客群,所購買商品種類也與一般大眾無異,購買金額較少因素因與產品無關,可能為店家與個人喜好因素。
5.2.4高價值顧客群
高價值顧客已被視為是企業(yè)的珍貴資產,因此如何針對高價值顧客對于企業(yè)未來的營收貢獻進行預測,則相當于預測企業(yè)的資產消長。高價值顧客相對于忠實型顧客來說,雖然平均交易金額大,但在購買時間上,也就是離最近一次消費的時間,相對來說比較久,因此必須通過分析與營銷策略找出能縮短購買時間的有效手段。
1)高價值顧客與全體之比較
在此超市交易數據中,高價值顧客群占總群體的62.77%,總交易金額為63,059,718元亦占全體金額的61.44%,約為其他三個族群的1.6倍,可知此超市的銷售主要來自高價值顧客,也是最主要的客群來源。
2)高價值顧客分項討論
在2017年到2018年間,高價值顧客群的主要客層:
A.女性消費者比例最多(67.14%,2018),但男性比例也不容忽視(32.86%2018)
B.學歷在2017年與2018年主要是高中最多(43.67%,2017)(36.14%,2018)
C.消費者多為已婚,但有減少的趨勢(77.38%,2018)
D.家庭人口由7人以上(47.54%,2017),逐漸被3~4人以上取代(44.07%,2018)
E.職業(yè)在2017年與2018年皆以家庭主婦占最多(31.52%,2018)
F.家庭月收入為1萬~1.5萬元(33.76%,2018)為最多
以下就以幾項基本數據進行進一步的討論:
就性別來看,不論男女超過一半以上都是屬于高價值顧客群,其中男性占了將近75%,店號1073的男生最多(15640),占了男性人數的百分之五十;而這些男性在購買商品,除了白米以外,家庭用品、洗衣粉/液、油類以及抽取式衛(wèi)生紙的交易金額也占了相當大的一部分。根據上述,可以推測男性大多是購買家庭用品并幫家中添購基本必需品。
月收入:高價值顧客不免讓人直觀定義為高收入,但事實上此族群的主要組成為月收入1~1.5萬元的會員,約為1.5萬元以上的2倍,且主要分布在店號1073,且主要購買的商品多為白米、果蔬類。
店:此客群與其他不同的是,每家店皆有高價值顧客,甚至在4001、4002為主宰者;從銷售金額來看,大部分來自1023、1073這兩家店,但值得關注的是1051,2018年的銷售量逐漸追上1073。因此可以初步推論剛增設的分店4001、4002可能會成為未來的發(fā)展要店,其他三家銷售金額較高的店家則為目前首要目標。
2)高價值顧客的暢銷商品
高價值顧客群本身就占全體相當大一部分的組成,因此不論在分類總件數或是總金額均與全體相同,總件數主要為白米、家庭用品、鮮奶等;而總金額則以白米、鮮奶、衛(wèi)生紙為大宗,因此我們可以推論在營銷手法上,商品在此群體中若主打這些暢銷商品,就幾乎等于對全體做營銷策略。
4結論與建議
4.1忠實顧客群
因為忠實顧客群就是較常來消費、買得較多的消費者,通過營銷策略,達到讓他們更“?!眮碣I、買得更“多”的目的。針對提升品牌忠誠度,使得消費者更頻繁地來消費,可以利用下列兩種方法:
1)紅利積點
每一次的消費金額可以依比例作為紅利點數,可以提供下次消費的折扣。不但當次消費金額可能因為有之前紅利折扣而增加,也可以使回客率上升,提供消費者下次購買的誘因。
2)以暢銷商品作為主題
忠實顧客群的暢銷商品通常為米、餅干、果蔬類、洗衣粉/液等家庭生活用品,可以不定期在商場內舉辦暢銷商品的主題特賣,例如某一時期就引進日本高級米作為主題宣傳,在現場提供免費試吃等。根據消費者喜歡嘗鮮的心態(tài),以及心理預期不定時舉辦的活動,顧客會更常來光顧,也可以維持消費者對于來此消費的興趣。而至于提升單次消費的金額,提供了下列兩種方法:
1)大包裝商品促銷
忠實顧客群中的客層主要為3~4或7人以上家庭,因此通常大包裝的商品對于他們有一定的吸引力,如果再加上一些促銷手段,消費者可能從原先選擇的小包裝,大包裝商品,增加當次的消費金額。
2)現金反饋
根據平均消費金額,再加上一點金額訂定滿千折百的促銷,提高單次平均消費金額。
4.2潛力顧客群
針對潛力顧客群對企業(yè)活躍度高,但總金額不高的特性,提出的營銷建議以促銷高單價商品、刺激購貨數量以提升總消費金額為主,有如下3點建議:
(1)消費者最易伸手拿與其視線平行的商品,因此在與視線平行的貨架上放置高單價商品,即潛力顧客群的暢銷商品:白蘭地與葡萄酒,以提升其消費數量與總金額。
(2)將薄利多銷商品放在超商入口處,可有效提高購買數量,因此建議將此客群整體而言購買件數、金額的商品放置在超商入口處,如:家庭用品、甜味餅干、其他油。
4.3流失顧客群
流失顧客群是較不常來消費、買得較少的消費者,因此需通過營銷策略,增加顧客來店頻率與提升消費金額。并針對店家與品牌忠誠度,可以利用下列三種方法:
1)會員紅利與滿額贈活動
推出集點紅利活動、滿額贈的誘因吸引消費者,(如:消費滿500元可兌換贈品或累積紅利點數),來提高顧客客單價與消費金額。
2)以暢銷商品作為主打
流失顧客群的暢銷商品通常為米、鮮奶、家庭用品類商品,雖然所購買的金額較少,但仍與整體顧客所購買的商品類別相似。因此仍需鎖定流失客群喜好的商品,做促銷提醒。
3)觀察競爭對手
除了商品因素,流失客群的增加可能與附近鄰近競爭者的興起有關,可能為小型超商或是其他連鎖超市,店家應觀察附近競爭者形態(tài),檢視自我店面形態(tài)、店內環(huán)境因素、或有其他應可改善的方面,做加強與補足。
4.4高價值顧客群
高價值顧客的組成主要還是已婚女性,但男性大多數屬于此客群,其他變量如家庭人口數3人以上,月收入1萬~1.5萬,職業(yè)為家庭主婦、商、服務業(yè),學歷高中等皆為此群體的主要特性。
主要的營銷策略制定方向在于縮短距離前一次購買時間的距離,提高購買的頻率,使其成為具有高價值的忠實客戶。
1)回購禮
此策略主要為減少購買時間的長度,提升高價值顧客群的回購率。主要可以通過禮券或點數的發(fā)放,提高再次來店消費的頻率。
2)男性客群—寵愛家人系列活動
因為大多數的男性皆屬于此客群,且購買的物品大多為家庭必需品相關,因此通過(寵愛家人)系列活動,提倡多項產品的組合優(yōu)惠,并且拉長系列活動的時間,或者是定期優(yōu)惠不同商品組合,改善來店的頻率。
參考文獻:
[1] 王爽.互聯(lián)網與文化生產、推廣和消費研究[D].濟南:山東大學,2016.
[2] 唐容.基于特征選擇的CART算法研究[D].成都:電子科技大學,2020.
[3] 白燕燕.基于客戶細分的潛在高價值客戶挖掘實證研究[D].蘭州:蘭州財經大學,2017.
[4] 李仁鐘,李秋緣.零基礎學R語言數據分析[M].北京:清華大學出版社,2018.
[5] 馬培梁.基于K-means算法的數據挖掘與客戶細分研究[J].市場研究,2019(11):66-67.
[6] 陳子璐.基于RFM模型的電子商務客戶細分[J].市場周刊,2020(4):56-58.
[7] 李健,王小蒙.基于R語言的數據挖掘工具的設計[J].內蒙古科技與經濟,2017(24):58-59.
[8] 裴晨.基于隨機森林與GBDT的社會醫(yī)療保險欺詐識別問題研究[D].大連:東北財經大學,2018.
[9] 鄭菱芝.基于客戶忠誠度分類的零售業(yè)購物籃分析[D].杭州:浙江工商大學,2018.
[10] 段清陽.基于會員分類的會員關系管理應用研究——以雅戈爾企業(yè)為例[D].西安:長安大學,2019.
【通聯(lián)編輯:王力】