胡艷霞 劉尖學(xué) 洪宗民
摘要:因B2C電子商務(wù)的競爭對個性化服務(wù)提出更高的要求,該文以某B2C電子商務(wù)網(wǎng)站建設(shè)為研究背景,結(jié)合粒子群優(yōu)化算法與 K-means 算法,以改進(jìn)K-means算法陷入局部最小和對初始聚類中心敏感的缺陷,并應(yīng)用到本文電子商務(wù)網(wǎng)站客戶細(xì)分中,得到具有不同特征的客戶群組,方便企業(yè)對客戶進(jìn)行針對性推薦服務(wù),用有限的資源提高客戶購買量,提高企業(yè)效益。理論分析和實驗結(jié)果表明本算法具有較優(yōu)的全局收斂性且收斂速度快的特點。
關(guān)鍵詞:B2C;客戶細(xì)分;PSO;K-means算法;全局收斂性
中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)35-0158-04
Abstract: B2C e-commerce competition has made higher requirements for personalized services , Taking a B2C e-commerce website construction background, combined with PSO and K-means algorithm, to improve the K - means algorithm trapped in local minimum and is sensitive to the initial clustering center of the defect, and applied to customer segmentation, get customer group with different characteristics. It can support enterprise to make a specific recommendation service for each kind of customer, with limited resources to improve customer purchases, and improve the efficiency of the enterprise. The theory analysis and experimental results show that, the algorithm has greater global convergence.
Key words: B2C; customer segmentation; PSO; K-means algorithm; global convergence
隨著電子商務(wù)的發(fā)展,傳統(tǒng)企業(yè)的實體店鋪經(jīng)營模式逐漸向網(wǎng)絡(luò)商務(wù)營銷模式擴展。互聯(lián)網(wǎng)為中小企業(yè)發(fā)展提供了一個更好的快速發(fā)展平臺,通過網(wǎng)站建設(shè)實現(xiàn)網(wǎng)絡(luò)營銷和電子商務(wù)成為時代發(fā)展的必然趨勢。本文以浙江省金華市某B2C電子商務(wù)網(wǎng)站建設(shè)為研究背景,其經(jīng)營品類涵蓋滿足人們?nèi)粘R率匙∠M的各類商品。
在電子商務(wù)環(huán)境下,客戶不僅獲取商務(wù)信息更為便捷,而且轉(zhuǎn)化成本也大大降低,導(dǎo)致客戶極易轉(zhuǎn)向競爭者。因此,針對不同的客戶群體進(jìn)行針對性的管理,已經(jīng)成為電子商務(wù)企業(yè)面臨的重大任務(wù)。而科學(xué)合理的客戶細(xì)分是電子商務(wù)企業(yè)有效實施市場策略的第一步,是成功管理客戶關(guān)系的基石。
1 B2C電子商城
1.1運營模式特點
對比傳統(tǒng)商務(wù)活動,本文B2C電子商務(wù)實現(xiàn)了交易的無紙化、自動化、數(shù)字化。其主要特點有:(1)用戶數(shù)量龐大,客戶的每一次搜索,每一次瀏覽點擊,每一次成功或失敗的交易都構(gòu)成了客戶個人數(shù)據(jù)庫的一個子集。(2)動態(tài)性,客戶數(shù)據(jù)更新頻繁。B2C電子商務(wù)的發(fā)展消除了商務(wù)活動在時間、地域上的限制;完成一次交易可能只需數(shù)十秒而且無需面對面的交易;智能終端、移動互聯(lián)網(wǎng)更加促進(jìn)了B2C電子商務(wù)交易能夠隨時隨地隨心進(jìn)行,因而,每個客戶的數(shù)據(jù)庫信息都處于隨時變動的狀態(tài)。(3)結(jié)構(gòu)性,B2C電子商務(wù)通過數(shù)據(jù)處理、傳輸、交換及電子支付過程將商務(wù)活動中的訂貨、付款、配送等中心環(huán)節(jié)有機聯(lián)系起來,把電子信息處理和人工操作進(jìn)行集成,提高了人力、物力的利用率。(4)交易轉(zhuǎn)化成本低。在B2C模式中,企業(yè)與客戶之間的交流渠道增加,各種購物輔助軟件,使得價格對比、產(chǎn)品對比實施起來方便及時且成本低廉,客戶基本上可以隨時通過網(wǎng)絡(luò)掌握實時的供需信息,在此種情況下客戶很容易就會因某家店的價格過高或產(chǎn)品評論不好而轉(zhuǎn)向同類產(chǎn)品的競爭者進(jìn)行交易。(5)客戶體驗要求增強。B2C模式下交易各方都是通過網(wǎng)絡(luò)這個虛擬環(huán)境進(jìn)行,賣方對于買方實物的交付存在延遲性,因而客戶的在線購物體驗、個性化的服務(wù)要求成為該B2C電子商務(wù)企業(yè)生存的關(guān)鍵。
1.2業(yè)務(wù)流分析
本文B2C電子商務(wù)網(wǎng)站的業(yè)務(wù)流程如下:首先由管理員將商品分類等信息保存到數(shù)據(jù)庫中,再發(fā)布商品信息。系統(tǒng)管理員可以對商品信息進(jìn)行管理,包括添加、修改、刪除、按條件查詢商品信息以及處理用戶訂單。所有信息進(jìn)人數(shù)據(jù)庫保存,并顯示在網(wǎng)站前臺。注冊用戶登錄網(wǎng)上商城可進(jìn)行商品檢索,查看商品信息。并將所需購買的商品加入購物車,完成訂單。
1.3客戶類型
根據(jù)客戶需求和購物動機等標(biāo)志將電子商務(wù)的客戶劃分為幾種不同的類型:
時間饑餓型客戶:經(jīng)??梢栽陔p收入家庭中發(fā)現(xiàn),他們愿意在購物時支付更高的價格或額外費用來節(jié)約時間,而不管是否喜歡在線購物體驗。
購物逃避型客戶:不喜歡購物,他們可能只是通過網(wǎng)上購物來避免擁擠的人群、排隊或堵塞的交通。
狩獵型客戶:喜歡價格比較的過程和搜索物超所值的商品。
品牌型客戶:是指為了某個特定品牌而在線購物的客戶,也許是能給商家?guī)碜罡呷司麧櫟目蛻羧后w。
隨眾型客戶:看到周圍的朋友同事都在這家網(wǎng)店購物,也會隨眾消費。
1.4客戶細(xì)分的作用
如今B2C電子商務(wù)企業(yè)的經(jīng)營關(guān)鍵已變?yōu)橥ㄟ^維持客戶忠誠度、提高客戶滿意度來保證自己的市場競爭力,這就需要B2C電子商務(wù)企業(yè)增強對客戶需求的關(guān)注力度,及時給出推薦信息,而及時得到合理建議的客戶很可能更有價值(因為他們購買更多的東西)且更忠誠(因為他們感到與銷售商有更緊密的關(guān)系)。而通過客戶細(xì)分便可實現(xiàn)這一目標(biāo)。
本文電子商城為了對客戶進(jìn)行針對性推薦服務(wù),提高網(wǎng)站、購物車轉(zhuǎn)化率,用有限的資源提高客戶購買量,提高企業(yè)效益,需要提取客戶特征進(jìn)行細(xì)分,得到具有不同特征的客戶群組。
1.5應(yīng)用K-means算法進(jìn)行客戶細(xì)分的不足
在客戶細(xì)分方面,現(xiàn)在普遍采用聚類分析算法[5],聚類分析中廣泛使用的是簡潔、高效且易實施的K-means算法。根據(jù)客戶的交易明細(xì)、購買偏好等信息,利用k-means算法對這些數(shù)據(jù)進(jìn)行挖掘,可以科學(xué)有效地對企業(yè)的客戶進(jìn)行細(xì)分。
但是K-means 算法的聚類結(jié)果通常會隨著初始聚類中心的不同而不一樣,隨機選取的初始聚類中心可能會使K-means 算法陷入局部最優(yōu)解。針對上述問題,利用粒子群優(yōu)化算法全局搜索能力強的特點,結(jié)合K-means 算法,本文提出一種混合的PSOK聚類算法以克服K-means算法陷入局部最小和對初始聚類中心敏感的缺陷。
2 PSOK算法
2.1 K-means算法
輸入:樣本數(shù)據(jù)集X和聚類數(shù)k
輸出:k個類
(1)隨機選擇k個初始聚類中心;
(2)逐個將數(shù)據(jù)集X中各點按最小距離原則分配給k個聚類中心的某一個;
(3)重新計算每個類的聚類中心;
(4)若新的聚類中心和原來的聚類中心相等或小于預(yù)設(shè)閾值,則計算結(jié)束,否則轉(zhuǎn)步驟(2)。
2.2 自調(diào)整慣性權(quán)值的PSO優(yōu)化算法
其中: Xij為i個粒子的d維位置矢量;Vij為粒子的飛行速度;Pij為粒子迄今為止搜索的最優(yōu)位置;Pgj為整個粒子群迄今為止搜索的最優(yōu)位置;w為慣性權(quán)值,表示先前粒子的速度對當(dāng)前速度的影響程度; [r1,r2]為兩個相互獨立的隨機函數(shù),在0~1之間取值;[c1,c2]為學(xué)習(xí)因子。
粒子群算法雖然編碼簡單,容易實現(xiàn),但它在優(yōu)化過程初期收斂速度較快,后期所有粒子都向最優(yōu)粒子學(xué)習(xí),失去種群多樣性,易陷入局部最優(yōu)。針對粒子算法的局限性,本文提出一種自調(diào)整慣性權(quán)值策略,它能改變w 為定值的單一模式,較好地權(quán)衡全局與局部搜索能力[4]。
2.3 PSOK算法編碼與適應(yīng)度選擇
本文采用的是基于粒子數(shù)的編碼方式,也就是每個粒子的位置是由N個聚類中心組成,粒子除了位置外,還有速度、適應(yīng)度值和聚類中心。由于樣本向量維數(shù)為D,因此粒子的位置是[N×D]維變量,所以粒子的速度也應(yīng)當(dāng)是[N×D]維向量,粒子都有其適應(yīng)度,和一個表示是哪個聚類中心的數(shù)目。
PSOK算法的步驟如下:
(1)對粒子群進(jìn)行初始化:設(shè)置種群規(guī)模(粒子個數(shù))m、粒子維數(shù)d,聚類數(shù)目k,搜索空間的大小、位置及速度的邊界xmax , xmin , vmax , vmin和各個參數(shù)的值,把所有樣本隨機指派到k個簇中,并計算k個簇的聚類中心,從而得到一個粒子,重復(fù)執(zhí)行m次,得到m個粒子。隨機初始化各粒子的初始速度和初始位置。
(2)根據(jù)式(5)計算每個粒子的適應(yīng)度值。
(3)對每個粒子,比較當(dāng)前適應(yīng)度值和它經(jīng)歷過的最好位置的適應(yīng)度值。若更好,則更新;對每個粒子,比較自己當(dāng)前最好適應(yīng)度值和群體所經(jīng)歷的最好位置的適應(yīng)度值。若更好,則更新。
(4)根據(jù)粒子的速度公式和位置公式調(diào)整粒子的速度和位置。
(5)樣本的K均值優(yōu)化。對于新一代粒子,按照以下的K均值算法進(jìn)行優(yōu)化:
首先根據(jù)粒子的當(dāng)前位置(k個新的聚類中心),按照最近鄰法則,確定每一個樣本應(yīng)該在哪一個簇中;其次樣本全部歸類后,重新計算聚類中心(粒子的位置),重新計算適應(yīng)度值,更新粒子的適應(yīng)度值。
(6)判斷是否達(dá)到最大迭代次數(shù)或者滿足最小誤差,如果終止條件滿足則輸出全局極值以及獲得全局極值的位置并結(jié)束算法,否則重復(fù)第二步。
3 實驗與結(jié)果分析
3.1算法比較
實驗數(shù)據(jù)采用某B2C電子商城2015年一萬多位客戶的消費數(shù)據(jù)。對原始數(shù)據(jù)進(jìn)行預(yù)處理后產(chǎn)生11326條記錄。經(jīng)過處理后的數(shù)據(jù)共有服裝類、食品類、辦公類、家居類、奢侈品類這5維特征。文中根據(jù)這5維特征對數(shù)據(jù)進(jìn)行分析比較。分別使用Matlab對PSOK算法和K-means算法進(jìn)行實驗數(shù)據(jù)處理。
從圖2可以看出,在同等條件下,K-means算法收斂速度很快,但很容易陷入局部最小值,而PSOK算法全局尋優(yōu)能力優(yōu)于K均值算法,而且由于粒子群算法不存在隨機尋優(yōu)的退化現(xiàn)象,因此收斂比較平穩(wěn),有較快的收斂速度。
3.2客戶細(xì)分聚類結(jié)果
在未進(jìn)行聚類前,數(shù)據(jù)分布比較雜亂,從統(tǒng)計學(xué)角度來看,總消費在1000元以下的客戶有3858位,占總?cè)藬?shù)的34%;總消費在(1000-5000)元之間的客戶有6783位,占總?cè)藬?shù)的59.8%;5000元以上的客戶只有685人,約占總?cè)藬?shù)的6%。通過這種統(tǒng)計,我們對客戶購買商品只有一個總額上的概念,對客戶的消費偏好得不到任何細(xì)致的信息。
本文中的PSOK算法對這些數(shù)據(jù)進(jìn)行聚類,輸入樣本數(shù)據(jù)集X,聚類數(shù)目K,設(shè)置粒子群體大小N,初始化種群,對數(shù)據(jù)集進(jìn)行處理,聚類結(jié)果如表l所示:
根據(jù)以上聚類結(jié)果,我們看到數(shù)據(jù)集被分成三類。其中第二類群體,客戶人數(shù)最多,約占樣本總數(shù)的60%,這類群體是電子商城的主要客戶。這類客戶的平均消費特征如下:辦公用品消費金額占了他們消費總額的一半以上。他們主要以辦公用品消費為主,企業(yè)就可以向這類客戶重點推薦辦公用品。
第三類客戶人數(shù)最少,可是平均消費金額卻很高,這類客戶的平均消費特征如下:奢侈品消費金額占了他們消費總額的一半以上。他們主要以奢侈品消費為主,為企業(yè)創(chuàng)造了豐厚的利潤,企業(yè)可以利用有限的資源重點維系這些客戶,向他們重點推薦奢侈品。
第一類客戶相較于第二類客戶人數(shù)偏少,平均消費金額較少,這類客戶的平均消費特征如下:服裝和食品(生活日用品)的消費金額占了他們消費總額的一半以上。他們主要以生活日用品的消費為主,屬于消費能力偏低的人群。針對這類群體登錄電商網(wǎng)站時重點廣告推薦生活日用品。
從這三類群體的消費特點可以看出客戶的消費偏好,在進(jìn)行針對性推薦時,可以花費最小的代價向客戶推薦他們最感興趣的商品,相對于僅僅依靠統(tǒng)計學(xué)分析,只給那些消費總額大的客戶盲目推薦各式商品信息相比,這種方式更加有效,更能為企業(yè)創(chuàng)造價值。
以上是基于客戶消費偏好的細(xì)分,把具有相似特征的客戶歸為一類,不同特征的客戶分為不同的類,方便企業(yè)進(jìn)行針對性推薦服務(wù),用有限的資源提高客戶的購買量,提高企業(yè)效益和競爭力。
4結(jié)束語
實驗表明本文提出的PSOK算法具有較優(yōu)的全局收斂性且收斂速度快的特點。將其應(yīng)用于B2C電子商城客戶細(xì)分中,對客戶數(shù)據(jù)進(jìn)行聚類分析,得到具有不同特征的客戶群組,對不同群組進(jìn)行針對性的推薦服務(wù),用有限的資源提高客戶的購買量,提高企業(yè)效益和競爭力。
參考文獻(xiàn)
[1] 王飛,錢玉文,王執(zhí)銓.基于無監(jiān)督聚類算法的入侵檢測[J].南京理工大學(xué)學(xué)報,2009,33(3):288-292.
[2] 馮靜,舒寧. 群智能理論及應(yīng)用研究[J]. 計算機工程與應(yīng)用,2006,42(17):31-34.
[3] 李峻金,向陽,蘆英明,吳朔桐. 粒子群聚類算法綜述[J]. 計算機應(yīng)用研究,2009,26(12):4424-4425.
[4] OMRANG M, SALM AN A, ENGELBRECHT A P. Image classification using paticle swarm optimization[C]. proc of the 4th Asia-Pacific Conference on Simulated Evolution and Learning 2002:370 - 374.
[5] 何煥. 聚類技術(shù)在客戶細(xì)分中的研究與應(yīng)用[D].江西:江西理工大學(xué),2009.