趙琨 楊瀟瀟
摘 要:近年來快遞業(yè)陷入價格戰(zhàn),在電子商務(wù)蓬勃發(fā)展的背景下,快遞業(yè)作為一個匯聚著海量數(shù)據(jù)的行業(yè),對數(shù)據(jù)的合理挖掘利用更可能帶來下一個利潤增長方向。以某快遞公司一年的消費者行為數(shù)據(jù),運用kohonen網(wǎng)絡(luò)進行客戶畫像。通過對同類的商品市場進行比較、分析與預(yù)測,便于商家了解自家產(chǎn)品銷售與市場反饋情況,比較競爭對手的產(chǎn)品,從而對產(chǎn)品進行優(yōu)化。
關(guān)鍵詞:數(shù)據(jù)挖掘;客戶畫像;kohonen網(wǎng)絡(luò)
中圖分類號:F27 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2018.24.022
1 引言
近年來,隨著互聯(lián)網(wǎng)的普及和移動智能終端的發(fā)展,電子商務(wù)以驚人的速度崛起,由此帶來的快遞需求也使得我國快遞行業(yè)快速成長,快遞行業(yè)積累及掌握的客戶信息更是過去無法比擬的,而這些數(shù)據(jù)所攜帶的信息價值更是難以估量的。在我國快遞行業(yè)競爭日趨白熱化的過程中,以四通一達為代表的民營快遞企業(yè)業(yè)務(wù)量蒸蒸日上,但服務(wù)產(chǎn)品同質(zhì)化現(xiàn)象甚為突出,缺乏個性與核心競爭力,導致客戶黏性不高,企業(yè)發(fā)展后勁不足。本文嘗試探索快遞公司業(yè)務(wù)的另一種可能性,將快遞公司手握的海量數(shù)據(jù)加以挖掘分析,增進對下游最終客戶的了解,以期提高快遞公司在鏈條中的地位并增加其業(yè)務(wù)板塊的多樣性,助力快遞行業(yè)產(chǎn)生新的價值增長方向。
姚風起(2015)提出快遞企業(yè)應(yīng)及時轉(zhuǎn)變思路,提供差異化服務(wù),并加快企業(yè)的轉(zhuǎn)型升級,由人員密集型產(chǎn)業(yè)向技術(shù)密集型轉(zhuǎn)變,從價格競爭升級為服務(wù)競爭。Kent Gourdin (2001)構(gòu)建了關(guān)于網(wǎng)購的消費者快遞服務(wù)體驗?zāi)P椭械贸隹爝f服務(wù)水平會通過影響終端客戶進而直接影響電商服務(wù)水平的結(jié)論。Jana Sporran (2013)分析了電商背景下的快遞業(yè)的基礎(chǔ)上,比較國有快遞企業(yè)和民營快遞企業(yè)的優(yōu)、劣勢及新環(huán)境下的競爭力,并對其發(fā)展方向提出思考。Ying Xu;Xuemei Zhang等(2016)提出供應(yīng)鏈環(huán)境下的電子商務(wù)和快遞業(yè)兩者的盈利與協(xié)作模式。Michael Beasley(2013)從度量和維度兩個角度先對數(shù)據(jù)進行過濾,再專注于用戶群表現(xiàn)出的特征行為,或比較不同用戶群間不同的設(shè)置,從而細分客戶。Deepa Ittimani Tholath與Fr.Casimirraj S.J.(2016)利用人口統(tǒng)計學相關(guān)理論,將客戶細分為不同類,并為之描述出不同分類客戶的典型模式,在客戶消費的過程中,客戶在消費旅程地圖每一步的決策行為都會影響最后的決策點。侯洪濤、黃有方(2012)利用Apriori算法,通過對消費者性別、年齡、收入、居住地、婚姻狀況等有關(guān)屬性的關(guān)聯(lián)度分析,尋找屬性間的關(guān)聯(lián),以期能對其他未知的客戶屬性進行預(yù)測。劉海、盧慧等(2015)先運用4C理論構(gòu)建用戶畫像的數(shù)據(jù)庫,再對其挖掘進行客戶細分,最后以三槍集團的身高因素為例進行實證分析。李冰,王悅,劉永祥(2016)基于K均值算法對卷煙客戶畫像,使末端零售商針對客戶進行個性化服務(wù)與推薦。崔琳(2016)基于SQL Server DQS的數(shù)據(jù)質(zhì)量控制,以香港某餅家的營銷數(shù)據(jù)為對象,構(gòu)建客戶畫像的數(shù)據(jù)庫與指標體系,并為其設(shè)計了更新維護方案,再利用Apriori算法實現(xiàn)購物籃分析,利用 k-means 算法實現(xiàn)客戶分層分類,最終基于挖掘結(jié)果進行智能推薦與針對營銷。趙飛鴻(2016)引入美國學者Pang-NingTan提出的二分聚類算法,基本思路是將所有點集合先分裂成兩個簇,再從兩個簇中根據(jù)條件選取一個繼續(xù)分裂,如此反復,最后生成K個簇。
2 客戶行為分析與畫像
此次對客戶畫像的數(shù)據(jù)來自于某公司2016年每天的訂單信息,共有三十幾萬條記錄,原始數(shù)據(jù)表的可用字段如下:復核時間、發(fā)貨人、站點、配送區(qū)域、行政區(qū)域、產(chǎn)品名稱、總件數(shù)、配送日期、配送日、客戶訂單號、收貨人、溫帶要求、發(fā)貨人類型、備注、妥投日期、妥投日、經(jīng)度、緯度、服務(wù)要點、重要客戶否、標準地址。由于原始數(shù)據(jù)存在缺失值、錯誤值、錯別字、描述不統(tǒng)一等情況,故在數(shù)據(jù)分析前需進行數(shù)據(jù)篩選和規(guī)范。由于快遞公司并不直接掌握產(chǎn)品目錄,故需要有大量的關(guān)于產(chǎn)品的數(shù)據(jù)預(yù)處理,使之形成一個標準的產(chǎn)品目錄。
客戶畫像就是通過貼標簽,得到客戶的立體印象,一個客戶身上有多重標簽,這些標簽可以有包含關(guān)系,并列關(guān)系等。根據(jù)產(chǎn)品目錄,了解到該快遞公司服務(wù)的所有商家的經(jīng)營范圍,并建立一個商品標簽庫,當然還可以建立人物的身份標簽,如家庭主婦,上班族,學生等,但S快遞公司目前的主要商戶主營生鮮食品,其主要客戶一般都是家庭主婦,故此處就不詳細建立身份標簽庫。此標簽表還能繼續(xù)下分,每樣商品的標簽可以交錯,比如水晶燈既屬于燈具也屬于家居飾品,正如每個人都有多重屬性多樣身份,再利用Apriori算法結(jié)合歷史消費記錄中與該商品關(guān)聯(lián)度高的商品標簽,給各商品分配各標簽比重,便于最后根據(jù)各類消費群的消費熱點與消費偏好描述各類消費群特點。從客戶消費數(shù)據(jù)中篩選出年消費次數(shù)較高前100名客戶的數(shù)據(jù),再將每個客戶的所有訂單都整合成單獨一條記錄,將各產(chǎn)品的消費數(shù)量進行各自匯總,最后新數(shù)據(jù)源表:154個字段,100條記錄,性別0代表男性,1代表女性,行政區(qū)1-16分別表示東城、西城、海淀、朝陽、豐臺、門頭溝、石景山、房山、通州、順義、昌平、大興、懷柔、平谷、延慶、密云16個市轄區(qū),其余的是商品字段,這些商品消費信息可以是各種渠道的,不局限于某一家店鋪或者某一線上平臺,這也是快遞公司的優(yōu)勢:聚集各方資源。若還能和商家合作,數(shù)據(jù)維度越廣,越能形象地刻畫描述客戶,其結(jié)果的可靠性也會更強。根據(jù)此次客戶消費數(shù)據(jù)的結(jié)果特性,可總結(jié)出本次判斷各類消費傾向方法。
最后根據(jù)橫縱向比較各類消費品的價格、消費品類型、消費次數(shù)等,結(jié)合商品標簽,將各類消費群進行描述,一共有9個消費群。可以發(fā)現(xiàn)女性消費者是該快遞公司承接商戶的消費主力,這與商戶的主營范圍有關(guān),該快遞公司的幾個主要商戶都是主營生鮮食品,故本次數(shù)據(jù)中大多是有關(guān)生鮮消費的數(shù)據(jù)。由于客戶的消費興趣、習慣等也會發(fā)生改變,故客戶畫像的標簽也要定期進行維護更新,依據(jù)消費時間的由遠到近,將消費記錄的權(quán)重由小到大進行分配,再進行消費結(jié)果的更替。Kohonen網(wǎng)絡(luò)作為一種神經(jīng)網(wǎng)絡(luò)算法適用范圍較廣,結(jié)果相較更合理。
3 結(jié)論
本文以某快遞公司的數(shù)據(jù)進行客戶畫像,通過聚類算法提取客戶特征,將客戶標簽化,便于商家針對營銷與挖掘潛在相關(guān)客戶。本文的方法具有良好的遷移效果,由于快遞公司手握許多商家的客戶數(shù)據(jù)信息,故可通過上述方法,快遞公司還能通過大數(shù)據(jù)對上游商家的產(chǎn)品進行畫像,該產(chǎn)品的消費人群特點,競品的特點及競品消費人群特點,替代品或互補品的消費情況等,通過對同類的商品市場進行比較、分析與預(yù)測,便于商家了解自家產(chǎn)品銷售與市場反饋情況,比較競爭對手的產(chǎn)品,從而對產(chǎn)品進行優(yōu)化。
參考文獻
[1]姚風起,當前快遞業(yè)價格戰(zhàn)問題探究[J].知識經(jīng)濟,2015,(24):69-69.
[2]Kent N Gourdin.Global logistics management:a competitive advantage for the new millennium[M].Blackwell PublishersLtd,2001,218-230.
[3]Jana Sporran.Electronic Commerce Internet Strategies and Business Models–A Survey [J].Information Systems Frontiers,2013,(14):96-110.
[4]Ying Xu;Xuemei Zhang;Jian Cao;Ya Chen;Xuhong Ye;Paolo Renna,Collaboration and Evolution of E-Commerce and Express Delivery Industry Supply Chain[J].Hindawi Publishing Corporation,2016.
[5]Michael Beasley,Segmentation[M].ElsevierInc,2013:135-155.
[6]DeepaIttimani Tholath、Fr.Casimirraj S.J.,Customer Journey Maps for Demographic Online Customer Profiles[J].International Journal of Virtual Communities and Social Networking (IJVCSN),2016:1-18.
[7]侯洪濤,黃有方.基于Apriori算法的銀行客戶行為分析[J].硅谷,2012,(03):20-21.
[8]劉海、盧慧、阮金花、田丙強、胡守忠,基于“用戶畫像”挖掘的精準營銷細分模型研究[J].Journal of Silk,2015,(12).
[9]李冰,王悅,劉永祥.大數(shù)據(jù)環(huán)境下基于K—means的用戶畫像與智能推薦的應(yīng)用[J].現(xiàn)代計算機,2016,(08):11-14.
[10]崔琳,基于客戶畫像的數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用[D].上海:東華大學,2016.
[11]趙飛鴻,基于金融類客戶畫像的二分K值算法分析研究與應(yīng)用[D].北京:中國科學院大學,2016.