• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      電子商務(wù)客戶流失的DBN預(yù)測(cè)模型研究

      2022-06-09 11:57:58周婉婷趙志杰王加迎韓小為
      關(guān)鍵詞:活躍天數(shù)權(quán)重

      周婉婷,趙志杰,劉 陽(yáng),王加迎,韓小為

      1.哈爾濱商業(yè)大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,哈爾濱 150028

      2.哈爾濱商業(yè)大學(xué) 黑龍江省電子商務(wù)與信息處理重點(diǎn)實(shí)驗(yàn)室,哈爾濱 150028

      大數(shù)據(jù)時(shí)代下,電子商務(wù)的快速發(fā)展使得行業(yè)之間的競(jìng)爭(zhēng)愈發(fā)激烈,客戶對(duì)產(chǎn)品與服務(wù)信息獲取渠道越來(lái)越多,電子商務(wù)企業(yè)面臨著產(chǎn)品同質(zhì)化嚴(yán)重、同行競(jìng)爭(zhēng)加劇,從而導(dǎo)致新增客戶獲取困難、成本增加等行業(yè)問(wèn)題。同時(shí),電子商務(wù)市場(chǎng)不同于傳統(tǒng)線下市場(chǎng)能獲取到穩(wěn)定客源,客戶流失量較高。因此對(duì)于電子商務(wù)市場(chǎng)而言,維護(hù)好留存客戶,保持客戶忠誠(chéng)度,降低客戶流失率是當(dāng)前面臨的主要問(wèn)題。電子商務(wù)客戶流失預(yù)測(cè)可以幫助商家預(yù)測(cè)流失趨勢(shì),構(gòu)建適合電子商務(wù)數(shù)據(jù)特性的影響因素指標(biāo)體系,有針對(duì)性地提出挽留措施,提高商家利潤(rùn),因此,電子商務(wù)客戶流失預(yù)測(cè)是電子商務(wù)領(lǐng)域的一個(gè)重要研究方向[1]。

      一般傳統(tǒng)線下的客戶關(guān)系主要靠契約維持,而電子商務(wù)中的客戶關(guān)系屬于非契約關(guān)系,致使客戶流失的可能性增加。針對(duì)電子商務(wù)非契約的不穩(wěn)定環(huán)境,學(xué)者通常將客戶流失當(dāng)作二分類任務(wù),選取當(dāng)下流行的機(jī)器學(xué)習(xí)模型及其集成方法解決預(yù)測(cè)精確度問(wèn)題。然而在上述模型與方法中學(xué)者通常使用全數(shù)據(jù)輸入模式進(jìn)行方法比較從而忽視了不同類型客戶的流失預(yù)測(cè)情況。目前,針對(duì)于客戶流失原因的研究,學(xué)者們遵從Farquhar提出的七大主題處理流失問(wèn)題,對(duì)電子商務(wù)客戶流失具有的隨機(jī)性、時(shí)變性等變化特性關(guān)注不夠。

      本文將UCI數(shù)據(jù)庫(kù)的電子商務(wù)零售數(shù)據(jù)集分為活躍和非活躍用戶兩類。通過(guò)考察電子商務(wù)零售的數(shù)據(jù)特性,結(jié)合客戶流失相關(guān)研究,優(yōu)化傳統(tǒng)RFM理論模型,以構(gòu)建較為全面的電子商務(wù)客戶流失因素體系。采用深度信念網(wǎng)絡(luò)(deep belief networks,DBN)實(shí)證模型對(duì)電子商務(wù)客戶流失進(jìn)行預(yù)測(cè),以提升模型預(yù)測(cè)性能。最后,提取DBN模型的權(quán)重矩陣,計(jì)算電子商務(wù)客戶流失影響因素的相對(duì)強(qiáng)度,為不同類型電子商務(wù)客戶流失原因提供合理解釋,以便為企業(yè)進(jìn)行客戶管理提出有針對(duì)性的建議與策略。

      1 客戶流失相關(guān)研究

      客戶流失預(yù)測(cè)是利用客戶記錄的歷史數(shù)據(jù)對(duì)潛在的流失客戶進(jìn)行判斷的過(guò)程[2]。客戶流失的研究自20世紀(jì)90年代興起之后便一直深受國(guó)內(nèi)外眾多學(xué)者的廣泛關(guān)注。目前,客戶流失研究主要集中于電信、金融等行業(yè),而電子商務(wù)作為互聯(lián)網(wǎng)快速發(fā)展所衍生的行業(yè),也受到了學(xué)者們的青睞。

      國(guó)內(nèi)外學(xué)者對(duì)于客戶流失的影響因素和流失的原因進(jìn)行了大量的研究,F(xiàn)arquhar等討論了美國(guó)銀行業(yè)的客戶獲取和客戶保持之間的平衡問(wèn)題,提出客戶價(jià)值、最大化信息等七個(gè)主題是處理好二者關(guān)系的基礎(chǔ)[3]。Meer等以荷蘭某網(wǎng)上銀行為研究對(duì)象,發(fā)現(xiàn)點(diǎn)擊流是研究客戶保持的較好方法[4]。文獻(xiàn)[5]從社交網(wǎng)絡(luò)的視角出發(fā),利用自我網(wǎng)絡(luò)的相關(guān)理論,在電信行業(yè)中,構(gòu)建了個(gè)體的度、聯(lián)系強(qiáng)度、個(gè)體的信息熵三個(gè)自我網(wǎng)絡(luò)特征變量。

      根據(jù)客戶流失發(fā)展歷程和智能化程度的高低,許多機(jī)器學(xué)習(xí)模型及其集成方法在客戶流失預(yù)測(cè)中得到成功的應(yīng)用,如決策樹(shù)[6]、支持向量機(jī)[7]、改進(jìn)神經(jīng)網(wǎng)絡(luò)[8]等。文獻(xiàn)[9]根據(jù)鐵路零散客戶流失的特征,為提高客戶流失的準(zhǔn)確性與高效性采取了C4.5決策樹(shù)方法進(jìn)行仿真預(yù)測(cè)。Gordini等利用支持向量機(jī)開(kāi)發(fā)出針對(duì)B2B電子商務(wù)行業(yè)量身定制的客戶流失預(yù)測(cè)模型[10]。Amin等針對(duì)于不同公開(kāi)可用的電信技術(shù)數(shù)據(jù)集,基于距離因子的分類器確定性估計(jì)概念提出了一種新穎的客戶流失預(yù)測(cè)方法[11]。

      綜上所述,對(duì)客戶流失預(yù)測(cè)模型構(gòu)建,研究方法多樣,但預(yù)測(cè)模型準(zhǔn)確率有待進(jìn)一步提升。文獻(xiàn)[12]為了驗(yàn)證DBN算法在分類上存在更好的性能,使用UCI上的多個(gè)數(shù)據(jù)集進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明DBN算法比傳統(tǒng)的SVM、KNN等神經(jīng)網(wǎng)絡(luò)的分類準(zhǔn)確度更高。DBN算法是神經(jīng)網(wǎng)絡(luò)的一種,既可以用于非監(jiān)督學(xué)習(xí),也可以用于監(jiān)督學(xué)習(xí),因此模型可以不受時(shí)間、數(shù)據(jù)形式等的限制。基于電子商務(wù)流失數(shù)據(jù)集中冗雜的時(shí)間數(shù)據(jù)以及復(fù)雜的客戶群體之間的特征選取,DBN算法可以運(yùn)用BP層在預(yù)測(cè)領(lǐng)域中的優(yōu)勢(shì)提升電子商務(wù)客戶流失預(yù)測(cè)的準(zhǔn)確度,并通過(guò)訓(xùn)練其神經(jīng)元間的權(quán)重,可以讓整個(gè)神經(jīng)網(wǎng)絡(luò)按照最大概率來(lái)生成訓(xùn)練數(shù)據(jù),并直接得到特征之間的權(quán)重大小確認(rèn)電子商務(wù)客戶流失的影響因素。對(duì)客戶流失因素選擇,學(xué)者們大多基于傳統(tǒng)電信、銀行等線下實(shí)體店進(jìn)行研究,鮮有研究考慮電子商務(wù)數(shù)據(jù)的時(shí)效性及客戶群體劃分情況,探討電子商務(wù)客戶差異性帶來(lái)的影響。因此,本文從客戶活躍角度出發(fā),將客戶分為活躍與非活躍兩類,優(yōu)化傳統(tǒng)RFM模型,確定影響因素指標(biāo)體系。采用DBN方法構(gòu)建電子商務(wù)客戶流失預(yù)測(cè)模型,并利用DBN模型的權(quán)重矩陣,計(jì)算權(quán)重系數(shù),對(duì)比分析不同類型電子商務(wù)客戶流失因素的差異。以幫助企業(yè)盡可能吸引具有潛在價(jià)值的客戶,提升保留客戶的現(xiàn)有價(jià)值。

      2 電子商務(wù)客戶流失預(yù)測(cè)模型構(gòu)建

      2.1 基于改進(jìn)RFM的電子商務(wù)客戶流失理論模型構(gòu)建

      在客戶關(guān)系管理上RFM模型理論是一種重要的客戶價(jià)值分析模型,1994年RFM模型首次被美國(guó)數(shù)據(jù)庫(kù)營(yíng)銷研究所Hughes提出[13],被廣泛應(yīng)用于客戶關(guān)系管理領(lǐng)域中。RFM模型由R(recency)、F(frenquency)及M(money)三個(gè)重要指標(biāo)組成。R表示客戶最近一次購(gòu)買的時(shí)間間隔。從企業(yè)的角度考慮,最近才購(gòu)買過(guò)產(chǎn)品、服務(wù)的客戶是最有可能接受再次購(gòu)買行為的客戶,吸引一名購(gòu)買時(shí)間間隔短的客戶所花費(fèi)的成本遠(yuǎn)小于吸引一名購(gòu)買時(shí)間間隔長(zhǎng)的客戶。R值越小則表明客戶在近段時(shí)間內(nèi)有過(guò)交易行為,客戶的依賴性較高。F表示客戶單位時(shí)間內(nèi)進(jìn)行的消費(fèi)次數(shù)。對(duì)于商家而言,購(gòu)買的頻率越高則表明客戶對(duì)產(chǎn)品或服務(wù)的滿意度越高、客戶的忠誠(chéng)度也越高。F值越大,客戶再次購(gòu)買的意向越高。M表示客戶在一段時(shí)間內(nèi)消費(fèi)總金額。對(duì)于企業(yè)來(lái)說(shuō),購(gòu)買金額越高則表示客戶的價(jià)值越高。M值越大,表明客戶最有可能在未來(lái)一段時(shí)間內(nèi)產(chǎn)生更高的價(jià)值。

      考慮電子商務(wù)客戶沖動(dòng)購(gòu)買心理及進(jìn)入商家的時(shí)間長(zhǎng)度,結(jié)合學(xué)者對(duì)客戶價(jià)值的研究,除RFM模型中頻率(F)、時(shí)間間隔(R)、金錢(M)指標(biāo)外,還引進(jìn)了客戶購(gòu)買的最大金額(MM)、進(jìn)入店鋪的時(shí)間長(zhǎng)度(L)、購(gòu)買天數(shù)(D)以及購(gòu)買的概率(G)。其中,進(jìn)入店鋪的時(shí)間長(zhǎng)度指客戶在觀察期內(nèi)第一次消費(fèi)的時(shí)間距離客戶最后消費(fèi)時(shí)間的長(zhǎng)度,概率是指客戶在已消費(fèi)的天數(shù)中平均每天購(gòu)買的次數(shù)。本文構(gòu)建的RFM模型假設(shè)如下:

      時(shí)間間隔(R):客戶在觀察期間第一次消費(fèi)的時(shí)間距離觀察期最后一次消費(fèi)時(shí)間長(zhǎng)度(流失期限中);

      頻率(F):客戶在單位時(shí)間上購(gòu)買的次數(shù);

      金錢(M):客戶在觀察期消費(fèi)的總金額;

      最大金額(MM):客戶在觀察期消費(fèi)的最大金額;

      進(jìn)入店鋪的時(shí)間長(zhǎng)度(L):客戶在觀察期后第一次消費(fèi)時(shí)間距離客戶最后消費(fèi)的時(shí)間長(zhǎng)度;

      購(gòu)買天數(shù)(D):客戶在觀察期總消費(fèi)天數(shù);

      概率(G):客戶在觀察期內(nèi)消費(fèi)的天數(shù)中平均每天購(gòu)買的次數(shù)。

      RFM電子商務(wù)客戶流失理論模型見(jiàn)圖1。

      圖1 RFM電子商務(wù)客戶流失理論模型Fig.1 Theoretical model of RFM e-commerce customer churn

      2.2 基于DBN的電子商務(wù)客戶流失預(yù)測(cè)實(shí)證模型構(gòu)建

      DBN是深度學(xué)習(xí)方法中的一種常用模型,是一種融合了深度學(xué)習(xí)與特征學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。DBN網(wǎng)絡(luò)結(jié)構(gòu)是由若干層受限玻爾茲曼機(jī)(restricted Boltzmann machine,RBM)和一層BP組成的一種深層神經(jīng)網(wǎng)絡(luò)[13]。DBN結(jié)構(gòu)如圖2所示。

      圖2 DBN結(jié)構(gòu)示意圖Fig.2 DBN structure diagram

      DBN訓(xùn)練過(guò)程由預(yù)訓(xùn)練和微調(diào)構(gòu)成,數(shù)據(jù)首先由輸入層輸入到網(wǎng)絡(luò)結(jié)構(gòu)中,生成一個(gè)向量V,通過(guò)權(quán)重值W傳給隱藏層得到H,單獨(dú)無(wú)監(jiān)督訓(xùn)練每一層RBM網(wǎng)絡(luò),確保特征向量映射到不同特征空間,最后由BP網(wǎng)絡(luò)接收RBM的輸出特征向量作為它的輸入特征向量,反向傳播網(wǎng)絡(luò)自頂向下將錯(cuò)誤信息傳播給每一層RBM,微調(diào)整個(gè)DBN網(wǎng)絡(luò),進(jìn)行有監(jiān)督的訓(xùn)練,最終得到網(wǎng)絡(luò)中的權(quán)重以及偏置。

      2.2.1 受限玻爾茲曼機(jī)

      RBM是1986年由Smolensky提出的一種可通過(guò)輸入數(shù)據(jù)集學(xué)習(xí)概率分布的隨機(jī)生成神經(jīng)網(wǎng)絡(luò)。RBM模型是包含一種可觀察變量(v)和單層隱藏變量(h)的無(wú)向概率圖,RBM只有兩層神經(jīng)元,它是一個(gè)二分圖,兩層間的單元相互連接,層內(nèi)的任何單元之間不存在連接。RBM結(jié)構(gòu)見(jiàn)圖3。

      圖3 RBM結(jié)構(gòu)示意圖Fig.3 RBM structure diagram

      RBM是一種基于能量的模型,任何兩個(gè)連接的神經(jīng)元之間都有一個(gè)權(quán)重W來(lái)表示連接權(quán)重Wij,Wij表示可觀察變量單元i和隱藏變量單元j之間的權(quán)重,觀察層與隱藏層分別用v和h來(lái)表示,則連接權(quán)重與偏差決定的觀察層變量v和隱藏層變量h的聯(lián)合配置能量如下[14]:

      其中,ai是可觀察層單元的偏置,b j是隱藏層單元的偏置,Wij為可觀察層單元與隱藏層單元之間的連接權(quán)重,基于能量函數(shù)的可觀察層和隱藏層可以得到概率分布[15]:

      其中,Z為配分函數(shù)的歸一化常數(shù),即所有參數(shù)下的能量之和,該函數(shù)累加所有可觀察向量和隱藏向量的可能組合。

      RBM中的每層中的神經(jīng)元只存在兩種狀態(tài)0或1,給定任意層中的各神經(jīng)元的狀態(tài),可以得到可觀察層神經(jīng)元和隱藏層神經(jīng)元的狀態(tài)概率如下[14]:

      根據(jù)Hinton在2002年提出的對(duì)比散度,可知參數(shù)的變化規(guī)則如下[14]:

      2.2.2 BP神經(jīng)網(wǎng)絡(luò)

      BP神經(jīng)網(wǎng)絡(luò)是一種多層的前饋神經(jīng)網(wǎng)絡(luò),其輸出結(jié)果采用的是前向傳播,誤差采用反向傳播方式進(jìn)行的。BP神經(jīng)網(wǎng)絡(luò)是含有輸入層、隱藏層和輸出層的三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[16]。具體如圖4所示。

      圖4 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.4 BP neural network structure diagram

      BP神經(jīng)網(wǎng)絡(luò)由上一層神經(jīng)元連接到下一層神經(jīng)元時(shí)可以接收到上一層神經(jīng)元傳遞來(lái)的信息,并經(jīng)過(guò)“激活”將接收到的值傳遞給下一層。對(duì)于誤差的反向傳播是從下一層神經(jīng)元傳遞給上一層神經(jīng)元,一次性調(diào)節(jié)隱含層到輸出層的權(quán)重和偏置,輸入層到隱含層的權(quán)重和偏置。

      3 實(shí)驗(yàn)結(jié)果及分析

      本文主要運(yùn)用拐點(diǎn)理論確定流失期限,利用客戶購(gòu)買天數(shù)確定個(gè)體的活躍度閾值,將其分為活躍與非活躍用戶兩類。對(duì)數(shù)據(jù)進(jìn)行集成、歸一化等預(yù)處理操作,提升數(shù)據(jù)質(zhì)量。優(yōu)化RFM模型,確定影響因素,結(jié)合DBN方法,構(gòu)建活躍與非活躍客戶的流失預(yù)測(cè)模型。著重分析活躍客戶流失及非活躍客戶不流失的影響因素權(quán)重大小,提出挽留建議措施,進(jìn)而幫助企業(yè)更好地進(jìn)行客戶關(guān)系管理,增強(qiáng)客戶依賴性,減少客戶流失,獲取更大的利潤(rùn)。電子商務(wù)客戶流失預(yù)測(cè)流程主要包括3個(gè)步驟:數(shù)據(jù)來(lái)源及預(yù)處理,優(yōu)化RFM模型和DBN模型的客戶流失模型構(gòu)建及影響因素權(quán)重計(jì)算。具體如圖5所示。

      圖5 電子商務(wù)客戶流失預(yù)測(cè)流程圖Fig.5 Flow chart of e-commerce customer churn prediction

      3.1 數(shù)據(jù)來(lái)源與預(yù)處理

      3.1.1 數(shù)據(jù)來(lái)源

      本文數(shù)據(jù)集來(lái)自于加利福尼亞大學(xué)機(jī)器學(xué)習(xí)UCI數(shù)據(jù)庫(kù)(http://archive.ics.uci.edu/ml/datasets.php),數(shù)據(jù)集中包含2010年12月至2011年12月(包括這一個(gè)月)真實(shí)的在線零售客戶數(shù)據(jù)。一共包括7個(gè)原始數(shù)據(jù)屬性,主要由客戶標(biāo)號(hào)、商品單價(jià)、購(gòu)買數(shù)量、生成交易的日期等組成。從該數(shù)據(jù)集中首先刪除2010年至2011年期間只存在一次購(gòu)買行為的客戶數(shù)據(jù),其次選取真實(shí)進(jìn)行在線零售的840位客戶進(jìn)行電子商務(wù)客戶流失研究。

      針對(duì)結(jié)構(gòu)化的數(shù)據(jù)所存在的缺失值、數(shù)據(jù)噪聲、標(biāo)準(zhǔn)不規(guī)范等問(wèn)題,本文對(duì)原始數(shù)據(jù)采取數(shù)據(jù)清洗、集成等預(yù)處理操作。將840位客戶都存在首次購(gòu)買行為的時(shí)間段設(shè)為觀察期,根據(jù)數(shù)據(jù)集可知本文研究客戶流失的觀察期為2010年12月到2011年3月,共計(jì)4個(gè)月。在觀察期間內(nèi)將同一客戶不同時(shí)間段購(gòu)買的多條數(shù)據(jù)整合成一條數(shù)據(jù),將原始數(shù)據(jù)中的157 510條數(shù)據(jù)整合成840條數(shù)據(jù)。通過(guò)整合變換原始數(shù)據(jù)集中的屬性生成新的屬性維度,如一位客戶在觀察期內(nèi)存在n天不同的數(shù)據(jù),則這位客戶的購(gòu)買天數(shù)為n;在觀察期內(nèi)這位客戶的最終購(gòu)買時(shí)間減去最初購(gòu)買時(shí)間得到客戶購(gòu)買的時(shí)間間隔;在觀察期內(nèi)購(gòu)買天數(shù)中購(gòu)買的最大金額為最大金額等。具體維度介紹見(jiàn)2.1節(jié)。數(shù)據(jù)集最終選取共840名客戶進(jìn)行實(shí)驗(yàn)。電子商務(wù)零售業(yè)部分?jǐn)?shù)據(jù)集如表1所示。

      表1 電子商務(wù)零售業(yè)部分?jǐn)?shù)據(jù)示例Table 1 Some examples of e-commerce retail data

      3.1.2 客戶流失期限確定

      客戶流失期限的確定一直是電子商務(wù)客戶流失關(guān)注的問(wèn)題,電子商務(wù)客戶流失管理是基于非契約的客戶關(guān)系,客戶未與商家簽訂契約,存在著隨時(shí)進(jìn)入市場(chǎng)隨時(shí)退出市場(chǎng)的可能。對(duì)于電子商務(wù)的客戶而言,電子商務(wù)的客戶消費(fèi)習(xí)慣存在著周期性,當(dāng)客戶首次消費(fèi)之后,存在著一段時(shí)間的無(wú)消費(fèi)周期,但在未來(lái)的某一時(shí)間若還會(huì)出現(xiàn)消費(fèi)行為,則代表客戶回購(gòu),若未出現(xiàn)消費(fèi)行為,則代表客戶沒(méi)有回購(gòu),客戶徹底流失,其中首次購(gòu)買后無(wú)消費(fèi)的周期則為流失期限,具體見(jiàn)公式(8):

      客戶流失期限的長(zhǎng)度與客戶的回購(gòu)率成反比,本文設(shè)定了不同時(shí)期的流失期限長(zhǎng)度進(jìn)行客戶回購(gòu)率的統(tǒng)計(jì),并觀察客戶回購(gòu)率隨客戶流失期限的增大時(shí)的收斂速度,本文以“月”為單位設(shè)定流失期限,根據(jù)不同流失期限回購(gòu)率的變化曲線,使用拐點(diǎn)理論進(jìn)行流失期限的設(shè)定,如圖6所示。

      圖6 流失期限與回購(gòu)率示意圖Fig.6 Schematic diagram of churn period and repurchase rate

      拐點(diǎn)理論是指X軸上的數(shù)值增大時(shí)Y軸上的數(shù)值隨之變化,直到到達(dá)某個(gè)點(diǎn)時(shí),Y軸變化的程度明顯減少,則稱為“拐點(diǎn)”。由圖所知,隨著流失期限增大,用戶回購(gòu)率一直降低。當(dāng)流失期限為4個(gè)月時(shí),回購(gòu)率降低幅度明顯減小。因此,設(shè)置4為拐點(diǎn)。

      根據(jù)拐點(diǎn)理論知,客戶流失期限為4個(gè)月,具體表現(xiàn)在2010年12月至2011年3月之間有過(guò)購(gòu)買行為,且連續(xù)4個(gè)月間未發(fā)生購(gòu)買行為的客戶,稱之為客戶流失。

      3.1.3 客戶活躍閾值確定

      選取2010年12月到2011年3月份的所有客戶的數(shù)據(jù),統(tǒng)計(jì)這4個(gè)月中消費(fèi)者消費(fèi)的天數(shù),繪制漏斗圖,具體如圖7所示。

      圖7 客戶活躍漏斗圖Fig.7 Customer active funnel diagram

      運(yùn)用客戶購(gòu)買的天數(shù)這個(gè)屬性加以漏斗圖與其轉(zhuǎn)化率可以解決客戶是否活躍的問(wèn)題。如圖所示,購(gòu)買天數(shù)大于等于3天的時(shí)候,轉(zhuǎn)換率大于50%,且與購(gòu)買天數(shù)大于等于4天的轉(zhuǎn)換率差別不大,所以確定活躍的購(gòu)買天數(shù)為3天及以上,將數(shù)據(jù)分為了活躍與非活躍兩大類,活躍用戶為購(gòu)買天數(shù)大于等于3天的客戶群體,非活躍用戶為購(gòu)買天數(shù)小于3天的客戶,將數(shù)據(jù)集劃分成活躍用戶群體380位,非活躍客戶用戶460位。

      3.1.4 數(shù)據(jù)歸一化

      基于活躍與非活躍用戶的數(shù)據(jù)存在穩(wěn)定的標(biāo)化趨勢(shì),并未具有極端的最大值與最小值。為了確保數(shù)據(jù)的有效性,將整合的數(shù)據(jù)經(jīng)過(guò)活躍劃分后進(jìn)行最大最小值標(biāo)準(zhǔn)化處理,使得數(shù)據(jù)便于比較。對(duì)原始數(shù)據(jù)進(jìn)行了收縮轉(zhuǎn)變,讓數(shù)據(jù)轉(zhuǎn)換成區(qū)間[0,1]中的值,其中屬性的最大值為max,最小值為min,X′為X標(biāo)準(zhǔn)化之后的值,公式如下[17]:

      3.2 DBN實(shí)證模型參數(shù)及結(jié)構(gòu)設(shè)定

      根據(jù)DBN流失預(yù)測(cè)模型的構(gòu)建,將活躍用戶數(shù)據(jù)集中380位客戶以及非活躍用戶數(shù)據(jù)集中460位客戶導(dǎo)入各自的模型中,運(yùn)用Matlab工具,得出活躍用戶數(shù)據(jù)集模型的精確率為93.16%,非活躍用戶數(shù)據(jù)集中的模型的精確率為78.7%。分別得到7×13×2的網(wǎng)絡(luò)結(jié)構(gòu)以及7×7×2的網(wǎng)絡(luò)結(jié)構(gòu)。

      3.2.1 DBN實(shí)證模型參數(shù)選擇

      DBN模型是一種生成型的神經(jīng)網(wǎng)絡(luò)模型,其組成部分包括三層即輸入層、隱藏層和輸出層。客戶流失模型中將優(yōu)化后的7個(gè)指標(biāo)作為輸入層的神經(jīng)元節(jié)點(diǎn)數(shù),輸出層神經(jīng)元節(jié)點(diǎn)數(shù)就是目標(biāo)是否流失。其中X1為時(shí)間間隔(R)、X2為客戶進(jìn)入商家的時(shí)長(zhǎng)(L)、X3為購(gòu)買頻率(F)、X4為購(gòu)買概率(G)、X5為消費(fèi)總金額(M)、X6為最大消費(fèi)金額(MM)、X7為消費(fèi)天數(shù)(D);y1為客戶流失、y2為客戶非流失。

      DBN模型隱藏層的選擇至關(guān)重要。增加隱藏層可以適當(dāng)?shù)亟档途W(wǎng)絡(luò)誤差,提高精度,但同時(shí)會(huì)使得網(wǎng)絡(luò)復(fù)雜化,增加了網(wǎng)絡(luò)的訓(xùn)練時(shí)間導(dǎo)致出現(xiàn)“過(guò)擬合”的傾向。因此,本文設(shè)置1層隱含層進(jìn)行訓(xùn)練。

      將優(yōu)化得到的RFM模型中的7個(gè)指標(biāo)作為輸入層輸入到DBN網(wǎng)絡(luò)結(jié)構(gòu)中,可知DBN輸入節(jié)點(diǎn)數(shù)n為7,輸出類別l為2,根據(jù)Kolmogorov定理[18]計(jì)算隱藏層神經(jīng)元個(gè)數(shù)m,公式如下:

      通過(guò)公式可確定隱藏層節(jié)點(diǎn)數(shù)m=[4,5,6,7,8,9,10,11,12,13],對(duì)兩組數(shù)據(jù)分別訓(xùn)練DBN模型,共2×10組實(shí)驗(yàn)。通過(guò)活躍與非活躍數(shù)據(jù)集實(shí)驗(yàn)結(jié)果對(duì)比確定單層隱藏層節(jié)點(diǎn)數(shù)。

      客戶流失函數(shù)設(shè)置為隱層和輸出層神經(jīng)元激活函數(shù)。DBN可分批次進(jìn)行訓(xùn)練,每批次訓(xùn)練數(shù)據(jù)由訓(xùn)練集樣本數(shù)和訓(xùn)練批次共同決定,即每批次訓(xùn)練數(shù)據(jù)為訓(xùn)練集樣本數(shù)據(jù)與訓(xùn)練批次的比值,對(duì)于活躍與非活躍的數(shù)據(jù)集來(lái)說(shuō),數(shù)據(jù)樣本不同,則每批訓(xùn)練數(shù)據(jù)不同,活躍數(shù)據(jù)集的每批訓(xùn)練數(shù)據(jù)為95次,非活躍數(shù)據(jù)集每批訓(xùn)練數(shù)據(jù)為115次,最大網(wǎng)絡(luò)循環(huán)次數(shù)為1 000次。學(xué)習(xí)率的值設(shè)置為1,動(dòng)量因子的值設(shè)置為0,這些值包含在RBM訓(xùn)練參數(shù)中。BP訓(xùn)練參數(shù)包括學(xué)習(xí)率,其值設(shè)置為2,動(dòng)量因子,其值設(shè)置為0.9。將兩組預(yù)處理后的數(shù)據(jù)集按1∶1的比例分成訓(xùn)練集與測(cè)試集輸入DBN模型中。

      3.2.2 DBN實(shí)驗(yàn)結(jié)果分析

      設(shè)置并調(diào)整參數(shù)后,構(gòu)建優(yōu)化RFM與DBN電子商務(wù)客戶流失預(yù)測(cè)模型?;钴S用戶的DBN實(shí)驗(yàn)結(jié)果如表2。

      表2 活躍用戶DBN實(shí)驗(yàn)結(jié)果Table 2 DBN experiment results of active users

      從表2中可知,在活躍用戶中DBN隱藏層為13層時(shí),實(shí)驗(yàn)誤差最小,準(zhǔn)確率最高達(dá)到93.16%;由表中可知將活躍用戶的單層隱藏層節(jié)點(diǎn)數(shù)設(shè)置為13時(shí),實(shí)驗(yàn)結(jié)果最佳。輸出層為流失與非流失,得到一個(gè)7×13×2的網(wǎng)絡(luò)結(jié)構(gòu)圖如圖8所示。

      圖8 活躍用戶DBN結(jié)構(gòu)Fig.8 DBN structure of active users

      從表3中可知,在非活躍用戶中DBN隱藏層為7層時(shí),實(shí)驗(yàn)誤差最小,準(zhǔn)確率最高達(dá)到78.7%;由表中可知將非活躍用戶的單層隱藏層節(jié)點(diǎn)數(shù)設(shè)置為7時(shí),實(shí)驗(yàn)結(jié)果最佳。得到一個(gè)7×7×2的網(wǎng)絡(luò)結(jié)構(gòu)如圖9所示。

      表3 非活躍用戶DBN實(shí)驗(yàn)結(jié)果Table 3 DBN experiment results of inactive users

      圖9 非活躍用戶DBN結(jié)構(gòu)Fig.9 DBN structure of inactive users

      3.2.3 DBN與其他預(yù)測(cè)方法對(duì)比

      為進(jìn)一步驗(yàn)證DBN模型對(duì)活躍客戶細(xì)分的電子商務(wù)客戶流失預(yù)測(cè)模型的準(zhǔn)確度,本文運(yùn)用了隨機(jī)森林、SVM、貝葉斯神經(jīng)網(wǎng)絡(luò)以及BP神經(jīng)網(wǎng)絡(luò)四種預(yù)測(cè)方法進(jìn)行了對(duì)比分析。具體實(shí)驗(yàn)結(jié)果如表4所示。

      表4 五種預(yù)測(cè)模型的準(zhǔn)確率Table 4 Accuracy of five prediction models %

      由表4可知,對(duì)于活躍用戶群體細(xì)分后的預(yù)測(cè)準(zhǔn)確率方面,DBN預(yù)測(cè)模型無(wú)論是活躍用戶還是非活躍用戶的準(zhǔn)確率都高于隨機(jī)森林、SVM以及BP神經(jīng)網(wǎng)絡(luò)。而對(duì)于貝葉斯神經(jīng)網(wǎng)絡(luò)而言,DBN預(yù)測(cè)模型中活躍用戶的準(zhǔn)確率遠(yuǎn)高于它,但對(duì)于非活躍用戶群體來(lái)說(shuō)貝葉斯神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率略高于DBN模型。綜合活躍與非活躍用戶客戶流失模型的準(zhǔn)確率,DBN模型相比于經(jīng)典的流失預(yù)測(cè)模型而言更加有效。

      3.3 電子商務(wù)流失客戶影響因素權(quán)重分析

      經(jīng)由DBN預(yù)測(cè)電子商務(wù)的客戶流失可以評(píng)估每個(gè)輸入變量與輸出變量之間的關(guān)系,得出每個(gè)變量之間的權(quán)重值,可由以下公式直接得出每個(gè)輸出層變量的最終權(quán)重[19]:

      其中,Wki表示第k個(gè)隱藏單元和第i個(gè)輸入單元之間的權(quán)重;W jk表示第j個(gè)輸出單元和第k個(gè)隱藏單元之間的權(quán)重。RS ji是第i個(gè)輸入變量和第j個(gè)輸出變量之間的相對(duì)強(qiáng)度。

      本文主要研究活躍客戶的流失,非活躍客戶的非流失原因,故運(yùn)用RS ji統(tǒng)計(jì)量計(jì)算優(yōu)化后的RFM模型中各變量權(quán)重,活躍用戶中影響客戶流失的各因素權(quán)值如表5所示;對(duì)于非活躍用戶中影響客戶未流失的各因素權(quán)值如表6所示。

      表5 活躍用戶中影響客戶流失的因素權(quán)重Table 5 Weights of factors affecting customer churn among active users

      表6 非活躍用戶中影響客戶未流失的因素的權(quán)重Table 6 Weights of factors affecting customer churn among inactive users

      根據(jù)表5可知,活躍客戶中的流失與購(gòu)買頻率、消費(fèi)天數(shù)、最大消費(fèi)金額、消費(fèi)總金額、客戶進(jìn)入商家的時(shí)長(zhǎng)以及客戶購(gòu)買概率成反比。根據(jù)影響因素權(quán)重的大小可知,消費(fèi)總金額是影響活躍客戶流失的最主要因素,權(quán)重最大為0.147 9;其次為客戶的消費(fèi)頻率,權(quán)重為0.134 5;第三為客戶進(jìn)入商家的時(shí)長(zhǎng),權(quán)重為0.116 3。其余四個(gè)影響因素的重要程度排名依次是客戶的最大消費(fèi)金額、客戶的購(gòu)買概率、客戶的消費(fèi)天數(shù)和客戶購(gòu)買的時(shí)間間隔。

      對(duì)于優(yōu)化的RFM模型中同是表示時(shí)間間隔的客戶購(gòu)買時(shí)間間隔以及客戶進(jìn)入商家的時(shí)長(zhǎng)而言,活躍客戶群體更關(guān)注的是客戶進(jìn)入商家的時(shí)長(zhǎng),對(duì)電子商務(wù)客戶而言,客戶可以隨時(shí)進(jìn)入商家的店鋪,也可以隨時(shí)流失。但對(duì)活躍的客戶群體來(lái)說(shuō),客戶進(jìn)入商家的時(shí)長(zhǎng)(L)權(quán)重系數(shù)為負(fù),表明了進(jìn)入商家時(shí)長(zhǎng)越長(zhǎng)的活躍客戶,則對(duì)商家存在一定的依賴性,時(shí)間越長(zhǎng)忠誠(chéng)度越高,則客戶越不容易流失。對(duì)于模型中同是表示頻率的購(gòu)買頻率與購(gòu)買概率而言,負(fù)向影響活躍客戶的流失,說(shuō)明頻率對(duì)于活躍客戶的流失存在抑制作用,因?yàn)橘?gòu)買頻率越頻繁則減少了客戶轉(zhuǎn)移商家的風(fēng)險(xiǎn),節(jié)省了轉(zhuǎn)移成本,在活躍客戶購(gòu)買頻率越高,依賴性越強(qiáng)的情形下,客戶就自動(dòng)減少成本,以至于減少流失。就模型中表示金額的消費(fèi)總金額與最大消費(fèi)金額而言,對(duì)于活躍客戶的流失存在顯著影響,消費(fèi)總金額(M)的權(quán)重最大,系數(shù)為負(fù),因此對(duì)于活躍客戶來(lái)說(shuō)其流失的最大影響因素為消費(fèi)金額。消費(fèi)總金額越大說(shuō)明了客戶對(duì)于商店的滿意度越高,信賴度越高,對(duì)商家建立了一定的客戶忠誠(chéng),有利于商家保持活躍客戶。

      對(duì)企業(yè)而言,活躍客戶是企業(yè)的核心客戶,但活躍客戶中依舊存在著流失現(xiàn)象。帕累托原則表示,不同價(jià)值的客戶對(duì)企業(yè)的利潤(rùn)貢獻(xiàn)度不同,企業(yè)80%的利益來(lái)源于20%有價(jià)值的客戶。為挽留活躍用戶中流失的高價(jià)值的客戶,由分析結(jié)果可知,企業(yè)應(yīng)首先關(guān)注活躍客戶中客戶的總購(gòu)買金額、消費(fèi)頻率以及進(jìn)入商家的時(shí)長(zhǎng)?;谏鲜鲆蛩兀瑸橥炝艨蛻?,企業(yè)首先應(yīng)對(duì)流失客戶提出個(gè)性化金融服務(wù),刺激其消費(fèi)并提高購(gòu)買總金額,其次,對(duì)客戶進(jìn)行會(huì)員等級(jí)登記,根據(jù)會(huì)員等級(jí)的高低推出個(gè)性化商品折扣促銷,保持流失客戶的消費(fèi)頻率。

      根據(jù)表6可知,非活躍用戶中的未流失客戶與購(gòu)買頻率、消費(fèi)天數(shù)、消費(fèi)的最大金額、消費(fèi)總金額以及購(gòu)買概率成正比,與客戶購(gòu)買的時(shí)間間隔成反比。根據(jù)表中權(quán)重大小可知,購(gòu)買頻率是影響活躍客戶流失的最主要因素,權(quán)重最大為0.758 1;其次為客戶購(gòu)買的時(shí)間間隔,權(quán)重為0.069 2;第三為消費(fèi)天數(shù),權(quán)重為0.048 7。其余四個(gè)影響因素的重要程度排名依次是客戶消費(fèi)總金額、客戶進(jìn)入商家的時(shí)長(zhǎng)、客戶消費(fèi)最大金額和購(gòu)買概率。

      在非活躍客戶研究客戶非流失問(wèn)題中對(duì)于優(yōu)化的RFM模型中對(duì)比同是時(shí)間因素的客戶購(gòu)買的時(shí)間間隔、客戶進(jìn)入商家的時(shí)長(zhǎng)和消費(fèi)天數(shù),可知對(duì)于非活躍客戶而言,影響客戶非流失的顯著影響因素為客戶購(gòu)買的時(shí)間間隔和客戶消費(fèi)天數(shù)。其中客戶購(gòu)買的時(shí)間間隔(R)負(fù)向影響非活躍客戶的非流失,客戶消費(fèi)天數(shù)(D)正向影響非活躍客戶的非流失,說(shuō)明了在非活躍客戶群體中,客戶購(gòu)買的時(shí)間間隔越短,消費(fèi)天數(shù)越多,其非流失率越高。就模型中表示頻率的客戶購(gòu)買頻率和客戶購(gòu)買概率而言,雖兩者都正向影響客戶的非流失率,但是對(duì)比權(quán)重大小可知,就頻率因素而言,客戶購(gòu)買頻率(F)顯著正向影響非活躍客戶的非流失率。對(duì)于模型中表示金額的消費(fèi)總金額以及最大消費(fèi)金額而言,兩者對(duì)非流失率都存在正向影響,但對(duì)比兩者權(quán)重大小可知,消費(fèi)總金額相對(duì)而言影響強(qiáng)度大于最大消費(fèi)總金額。而對(duì)于最大消費(fèi)金額而言,非活躍客戶存在一定的沖動(dòng)消費(fèi),在沖動(dòng)消費(fèi)期間客戶對(duì)商家存在短暫的客戶滿意,在此段時(shí)間過(guò)后,客戶存在著流失的風(fēng)險(xiǎn),故對(duì)于非活躍用戶而言客戶的非流失率并未特別關(guān)注客戶的金額因素。在非活躍客戶群體中,對(duì)于購(gòu)買頻率越高、時(shí)間間隔越短、消費(fèi)天數(shù)越多的這類潛在有價(jià)值客戶可期發(fā)展成活躍客戶。

      對(duì)企業(yè)而言,非活躍客戶群體中的非流失客戶是企業(yè)的潛在有價(jià)值客戶。根據(jù)Rosenberg和Czepiel對(duì)客戶價(jià)值的調(diào)查研究報(bào)告可以得出,開(kāi)發(fā)一個(gè)新客戶所需的花費(fèi),相比較對(duì)于一個(gè)老客戶的維護(hù)費(fèi)用,前者是后者近六倍的成本[20]。對(duì)于發(fā)展這部分潛在有價(jià)值客戶,由結(jié)果分析可知,企業(yè)應(yīng)該關(guān)注非活躍用戶中客戶購(gòu)買頻率、客戶購(gòu)買的時(shí)間間隔以及客戶消費(fèi)天數(shù)。企業(yè)對(duì)這類客戶,刻畫其用戶畫像,了解客戶的偏好,采取有針對(duì)性地對(duì)其推送感興趣商品的措施,提高其購(gòu)買頻率以及購(gòu)買天數(shù),以期發(fā)展為活躍客戶。

      4 結(jié)語(yǔ)

      根據(jù)Reicheld的研究可知,如果能夠?qū)⒖蛻舻牧魇式档?%,就會(huì)給企業(yè)帶來(lái)至少1/4的利潤(rùn)增長(zhǎng)[21]。一個(gè)有價(jià)值的老客戶比一個(gè)新客戶對(duì)于商家而言,利益更大。本文針對(duì)傳統(tǒng)客戶流失預(yù)測(cè)模型全數(shù)據(jù)導(dǎo)入的局限性,提出了一種優(yōu)化RFM理論模型與DBN實(shí)證模型,預(yù)測(cè)電子商務(wù)客戶流失情況,研究活躍客戶流失及非活躍客戶未流失的影響因素。實(shí)驗(yàn)結(jié)果表明:(1)本文考慮到電子商務(wù)數(shù)據(jù)時(shí)變性特點(diǎn)及電子商務(wù)客戶本身的不穩(wěn)定性,優(yōu)化了傳統(tǒng)的RFM模型,構(gòu)建了更全面的電子商務(wù)客戶流失影響因素指標(biāo)體系,探討了各影響因素的重要性。(2)通過(guò)實(shí)證研究,對(duì)比分析5種客戶流失預(yù)測(cè)模型,DBN模型原理清晰,準(zhǔn)確率高、效果好,在電子商務(wù)客戶流失預(yù)測(cè)模型中凸顯出較好的優(yōu)勢(shì)。(3)本文基于活躍用戶流失和非活躍用戶不流失的獨(dú)特視角,對(duì)比分析了不同類型用戶的影響因素,探討了用戶差異造成的影響,為企業(yè)針對(duì)不同類用戶制定有效的管理策略提供參考,進(jìn)而提升客戶忠誠(chéng)度,獲得企業(yè)利益。

      猜你喜歡
      活躍天數(shù)權(quán)重
      本周連漲天數(shù)居前個(gè)股
      本周連跌天數(shù)居前個(gè)股
      權(quán)重常思“浮名輕”
      活躍在抗洪救災(zāi)一線的巾幗身影
      海峽姐妹(2019年8期)2019-09-03 01:00:46
      為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
      這些活躍在INS的時(shí)髦萌娃,你Follow了嗎?
      Coco薇(2017年11期)2018-01-03 20:24:03
      生日謎題
      基于公約式權(quán)重的截短線性分組碼盲識(shí)別方法
      層次分析法權(quán)重的計(jì)算:基于Lingo的數(shù)學(xué)模型
      河南科技(2014年15期)2014-02-27 14:12:51
      二月為什么天數(shù)最少
      宜兰县| 鄱阳县| 集安市| 太和县| 金坛市| 元朗区| 和田市| 墨江| 荆门市| 崇信县| 象山县| 河北区| 尼勒克县| 南岸区| 墨脱县| 惠东县| 五原县| 探索| 肥西县| 平果县| 白城市| 长寿区| 云霄县| 南漳县| 武汉市| 澎湖县| 廊坊市| 苍梧县| 诏安县| 洛隆县| 铜陵市| 思南县| 当雄县| 乡宁县| 兴文县| 绥化市| 兖州市| 南安市| 融水| 香格里拉县| 新泰市|