盧美麗,高宇佳,葉作亮
(1.山西財經(jīng)大學工商管理學院,太原 030006;2.西南財經(jīng)大學國際商學院,成都 611130)
非契約客戶關(guān)系情景下,客戶是否流失無法直接觀察得到,但在對顧客購買行為進行一定假設(shè)后,根據(jù)顧客購買相關(guān)變量,如最近購買時間(Recently,R)、購買頻次(Frequency,F(xiàn))等,可以對其未來活躍狀態(tài)進行預(yù)測。Schmittlein等首次考慮顧客流失,視顧客購買事件為泊松分布、顧客生存時間為指數(shù)分布,提出經(jīng)典的Pareto/NBD模型[1],為分析顧客價值和消費行為奠定了很好的基礎(chǔ)。Fader等進一步假定顧客在某一次購買后立即死亡,建立了GB/NBD模型[2],在基本相同的預(yù)測準確度內(nèi),其公式推導(dǎo)和數(shù)據(jù)處理過程都更為簡單,在實踐中得到廣泛應(yīng)用[3]。之后的研究不斷細化購買過程的具體假設(shè),如考慮購買率和流失率可能的相關(guān)性,建立HB模型[4];考慮顧客僅在某時間段內(nèi)流失,與交易次數(shù)獨立,建立PDO模型[5];考慮顧客活躍與不活躍可以轉(zhuǎn)化,建立EMS模型[6]。但這些研究的共同特點是在顧客活躍時,將顧客購買率視為服從泊松分布。長期以來,將個體行為視為泊松分布是理論研究中慣用的假設(shè),適合于描述單位時間內(nèi)隨機事件發(fā)生的次數(shù)。服從泊松分布的事件,其時間間隔服從指數(shù)分布。
但是1999年Barabasi發(fā)表在Science上的文章,打破了研究者對于“人類日常行為模式隨機性”的認識[7],他認為“爆發(fā),無處不在”,也即“我們的工作和娛樂及其他種種活動都具有間歇性,會在短期內(nèi)突然爆發(fā),然后又幾乎陷入沉寂”。之后很多領(lǐng)域的實證研究表明,冪律及其它形式的長尾分布是普遍存在的[8-11],樊超[12]對人類行為動力學研究進行了綜述,總結(jié)了人類行為中普遍存在的主要特征,他認為級聯(lián)特征、周期特征、波動特征、興趣特征以及自相似特征等相互關(guān)聯(lián)、相互制約,最終形成人類行為的陣發(fā)性和重尾表現(xiàn)。在線購買作為人類行為的一種具體形式,具有人類行為的一些共性特征。葉作亮等[13]分析了大量C2C市場實證數(shù)據(jù),指出在線購買行為中存在著強化效應(yīng),即人們再次購買的概率隨著購買次數(shù)的增加而增大,并得出C2C在線顧客購買服從冪律分布的結(jié)論。這一強化效應(yīng)的概念與指數(shù)分布的無記憶性是矛盾的,所以對在線購買時間特征的描述已經(jīng)不適宜使用指數(shù)分布,需要進一步探討,尋找適合在線購買時間間隔特征的分布形式和刻畫方法。
Zhang等[14-15]分析了在線數(shù)據(jù)中出現(xiàn)的陣發(fā)性現(xiàn)象,將之稱為“Clumpy”,同時提出衡量陣發(fā)性程度指標的四個性質(zhì),引入時間間隔的對稱凸函數(shù)作為測量指標,與其他文獻中類似的測量指標相比[16],性質(zhì)更優(yōu),且統(tǒng)計檢驗的方法更具科學性,適用于判斷事件的陣發(fā)性。其總體思路是:建立陣發(fā)性的衡量指標,將購買事件隨機發(fā)生作為原假設(shè),備擇假設(shè)是購買事件表現(xiàn)為陣發(fā)性,通過蒙特卡洛模擬得到置信水平α時原假設(shè)成立的置信區(qū)間,建立檢驗表,在計算陣發(fā)性之后,與檢驗表所對應(yīng)的臨界值進行對比,如果小于臨界值,則接受原假設(shè),認為該數(shù)據(jù)序列表現(xiàn)為隨機性,如果大于臨界值,則拒絕原假設(shè),支持備擇假設(shè),認為該數(shù)據(jù)序列表現(xiàn)出陣發(fā)性。
本文對事件時間間隔的研究進行綜述,指出已有文獻在不同顧客首次購買時間影響測量結(jié)果穩(wěn)定性方面的不足,進一步探索在線購買陣發(fā)性測量的改進方法,并基于陣發(fā)性的識別,分析陣發(fā)性對顧客活躍預(yù)測的影響,為在線顧客購買行為的研究提供新的思路。
已有文獻對于時間間隔陣發(fā)性的刻畫有兩種方法,一種是以統(tǒng)計的方法進行描述,另一種是直接的數(shù)值性測量方法。
理論和實證表明,指數(shù)分布、冪律分布、廣延指數(shù)分布等可以用來刻畫事件的時間間隔[17-18],但分布擬合本身需要較豐富的數(shù)據(jù),對于群體行為的研究其結(jié)論較為穩(wěn)定,對個體的研究常常出現(xiàn)困難,如有些群體中的個體行為可能比較一致,有些群體中個體的行為表現(xiàn)出較大的差異性,或者個體時間間隔的數(shù)據(jù)量較少,這些狀況都導(dǎo)致對個體行為的刻畫無法以分布形式統(tǒng)一描述。
數(shù)值性測量方面,Goh和Barabási最早對陣發(fā)性進行了定義[19],給出陣發(fā)性的計算公式B=(στ-mτ)/(στ+mτ)。這里στ、mτ分別表示事件時間間隔序列τ的標準差和均值,B值在-1和1之間。但個體時間間隔所表現(xiàn)出的差異性應(yīng)該是個相對概念,需要結(jié)合事件的個數(shù)和觀察期長度,根據(jù)置信度確定一個較穩(wěn)定的臨界判斷區(qū)間,而不應(yīng)該以一個絕對的數(shù)值判斷本質(zhì)上反映較大差異的“陣發(fā)性”特征。Zhang等提出的陣發(fā)性數(shù)值性測量方法以較好的統(tǒng)計特性[14],得到了學界的認可。
圖1 陣發(fā)性計算示例Fig.1 Clumpy calculation example
具體來說,若以ti、xi分別表示事件i發(fā)生的時刻和時間間隔(距離上次事件發(fā)生所間隔的時間),n表示事件的發(fā)生次數(shù),N表示總試驗次數(shù)或潛在可能發(fā)生的事件次數(shù)(一般認為單位時間最多發(fā)生1次事件,故N為時間長度)。如圖1所示,(t0,T]為觀察期,計算Hp的步驟如下。
1)計算時間間隔
3)計算Hp
圖2 首次購買時間不同對陣發(fā)性的影響Fig.2 The effect to clumpy on different the first purchase time
以上陣發(fā)性的測量得到了學者Kumar等的高度認可[20],但具體分析仍存在明顯缺陷:當首次購買時間不同時,同樣間隔發(fā)生的行為卻可能有不同陣發(fā)性的判斷結(jié)果。如圖2為兩名顧客在觀察期(t0,T)的購買情況,顧客a和b購買的時間間隔相同,購買次數(shù)都是4次,a的首次購買時間較早,b的首次購買處于中間階段,總體來看在觀察期中b比a的購買時間間隔更加均勻,計算所得的Hp相對較小,可能表現(xiàn)出非陣發(fā)性的測量結(jié)果,這一情況尤其在購買次數(shù)較少時,影響更大。所以當顧客首次購買時間表現(xiàn)出較大差異性時,這一測量方式在不同的觀察期將會出現(xiàn)不一樣的判斷結(jié)果,對陣發(fā)性特征的描述不夠穩(wěn)定。
葉作亮等[13]、Tian等[21]、吳曉飛[22]和盧美麗[23]等對中國典型電子商務(wù)平臺淘寶、京東等進行實證發(fā)現(xiàn),我國電子商務(wù)處于高速發(fā)展時期,每一商鋪或平臺中存在大量購買次數(shù)較低的顧客,進一步關(guān)注顧客購買時間,可見新顧客在逐漸進入,顧客首次購買時間差異性很大。所以探索適合我國目前電子商務(wù)特征的在線顧客陣發(fā)性測量方法,把握陣發(fā)性對顧客活躍的影響將為深入研究顧客行為提供理論基礎(chǔ)。
在文獻[14]的測量方法中,以整個觀察期(0,T)為陣發(fā)性的測量期,除了受每次購買時刻本身形成時間間隔的影響外,圖2可見不同首次購買時間影響測量結(jié)果的穩(wěn)定性,此外最后購買時間也對陣發(fā)性判定有一定影響,但在RFM模型中,最后購買時刻和觀察截止時間T的關(guān)系往往以最近購買時間R刻畫。所以陣發(fā)性特征可以主要考慮購買時刻發(fā)生本身的情況,盡量減少不同觀察期的影響,我們將測量期縮短為接近初次購買和最后購買的時刻,如以(t1-1,t4+1)為陣發(fā)性測量期,見圖3。
改進測量方法后的相關(guān)變量如圖4所示,具體計算步驟如下。
圖3 首次購買時間不同時改進的陣發(fā)穩(wěn)定性示例Fig.3 Examples of improved clump stability at different first purchase time
圖4 改進的陣發(fā)性測量方法計算示例Fig.4 Example of improved clumpy measurement method
1)計算時間間隔,(t1-1,tn+1)為測量期
3)計算Hp
得到Hp的計算結(jié)果后,通過Matlab編程進行蒙特卡羅模擬,產(chǎn)生10 000個在時間長度為N時發(fā)生n個事件的樣本,計算所有產(chǎn)生的隨機樣本其時間間隔的陣發(fā)性,取α為置信水平,并將α分位確定為臨界值。具體數(shù)值與相應(yīng)的臨界值比較,大于臨界值時則認為其表現(xiàn)為陣發(fā)性。
實證數(shù)據(jù)來自國內(nèi)兩個知名B2C網(wǎng)站——一號店和京東商城的快速消費品購買記錄,形成五組數(shù)據(jù),分別記為BC01~BC03及BC04、BC05,時間跨度為12個月。BC01~BC03數(shù)據(jù)涉及顧客數(shù)在3 200名~4 100名之間,商品品種數(shù)為3萬多種;BC04和BC05數(shù)據(jù)分別涉及顧客數(shù)為6萬和20萬名多,商品品種數(shù)為600多種。以上數(shù)據(jù)均將同一顧客一天內(nèi)發(fā)生的購買行為視為一次。
1號店數(shù)據(jù)的獲取方式是從幾種具體商品入手,找到購買商品的顧客,通過顧客地址爬蟲抓取其所有的購買記錄,下載形成包含20萬名顧客購買記錄的數(shù)據(jù)庫,相應(yīng)信息有用戶代碼、用戶名、購買商品編號、商品名稱、商品價格、購買時間等。由于數(shù)據(jù)量較大,部分記錄不完整,如缺少用戶ID、缺少購買時間等,在對數(shù)據(jù)清洗時將之刪除。之后隨機從數(shù)據(jù)庫中抽取1萬名顧客形成3個組,并研究每組中2015年1月1日進入1號店的顧客至2015年12月31日整個年度的購買情況,即BC01~BC03。京東商城的兩組數(shù)據(jù)BC04和BC05來自文獻[22]。
進一步去掉以上數(shù)據(jù)組中購買1次和購買2次的所有記錄,形成購買次數(shù)在3次及以上新的數(shù)據(jù)組,計算每名顧客的購買時間間隔,五組數(shù)據(jù)樣本情況如表1所示。
表1 各樣本數(shù)據(jù)組數(shù)據(jù)情況描述
用Matlab編程計算每一樣本數(shù)據(jù)組所有顧客的陣發(fā)性Hp值和相應(yīng)的臨界值,Hp大于臨界值,即表現(xiàn)出陣發(fā)性,記陣發(fā)性為1,否則為非陣發(fā)性,記陣發(fā)性為0。用Zhang的算法及改進方法(置信度為5%)分別對實證數(shù)據(jù)進行陣發(fā)性檢驗。兩種方法的計算和判斷舉例如表2。
表2 計算陣發(fā)性舉例(顧客來自BC01)
以表2中第一名顧客的改進方法舉例說明計算過程:顧客編碼為“1683785”,發(fā)生5次購買,其購買時間為2015-07-30、2015-08-01、2015-08-02、2015-08-31、2015-09-02,故相應(yīng)觀察期為(t0,T)=(2015-07-29,2015-09-03),記t0=0,t1=1,t2=3,t3=4,t4=33,t5=35,N=36,時間間隔x1=1,x2=2,x3=1,x4=29,x5=2,x6=1,n=5,將xi除以36作歸一化處理,計算Hp如下:
Hp=1+(0.027 8×log0.027 8+0.055 6×log0.055 6+0.027 8×log0.027 8+0.805 6×log0.805 6+0.055 6×log0.055 6=0.027 8×log0.027 8)/log6=0.556 9,該值大于5次購買、時間長度為36天的相應(yīng)臨界值z(5,36)=0.3380,所以此顧客被認為在5%的雙側(cè)置信水平時表現(xiàn)為購買行為陣發(fā)性。
同時表2的計算可見,兩種方法的計算結(jié)果有很大差異,這一方面是因為Hp計算的方法不同,另一方面用于判斷的臨界值也不同。
傳統(tǒng)觀點認為顧客最近購買時間R和購買頻次F,是影響顧客活躍表現(xiàn)的兩個主要因素,顧客在越近期的時間段內(nèi)購買,R值越大,顧客保持活躍狀態(tài)繼續(xù)購買的可能性就越大(對R的刻畫采取NBD模型中的方法,即:將觀察期0-T的時間刻度化,顧客最近一次購買日期所對應(yīng)的時間刻度位置記為R的取值,故R越小表示其越接近觀察始點,R越大表示越接近T值,距離觀察結(jié)束點較近);同樣,顧客購買頻次越多,顧客再次購買的概率也越大,顧客活躍的可能性就大。這兩個因素的影響應(yīng)該是容易被人們接受和認可的,為此本文提出假設(shè)1和假設(shè)2。
假設(shè)1:最近購買時間R越大,顧客活躍的概率越大。
假設(shè)2:購買頻次F越大,顧客活躍的概率越大。
那么陣發(fā)性會對顧客活躍度有影響嗎?當顧客表現(xiàn)為陣發(fā)性時,明顯增加了對于驗證期是否活躍的判斷難度,比如顧客最后一次購買時間很近,但因其進入靜默期,可能在驗證期沒有購買行為;或者顧客最后一次購買時間較久,通常認為他已經(jīng)流失,在驗證期不會產(chǎn)生購買行為,但因為他是陣發(fā)性顧客,可能之前他正在處于長久的靜默中,在驗證期期間卻表現(xiàn)出頻繁購買的現(xiàn)象。于是,本文提出假設(shè)3。
假設(shè)3:陣發(fā)性對最近購買時間R有調(diào)節(jié)作用,無陣發(fā)性的顧客,最近購買時間R和顧客活躍的概率更相關(guān)。
為驗證以上假設(shè),建立Logit回歸模型進行具體分析,探討顧客最近購買時間R、購買頻次F以及顧客陣發(fā)性Clumpy對顧客活躍概率的影響。
模型的因變量為顧客是否活躍,是虛擬變量,以Alive=1表示顧客活躍,Alive=0表示顧客不活躍(顧客流失),p(Alive)表示顧客活躍的概率。自變量為顧客最近購買時間R、購買頻次F以及顧客陣發(fā)性Clumpy,R和F是連續(xù)變量,Clumpy為虛擬變量,Clumpy=1表示顧客購買行為呈現(xiàn)陣發(fā)性,Clumpy=0表示顧客購買行為比較均衡。以上3個假設(shè)中變量間關(guān)系如圖5所示。
圖5 變量間關(guān)系示意模型Fig.5 The model of the relationship between variables
定義:
建立Logit回歸模型
Logitp(Alive)=b0+b1R+b2F
(1)
可知
為驗證陣發(fā)性對于最近購買時間R是否有調(diào)節(jié)作用,建立Logit回歸模型:
Logitp(Alive)=β0+β1R+β2Clumpy+β3R×Clumpy
(2)
Logit模型的參數(shù)可以通過基于自然對數(shù)極大函數(shù)的極大似然估計法求得。整理數(shù)據(jù)并錄入SPSS21.0軟件,可得樣本數(shù)據(jù)的描述性統(tǒng)計分析、相關(guān)性分析及Logit回歸分析結(jié)果。
3.2.1 描述性統(tǒng)計分析
以BC01數(shù)據(jù)組為例,數(shù)據(jù)樣本總量1 178個,在驗證期中仍然活躍的顧客數(shù)量為858名,占樣本總量的72.8%;驗證期中沒有購買行為,表現(xiàn)為不活躍的顧客數(shù)量為320名,占樣本總量的27.2%。在觀察期中表現(xiàn)出陣發(fā)性的顧客有491名,占樣本總量的41.7%,購買行為基本規(guī)律的顧客有687名,占樣本總量的58.3%。最近購買時間的數(shù)值分布在第16天到273天之間,平均最近購買時間為第235.8天,購買頻次在3到87次之間,平均購買頻次為8.9次。(見表3)。
表3 變量的描述性統(tǒng)計分析
3.2.2 相關(guān)性分析
變量的Pearson相關(guān)系數(shù)如表4所示,從中可見顧客是否活躍與最近購買時間、購買頻次表現(xiàn)為顯著正相關(guān),與陣發(fā)性表現(xiàn)為顯著負相關(guān),由于Alive=1表示顧客活躍,Clumpy=1表示顧客陣發(fā)性購買,所以從相關(guān)系數(shù)的符號可知,與不活躍的顧客相比,活躍顧客購買時間相對比較近期、購買頻次較高且購買時間間隔更為均衡。
表4 變量之間的相關(guān)性統(tǒng)計分析結(jié)果
注:***代表在1%水平上顯著相關(guān),**代表在5%水平上顯著相關(guān)。
3.2.3 回歸分析
對所建立的二元Logit回歸模型,采用Enter法進行分析,結(jié)果如表5所示。
表5 Logit回歸分析結(jié)果
在Logit回歸模型分析中,最理想的情況是所建立回歸模型的卡方值達到顯著性水平而Hosmer-Lemeshow檢驗未達到顯著性水平[24]。
本模型系數(shù)的Omnibus檢驗結(jié)果表明,所建立的兩個變量的回歸模型整體適配度檢驗卡方值為176.913,p=0.000,達到顯著水平,說明兩個變量中至少有一個自變量可以對顧客活躍情況進行有效解釋,進一步采用向前逐步回歸的方法,可知進入模型中的自變量均顯著。同時,采用Hosmer和Lemeshow檢驗法對回歸模型整體適配度的檢驗結(jié)果為:Hosmer-Lemeshow檢驗卡方值等于12.701,p=0.123,未達顯著水平,說明模型整體回歸的適配度較好,即整體上看自變量可以有效預(yù)測顧客活躍度。
從關(guān)聯(lián)強度系數(shù)來看,Cox-Snell關(guān)聯(lián)強度值為0.139,Nagelkerke關(guān)聯(lián)強度指標值為0.202,表明自變量和因變量間存在一定程度的關(guān)聯(lián)。
檢驗Logit回歸模型個別參數(shù)顯著性的主要指標有Wald檢驗值和Score檢驗值,計算結(jié)果表明,最近購買時間R、購買頻次F兩個因素的Wald檢驗值分別為57.429和37.092,Score檢驗值分別為127.292和65.324,數(shù)值較大且p值均遠遠小于1%,具有統(tǒng)計意義,說明這兩個自變量從個別角度看對顧客活躍的影響也是十分顯著的。分析具體系數(shù),最近購買時間R的系數(shù)估計值為正數(shù),說明其值越大時,顧客活躍的概率會增大,且從EXP(B)=1.103,可知距離觀察結(jié)束時刻每接近1天(即最近購買時間增加1天),在驗證期顧客活躍比顧客不活躍的概率會增加10.3%;購買頻次F的系數(shù)估計值也為正數(shù),說明購買頻次越大時,顧客活躍的概率增大,且從EXP(B)=1.122,可知購買頻次每增加1次,在驗證期顧客活躍比顧客不活躍的概率就會增加12.2%。
在對其余數(shù)據(jù)組的Logit回歸模型檢驗中,所有模型系數(shù)的Omnibus檢驗結(jié)果均顯著,但Hosmer-Lemeshow檢驗時,BC02、BC03數(shù)據(jù)組的卡方值在5%水平時不顯著,BC04、BC05數(shù)據(jù)組的卡方值顯著;關(guān)聯(lián)強度系數(shù)相差不大,Cox-Snell關(guān)聯(lián)強度值在0.12到0.28之間,Nagelkerke關(guān)聯(lián)強度指標值在0.19到0.37之間;在個別參數(shù)顯著性的Wald檢驗值,R和F的系數(shù)均通過顯著性檢驗,具體結(jié)果見表6。
表6 其余四組數(shù)據(jù)Logit回歸分析結(jié)果
注:括號內(nèi)為相應(yīng)p值
3.2.4 陣發(fā)性對最近購買時間R的調(diào)節(jié)作用
為減少變量間可能的多重共線性,將R、F進行標準化處理,運用SPSS軟件對R和Clumpy的交互作用按式(2)進行回歸,回歸結(jié)果見表7。其中交叉項的Wald值為5.933(p=0.015),回歸系數(shù)為負值,說明具有陣發(fā)性特點的顧客,其活躍的概率從統(tǒng)計角度上看明顯比均衡性顧客活躍的概率降低,即假設(shè)3成立。
表7 Logit回歸分析結(jié)果(Clumpy的調(diào)節(jié)作用)
同樣,對其余組陣發(fā)性Clumpy的調(diào)節(jié)作用進行檢驗,交叉項均有顯著的統(tǒng)計意義,各組Wald值及系數(shù)見表8。
表8 其余四組數(shù)據(jù)Logit回歸分析R和Clumpy交叉項顯著性檢驗結(jié)果
也有學者認為,當調(diào)節(jié)變量為分類變量時,應(yīng)當使用按調(diào)節(jié)變量分組的方法分別將因變量對自變量做回歸[25],若回歸系數(shù)差異顯著,則調(diào)節(jié)效應(yīng)顯著。進一步進行分組驗證,結(jié)果見表9。
表9 BC01有無陣發(fā)特性的分組Logit回歸對比分析結(jié)果
觀察表9中Omnibus檢驗結(jié)果,所建立的兩個變量的回歸模型整體適配度檢驗的卡方值分別為119.250和58.672,p=0.000,均達到顯著水平,無陣發(fā)性的卡方值是陣發(fā)性組的2倍,且從Hosmer-Lemeshow檢驗來看,其卡方值分別等于4.241和14.182,相應(yīng)的p值為0.835和0.077,無陣發(fā)性組不顯著,有陣發(fā)性組表現(xiàn)為在10%的顯著性水平時顯著,說明無陣發(fā)性組的模型整體回歸適配度優(yōu)于有陣發(fā)性組。
在關(guān)聯(lián)強度上,Cox-Snell關(guān)聯(lián)強度值分別為0.159和0.113,Nagelkerke關(guān)聯(lián)強度指標值為0.238和0.158,同樣說明無陣發(fā)性組回歸的關(guān)聯(lián)強度優(yōu)于有陣發(fā)性組。
對比個別參數(shù)的顯著性,兩個模型R的Wald檢驗值分別為44.066和15.394,將近3倍的差距說明無陣發(fā)性組的模型參數(shù)R的顯著性優(yōu)于有陣發(fā)性組,故可進一步說明假設(shè)3是成立的。
隨著互聯(lián)網(wǎng)技術(shù)的推廣和應(yīng)用,電子商務(wù)快速發(fā)展,消費者在線購買過程中大量的行為數(shù)據(jù)很容易地被自動記錄下來,沉淀為海量的信息數(shù)據(jù)庫。在對電子商務(wù)的實證研究中同樣發(fā)現(xiàn),已有的文獻不再能充分解釋在線顧客購買行為的規(guī)律,更難以實現(xiàn)對重復(fù)購買的準確預(yù)測[21]。和人類行為中普遍存在的“爆發(fā)”性一致,在線顧客的購買行為也表現(xiàn)出一段時間內(nèi)頻繁購買,經(jīng)歷長久靜默之后再次爆發(fā)的現(xiàn)象[14],即“陣發(fā)性”。本研究基于已有文獻對陣發(fā)性測量的研究,探索了相應(yīng)的改進方法。并使用Logit回歸模型對變量間關(guān)系的假設(shè)予以實證,主要的研究結(jié)論:
1)根據(jù)改進的陣發(fā)性測量方法,可以判斷在線顧客購買是否具有陣發(fā)性的特征。
2)最近購買時間R越大,顧客活躍的概率越大;購買頻次F越大,顧客活躍的概率越大;陣發(fā)性對最近購買時間R有調(diào)節(jié)作用,無陣發(fā)性的顧客,最近購買時間R和顧客活躍的概率更相關(guān)。
本文的理論貢獻:一是基于對已有時間間隔描述和測量方法的成果梳理,提出改進的在線購買時間間隔陣發(fā)性測量方法,為進一步分析顧客在線購買行為,提供了概念測量的理論基礎(chǔ)和方法;二是厘清在線顧客購買行為中顧客購買頻次、最近購買時間、顧客陣發(fā)性和顧客是否活躍等的關(guān)系,揭示在線購買陣發(fā)性特征對顧客在線購買的影響機制,豐富和拓展了在線購買行為理論,為顧客是否活躍的判斷提供了變量測量和具體預(yù)測的理論依據(jù)。
本文的結(jié)論將對電子商務(wù)實踐有如下啟示:傳統(tǒng)顧客價值識別技術(shù)RFM模型未考慮顧客陣發(fā)性特征對顧客是否活躍的影響,在對顧客分類時,認為顧客購買次數(shù)越多、顧客最近購買時間越近,顧客再購買的可能性越大,顧客的價值也越高。但結(jié)合本文的結(jié)論我們知道同樣購買次數(shù)和同樣最近購買時間的兩名顧客不能直接認為其下次購買概率的大小相同,而應(yīng)和他們是否表現(xiàn)出陣發(fā)性的特征相結(jié)合。進一步將之應(yīng)用于電子商務(wù)實踐中,可提高預(yù)測準確率,指導(dǎo)電商企業(yè)精準識別顧客行為、實施不同顧客策略。
雖然本文的研究和結(jié)論有一定的理論和實踐意義,但在研究中尚有諸多不足:首先,未能取得文獻[14]對陣發(fā)性測量的數(shù)據(jù),無法和本研究所獲得的數(shù)據(jù)進行具體特點的比較。本文提出的改進方法,由于測量方法本身以及置信度的選取等影響顧客陣發(fā)性的判斷,尤其對購物次數(shù)較少的顧客判定存在較大的差異,進而影響對整個數(shù)據(jù)組的判斷和預(yù)測效果,其穩(wěn)定性值得在統(tǒng)計理論及更大量的實證中繼續(xù)探索。其次中國近年的電子商務(wù)發(fā)展中,較大規(guī)模的促銷(如雙十一)必然影響顧客的陣發(fā)性,我們在實證中無法排除,也在一定程度上影響對理論的解釋力度。下一步的研究中針對更廣泛的電子商務(wù)平臺和不同的商品種類繼續(xù)深入對比。