趙 剛
(上海賽可出行科技服務(wù)有限公司,上海 201299)
需求彈性反應(yīng)商品需?求量對價格變動做出反應(yīng)的敏感程度,營銷的主要目標(biāo)客戶群是對價格敏感、需求彈性大的消費者,可以通過調(diào)整商品價格來促使需求彈性大的消費者進行消費。
優(yōu)惠券可提升消費者的下單意愿,已成為企業(yè)常用的營銷工具。優(yōu)惠券的主要作用是有效提升客戶交易滿意度,引導(dǎo)消費者下單,從而提升企業(yè)的整體收益。如果企業(yè)希望達到收益最大化的目標(biāo),就應(yīng)該給實際有需要的消費者發(fā)放優(yōu)惠券,從而在營銷成本一定的情況下,完成更多的營銷轉(zhuǎn)化任務(wù)。企業(yè)合理制定優(yōu)惠券發(fā)放策略,使消費者享受優(yōu)惠的同時,提高企業(yè)的營收和利潤,從而達到雙贏的目的,這是當(dāng)前企業(yè)在營銷環(huán)節(jié)的核心問題。
目前,優(yōu)惠券已普遍用于服務(wù)和商品銷售領(lǐng)域,優(yōu)惠券分不同的獲取方式和類型。獲取方式分為2種,企業(yè)主動發(fā)放和客戶自動領(lǐng)取。優(yōu)惠券類型有折扣類、現(xiàn)金類以及滿減類等。兼顧提高使用率和降低補貼成本是一個難題。
優(yōu)惠券的本質(zhì)是以企業(yè)讓利的形式吸引更多消費者購買商品(降低商品消費門檻,提高商品單量)。同時,優(yōu)惠券是一種隱性的商品價格歧視策略,企業(yè)針對不同的消費者需求制定相同的價格和差異化的優(yōu)惠券(即在價格相同的情況下,針對不同消費者的消費能力發(fā)放不同的優(yōu)惠券),既不會侵犯消費者的知情權(quán),也不會違背公平交易的原則,這是企業(yè)追求最大利潤的合理定價行為。
傳統(tǒng)的優(yōu)惠券發(fā)放策略包括前臺發(fā)放和后臺發(fā)放。前臺發(fā)放為運營人員制定活動,告知消費者獲取優(yōu)惠券的規(guī)則,讓消費者通過分享、做任務(wù)以及消費等形式參與活動,如果滿足活動的獎勵規(guī)則,就為消費者發(fā)放優(yōu)惠券。后臺發(fā)放主要是將消費者分群,例如分為新消費者、老消費者以及流失消費者等,通過精準(zhǔn)定位目標(biāo)消費者的方法統(tǒng)一發(fā)放優(yōu)惠券。后臺發(fā)放主要依靠運營人員的經(jīng)驗和人工觀察(觀察用戶使用優(yōu)惠券的購物偏好)來對發(fā)放策略進行調(diào)整。傳統(tǒng)的策略具有滯后性和依賴差異性的人工經(jīng)驗(不具有普適性)等特點,難以滿足當(dāng)前商業(yè)智能發(fā)展的需求。
為了解決前臺發(fā)放和后臺發(fā)放存在的難以制定策略的問題,該文提出智能推薦發(fā)放方法。對前臺發(fā)放場景來說,可以設(shè)置合理的優(yōu)惠券面額,從而達到吸引消費者的目的;對后臺發(fā)放場景來說,可以通過自動計算每個消費者應(yīng)發(fā)放的優(yōu)惠券進行個體精準(zhǔn)營銷。
優(yōu)惠券推薦系統(tǒng)是一個帶Web用戶界面的交互式系統(tǒng),支持運營人員輸入推薦規(guī)則,例如成本約束、人群限制、優(yōu)惠券類型、金額限制以及使用條件等。優(yōu)惠券推薦系統(tǒng)根據(jù)所設(shè)規(guī)則進行智能運算,運算的結(jié)果包括發(fā)放張數(shù)、發(fā)放人數(shù)、成本以及預(yù)期營收等。
推薦系統(tǒng)架構(gòu)和二階段優(yōu)惠券交互圖如圖1所示,推薦系統(tǒng)架構(gòu)共分為4個模塊。其交互步驟如下:首先,客戶消費產(chǎn)生新的消費數(shù)據(jù)。其次,一階段機器學(xué)習(xí)根據(jù)消費數(shù)據(jù)進行訓(xùn)練,完成模型更新。再次,二階段依賴一階段生成的機器學(xué)習(xí)模型,在優(yōu)惠券推薦時執(zhí)行預(yù)測邏輯和模擬退火算法,生成最優(yōu)發(fā)放結(jié)果數(shù)據(jù)。最后,根據(jù)最優(yōu)發(fā)放結(jié)果為用戶發(fā)放優(yōu)惠券。
規(guī)則約束模塊可以處理運營人員的UI界面操作,還可以展示操作結(jié)果,程序?qū)l(fā)放結(jié)果數(shù)據(jù)和規(guī)則的設(shè)置存入推薦數(shù)據(jù)庫(推薦數(shù)據(jù)庫一般選擇關(guān)系型數(shù)據(jù)庫)。
AI模型訓(xùn)練模塊的目標(biāo)是學(xué)習(xí)消費者在購買商品時使用優(yōu)惠券的概率。輸入信息為消費者購買商品是否使用優(yōu)惠券的數(shù)據(jù),輸出信息為1個函數(shù),該函數(shù)通過機器學(xué)習(xí)的方法習(xí)得1個概率,該概率能夠度量客戶對優(yōu)惠券的敏感程度。
AI模型預(yù)測模塊是部署AI模型訓(xùn)練模塊生成的機器學(xué)習(xí)模型,還可以根據(jù)消費者特征和優(yōu)惠券特征預(yù)測使用概率。SA模擬退火推薦模塊調(diào)用AI模型預(yù)測模塊預(yù)測消費者使用優(yōu)惠券的概率。
該推薦模塊的目標(biāo)是計算最優(yōu)推薦結(jié)果,其價值的評估是在營銷成本一定的情況下,使企業(yè)營收或利潤最大化;或在預(yù)定營銷和利潤增長目標(biāo)的情況下,計算所需的最低補貼成本。根據(jù)推薦結(jié)果,運營人員會使用該結(jié)果或調(diào)整規(guī)則重新計算,當(dāng)該推薦結(jié)果滿足企業(yè)成本要求或達成企業(yè)利潤目標(biāo)時,為消費者發(fā)放優(yōu)惠券。
機器學(xué)習(xí)是通過學(xué)習(xí)已知的知識來推斷未知信息的方法,可以應(yīng)用于經(jīng)濟活動的各個方面。該文的機器學(xué)習(xí)的目標(biāo)是在為消費者發(fā)放優(yōu)惠券或消費者領(lǐng)取優(yōu)惠券后,由預(yù)測系統(tǒng)預(yù)測消費者在2周內(nèi)進行消費的概率。如果消費者需求彈性大,則通過調(diào)整優(yōu)惠券的面值來提高其消費概率;如果消費者需求彈性小且對價格不敏感,那么無論是否有優(yōu)惠券(或者優(yōu)惠券的面值大?。┒疾粫绊懰麄兊南M行為,此時應(yīng)該不發(fā)放優(yōu)惠券(或者發(fā)放面值較小的優(yōu)惠券)。
特征的數(shù)據(jù)來自消費者信息數(shù)據(jù)庫、商品信息數(shù)據(jù)庫以及優(yōu)惠券數(shù)據(jù)庫(包括發(fā)放信息和使用信息)。采用描述統(tǒng)計、維度聚合以及關(guān)聯(lián)分析等方法構(gòu)造數(shù)據(jù)特征。
數(shù)據(jù)模型的特征構(gòu)造分為5類:消費者特征、商品特征、優(yōu)惠券特征、消費者對商品的偏好特征以及消費者對優(yōu)惠券的偏好特征。消費者特征主要包括年齡、性別、消費頻率以及消費金額等;商品特征包括商品類型、商品投放優(yōu)惠券次數(shù)以及商品核銷優(yōu)惠券次數(shù)等;優(yōu)惠券特征包括面值、折扣率以及折扣類型等;消費者對商品的偏好特征包括對該商品的消費頻率、下單后的支付率等;消費者對優(yōu)惠券的偏好特征包括訂單平均折扣率、優(yōu)惠券訂單比例等。
優(yōu)惠券的使用預(yù)測等價為機器學(xué)習(xí)對數(shù)據(jù)的二分類問題。因此,將數(shù)據(jù)模型的標(biāo)簽設(shè)置為0和1,0表示2周內(nèi)未使用優(yōu)惠券,1表示2周內(nèi)使用過優(yōu)惠券,用特征加標(biāo)簽構(gòu)成樣本集。
首先,該文采用LightGBM對算法進行訓(xùn)練,LightGBM是一個實現(xiàn)GBDT算法的框架。將樣本數(shù)據(jù)集劃分為訓(xùn)練集和測試集,測試集中的數(shù)據(jù)是從樣本數(shù)據(jù)集中隨機抽取的,并且與訓(xùn)練集的數(shù)據(jù)無交叉,從而生成離線模型。
其次,采用(開源的)Java模型工具庫lightgbm_predict4j對算法進行預(yù)測。因為主流的后端框架是Java語言,所以一般使用Java語言完成在線模型預(yù)測工作。在用LightGBM生成離線模型之后,使用lightgbm_predict4j加載該模型。
最后,在Java在線應(yīng)用中進行預(yù)測。
二分類一般使用AUC值作為模型的評價標(biāo)準(zhǔn),AUC表示接受者操作特性曲線(ROC曲線)下的面積。AUC的取值范圍為0.5~1.0,當(dāng)AUC=0.5時,其真實性最低,無實際價值;AUC越接近1.0,其真實性越高,機器學(xué)習(xí)分類器的效果也就越好。一般訓(xùn)練的模型在測試集上的AUC大于0.8,即可在實際業(yè)務(wù)中應(yīng)用,并能取得不錯的業(yè)務(wù)效果。
二分類算法收斂后,機器學(xué)習(xí)算法可以展示各個特征對模型的重要性評分。并按重要性評分對特征進行排序,選取前n個特征重新進行模型訓(xùn)練,計算對應(yīng)的AUC值。當(dāng)找到AUC的最大值時,相應(yīng)的前n個特征值為最佳的特征組合。
優(yōu)惠券推薦屬于組合優(yōu)化問題,隨著問題規(guī)模的擴大,搜索空間也會增長,使求最優(yōu)解變得非常困難,因此一般會采用尋找可接受滿意解的方法。遺傳算法(Genetic Algorithm,GA) 、模擬退火(Simulate Anneal,SA)、神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)是解決這類問題的3種經(jīng)典啟發(fā)式算法,這類算法都是先生成初始可行解,再采用優(yōu)化方法逐步得到可接受滿意解。
模擬退火算法是單體啟發(fā)式算法,其優(yōu)點是易于對復(fù)雜問題進行建模,且總是有可能找到全局最優(yōu)解。下面以消費者的平均期望優(yōu)惠券使用率表示目標(biāo)訂單數(shù)或目標(biāo)營收的近似值,為用戶發(fā)放單一面值的優(yōu)惠券,以說明模擬退火在優(yōu)惠券推薦中的應(yīng)用方法(其他規(guī)則和場景與其類似)。
消費者的預(yù)測使用概率如公式(1)所示。
式中:x為消費者特征數(shù)據(jù);g(x)為對消費者的補貼成本,即對消費者發(fā)放優(yōu)惠券的面值;p(x)為x在g(x)情況下的預(yù)測使用概率;f為第一階段的機器學(xué)習(xí)預(yù)測求解的概率函數(shù)(根據(jù)消費者過去的消費數(shù)據(jù))。
消費者的發(fā)放成本如公式(2)所示。
式中:x為消費者特征數(shù)據(jù);h(x)為x的發(fā)放成本。
目標(biāo)優(yōu)化函數(shù)如公式(3)所示。
圖1 推薦系統(tǒng)架構(gòu)和二階段優(yōu)惠券交互圖
式中:L為總發(fā)送成本。
設(shè)消費者數(shù)量為n,消費者x標(biāo)記為x~x,將優(yōu)惠券發(fā)放問題轉(zhuǎn)化為求解g(x)的問題,使目標(biāo)優(yōu)化函數(shù)L取得最小值。
設(shè)定最優(yōu)化問題的約束條件,所有消費者的預(yù)測使用概率均值約束如公式(4)所示。如果未接受新解,則對未接受次數(shù)d累加1。接受概率σ如公式(6)所示。5) 如果滿足終止條件,則輸出當(dāng)前解,將其作為最優(yōu)解, 計算結(jié)束, 終止條件定義如公式(7)所示。6) 退火內(nèi)循環(huán)1輪結(jié)束,溫度降溫后轉(zhuǎn)第2步。溫度更新方法如公式(8)所示。
式中:α為本次發(fā)放目標(biāo)期望平均使用率約束因子;p 為計算的所有消費者的預(yù)測使用概率實際值;n為消費者數(shù)量。
單個消費者的補貼約束如公式(5)所示。
式中:β為單個消費者補貼上限;g(x)為對消費者x的補貼成本,g(x)取值為離散整數(shù)值,取值范圍為[0,β]。
對g(x)的求解過程如下:1) 算法初始化。執(zhí)行智能發(fā)放優(yōu)惠券模擬退火算法的流程如圖2所示。設(shè)初始化溫度t,每個溫度t下的迭代次數(shù)為m,溫度的衰減系數(shù)為u[u∈(0,1)],初始解s為每個消費者最大補貼金額β,根據(jù)公式(1)~公式(3)計算初始化目標(biāo)函數(shù)值L。2) 當(dāng)k=1,…,m時,重復(fù)執(zhí)行第3步~第5步。m為關(guān)鍵參數(shù),表示馬爾科夫鏈長度(此處是對m現(xiàn)實含義的進一步解釋。從算法角度看,m為溫度t下的迭代次數(shù);從現(xiàn)實含義來看,m為馬爾科夫鏈長度),其數(shù)字越大,模擬退火算法搜索就越充分,越有可能找到全局最優(yōu)解,但會增加算法的搜索時間。3) 根據(jù)隨機選擇操作對當(dāng)前解進行變換,得到的新解為s',具體過程為隨機選擇消費者x,對g(x)進行隨機變換(增加或減少),該變換需要滿足公式(4)、公式(5)所定義的約束條件。4) 計算目標(biāo)函數(shù)變化量。如果變化量小于0,就說明新解比原有解更好(接受新解);否則基于Metropolis準(zhǔn)則,用概率σ接受新解。在接受新解后,設(shè)置未接受次數(shù)d=0;
式中:K為玻爾茲曼常數(shù),K=1.380649×10;t為當(dāng)前溫度;ΔL為目標(biāo)函數(shù)變化量,ΔL=L-L(L為新解的目標(biāo)值);σ為接受概率。
圖2 模擬退火推薦算法流程圖
式中:d為未接受新解的連續(xù)次數(shù),如果連續(xù)d次未接受新解,則默認(rèn)已收斂;β為單個消費者補貼上限;n為消費者數(shù)量。
式中:u為溫度衰減系數(shù);t為當(dāng)前溫度。
智能營銷在經(jīng)濟領(lǐng)域中占據(jù)越來越重要的地位,優(yōu)惠券是一種有效的營銷方法。為了解決智能營銷問題,該文建立了優(yōu)惠券推薦系統(tǒng),該系統(tǒng)采用機器學(xué)習(xí)和模擬退火算法解決優(yōu)惠券發(fā)放最優(yōu)化問題。該推薦系統(tǒng)的特點是可設(shè)置各種補貼目標(biāo),例如補貼上限、消費者使用率以及目標(biāo)訂單數(shù)等,由推薦系統(tǒng)自動完成對每個消費者個性補貼的計算工作。 同時,該算法能估算總營銷成本以及營銷成果的可提升空間。如果運營人員評估營銷成本高于預(yù)算,還可以重新調(diào)整約束規(guī)則,再次進行計算。該算法具有按需補貼、預(yù)算可控以及個性補貼等優(yōu)勢,可以降低企業(yè)營銷的難度和成本。