彭芳
內(nèi)容摘要:隨著行為運作管理研究的興起與發(fā)展,出現(xiàn)了越來越多的基于行為實驗的研究工作。通過對行為決策的實證考察,了解了決策者的真實決策行為;通過行為模型分析,縮小了理論與現(xiàn)實之間的差距?;诖?,本文考慮策略消費者的有限理性行為和決策偏差,認為零售商需要調(diào)整自己的庫存量和價格決策,建立了面對同質(zhì)策略型消費者的零售商優(yōu)化模型,并使用隨機最優(yōu)反應均衡模型來刻畫策略型消費者的有限理性行為。
關鍵詞:策略型 ? 消費者行為 ? 零售商 ? 決策
理論分析
(一)有關策略型消費者的概述
CaChon根據(jù)消費者的消費時間將消費者分成了三類:一是逢低吸納的消費者(Bargain-Hunting Customers),他們只會在商品打折的時候才會選擇購買。在折扣期,每個逢低吸納的消費者對商品有一個估值,折扣價格小于估值,他們在逢低吸納的過程中獲得盈余。全球最大家用電器和電子產(chǎn)品零售商百思買集團(Best Buy),給這類消費者加了一個標簽“惡魔”(Devils),與這個標簽恰恰相反,他們給那些喜歡直接以全價購買商品的消費者的標簽是“天使”(Angels)。二是近視型消費者(Myopic Customers),這類消費者就是百思買集團所說的“天使”,與逢低吸納的消費者正好相反,在全價銷售期只要價格低于商品對他們的價值,他們就會立即在銷售期購買。運作管理領域一些傳統(tǒng)的研究大多是基于近視型消費者這一假設的,也就是假設所有消費者都會選擇直接購買商品。三是策略型消費者(Strategic Customers),這類消費者在購買商品之前會考慮商品降價的可能性,以及降價后能買到商品的可能性,通過比較立即購買和等待折扣可能獲得的效用大小,選擇最佳購買時間。不同于逢低吸納和近視型消費者,策略型消費者的決策不是簡單地考量單期效用,而是綜合地比較兩期或多期的效用,這類具有跨期替代行為的消費者就是策略型消費者。
(二)研究模型的建立
Cashon和Swnniey在他們的研究模型中發(fā)現(xiàn)不確定的定價策略勝過固定價格路徑的定價策略。他們的一個直觀證據(jù)是,在固定價格路徑時,為了引導策略型消費者全價購買,零售商需要放棄一部分的回收庫存。但是,Aviv和Pazgal通過對比定價策略,發(fā)現(xiàn)在考慮策略型消費者的情況下,固定的價格路徑比不確定的定價更具優(yōu)勢。Dasu和Tong也得到了相似的結論,他們認為固定的價格路徑,價格之間有小幅差異的定價策略幾乎是最優(yōu)的。
本研究將基于固定價格路徑的假設。庫存量有限、價格路徑固定的例子在現(xiàn)實中也很常見。例如,美國的Filenes Basement、中國的上品折扣、以及美國和英國的TKTS售票廳。Filenes Basement和上品折扣都是銷售打折服飾的市場,一些品牌服飾會在銷售期末在Filenes Basement和上品折扣進行打折銷售,折扣力度經(jīng)常超過50%。TKTS是百老匯售票亭更為典型,其演出劇場是有確定的容量限制的,而TKTS通常會在開始售票時以全價銷售,到演出當天如果仍然有票剩余,會降價處理剩余的票,折扣力度經(jīng)常是50%或更低。
同質(zhì)策略型消費者行為對零售商決策的影響模型構建及優(yōu)化
(一)考慮同質(zhì)策略型消費者的零售商優(yōu)化基本模型
本文采用報童模型來分折考慮策略型消費者的零售商優(yōu)化問題。消費者數(shù)量是隨機的,用X來表示,服從分布函數(shù)F(·)。每個消費者從零售商處購買一件商品。銷售期商品價格是p,折扣期商品價格是s,零售商的庫存量是q。假設每件商品零售商的訂貨成本為c,那么傳統(tǒng)的報童模型可以表示為:
在策略型消費者行為的模型中,假設直接購買的消費者一定能夠獲得商品。也就是說,零售商會通過一些補貨策略,例如快速反應(Quick Response)策略來滿足銷售期的過剩需求。然而,由于臨時補貨需要更高的成本,臨時補貨帶來的收益可能不多甚至沒有收益。為了簡化模型,假設臨時補貨的成本等于銷售價格p,因此臨時補貨帶來的收益為0。
假設折扣期的低價格會吸引大量的外生需求(逢低吸納的消費者),也就是假設以祈扣價格銷售商品時,如果系統(tǒng)中的X個消費者都買到商品后仍有剩余,那么剩余的貨物將被大量的外生消費者以s的價格買走。因為,這部分消費者不像系統(tǒng)中的消費者那樣一直在銷售市場中等待,因此系統(tǒng)中的消費者會優(yōu)先購買到商品。這樣的假設在文獻中也經(jīng)常被用到。
為了不失一般性,假設折扣價s一定,零售商的決策變量就為商品銷售期的價格p和庫存量q。事件發(fā)生的順序是:已知需求分布以及策略型消費者的行為規(guī)則,零售商作出價格p和庫存量q的決策;策略型消費者決定在銷售期全價購買,還是等待折扣。α是選擇等待的消費者的比率,因此零售商收益的優(yōu)化模型可以表示為:
注意,優(yōu)化模型(2)假設了臨時補貨成本等于銷售價格p。設臨時補貨成本為cQ,更貼近現(xiàn)實的假設應該是臨時補貨成本cQ小于價格p大于成本c。這里采用cQ=p 的假設是因為cQ是一個常數(shù)項,并不會改變優(yōu)化模型的性質(zhì);且這個假設可以簡化模型,這將為后續(xù)的分析過程帶來很多便利。放松模型(2)對cQ的假設,也就是如果cQ
比較優(yōu)化模型(2)和(3),函數(shù)關于α*和q的單調(diào)性沒有變。并且,成本的變化與策略型消費者決策沒有直接聯(lián)系(策略型消費者效用函數(shù)中沒有成本項)。因此,弱激勵相容、強激勵相容這樣的價格條件也沒有變化。也就是說,當cQ
(二)零售商優(yōu)化模型
根據(jù)隨機最優(yōu)反應均衡模型,己知庫存量q、價格p以及有限理性參數(shù)β,符合隨機最優(yōu)反應均衡的等待的比率α*可以被計算出來。根據(jù)零售商收益的優(yōu)化模型(2),考慮有限理性的策略型消費者,零售商應該先估計有限理性參數(shù)β,然后做出最優(yōu)決策(q*,p*)。因此,零售商的最優(yōu)化模型變?yōu)椋?/p時,本研究的主要結論也仍然成立。>
根據(jù)隨機最優(yōu)反應均衡模型,設V′w(·) 為消費者等待折扣期望效用的一階導。
定理1:如果,α* 唯一。
證明:QRE(α)的一階導是:
因為 ?V`w(α)>0,所以。
己知α*是QRE(α)與QRE(α)=α的交點,并且QRE(α)=α的斜率是1。因此,如果,則交點 α*唯一。也就是:
因此,當時, α*唯一。定理1得證。
定理1給出了 α*唯一的充分條件。如果 α*唯一,優(yōu)化模型(4)會更容易處理,最優(yōu)決策可以通過計算得到。然而,如果過小α*不唯一,零售商的優(yōu)化決策會變得比較復雜,有限理性參數(shù)的值滿足唯一性條件。也就是說,實際中β是唯一的α*,這個唯一的α*會為零售商的決策帶來更多方便。
定理2:如果,α*隨價格p的降低而減小。
證明:己知α*是不動點??梢赞D(zhuǎn)換為,設等式右邊為。
當p降低,Vb=v-p 升高,等式左邊升高,因此y也跟著升高。如果證明y隨α*遞減,也就是y`<0 ,也就證明了α*隨價格p的降低而減小。y關于α*的一階導是:
如果,那么需要滿足條件;也就是,如果,α*會隨p的降低而減小。定理2得證。
定理2給出了α*隨p變化的單調(diào)性,價格降低將導致需求的增加是經(jīng)濟學中普遍認可的直觀規(guī)律。根據(jù)定理2,當價格降低時等待的比率減小,也就是說直接購買的消費者比率增加。如果策略型消費者是完全理性的,零售商應該考慮(q,p)與納什均衡之間的關系。根據(jù)優(yōu)化模型(4),零售商希望消費者能夠達到“全部購買”這一均衡,也就是α*=0。如果在弱激勵相容的條件下,零售商就能夠達到“全部購買”這一均衡,那么零售商的最優(yōu)決策可以通過和 p=pw(q)計算得到;在強激勵相容的條件下,消費者有可能達到“全部購買”的均衡。因此,比起弱激勵相容,強激勵相容對于零售商而言更具參考價值。
(一)零售商的決策空間
根據(jù)優(yōu)化模型(4),給定價格p,零售商的最優(yōu)決策q*滿足臨界分位值。設報童模型的最優(yōu)解為q10,對比報童模型(1),可以得到,即考慮有限理性的最優(yōu)庫存量小于傳統(tǒng)報童模型的最優(yōu)庫存量。換言之,如果 α*>0,給定p,優(yōu)化模型(4)的解q*,會落在圖1中傳統(tǒng)報童模型臨界分位值曲線的左側;也就是說,傳統(tǒng)報童模型的臨界分位值可以作為優(yōu)化模型(4)最優(yōu)庫存量的上界。另外,強激勵相容能夠引導消費者“全部購買”。根據(jù)強激勵相容條件,可以給出零售商最優(yōu)庫存量的下界。因此,零售商的最優(yōu)決策應該在圖1中的陰影部分內(nèi)。
(二)a*不唯一時零售商的決策
定理1給出了α*唯一的充分條件。無論α*唯一與否,圖1的決策空間都成立。設c=3、s=1.5、v=7.5并且X~U[0,10] ,給定β,根據(jù)圖1給出的決策空間可以計算所有的α*,以及其對應的零售商收益∏(q,p)。當β→0,消費者接近完全理性,那么當p≥pw(q) 和p≤pw(q) 時α*唯一;當 p∈(ps(q),pw(q))時,α*不唯一。隨著β的增大,α*不唯一的決策空間逐漸減小。β=0.2和β=0.5,α*具有不唯一的決策空間。當β大于一個固定的值時,整個決策空間都對應唯一的α*。
對于給定的β,如果決策空間對應著不唯一的隨機最優(yōu)反應均衡α*,零售商很難判斷策略型消費者將達到哪個均衡。與納什均衡的多均衡相似,不唯一的α*給零售商決策帶來困難。這里繼續(xù)采用β=0.2和β=0.5的例子,在這兩個例子中,零售商的部分決策空間存在三個隨機最優(yōu)反應均衡,定義這三個均衡為α*1、α*2和α*3,這里 α*1<α*2<α*3,零售商可以根據(jù)α*1、α*2和α*3中任意均衡進行決策。表1給出了零售商根據(jù)不同均衡的決策情況。β=0.2時,如果零售商根據(jù)α*1進行決策,最優(yōu)解是 (q*,p*)=(2.475,5.535),對應的α*1=0.137,Π*1=4.842。但是,對于這個最優(yōu)解還有其他兩個隨機最優(yōu)反應均衡存在,分別是α*2=0.378和α*3=0.999。因此,如果零售商采用這個最優(yōu)解,則必須承受消費者可能達到其他兩個均衡的風險,實際收益可能是 Π2=4.287對應α*2=0.378,或者Π3=-3.706 對應 α*3=0.999。也就是說,如果消費者偏離α*1=0.137 這個均衡,零售商將得不到預想的收益,并且可能承受一定的損失。類似地,如果零售商按照α*2進行決策,那么最優(yōu)解是 (q*,p*)=(2.535,5.530)對應的 α*2=0.250,Π2=4.686 。在這種情況下,可能導致其他兩個可能均衡的發(fā)生,α*1=0.231 和α*3=0.999,零售商對應的收益分別是Π1=4.728 和Π3=-3.797。因此,如果消費者按照α*2做決策,實際的收益可能變得更好,也可能變得更糟。最后,如果零售商按照α*3決策,Π*3的結果會比較小,但是其它兩個可能的均衡帶來的收益都比Π*3 更好。
表1中,歸納了β=0.2和β=0.5時數(shù)值計算的結果,從這些結果中可以觀察到以下一些規(guī)律。首先,不論哪個α*被選擇,如果α*1<α*2<α*3,則Π1>Π2>Π3。這個結論也可以通過最優(yōu)化模型(4)得到驗證。對于給定的 (q*,p*),Π隨著α*的減小而增大。也就是說,對于零售商而言,α*的值越大將導致收益越差。其次,如果零售商的決策是基于第i個均衡α*的,那么 Π*i>Πi,也就是說目標均衡對應的最優(yōu)收益大于其他第i個均衡對應的收益。例如,當β=0.5時,Π*2=3.408 ,大于Π2=1.363 和Π2=0.232 。
當零售商的有限理性程度β很小時,與納什均衡的多均衡情況非常相近,隨機最優(yōu)反應均衡也存在多均衡。不同的α*對應著不同數(shù)量的等待折扣的消費,從而影響零售商的收益。面對不唯一的零售商需要采用一些方法決定選擇哪個α*進行決策,我們認為當β很小的時候,可以將策略型消費者近似地看做是完全理性的,這樣可以按照完全理性的方法進行相關的分析。
(三)α*唯一時零售商的決策
如果α*唯一,零售商的決策會變得容易許多。α* 唯一的一個充分條件是β足夠大,那么對于任意的β值是不是都存在對應唯一 α*的(q,p)值呢?根據(jù)數(shù)值計算發(fā)現(xiàn),當β很小時,決策空間(q,p)被劃分為三部分:一部分對應唯一α*,—部分對應兩個α*,還有一部分對應三個α*。并且,隨著β的增大,對應三個α*的決策空間會逐漸變小,直至α*大于一定值,整個決策空間都對應唯一的α*。也就是說,對于任意α*,都有對應唯一α*的(q,p)值。具體如圖2所示。
對于對應唯一 α*的決策空間,可以找到零售商優(yōu)化問題的最優(yōu)解。這里仍然采用c=3,s=1.5,v=7.5,并且X~U[0,10] 這個例子。圖3是針對不同的值β,只考慮唯一α*的決策空間內(nèi),零售商優(yōu)化問題的最優(yōu)解(q*,p*)。圖3中箭頭所指方向,是β逐漸變大時,對應的(q*,p*) 的變化趨勢。正如前文所述,當β值較小時,決策空間被分成三個區(qū)域,而此時的(q*,p*) 在α*唯一與不唯一的分界點上。為了更直觀的理解零售商決策與β之間的關系,這里采用了β=0.2,β=0.5和β=0.7三個例子。圖3給出了最優(yōu)解(q*,p*)與不同β值對應決策空間之間的關系。當β較小時(例如β=0.2和β=0.5),(q*,p*)接近α* 唯一與不唯一的分界點,見圖3的子圖(a)和(b)。但是,當β增大時(例如β=0.7),α*不唯一的決策空間變小,最優(yōu)解(q*,p*) 偏離分界點,見圖3的子圖(c)。
另外,文獻中經(jīng)常用理性期望均衡的方法,假設消費者會“全部購買”,理性期望均衡的條件與弱激勵相容條件是一致的,這個條件在實際中無法引導消費者“全部購買”,相反很可能導致消費者“全部等待”。但是,理性期望均衡仍然在兩個決策變量p和q之間建立了一種聯(lián)系,也就是p=pw(q) ,通過這種聯(lián)系將有效的提高運算效率。在有限理性的前提下,這樣的聯(lián)系是否能夠幫助零售商進行更有效的決策呢?將弱激勵相容條件與考慮有限理性的消費者的零售商優(yōu)化模型結合在一起,對比唯一α*對應的最優(yōu)解Π*,當β在一定范圍時,通過弱激勵相容條件計算的零售商收益與最優(yōu)解Π*非常接近。這個發(fā)現(xiàn)意味著,當消費者的有限理性在一定范圍內(nèi)時,零售商可以參照弱激勵相容條件(也就是理性期望均衡)進行決策,并得到滿意的收益。
參考文獻:
1.周維浪,韓小花,沈瑩.考慮消費者行為的閉環(huán)供應鏈定價和服務水平?jīng)Q策及協(xié)調(diào)[J].計算機集成制造系統(tǒng),2017,23(10)
2.張艷麗,胡小建,楊海洪等.政府補貼下考慮消費者策略行為的綠色供應鏈決策模型[J].預測,2017,36(2)
3.楊冬旭,于建軍.消費者類型與廠商的決策博弈[J].商業(yè)經(jīng)濟研究,2017(23)
4.毛照,王方圓.基于消費者行為和估值折扣差異的易逝品兩期定價決策研究[J].管理學報, 2017,14(3)
5.唐躍武,范體軍,劉莎.考慮策略性消費者的生鮮農(nóng)產(chǎn)品定價和庫存決策[J].中國管理科學,2018,26(11)