楊蘇,蔡樂(lè)
(1.安徽建筑大學(xué) 經(jīng)濟(jì)與管理學(xué)院,安徽 合肥 230601;2.安徽省建筑經(jīng)濟(jì)與房地產(chǎn)管理研究中心,安徽 合肥 230601)
在工業(yè)化進(jìn)程中,環(huán)境問(wèn)題成為全球性問(wèn)題,在資源和環(huán)境限制下的綠色行為也日益重要。企業(yè)的綠色行為是指為了在資源環(huán)境約束下提高自身競(jìng)爭(zhēng)優(yōu)勢(shì),為獲得社會(huì)、經(jīng)濟(jì)和環(huán)保的最大收益行為,采用綠色創(chuàng)新與管理,將資源消耗降到最低且將環(huán)境污染減到最少[1]。在綠色行為決策過(guò)程中,企業(yè)追求的是自身的利潤(rùn)最大化,而政府作為監(jiān)管方,受到一些不確定因素的影響,也無(wú)法時(shí)刻都做出完全理性的決策行為,因此風(fēng)險(xiǎn)決策行為可以看做是在不確定情形下有限理性決策主體所做的綠色行為決策的這一行為,符合演化博弈的有限理性假設(shè)。
已有研究證實(shí)絕大多數(shù)的環(huán)境污染問(wèn)題產(chǎn)生的原因是企業(yè)未采取綠色行為或政府未能進(jìn)行及時(shí)有效的監(jiān)管[2-5],而運(yùn)用演化博弈分析綠色行為的現(xiàn)有研究成果中對(duì)企業(yè)不采取綠色行為、政府不積極監(jiān)管的決策行為背后的形成機(jī)理并未給出有說(shuō)服力的解釋[6-7]。那么究竟如何利用演化博弈研究綠色行為決策過(guò)程中的形成機(jī)理?
演化博弈理論[8-10]摒棄了經(jīng)典博弈論完全理性假設(shè)的局限,從人的有限理性出發(fā)來(lái)分析和預(yù)測(cè)群體行為,真實(shí)反映決策主體行為的多樣性和復(fù)雜性。一些學(xué)者已運(yùn)用演化博弈的方法對(duì)綠色行為決策進(jìn)行了研究,這些研究成果[11-14]改進(jìn)了原有完全理性的假設(shè)局限,但在分析過(guò)程中仍采用的是基于傳統(tǒng)期望效用理論的客觀收益矩陣來(lái)表達(dá)支付矩陣,無(wú)法準(zhǔn)確刻畫(huà)決策行為人的心理感知,所得出的結(jié)論常與現(xiàn)實(shí)矛盾甚至相悖。因?yàn)榍熬袄碚撆c傳統(tǒng)的期望效用理論相比較,增加了決策者的理性不足和偏好兩方面的考慮,衡量的是動(dòng)態(tài)不確定條件下的前景價(jià)值,所以其在分析企業(yè)行為方式行為變化時(shí)更加客觀,也更符合在真實(shí)情況下人們的決策行為[15-16]。
因此,本文將前景理論引入演化博弈分析框架,遵循有限理性的假設(shè)前提,用前景理論中的前景價(jià)值函數(shù)替代傳統(tǒng)期望效用理論中的收益矩陣,構(gòu)建演化博弈模型并通過(guò)仿真分析探討政府不同環(huán)境規(guī)制強(qiáng)度下的企業(yè)行為策略。
建立基于前景理論綠色行為的企業(yè)前景價(jià)值感知函數(shù),并構(gòu)建主體綠色決策的演化博弈模型,運(yùn)用演化動(dòng)態(tài)中的復(fù)制動(dòng)態(tài)來(lái)刻畫(huà)政府和企業(yè)的策略選擇與演化路徑。
在不考慮外部環(huán)境和其他決策主體影響的情況下,綠色行為決策過(guò)程可以視為一種不確定情形下政府和企業(yè)的風(fēng)險(xiǎn)決策行為?;诖耍岢鲆韵录僭O(shè):
假設(shè)1:在綠色行為決策中,存在著政府和企業(yè)博弈雙方,其各自對(duì)策略?xún)r(jià)值的感知從而進(jìn)行決策,并且政府和企業(yè)這種感知價(jià)值的特征符合前景理論,前景價(jià)值(V)即博弈主體對(duì)策略得失值的心理感受,其分為價(jià)值函數(shù)v(x)和權(quán)重函數(shù)π(p)。
其中,我們將pi作為決策事件所發(fā)生的概率,π( pi)代表決策者的主觀判斷事件所發(fā)生的概率,其權(quán)重函數(shù)形狀為倒“S”型,γ 值越小,函數(shù)曲線越彎曲,滿足π(0)= 0,π(1)= 1;Δxi為事件發(fā)生后博弈主體所得的實(shí)際收益與參照點(diǎn)的差值,Δx =x - x0,x0為參照點(diǎn)。
α、β ∈(0,1)為博弈主體的風(fēng)險(xiǎn)偏好系數(shù),當(dāng)α = β = 1 時(shí)此時(shí)的博弈主體是風(fēng)險(xiǎn)中等偏好。損失規(guī)避系數(shù)為λ(λ ≥1),它的值越大則表示主體對(duì)損失的敏感性強(qiáng)于收益。
假設(shè)2:企業(yè)和政府的策略選擇分別有兩種:{采取綠色創(chuàng)新行為I1,不采取綠色創(chuàng)新行為I2}與{積極監(jiān)管S1,消極監(jiān)管S2}。
若政府為投入積極監(jiān)管而產(chǎn)生的費(fèi)用為c,相對(duì)應(yīng)的前景價(jià)值感知為C;企業(yè)的進(jìn)行的綠色創(chuàng)新行為采取包括勞動(dòng)、時(shí)間、精力等付出的實(shí)際成本為t,前景價(jià)值感知相應(yīng)為T(mén)。f1為政府實(shí)際處罰企業(yè)造成的環(huán)境污染問(wèn)題,相應(yīng)的前景價(jià)值感知為F1。
假設(shè)3:政府在決策時(shí)的主要關(guān)注問(wèn)題是社會(huì)效益最大化,企業(yè)既追求利潤(rùn)最大化也會(huì)考慮社會(huì)效益。社會(huì)理性更加決定了個(gè)體利益,行為如果只考慮到個(gè)體利益無(wú)法絕對(duì)保證個(gè)體的最大化利益[17]。
企業(yè)與政府在日常生產(chǎn)生活中所存在的博弈過(guò)程是動(dòng)態(tài)可重復(fù)的過(guò)程,根據(jù)對(duì)方的相關(guān)變化來(lái)調(diào)整自身策略,改變的策略會(huì)形成演化穩(wěn)定均衡。
企業(yè)采取綠色行為的概率為x,不采取綠色行為的概率為1 - x 政府積極監(jiān)管的概率為y,消極監(jiān)管的概率為1 - y,其中。
文中各變量設(shè)置與符號(hào)約定參見(jiàn)表1。
表1 變量設(shè)置與符號(hào)約定
通過(guò)上述三個(gè)假設(shè),構(gòu)建基于前景理論的綠色行為決策主體間的演化博弈模型、收益感知矩陣,如下表2 所示。
表2 綠色行為決策主體的收益感知矩陣
(3)當(dāng)博弈雙方采取{ }S1,I2策略時(shí),假設(shè)企業(yè)不采取綠色行為被發(fā)現(xiàn)的實(shí)際概率為q,若未被發(fā)現(xiàn)則可逃脫處罰。
基于復(fù)制動(dòng)態(tài)的演化博弈分析方法[18],由表2可知,企業(yè)在采納綠色行為和不采納綠色行為兩種情形下的期望收益感知及平均收益感知分別為:
同理,政府在積極監(jiān)管和消極監(jiān)管兩種情形下的期望收益感知及平均收益感知分別為:
根據(jù)非對(duì)稱(chēng)復(fù)制動(dòng)態(tài)演化方式,得到x 和y 的復(fù)制動(dòng)態(tài)方程分別為:
綠色行為決策主體的演化均衡結(jié)果可通過(guò)式(10)和(11)聯(lián)立的微分方程組系統(tǒng)求解得到。
使(F(x),F(y))=(0,0),從而得到了五個(gè)點(diǎn),分 別 是:E1(0,0),E2(0,1),E3(1,0),E4(1,1) 與E5(x0,y0),其 中,y0)=。
再根據(jù)每個(gè)均衡點(diǎn)的detJ 和trJ 的正負(fù)情況進(jìn)行判定,將雅克比矩陣記為 J,J =,雅克比矩陣存在局部穩(wěn)定性相應(yīng)判定準(zhǔn)則[19],當(dāng)且僅當(dāng)detJ >0 且trJ <0 時(shí)可能均衡點(diǎn)為演化穩(wěn)定均衡點(diǎn)其對(duì)應(yīng)的局部穩(wěn)定性分析為下表3。
表3 局部穩(wěn)定性分析結(jié)果
根據(jù)前景理論可知,綠色行為主體的決策是由其收益心理感知決定的,只有同時(shí)滿足(13)中的所有條件,政府才會(huì)選擇積極監(jiān)管,企業(yè)才會(huì)選擇采用綠色行為的策略,此時(shí)達(dá)到帕累托最優(yōu)。
由于x,y ∈[ 0,1 ],而要使得點(diǎn)E5(x0,y0)有意義則需要滿足:
即企業(yè)采取綠色行為的所付出的費(fèi)用的前景價(jià)值感知小于政府對(duì)企業(yè)進(jìn)行污染行為的處罰風(fēng)險(xiǎn)、聲譽(yù)及損失的風(fēng)險(xiǎn)貼現(xiàn)值之和,且也小于由此帶來(lái)的額外外部收益,企業(yè)才可能自發(fā)采取綠色行為。
通過(guò)采用MATLAB 軟件仿真模擬企業(yè)綠色行為決策演化構(gòu)建博弈模型中的參數(shù)變化對(duì)系統(tǒng)演化的影響。
假設(shè)初始值為x=0.2,y=0.2,k=1,m=0.4,n=0.6,F(xiàn)1=0.5,F(xiàn)2=1,C=1,T=1,通過(guò)上述的初始值設(shè)置,再進(jìn)行MATLAB 軟件50 次的重復(fù)博弈仿真。
2.2.1 政府對(duì)企業(yè)行為的監(jiān)管成本C 值得改變對(duì)結(jié)果的影響
由圖1 知,關(guān)于監(jiān)管成本C 的臨界值在0.9 值附近,當(dāng)臨界值小于C 時(shí),y 收斂于0,然而C 的減少一定程度降低y 收斂于0 速度;當(dāng)臨界值大于C時(shí),y 收斂于1,此時(shí)C 的減少一定程度加快y 收斂于1。由此我們發(fā)現(xiàn),經(jīng)過(guò)C 的降低,政府積極監(jiān)管的概率會(huì)的到提升。
圖1 政府的監(jiān)管成本C的變化對(duì)演化結(jié)果的影響
2.2.2 企業(yè)污染行為被政府處罰的損失其F1的變化對(duì)演化結(jié)果的影響
由圖2 可得,F(xiàn)1在1.0-1.5 之間存在某個(gè)臨界值,當(dāng)F1小于該臨界值時(shí)x 收斂于0,而F1增加會(huì)減慢x 收斂于0 的速度;當(dāng)F1大于其時(shí),x 則會(huì)收斂于1??梢?jiàn),通過(guò)增加企業(yè)污染行為被政府處罰所損失的F1使企業(yè)在綠色生產(chǎn)方面更加重視。
2.2.3 企業(yè)的風(fēng)險(xiǎn)損失的前景價(jià)值感知F2的變化對(duì)演化結(jié)果的影響
圖2 企業(yè)受到政府處罰的損失的前景價(jià)值感知F1變化對(duì)演化結(jié)果的影響
由圖3 可知,臨界值存在于1.6-1.8 之間,當(dāng)臨界值大于F2,x 收斂于0,增大F2減慢x 的收斂;當(dāng)臨界值小于F2時(shí),x 收斂于1,這使得增大F2反而加快了x 的收斂。從而,增加企業(yè)的風(fēng)險(xiǎn)損失的前景價(jià)值感知F2,可促進(jìn)企業(yè)更多的采納綠色生產(chǎn)行為。
圖3 企業(yè)的風(fēng)險(xiǎn)損失的前景價(jià)值感知F2變化對(duì)演化結(jié)果的影響
2.2.4 綠色行為的采取所付出成本T 其變化對(duì)演化結(jié)果的影響
從圖4 可得,在0.6 的附近存在一個(gè)相應(yīng)的臨界值,當(dāng)T 比其小時(shí),x 收斂于1,此時(shí)T 的減少能夠更快的促使x 收斂于1。當(dāng)T 比此臨界值大時(shí),x 會(huì)收斂于0,但T 減少時(shí)能降低x 收斂于0 的速度;所以,幫助企業(yè)降低綠色行為成本T 幫助綠色行為采納。
2.2.5 風(fēng)險(xiǎn)傳遞系數(shù)k 的變化對(duì)演化結(jié)果的影響
圖4 綠色行為的采取所付出成本T其變化對(duì)演化結(jié)果的影響
由圖5 可知,在1.2-1.4 之間存在某個(gè)臨界值,臨界值小于k 時(shí),y 收斂于1,此時(shí)增加k 一定程度令y 加速收斂于1。所以,政府在通過(guò)加大經(jīng)濟(jì)懲罰的力度和制定更加嚴(yán)厲的環(huán)境規(guī)范政策會(huì)相應(yīng)增加企業(yè)對(duì)于綠色行為的拒絕產(chǎn)生的環(huán)境危害所遞送到政府的成本,企業(yè)在種種措施下會(huì)更加傾向于綠色行為。
圖5 風(fēng)險(xiǎn)傳遞系數(shù)k變化對(duì)演化結(jié)果的影響
2.2.6 y 改變對(duì)演化結(jié)果的影響
從圖6 得知,F(xiàn)2= 1.6 時(shí),臨界值存在0.8 附近,臨界值大于y 時(shí),x 收斂于0,并且增加y 一定程度減緩x 收斂于0 的速率,反之。所以提升政府積極監(jiān)管的概率y 比例能夠促進(jìn)企業(yè)采納綠色行為。
綜上,由以上綠色行為決策的演化博弈模型和仿真結(jié)果可知,企業(yè)采納綠色行為與否在于對(duì)其收益和成本的前景價(jià)值感知的衡量?;谇熬袄碚摵陀邢蘩硇约僭O(shè),可從以下方面促進(jìn)企業(yè)的綠色行為:
(1)強(qiáng)化企業(yè)的心理預(yù)期價(jià)值感知
圖6 y變化對(duì)演化結(jié)果的影響
企業(yè)的綠色行為是不確定性的風(fēng)險(xiǎn)決策行為,決策者的風(fēng)險(xiǎn)偏好和有限理性會(huì)影響決策行為。根據(jù)前景理論,決策者面對(duì)收益的反應(yīng)是風(fēng)險(xiǎn)規(guī)避,面對(duì)損失的反應(yīng)是風(fēng)險(xiǎn)偏好,并且對(duì)損失的感知比對(duì)收益的感知更為敏感;決策者往往還會(huì)低估事件發(fā)生的風(fēng)險(xiǎn)。因此可在一定范圍內(nèi)變動(dòng)懲罰的大小,通過(guò)增加聲譽(yù)損失、提高準(zhǔn)入門(mén)檻等方式,增加企業(yè)對(duì)損失的風(fēng)險(xiǎn)價(jià)值感知,或者采取不定期和隨機(jī)抽查的方式,加大企業(yè)對(duì)懲罰的心理威懾作用,促進(jìn)企業(yè)的綠色行為。
(2)采取差異化的環(huán)境監(jiān)管政策
考慮到環(huán)境監(jiān)管政策對(duì)不同企業(yè)綠色行為決策的影響,政府應(yīng)根據(jù)不同性質(zhì)企業(yè)不同階段需求不同的特點(diǎn),選擇不同的監(jiān)管強(qiáng)度進(jìn)行監(jiān)管。對(duì)有違規(guī)生產(chǎn)、排放記錄的企業(yè),應(yīng)增加檢查頻率加大監(jiān)管力度,對(duì)采取綠色行為、聲譽(yù)良好的企業(yè),可降低監(jiān)管力度減少監(jiān)管成本。
(3)建立更為有效的激勵(lì)和監(jiān)督機(jī)制
有效的激勵(lì)機(jī)制和監(jiān)督機(jī)制可以正向促進(jìn)企業(yè)綠色行為??筛嗟募?lì)企業(yè)的綠色行為,能夠使得綠色行為在激勵(lì)中不斷地改革創(chuàng)新,同時(shí),其采用的科學(xué)技術(shù)也會(huì)越來(lái)越豐富,那些選擇綠色行為的企業(yè)也能夠更輕松地獲得更大的競(jìng)爭(zhēng)力,除了常規(guī)的稅收優(yōu)惠、環(huán)保補(bǔ)貼、財(cái)政支持等激勵(lì)措施,還應(yīng)當(dāng)創(chuàng)新激勵(lì)方式,采取一些增加企業(yè)聲譽(yù)、認(rèn)證等形式的激勵(lì),為企業(yè)提供可獲得長(zhǎng)期競(jìng)爭(zhēng)優(yōu)勢(shì)的愿景。政府的監(jiān)管不可能做到時(shí)刻有效,因此,可考慮多種監(jiān)管方式的協(xié)同,如引入第三方監(jiān)管,充分發(fā)揮環(huán)境非政府組織的監(jiān)管作用。
本文創(chuàng)新性地構(gòu)建了前景理論框架下的綠色行為決策演化博弈模型,更為真實(shí)地展現(xiàn)了博弈主體從感知到?jīng)Q策過(guò)程中的有限理性,運(yùn)用前景理論中的價(jià)值函數(shù)來(lái)表示決策主體的得失的心理感知,用決策權(quán)重函數(shù)來(lái)表示決策主體對(duì)各自不同策略選擇的概率的認(rèn)知,推導(dǎo)了促進(jìn)綠色行為發(fā)生的四個(gè)條件,探討博弈雙方具體何時(shí)做出“趨利”的選擇,何一時(shí)間點(diǎn)選擇“避害”的策略,并利用MATLAB 軟件仿真模擬了各個(gè)參數(shù)對(duì)演化結(jié)果的影響,所得結(jié)論更為貼近現(xiàn)實(shí)中綠色行為決策主體的行為。
安徽建筑大學(xué)學(xué)報(bào)2019年5期