食品安全的進化博弈分析

2015-04-11 10:30:14許芳芳

赤峰學(xué)院學(xué)報·自然科學(xué)版 2015年22期

許芳芳

（鄭州大學(xué) 商學(xué)院，河南鄭州 450001）

1 引言

糧食作為人們最基礎(chǔ)的物質(zhì)條件之一，在我國的國民經(jīng)濟中也發(fā)揮著巨大的作用，當(dāng)前，我國的食品工業(yè)在我國的經(jīng)濟發(fā)展中具有舉足輕重的地位.根據(jù)有關(guān)的數(shù)據(jù)，在1993年，我國的食品工業(yè)總值是3500億元，但到了1998年前后，已經(jīng)增長到6000億元，每年的增長率都超過了10%.到2003年，更是突破了萬億大關(guān)，達到了12000億元，而當(dāng)時的汽車工業(yè)產(chǎn)值也只有9000多億元.與此同時，我國的食品安全事故也時常發(fā)生，如劣質(zhì)奶粉、“蘇丹紅”辣椒、毛發(fā)醬油、石蠟火鍋底料、瘦肉精、毒大米、地溝油…“問題食品”之多、涉及范圍之廣、造成惡果之重.

因此，近年來食品安全問題引起了人們越來越多的關(guān)注.造成我國食品問題如此嚴重原因有很多，但從根本上看，主要是廠商本身在面對利益誘惑所做出的選擇和食品監(jiān)測部門對生產(chǎn)不合格食品的廠商處罰的力度.生產(chǎn)食品的廠商做出的選擇不同、食品監(jiān)測部門監(jiān)測的力度不同，其結(jié)果是不一樣的.所以本文用進化博弈的思想、復(fù)制動態(tài)與進化穩(wěn)定策略的方法對廠商之間以及廠商與監(jiān)測部門相互作用的策略選擇進行分析，從而得出重要的結(jié)論.

2 理論基礎(chǔ)

首先我們認為博弈的雙方即生產(chǎn)食品的廠商以及監(jiān)測部門都是有限理性的，即理性意識、分析推理能力、識別判斷能力、記憶能力和準確行為能力等多方面，博弈雙方至少有一個方面不能滿足完全理性的完美性要求.有限理性最大的特點就是在最開始進行選擇時，并不是直接選擇最優(yōu)的策略，而是在博弈的過程中不斷的摸索，探索出一個比較好的策略，均衡也不是一個靜止不動的，而是一個動態(tài)的，不斷的發(fā)生著偏離糾正的過程.

有限博弈分析的關(guān)鍵是確定博弈方學(xué)習(xí)和策略調(diào)整的模式.最基本的是最有反應(yīng)動態(tài)和復(fù)制動態(tài)，前者針對有快速學(xué)習(xí)能力的小群體成員的反復(fù)博弈，后者主要針對學(xué)習(xí)速度很慢的成員組成的大群體隨機配對的反復(fù)博弈.由于本文所研究的群體比較大，面對多種策略需要一定的反應(yīng)時間，所以本文的有限博弈分析采用“復(fù)制動態(tài)”機制.為了分析廠商之間以及廠商和食品監(jiān)測部門之間的均衡穩(wěn)定狀況，及長期的變化趨勢，本文同時又用了“進化穩(wěn)定策略”的方法.

3 生產(chǎn)食品的廠商之間的復(fù)制動態(tài)和進化為定策略分析

現(xiàn)假設(shè)有兩個對稱的廠商1和2,在生產(chǎn)食品時,如果雙方生產(chǎn)的產(chǎn)品都合格,各得a單位的收益;雙方生產(chǎn)的都不合格,各得b單位的收益;當(dāng)一方生產(chǎn)合格食品另一方生產(chǎn)不合格食品,生產(chǎn)合格食品者得c單位的收益,不合格者得d單位的收益.雙方的支付矩陣如圖1所示.

圖1

因為廠商的受益不僅取決于自己的選擇的策略，也取決于其他廠商所選取的策略，也就是說策略受益之間是存在聯(lián)系的.因此，在圖 1里，a、b、c、d四個值在一般情況是各不相同的，只有在特殊時刻它們才相等.加入廠商的理性層次較低，只博弈一次的話，產(chǎn)生的結(jié)果與a、b、c、d的值無關(guān)，但是如果進行的是重復(fù)博弈或者說是多次博弈，結(jié)果就與這四個值有關(guān).現(xiàn)在假設(shè)有一個大群體的廠商，隨進的進行博弈，在這些廠商中，有x個廠商采取合格的生產(chǎn)策略，剩下的1-x廠商采取生產(chǎn)不合格食品策略,選擇生產(chǎn)合格食品的概率為x,則選擇后者概率為1-x，那么生產(chǎn)合格食品和不合格食品兩種類型的博弈雙方各自的期望得益Um和Un分別為：

x通常是時間t的函數(shù).當(dāng)廠商的學(xué)習(xí)速度比較慢時,采用生產(chǎn)合格食品策略的比例動態(tài)變化速度可以用下面的復(fù)制動態(tài)方程來表示：

令dx/dt=0,得上式可能的穩(wěn)定狀態(tài)為：

由于x3即，可知d且b或a且b(等號不能同時成立);令F(x)=dx/dt,根據(jù)微分方程的穩(wěn)定性定理及進化穩(wěn)定策略的性質(zhì),當(dāng)F’(x)<0時,x為進化穩(wěn)定策略(ESS).

1)若a>d且b>c,也就是說當(dāng)其中一方生產(chǎn)的是合格產(chǎn)品時，另外一方生產(chǎn)合格產(chǎn)品的收益多于生產(chǎn)不合格產(chǎn)品時所產(chǎn)生的收益.例如：食品檢測部門沒有履行自己的職責(zé)，當(dāng)有其他的廠商生產(chǎn)的產(chǎn)品合格的時候，生產(chǎn)不合格產(chǎn)品的廠商就會得到懲罰，但是如果所有的廠商都生產(chǎn)不合格的食品的話，那么它們都不會受到懲罰.此時,F'(x1)<0,F'(x2)<0,F'(x3)>0,x1=0和x2=1都是演化穩(wěn)定策略.博弈的結(jié)果取決于x的初始水平.當(dāng)初始的x∈(0,x3)時,如果廠商是有限理性，且博弈是重復(fù)的話，結(jié)果就是選取不處理.當(dāng)初始的x∈(x3,1)時,廠商是有限理性，博弈是重復(fù)的話，結(jié)果就是選取處理.顯然,x3=（b-c）/(a-d+b-c)隨著 b-c的增加而增加,隨著a-d的增加而減少.特別的，當(dāng)b=c,a≠d時,x3=0,F'(x2)<0反復(fù)博弈的結(jié)果為廠商選擇生產(chǎn)合格食品的策略;當(dāng)b≠c,a=d時,x3=1,F'(x1)<0反復(fù)博弈的結(jié)果為廠商選擇生產(chǎn)合格食品的策略.

2)若a0,F'(x2)>0,F'(x3)<0,x3=（b-c）/(a-d+b-c)是唯一演化穩(wěn)定策略.博弈結(jié)果為:在有限理性的食品生產(chǎn)廠商的大群體中,經(jīng)過長期反復(fù)博弈,有（b-c）/(a-d+b-c)比例的廠商趨向生產(chǎn)合格的食品,（a-d）/(a-d+b-c)比例的廠商趨向生產(chǎn)不合格的食品.顯然,b-c越大趨向于采用生產(chǎn)合格的食品策略的廠商的比例就越大,而a-d越大趨向于采用生產(chǎn)合格的食品策略的廠商的比例就越小.

4 生產(chǎn)食品的廠商與食品監(jiān)測部門之間的復(fù)制動態(tài)和進化為定策略分析

廠商的可選擇策略依然是有兩個：合格的食品和不合格的食品.監(jiān)測部門也有兩種可供選擇的策略:對生產(chǎn)的食品進行監(jiān)測或不對生產(chǎn)的食品進行監(jiān)測.如果檢測部門選擇進行檢測的話，不僅要花費一定數(shù)量的人力、物力、財力，同時在檢測到食品不合格進行處罰時，也需要向上級匯報以及相關(guān)部門進行配合.也就是說，檢測部門在選取檢測策略時也是有一定的成本的，在一定情況下也是非常高的.當(dāng)然，我們可以進行一定的補償，例如極大對檢測部門的投入力度和獎勵的效果.在開始討論時，我們可以假設(shè)廠商生產(chǎn)合格的產(chǎn)品，檢測部門選擇不檢測這兩個策略結(jié)合的時候，雙方的受益都是零，食品監(jiān)測部門與食品生產(chǎn)廠商進行博弈時的支付矩陣如圖2所示.

圖2

其中,c1>0是監(jiān)測部門對廠商生產(chǎn)的食品進行監(jiān)測的成本,c2≥0是政府有關(guān)部門對監(jiān)測部門失職的懲罰.s>0是食品監(jiān)測部門對生產(chǎn)不合格食品的處罰,r≥0是政府有關(guān)部門對食品監(jiān)測部門的獎勵.廠商生產(chǎn)不合格食品的目的是為了謀取私利,因此有a1>0.由于不管監(jiān)測部門監(jiān)測與否，廠商生產(chǎn)食品是否合格，廠商都會得到一定的正常收益，在這里忽略考慮，記為0.由于如果檢測部門不進行檢測，而廠商生產(chǎn)的也是合格食品，那么監(jiān)測部門不會被懲罰也不會得到獎勵，所以，此時監(jiān)測部門收益為0.

對于有限理性層次較低的食品監(jiān)測部門和生產(chǎn)食品的廠商,如果假設(shè)選擇生產(chǎn)合格食品策略的廠商比例為x,在食品監(jiān)測部門的群體中采用監(jiān)測策略的比例為y,令U1m為廠商選擇生產(chǎn)合格食品策略的期望收益，U1n為廠商選擇生產(chǎn)不合格食品策略的預(yù)期收益，為所有廠商的平均收益，則：

那么，生產(chǎn)食品廠商的復(fù)制動態(tài)方程為：

令U2m為食品監(jiān)測部門選擇監(jiān)測策略的期望收益，U2n為食品監(jiān)測部門選擇不監(jiān)測策略的期望收益，為所有廠商的平均收益，則：

那么，食品監(jiān)測部門的復(fù)制動態(tài)方程為：

對于食品生產(chǎn)廠商：

1）若a1-s=0，a1>0,即監(jiān)測部門進行監(jiān)測時，廠商生產(chǎn)合格食品和生產(chǎn)不合格食品的收益相同,而在不監(jiān)測時，廠商生產(chǎn)不合格食品的收益大于生產(chǎn)合格食品的收益，所以，在此時，廠商都會選擇生產(chǎn)不合格食品謀取私利.

2）若a1-s>0,a1>0,即不管監(jiān)測部門是否進行監(jiān)測，廠商生產(chǎn)不合格食品的收益都大于生產(chǎn)合格食品的收益，那么廠商肯定會生產(chǎn)不合格食品獲取私利.這就對應(yīng)了在廠商生產(chǎn)了不合格食品，即使檢測出來被發(fā)現(xiàn)，但由于懲罰力度過輕，罰款的錢抵不過牟來的私利，那么，場上一定還會繼續(xù)生產(chǎn)不合格食品，所以應(yīng)加大懲罰力度.

3）若a1-s<0,a1>0,即監(jiān)測部門進行檢測時，廠商生產(chǎn)合格食品的收益大于生產(chǎn)不合格食品的收益，而不檢測時，生產(chǎn)不合格食品的收益大于生產(chǎn)合格食品的收益.這就說明了監(jiān)測部門監(jiān)測的必要性，所以應(yīng)加大監(jiān)測強度.

4）如果y=a1/s,則F(x)始終為0,這意味著所有x都是穩(wěn)定狀態(tài).

5）如果y≠a1/s,則x1=0和x2=1是兩個穩(wěn)定狀態(tài),且當(dāng)y>a1/s時x2=1是演化穩(wěn)定策略,當(dāng)y

對于食品監(jiān)測部門：

1）當(dāng) r-c1≥-c2，-c1<0時,即廠商生產(chǎn)合格食品時，監(jiān)測部門進行監(jiān)測的收益小于不檢測的收益，所以此時監(jiān)測部門會傾向于不監(jiān)測；廠商生產(chǎn)不合格食品時，監(jiān)測部門進行監(jiān)測的收益大于不監(jiān)測的收益.

2）如果x<(r+c2-c1)/(c2+r),y1=0是演化穩(wěn)定策略,如果x>(r+c2-c1)/(c2+r),y2=1是演化穩(wěn)定策略.這就說明當(dāng)監(jiān)測成本過高,監(jiān)測部門趨向于選擇不監(jiān)測策略.

3）當(dāng)r-c1<-c2,-c1<0時，即廠商生產(chǎn)合格食品時，監(jiān)測部門進行監(jiān)測的收益小于不檢測的收益，所以此時監(jiān)測部門會傾向于不監(jiān)測；廠商生產(chǎn)不合格食品時，監(jiān)測部門不進行監(jiān)測的收益大于進行監(jiān)測的收益.即對任意的x∈[0,1]均有r-c1+c2-(r+c2)x<0,G'(y1)<0,G'(y2)>0,y2=0是演化穩(wěn)定策略.監(jiān)測部門最終傾向不監(jiān)測.C2越小，監(jiān)測部門越傾向不監(jiān)測，即政府對監(jiān)測部門失職懲罰太輕，可能會促使監(jiān)測部門的失職.

4）如果 x=(r+c2-c1)/(c2+r)(r+c2≥c1),則 G(y)始終為 0,這意味著所有y都是穩(wěn)定狀態(tài).

令x0=(r+c2-c1)/(c2+r)(r+c2≥c1),y0=a1/s,用以兩個比例為坐標的坐標平面圖來表示生產(chǎn)食品廠商和食品監(jiān)測部門兩群體類型比例變化復(fù)制動態(tài)關(guān)系,得到圖3～圖4.

r+c2>c1時，由圖3可以看出兩方的博弈并沒有往前推進的策略，這也就是說雙方在選擇策略時是有一定的依賴性的.

r+c2

圖3(r+c2>c1)

圖4（r+c2

5 結(jié)論

通過上面的討論，我們可以得出食品安全問題嚴重的主要原因為:①廠商生產(chǎn)不合格食品的收益大于生產(chǎn)合格食品的收益;②對生產(chǎn)不合格食品的廠商處罰力度不夠；③相對于發(fā)現(xiàn)生產(chǎn)不合格食品的獎勵以及未發(fā)現(xiàn)生產(chǎn)不合格食品的處罰而言,食品監(jiān)測部門對廠商進行監(jiān)測的成本過高.④政府對監(jiān)測部門的失職懲罰力度過小.因此,要抑制廠商生產(chǎn)不合格食品的行為,減少食品安全問題,就要①對生產(chǎn)不合格食品的廠商和廠商主要領(lǐng)導(dǎo)進行嚴懲；②加大國家食品安全投資力度,特別是科技投入,提高監(jiān)測部門對生產(chǎn)食品廠商進行監(jiān)測的積極性和減少檢測成本;③加大政府對監(jiān)測部門的管理.

〔1〕朱希剛.我國糧食生產(chǎn)率增長分析[J].農(nóng)業(yè)經(jīng)濟問題，1999（7）.

〔2〕李軍鵬，傅賢治.基于市場失靈的博弈模型分析[J].中國流通經(jīng)濟，2007（7）：52-55.

〔3〕張公毅，董炳南，丁建勛.食品監(jiān)管安全中的合謀博弈分析[J].當(dāng)代經(jīng)濟，2008（11）.

〔4〕茆翠紅，錢鋼.食品安全問題中的政府監(jiān)管部門和企業(yè)的演化博弈分析[J].工業(yè)技術(shù)經(jīng)濟，2009（05）.