許芳芳
(鄭州大學(xué) 商學(xué)院,河南 鄭州 450001)
糧食作為人們最基礎(chǔ)的物質(zhì)條件之一,在我國的國民經(jīng)濟中也發(fā)揮著巨大的作用,當(dāng)前,我國的食品工業(yè)在我國的經(jīng)濟發(fā)展中具有舉足輕重的地位.根據(jù)有關(guān)的數(shù)據(jù),在1993年,我國的食品工業(yè)總值是3500億元,但到了1998年前后,已經(jīng)增長到6000億元,每年的增長率都超過了10%.到2003年,更是突破了萬億大關(guān),達到了12000億元,而當(dāng)時的汽車工業(yè)產(chǎn)值也只有9000多億元.與此同時,我國的食品安全事故也時常發(fā)生,如劣質(zhì)奶粉、“蘇丹紅”辣椒、毛發(fā)醬油、石蠟火鍋底料、瘦肉精、毒大米、地溝油…“問題食品”之多、涉及范圍之廣、造成惡果之重.
因此,近年來食品安全問題引起了人們越來越多的關(guān)注.造成我國食品問題如此嚴重原因有很多,但從根本上看,主要是廠商本身在面對利益誘惑所做出的選擇和食品監(jiān)測部門對生產(chǎn)不合格食品的廠商處罰的力度.生產(chǎn)食品的廠商做出的選擇不同、食品監(jiān)測部門監(jiān)測的力度不同,其結(jié)果是不一樣的.所以本文用進化博弈的思想、復(fù)制動態(tài)與進化穩(wěn)定策略的方法對廠商之間以及廠商與監(jiān)測部門相互作用的策略選擇進行分析,從而得出重要的結(jié)論.
首先我們認為博弈的雙方即生產(chǎn)食品的廠商以及監(jiān)測部門都是有限理性的,即理性意識、分析推理能力、識別判斷能力、記憶能力和準確行為能力等多方面,博弈雙方至少有一個方面不能滿足完全理性的完美性要求.有限理性最大的特點就是在最開始進行選擇時,并不是直接選擇最優(yōu)的策略,而是在博弈的過程中不斷的摸索,探索出一個比較好的策略,均衡也不是一個靜止不動的,而是一個動態(tài)的,不斷的發(fā)生著偏離糾正的過程.
有限博弈分析的關(guān)鍵是確定博弈方學(xué)習(xí)和策略調(diào)整的模式.最基本的是最有反應(yīng)動態(tài)和復(fù)制動態(tài),前者針對有快速學(xué)習(xí)能力的小群體成員的反復(fù)博弈,后者主要針對學(xué)習(xí)速度很慢的成員組成的大群體隨機配對的反復(fù)博弈.由于本文所研究的群體比較大,面對多種策略需要一定的反應(yīng)時間,所以本文的有限博弈分析采用“復(fù)制動態(tài)”機制.為了分析廠商之間以及廠商和食品監(jiān)測部門之間的均衡穩(wěn)定狀況,及長期的變化趨勢,本文同時又用了“進化穩(wěn)定策略”的方法.
現(xiàn)假設(shè)有兩個對稱的廠商1和2,在生產(chǎn)食品時,如果雙方生產(chǎn)的產(chǎn)品都合格,各得a單位的收益;雙方生產(chǎn)的都不合格,各得b單位的收益;當(dāng)一方生產(chǎn)合格食品另一方生產(chǎn)不合格食品,生產(chǎn)合格食品者得c單位的收益,不合格者得d單位的收益.雙方的支付矩陣如圖1所示.
圖1
因為廠商的受益不僅取決于自己的選擇的策略,也取決于其他廠商所選取的策略,也就是說策略受益之間是存在聯(lián)系的.因此,在圖 1里,a、b、c、d四個值在一般情況是各不相同的,只有在特殊時刻它們才相等.加入廠商的理性層次較低,只博弈一次的話,產(chǎn)生的結(jié)果與a、b、c、d的值無關(guān),但是如果進行的是重復(fù)博弈或者說是多次博弈,結(jié)果就與這四個值有關(guān).現(xiàn)在假設(shè)有一個大群體的廠商,隨進的進行博弈,在這些廠商中,有x個廠商采取合格的生產(chǎn)策略,剩下的1-x廠商采取生產(chǎn)不合格食品策略,選擇生產(chǎn)合格食品的概率為x,則選擇后者概率為1-x,那么生產(chǎn)合格食品和不合格食品兩種類型的博弈雙方各自的期望得益Um和Un分別為:
x通常是時間t的函數(shù).當(dāng)廠商的學(xué)習(xí)速度比較慢時,采用生產(chǎn)合格食品策略的比例動態(tài)變化速度可以用下面的復(fù)制動態(tài)方程來表示:
令dx/dt=0,得上式可能的穩(wěn)定狀態(tài)為:
由于x3即,可知d且b或a且b(等號不能同時成立);令F(x)=dx/dt,根據(jù)微分方程的穩(wěn)定性定理及進化穩(wěn)定策略的性質(zhì),當(dāng)F’(x)<0時,x為進化穩(wěn)定策略(ESS).
1)若a>d且b>c,也就是說當(dāng)其中一方生產(chǎn)的是合格產(chǎn)品時,另外一方生產(chǎn)合格產(chǎn)品的收益多于生產(chǎn)不合格產(chǎn)品時所產(chǎn)生的收益.例如:食品檢測部門沒有履行自己的職責(zé),當(dāng)有其他的廠商生產(chǎn)的產(chǎn)品合格的時候,生產(chǎn)不合格產(chǎn)品的廠商就會得到懲罰,但是如果所有的廠商都生產(chǎn)不合格的食品的話,那么它們都不會受到懲罰.此時,F'(x1)<0,F'(x2)<0,F'(x3)>0,x1=0和x2=1都是演化穩(wěn)定策略.博弈的結(jié)果取決于x的初始水平.當(dāng)初始的x∈(0,x3)時,如果廠商是有限理性,且博弈是重復(fù)的話,結(jié)果就是選取不處理.當(dāng)初始的x∈(x3,1)時,廠商是有限理性,博弈是重復(fù)的話,結(jié)果就是選取處理.顯然,x3=(b-c)/(a-d+b-c)隨著 b-c的增加而增加,隨著a-d的增加而減少.特別的,當(dāng)b=c,a≠d時,x3=0,F'(x2)<0反復(fù)博弈的結(jié)果為廠商選擇生產(chǎn)合格食品的策略;當(dāng)b≠c,a=d時,x3=1,F'(x1)<0反復(fù)博弈的結(jié)果為廠商選擇生產(chǎn)合格食品的策略.
2)若a
廠商的可選擇策略依然是有兩個:合格的食品和不合格的食品.監(jiān)測部門也有兩種可供選擇的策略:對生產(chǎn)的食品進行監(jiān)測或不對生產(chǎn)的食品進行監(jiān)測.如果檢測部門選擇進行檢測的話,不僅要花費一定數(shù)量的人力、物力、財力,同時在檢測到食品不合格進行處罰時,也需要向上級匯報以及相關(guān)部門進行配合.也就是說,檢測部門在選取檢測策略時也是有一定的成本的,在一定情況下也是非常高的.當(dāng)然,我們可以進行一定的補償,例如極大對檢測部門的投入力度和獎勵的效果.在開始討論時,我們可以假設(shè)廠商生產(chǎn)合格的產(chǎn)品,檢測部門選擇不檢測這兩個策略結(jié)合的時候,雙方的受益都是零,食品監(jiān)測部門與食品生產(chǎn)廠商進行博弈時的支付矩陣如圖2所示.
圖2
其中,c1>0是監(jiān)測部門對廠商生產(chǎn)的食品進行監(jiān)測的成本,c2≥0是政府有關(guān)部門對監(jiān)測部門失職的懲罰.s>0是食品監(jiān)測部門對生產(chǎn)不合格食品的處罰,r≥0是政府有關(guān)部門對食品監(jiān)測部門的獎勵.廠商生產(chǎn)不合格食品的目的是為了謀取私利,因此有a1>0.由于不管監(jiān)測部門監(jiān)測與否,廠商生產(chǎn)食品是否合格,廠商都會得到一定的正常收益,在這里忽略考慮,記為0.由于如果檢測部門不進行檢測,而廠商生產(chǎn)的也是合格食品,那么監(jiān)測部門不會被懲罰也不會得到獎勵,所以,此時監(jiān)測部門收益為0.
對于有限理性層次較低的食品監(jiān)測部門和生產(chǎn)食品的廠商,如果假設(shè)選擇生產(chǎn)合格食品策略的廠商比例為x,在食品監(jiān)測部門的群體中采用監(jiān)測策略的比例為y,令U1m為廠商選擇生產(chǎn)合格食品策略的期望收益,U1n為廠商選擇生產(chǎn)不合格食品策略的預(yù)期收益,為所有廠商的平均收益,則:
那么,生產(chǎn)食品廠商的復(fù)制動態(tài)方程為:
令U2m為食品監(jiān)測部門選擇監(jiān)測策略的期望收益,U2n為食品監(jiān)測部門選擇不監(jiān)測策略的期望收益,為所有廠商的平均收益,則:
那么,食品監(jiān)測部門的復(fù)制動態(tài)方程為:
對于食品生產(chǎn)廠商:
1)若a1-s=0,a1>0,即監(jiān)測部門進行監(jiān)測時,廠商生產(chǎn)合格食品和生產(chǎn)不合格食品的收益相同,而在不監(jiān)測時,廠商生產(chǎn)不合格食品的收益大于生產(chǎn)合格食品的收益,所以,在此時,廠商都會選擇生產(chǎn)不合格食品謀取私利.
2)若a1-s>0,a1>0,即不管監(jiān)測部門是否進行監(jiān)測,廠商生產(chǎn)不合格食品的收益都大于生產(chǎn)合格食品的收益,那么廠商肯定會生產(chǎn)不合格食品獲取私利.這就對應(yīng)了在廠商生產(chǎn)了不合格食品,即使檢測出來被發(fā)現(xiàn),但由于懲罰力度過輕,罰款的錢抵不過牟來的私利,那么,場上一定還會繼續(xù)生產(chǎn)不合格食品,所以應(yīng)加大懲罰力度.
3)若a1-s<0,a1>0,即監(jiān)測部門進行檢測時,廠商生產(chǎn)合格食品的收益大于生產(chǎn)不合格食品的收益,而不檢測時,生產(chǎn)不合格食品的收益大于生產(chǎn)合格食品的收益.這就說明了監(jiān)測部門監(jiān)測的必要性,所以應(yīng)加大監(jiān)測強度.
4)如果y=a1/s,則F(x)始終為0,這意味著所有x都是穩(wěn)定狀態(tài).
5)如果y≠a1/s,則x1=0和x2=1是兩個穩(wěn)定狀態(tài),且當(dāng)y>a1/s時x2=1是演化穩(wěn)定策略,當(dāng)y 對于食品監(jiān)測部門: 1)當(dāng) r-c1≥-c2,-c1<0時,即廠商生產(chǎn)合格食品時,監(jiān)測部門進行監(jiān)測的收益小于不檢測的收益,所以此時監(jiān)測部門會傾向于不監(jiān)測;廠商生產(chǎn)不合格食品時,監(jiān)測部門進行監(jiān)測的收益大于不監(jiān)測的收益. 2)如果x<(r+c2-c1)/(c2+r),y1=0是演化穩(wěn)定策略,如果x>(r+c2-c1)/(c2+r),y2=1是演化穩(wěn)定策略.這就說明當(dāng)監(jiān)測成本過高,監(jiān)測部門趨向于選擇不監(jiān)測策略. 3)當(dāng)r-c1<-c2,-c1<0時,即廠商生產(chǎn)合格食品時,監(jiān)測部門進行監(jiān)測的收益小于不檢測的收益,所以此時監(jiān)測部門會傾向于不監(jiān)測;廠商生產(chǎn)不合格食品時,監(jiān)測部門不進行監(jiān)測的收益大于進行監(jiān)測的收益.即對任意的x∈[0,1]均有r-c1+c2-(r+c2)x<0,G'(y1)<0,G'(y2)>0,y2=0是演化穩(wěn)定策略.監(jiān)測部門最終傾向不監(jiān)測.C2越小,監(jiān)測部門越傾向不監(jiān)測,即政府對監(jiān)測部門失職懲罰太輕,可能會促使監(jiān)測部門的失職. 4)如果 x=(r+c2-c1)/(c2+r)(r+c2≥c1),則 G(y)始終為 0,這意味著所有y都是穩(wěn)定狀態(tài). 令x0=(r+c2-c1)/(c2+r)(r+c2≥c1),y0=a1/s,用以兩個比例為坐標的坐標平面圖來表示生產(chǎn)食品廠商和食品監(jiān)測部門兩群體類型比例變化復(fù)制動態(tài)關(guān)系,得到圖3~圖4. r+c2>c1時,由圖3可以看出兩方的博弈并沒有往前推進的策略,這也就是說雙方在選擇策略時是有一定的依賴性的. r+c2 圖3(r+c2>c1) 圖4(r+c2 通過上面的討論,我們可以得出食品安全問題嚴重的主要原因為:①廠商生產(chǎn)不合格食品的收益大于生產(chǎn)合格食品的收益;②對生產(chǎn)不合格食品的廠商處罰力度不夠;③相對于發(fā)現(xiàn)生產(chǎn)不合格食品的獎勵以及未發(fā)現(xiàn)生產(chǎn)不合格食品的處罰而言,食品監(jiān)測部門對廠商進行監(jiān)測的成本過高.④政府對監(jiān)測部門的失職懲罰力度過小.因此,要抑制廠商生產(chǎn)不合格食品的行為,減少食品安全問題,就要①對生產(chǎn)不合格食品的廠商和廠商主要領(lǐng)導(dǎo)進行嚴懲;②加大國家食品安全投資力度,特別是科技投入,提高監(jiān)測部門對生產(chǎn)食品廠商進行監(jiān)測的積極性和減少檢測成本;③加大政府對監(jiān)測部門的管理. 〔1〕朱希剛.我國糧食生產(chǎn)率增長分析[J].農(nóng)業(yè)經(jīng)濟問題,1999(7). 〔2〕李軍鵬,傅賢治.基于市場失靈的博弈模型分析[J].中國流通經(jīng)濟,2007(7):52-55. 〔3〕張公毅,董炳南,丁建勛.食品監(jiān)管安全中的合謀博弈分析[J].當(dāng)代經(jīng)濟,2008(11). 〔4〕茆翠紅,錢鋼.食品安全問題中的政府監(jiān)管部門和企業(yè)的演化博弈分析[J].工業(yè)技術(shù)經(jīng)濟,2009(05).5 結(jié)論