曹志
摘要:約翰·納什發(fā)表的兩篇關(guān)于博弈論的論文將博弈論引入快速發(fā)展階段。在這之后,博弈論成為經(jīng)濟、社會等各個領(lǐng)域廣泛使用的工具。然而在研究中發(fā)現(xiàn),博弈論的使用集中在經(jīng)濟學(xué)研究中,而在社會學(xué)領(lǐng)域比較少。同時,大量的博弈模型雖然揭示了個人理性與集體理性的沖突,但其在指導(dǎo)策略選擇時依然是以利己為出發(fā)點,即使是共贏的觀點也如此。然而現(xiàn)實生活中有很多博弈的情況不是以自身對物質(zhì)的占有為最終目的,恰恰相反,決策者希望對方可以占有更多。
關(guān)鍵詞:博弈論;模型
博弈論也翻譯為對策論,是一門研究理性決策者在合作與沖突之中做出決策選擇的理論。博弈論最早正式提出于1944年,以馮·諾依曼和摩根斯坦恩合作出版的《博弈論與經(jīng)濟行為》一書為標(biāo)志。事實上,博弈論的思想早在幾千年前的中國就已經(jīng)形成,田忌賽馬就是很好的例子。博弈論剛提出之時,由于其過于抽象,理論性不強,并且需要較高的數(shù)學(xué)功底,僅被少數(shù)的數(shù)學(xué)家和經(jīng)濟學(xué)家所接受。真正使博弈論進入實用領(lǐng)域的是約翰·納什的研究成果。20世紀(jì)50年代初,約翰·納什名為《N人博弈的均衡點》與《非合作博弈》的兩篇文章將博弈論引入經(jīng)濟學(xué)研究之中。約翰·納什的文章提出了“納什均衡”,圖克定義了“囚徒困境”,澤爾騰將動態(tài)分析的觀點引入博弈論,三人在博弈論的形成與演化所做的貢獻共同榮獲了1994年諾貝爾經(jīng)濟學(xué)獎。
簡單地說,博弈論研究的是理性的決策主體在已知信息的前提下如何決策以使自身效用最大化。該闡述說明了博弈論構(gòu)成的三個基本要素:一是決策主體,即決策的參與人,決策結(jié)果的利益相關(guān)者;二是給定的信息結(jié)構(gòu),這里的信息結(jié)構(gòu)實際上就是決策主體可以選擇的策略,所以也叫策略集;三是效用,是可以定義或量化的決策者的利益,也叫偏好或支付。以上三個要素構(gòu)成了一個基本的博弈。事實上一個完整的博弈除了這三個基本要素外還包含另外一個要素,博弈的次序,即博弈的參加者做出決策的先后順序。博弈參加者同時做出一次性決策的博弈稱為靜態(tài)博弈,參加者先后做出決策行動的博弈稱為動態(tài)博弈?;谝陨衔鍌€方面,博弈論模型可以用G={P,A,S,I,U}來描述。
其中,P為博弈的參與者,參與者是理性的個人、組織或團體,能夠獨立做出決策,并以滿足自身效用最大化為目標(biāo)。A為博弈參與者所有可能選擇的策略的集合。根據(jù)該集合是有限集還是無限集將博弈分為有限博弈和無限博弈。S即上述博弈參與者做出決策的先后順序,將博弈分為靜態(tài)博弈和動態(tài)博弈。I為博弈信息,是參與博弈所有人的信息,博弈信息對博弈結(jié)果有著重要的影響。在靜態(tài)博弈中,根據(jù)參與者是否了解其他參與者的得益狀況分為完全信息博弈和非完全信息博弈。在動態(tài)博弈中,因為決策分先后,根據(jù)參與者是否了解對方在此之前的決策分為“完美信息的動態(tài)博弈”和“不完美信息的動態(tài)博弈”。U為參與者的利益,根據(jù)博弈方利益是否完全對立分為零和博弈和非零和博弈。這兩者的主要區(qū)別在于是否能夠在決策過程中達成一個穩(wěn)定的協(xié)議。事實上,零和博弈希望達到所有參與者利益的最大化,是從集體理性思考問題并做出決策。而非零和博弈在策略選擇的問題上,希望將自身利益最大化,強調(diào)的是個人理性。博弈論在引入經(jīng)濟學(xué)之后,根據(jù)理性經(jīng)濟人假設(shè),非零和博弈是目前博弈論研究的重點。
前人研究的重點即非零和博弈是以理性經(jīng)濟人假設(shè)去設(shè)計博弈模型,最終得出了納什均衡與囚徒困境。囚徒困境揭示了個人理性與集體理性之間沖突的哲學(xué)問題。不管是零和博弈還是非零和博弈,其根本追求的都是自身效用的最大,盡管零和博弈采用共贏思想,也不例外。但是不可否認博弈論推動了人類思維模式向前發(fā)展。在有共贏的可能性的情況下,我們都不應(yīng)該破壞規(guī)則導(dǎo)致降低各自的效用。在納什等人將博弈論引入經(jīng)濟學(xué)研究中之后,理論界研究的重點放在了經(jīng)濟學(xué)領(lǐng)域,而在社會生活領(lǐng)域?qū)τ诓┺恼摰难芯亢蛻?yīng)用較少。在博弈論的定義中,以自身效用最大化為目標(biāo)是博弈論對決策者最基本的定義和要求。這種效用大多是通過對金錢、權(quán)利等對物質(zhì)的占有多少來衡量。然而,在社會生活中,參與者效用可能并非這些,而且有可能恰恰相反——參與者的效用也有可能是使博弈方的效用最大,即參與者效用(精神層面的效用)的實現(xiàn)以博弈方效用(物質(zhì)層面的效用)最大為前提。筆者發(fā)現(xiàn)在日常生活中存在著將他人利益最大化的博弈情景。
當(dāng)兒子與母親吃飯時,母親會將最好的省給兒子吃。比如說有條魚,母親會將魚肉省給兒子吃,而自己選擇不吃。雖然她自己沒有吃到魚肉,但是她內(nèi)心卻獲得了滿足感。與此同時,懂事的兒子也希望將魚肉給母親吃,同樣的,即使自己沒有吃到他也會獲得滿足感。在此,母親和兒子就是博弈的參與者,即為P,母親用Pm表示,兒子用Ps表示。作為博弈參與者,母親與兒子可供選擇的策略各有兩個,母親可以選擇吃和不吃,兒子也同樣選擇吃和不吃。母親選擇吃的策略用Am1表示,選擇不吃的策略用Am2表示。兒子選擇吃的策略用As1表示,選擇不吃的策略用As2表示。母親的策略集合為{Am1,Am2},兒子的策略集合為{As1,As2}。與此同時用Um11和Us11分別表示母親選擇Am1和兒子選擇As1時母親所產(chǎn)生的效用和兒子所產(chǎn)生的效用。用Um12和Us12分別表示母親選擇Am1和兒子選擇As2時母親所產(chǎn)生的效用和兒子所產(chǎn)生的效用,用Um21和Us21分別表示母親選擇Am2同時兒子選擇As1時母親和兒子所產(chǎn)生的效用,用Um22和Us22表示母親選擇Am2同時兒子選擇As2時母親和兒子所產(chǎn)生的效用。
關(guān)于母親與兒子的效用問題,值得注意的是,此處不同于在經(jīng)濟行為中以占有物質(zhì)的多少來衡量,而是以自身的滿足感來衡量。這就與經(jīng)濟學(xué)中的效用相反,不吃魚導(dǎo)致高效用,吃魚導(dǎo)致低效用。下面分析在母親與兒子選擇策略時,雙方所產(chǎn)生效用的數(shù)量關(guān)系。
對于母親來說,當(dāng)母親與兒子同時選擇吃的策略時,母親產(chǎn)生的效用水平高于當(dāng)母親選擇吃而兒子選擇不吃所產(chǎn)生的效用水平。這樣避免了魚都被母親自己一個人吃掉,故Um11>Um12。同樣對于兒子來說,Us11>Us21。
但是對于母親來說,如果兒子選擇吃的策略,那么母親選擇不吃的策略將會比選擇吃的策略產(chǎn)生更高的效用水平,因為這樣可以讓兒子吃更多的魚,故Um11 假設(shè)1:母親與兒子在情感上相同的。母親所做出的不同策略選擇所產(chǎn)生的效用與兒子所做出的不同策略選擇所產(chǎn)生的效用在數(shù)量上是相同的。根據(jù)這個假設(shè),可以得出Um11=Us11,Um12=Us21,Um21=Us12。 假設(shè)2:母親與兒子都選擇不吃的策略時產(chǎn)生的效用為0,即Um22=Us22=0。 假設(shè)3:吃魚的數(shù)量所產(chǎn)生的效用是線性的,即吃的越多產(chǎn)生的效用越多。聯(lián)系假設(shè)1,可以得出Um11=Um12+Um21。 母親與兒子之間吃魚博弈的效用如圖1所示。 假設(shè)吃的概率是X,則不吃的概率是(1-X)。 對于母親,所產(chǎn)生的效用為 Um=[Um11X+Um21(1-X)]X+[Um12X+Um22(1-X)](1-X) 為了便于分析,令Um11=Us11=a;Um21=Us12=b;Us21=Um12=c。 又因為Um22與Us22表示母親與兒子都選擇不吃的效用,故此時效應(yīng)為0。 則上述等式可寫為 Um=[aX+b(1-X)]X+[cX+0(1-X)](1-X) 變型得 Um=(a-b-c)X2+(b+c)X 當(dāng)X=(b+c)/2(b+c-a)時有最大值。 因為魚是有限的,所產(chǎn)生的效用是線性的,并且已經(jīng)假設(shè)母親與兒子相同,則b+c=2a,此時得到X=1。 所以,當(dāng)X=1時,Um取得最大值,即母親選擇吃的策略時,其效用最大。同理可得,兒子也選擇吃的時候,其效用最大。 在計算結(jié)果出來之前,筆者認為結(jié)果應(yīng)該像生活中的一樣,盡量不吃,盡量讓對方吃,認為這才是對對方好所應(yīng)該做的,才會讓自己產(chǎn)生最大的滿足感,但是結(jié)果出乎意料。在思考生活中此類問題的時候,我們都希望自己少吃一點魚,希望對方多吃一點。這就是對于對方的愛,而當(dāng)這種情況實現(xiàn)的時候,我們會產(chǎn)生滿足感,也就是模型中的效用。然而通過模型的分析計算卻發(fā)現(xiàn),我們希望對方吃而自己不吃恰恰又不能使大家的效用最大化。而當(dāng)決策者各自按照對方希望的那樣做出選擇,才能使得所有人都滿意。 這個模型解決了之前在情景介紹中出現(xiàn)的問題。筆者認為,該結(jié)論存在普遍性。因為對于模型中的各個效用并沒有給出特定數(shù)字,而是根據(jù)邏輯分析給出了其數(shù)量關(guān)系。對于類似的,兩個博弈方的目的不是最大化自己的利益而是為了對方獲得最大收益的博弈類型,該模型給出了最優(yōu)解答,即雙方都選擇對自己有利的方案,增加自身的利益,或者說,按照對方希望自己做的那樣去做就是對對方最大的幫助,使自己和對方都能獲得最大的滿足感。 參考文獻: [1]張維迎.博弈論和信息經(jīng)濟學(xué)[M].上海:三聯(lián)書社,1996. [2]謝識予.經(jīng)濟博弈論[M].復(fù)旦大學(xué)出版社,2001. [3]蔣殿春.博弈論如何改寫了微觀經(jīng)濟學(xué)[J].經(jīng)濟學(xué)家,1997(06). (作者單位:揚州大學(xué))