方錦清
在自然界和人類社會(huì)中廣泛存在合作與競(jìng)爭(zhēng),而能夠反映這種既激烈競(jìng)爭(zhēng)又需要合作的一門學(xué)科就是博弈論(Game Theory),也稱對(duì)策論。它是模擬和分析理性的個(gè)體在利益沖突環(huán)境下相互作用的形式、決策及其均衡理論,研究個(gè)體之間行為的相互影響和相互作用規(guī)律,它可以描述現(xiàn)實(shí)生活中參與者面對(duì)有限資源的合作與競(jìng)爭(zhēng)行為。令人驚奇的是,有三次諾貝爾獎(jiǎng)獲得者是博弈論研究方面的杰出科學(xué)家,他們是1985年獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的公共選擇學(xué)派的領(lǐng)導(dǎo)者布坎南,1994年獲獎(jiǎng)的美國(guó)普林斯頓大學(xué)的納什、塞爾屯、哈桑尼3位博弈論專家以及1995年獲獎(jiǎng)的理性主義學(xué)派的領(lǐng)袖盧卡斯。博弈論在經(jīng)濟(jì)學(xué)、政治學(xué)、管理學(xué)、社會(huì)學(xué)、軍事學(xué)、生物學(xué)等諸多學(xué)科領(lǐng)域具有廣泛的實(shí)際背景和應(yīng)用價(jià)值。進(jìn)入20世紀(jì)末,隨著復(fù)雜網(wǎng)絡(luò)科學(xué)的一些新的發(fā)現(xiàn),博弈論也成為網(wǎng)絡(luò)時(shí)代人們的一種思維、競(jìng)爭(zhēng)與合作的模式。
博弈論對(duì)人有一個(gè)最基本假定:人是理性的,人在具體策略選擇的目的全是使自己的利益最大化。博弈論就是研究理性的人之間如何進(jìn)行策略選擇的,因此博弈論也稱為對(duì)策論。博弈論就憑這么一條最簡(jiǎn)單的假定可以展開廣泛的研究,并獲得了豐富多彩的結(jié)果,利用博弈論可以解讀人類的社會(huì)行動(dòng)或集體行動(dòng),更易理解人類社會(huì)的復(fù)雜性和特殊性。為了刻畫個(gè)體間利益的沖突對(duì)整個(gè)系統(tǒng)的影響,人們已經(jīng)提出和發(fā)展了許多博弈模型,比較著名的有三個(gè)模型:囚徒困境、“雪堆”博弈和“少數(shù)者”博弈模型,下面筆者通過對(duì)這三個(gè)模型進(jìn)行簡(jiǎn)單而通俗的介紹,讓大家來了解博弈論及其應(yīng)用概況。
“囚徒困境”模型
囚徒困境作為一個(gè)經(jīng)典的博弈模型受到廣泛關(guān)注。這個(gè)博弈模型假設(shè)兩個(gè)小偷合伙作案時(shí)被捕,分別被關(guān)在不同的屋子里,如果雙方都拒絕承認(rèn)同伴的罪行,則由于證據(jù)不足兩人都會(huì)被輕判(收益為R);為此,警方設(shè)計(jì)了一個(gè)機(jī)制:如果一方出賣同伴,而另一方保持忠誠(chéng),則背叛者將無罪釋放(收益為T);堅(jiān)持忠誠(chéng)的一方將被重判(收益為S);如果雙方都背叛了對(duì)方,則雙方都會(huì)被判刑(收益為P)。這里假設(shè)上述收益參數(shù)滿足下面的條件:T>R>P>S。對(duì)每個(gè)參與者來說,如果對(duì)手堅(jiān)持忠誠(chéng),則他也選擇忠誠(chéng)得到的收益R小于他選擇背叛得到的收益T;如果對(duì)手選擇背叛,則他選擇忠誠(chéng)得到的收益S仍小于他選擇背叛得到的收益P。
可見,無論對(duì)手采取哪種策略,自己的最佳策略就是背叛,雙方都選擇背叛稱為囚徒困境的唯一“納什均衡”(納什因其提出的“非合作完全信息博弈的納什均衡”概念而榮獲了1994年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng));但是同時(shí)選擇背叛所取得的平均收益要低于兩個(gè)人同時(shí)保持忠誠(chéng)取得的平均收益。在這種情況下,理性參與者面臨著兩難的困境。
自然界中廣泛存在的合作現(xiàn)象——從單細(xì)胞生物的協(xié)同工作到人類的無私奉獻(xiàn)的行為說明,還有其他的動(dòng)力學(xué)機(jī)制激勵(lì)一般所認(rèn)為的自私的個(gè)體認(rèn)識(shí)到合作的重要性。為了揭示這種潛在的演化機(jī)制,有人提出了“針鋒相對(duì)”演化規(guī)則,采用“去輸存贏”策略,改進(jìn)囚徒困境中的兩難結(jié)局。
“營(yíng)堆”博弈模型
“雪堆”博弈又稱為“鷹鴿”博弈或者“小雞”博弈(chicken Game),是另一類兩人對(duì)稱博弈模型,描述了兩個(gè)人相遇時(shí)是彼此合作共同受益,還是彼此欺騙來相互報(bào)復(fù)。它揭示了個(gè)體理性和群體理性的矛盾對(duì)立??梢赃@樣來描述雪堆博弈:在一個(gè)風(fēng)雪交加的夜晚,兩人相向而來,被一個(gè)雪堆所阻,假設(shè)鏟除這個(gè)雪堆使道路通暢需要的代價(jià)為c,如果道路通暢則帶給每個(gè)人的好處量化為b。如果兩人一齊動(dòng)手鏟雪,則他們的收益為R=(b-c)/2;如果只有一人鏟雪,雖然兩個(gè)人都可以回家,但是背叛者逃避了勞動(dòng),它的收益為T=b,而合作者的收益為S=b-c;如果兩人都選擇不合作,兩人都被雪堆擋住而無法回家,他們的收益都為P=0。這里假設(shè)收益參數(shù)滿足下面的條件:T>R>S>P。雪堆模型與囚徒困境不同的是,遇到背叛者時(shí)合作者的收益高于雙方相互背叛的收益。因此,一個(gè)人的最佳策略取決于對(duì)手的策略:如果對(duì)手選擇合作,他的最佳策略是背叛;反過來,如果對(duì)手選擇背叛,那么他的最佳策略是合作。這樣合作在系統(tǒng)中不會(huì)消亡,而與囚徒困境相比,合作更容易在雪堆博弈中涌現(xiàn)。
“爭(zhēng)當(dāng)少數(shù)者”博弈模型
該模型由兩位數(shù)學(xué)家查勒特和張翼成于1997年提出,他們假設(shè)在一個(gè)系統(tǒng)中有多(奇數(shù))個(gè)參與者,在某一時(shí)刻各自獨(dú)立地在兩個(gè)策略中做出選擇,參與人數(shù)少的策略獲勝。該模型的核心思想是少數(shù)者獲勝,這是從實(shí)際中提煉出來的一個(gè)好模型,股票交易就是一個(gè)典型例子。需要指出,“少數(shù)者”博弈模型是對(duì)著名“酒吧問題”的一種抽象和簡(jiǎn)化。
“酒吧問題”研究的是一群生活在美國(guó)圣塔菲的人們?cè)谥芩耐砩鲜欠袢ピ摰貐^(qū)的一個(gè)著名酒吧的決策問題:每周四晚上這個(gè)酒吧都會(huì)有優(yōu)雅的愛爾蘭音樂演奏,然而如果去的人數(shù)過多,超過了酒吧所能容納的人數(shù),酒吧就會(huì)變得嘈雜擁擠,人們也無法悠閑地欣,賞音樂。因此人們需要根據(jù)過去的公共信息來對(duì)當(dāng)晚去酒吧的人數(shù)做預(yù)測(cè),以決定自己究竟是去酒吧還是留在家里。“酒吧問題”和“少數(shù)者”博弈模型都反映了社會(huì)經(jīng)濟(jì)活動(dòng)中眾多千差萬別的參與者對(duì)有限資源競(jìng)爭(zhēng)的基本特征,其思想是金融市場(chǎng)中的普遍原則——少數(shù)人獲勝。
爭(zhēng)當(dāng)少數(shù)者博弈模型原則上與前面兩個(gè)模型不同,雙方并非完全自私、完全理性且具有相當(dāng)完整信息,并按照嚴(yán)格的收益計(jì)算而決策,以便達(dá)到某種博弈的均衡。人們看到該模型中的雙方基本上是根據(jù)“成功的經(jīng)驗(yàn)”或“模仿成功者”進(jìn)行決策,并非理性,信息也非完整,因此它不存在爭(zhēng)當(dāng)少數(shù)者博弈模型的均衡,似乎可以說,非理性和非完整信息的博弈更為重要。確實(shí),現(xiàn)實(shí)生活中究竟有哪些面臨的抉擇是“完全理性”地根據(jù)完整信息嚴(yán)格計(jì)算而進(jìn)行決策的博弈?
在“少數(shù)者”博弈模型的基礎(chǔ)上,科學(xué)家還提出了“演化少數(shù)者博弈”(EMG)模型,將進(jìn)化論與少數(shù)者博弈結(jié)合在一起,發(fā)現(xiàn)通過學(xué)習(xí)過去的公共歷史信息,可以提高參與者的平均收益。在EMG模型中,對(duì)于某一輪博弈,參與者根據(jù)他記憶中保存的公共歷史信息來獨(dú)立地決策本輪自己是加入“1”組還是“0”組;當(dāng)所有人都做出選擇后,加入人數(shù)少的一組為獲勝者,加入人數(shù)多的一組為失敗者。人們通過對(duì)EMG模型的研究發(fā)現(xiàn)一個(gè)有趣的結(jié)論:一個(gè)相互間競(jìng)爭(zhēng)的人群最終總是趨向于分離成為具有兩種相反的極端行為的人群。這意味著為了在競(jìng)爭(zhēng)社會(huì)中生存,參與者的行為最終會(huì)走向極端:要么始終遵循基本策略,要么始終反其道而行之。
本文以囚徒困境、雪堆博弈和少數(shù)者博弈三個(gè)典型模型為例,簡(jiǎn)單介紹了近年來博弈論研究概況。在現(xiàn)實(shí)生活和許多領(lǐng)域中,博弈行為對(duì)網(wǎng)絡(luò)結(jié)構(gòu)演化的作用是令人關(guān)注的課題。隨著對(duì)演化博弈動(dòng)力學(xué)行為與復(fù)雜網(wǎng)絡(luò)之間關(guān)系深入研究,博弈必定會(huì)推動(dòng)復(fù)雜網(wǎng)絡(luò)的發(fā)展,乃至社會(huì)的進(jìn)步,其應(yīng)用前景十分美好。
責(zé)任編輯龐云