陳建先
博弈價(jià)值取向涉及許多方面,而最為重要的應(yīng)該考慮兩個(gè):一是風(fēng)險(xiǎn)收益,二是理性判斷。以下從“交換實(shí)驗(yàn)”和“誠實(shí)實(shí)驗(yàn)”來分析人們的博弈思考。
一、交換選擇實(shí)驗(yàn)的風(fēng)險(xiǎn)收益分析
筆者曾經(jīng)在教學(xué)中多次與學(xué)生做“交換信封”實(shí)驗(yàn)。實(shí)驗(yàn)分兩次做,第一次讓他們(兩個(gè)學(xué)生)把自己的錢包拿出來給我。我在他倆的錢包里分別抽取一部分錢(50元或100元),即學(xué)生甲的錢是學(xué)生乙的錢的一倍。然后告訴他倆,一個(gè)人的錢是另一個(gè)人的錢的兩倍(但不知道誰是誰的兩倍),試問:你們是否愿意交換錢包?做完第一次后,緊接著做第二次:我給兩個(gè)學(xué)生各自一個(gè)信封,這兩個(gè)信封放著不同數(shù)額的錢(50元或100元),并且告訴他倆,一個(gè)信封的錢是另一個(gè)信封的錢的兩倍(但不知道誰是誰的兩倍),試問:你倆是否愿意交換錢包?你認(rèn)為,學(xué)生是愿意交換或是不愿意交換,為什么?
從表面上看,第一次情況與第二次情況是一樣的,但細(xì)致思考,會(huì)發(fā)現(xiàn)二者是不一樣的。因?yàn)?,前者收益與風(fēng)險(xiǎn)并存,后者只是收益的大小。在信息不完全時(shí),人們不是謀求自己的支付最大化,而是盡量使自己的風(fēng)險(xiǎn)最小化,即當(dāng)會(huì)損失自己的利益時(shí),人們會(huì)選擇規(guī)避風(fēng)險(xiǎn)的策略;當(dāng)不會(huì)損失自己的利益時(shí),人們會(huì)選擇承擔(dān)風(fēng)險(xiǎn)的策略。在完全信息狀況下,人們追求收益的最大化;在不完全信息狀況下,人們注意其風(fēng)險(xiǎn)性。從一般理性進(jìn)行分析,其所確立的觀點(diǎn)在理論上是合理的,但在現(xiàn)實(shí)中卻是相悖的;從博弈理性進(jìn)行分析,其所確立的觀點(diǎn),在理論與現(xiàn)實(shí)中是吻合的。
第一,風(fēng)險(xiǎn)與收益。只要是博弈,都存在著“收益”或“風(fēng)險(xiǎn)”。在現(xiàn)實(shí)社會(huì)里,其實(shí)人們總是在預(yù)期的收益和風(fēng)險(xiǎn)中不斷地進(jìn)行選擇,是收益大于風(fēng)險(xiǎn)或是風(fēng)險(xiǎn)大于收益。這其中與人們的價(jià)值取向、對收益與風(fēng)險(xiǎn)的理解,以及社會(huì)風(fēng)險(xiǎn)機(jī)制的設(shè)置有關(guān)。行為科學(xué)研究表明,對未來預(yù)期是影響人行為的重要因素:一種預(yù)期收益,即這樣做將會(huì)有什么好處;一種預(yù)期風(fēng)險(xiǎn),即這樣做將會(huì)面臨什么問題。對未來沒有明確的預(yù)期,是引發(fā)機(jī)會(huì)主義的關(guān)鍵要素。而只有在穩(wěn)定性機(jī)制作用下的未來,才會(huì)有較為明確的未來,才會(huì)有相對確定的預(yù)期。而人們在利益博弈過程中,更多看到的是“收益”,而不是“風(fēng)險(xiǎn)”,更沒有將“風(fēng)險(xiǎn)”與“收益”進(jìn)行一些測算。在第一次交換的情況下,倆人唯一的信息就是自己手中的錢(數(shù)額)。從一般思考(用概率來思考),學(xué)生甲肯定知道自己錢包里的錢是多少,但不知道學(xué)生乙的錢是多少。那么,怎么來判斷?學(xué)生甲會(huì)這樣來設(shè)想:對方要么是自己的兩倍(如果自己愿意交換,會(huì)贏得一倍的收益),要么是自己的一半(自己會(huì)輸?shù)粢话氲腻X)。假設(shè)學(xué)生甲的錢是100元,學(xué)生乙的錢是200元。學(xué)生甲愿意進(jìn)行交換,將會(huì)有100元的預(yù)期收益;假設(shè)學(xué)生甲的錢是100元,學(xué)生乙的錢是50元,將會(huì)有50元的預(yù)期損失。即預(yù)期收益(100元)-預(yù)期損失(50元)=50元,即預(yù)期收益大于預(yù)期損失(50元)。通過以上分析,學(xué)生甲進(jìn)行交換是劃算的,所以他愿意進(jìn)行交換。同理,學(xué)生乙也愿意進(jìn)行交換。但是,從博弈思考(用倒推來思考),其結(jié)果就不一樣了。倆人是否愿意交換有一個(gè)基本思路:對方錢的數(shù)額小,就愿意“交換”,對方錢的數(shù)額大,就不愿意“交換”。如果雙方都愿意交換:一是基于自己錢的數(shù)額很小;二是基于認(rèn)為對方錢的數(shù)額比自己大;三是基于他的對方愿意交換。假如學(xué)生甲有800元,他會(huì)假設(shè)對方一般情況下不會(huì)有1600元(因?yàn)楫吘故菍W(xué)生),最多只有400元,因此選擇“拒絕”交換;假設(shè)學(xué)生甲只有200元,而對方又愿意交換,說明對方很可能只有100元,因此學(xué)生甲也應(yīng)該選擇“拒絕”交換。所以,學(xué)生甲總是會(huì)選擇“拒絕”交換……反之則然,學(xué)生乙也會(huì)選擇“拒絕”交換。最終,學(xué)生甲和學(xué)生乙都會(huì)選擇“拒絕”交換。因?yàn)?,他們通過倒推,發(fā)現(xiàn)選擇交換的風(fēng)險(xiǎn)很大。
第二,收益與信息。在第二次交換的情況下,兩人唯一的信息也是自己手中的錢(數(shù)額),但有所不同的是這些錢不是自己的。兩個(gè)學(xué)生是選擇“交換”或“拒絕”?其實(shí),倆人都會(huì)想到,自己拿到數(shù)額大的那份錢的可能性是50%。既然自己贏得數(shù)額大的可能性和損失一半數(shù)額的可能性各占50%,那為什么不試著交換一下,反正自己本身也沒有什么損失,可以去博一下。選擇“交換”就成為倆人(學(xué)生甲和學(xué)生乙)的必然選擇。筆者通過對學(xué)生(碩士研究生)的多次實(shí)驗(yàn)表明:在第一次交換的情況下,學(xué)生不愿意進(jìn)行交換。因?yàn)樗麄兏嗟臅?huì)考慮風(fēng)險(xiǎn)問題(這些錢是自己的);在第二次交換的情況下,學(xué)生基本上都愿意進(jìn)行交換。因?yàn)樗麄冋J(rèn)為這些錢不是自己的,愿意用這些錢去冒風(fēng)險(xiǎn),搏得更多的錢。從表面上看,兩種情況似乎很相近,但實(shí)質(zhì)上是有區(qū)別的。不論第一次或第二次選擇(“不愿意交換”和“愿意交換”),都是運(yùn)用了博弈理念來思考這個(gè)問題,才會(huì)得出正確的選擇。由此可見,一般理性思考與博弈理性思考的最大不同——是否考慮風(fēng)險(xiǎn)與收益之比、是否考慮對方策略和是否考慮人們的價(jià)值取向。
二、誠實(shí)選擇實(shí)驗(yàn)的理性判斷分析
人們在進(jìn)行“囚徒困境”選擇時(shí),最大的困惑是:好的結(jié)果(“不坦白”)被否定,壞的結(jié)果(“坦白”)被采納。因此,人們始終不愿意承認(rèn)自己會(huì)選擇“坦白”。但是,現(xiàn)實(shí)社會(huì)大量的事情都說明了,人們最終是選擇“坦白”,如教育中“應(yīng)試教育”與“素質(zhì)教育”的選擇,落后農(nóng)村在計(jì)劃生育中“累累超生”的選擇,其實(shí)都是選擇的“坦白”(應(yīng)試教育、超生養(yǎng)老)。
筆者在培訓(xùn)中,運(yùn)用“誠實(shí)選擇”實(shí)驗(yàn),來提升學(xué)生對這個(gè)問題的認(rèn)識(shí)。所謂“誠實(shí)選擇”講的是以前有一個(gè)教博弈論的教授,帶了兩個(gè)學(xué)生,第二天要考試,而學(xué)生要去參加一個(gè)“聚會(huì)”。聚會(huì)晚上八、九點(diǎn)鐘才開始,半夜才是高潮。如果玩下去,可能會(huì)影響第二天的考試;如果回學(xué)校,他倆又不甘心,怎么辦?倆人商量后,給教授打了一個(gè)電話:“教授,我們學(xué)習(xí)博弈論這門課,非常認(rèn)真,臨考前還進(jìn)行調(diào)研。但很不幸,回學(xué)校的路上,車輪胎爆了,始終修不好。如果修好后回來,可能已經(jīng)是深更半夜,定會(huì)影響第二天的考試。教授能不能考慮考慮,把考試的時(shí)間延一、二天?!苯淌诨卮穑骸靶小?。于是,倆人放心地玩了個(gè)通宵。endprint
考試那天,倆人翻開試卷,教授就只出了一道題:你們那天出去調(diào)研,車輪胎爆了,是哪個(gè)車輪胎爆了。誠實(shí)回答,可以及格;不誠實(shí)回答,就“掛科”。學(xué)生選擇“坦白”,自然就會(huì)及格;選擇“不坦白”,就面臨兩人各自都有四種選擇(左前輪胎,右前輪胎,左后輪胎,右后輪胎)。假如兩人都選擇“不坦白”,就必須對四個(gè)輪胎進(jìn)行選擇,如要獲得成功,其概率只有6.25%(依照排列組合,16次能選對一次)。因此,在現(xiàn)實(shí)中理性也是應(yīng)該選擇“坦白”。
“囚徒困境”及“誠實(shí)選擇”,這組博弈選擇筆者近幾年的培訓(xùn)中,曾經(jīng)做過上百次。兩個(gè)博弈選擇看似很相近,當(dāng)人們在處于“困境”的狀況下,進(jìn)行選擇的結(jié)果卻差別非常之大。對于“囚徒困境”的選擇時(shí),學(xué)生90%以上是選擇“不坦白”(一個(gè)班,往往選擇“坦白”的,一般只占6-12%);對于“誠實(shí)選擇”,學(xué)生85%以上是選擇“誠實(shí)”。
實(shí)驗(yàn)表明:第一,“囚徒困境”的選擇,是一種追求個(gè)體理性的范式,是一種較為抽象、理論理性的思考選擇,而“誠實(shí)選擇”,是一種追求集體理性的范式,是一種較為具體、現(xiàn)實(shí)理性的思考選擇。在實(shí)際選擇過程中,學(xué)生很難將其分辨,因?yàn)檫@需要很強(qiáng)的理性思維能力。同時(shí),人們在選擇過程中,在他人有風(fēng)險(xiǎn)時(shí),往往比較忽略、忽視,呈現(xiàn)出非理性,而自己有風(fēng)險(xiǎn)時(shí),選擇相對理性一些。這就給我們一個(gè)啟示,實(shí)施者應(yīng)與其責(zé)任相聯(lián)系,否則實(shí)施者會(huì)缺乏風(fēng)險(xiǎn)意識(shí)。
第二,在“囚徒困境”選擇中,選擇坦白的人少,原因是他們沒有更多的思考其后果。在進(jìn)行“誠實(shí)選擇”實(shí)驗(yàn)過程中,每每進(jìn)行情景模擬時(shí),都要告誡他們,你的四種選擇(有四個(gè)輪胎的選擇)與他的四種選擇(有四個(gè)輪胎的選擇),按排列組合,其概率僅只有6.25%,既使少部分人選擇了“不誠實(shí)”,當(dāng)兩兩相對時(shí),上百次的選擇都以“失敗”告終。使學(xué)生在進(jìn)行選擇時(shí),具有一些風(fēng)險(xiǎn)與收益的預(yù)判,且理性細(xì)致思考的選擇。
第三,在“囚徒困境”選擇中,為什么不坦白的比例高,因?yàn)樗麄冞x擇時(shí)是處于“非理性”狀態(tài)的。在“誠實(shí)選擇”中,為什么選擇“誠實(shí)”的比例非常大,其根本原因是教授充分運(yùn)用了信息不對稱,使得選擇者的選擇風(fēng)險(xiǎn)很高,如選擇不誠實(shí),其風(fēng)險(xiǎn):收益比是極其不經(jīng)濟(jì)的。所以,這給人們一個(gè)非常重要的啟示,要使全社會(huì)是“誠實(shí)”、“理性”的,那么,“不誠實(shí)”、“非理性”選擇的機(jī)制風(fēng)險(xiǎn)就應(yīng)該很高。只有這樣,才能引導(dǎo)人們的選擇是“誠實(shí)”而“理性”的。
1978年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者西蒙認(rèn)為,人的理性能力是有限的,不可能對所有的可能選擇作出精確的利益計(jì)算。人在作決策時(shí),采用的是由局部到整體的實(shí)驗(yàn)方法,這時(shí)要求集體選擇達(dá)到個(gè)體都無法到達(dá)的理性是不可能。原因是人的理性能力是有限的:信息是不完備的,個(gè)人不知道全部備選方案;環(huán)境存在不確定性,外生事件隨時(shí)可能發(fā)生;人的認(rèn)識(shí)能力和計(jì)算能力是有限的。而且,人的理性在政治領(lǐng)域表現(xiàn)得更加弱化,一是與經(jīng)濟(jì)活動(dòng)相比,政治活動(dòng)有更大的不確定性,人的政治行為難以理性化;二是與經(jīng)濟(jì)活動(dòng)相比,人們在政治活動(dòng)中對自己行為結(jié)果所承擔(dān)的責(zé)任并不總是直接的,而且往往不是很確定的,這也淡化了人們進(jìn)行理性計(jì)算的動(dòng)力。
本文系重慶市研究生教育優(yōu)質(zhì)課程項(xiàng)目“管理博弈論”;重慶市研究生教育教學(xué)改革研究項(xiàng)目“現(xiàn)代培訓(xùn)方式與理念研究”。
作 者:中共重慶市委黨校公共管理教研部
責(zé)任編輯:粟 超endprint