李 莉
(湖北大學(xué)哲學(xué)學(xué)院,湖北武漢430062)
紐科姆難題是一個(gè)與合理行動(dòng)相關(guān)的決策困境問(wèn)題。處于紐科姆難題決策情形中的決策者,根據(jù)決策理論中的兩個(gè)基本原則——最大化效用原則和占優(yōu)策略原則,得出了完全相反的兩個(gè)答案,使得決策者無(wú)法確定什么才是合理的行動(dòng)。
物理學(xué)家威廉·紐科姆(W.Newcomb)在考慮囚徒困境問(wèn)題的過(guò)程中,首先構(gòu)造出紐科姆難題。羅伯特·諾齊克(R.Nozick)了解到這個(gè)難題后,于1969年撰寫(xiě)了一篇著名的論文《紐科姆難題和決策的兩個(gè)原則》[1]65~72,標(biāo)志著紐科姆難題的正式提出。
紐科姆難題體現(xiàn)了作為決策論中最重要且最基本的兩個(gè)原則,也就是最大化效用原則與占優(yōu)策略原則之間的沖突。諾齊克在《理性的性質(zhì)》一書(shū)中談到紐科姆疑難研究之意義時(shí)寫(xiě)道:
經(jīng)濟(jì)學(xué)家和統(tǒng)計(jì)學(xué)家已經(jīng)發(fā)展出一種有關(guān)合理決策的精心制作的理論,并將其廣泛運(yùn)用到理論與政策研究之中。這是一種具有數(shù)學(xué)嚴(yán)格性的,既強(qiáng)有力而又容易掌握的理論。雖然它作為實(shí)際行為的描述之充分性已受到廣泛質(zhì)疑,它仍然是有關(guān)合理決策所應(yīng)滿(mǎn)足條件之研究中居于支配地位的標(biāo)準(zhǔn)理論。我認(rèn)為,這種標(biāo)準(zhǔn)決策理論需擴(kuò)充到與行為的符號(hào)意義及其他有關(guān)因素的明晰思考相結(jié)合,而關(guān)于當(dāng)前標(biāo)準(zhǔn)理論之不充分性認(rèn)識(shí)的一個(gè)有益入口,是由紐科姆問(wèn)題提供的。[2]222
在學(xué)界,紐科姆難題因此引起了廣泛的關(guān)注。
紐科姆難題有很多版本,以下采自諾齊克最原始的表述:
假定一個(gè)擁有超能力的生物,他能夠預(yù)測(cè)你的選擇(或者你也可以把它想象成一個(gè)科幻故事中外星來(lái)的生物,擁有先進(jìn)的科學(xué)技術(shù),同時(shí)也是非常友好的等等)。你知道這個(gè)生物過(guò)去常常能正確地預(yù)測(cè)出你的選擇(至少到目前為止,對(duì)你的選擇沒(méi)有做過(guò)錯(cuò)誤的預(yù)測(cè))。此外,你還知道這個(gè)生物經(jīng)常正確地預(yù)測(cè)到其他人的選擇,而且其中很多人都處于與你類(lèi)似的情形中?,F(xiàn)在有兩個(gè)盒子:盒子B1和盒子B2。B1是透明的,里面有1000美元。B2是不透明的,里面有100萬(wàn)美元,或者什么也沒(méi)有。B2里面是否有錢(qián)取決于接下來(lái)發(fā)生的事情。首先,超級(jí)生物做出預(yù)測(cè)。他知道你面臨兩個(gè)選擇,或者拿走兩個(gè)盒子,或者只拿走盒子B2。接下來(lái),(1)如果生物預(yù)測(cè)到你會(huì)拿走兩個(gè)盒子,他就不把100萬(wàn)美金放在B2里。(2)如果生物預(yù)測(cè)到你只拿走B2,他就會(huì)放100萬(wàn)美元在里面。于是首先由超級(jí)生物作出預(yù)測(cè),然后把錢(qián)放進(jìn)B2,或者沒(méi)有放,取決于他是怎么預(yù)測(cè)的?,F(xiàn)在輪到你來(lái)做決策,你知道超級(jí)生物知道的信息。你會(huì)怎么做?
在紐科姆難題的決策情形中,決策者必須在兩個(gè)可能的行動(dòng)中作出決定,這意味著有兩種可能的世界狀態(tài)。據(jù)此,諾齊克給出了兩個(gè)相反的但是同樣合理的論證。根據(jù)最大化效用原則建議,應(yīng)該是只拿走一只盒子,也就是盒子B2。根據(jù)占優(yōu)策略原則的建議,應(yīng)該是拿走兩只盒子。
以下是諾齊克的“一盒論”論證:(T表示時(shí)間,數(shù)字越大,表示時(shí)間越晚;數(shù)字相同,表示時(shí)間一樣。)
前提1:如果我在T3拿走兩只盒子,預(yù)言家將會(huì)在T1以很高的概率預(yù)測(cè)到這些,并且在T2不往B2里面放錢(qián),所以我?guī)缀跄艽_定地拿到1000美元。
前提2:如果我在T3拿走B2,預(yù)言家會(huì)在T1以很高的概率預(yù)測(cè)到這些,并在T2放100萬(wàn)美元在B2里,所以我?guī)缀跄艽_定地拿到100萬(wàn)美元。
結(jié)論:因此我應(yīng)當(dāng)拿走B2。
論證過(guò)程:令C表示置信度,a1表示拿走兩只盒子,a2表示拿走盒子B2,s1表示盒子里面有100萬(wàn)美元,s2表示盒子里面沒(méi)有錢(qián),此時(shí)決策者的置信度為:
并且假定決策者可能收益的效用是和可能結(jié)果成線(xiàn)性增長(zhǎng),那么可能行動(dòng)a1和a2的條件效用是這樣計(jì)算的,其中CU表示期望效用,a1表示拿走兩只盒子,a2表示拿走盒子B2:
因?yàn)镃U(a2)比CU(a1)高,最大化條件效用原則推薦拿走盒子B2。
以下是諾齊克的“2盒論”論證:
前提1:預(yù)言者已經(jīng)在T1做出了他的預(yù)言,把100萬(wàn)美元在T2放入了B2中,或者沒(méi)放。
前提2:假定預(yù)言者T2時(shí)在B2中已經(jīng)放入100萬(wàn)美元,如果你在T3時(shí)拿走兩個(gè)盒子,你將得到1,001,000美元,如果你在T3時(shí)拿走B2,你將得到100萬(wàn)美元。
前提3:假定預(yù)言者T2時(shí)在B2中不放錢(qián),如果你在T3時(shí)拿走兩只盒子,那你得到1000美元,如果我在T3時(shí)拿走一只盒子,那你得不到錢(qián)。
前提4:如果你拿走兩只盒子而不是一只,那么任何情況下,你都能多得1000美元。
結(jié)論:因此你應(yīng)當(dāng)拿走兩只盒子。
假定對(duì)決策者而言,1000美元的效用比0美元的效用高,1,001,000的效用比1,000,000的效用高。拿走兩只盒子的行動(dòng)明顯優(yōu)于拿走一只盒子,所以占優(yōu)策略原則推薦拿走兩只盒子。
這兩個(gè)論證,在同一決策情形中,給出了完全相反的建議。諾齊克認(rèn)為這體現(xiàn)了合理決策行動(dòng)中兩個(gè)決策原則之間的沖突,也就是期望效用最大化原則和占優(yōu)原則之間的沖突。
紐科姆難題提出以后,很多學(xué)者都用大量的精力和時(shí)間來(lái)提出解決方案。這些解決方案主要分為三個(gè)途徑:其一,以杰弗里、艾爾斯方案為代表的證據(jù)決策方向;其二,以吉伯德和哈珀方案為代表的因果決策方向;第三,以諾齊克方案為代表的折衷調(diào)和方向。
紐科姆難題是于1969年提出的,而杰弗里的決策邏輯是1965年提出的,嚴(yán)格地說(shuō),它應(yīng)該不算是紐科姆難題的解決方案。然而,根據(jù)杰弗里的決策邏輯,可以在紐科姆難題中得到只拿走一只盒子的解決方案,因此,從這個(gè)意義上,也可以把它算作一種方案。
杰弗里后來(lái)(1983、1988、1996)的方案則更為清楚地處理了紐科姆難題。他把紐科姆難題看做是自己提出的決策邏輯的反例,從而在1983年提出了可能行動(dòng)效用的新定義,以及一個(gè)不同的最大化原則,與他原來(lái)的決策邏輯背道而馳。然而他的新理論,也遇到和紐科姆難題不同的反例。于是1988年,杰弗里又回歸到他的決策邏輯立場(chǎng),宣稱(chēng)他的邏輯足夠給紐科姆難題以解決方案,但有一個(gè)前提,就是紐科姆難題要在兩個(gè)層面上進(jìn)行概率化:第一個(gè)層面是決策者拿走盒子B2或者拿走兩只盒子的未知概率,而另一個(gè)層面是決策者的可信度,決策者的可信度有助于了解這個(gè)未知的概率是多少。1996年杰弗里通過(guò)對(duì)決策者的置信度添加限制條件來(lái)改進(jìn)了他的決策邏輯,并提出了對(duì)紐科姆難題的解決方案。
杰弗里1965年的解決方案是基于他的決策邏輯而提出的。他指出,決策者的置信度和效用應(yīng)當(dāng)服從克格莫洛夫的三條公理和他本人提出的效用公理。這四條公理一起推出的結(jié)果與杰弗里計(jì)算可能行動(dòng)的條件效用結(jié)果是一致的,決策者應(yīng)當(dāng)使用下面的方式來(lái)計(jì)算可能行動(dòng)的條件效用:
如果C(ai)>0,那么
此外,決策者應(yīng)當(dāng)使用最大化條件效用原則。在紐科姆難題中,分別計(jì)算拿兩只盒子的條件效用,和拿走B2的效用相比,B2的條件效用更高,因此,決策者應(yīng)當(dāng)拿走B2。
然而,杰弗里的決策邏輯提供的解決方案在紐科姆難題上連杰弗里本人都不滿(mǎn)意。這個(gè)方案是不準(zhǔn)確的,因?yàn)樗o出了錯(cuò)誤的建議,也就是只拿走盒子B2。這個(gè)錯(cuò)誤根源于杰弗里決策邏輯自身所具有的兩個(gè)缺點(diǎn):第一,在他的理論中并沒(méi)有考慮因果關(guān)系;第二,根據(jù)他的理論,每個(gè)可能的世界狀態(tài)的分區(qū)都是允許的。不克服這兩個(gè)缺點(diǎn),是很難得出正確答案的。
實(shí)際上,杰弗里此時(shí)的決策邏輯具有如下特點(diǎn):
(1)理論是非因果的。杰弗里之所有沒(méi)有使用因果關(guān)系,是因?yàn)樗J(rèn)為只有在賭博中才使用因果關(guān)系,因果關(guān)系取決于打賭雙方對(duì)彼此的信任以及雙方是否能夠兌現(xiàn)諾言的能力。比如,我出1美元跟你打賭,如果C出現(xiàn),給你1美元;如果C不出現(xiàn),你給我1美元。你接受了這個(gè)賭局。A這個(gè)命題就是:當(dāng)知道C的真假之后,你給我1美元;B這個(gè)命題就是:當(dāng)知道C的真假之后,我給你1美元。這樣我們就在CAB之間建立了一個(gè)因果關(guān)系。杰弗里指出這種因果關(guān)系和命題(如果油箱沒(méi)油,那么汽車(chē)無(wú)法啟動(dòng))之間所具有的因果關(guān)系是一樣的。因此,杰弗里認(rèn)為,如果在決策中使用因果關(guān)系,就很難對(duì)命題的偏好進(jìn)行排序。這有一個(gè)例子說(shuō)明這一點(diǎn)。假定有三個(gè)命題:A.下個(gè)星期有核戰(zhàn);B.下個(gè)星期天氣晴朗;C.硬幣朝上。然后有一個(gè)打賭,如果C,那么B;如果不是C,那么A。杰弗里認(rèn)為在這個(gè)賭局中,決策者就沒(méi)辦法對(duì)他的偏好進(jìn)行排序。
(2)決策者可以任意區(qū)分可能的世界狀態(tài)。在杰弗里的偏好理論中,決策者對(duì)可能世界狀態(tài)可以進(jìn)行任意的分區(qū)。其原因在于無(wú)論用何種方式區(qū)分,決策者對(duì)可能行動(dòng)效用的計(jì)算都會(huì)導(dǎo)出同樣的結(jié)果。
(3)決策者對(duì)他的可能行動(dòng)可以指派置信度。因?yàn)橛妹}來(lái)表示可能行動(dòng),從而決策者可以給可能行動(dòng)指派置信度。如果決策者相信,他可以實(shí)現(xiàn)一個(gè)可能行動(dòng),那么他指派的置信度為1。在杰弗里的公式中,置信度是大于0的。如果決策者不能確定一個(gè)可能行動(dòng)是否為真,就要給這個(gè)可能行動(dòng)賦予很低的概率,而不能為0。
(4)根據(jù)理論,可以在信息來(lái)源中建立偏好。主體采取某種行動(dòng)不能簡(jiǎn)單地描述為使命題B為真,而應(yīng)當(dāng)描述為改變兩個(gè)或更多的命題概率,從prob B1,prob B2,…,prob Bn成為PROB B1,PROB B2,…,PROB Bn。因此在行動(dòng)中,決策者相信如果他想要的話(huà),就能使得一個(gè)可能行動(dòng)為真。在概率行動(dòng)的情況中,決策者相信他無(wú)法控制使得一個(gè)可能的行動(dòng)為真,只能試圖使它為真??赡苄袆?dòng)A1的效用比可能行動(dòng)A2的高,就是指在決策者的偏好排序中,可能行動(dòng)A1高于A2。也就是說(shuō),這意味著決策者更歡迎A1所帶來(lái)的信息。據(jù)此,杰弗里建立了信息間的偏好。此外,這種理解也解釋了矛盾的命題不可能在命題的偏好排序中出現(xiàn)。同時(shí)也解釋了為什么必要的命題不傳遞任何信息。因?yàn)檫@肯定是真的。A在必要的命題中排序最低,意味著A是不好的信息;對(duì)決策者而言,相對(duì)于A是真的消息,其他的消息都是好消息。A的排序最高,意味著與A是真的這個(gè)好消息相比,其他的消息都不是壞消息。A的排序是必要的,意味著決策者對(duì)A是否為真無(wú)動(dòng)于衷。
(5)理論中有一個(gè)表征性定理。這構(gòu)成杰弗里決策邏輯的核心。
(6)指出決策者應(yīng)當(dāng)服從最大化條件效用原則。
1983年,杰弗里對(duì)他的決策邏輯進(jìn)行了反思,認(rèn)為紐科姆難題是他的理論的一個(gè)反例,原因有兩個(gè):(1)他認(rèn)為他的最大化條件效用原則在紐科姆問(wèn)題上給出了錯(cuò)誤的答案,也就是選擇拿走一只盒子;(2)杰弗里指出,如果決策被看做是可能世界狀態(tài)的證據(jù),在這些世界中可能的行動(dòng)不會(huì)發(fā)生,也不能被阻止,那么此時(shí)他的決策邏輯就是錯(cuò)誤的。
據(jù)此,他提出了可接受主義理論。可接受主義的核心是什么呢?杰弗里說(shuō):“一個(gè)理性的決策就是這樣一個(gè)決策,當(dāng)主體最終決定如果實(shí)施這個(gè)行動(dòng),根據(jù)他所認(rèn)為的概率矩陣,能夠使預(yù)估的目標(biāo)最大化,那么理性的決策就是實(shí)施這個(gè)行動(dòng)?!盵4]25
可接受主義指出決策者的最終決策是可能世界狀態(tài)的證據(jù),或者是其他決策者的可能行動(dòng)的證據(jù)。因此,基于這個(gè)假定,一個(gè)可能行動(dòng)的效用就可以用下面的方式來(lái)計(jì)算:(此處sj指稱(chēng)可能世界狀態(tài),或者任何與不同決策問(wèn)題相關(guān)的決策者的可能行動(dòng),dai指稱(chēng)這樣一個(gè)命題,就是決策者最終決定采取的決策[4]16。)
如果c(dai)>0,那么
在紐科姆難題中,如果我們用行動(dòng)A1表示在T3時(shí)刻拿走兩只盒子,A2表示在T3拿走B2,S1表示預(yù)言者在T1預(yù)言我拿走兩只盒子,在T2不往盒子里放東西,S2表示預(yù)言者在T1預(yù)計(jì)到我會(huì)拿走B2里的東西,從而在T2時(shí)往B2中放入100萬(wàn)美元,那么,根據(jù)可接受主義原則的計(jì)算,拿走兩只盒子的決策效用大于拿走一只盒子的效用,從而拿走兩只盒子的決策是理性的。
可接受主義理論也并非完美,杰弗里自己指出他的可接受主義理論有以下幾個(gè)缺點(diǎn):第一,有些決策問(wèn)題中,沒(méi)有可接受的決策。第二,有些決策問(wèn)題中,所有的決策都是可接受的。“一個(gè)主體可能會(huì)發(fā)現(xiàn)所有的行動(dòng)都是理性的,因?yàn)閷?duì)任何行動(dòng)的選擇都能使他預(yù)估的愿望最大化——不是通過(guò)改變條件概率,而是通過(guò)增加支付矩陣中的意向”[4]190。在這種情況下,理性決策的數(shù)值不一定就是1,決策者應(yīng)當(dāng)在做決策前,重新評(píng)估他的信念和愿望。第三,范·弗拉森(van Fraassen)認(rèn)為,在一些決策問(wèn)題中,有些值得選擇的可能行動(dòng)并非是可接受的。作為可能世界狀態(tài)的證據(jù),或者是其他決策者的可能行動(dòng)的證據(jù),有些可能行動(dòng)比最終決策好。
除此以外,由于引進(jìn)了最終決策這個(gè)術(shù)語(yǔ),使得杰弗里的可接受主義和因果決策理論一樣復(fù)雜。
總而言之,在紐科姆問(wèn)題中,杰弗里的可接受主義理論提出了正確的解決方案,但是對(duì)決策者而言,他要求了太多的自我知識(shí)。此外,這個(gè)理論的應(yīng)用有限制,不是一個(gè)在所有場(chǎng)合都能使用的合理決策理論。最后,這不是一個(gè)經(jīng)濟(jì)的合理決策理論。由于引進(jìn)了最終決策這一概念,可接受主義理論和因果決策理論一樣不經(jīng)濟(jì)。
鑒于可接受主義的缺點(diǎn),杰弗里又回到他1965年的立場(chǎng),采用了概率主義。他寫(xiě)道:“一旦我們發(fā)現(xiàn)這里實(shí)際上是最終偏好起作用,那么如果紐科姆難題能夠在兩個(gè)層面上概率化,第一版(1965)決策邏輯中所提出的證據(jù)決策理論似乎是令人滿(mǎn)意的。”[5]241
杰弗里認(rèn)為他的概率主義既有可接受主義的優(yōu)點(diǎn),又避免了范·弗拉森的反例。杰弗里的論證過(guò)程比較復(fù)雜,因?yàn)槠?,這里只給出杰弗里計(jì)算最終條件效用的公式:
如果cn(ai)>0,那么
此時(shí)決策者應(yīng)當(dāng)采用最大化最終條件效用原則:在給定的決策情形D中,決策者X1應(yīng)當(dāng)采用能夠使最終條件效用最大化的可能行動(dòng)。
在紐科姆問(wèn)題上,杰弗里的概率主義給出了正確的解決方案。然而杰弗里計(jì)算最終條件效用的公式是不對(duì)的,因?yàn)樗褂昧俗罱K置信度來(lái)評(píng)價(jià)可能行動(dòng)。
1996年,杰弗里提出了第四個(gè)方案即線(xiàn)性動(dòng)態(tài)決策理論來(lái)解決紐科姆難題。根據(jù)線(xiàn)性動(dòng)態(tài)理論,杰弗里認(rèn)為紐科姆難題根本就不是一個(gè)決策問(wèn)題。
對(duì)此觀點(diǎn),詹姆士·M.喬伊斯[7]指出,杰弗里之所以認(rèn)為紐科姆難題不是決策問(wèn)題,因?yàn)樘幱诩~科姆難題中的主體,擁有的關(guān)于他們的行動(dòng)和世界關(guān)系之間關(guān)系的證據(jù)是如此之多,使得他們不能把選擇當(dāng)做是收益的原因,在這個(gè)意義上他們本身是沒(méi)有自由選擇的。然而杰弗里的推理是錯(cuò)誤的,因?yàn)樗麤](méi)有認(rèn)識(shí)到主體關(guān)于他的可供選擇的信念,是與這些行動(dòng)的原因密切相連的,以至于他可以制造證據(jù),來(lái)權(quán)衡行動(dòng)和世界狀態(tài)之間的關(guān)系。
當(dāng)然杰弗里不是唯一一個(gè)認(rèn)為紐科姆難題不是決策問(wèn)題的人??ɑ鶢朳8]、伽登納[9]、麥基[10]和施耐辛格[11]也得出了同樣的結(jié)論。
麥基認(rèn)為紐科姆問(wèn)題不是一個(gè)決策問(wèn)題的理由是:要求參與人在一次博弈中有一個(gè)真正的開(kāi)放的選擇,其中既沒(méi)有作弊,也沒(méi)有逆向因果,從而使得預(yù)言者成功的預(yù)言是順理成章的這樣的要求實(shí)際上根本無(wú)法得到滿(mǎn)足。
施耐辛格的理由是沒(méi)有人能夠預(yù)測(cè)出自由決策。因?yàn)榧词箾Q策者非常傾向于拿走B2,即使預(yù)測(cè)者知道這些,決策者依然可以使用他意志的力量來(lái)抵制這種傾向,從而拿走兩只盒子。
杰弗里從1965年至1996年間,在紐科姆問(wèn)題上的觀點(diǎn)發(fā)生了很多轉(zhuǎn)變,這種對(duì)自己理論進(jìn)行反思的精神是非常值得敬佩的。對(duì)他的觀點(diǎn)以及解決方案雖然可以有不同的立場(chǎng),然而他的努力推動(dòng)了決策邏輯的發(fā)展,這是不容忽視的事實(shí)。
[致謝]本文還得到了湖北大學(xué)高校文化資源服務(wù)社會(huì)專(zhuān)項(xiàng)研究課題(課題號(hào):0b075060)資助,特此致謝!
[1]Nozick,R.Newcomb’s Problem and Two Principles of Choice[M]//N.Rescher,D.Davidson,C.G.Hempel.Essays in Honor of Carl G.Hempel.Dordrecht:Reidel,1969.
[2]張建軍.邏輯悖論研究引論[M].南京:南京大學(xué)出版社,2002.
[3]Jeffrey,R.C.The Logic of Decision[M].New York:McGraw-Hill,1965.
[4]Jeffrey.R.C.The Logic of Decision(second edition)[M].Chicago and London:The University of Chicago Press,1983.
[5]Jeffrey,R.C.How to Probabilize a Newcomb Problem[M]//J.H.Fetzer.Probability and Causality.Dordrecht:Reidel,1988.
[6]Jeffrey.R.C.Decision Kinematics[M].K.J.Arrow,E.Colombatto,M.Perlman,C.Schmidt.The Rational Foundations of Economic Behaviour.Basingstoke:Macmillan,1996.
[7]James M.Joyce.Are newcomb problems really decisions?[J].Synthes,2007,(156).
[8]Cargile.J.Newcomb’s Paradox[J].British Journal for the Philosophy of Science,1975,(26).
[9]Gardner.M.Free Will Revisited,with a Mind-Bending Prediction Paradox by William Newcomb[J].Scientific American,1973,(229).
[10]Mackie.J.L.Newcomb’s Paradox and the Direction of Causation[J].Canadian Journal of Philosophy,1977,(7).
[11]Schlesinger.G.The Unpredictability of Free Choices[J].British Journal forthe Philosophy of Science,1974,(25).
湖北大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)2015年4期