付小軒
一個(gè)理性主體通常需要具備在不同情境中做出決策的能力,而這些決策最終如何服從于他的理性,亦即,該主體的內(nèi)在推理機(jī)制如何在決策過程中起作用?這個(gè)問題不僅僅是決策論(decision theory)所關(guān)注的對象,也是邏輯學(xué)中的偏好提升(preference lifting)理論所探討的話題。
舉一個(gè)簡單的例子:張三需要決定是否購買100 元的房屋險(xiǎn)。如果他選擇購買的話,那么他將在房屋著火后獲得100,000 元的保險(xiǎn)賠償;反之,他將省下100元保險(xiǎn)費(fèi)。這個(gè)決策情境可以用如下表格表示:
在決策論中,該表格的第一列統(tǒng)稱為“張三的行為”,“a,b,c,d”稱作“張三的行為可能導(dǎo)致的結(jié)果”。決策論的目的是通過對這四個(gè)可能結(jié)果的偏好對比,推導(dǎo)出張三應(yīng)該選擇哪個(gè)行為。而在偏好提升中,“a,b,c,d”可以看作是四個(gè)“狀態(tài)”,“購買保險(xiǎn)”看作是“a,b兩個(gè)狀態(tài)的集合”,“不購買保險(xiǎn)”看作是“c,d兩個(gè)狀態(tài)的集合”。偏好提升理論的目的是基于不同狀態(tài)之間的對比,推導(dǎo)出它們所構(gòu)造出的不同集合間的對比。譬如,通過比較a、b、c和d,推導(dǎo)出張三更偏好集合{a,b}亦或者是集合{c,d}。由此可見,決策論和偏好提升理論在推理結(jié)構(gòu)以及研究目的方面都一致,因此探討二者的聯(lián)系是一項(xiàng)自然且重要的研究。
然而,由于決策論和偏好提升理論在研究方法上的不同,將二者聯(lián)系起來的工作目前主要面臨兩個(gè)挑戰(zhàn):
第一,決策論是定量化研究,而偏好提升理論是定性分析。譬如,假定張三的偏好序是c ≤a ≤b ≤d。1此處的偏好序表示的是:張三最偏好的結(jié)果是d,其次是b,再次是a,最后是c。那么偏好提升理論是基于這個(gè)序關(guān)系直接推導(dǎo)出張三應(yīng)該選擇{a,b}亦或者是{c,d},而決策論會給a、b、c、d賦上具體的數(shù)值(比如,a=1,b=4,c=?100,d=10),從而借助數(shù)值上的大小關(guān)系來表達(dá)出a、b、c、d之間的偏好關(guān)系,進(jìn)而推導(dǎo)出張三應(yīng)該選擇哪個(gè)行為。除此之外,當(dāng)決策情境伴隨著不確定性時(shí),這些可能結(jié)果的計(jì)算方式將不僅僅是單純的賦值,同時(shí)還會引入概率的計(jì)算。由此就進(jìn)一步加大了與偏好提升理論研究的差距。所以,本文首先需要探討這類定量化研究與定性分析方式可以在何種程度上解決同樣的問題,而它們之間的差異又體現(xiàn)在何處。
第二,迄今為止的偏好提升理論著重于研究帶有確定性的決策情境,而較少將概率納入考量,這就使得偏好提升理論在解釋力方面相對較弱,并且較難運(yùn)用到日常的決策情境當(dāng)中。因此,本文也需要考量如何在偏好提升理論中加入概率,進(jìn)而與決策論中結(jié)合概率的方法進(jìn)行對比。
本文將主要圍繞這兩個(gè)挑戰(zhàn)展開。第二節(jié)將介紹決策論的定量方法(效用函數(shù)以及期許度函數(shù))、偏好提升理論中的四種主要提升方法以及結(jié)合概率的一些邏輯研究,從而探討決策論的定量方法與偏好提升理論的聯(lián)系和區(qū)別;第三節(jié)將給出一類偏好概率的邏輯模型,將它作為解決第二個(gè)挑戰(zhàn)的初步嘗試,并通過探討它的性質(zhì)來說明概率化的定性分析的優(yōu)勢與弊端;在最后的第四節(jié),本文將總結(jié)主要的研究成果,并對未來的工作給予進(jìn)一步的闡述與展望。
決策論中的兩個(gè)核心概念分別是:主體的偏好(preference)以及主體可實(shí)施的選擇(options)。而主體做決策的過程就可以看作是他基于自身偏好對可能的選項(xiàng)做選擇的過程。簡單來說,面對兩個(gè)可能的選項(xiàng)x和y,如果主體更偏好x,那么他會選擇實(shí)施x,而數(shù)學(xué)上一般用y ≤x來表示這種情形;反之亦然。在更一般的數(shù)學(xué)設(shè)定中,對于一集可能的選項(xiàng){x1,...,xn},主體基于對任意兩個(gè)選項(xiàng)之間的偏好比較2此處,假定任意兩個(gè)選項(xiàng)都可比較。,可以生成關(guān)于這個(gè)集合的偏好序列,譬如x1≤...≤xn。而這類偏好的序關(guān)系在決策論中通常用如下的效用函數(shù)(utility function)U:X →R 表示:
任取一個(gè)選項(xiàng)集X,對任意的x,y ∈X,U(x)≤U(y)?x ≤y。
從而通過以上定量化(數(shù)值間)的比較,主體會選擇具有最大效用值的x(此處,不妨假定X={x1,...,xn},那么U(x)=max{U(x1),...,U(xn)})。
然而,在實(shí)際的決策情境中,主體的選擇往往伴隨著不確定性,因此決策論在上述定義的基礎(chǔ)上加入了概率,由此引入了期望效用(expected utility)。此時(shí),主體的偏好序關(guān)系通過期望效用值之間的大小比較體現(xiàn)出來,并且他會選擇期望效用值最大的選項(xiàng),而不再是效用值最大的選項(xiàng)。對于期望效用值在實(shí)際決策情境中的定義,主要有以下兩種方式:
第一是薩維奇(L.J.Savage)([12])提出的計(jì)算方式:
這個(gè)等式表達(dá)的是:對于每個(gè)狀態(tài)si而言,主體事先都分配了一對數(shù)值,它們分別是si出現(xiàn)的概率以及在si上實(shí)施行為f會產(chǎn)生的效用值,通過計(jì)算這一對數(shù)值的乘積,可以得出si上的期望效用值;接下來,主體再對每個(gè)si的期望效用值進(jìn)行求和,以此來計(jì)算出行為f作用在整個(gè)S上的期望效用值。
薩維奇的理論為偏好關(guān)系提供了概率化的解釋,該解釋可以用如下等價(jià)關(guān)系表示:
對任意行為f和g而言,U(f)≤U(g)?f ≤g。3這個(gè)結(jié)論保證了即使加入了概率,偏好序依然可以用效用之間的數(shù)值比較來表示。
在探討這個(gè)等價(jià)關(guān)系的過程中,他提出了著名的“確定性原則”(Sure Thing Principle)([12],第21–22 頁)。該原則可以表述如下:
將狀態(tài)集合S劃分成兩個(gè)互斥的子集S′以及S ?S′,如果f、g和f′、g′同時(shí)滿足:(i)f、g在S′導(dǎo)致相同的結(jié)果,并且f′、g′在S′也導(dǎo)致相同的結(jié)果;(ii)f、f′在S ?S′導(dǎo)致相同的結(jié)果,并且g、g′在S ?S′也導(dǎo)致相同的結(jié)果;(iii)f ≤g;那么就有f′ ≤g′。
這個(gè)原則要求了行為與狀態(tài)之間的概率相互獨(dú)立,亦即,在任意可比較的狀態(tài)中,如果主體總是更偏好其中的一種行為,那么無論一個(gè)狀態(tài)發(fā)生的概率是多少,他對這兩種行為的偏好排序都會保持不變。這預(yù)設(shè)了主體必須優(yōu)先了解哪種劃分狀態(tài)的方式可以保證這種獨(dú)立性。但是這種對于概率分布的先天預(yù)設(shè)限制了薩維奇對于概率的設(shè)定。
第二是杰弗里(R.C.Jeffrey)([10])提出的計(jì)算方式:
在該公式中,p表示一個(gè)命題,P(pi |p)表示的是:在p發(fā)生的情況下pi發(fā)生的條件概率,D:P→R 是一個(gè)定義域?yàn)槊}集的期許度函數(shù)(desirability function)。它與薩維奇的效用函數(shù)的差異在于:這個(gè)函數(shù)定義域中的任意一個(gè)元素既可以是一個(gè)狀態(tài)也可以是一個(gè)行為(或行為的結(jié)果)。
在偏好關(guān)系的概率化解釋方面,杰弗里的定義也能保證:
對于任意的命題p和q而言,D(p)≤D(q)?p ≤q。
它表明了任意一個(gè)偏好關(guān)系都可以用期許度函數(shù)來表示。與此同時(shí),杰弗里在[10]中弱化了確定性原則的條件,提出了一個(gè)所謂的平均值(averaging)原則。該原則可以用如下形式表述:
任取一個(gè)命題集合?(其中,⊥/∈?),如果p,q是? 中彼此互不相容的兩個(gè)命題,那么p ≤q ?p ≤p ∪q ≤q。
這個(gè)條件表示:對于兩個(gè)不相容的命題p和q而言,p ∪q蘊(yùn)含了——只能是p和q的其中之一為真。由此,假定q比p更令人期許(desirable),那么p ∪q既不能比p更不令人期許,也不能比q更令人期許。這是因?yàn)閜 ∪q:要么p更令人期許要么q更令人期許。不過,杰弗里的定義也遺留了一個(gè)問題:即使主體的偏好滿足他所設(shè)定的條件,那么既不能保證只有一個(gè)概率函數(shù)代表他的信念,也不能保證代表他意愿的期許度函數(shù)的唯一性。進(jìn)而,這種定義唯一性的缺失也成為杰弗里計(jì)算方式的一個(gè)重要弊端。
綜上可見,薩維奇與杰弗里的計(jì)算方式都有各自的不足,但是本文的重點(diǎn)并不是回應(yīng)、修正他們各自理論的不足,而是通過探討效用函數(shù)與期許度函數(shù),以此來說明他們二者討論偏好(或者說是決策)的方式本質(zhì)上一樣。這是因?yàn)榭梢詫⑵谠S度函數(shù)D看作是從行為集合到實(shí)數(shù)的函數(shù),“一個(gè)p命題”看作是“行為f”,對任意的“i”而言,“i”可以看作是“指標(biāo)集”,它表示了“不同的狀態(tài)”,而“pi”就表示了“在i狀態(tài)中p行為所導(dǎo)致的后果”,“P(pi |p)”表示了“實(shí)施p行為的i狀態(tài)出現(xiàn)的概率”。由此可見,二者都是通過考慮每個(gè)行為所產(chǎn)生的后果值(效益值或者期許度)以及發(fā)生該行為的狀態(tài)所出現(xiàn)的概率,來計(jì)算這個(gè)行為的最終總收益(期望值或者期許度)。
關(guān)于主體如何將他的偏好序從狀態(tài)間的比較(或可能結(jié)果間的對比)提升到狀態(tài)集合間的比較(或行為間的對比),劉奮榮([11])以及范丙申(J.van Benthem)([2])都探討了具體的方法。利用邏輯量詞,這些提升方法主要分為以下四類:
? ??-法:如果?x ∈X ?y ∈Y:x ≤y,那么X ≤Y;
? ??-法:如果?x ∈X ?y ∈Y:x ≤y,那么X ≤Y;
? ??-法:如果?x ∈X ?y ∈Y:x ≤y,那么X ≤Y;
? ??-法:如果?x ∈X ?y ∈Y:x ≤y,那么X ≤Y。
其中,??-法以及??-法被較為廣泛地在實(shí)踐中使用。哈爾彭(J.Y.Halpern)為偏好提升理論中的??-法提供了公理化。([7])范丙申、吉拉德(P.Girard)與羅伊(O.Roy)認(rèn)為用??-法所定義的偏好提升正是馮萊特(G.H.von Wright)在[13]中研究偏好時(shí)的想法。([3])哈勒戴(W.H.Holliday)和??藸柕拢═.F.Icard)為了避免亞爾欽(S.Yalsin,[14])所提出的蘊(yùn)涵問題,提出了偏好提升的新方法。([9])他們在??-法的基礎(chǔ)上加上了一個(gè)要求——X ≤Y當(dāng)且僅當(dāng)存在一個(gè)從X到Y(jié)的通脹(inflationary)函數(shù),并且該函數(shù)是單射。其中,一個(gè)函數(shù)f:X →Y是通脹的指的是:對?x ∈X,x ≤f(x)。而這也等價(jià)于??-法的定義。在該文章中,他們認(rèn)為主體根本不會有足夠的信息來完全確定命題(或者說狀態(tài))的總體排序,因此允許了許多不可比性。哈里森-特瑞那(M.Harrison-Trainor)等人表明這個(gè)新規(guī)則相對于不精確概率的比較邏輯([1])是可靠并且完全的。([8])其中最為重要的是:通過這些設(shè)定,他們以概率的方式解釋了新??-法,并用定性的定義方式捕捉了其背后的定量推理。
第一個(gè)將概率解釋引入“≤-關(guān)系”的邏輯研究可以追溯到[6]。德菲尼蒂(B.de Finetti)推測:對于任意有窮的非空集S而言,考慮其所有子集X和Y上的“≤-關(guān)系”,那么一定存在一個(gè)概率P使得:
X ≤Y當(dāng)且僅當(dāng)P(X)≤P(Y)
并且滿足以下條件:
1.?≤X;
2.并非S ≤?;
3.X ≤Y或者Y ≤X;
4.如果X ≤Y并且Y ≤Z,那么X ≤Z;
5.X ≤Y當(dāng)且僅當(dāng)X ∪Z ≤Y ∪Z,其中Z與X、Y的交集都為空。德菲尼蒂的提議不僅保證了≤的一般屬性4此處的屬性指的是:自反、反對稱以及傳遞。,而且還為“≤-關(guān)系”的解釋提供了一系列必要條件,以此為偏好提升找到了概率化的表示方法。
范·??耍↗.van Eijck)和雷尼(B.Renne)重新開始了關(guān)于德菲尼蒂的研究,并且提出了認(rèn)知“鄰域模型”中的認(rèn)知概率更新邏輯,探討了“信念”算子(該算子可以看作置信度(plausibility)間的“≤-關(guān)系”)的概率化,并將“更相信某個(gè)世界”解釋為“這個(gè)世界出現(xiàn)的概率大于”。([4])在[5]中,他們進(jìn)一步利用“權(quán)重(weight)函數(shù)”為這種解釋方式提供了邏輯模型,將“更相信某個(gè)命題?”解釋為“?出現(xiàn)的權(quán)重比??出現(xiàn)的權(quán)重更高”。從而,他們通過對比狀態(tài)之間的權(quán)重(或者說是概率),將置信度關(guān)系的比較提升到狀態(tài)集合之間。
從2.1 關(guān)于決策論的概述和討論可以看出,效用函數(shù)(期望效用)和期許度函數(shù)實(shí)際上是相同結(jié)構(gòu)的計(jì)算方式。本節(jié)將主要從杰弗里的定義方式出發(fā),只利用唯一的函數(shù)(期許度函數(shù))來探討決策論和偏好提升理論之間的關(guān)系。
借助杰弗里的定義,主體會選擇期許度更高的命題(或者說是行為),亦即,對兩個(gè)命題X和Y來說,如果D(X)≤D(Y),那么X ≤Y。一般而言,X和Y可以看作兩個(gè)集合,它們各自包含了滿足這兩個(gè)命題的所有狀態(tài),或者說是實(shí)施這兩個(gè)行為會導(dǎo)致的兩個(gè)可能結(jié)果集。由此,D(X)和D(Y)都可以看作是借助“D(x)≤D(y)?x ≤y”5該等價(jià)關(guān)系只能用在可能的結(jié)果上,或者更形式地說是用在形如pi 以及qj 的公式上。這個(gè)等價(jià)置換后,利用“偏好值”、概率進(jìn)行求和所計(jì)算出來的結(jié)果。而偏好提升理論和該定義的聯(lián)系與差別主要在于:
第一,偏好提升理論沒有“D(x)≤D(y)?x ≤y”的等價(jià)置換過程,而是直接考慮“x ≤y”這個(gè)關(guān)系從個(gè)體收斂到集合的結(jié)果。這個(gè)“收斂”過程在決策論當(dāng)中是通過求和的形式表示。但是由于偏好提升理論無法對個(gè)體間的關(guān)系進(jìn)行“求和”,這需要它能夠通過其他的規(guī)則(譬如,偏好提升理論的四種基本方式)來表現(xiàn)出此類“求和”的方式。實(shí)質(zhì)上,這四種提升方式無法表示出決策論中的“求和”結(jié)果。這不僅因?yàn)樗鼈儫o法計(jì)算概率,也因?yàn)檫@種計(jì)算方式并不要求對于≤偏好關(guān)系進(jìn)行求和(甚至也無法進(jìn)行求和)。
第二,決策論在求和過程中既涉及到了每個(gè)命題(結(jié)果或者說是狀態(tài))的期許度(或者說是效益),也涉及到了這些命題出現(xiàn)的概率,而在迄今為止的偏好提升理論中,這兩個(gè)部分基本都是分開考量。換句話說,偏好提升理論要么直接考慮每個(gè)命題之間的“≤”偏好關(guān)系,要么通過概率的方式來體現(xiàn)這個(gè)“≤”關(guān)系——更偏好(或者說是更相信一個(gè)狀態(tài))當(dāng)且僅當(dāng)這個(gè)狀態(tài)出現(xiàn)的概率更高。譬如,[4]就利用了這種概率化的定義方式。這也就表明,當(dāng)探討命題集合(或者說是行為)之間的偏好關(guān)系時(shí),偏好提升理論并沒有綜合考慮命題之間的偏好關(guān)系以及這些命題各自出現(xiàn)的概率。
為了貼近決策論的這種綜合考量,本文將在偏好提升理論的基礎(chǔ)上,引入一種“兩兩比較提升法”。
綜合第二節(jié)的討論可以看出,偏好提升理論與決策論匹配間的缺口在于:如何通過定性的方式將“≤-關(guān)系”與概率相結(jié)合。本節(jié)將以兩個(gè)行為6此處的“行為”指的是這兩個(gè)行為所各自導(dǎo)致的所有可能結(jié)果構(gòu)成的兩個(gè)集合。之間的對比為出發(fā)點(diǎn),通過定義一種“兩兩比較提升法”,將兩類可能結(jié)果之間的對比提升到行為之間的比較,從而令主體能夠在這兩個(gè)行為之間做出決策。直觀上,本節(jié)接下來將提供一種較決策論的量化方式而言“更粗糙”7此處的“粗糙”指的是:通過“求和”的計(jì)算方式,任意兩個(gè)行為都可以通過比較數(shù)值大小來確定偏好,但是可能存在一些行為在偏好提升理論當(dāng)中不可比較,但是在決策論中可以比較?;仡櫼援?dāng)中的例子,主體無法直接得出更偏好哪個(gè)行為,卻可以通過給它們不同的效用值以及概率賦值計(jì)算出選擇哪個(gè)行為。而較原有的偏好提升理論而言“更細(xì)致”8此處的“細(xì)致”指的是:可以適用于帶有不確定性的偏好提升(決策情境),將可能結(jié)果之間的比較以及它們出現(xiàn)的概率綜合起來考量。的計(jì)算方式。
定義1(兩兩比較提升法).給定任意兩個(gè)行為所產(chǎn)生的結(jié)果集X和Y,Y比X更被偏好,亦即,X ≤Y當(dāng)且僅當(dāng)如下條件被滿足:
其中,
?P(x)是x出現(xiàn)在X中的概率,而P(y)可以被類似地定義。
直觀上,任取X×Y中的有序?qū)?x,y?,如果“y ≤x”這類關(guān)系出現(xiàn)的概率比“x ≤y”這類關(guān)系出現(xiàn)的概率小,那么主體就會更加偏好Y。此處比較的是X和Y兩個(gè)集合中形如“x ≤y”和“y ≤x”這兩類關(guān)系各自出現(xiàn)的總概率。
例如,集合X={x1,x2}以及Y={y1,y2},它們元素之間的偏好關(guān)系是:x1≤y1,x1≤y2,x2≤y1,且y2≤x2。不妨假定滿足以上關(guān)系的四個(gè)有序?qū)Τ霈F(xiàn)的概率相同,那么借助定義1,主體會更加偏好Y。此處當(dāng)然也可以假定每個(gè)有序?qū)Τ霈F(xiàn)的概率不一樣,它們具體的概率都取決于主體對于每個(gè)狀態(tài)(或者說是結(jié)果)的置信度。
相較于偏好提升理論而言,兩兩比較提升法不再是定性化的關(guān)系提升,而是定量化的概率提升,并且它可以直接運(yùn)用在帶有不確定性的決策情境中。無論是原有的四類基本方式,抑或是偏好提升理論的近期研究,都僅僅關(guān)注個(gè)體關(guān)系上升到總體后的變換,不關(guān)注每個(gè)個(gè)體關(guān)系出現(xiàn)的概率。在實(shí)際的決策情境中,這可能會導(dǎo)致小概率事件決定了最終偏好。舉個(gè)簡單的例子,在比較兩個(gè)集合X和Y時(shí),X中有主體最偏好的元素,但是該元素出現(xiàn)的概率逼近于零,而Y中的任意元素至少和X中的其他元素一樣被偏好。在這種情境下,利用基本方式中的??-法,主體會選擇X;而兩兩提升比較法卻可以同時(shí)將概率納入考量,如果兩個(gè)集合的基數(shù)足夠大,那么主體可能會選擇Y。在結(jié)合概率方面,雖然置信度關(guān)系對“≤-關(guān)系”進(jìn)行了概率化解釋,但是兩兩提升比較在它的基礎(chǔ)上增加了一個(gè)維度——“X ≤Y”并不是僅僅因?yàn)閅出現(xiàn)的概率更高,而是Y中主體更偏好的元素出現(xiàn)的概率更高。
相較于決策論而言,兩兩比較提升法將求和過程分解成以下步驟:
1.考慮兩個(gè)集合中所有元素的可能配對組合;
2.考慮每個(gè)有序?qū)χg的大小關(guān)系,并乘以該有序?qū)Τ霈F(xiàn)的概率;
3.分別計(jì)算出“x ≤y”這類關(guān)系出現(xiàn)的概率總和以及“y ≤x”這類關(guān)系出現(xiàn)的概率總和,再進(jìn)一步進(jìn)行比較。
這三個(gè)步驟中的重點(diǎn)在于第三個(gè)步驟的設(shè)定:此處拋棄了決策論中的等價(jià)置換——“D(x)≤D(y)?x ≤y”,而直接利用元素之間的的可比較關(guān)系,將它們用λ函數(shù)計(jì)算出來:對于任意的兩個(gè)元素x和y而言,如果有x ≤y,那么λx≤y就需要“記錄”這個(gè)關(guān)系(用1 表示),從而通過乘以這對有序?qū)Τ霈F(xiàn)的概率,以此作為“求和”過程中的一部分;反之,λy≤x不需要“記錄”該關(guān)系。因而在最終對比“x ≤y”和“y ≤x”這兩類關(guān)系的概率總和時(shí),λ函數(shù)相當(dāng)于杰弗里的期許度函數(shù)D,只不過λ運(yùn)算不需要精確到x和y的具體數(shù)值。
不過,這種兩兩對比的方式還是無法模擬決策論中的所有計(jì)算。其中比較顯著的的一個(gè)差異在于:決策論對于偏好有兩個(gè)基本設(shè)定,那就是偏好之間的“≤-關(guān)系”是可比較并且傳遞的。但是這種兩兩對比的方式卻會導(dǎo)致以下問題:
命題1.定義1 中的“≤-關(guān)系”可比較但是并不傳遞。
證明.≤關(guān)系的可比較性可以由定義直接得證。以下將通過提供三類反例來說明該關(guān)系的非傳遞性。
?“=-關(guān)系”非傳遞性:假設(shè)X={2},Y={3}且Z={1,4},這些元素之間的偏好關(guān)系是1<2<3<4,并且對任意兩個(gè)集合A和B而言(A和B用來指代X、Y、Z當(dāng)中的任意二者),每個(gè)有序?qū)Τ霈F(xiàn)的概率都是。那么根據(jù)定義1 可以得出:X=Z,Y=Z并且X ?“<-關(guān)系”非傳遞性的第一類例子:假設(shè)X={2,6},Y={1,4,5}且Z={3},這些元素之間的偏好關(guān)系是1<2<3<4<5<6,并且對任意兩個(gè)集合A和B而言,每個(gè)有序?qū)Τ霈F(xiàn)的概率都是。那么根據(jù)定義1 可以得出:Y < X,Z < Y并且X=Z。然而這就與“<”的傳遞性相矛盾。 ?“<-關(guān)系”非傳遞性的第二類例子:假設(shè)X={2,3,7},Y={1,5,6}且Z={4},這些元素之間的偏好關(guān)系是1<2<3<4<5<6<7,并且對任意兩個(gè)集合A和B而言,每個(gè)有序?qū)Τ霈F(xiàn)的概率都是。那么根據(jù)定義1 可以得出:Y 前兩個(gè)反例揭示了“≤-關(guān)系”的非傳遞性。第三個(gè)反例還表明這種定義方式允許存在“<-循環(huán)”。因此,兩兩比較提升法所定義的“≤-關(guān)系”并不傳遞。 在以上反例中,有序?qū)Φ母怕势骄植际菢?gòu)造反例的關(guān)鍵。雖然由此證明了“兩兩比較提升法”并不保證偏好關(guān)系的傳遞性,但是這種不傳遞性在實(shí)際運(yùn)用中并不少見。 接下來簡單介紹這個(gè)方法的一個(gè)應(yīng)用: 例1(“概率悖論”:擲骰子).張三邀請李四玩骰子?,F(xiàn)在桌子上有三個(gè)骰子:A,B以及C,它們分別是: ? A={3,3,5,5,7,7} ? B={2,2,4,4,9,9} ? C={1,1,6,6,8,8} 張三要求李四首先選擇一個(gè)骰子,然后他選擇剩下兩個(gè)當(dāng)中的一個(gè)。在投擲兩個(gè)骰子的過程中,投擲更大數(shù)字的人就是勝利者。那么張三該如何做決策? 在以上決策情境中,無論李四選擇了哪個(gè)骰子,張三都可以有獲勝的策略。這是因?yàn)椋和ㄟ^對任意兩個(gè)骰子之間的點(diǎn)數(shù)以及出現(xiàn)概率的比較,可以推斷出: A 如果李四選擇A,那么張三將選擇C;如果李四選擇B,那么張三將選擇A;如果李四選擇C,那么張三將選擇A。顯然,這三組之間的偏好并不具有傳遞性,而定義1 恰好可以用來解釋這種“概率悖論”。 基于上述對于兩兩比較提升方法的闡釋,本文接下來引入“兩兩比較偏好概率模型”。在設(shè)定它的語言和模型時(shí),本文只考慮單一主體的情況,所以省略了偏好關(guān)系符號中表示主體的下標(biāo)。 定義2(語言:Lpref).給定一個(gè)非空的命題變號集合Prop,Lpref的語言定義如下: 其中,p ∈Prop,并且?、ψ是命題變號或者僅僅是由布爾運(yùn)算構(gòu)成的命題。 在語義上,? ≤ψ表示了公式ψ至少和公式?一樣被偏好。 定義3.偏好概率模型是一個(gè)四元組M=?S,?,V,P?,其中: ?S是一個(gè)非空且可數(shù)的狀態(tài)集; ?V指派給每個(gè)p ∈Prop 一個(gè)S的子集; ?P是從S到[0,1]的一個(gè)概率函數(shù)。 注意:根據(jù)以上P的定義,本文將使用條件概率來表示“給定Z后,P(z)的值”。 定義4.給定Lpref語言中的一個(gè)偏好概率模型,它的可滿足關(guān)系(?)定義如下: 按照以上定義,本文接下來討論該邏輯的一些性質(zhì): 命題2.以下列舉出該邏輯的一些有效式和非有效式: 有效式: ? |=⊥≤?,由定義4 可直接證明。 說明:偏好概率模型保證了任意公式的概率都大于等于0。 ? |=? ≤?,由定義4 可直接證明。 說明:偏好概率模型保證了偏好關(guān)系的自反性。 ? |=? ≤ψ ∨ψ ≤?,由定義1 以及定義4 可證。 說明:偏好概率模型保證了偏好關(guān)系的完全性。 ? |=?<ψ →?(ψ ),由定義4 可直接證明。其中,?<ψ:=(? ≤ψ)∧?(?=ψ),而?=ψ .=(? ≤ψ)∧(ψ ≤?)。 ? |=(? ≤ψ)→(? ∨χ ≤ψ ∨χ),其中∥?∥∩∥χ∥=?且∥ψ∥∩∥χ∥=?。由定義4 以及?-關(guān)系的傳遞性可證。 說明:偏好概率模型保證了偏好關(guān)系概率化后的有窮求和屬性。 ? |=(? ≤ψ)?(? ≤(? ∨ψ)≤ψ)。 證明.易見,該等值式從右往左成立。從左往右的證明如下: 假設(shè)|=(? ≤ψ)。那么由定義4 可知: 現(xiàn)在考慮兩種極端情況: 1.“∥?∥?∥ψ∥,抑或是∥ψ∥?∥?∥”的情況。在這兩類情況中,∥? ∨ψ∥=∥ψ∥或者是∥? ∨ψ∥=∥?∥。由假設(shè)、|=? ≤?以及|=ψ ≤ψ可以得出|=? ≤(? ∨ψ)≤ψ。 2.“∥?∥與∥ψ∥交集為空”的情況。首先證明|=? ≤(? ∨ψ)。由于 同理可證|=(? ∨ψ)≤ψ。 綜上可見,等值式從左往右得證。 說明:偏好概率模型滿足2.1 節(jié)中杰弗里所提出的平均值原則。該條件也可以看作是薩維奇所提出的“確定性原則”的弱化,它不需要區(qū)分行為與狀態(tài),也不需要預(yù)設(shè)二者之間的概率相互獨(dú)立。這也進(jìn)一步說明偏好概率模型保證了——期望效用以及期許度函數(shù)的重要性質(zhì)。 ? |=(? ≤??)→(? ≤?),由有效式6 以及定義4 可證。 說明:結(jié)合下述第一個(gè)非有效式可以看出,偏好概率模型并不要求任意公式出現(xiàn)的概率都要小于等于重言式出現(xiàn)的概率。而有效式7 就給出了一種充分條件——它能夠保證一類公式出現(xiàn)的概率總是小于等于重言式出現(xiàn)的概率。 ? |=(? ≤ψ)∧(χ ≤ψ)→(? ∨χ ≤ψ)。 證明.假設(shè)|=(? ≤ψ)∧(χ ≤ψ)成立。那么由定義4 可知: 在∥?∥?∥ψ∥,或是∥ψ∥?∥?∥,抑或是∥?∥與∥ψ∥交集為空的三種情況下,由(i)和(ii)易見|=? ∨χ ≤ψ成立?,F(xiàn)在考慮∥?∥∩∥ψ∥=X,其中X非空的情況: 進(jìn)而,結(jié)合(i)、(ii)、(iii) 以及(iv) 可以得出。因此,|=? ∨χ ≤ψ成立。 說明:偏好概率模型滿足了一個(gè)新特點(diǎn):對于三個(gè)對象(或者說是公式)而言,假如主體有個(gè)最偏好的對象,那么即使將另外兩個(gè)對象結(jié)合在一起,主體依然會選擇他最偏好的那個(gè)對象。 非有效式: ??? ≤? 證明.假設(shè)模型M 由以下部分組成:S={1,2},?={?1,1?,?1,2?,?2,2?},V(p)={2},并且。那么 進(jìn)而,由定義4 可以得出M,2|=?≤p。 ??(? ≤ψ)∧(ψ ≤χ)→(? ≤χ),由命題1 可證。 說明:偏好概率模型中的偏好關(guān)系并不傳遞。 ??(?? ≤?)→(ψ ≤?)。 證明.假設(shè)模型M 由以下部分組成:S={1,2},?={?1,1?,?1,2?,?2,2?},V(p)={2},V(q)={1}并且。那么,由定義4 易見:M,2|=?p ≤p,然而M,2 ?q ≤p。 ???? →(?(? ∧ψ)<(? ∧ψ))。 證明.假設(shè)模型M 由以下部分組成:S={1,2},?={?1,1?,?1,2?,?2,2?},V(p)={2},V(q)={1}并且。易見,∥p ∧q∥=?,并且∥?(p ∧q)∥={1,2}。因此,由定義4 可以得出:M,2|=?p < p,然而M,2 ??(p ∧q)<(p ∧q)。 ??(⊥<(? ∧?ψ))→(ψ <(? ∨ψ))。 證明.假設(shè)模型M 由以下部分組成:S={1,2},?={?1,1?,?1,2?,?2,2?},V(p)={1},V(q)={2}并且。易見,∥p ∧?q∥={1},并且∥p ∨q∥={1,2}。因此,由定義4 可以得出:M,2|=⊥<(p ∧?q),然而M,2|=q >(p ∨q),亦即M,2 ?q <(p ∨q)。 由此可見,偏好概率邏輯滿足直觀上偏好關(guān)系應(yīng)該具有的大部分性質(zhì),并且也除去了那些顯然不應(yīng)該具有的性質(zhì)。與此同時(shí),這些有效式也滿足德菲尼蒂在邏輯上關(guān)于“≤-關(guān)系”概率化的研究,尤其是其中的第六條吻合了決策論所關(guān)注的重要原則——確定性原則。雖然這種定義方式不能保證傳遞性,但是也不失為一種利用偏好提升理論逼近決策論計(jì)算方式的嘗試。 本文針對引言所提出的兩個(gè)挑戰(zhàn),在第二節(jié)中具體探討了決策論與偏好提升理論之間的聯(lián)系與差異,并通過在第三節(jié)中引入“兩兩比較提升法”,將概率納入偏好提升理論進(jìn)行考量,介紹了其中的λ函數(shù)與概率的結(jié)合,嘗試?yán)枚ㄐ缘姆治龇绞絹肀平鼪Q策論的定量計(jì)算結(jié)果。尤為重要的是,第三節(jié)分析了這種新的定義方式相較于原有偏好提升方式的優(yōu)勢,以及它在何種程度上可以解決決策論的問題,這也包括了它相較于決策論的缺失——偏好關(guān)系沒有傳遞性。除此之外,作為一種初步嘗試,本文還為這種“兩兩比較提升法”提供了邏輯模型,并結(jié)合了決策論與偏好提升理論的研究,討論了該模型的一些重要性質(zhì)。 關(guān)于如何在偏好提升方法或者是邏輯模型中引入概率,邏輯定義方面可以做更多的嘗試。譬如可以基于基本的??-法,考慮以下引入概率的方法: ? 如果?x ∈X ?Y′ ?Y:P(Y′ |Y)>0.5 &?z ∈Y′(x ≤z),那么X ≤Y; ? 如果?Y′ ?Y:P(Y′ |Y)>0.5,那么?x ∈X?y ∈Y′(x ≤y)。 當(dāng)然,針對偏好提升理論的概率化研究,可以引入更多的定義方法,并進(jìn)一步逼近決策論的計(jì)算能力。對比于第三節(jié)所提出的“兩兩比較提升”,這些方法本質(zhì)上都是希望借助對比兩類關(guān)系——“≤-關(guān)系”和“≥-關(guān)系”各自出現(xiàn)的總概率大小,來實(shí)現(xiàn)定性化的概率求和,從而計(jì)算出主體的選擇。以上兩種新的定義方式可以保證偏好關(guān)系之間的傳遞性,其中的一個(gè)重要原因就在于它們都不需要從“兩兩集合之間的概率對比”過渡到“所有集合之間的概率對比”9這種“不同集合間都可以進(jìn)行兩兩對比”與“整個(gè)集合間可以進(jìn)行排序(排除了環(huán)狀)”并不是等價(jià)的概念,從右往左是自然的結(jié)果,但是從左往右存在反例。譬如在第三節(jié)所舉出的三類反例。,而是直接選擇所有集合中的部分集合(譬如出現(xiàn)概率大于0.5 的那些集合)進(jìn)行排序。 總之,本文主要希望通過抽象出決策論計(jì)算方式與偏好提升理論背后的數(shù)學(xué)結(jié)構(gòu),揭示出它們結(jié)構(gòu)上的聯(lián)系,并利用它們二者之間的差異,表明這種研究的必要性以及可能性。在未來的研究中,可以考慮更豐富的定義方式來進(jìn)一步搭建起聯(lián)結(jié)決策論與偏好提升理論的橋梁。以下列舉一些可能的研究課題: ?“兩兩比較提升法”與鄰域語義學(xué)(neighborhood semantics)的結(jié)合。從上述關(guān)于“偏好概率模型”的討論可以看出,⊥和?公式的有效性并不滿足排中律。這就說明滿足這兩個(gè)公式的集合有可能存在重疊,而鄰域語義學(xué)恰好具有這種性質(zhì)。 ? 引入其他的“測量”方式(譬如拓?fù)鋵W(xué)的方式)來進(jìn)行偏好提升理論的定量化研究,從而避免第三節(jié)中概率空間的二元劃分所導(dǎo)致的非傳遞性。 ? 結(jié)合動態(tài)概率邏輯,將決策論中的其中一個(gè)形如“效用值與概率的乘積”的公式作為初始的靜態(tài)概率模型引入,并且將每一步“加法”都轉(zhuǎn)變?yōu)椤俺跏检o態(tài)模型與行為模型的叉乘”,從而分解為逐步求和的計(jì)算。3.2 兩兩比較偏好概率模型
4 結(jié)語