劉洪志 李興珊 李 紓,4 饒儷琳
基于期望值最大化的理論何時失效:風(fēng)險決策中為自己–為所有人決策差異的眼動研究*
劉洪志3李興珊1,2李 紓1,2,4饒儷琳1,2
(1中國科學(xué)院行為科學(xué)重點(diǎn)實(shí)驗(yàn)室, 中國科學(xué)院心理研究所, 北京 100101) (2中國科學(xué)院大學(xué), 北京 100049) (3南開大學(xué)周恩來政府管理學(xué)院社會心理學(xué)系, 天津 300350) (4浙江大學(xué)心理與行為科學(xué)系, 杭州 310028)
主流的風(fēng)險決策理論專家發(fā)展了一系列基于期望值最大化(expectation-maximization)的理論, 以期捕獲所有人的風(fēng)險決策行為。然而大量證據(jù)表明, 這些基于期望值最大化的理論并不能如同描述性理論那樣理想地描述單一個體的決策行為。本研究采用眼動追蹤技術(shù), 系統(tǒng)考察了個體在為所有人決策與為自己決策時的風(fēng)險決策行為及信息加工過程的差異。本研究發(fā)現(xiàn), 基于期望值最大化的理論可捕獲為所有人決策或?yàn)樽约憾啻螞Q策時的情況, 卻不能很好捕獲個體為自己進(jìn)行單次決策時的情況。本研究結(jié)果有助于理解基于期望值最大化的理論與啟發(fā)式/非基于期望值最大化的理論的邊界, 為風(fēng)險決策理論的劃分和發(fā)展提供實(shí)證參考。
風(fēng)險決策, 為所有人決策, 期望值最大化, 為自己–為所有人決策差異, 眼動追蹤技術(shù)
相傳有一個關(guān)于決策理論專家Howard Raiffa的軼事。Raiffa是貝葉斯決策理論的先驅(qū)和決策分析領(lǐng)域的奠基人。1957年, 時任教于哥倫比亞大學(xué)的Raiffa教授收到了來自哈佛大學(xué)的教職邀請。Raiffa猶豫不決, 便向哥倫比亞大學(xué)的系主任尋求建議。諷刺的是, 系主任建議Raiffa應(yīng)根據(jù)他自己所提出的決策分析理論那樣進(jìn)行決策: 分析兩個選項(xiàng)的相關(guān)維度, 賦予各維度以權(quán)重, 再根據(jù)期望值算法計(jì)算出兩選項(xiàng)的總分, 并選擇總分更高的學(xué)校。然而, Raiffa卻回答說: “不, 這是一個嚴(yán)肅的抉擇(No, this is a serious decision)?!?(見Bazerman et al., 1998)。這則軼事提示我們, 為描述所有人的決策行為所發(fā)展出的決策理論不一定適用于描述單一個體的決策。主流的決策理論專家試圖為所有面臨決策的個體提供普適性的最優(yōu)決策方案, 并發(fā)展出了豐富多樣的“加權(quán)求和最大化”的決策理論。然而, 當(dāng)在現(xiàn)實(shí)世界中面臨真實(shí)的決策問題時, 決策者(甚至包括決策理論專家本人)并不愿將這些復(fù)雜的加權(quán)求和理論付諸實(shí)踐。受到Raiffa軼事的啟發(fā), 本研究旨在探索導(dǎo)致期望值最大化的理論失效的內(nèi)在原因。
在風(fēng)險決策領(lǐng)域, 基于期望值最大化(expectation-maximization)理論的發(fā)展史, 便可視為Raiffa軼事的演繹史。主流的風(fēng)險決策理論從未放棄期望值最大化的核心框架, 即假設(shè)在風(fēng)險決策中, 個體會基于概率的權(quán)重函數(shù)對各選項(xiàng)結(jié)果的效用進(jìn)行加權(quán), 并累加所有加權(quán)后的效用值(即獲取期望值), 最終選擇期望值最大的選項(xiàng)(Kahneman & Tversky, 1979; Payne & Braunstein, 1978; Tversky & Kahneman, 1992)。期望價值(expected value, EV)理論(Bernoulli, 1738)、期望效用(expected utility, EU)理論(von Neumann & Morgenstern, 1947)、預(yù)期理論(prospect theory)(Kahneman & Tversky, 1979)等均屬于此類理論, 這些理論均假設(shè)風(fēng)險決策是基于加權(quán)求和的加工過程做出的(Payne & Braunstein, 1978)。
然而, 大量證據(jù)表明主流理論家發(fā)展的基于期望值最大化的理論并不能捕獲個體(甚至如Raiffa一樣的決策專家)的真實(shí)風(fēng)險決策行為。眾多研究表明, 個體在風(fēng)險決策時并未采用基于期望值最大化的理論所假設(shè)的認(rèn)知加工過程, 而是采用基于另一類獨(dú)特理論取向的簡單啟發(fā)式策略進(jìn)行決策(Brandst?tter et al., 2006; Li, 2004, 2016)。這些啟發(fā)式理論假設(shè), 個體在風(fēng)險決策時不必整合選項(xiàng)所有維度的信息以達(dá)成決策。許多啟發(fā)式理論, 如最大值最大啟發(fā)式(maximax heuristic, MH)(Savage, 1951)、齊當(dāng)別(equate-to-differentiate, ETD)抉擇模型(Li, 2004, 2016; Huang et al., 2021)、占優(yōu)啟發(fā)式(priority heuristic)(Brandst?tter et al., 2006)等, 均假設(shè)個體在風(fēng)險決策時首先會識別并比較選項(xiàng)間多個維度(或單一維度)的差異, 并基于關(guān)鍵的單一維度進(jìn)行決策。
主流決策理論家之所以不放棄遵循加權(quán)求和計(jì)算方式的基于期望值最大化的理論, 或是因?yàn)樗麄儚牟粦岩蛇@些理論能夠準(zhǔn)確、理想地捕獲到人們的風(fēng)險決策行為。在發(fā)展基于期望值最大化的各種理論時, 理論家往往試圖發(fā)展出用于計(jì)算最優(yōu)決策方案的數(shù)理模型, 使得該方案適用于所有面臨這一方案的個體(Baron, 1986)。在本研究中, 我們聚焦于這種為所有人決策(decision-for-everyone)的情況, 即為所有面臨該選擇的人提供最優(yōu)方案。此外, 本研究亦關(guān)注多次決策(decision-for-self-multiple-play), 即當(dāng)風(fēng)險選項(xiàng)會被執(zhí)行多次時, 個體的風(fēng)險決策行為(Li, 2003; Su et al., 2013)。本研究認(rèn)為, 與單次為自己決策(decision-for-self-single-play)的情況不同, 基于期望值最大化的理論或許在描述為所有人決策或多次決策時是行得通的。
我們認(rèn)為, 基于期望值最大化的理論可以解釋為所有人決策和多次決策的情況。與多次風(fēng)險決策類似, 在為所有人決策的情境中, 個體需要為所有面臨選擇的人提供最優(yōu)方案, 即意味著所選擇方案將被執(zhí)行多次。根據(jù)大數(shù)定律(law of large numbers), 即在大樣本中, 隨機(jī)事件發(fā)生的相對頻數(shù)可近似于事件發(fā)生的概率(van der Stoep & Seifert, 1994), 因此如果某一風(fēng)險決策的重復(fù)次數(shù)足夠多, 那么其決策結(jié)果會趨近于期望價值(Klos et al., 2005)。由于在為所有人決策和多次決策的情況下, 風(fēng)險決策一旦做出便會被執(zhí)行多次, 因此決策者傾向于將風(fēng)險選項(xiàng)的可能結(jié)果視為可相互補(bǔ)償?shù)? 并考慮選項(xiàng)的過去統(tǒng)計(jì)數(shù)據(jù)和未來的多種機(jī)會, 從而遵循期望值最大化理論所假設(shè)的決策策略。相反, 單次為自己決策的情境無法滿足基于期望值最大化的理論重復(fù)多次的理論需求。因此, 決策者往往傾向于將風(fēng)險選項(xiàng)視為獨(dú)特的(Kahneman & Lovallo, 1993), 并認(rèn)為不同選項(xiàng)的可能結(jié)果不可互相補(bǔ)償(DeKay et al., 2006; DeKay & Kim, 2005), 從而“明智地”忽略其期望值(Kahneman & Lovallo, 1993)。在這種情況下, 個體并不會采用期望策略(即基于期望值最大化的策略), 而更可能采用一些啟發(fā)式策略(Brandst?tter et al., 2006; Li, 2004, 2016)。
現(xiàn)有的行為學(xué)和認(rèn)知神經(jīng)科學(xué)研究一致發(fā)現(xiàn), EV策略已經(jīng)可以較好描述個體的多次風(fēng)險決策情境(Klos et al., 2005; Li, 2003; Rao et al., 2013; Su et al., 2013), 這在一定程度上支持了本研究的推斷(參見:孫紅月等, 2011)。然而, 盡管人們意識到相對于日常生活中為自己決策, 為所有人決策(如政府為所有公民制定應(yīng)對重大公共衛(wèi)生突發(fā)事件的政策、醫(yī)生為所有病人制定標(biāo)準(zhǔn)的治療方案等)其決策質(zhì)量問題更事關(guān)重大、其決策后果所產(chǎn)生的影響力更加深遠(yuǎn), 但至今尚鮮有研究檢驗(yàn)期望策略(即基于期望值最大化的策略)是否可足夠好地描述為所有人做風(fēng)險決策的情境。此外, 缺乏為所有人決策與為自己決策的差異的了解也阻礙我們理解現(xiàn)實(shí)中一些決策沖突發(fā)生的潛在機(jī)理。以醫(yī)療決策為例, 醫(yī)生為眾多患者決策時或采用期望策略以降低“決策噪聲” (Kahneman et al., 2021), 而為自己或家人進(jìn)行醫(yī)療決策時可能采取某些啟發(fā)式策略(Popovic et al., 2019), 這種由于不同決策目標(biāo)、情境所產(chǎn)生的決策差異或可導(dǎo)致醫(yī)患關(guān)系沖突問題。因此, 考察為所有人決策的特點(diǎn)與心理機(jī)制不僅具有理論意義而且具有重要的現(xiàn)實(shí)應(yīng)用價值。
本研究采用組內(nèi)設(shè)計(jì), 檢驗(yàn)了個體在為所有人決策情境和多次決策情境中是否采用與為自己決策情境中相同的決策策略。本研究假設(shè), 個體在為所有人決策和多次決策條件下更可能采用期望策略, 而在為自己單次決策條件下更可能采用啟發(fā)式策略。近年來, 眼動追蹤技術(shù)被成功用于考察決策的認(rèn)知加工過程(Brandst?tter & K?rner, 2014; Liu et al., 2020; Liu et al., 2021; Sui et al., 2020; Zhou et al., 2021; 魏子晗, 李興珊, 2015)。因此, 本研究采用眼動追蹤技術(shù)來比較個體在不同決策任務(wù)中的信息加工過程, 以檢驗(yàn)研究假設(shè)。
本研究構(gòu)建了3個風(fēng)險決策任務(wù): 為所有人決策任務(wù), 多次決策任務(wù)和單次(為自己)決策任務(wù)。引入多次決策任務(wù), 是因?yàn)殍b于眾多研究已經(jīng)驗(yàn)證個體在多次決策任務(wù)中傾向于采用期望策略(Klos et al., 2005; Langer & Weber, 2001; Li, 2003; Sun et al., 2014), 這一任務(wù)可用作對照任務(wù)以幫助鑒別為所有人決策任務(wù)和單次決策任務(wù)中個體是否也采用了期望策略。
期望策略與啟發(fā)式/非期望策略對個體的眼動指標(biāo)有不同的預(yù)測。總的來說, 采用這兩種不同策略會影響個體的整體掃視軌跡模式(Zhou et al., 2016)。具體來說, 采用這兩種策略會從三方面影響個體的信息搜索與加工: 信息加工的深度、復(fù)雜度和方向(Su et al., 2013)。采用期望策略通常需要整合選項(xiàng)的所有可用信息, 采取復(fù)雜的計(jì)算方法, 進(jìn)行基于選項(xiàng)的信息搜索; 而采用啟發(fā)式/非期望策略通常只需要有選擇性地使用選項(xiàng)信息, 采取簡單的定性比較, 進(jìn)行基于維度的信息搜索。因此, 如果為所有人決策任務(wù)和多次決策任務(wù)基于期望策略, 而單次決策任務(wù)基于啟發(fā)式/非期望策略, 那么為所有人決策任務(wù)和多次決策任務(wù)與單次決策任務(wù)在眼動指標(biāo)上將存在差異。據(jù)此, 本研究提出如下假設(shè):
H1: 為所有人決策任務(wù)和多次決策任務(wù)的掃視軌跡模式的相似性應(yīng)高于為所有人決策任務(wù)和單次決策任務(wù)的相似性。
H2: 為所有人決策任務(wù)和多次決策任務(wù)的信息獲取深度和信息加工復(fù)雜度應(yīng)高于單次決策任務(wù), 且比單次決策任務(wù)更多采用基于選項(xiàng)的信息搜索模式。
為明確相關(guān)眼動指標(biāo)在實(shí)驗(yàn)任務(wù)與風(fēng)險決策之間的解釋作用, 本研究進(jìn)一步檢驗(yàn)如下假設(shè):
H3: 眼動指標(biāo)(即信息獲取深度, 信息加工復(fù)雜度和信息搜索方向)可中介決策任務(wù)對個體的選擇是否符合EV預(yù)測(EV-consistent choice)的效應(yīng)。
為進(jìn)一步檢驗(yàn)個體是否采用期望策略或啟發(fā)式/非期望策略, 研究者通常會基于認(rèn)知心理學(xué)中常用的雙分離(double dissociation)邏輯操縱兩個影響因素(Brandst?tter et al., 2006; Rao et al., 2013; 劉洪志等, 2015; 張陽陽等, 2018)。雙分離邏輯指的是: 如果某因素影響任務(wù)A的績效但不影響任務(wù)B, 另一因素影響任務(wù)B的績效但不影響任務(wù)A, 則表明兩任務(wù)包含不同的心理過程(Rao et al., 2013)。本研究關(guān)注的第一個因素是兩選項(xiàng)期望值的差異。有研究發(fā)現(xiàn), 兩選項(xiàng)EV差異越大, 基于期望值最大化的理論預(yù)測的準(zhǔn)確率越高(Brandst?tter et al., 2006, 2008)。本研究關(guān)注的第2個因素是維度差異。有研究發(fā)現(xiàn), 結(jié)果維度的差異可影響啟發(fā)式/非期望策略的選擇行為和認(rèn)知加工過程(Brandst?tter et al., 2006; Rao et al., 2011; Rao et al., 2013; Huang et al., 2021)。因此, 本研究也檢驗(yàn)了如下假設(shè)。
H4: 結(jié)果維度差異的量級(簡稱結(jié)果差異)應(yīng)當(dāng)影響單次決策任務(wù)的信息加工過程(如信息獲取深度), 而選項(xiàng)間EV值差異的量級(簡稱EV差異)不會有此效應(yīng); EV差異應(yīng)當(dāng)影響為所有人決策任務(wù)和多次決策任務(wù)的信息加工過程(如信息加工復(fù)雜度), 而結(jié)果差異不會有此效應(yīng)。
采用G*Power軟件(version 3.1.9.2)(Faul et al., 2007)計(jì)算實(shí)驗(yàn)所需樣本量。設(shè)定統(tǒng)計(jì)檢驗(yàn)力(1 – β)為95%, 效應(yīng)量為Cohen’s= 0.32 (參考Su等人(2013)的研究結(jié)果), 計(jì)算所需樣本量為= 46。實(shí)驗(yàn)共招募52名大學(xué)生被試(男性26人, 平均年齡 = 22.8 ± 3.0周歲)。所有被試視力或矯正視力正常, 且實(shí)驗(yàn)前簽署了知情同意書。實(shí)驗(yàn)結(jié)束后被試獲得120元人民幣的基本報(bào)酬及0~45元與實(shí)驗(yàn)表現(xiàn)相關(guān)的額外獎勵。4名被試的數(shù)據(jù)因眼動追蹤數(shù)據(jù)不完整被刪除, 有效被試48人。
被試的眼動數(shù)據(jù)通過采樣率為1000 Hz的Eye-Link 1000眼動儀(SR Research, Canada)來收集。被試用雙眼觀看實(shí)驗(yàn)刺激, 但只采集右眼的眼動數(shù)據(jù)。實(shí)驗(yàn)刺激呈現(xiàn)于19英寸的CRT顯示器上(刷新率為150 Hz), 其分辨率為1024 × 768。為減小頭動對眼動軌跡的影響, 實(shí)驗(yàn)中采用距離顯示器60 cm的腮托固定被試的頭部。被試雙眼與屏幕邊緣的水平視角為37°, 垂直視角為28°。被試通過用一個微軟SideWinder手柄按鍵來對實(shí)驗(yàn)刺激做出反應(yīng)。
2.3.1 實(shí)驗(yàn)刺激
本研究建構(gòu)了108對各包含兩個金錢結(jié)果的風(fēng)險選項(xiàng)(見補(bǔ)充材料表S1: https://osf.io/yg67b/), 所有選項(xiàng)只涉及金錢獲益。108對選項(xiàng)組成3 (EV差異: 小, 中, 大) × 3 (結(jié)果差異: 小, 中, 大)的實(shí)驗(yàn)設(shè)計(jì), 每種條件包含12對選項(xiàng)。EV差異指的是兩選項(xiàng)之間EV值的差異, 分為3個水平: 兩選項(xiàng)的EV差異為10, 30和60。每個選項(xiàng)包含一個最好可能結(jié)果和一個最差可能結(jié)果。兩選項(xiàng)在最好可能結(jié)果維度的差異分為3個水平: 差異為400, 300和200; 兩選項(xiàng)在最差可能結(jié)果維度的差異固定為100。
實(shí)驗(yàn)采用Brandst?tter和K?rner (2014)的刺激呈現(xiàn)方式, 以保證被試每次只能單獨(dú)注視選項(xiàng)的某一信息, 而無法有效感知到相鄰信息。具體來說, 每個信息(結(jié)果或概率)均被一個邊長為3.50°視角、厚度為0.90°視角的正方形所包圍, 以防止被試的余光識別到其他相鄰信息(Bouma, 1970)。任意相鄰兩信息的中心距離為5.95°視角, 可保證被試在不發(fā)生眼動的情況下只能識別一個條目(Rayner, 2009)。每個選項(xiàng)的結(jié)果信息均呈現(xiàn)在其對應(yīng)概率的左側(cè)(如圖1a所示)。選項(xiàng)的呈現(xiàn)位置已平衡, 即EV值較大的選項(xiàng)一半在上側(cè)一半在下側(cè)。
2.3.2 實(shí)驗(yàn)任務(wù)
本研究構(gòu)建了3個風(fēng)險決策任務(wù): 為所有人決策任務(wù), 多次決策任務(wù)和單次決策任務(wù)。在為所有人決策任務(wù)中, 告知被試從兩選項(xiàng)中選出最優(yōu)選項(xiàng), 假設(shè)其所選擇的選項(xiàng)將成為所有面臨該選擇的人的選擇——即, 每人都接受相同選擇, 但可能面臨不同結(jié)果。在多次決策任務(wù)中, 告知被試選擇自己偏愛的選項(xiàng), 假設(shè)其選擇的選項(xiàng)將被執(zhí)行100次。在單次決策任務(wù)中, 告知被試選擇自己偏愛的選項(xiàng), 假設(shè)其選擇的選項(xiàng)只被執(zhí)行1次。
為進(jìn)一步激勵被試認(rèn)真完成實(shí)驗(yàn)任務(wù), 告知被試他們的額外實(shí)驗(yàn)報(bào)酬將由其在實(shí)驗(yàn)中的表現(xiàn)所決定。在多次決策任務(wù)和單次決策任務(wù)中, 告知被試在實(shí)驗(yàn)結(jié)束后會隨機(jī)選擇一次決策, 用一個后臺程序來確定結(jié)果, 并按照一定比例確定實(shí)驗(yàn)報(bào)酬。在單次決策任務(wù)中, 所選擇選項(xiàng)將被執(zhí)行1次。在多次決策任務(wù)中, 所選擇選項(xiàng)將被執(zhí)行100次, 即被試的某一次選擇將被后臺程序執(zhí)行100次, 并將結(jié)果累加在一個虛擬賬戶中, 其金額越大, 被試在此任務(wù)中的獎勵越多。在為所有人決策任務(wù)中, 告知被試實(shí)驗(yàn)結(jié)束后會根據(jù)他們是否為所有人選擇了最優(yōu)選項(xiàng)來確定其實(shí)驗(yàn)報(bào)酬(并未要求被試選擇EV值大的選項(xiàng))。在實(shí)驗(yàn)開始前, 告知被試所有實(shí)驗(yàn)報(bào)酬需在3個任務(wù)全部完成后才可發(fā)放。
實(shí)驗(yàn)采用被試內(nèi)設(shè)計(jì), 每名被試需完成全部3個實(shí)驗(yàn)任務(wù), 但被試每次來實(shí)驗(yàn)室只完成1個任務(wù), 任意2個實(shí)驗(yàn)任務(wù)的時間間隔不少于3天。任務(wù)順序在被試間進(jìn)行了平衡。三個任務(wù)所采用的實(shí)驗(yàn)刺激在視覺上完全相同(見圖1a)。
2.3.3 實(shí)驗(yàn)程序
在每個實(shí)驗(yàn)任務(wù)開始前先進(jìn)行校準(zhǔn)。實(shí)驗(yàn)采用9點(diǎn)校準(zhǔn)和驗(yàn)證, 最大驗(yàn)證誤差為0.5°視角。在初始校準(zhǔn)后進(jìn)行4個練習(xí)試次, 以幫助被試熟悉實(shí)驗(yàn)刺激的呈現(xiàn)方式及任務(wù)要求。正式實(shí)驗(yàn)包括108試次, 呈現(xiàn)順序在被試間進(jìn)行了平衡。108試次分為3個組塊(block), 每個組塊有36試次。被試在完成每個組塊后可休息1~2分鐘。
在每一試次開始時, 屏幕中央會呈現(xiàn)一個圓形注視點(diǎn)作為漂移校準(zhǔn)。當(dāng)被試注視屏幕中央的注視點(diǎn)時, 可通過按鍵來觸發(fā)呈現(xiàn)選項(xiàng)刺激。然后被試通過另外兩個按鍵進(jìn)行選擇, 按左鍵來選擇屏幕上側(cè)的選項(xiàng)A, 按右鍵來選擇屏幕下側(cè)的選項(xiàng)B。被試的決策時間不受限制, 一旦做出決策后, 選項(xiàng)刺激將消失, 并呈現(xiàn)1000 ms的空白屏, 隨后開始下一試次(詳見圖1)。在實(shí)驗(yàn)過程中不會出現(xiàn)關(guān)于選擇結(jié)果的任何反饋。
圖1 實(shí)驗(yàn)刺激及流程。(a) 實(shí)驗(yàn)刺激呈現(xiàn)方式。 (b) 試次程序及時間。
基于被試的選擇計(jì)算不同決策理論預(yù)測的準(zhǔn)確率。本研究采用的理論模型包括: (1) 3個基于期望值最大化的理論, 包括EV理論(Bernoulli, 1738), EU理論(von Neumann & Morgenstern, 1947)和累積預(yù)期理論(cumulative prospect theory, CPT) (Tversky & Kahneman, 1992), 以及(2) 3個啟發(fā)式/非基于期望值最大化的理論, 包括齊當(dāng)別抉擇模型(Li, 2004, 2016), 最大值最大啟發(fā)式(Brandst?tter et al., 2006; Savage, 1951)和計(jì)數(shù)啟發(fā)式(tallying heuristic, TH) (Gigerenzer, 2004)。以上模型的決策規(guī)則總結(jié)見表1。本研究檢驗(yàn)了以上模型對被試選擇的預(yù)測力。
眼動數(shù)據(jù)采用軟件Eyelink Data Viewer (SR Research, Canada)來分析。注視點(diǎn)(fixation)定義為兩次眼跳之間眼睛位置相對穩(wěn)定的一段時間, 短于50 ms的注視點(diǎn)在數(shù)據(jù)分析時被剔除。將實(shí)驗(yàn)刺激劃為8個互不重疊的等大(5.90° × 5.90°視角)矩形興趣區(qū)(regions of interest, ROIs)。為了檢驗(yàn)研究假設(shè), 本研究分析了掃視路徑模式, 各興趣區(qū)的注視次數(shù), 不同興趣區(qū)之間的眼跳次數(shù), 以及所有興趣區(qū)的平均注視時長。同時, 為檢驗(yàn)被試在三個任務(wù)中的認(rèn)真程度是否相同, 本研究計(jì)算了每個試次的最大瞳孔直徑, 因?yàn)橥状笮】勺鳛榉从硞€體在實(shí)驗(yàn)任務(wù)中認(rèn)真程度的有效指標(biāo)(Hopstaken et al., 2015)。
實(shí)驗(yàn)總計(jì)15552試次, 其中2試次因眼動追蹤失敗而在數(shù)據(jù)分析時被剔除。
以試次中的最大瞳孔直徑為因變量, 以實(shí)驗(yàn)任務(wù)為自變量的單因素重復(fù)測量方差分析發(fā)現(xiàn), 實(shí)驗(yàn)任務(wù)的主效應(yīng)不顯著,(2, 94) = 2.20,= 0.116, 表明被試在三個任務(wù)中的認(rèn)真程度并無顯著差異。
3.1.1 模型預(yù)測
以模型預(yù)測準(zhǔn)確率為因變量, 做3 (任務(wù)) × 6 (模型)的重復(fù)測量ANOVA。結(jié)果發(fā)現(xiàn), 任務(wù)的主效應(yīng)顯著,(2, 94) = 31.30,< 0.001, η2p= 0.40; 模型的主效應(yīng)顯著,(5, 235) = 201.50,< 0.001, η2p= 0.81; 交互作用顯著,(10, 470) = 31.20,< 0.001, η2p= 0.40。事后檢驗(yàn)發(fā)現(xiàn), 對于為所有人決策任務(wù)和多次決策任務(wù), EV、EU和CPT的預(yù)測準(zhǔn)確率顯著高于其他模型(s ≥ 9.07,s < 0.001); 對于單次決策任務(wù), EV、EU、TH、ETD和MH的預(yù)測準(zhǔn)確率均無顯著差異(s ≤ 2.56,s > 0.502), 而CPT的預(yù)測準(zhǔn)確率顯著高于其他模型(s ≥ 5.57,s < 0.001), 見圖2。
3.1.2 決策時間
決策時間(ms)進(jìn)行了自然對數(shù)轉(zhuǎn)換。單因素重復(fù)測量的方差分析表明, 決策任務(wù)的主效應(yīng)顯著,(2, 94) = 5.39,= 0.006, η2p= 0.10。事后檢驗(yàn)發(fā)現(xiàn), 單次決策任務(wù)的決策時間(= 8.75, 95% CI = [8.63, 8.87])短于為所有人決策任務(wù)(= 8.91, 95% CI = [8.79, 9.03],(94) = 2.83,= 0.015)和多次決策任務(wù)(= 8.91, 95% CI = [8.78, 9.04],(94) = 2.86,= 0.014), 但為所有人決策任務(wù)和多次決策任務(wù)的決策時間沒有顯著差異,(94) = 0.02,= 1.000。
模型預(yù)測結(jié)果表明, 基于期望值最大化的理論與啟發(fā)式/非基于期望值最大化的理論在單次決策任務(wù)中的預(yù)測力均表現(xiàn)不夠好。基于期望值最大化的理論(尤其是EV和EU理論)在為所有人決策任務(wù)和多次決策任務(wù)中的預(yù)測力優(yōu)于啟發(fā)式理論(事實(shí)上, 啟發(fā)式理論并未宣稱可預(yù)測人們在為所有人決策任務(wù)和多次決策任務(wù)中的選擇)。這些結(jié)果表明, 相比于單次決策任務(wù), 被試在為所有人決策任務(wù)和多次決策任務(wù)中更可能采用EV或EU理論所假設(shè)的策略。由于期望策略通常比啟發(fā)式/非期望策略需要更長的決策時間(Rao et al., 2011; Su et al., 2013), 本研究關(guān)于決策時間的結(jié)果亦表明相比于單次決策任務(wù), 被試在為所有人決策任務(wù)和多次決策任務(wù)中更可能采用期望策略。此外, 本研究所發(fā)現(xiàn)的單次決策任務(wù)與多次決策任務(wù)模型預(yù)測與決策時間上的差異, 亦重復(fù)了Su等人(2013)研究中所揭示的結(jié)果模式。
表1 六個預(yù)測模型的決策規(guī)則總結(jié)
圖2 在(a)為所有人決策任務(wù), (b)多次決策任務(wù)和(c)單次決策任務(wù)三個任務(wù)中基于期望值最大化的理論與啟發(fā)式/非基于期望值最大化的理論對選擇的預(yù)測準(zhǔn)確率。誤差棒表示均值的標(biāo)準(zhǔn)誤。
為了檢驗(yàn)為所有人決策任務(wù)和多次決策任務(wù)中的掃視路徑模式是否異于單次決策任務(wù)(H1), 本研究采用Zhou等人(2016)介紹的掃視路徑分析法(scanpath analysis)。當(dāng)個體在某一認(rèn)知階段時觀看屏幕, 即可產(chǎn)生一個相對固定的“路徑” (path)。這一路徑往往具有特定模式, 因此稱為“掃視路徑” (scanpath; Noton & Stark, 1971)。掃視路徑分析可為行為決策理論的認(rèn)知加工過程提供更清晰、直接的證據(jù)(Ashby et al., 2016)。通常使用相似性分?jǐn)?shù)來比較風(fēng)險決策中兩個掃視路徑的相似性程度(Zhou et al., 2016), 相似性分?jǐn)?shù)值越大, 意味著兩個掃視路徑越相似。本研究采用基于Needleman-Wunsch (N-W)算法(Needleman & Christian, 1970)的ScanMatch軟件包(Cristino et al., 2010), 來計(jì)算不同掃視路徑之間的相似性分?jǐn)?shù), 設(shè)置參數(shù)為Cristino等(2010)建議的默認(rèn)值。與只考慮注視點(diǎn)序列的傳統(tǒng)字符編輯(string-editing)算法相比, N–W算法可進(jìn)一步考慮注視序列中的注視點(diǎn)時長, 將注視點(diǎn)基于時長進(jìn)行分割, 從而提高注視序列相似性比較的靈敏度, 此外, 這一算法亦可基于刺激的興趣區(qū)進(jìn)行編碼(Zhou et al., 2016)。本研究分別計(jì)算了每個被試的任務(wù)內(nèi)和任務(wù)間相似性分?jǐn)?shù)。
單次決策任務(wù)的任務(wù)內(nèi)相似性分?jǐn)?shù)(= 0.465, 95% CI = [0.454, 0.476])顯著低于為所有人決策任務(wù)(= 0.485, 95% CI = [0.468, 0.502],(47) = 2.66,= 0.011, Cohen’s= 0.38)和多次決策任務(wù)(= 0.484, 95% CI = [0.470, 0.498],(47) = 3.35,= 0.002, Cohen’s= 0.48)的相似性分?jǐn)?shù), 而后兩者沒有顯著差異,(47) = 0.09,= 0.933, Cohen’s= 0.01, 見圖3。該結(jié)果表明, 單次決策任務(wù)的掃視路徑模式的內(nèi)部一致性低于為所有人決策任務(wù)和多次決策任務(wù), 這暗示相比于單次決策任務(wù), 為所有人決策和多次決策任務(wù)的掃視路徑同質(zhì)性更高, 其決策策略更一致。
對于三個決策任務(wù), 任務(wù)內(nèi)相似性分?jǐn)?shù)均高于任務(wù)間相似性分?jǐn)?shù)(s ≥ 5.56,s < 0.001, Cohen’ss ≥ 0.80), 表明被試在三個決策任務(wù)中的掃視路徑模式均存在差異。進(jìn)一步分析發(fā)現(xiàn), 為所有人決策任務(wù)和多次決策任務(wù)的任務(wù)間相似性分?jǐn)?shù)(= 0.454, 95% CI = [0.439, 0.469])高于為所有人決策任務(wù)和單次決策任務(wù)的任務(wù)間相似性分?jǐn)?shù)(= 0.432, 95% CI = [0.417, 0.446],(47) = 3.46,= 0.001, Cohen’s050)以及多次決策任務(wù)和單次決策任務(wù)的任務(wù)間相似性分?jǐn)?shù)(= 0.434, 95% CI = [0.420, 0.449],(47) = 3.53,< 0.001, Cohen’s= 051), 但是后兩個相似性分?jǐn)?shù)沒有顯著差異,(47) = 0.46,= 0.645。該結(jié)果表明, 為所有人決策任務(wù)與多次決策任務(wù)的掃視路徑模式較于單次決策任務(wù)更為相似。
總的來說, 相似性分?jǐn)?shù)的結(jié)果表明, 雖然三個決策任務(wù)的掃視路徑模式各不相同, 但是為所有人決策任務(wù)和多次決策任務(wù)的掃視路徑模式較于單次決策任務(wù)更為相似, 支持了H1。
圖3 三個任務(wù)的任務(wù)內(nèi)與任務(wù)間相似性分?jǐn)?shù)。
注:誤差棒表示均值的標(biāo)準(zhǔn)誤。***< 0.001,**< 0.01,*< 0.05。
為檢驗(yàn)H2, 本研究考察了以下眼動指標(biāo)。(1) 與前人研究一致(Payne & Braunstein, 1978; Su et al., 2013), 本研究用信息搜索比例(percentage of total information searched, PTIS)來測量各任務(wù)的信息獲取深度。(2) 本研究用平均注視時長(mean fixation duration, MFD)來測量決策過程中信息加工的復(fù)雜度。單個注視點(diǎn)的時長會隨著信息加工復(fù)雜度的升高而增大(Velichkovsky et al., 2002)。(3) 本研究用基于選項(xiàng)/基于維度的搜索指數(shù)(search measure index, SMI)和最好結(jié)果間眼跳比例(proportion of the saccades between the two best outcomes, PSTB)來衡量信息搜索方向是基于選項(xiàng)或基于維度的程度(B?ckenholt & Hynan, 1994; Pachur et al., 2013; Su et al., 2013)。SMI越大, 表示基于選項(xiàng)的眼跳模式越占優(yōu)(Liu et al., 2021; Su et al., 2013)。如果被試在風(fēng)險決策中采用期望策略, 那么相比于采用啟發(fā)式/非期望策略, 其PTIS、MFD和SMI值應(yīng)更高, PSTB值應(yīng)更低。
分別以PTIS、MFD、SMI和PSTB為因變量, 構(gòu)建3 (實(shí)驗(yàn)任務(wù)) × 3 (EV差異) × 3 (結(jié)果差異)的重復(fù)測量ANOVA, 結(jié)果如表2所示。
表2 以實(shí)驗(yàn)任務(wù)、EV差異、結(jié)果差異為自變量, 以PTIS、MFD、SMI和PSTB為因變量的方差分析結(jié)果
注: Task表示實(shí)驗(yàn)任務(wù), ED (EV difference)表示EV差異, OD (outcome difference)表示結(jié)果差異。
圖4 眼動指標(biāo)結(jié)果。(a) PTIS指標(biāo)結(jié)果。(b) MFD指標(biāo)結(jié)果。(c) SMI指標(biāo)結(jié)果。(d) PSTB指標(biāo)結(jié)果。
注:誤差棒表示均值的標(biāo)準(zhǔn)誤。***< 0.001,**< 0.01,*< 0.05。
結(jié)果發(fā)現(xiàn), 實(shí)驗(yàn)任務(wù)在4個眼動指標(biāo)上均存在顯著的主效應(yīng)(見表2)。事后檢驗(yàn)發(fā)現(xiàn): (1) 單次決策任務(wù)中的PTIS(= 92.8%, 95% CI = [91.0%, 94.5%])顯著低于多次決策任務(wù)(= 95.6%, 95% CI = [93.8%, 97.3%],(94) = 2.88,= 0.014)和為所有人決策任務(wù)(= 95.3%, 95% CI = [93.7%, 97.1%],(94) = 2.59,= 0.029) (見圖4a); (2) 單次決策任務(wù)中的MFD (= 224 ms, 95% CI = [211, 238] ms)顯著低于多次決策任務(wù)(= 246 ms, 95% CI = [233, 259] ms,(94) = 3.48,= 0.002)和為所有人決策任務(wù)(= 252 ms, 95% CI = [239, 265] ms,(94) = 4.45,< 0.001) (見圖4b); (3) 單次決策任務(wù)中的SMI (= 0.79, 95% CI = [0.55, 1.03])顯著低于多次決策任務(wù)(= 1.17, 95% CI = [0.93, 1.40],(94) = 3.14,= 0.006)和為所有人決策任務(wù)(= 1.26, 95% CI = [1.02, 1.50],(94) = 3.92,< 0.001) (見圖4c); (4)單次決策任務(wù)中的PSTB (= 2.0%, 95% CI = [1.7%, 2.2%])顯著高于多次決策任務(wù)(= 1.5%, 95% CI = [1.3%, 1.8%],(94) = 3.24,= 0.005)和為所有人決策任務(wù)(= 1.4%, 95% CI = [1.2%, 1.7%],(94) = 4.00,< 0.001) (見圖4d)。在以上4個指標(biāo)上, 均未發(fā)現(xiàn)多次決策任務(wù)和為所有人決策任務(wù)存在顯著差異。
ANOVA結(jié)果發(fā)現(xiàn), 實(shí)驗(yàn)任務(wù)與結(jié)果差異在PTIS這一變量上存在顯著交互作用(見表1)。簡單效應(yīng)分析發(fā)現(xiàn), 在單次決策任務(wù)中, 大結(jié)果差異條件下的PTIS顯著低于小結(jié)果差異條件,(277) = 4.04,= 0.002。為所有人決策任務(wù)和多次決策任務(wù)在PTIS指標(biāo)上無顯著差異。本研究在PTIS指標(biāo)上關(guān)于結(jié)果差異只影響單次決策任務(wù)的發(fā)現(xiàn)支持了H4。
ANOVA結(jié)果還發(fā)現(xiàn), 實(shí)驗(yàn)任務(wù)與EV差異在MFD指標(biāo)上存在顯著交互作用(見表1)。簡單效應(yīng)分析發(fā)現(xiàn), 在為所有人決策任務(wù)中, 大EV差異條件下的MFD顯著低于中EV差異條件((281.9) = 7.65,< 0.001)和小EV差異條件((281.9) = 3.28,= 0.031)1與預(yù)期不符的是, 中EV差異條件的MFD顯著大于小EV差異條件。這一結(jié)果可能是由于小EV差異條件的計(jì)算難度低于中EV差異條件。我們猜測, 概率為10% (或金錢結(jié)果為100元)的選項(xiàng)計(jì)算期望價值的難度低于其他概率(或金錢結(jié)果)的選項(xiàng)。事后觀察發(fā)現(xiàn), 小EV差異條件比中EV差異條件包含更多低計(jì)算難度的選項(xiàng)(小EV差異條件有26個選項(xiàng)是低計(jì)算難度, 中EV差異條件有18個選項(xiàng)是低計(jì)算難度)。分析發(fā)現(xiàn), 在控制計(jì)算難度后, 在為所有人決策任務(wù)中小、中EV差異條件的MFD沒有顯著差異(F(1, 47) = 1.79, p = 0.187), 這在一定程度上支持了我們的猜測。。多次決策任務(wù)和單次決策任務(wù)在MFD指標(biāo)上無顯著差異。本研究在MFD指標(biāo)上關(guān)于EV差異只影響為所有人決策任務(wù)的發(fā)現(xiàn)在一定程度上支持了H4。
以上結(jié)果暗示, 相比于多次決策任務(wù)和為所有人決策任務(wù), 被試在單次決策任務(wù)中的信息獲取深度更低, 信息加工復(fù)雜度更低, 更可能采用基于維度的信息搜索模式。這些結(jié)果表明, 個體在單次決策任務(wù)中進(jìn)行風(fēng)險決策時更可能采用了啟發(fā)式/非期望策略進(jìn)行決策, 而在為所有人決策任務(wù)和多次決策任務(wù)中更符合期望策略的加權(quán)求和加工過程。
為檢驗(yàn)H3, 本研究檢驗(yàn)了眼動指標(biāo)是否中介了決策任務(wù)對個體的選擇是否符合EV預(yù)測的效應(yīng)。設(shè)定因變量為選擇是否符合EV預(yù)測(選擇EV較大選項(xiàng)記為1, 否則記為0)。本研究采用SPSS的MEMORE (Montoya & Hayes, 2017)軟件包中的平行多中介變量模型來檢驗(yàn)決策任務(wù)通過一系列平行中介變量進(jìn)而影響個體的選擇是否符合EV預(yù)測的效應(yīng)。這一模型可允許中介變量之間存在相關(guān)性, 且能夠估計(jì)控制其他中介變量的效應(yīng)之后的各中介變量的間接效應(yīng)。由于MEMORE軟件包只允許放入2水平的組內(nèi)條件, 因此本研究構(gòu)建了2個中介分析, 即分別檢驗(yàn)兩類決策任務(wù)(單次決策任務(wù) vs. 為所有人決策任務(wù)/單次決策任務(wù) vs. 多次決策任務(wù))通過上文提到的眼動指標(biāo)對個體的選擇是否符合EV預(yù)測的影響?;?000次bootstrap抽樣生成95%置信區(qū)間(在下文中括號中報(bào)告)。
單次決策任務(wù)vs. 為所有人決策任務(wù)。中介分析結(jié)果如圖5a所示。決策任務(wù)通過以下4個眼動指標(biāo)對個體的選擇是否符合EV預(yù)測的間接效應(yīng)顯著: PTIS (11= 0.008 [0.005, 0.012]), MFD (22= 0.021 [0.013, 0.028]), SMI (33= 0.014 [0.009, 0.018]), 以及PSTB (44= 0.006 [0.004, 0.008])。決策任務(wù)對因變量的總效應(yīng)顯著(= 0.31 [0.29, 0.32],< 0.001), 直接效應(yīng)也顯著(’ = 0.26 [0.24, 0.28],< 0.001), 說明在控制以上中介變量后, 決策任務(wù)仍然能夠解釋因變量的變異(見圖5a)。對各間接效應(yīng)進(jìn)行配對檢驗(yàn)發(fā)現(xiàn), MFD對因變量的貢獻(xiàn)顯著高于PTIS (22?11= 0.013 [0.004, 0.020])和PSTB (22?44= 0.015 [0.007, 0.023]), SMI對因變量的貢獻(xiàn)顯著高于PSTB (33?44= 0.008 [0.002, 0.013])。MFD與SMI的貢獻(xiàn)無顯著差異(33?22= ?0.007 [?0.016, 0.002])。
圖5 中介分析結(jié)果。(a) 決策任務(wù)(單次決策任務(wù) vs. 為所有人決策任務(wù))通過眼動指標(biāo)對個體的選擇是否符合EV預(yù)測的中介效應(yīng)。(b) 決策任務(wù)(單次決策任務(wù)vs. 多次決策任務(wù))通過眼動指標(biāo)對個體的選擇是否符合EV預(yù)測的中介效應(yīng)。***p < 0.001。
單次決策任務(wù)vs.多次決策任務(wù)。中介分析結(jié)果如圖5b所示。決策任務(wù)通過以下4個眼動指標(biāo)對個體的選擇是否符合EV預(yù)測的間接效應(yīng)顯著: PTIS (11= 0.010 [0.006, 0.014]), MFD (22= 0.030 [0.023, 0.036]), SMI (33= 0.012 [0.008, 0.016]), 以及PSTB (44= 0.003 [0.001, 0.005])。決策任務(wù)對因變量的總效應(yīng)顯著(= 0.22 [0.21, 0.24],< 0.001), 直接效應(yīng)也顯著(’ = 0.17 [0.15, 0.19],< 0.001), 說明在控制以上中介變量后, 決策任務(wù)仍然能夠解釋因變量的變異(見圖5b)。對各間接效應(yīng)進(jìn)行配對檢驗(yàn)發(fā)現(xiàn), MFD對因變量的貢獻(xiàn)顯著高于其他三個指標(biāo) (22?11= 0.020 [0.012, 0.028],22?33= 0.018 [0.010, 0.026],22?44= 0.027 [0.020, 0.034]), PTIS和SMI對因變量的貢獻(xiàn)顯著高于PSTB (11?44= 0.007 [0.002, 0.011],33?44= 0.009 [0.004, 0.014])。
與研究假設(shè)一致, 中介分析結(jié)果發(fā)現(xiàn)眼動指標(biāo)能夠中介決策任務(wù)對個體的選擇是否符合EV預(yù)測的效應(yīng)。在4個眼動指標(biāo)中, MFD (反映信息加工復(fù)雜度的指標(biāo))和SMI (反映信息搜索方向的指標(biāo))的中介效應(yīng)最強(qiáng)。相比于單次決策任務(wù), 在多次決策任務(wù)和為所有人決策任務(wù)中, 被試的信息搜索深度和信息加工復(fù)雜度更高、更多采用基于選項(xiàng)的信息搜索模式, 從而導(dǎo)致其更可能選擇EV值較大的選項(xiàng)。
關(guān)于風(fēng)險決策是基于期望策略還是啟發(fā)式/非期望策略的爭論至今尚未完美解決(Pachur et al., 2013)。本研究基于過程檢驗(yàn)的視角, 采用眼動追蹤技術(shù)探索了基于期望值最大化的理論與啟發(fā)式/非基于期望值最大化的理論的邊界。
本研究的行為和眼動分析結(jié)果總結(jié)見圖6。行為結(jié)果揭示, 相比于單次決策任務(wù), 在為所有人決策任務(wù)和多次決策任務(wù)中, 被試的選擇符合EV和EU理論預(yù)測的比例更大, 且需要更長時間進(jìn)行決策。此外, 眼動指標(biāo)結(jié)果揭示: (1)為所有人決策任務(wù)和多次決策任務(wù)的掃視路徑模式更相似, 且顯著不同于單次決策任務(wù); (2)為所有人決策任務(wù)和多次決策任務(wù)的信息獲取深度高于單次決策任務(wù), 且結(jié)果差異大小只影響單次決策任務(wù)中的信息獲取深度; (3)為所有人決策任務(wù)和多次決策任務(wù)的信息加工復(fù)雜度高于單次決策任務(wù), 且EV差異大小只影響為所有人決策任務(wù)的信息加工復(fù)雜度; (4)相比于單次決策任務(wù), 被試在為所有人決策任務(wù)和多次決策任務(wù)中更多采用基于選項(xiàng)的信息搜索模式; (5)眼動指標(biāo)中介了決策任務(wù)對選擇是否符合EV預(yù)測的效應(yīng)??傊? 行為和眼動指標(biāo)結(jié)果均表明, 相比于單次決策任務(wù), 被試在為所有人決策任務(wù)和多次決策任務(wù)中更可能采用期望策略。
圖6 行為和眼動指標(biāo)結(jié)果總結(jié)。
注: 相比于啟發(fā)式理論, 基于期望值最大化的理論預(yù)測個體的選擇符合EV預(yù)測比例更大, 反應(yīng)時更長, 信息獲取深度更高, 信息加工復(fù)雜度更高, 更多采用基于選項(xiàng)的信息搜索方向。
回到前文提到的關(guān)于“為什么主流理論家不放棄基于期望值最大化的理論”這一問題。我們以為, 或許是因?yàn)橛袃蓚€信念支撐著這些理論家對基于期望值最大化的理論不離不棄: 一是為發(fā)展出用于描述所有人的決策理論而誕生的基于期望值最大化的理論確實(shí)能夠描述為所有人決策的情境; 二是理論家默認(rèn)單一個體是包含在所有人中的子集。由此推論, 基于期望值最大化的理論最終當(dāng)可捕獲每個個體的風(fēng)險決策行為。
針對第一個信念, 本研究從過程檢驗(yàn)的視角為期望法則的優(yōu)美公式符合個體為所有人做風(fēng)險決策提供了眼動的支持證據(jù)??紤]到在大數(shù)定律中, “多次”和“多人”的意義相通, 本研究的這一觀點(diǎn)同樣被多次決策任務(wù)中的發(fā)現(xiàn)所支持。而以往眾多或結(jié)果導(dǎo)向或過程導(dǎo)向的研究, 有專注于驗(yàn)證基于期望值最大化的理論可否描述“為自己”的實(shí)際風(fēng)險決策(Brandst?tter & K?rner, 2014; Li, 2004; Pachur et al., 2013; Rao et al., 2013; Sun et al., 2014), 有專注于驗(yàn)證基于期望值最大化的理論可否描述“為他人”的實(shí)際風(fēng)險決策(Beisswanger et al., 2003; Hsee & Weber, 1997; Mengarelli et al., 2014; Polman, 2012), 但尚沒有研究收集“為所有人”決策的證據(jù), 以驗(yàn)證基于期望值最大化的理論可否描述“為所有人”的實(shí)際風(fēng)險決策。本研究發(fā)現(xiàn), 個體在“為所有人”做決策時, 還真像Raiffa教授故事中的系主任所建議的那樣, 會進(jìn)行加權(quán)求和并計(jì)算總分的算計(jì)。
針對第二個信念, 主流理論家會想當(dāng)然地認(rèn)為: 為描述所有人(全集)的決策行為發(fā)展而來的基于期望值最大化的理論也就一定能夠描述包含于所有人中的單個人(子集)的決策行為。然而, 本研究的行為和眼動指標(biāo)結(jié)果首次向世人展現(xiàn): 為自己決策與為所有人決策是不同的。為自己決策是一回事, 為所有人決策是另外一回事。因此, 理論家為所有人發(fā)展出的基于期望值最大化的理論不見得適用于描述單一個體做決策的情況。本研究這首次公布于眾的“所有人–單個人”的差異內(nèi)隱地提示, 基于期望值最大化的理論在為自己決策時行不通的原因可能是, 全集(所有人)和子集(單個人)之間的默認(rèn)兼容性或是不存在的。正是在這最不可能出現(xiàn)裂痕的環(huán)節(jié)上出現(xiàn)了不易察覺的裂縫, 才使得基于期望值最大化的理論“莫名其妙”地失效了。
當(dāng)重新審視帕斯卡和費(fèi)馬提出來的期望價值理論, 本研究發(fā)現(xiàn)有兩點(diǎn)值得讀者深思。第一, 他們發(fā)展EV理論的初衷, 是為賭徒(而非為自己)的賭金分配問題提供一個最優(yōu)方案, 該方案對任何一個面臨該問題的人都適用(Durrett, 2010; Vinod & Reagle, 2004)。與帕斯卡和費(fèi)馬的本意相符, 本研究的行為和眼動結(jié)果揭示, 在多人、多次決策條件下比在為自己決策條件下更符合EV策略, 表明帕斯卡和費(fèi)馬的EV理論確實(shí)能夠捕獲為所有人的風(fēng)險決策。第二, 本研究發(fā)現(xiàn), 在為所有人決策的時候, EV理論已能足夠準(zhǔn)確地預(yù)測人們的風(fēng)險決策(在為所有人決策任務(wù)中, EV理論的預(yù)測準(zhǔn)確率高達(dá)89%), 但是在單次決策任務(wù)中, 尚不能夠準(zhǔn)確地預(yù)測人們的風(fēng)險決策(在單次決策任務(wù)中, EV理論的預(yù)測準(zhǔn)確率僅為58%), 這表明在描述個體為所有人做出的決策時, 簡單的EV理論似乎已經(jīng)足矣。值得指出的是, 雖然在單次決策任務(wù)中, CPT的預(yù)測準(zhǔn)確率(= 72%)顯著高于其他模型, 但是這一預(yù)測力是采用極大化正確率的方法進(jìn)行參數(shù)估計(jì)得出的, 使得該模型在預(yù)測正確率上相較于其他模型具有較大優(yōu)勢, 同時犧牲了模型的簡約性。此外, 也有研究者質(zhì)疑CPT是否屬于期望值最大化的理論, 例如有研究者發(fā)現(xiàn)CPT也可很好地適配由啟發(fā)式模型所生成的決策數(shù)據(jù)模式(Pachur et al., 2017)。
本研究對風(fēng)險決策理論的劃分提出了新的見解。從EV理論誕生之日起, 期望家族理論一直因?yàn)槠錈o法描述個體的實(shí)際風(fēng)險決策(即, 屢屢應(yīng)付不了不能解釋的悖論, 如圣彼得堡悖論、艾勒悖論以及其他新的風(fēng)險決策悖論(Birnbaum, 2008))而被迫不斷修改。傳統(tǒng)的EV理論被修正為EU理論(von Neumann & Morgenstern, 1947), SEU理論(Savage, 1954), 加權(quán)效用模型(Edwards, 1962), 等級相關(guān)效用模型(Quiggin, 1982), 等級和符號相關(guān)效用模型(Luce & Fishburn, 1991), 以及第三代預(yù)期理論(Schmidt et al., 2008), 等等。這種不斷修正的靈魂可反映于Tversky在一封審稿信中的評論: “決策過程中任何明確的選擇法則都可以描述成某個函數(shù)的最大化。因此, 問題不在于選擇過程是否被描述成一個最大化的過程, 而是究竟哪個函數(shù)被最大化了” (Tversky原信見Li, 2016, pp. 68–69)。但是, 這種從未停止的修正反而暗示, 至今還沒有一個基于期望值最大化的理論能夠完美描述個體的實(shí)際風(fēng)險決策行為。由于基于期望值最大化的理論表現(xiàn)不佳, 目前理論界已經(jīng)無奈地把決策理論分為規(guī)范性理論(normative theories)和描述性理論(descriptive theories) (Baron, 2008)兩類。換句話說, 理論家不得不給基于期望值最大化的理論一個規(guī)范性理論的名分卻包容它無法描述個體真實(shí)的風(fēng)險決策行為。與規(guī)范性理論的普遍認(rèn)可的概念有出入, 本研究發(fā)現(xiàn)提示, 作為最簡單、最原始的規(guī)范性理論, EV理論反而不經(jīng)修正其客觀概率和客觀結(jié)果就能夠完美地描述個體為所有人決策時的實(shí)際風(fēng)險決策行為。
或許, 如果要求一個理論能夠描述個體為自己決策時的實(shí)際風(fēng)險決策行為, 當(dāng)下迫切要做的不是繼續(xù)修正基于期望值最大化的理論, 而是從非補(bǔ)償性的、非期望值最大化的角度來發(fā)展、完善啟發(fā)式/非期望的決策理論。
本文通過眼動實(shí)驗(yàn), 考察了個體在為所有人決策任務(wù)、多次決策任務(wù)和單次決策任務(wù)中的行為和眼動指標(biāo), 得到如下結(jié)論: (1) 相比于單次決策任務(wù), 個體在多次決策任務(wù)和為所有人決策任務(wù)中更可能采用EV策略, 其決策時間更長。(2) 就掃視軌跡模式而言, 為所有人決策任務(wù)和多次決策任務(wù)的相似性, 高于為所有人決策任務(wù)和單次決策任務(wù)的相似性。(3) 眼動指標(biāo)可中介決策任務(wù)對個體選擇是否符合EV預(yù)測的效應(yīng)。(4) 結(jié)果差異影響單次決策任務(wù)的信息加工過程, EV差異影響為所有人決策任務(wù)的信息加工過程??傮w結(jié)果表明, 基于期望值最大化的理論可捕獲為所有人決策時的行為, 但不能捕獲為自己決策時的行為。這些發(fā)現(xiàn)揭示了基于期望值最大化的理論與啟發(fā)式/非基于期望值最大化的理論的邊界, 為風(fēng)險決策理論的劃分和發(fā)展提供實(shí)證參考。
Ashby, N. J. S., Johnson, J. G., Krajbich, I., & Wedel, M. (2016). Applications and innovations of eye-movement research in judgment and decision making.(2-3), 96–102.
B?ckenholt, U., & Hynan, L. S. (1994). Caveats on a process-tracing measure and a remedy.(2), 103–117.
Baron, J. (1986). Tradeoffs among reasons for action.(2), 173–195.
Baron, J. (2008).(4th ed.). Cambridge, England: Cambridge University Press.
Bazerman, M. H., Tenbrunsel, A. E., & Wade-Benzoni, K. (1998). Negotiating with yourself and losing: Making decisions with competing internal preferences.(2), 225–241.
Beisswanger, A. H., Stone, E. R., Hupp, J. M., & Allgaier, L. (2003). Risk taking in relationships: Differences in deciding for oneself versus for a friend.(2), 121–135.
Bernoulli, D. (1738). Specimen theoriae novae de mensura sortis [Exposition of a new theory on the measurement of risk]., 175–192.
Birnbaum, M. H. (2008). New tests of cumulative prospect theory and the priority heuristic: Probability-outcome tradeoff with branch splitting.(4), 304–316.
Bouma, H. (1970). Interaction effects in parafoveal letter recognition.(5241), 177–178.
Brandst?tter, E., Gigerenzer, G., & Hertwig, R. (2006). The priority heuristic: Making choices without trade-offs.(2), 409–432.
Brandst?tter, E., Gigerenzer, G., & Hertwig, R. (2008). Risky choice with heuristics: Reply to Birnbaum (2008), Johnson, Schulte-Mecklenbeck, & Willemsen (2008) and Rieger & Wang (2008).(1), 281–289.
Brandst?tter, E., & K?rner, C. (2014). Attention in risky choice., 166–176.
Cristino, F., Mathot, S., Theeuwes, J., & Gilchrist, I. D. (2010). ScanMatch: A novel method for comparing fixation sequences.(3), 692–700.
DeKay, M. L., Hershey, J. C., Spranca, M. D., Ubel, P. A., & Asch, D. A. (2006). Are medical treatments for individuals and groups like single-play and multiple-play gambles?(2), 134–145.
DeKay, M. L., & Kim, T. G. (2005). When things don't add up: The role of perceived fungibility in repeated-play decisions.(9), 667–672.
Durrett, R. (2010).(4th ed.). New York: Cambridge University Press.
Edwards, W. (1962). Subjective probabilities inferred from decisions.(2), 109–135.
Faul, F., Erdfelder, E., Lang, A. G., & Buchner, A. (2007). G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences.(2), 175–191.
Gigerenzer, G. (2004). Fast and frugal heuristics: The tools of bounded rationality. In D. Koehler & N. Harvey (Eds.),(pp. 62–88). Oxford, United Kingdom: Blackwell.
Hopstaken, J. F., van der Linden, D., Bakker, A. B., & Kompier, M. A. (2015). A multifaceted investigation of the link between mental fatigue and task disengagement.(3), 305–315.
Hsee, C. K., & Weber, E. U. (1997). A fundamental prediction error: Self–others discrepancies in risk preference.(1), 45–53.
Huang, Y., Shen, S., Yang, S., Kuang, Y., Li, Y., & Li, S. (2021). Asymmetrical property of the subproportionality of weighting function in prospect theory: Is it real and how can it be achieved?(10), 1928.
Kahneman, D., Sibony, O., & Sunstein, C. R. (2021).. Glasgow, Scotland: William Collins Publishers.
Kahneman, D., & Lovallo, D. (1993). Timid choices and bold forecasts: A cognitive perspective on risk taking.(1), 17–31.
Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of decision under risk.(2), 263–292.
Klos, A., Weber, E. U., & Weber, M. (2005). Investment decisions and time horizon: Risk perception and risk behavior in repeated gambles.(12), 1777–1790.
Langer, T., & Weber, M. (2001). Prospect theory, mental accounting, and differences in aggregated and segregated evaluation of lottery portfolios.(5), 716–733.
Li, S. (2003). The role of expected value illustrated in decision-making under risk: Single-play vs multiple-play.(2), 113–124.
Li, S. (2004). A behavioral choice model when computational ability matters., 147–163.
Li, S. (2016).. Shanghai, China: East China Normal University Press.
Liu, H. Z., Jiang, C. M., Rao, L. L., & Li, S. (2015). Discounting or priority: Which rule dominates the intertemporal choice process?(4), 522–532.
[劉洪志, 江程銘, 饒儷琳, 李紓. (2015). “時間折扣”還是“單維占優(yōu)”?——跨期決策的心理機(jī)制.(4), 522–532.]
Liu, H. Z., Wei, Z. H., & Li, P. (2021). Influence of the manner of information presentation on risky choice., 605206.
Liu, H. Z., Zhou, Y. B., Wei, Z. H., & Jiang, C. M. (2020). The power of last fixation: Biasing simple choices by gaze- contingent manipulation., 103106.
Luce, R. D., & Fishburn, P. C. (1991). Rank-and sign- dependent linear utility models for finite first-order gambles.(1), 29–59.
Mengarelli, F., Moretti, L., Faralla, V., Vindras, P., & Sirigu, A. (2014). Economic decisions for others: An exception to loss aversion law.(1), e85042.
Montoya, A. K., & Hayes, A. F. (2017). Two-condition within- participant statistical mediation analysis: A path-analytic framework.(1), 6–27.
Needleman, S. B., & Wunsch, C. D. (1970). A general method applicable to the search for similarities in the amino acid sequence of two proteins.(3), 443–453.
Noton, D., & Stark, L. (1971). Scanpaths in eye movements during pattern perception., 308–311.
Pachur, T., Hertwig, R., Gigerenzer, G., & Brandst?tter, E. (2013). Testing process predictions of models of risky choice: A quantitative model comparison approach., 646.
Pachur, T., Suter, R. S., & Hertwig, R. (2017). How the twain can meet: Prospect theory and models of heuristics in risky choice., 44–73.
Payne, J. W., & Braunstein, M. L. (1978). Risky choice: An examination of information acquisition behavior.(5), 554–561.
Polman, E. (2012). Self–other decision making and loss aversion.(2), 141–150.
Popovic, N. F., Pachur, T., & Gaissmaier, W. (2019). The gap between medical and monetary choices under risk persists in decisions for others.(4), 388–402.
Quiggin, J. (1982). A theory of anticipated utility.(4), 323–343.
Rao, L. L., Liu, X. N., Li, Q., Zhou, Y., Liang, Z. Y., Sun, H. Y., ... Li, S. (2013). Toward a mental arithmetic process in risky choices.(3), 307–314.
Rao, L. L., Zhou, Y., Xu, L., Liang, Z. Y., Jiang, T., & Li, S. (2011). Are risky choices actually guided by a compensatory process? New insights from fMRI.(3), e14756.
Rayner, K. (2009). Eye movements and attention in reading, scene perception, and visual search.(8), 1457–1506.
Savage, L. J. (1951). The theory of statistical decision.(253), 55–67.
Savage, L. J. (1954).. New York: Wiley.
Schmidt, U., Starmer, C., & Sugden, R. (2008). Third- generation prospect theory.(3), 203–223.
Su, Y., Rao, L. L., Sun, H. Y., Du, X. L., Li, X., & Li, S. (2013). Is making a risky choice based on a weighting and adding process? An eye-tracking investigation.(6), 1765–1780.
Sui, X. Y., Liu, H. Z., & Rao, L. L. (2020). The timing of gaze-contingent decision prompts influences risky choice., 104077.
Sun, H. Y., Rao, L. L., Zhou, K., & Li, S. (2014). Formulating an emergency plan based on expectation-maximization is one thing, but applying it to a single case is another.(7), 785–814.
Sun, H. Y., Su, Y., Zhou, K., & Li, S. (2011). From multiple-play to single-play in risky decision making: Quantitative change or qualitative change?(10), 1417–1425.
[孫紅月, 蘇寅, 周坤, 李紓. (2011). 從風(fēng)險決策中的多次博弈到單次博弈:量變還是質(zhì)變?(10), 1417–1425.]
Tversky, A., & Kahneman, D. (1992). Advances in prospect theory: Cumulative representation of uncertainty.(4), 297–323.
van der Stoep, S. W., & Seifert, C. M. (1994). Problem solving, transfer, and thinking. In P. R. Pintrich, D. R. Brown, & C. E. Weinstein (Eds.),(pp. 27–49). Hillstale, NJ: Erlbaum.
Velichkovsky, B. M., Rothert, A., Kopf, M., Dornh?fer, S. M., & Joos, M. (2002). Towards an express-diagnostics for level of processing and hazard perception.(2), 145–156.
Vinod, H. R. D., & Reagle, D. (2004).. Hoboken, NJ: Wiley.
von Neumann, J., & Morgenstern, O. (1947).. Princeton, NJ: Princeton University Press.
Wei, Z. H., & Li, X. Decision process tracing: Evidence from eye-movement data.(12), 2029–2041.
[魏子晗, 李興珊. (2015). 決策過程的追蹤: 基于眼動的證據(jù).(12), 2029–2041.]
Zhang, Y. Y., Zhou, L., You, X., Li, S., & Liang, Z. Y. (2018). Is intertemporal decision-making based on a temporal discounting process? Evidence from double-dissociation paradigm.(5), 592–608.
[張陽陽, 周蕾, 游旭群, 李紓, 梁竹苑. (2018). 跨期決策是否基于“折扣計(jì)算”: 來自雙分離范式的證據(jù).(5), 592–608.]
Zhou, L., Zhang, Y. Y., Wang, Z. J., Rao, L. L., Wang, W., Li, S., ... Liang, Z. Y. (2016). A scanpath analysis of the risky decision-making process.(2–3), 169–182.
Zhou, Y. B., Li, Q., & Liu, H. Z. (2021). Visual attention and time preference reversals.(4), 1010–1038.
When expectation-maximization-based theories work or do not work: An eye-tracking study of the discrepancy between everyone and every one
LIU Hong-Zhi3, LI Xingshan1,2, LI Shu1,2,4, RAO Li-Lin1,2
(1CAS Key Laboratory of Behavioral Science, Institute of Psychology, Chinese Academy of Sciences, Beijing 100101, China) (2University of Chinese Academy of Sciences, Beijing 100049, China) (3Department of Social Psychology, Zhou Enlai School of Government, Nankai University, Tianjin 300350, China) (4Department of Psychology and Behavioral Sciences, Zhejiang University, Hangzhou 310028, China)
Mainstream theorists in risky decision-making have developed various expectation-maximization-based theories with the ambitious goal of capturing everyone’s choices. However, ample evidence has revealed that these theories could not capture every individual’s (“every one’s”) actual risky choice as descriptive theories. Substantial research has demonstrated that people do not follow the logical process suggested by expectation-maximization-based theories when making risky choices but rather rely on simplifying heuristics. From our perspective, the possible reason why mainstream decision theorists did not abandon the framework of expectation is that these theorists never doubted the validity of the expectation rule as a descriptive rule in describing decision-making under risk. We believe that expectation-maximization-based theories may capture risky choices when individuals make decisions for everyone. However, whether these theories could capture risky choices when individuals make decisions for themselves cannot be taken for granted. We thus used an eye-tracking technique to explore whether a theory for everyone would work well for every one.
A total of 52 college students participated in the experiment. Three risky choice tasks were conducted in the present study: a D-everyone task, a D-multiple task, and a D-single task. In the D-everyone task, participants were asked to choose the more optimal option out of two options under the assumption that their selection would be the final decision for everyone who was facing the same choice—that is, everyone would be subject to the same choice but could receive different outcomes. In the D-multiple task, participants were asked to choose between the two options under the assumption that their selection would be applied a total of 100 times. In the D-single task, participants were asked to choose between the two options under the assumption that their selection would be applied only once to themselves. The participants’ eye movements were recorded while they performed the tasks.
Behavioral results revealed that, compared with the D-single task, participants selected more choices correctly predicted by EV and EU theories, and took a longer time to make a decision in the D-everyone and D-multiple tasks. Furthermore, eye movement measurements revealed the following. (1) The scanpath patterns of the D-everyone task and D-multiple task were similar but different from those of the D-single task. (2) The depth of information acquisition and the level of complexity of information processing in the D-everyone task and D-multiple task was higher than that in the D-single task. (3) The direction of information search in the D-everyone task and D-multiple task was more alternative-based than that in the D-single task. (4) The eye-tracking measures mediated the relationship between the task and the EV-consistent choice. In summary, behavioral and eye movement results supported our hypotheses that participants were likely to follow an expectation strategy in the D-everyone and D-multiple tasks, whereas they were likely to follow a heuristic/non- expectation strategy in the D-single task.
We found that expectation-maximization-based theories could capture the choice of an individual when making decisions for everyone and for self in a multiple-play condition but could not capture the choice of an individual when making decisions for self in a single-play condition. The evidence for the discrepancy between everyone and every one, which was first reported in our study, implied that the possible reason why expectation-maximization-based theories do not work is that a default compatibility between the full set (everyone) and the subset (every one) does not exist. Our findings contribute to an improved understanding of the boundaries of expectation-maximization-based theories and those of heuristic/non-expectation models. Our findings may also shed light on the general issue of the classification of risky decision-making theories.
risky choice, decision for everyone, expectation-maximization, discrepancy between everyone and every one, eye-tracking
2022-01-22
* 國家自然科學(xué)基金項(xiàng)目(71901126), 國家社會科學(xué)基金重大項(xiàng)目(19ZDA358), 教育部人文社會科學(xué)研究青年項(xiàng)目(19YJC190013)和中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(63222045)資助。
饒儷琳, E-mail: raoll@psych.ac.cn
B849: C91