陳汝淇 包亞倩 黃林潔瓊 李興珊
(1 中國(guó)科學(xué)院行為科學(xué)重點(diǎn)實(shí)驗(yàn)室(中國(guó)科學(xué)院心理研究所),北京 100101) (2 中國(guó)科學(xué)院大學(xué)心理學(xué)系,北京 100049)
無(wú)論英文還是中文,詞都是非常重要的語(yǔ)言單位?;旧纤械幕谟⑽牡难蹌?dòng)控制模型,都假定了詞間空格在英語(yǔ)閱讀中的重要作用,即先依據(jù)空格完成詞的切分,再進(jìn)行加工(Reichle et al.,1998)。然而,中文閱讀中沒(méi)有詞間空格,因此這些經(jīng)典的拼音文字閱讀模型無(wú)法推廣到中文閱讀中。具體來(lái)說(shuō),無(wú)詞間空格使中文眼動(dòng)控制模型必須回答兩個(gè)問(wèn)題:第一,詞間無(wú)空格,中文讀者如何識(shí)別詞語(yǔ)?第二,沒(méi)有詞間空格來(lái)幫助引導(dǎo)眼睛移動(dòng)的位置,讀者如何選擇眼跳目標(biāo)(即掃視后眼睛落在哪個(gè)位置)?這些與詞切分有關(guān)的認(rèn)知加工機(jī)制是近年中文閱讀領(lǐng)域的焦點(diǎn)。
詞切分問(wèn)題對(duì)構(gòu)建中文閱讀模型來(lái)說(shuō)是一大挑戰(zhàn)。在閱讀中,在每個(gè)注視點(diǎn)能感知的內(nèi)容非常有限。讀者注視一個(gè)位置時(shí)可以有效加工的信息量叫知覺(jué)廣度(McConkie & Rayner,1976)。中文閱讀中知覺(jué)廣度的范圍是當(dāng)前注視點(diǎn)的漢字(字n),加上注視點(diǎn)左側(cè)一個(gè)漢字(字n-1)和右側(cè)三個(gè)漢字(字n+1、n+2 和n+3)(Inhoff & Liu,1998)。因此,中文讀者必須逐漸移動(dòng)眼睛,才能夠閱讀整個(gè)句子或者整個(gè)篇章。此外,知覺(jué)廣度中包含的詞語(yǔ)個(gè)數(shù)是不確定的,可能是兩個(gè)詞、三個(gè)詞,也可能只包括一個(gè)詞的一部分。對(duì)于這種復(fù)雜的情況,模型能幫助讀者更好地理解閱讀加工過(guò)程。
最近,Li 和Pollatsek(2020)提出了中文閱讀中詞語(yǔ)加工與眼動(dòng)控制的整合模型(Chinese Reading Model,CRM)。該模型充分考慮中文書(shū)寫(xiě)系統(tǒng)的特點(diǎn),基于以往大量實(shí)驗(yàn)研究,采用計(jì)算建模技術(shù),建構(gòu)了模擬中文閱讀認(rèn)知加工過(guò)程以及眼動(dòng)控制機(jī)制的計(jì)算模型。該模型著重解釋了中文讀者在閱讀過(guò)程中如何解決詞切分和眼跳目標(biāo)的選擇等重要問(wèn)題。為了方便讀者更好地理解該模型,本文對(duì)該模型進(jìn)行詳細(xì)介紹,并通過(guò)舉例更進(jìn)一步地分析該模型的特點(diǎn)。
本文首先介紹了詞切分、眼跳目標(biāo)選擇的以往文獻(xiàn),隨后是模型的重要假設(shè)、結(jié)構(gòu)以及實(shí)現(xiàn),最后介紹了模型對(duì)一些重要的中文閱讀眼動(dòng)研究的模擬結(jié)果。在討論中總結(jié)了該模型為了解決詞切分問(wèn)題提出的重要假設(shè)。
即使沒(méi)有明顯的詞邊界信息,中文讀者在閱讀中文時(shí)也沒(méi)有表現(xiàn)出任何困難。一些研究表明,流利的中文讀者通常在一分鐘內(nèi)閱讀400 個(gè)漢字(或260 個(gè)詞),英文讀者和中文讀者閱讀相同內(nèi)容的文本時(shí)所花費(fèi)的時(shí)間是相似的(Liversedge et al.,2016; Sun et al.,1985)。這表明中文讀者在閱讀過(guò)程中有一套非常高效的詞切分機(jī)制。
已有許多研究揭示了中文詞切分的認(rèn)知機(jī)制(Inhoff & Wu,2005; Li et al.,2009; Yen et al.,2012)。本文主要介紹其中的一個(gè)研究。Ma 等人(2014)研究了中文讀者在句子閱讀過(guò)程中如何切分重疊歧義字符串(overlapping ambiguous strings,OAS)。OAS 是一種詞邊界歧義的三字字符串(用ABC 分別表示從左至右的三個(gè)字),中間漢字可以分別與左側(cè)和右側(cè)漢字組成一個(gè)詞(即AB 和BC),比如“學(xué)生活”中“學(xué)生”和“生活”都是詞。在閱讀過(guò)程中,讀者需要決定中間位置的漢字到底屬于哪個(gè)詞。這可能導(dǎo)致兩種切分類型:AB-C 或ABC。Ma 等人正交地操縱了句子語(yǔ)境和詞頻:根據(jù)OAS 之后的句子語(yǔ)境,OAS 應(yīng)被切分為ABC 或A-BC;在OAS 內(nèi),第一個(gè)詞AB 的詞頻高于或低于第二個(gè)詞BC,分別產(chǎn)生高-低或低-高的詞頻條件。因此,基于詞頻的切分與后文語(yǔ)境可能一致或不一致,Ma 等人發(fā)現(xiàn),在一致條件下,讀者對(duì)OAS 區(qū)域的回視比不一致條件的更少。這表明,最初讀者將高詞頻的詞切分出來(lái),隨后再利用語(yǔ)境進(jìn)行整合。
根據(jù)他們的實(shí)驗(yàn)結(jié)果,Ma 等人(2014)認(rèn)為讀者使用兩階段策略來(lái)加工此類句子。第一階段(詞語(yǔ)競(jìng)爭(zhēng)階段):知覺(jué)廣度范圍內(nèi)所有漢字可能組成的詞語(yǔ)都會(huì)被激活,所有激活的詞語(yǔ)競(jìng)爭(zhēng)唯一的勝出者。當(dāng)某個(gè)詞勝出后,詞語(yǔ)被識(shí)別的同時(shí),位置在中間的漢字會(huì)被切分到勝出詞。他們認(rèn)為詞頻等因素作用于這個(gè)階段。第二階段(信息整合階段):讀者會(huì)利用語(yǔ)境等信息檢查最初的詞切分是否正確,如果最初的詞切分與后文句子語(yǔ)境不匹配,讀者需要回視到歧義區(qū)重新切分。CRM 模型主要能模擬詞切分的第一階段,并且采納了這個(gè)階段中存在詞語(yǔ)競(jìng)爭(zhēng)的假設(shè)。
許多研究表明,拼音文字閱讀中讀者在一個(gè)詞上的首次注視位置通常會(huì)落在詞中心偏左的位置,稱為偏好注視位置(preferred viewing location,PVL; Rayner,1979)。這在英文閱讀中是可行的,因?yàn)橛⑽淖x者可以用副中央凹視覺(jué)獲取詞邊界位置,從而將眼睛移動(dòng)至PVL。但是在沒(méi)有詞間空格的情況下,中文讀者如何選擇眼跳落點(diǎn)位置?一些研究表明,中文閱讀的PVL 曲線呈扁平狀,PVL 曲線表示首次注視落在各漢字上的頻率(Tsai &McConkie,2003);后來(lái)的研究發(fā)現(xiàn)PVL 曲線峰值出現(xiàn)在詞首位置(Li et al.,2011; Yan et al.,2010),沒(méi)有研究表明中文閱讀中PVL 曲線峰值會(huì)出現(xiàn)在詞中央,這表明中文讀者不像英文讀者更偏好將眼跳落到詞中央。
為了解釋中文閱讀中眼跳目標(biāo)的選擇,Li 等人(2011)提出了基于加工的策略(processing-based strategy)。根據(jù)這一策略,讀者首先試著在給定注視點(diǎn)上加工盡可能多的信息,然后將眼睛移動(dòng)到未加工的字的位置。一些研究檢驗(yàn)了這個(gè)策略的重要推論。例如,Wei 等人(2013)發(fā)現(xiàn),離開(kāi)高頻詞的眼跳長(zhǎng)度要比離開(kāi)低頻詞時(shí)更長(zhǎng)。基于加工的策略推測(cè),一個(gè)注視點(diǎn)上能加工的右側(cè)字個(gè)數(shù)越多,眼跳長(zhǎng)度就會(huì)越長(zhǎng),讀者對(duì)高頻詞的加工效率往往較高。Wei 等人的實(shí)驗(yàn)驗(yàn)證了這一策略,當(dāng)中央凹為高頻詞時(shí),相對(duì)于中央凹為低頻詞,讀者將有更多的認(rèn)知資源用于加工右側(cè)的信息,因此眼跳長(zhǎng)度更長(zhǎng)。
此外,根據(jù)基于加工的策略,既然眼跳長(zhǎng)度取決于右側(cè)文本被加工的程度,那么當(dāng)讀者不能加工右側(cè)的字時(shí),中央凹的詞頻對(duì)眼跳長(zhǎng)度的影響將消失。Liu 等人(2015)的研究驗(yàn)證了這一點(diǎn)。他們讓中文讀者閱讀嵌入了高頻或低頻目標(biāo)詞的句子。其中,在有效預(yù)視條件下,讀者自然閱讀句子;而在無(wú)效預(yù)視條件下,注視點(diǎn)右側(cè)的每個(gè)漢字都被掩蔽符號(hào)“※”替代,直到眼睛跨過(guò)隱形邊界后才顯示正常漢字,因此在無(wú)效預(yù)視條件下讀者看不到目標(biāo)詞右側(cè)的漢字。研究結(jié)果表明,當(dāng)限制副中央凹的加工時(shí),詞頻對(duì)眼跳長(zhǎng)度的影響減小。
總之,這兩項(xiàng)研究結(jié)果表明,在注視點(diǎn)右側(cè)加工的漢字越多(從注視點(diǎn)的字開(kāi)始計(jì)算),眼跳長(zhǎng)度就會(huì)越長(zhǎng),因此簡(jiǎn)單的詞會(huì)被快速加工并有更長(zhǎng)的眼跳長(zhǎng)度。但如果副中央凹視覺(jué)加工被阻礙,高頻詞和低頻詞之間的眼跳長(zhǎng)度不會(huì)有顯著差異。
CRM 模型的一個(gè)重要假設(shè)為詞語(yǔ)加工和眼動(dòng)控制兩個(gè)系統(tǒng)互相影響。因此該模型有兩個(gè)模塊:詞語(yǔ)加工模塊和眼動(dòng)控制模塊。兩個(gè)模塊功能相對(duì)獨(dú)立,但通過(guò)實(shí)時(shí)通信互相影響。將詞語(yǔ)加工和眼動(dòng)控制整合在一個(gè)模型中,可以幫助理解詞語(yǔ)加工和眼動(dòng)控制之間復(fù)雜的交互作用。
CRM 的另一個(gè)重要假設(shè)是采納了交互激活模型(Interactive Activation Model,IAM; McClelland &Rumelhart,1981)模擬詞語(yǔ)加工過(guò)程。IAM 在認(rèn)知心理學(xué)研究中極具影響力,已被廣泛用于解釋視覺(jué)文字加工(McClelland & Rumelhart,1981)、出聲閱讀(Coltheart et al.,2001)、眼動(dòng)控制(Reilly &Radach,2006; Snell et al.,2018) 和語(yǔ)音知覺(jué)(McClelland & Elman,1986)等認(rèn)知活動(dòng)。針對(duì)中文閱讀的特性,CRM 模型提出了一些新的假設(shè),以確保IAM 可以解釋中文句子閱讀中的詞語(yǔ)加工過(guò)程。
首先,中文詞之間沒(méi)有空格,無(wú)法通過(guò)低級(jí)視覺(jué)信息獲取詞邊界信息,因此模型需要進(jìn)行詞切分。模型的輸入是漢字序列,其中包含的詞語(yǔ)個(gè)數(shù)和詞語(yǔ)長(zhǎng)度在識(shí)別之前是未知的。為了解決這些問(wèn)題,CRM 模型假設(shè)詞語(yǔ)加工和詞切分是一個(gè)統(tǒng)一的過(guò)程。模型平行加工知覺(jué)廣度范圍內(nèi)的所有漢字,并激活由這些漢字組成的所有可能的詞。相互重疊的詞會(huì)互相競(jìng)爭(zhēng)。一旦一個(gè)詞在競(jìng)爭(zhēng)中勝出,它就被識(shí)別出來(lái),并確定其首尾位置,從而將其從漢字串中切分出來(lái)。
其次,中文有超過(guò)5000 個(gè)常用漢字,且這些漢字相對(duì)于英文字符來(lái)說(shuō)結(jié)構(gòu)更復(fù)雜。IAM 模型中,英文的字母由每個(gè)位置上的特征探測(cè)器識(shí)別,而在CRM 模型中,對(duì)漢字的識(shí)別通過(guò)與漢字模版進(jìn)行匹配來(lái)實(shí)現(xiàn),即將輸入的漢字圖像與漢字模版進(jìn)行相似性比較,并將漢字圖像識(shí)別為與它最匹配的模版。
第三部分的假設(shè)與眼動(dòng)控制有關(guān)。之前的研究表明眼睛何時(shí)移動(dòng)和向何處移動(dòng)的決定往往是獨(dú)立進(jìn)行的(Rayner & McConkie,1976; Rayner &Pollatsek,1981),CRM 模型也做出相同的假設(shè)。模型假設(shè)兩種眼動(dòng)控制機(jī)制共同決定了眼睛何時(shí)移動(dòng)。首先,當(dāng)前注視詞的加工情況影響了眼睛移動(dòng)的時(shí)間。對(duì)注視詞已經(jīng)加工的程度越深,啟動(dòng)眼動(dòng)所需的時(shí)間就越短。其次,眼動(dòng)機(jī)制中還存在自主控制成分,即使在一個(gè)注視點(diǎn)上沒(méi)有加工任何信息,一段時(shí)間后眼睛也會(huì)移動(dòng)。
至于向何處移動(dòng)眼睛,該模型采用基于加工的策略(Li et al.,2011; Wei et al.,2013)來(lái)模擬眼跳目標(biāo)的選擇。根據(jù)這個(gè)策略,中文讀者會(huì)先估算在一個(gè)注視點(diǎn)上能夠加工多少漢字,然后把眼睛移動(dòng)到這些漢字之后。
模型主要包括兩個(gè)模塊:詞語(yǔ)加工模塊和眼動(dòng)控制模塊(見(jiàn)圖1)。詞語(yǔ)加工模塊識(shí)別和切分知覺(jué)廣度范圍內(nèi)的詞,眼動(dòng)控制模塊決定眼睛移動(dòng)的時(shí)間和位置。兩個(gè)模塊實(shí)時(shí)互動(dòng),而非獨(dú)立運(yùn)作。詞語(yǔ)加工模塊向眼動(dòng)控制模塊提供詞語(yǔ)加工和漢字加工情況的實(shí)時(shí)信息,使它可以決定眼睛的移動(dòng)時(shí)間和位置。眼動(dòng)控制模塊向詞語(yǔ)加工模塊提供眼動(dòng)信號(hào),詞語(yǔ)加工模塊一旦收到眼動(dòng)指令,知覺(jué)廣度范圍便移動(dòng)到由眼動(dòng)控制模塊指定的新位置上。
圖1 模型結(jié)構(gòu)示意圖(Li & Pollatsek,2020)
3.2.1 詞語(yǔ)加工模塊
詞語(yǔ)加工模塊采納了交互激活模型的結(jié)構(gòu)。該模塊包含三個(gè)加工層級(jí),分別為視覺(jué)層、漢字層、詞語(yǔ)層。每個(gè)層級(jí)設(shè)置有許多單元(unit)。不同層級(jí)的單元代表不同意義,如,詞語(yǔ)層的每個(gè)單元代表一個(gè)詞,漢字層的每個(gè)單元代表一個(gè)漢字。每個(gè)單元都有激活值,對(duì)應(yīng)于該單元出現(xiàn)在特定位置的可能性。不同層級(jí)單元之間、各個(gè)層級(jí)內(nèi)部都設(shè)有鏈接(link)。鏈接分為前饋、反饋鏈接,同時(shí)又分為興奮性或抑制性鏈接。興奮性鏈接是指一個(gè)單元的激活會(huì)增加另一個(gè)單元的激活值;抑制性鏈接是指一個(gè)單元的激活會(huì)降低另一個(gè)單元的激活值。在三個(gè)層級(jí)中,編碼方式具有位置特異性:在詞語(yǔ)加工模塊中有很多插槽(slot),每個(gè)插槽對(duì)應(yīng)文本中一個(gè)漢字的位置。在每個(gè)插槽中都有一個(gè)視覺(jué)單元、一組漢字單元和一組詞語(yǔ)單元。插槽中的視覺(jué)單元和漢字單元只接收來(lái)自同一位置的輸入。
模型假定詞語(yǔ)加工模塊在每個(gè)注視點(diǎn)上的視覺(jué)輸入為五個(gè)漢字,即注視點(diǎn)附近的知覺(jué)廣度范圍內(nèi)。盡管每個(gè)注視點(diǎn)的視覺(jué)輸入包含五個(gè)漢字,但詞語(yǔ)加工模塊中正在加工的字?jǐn)?shù)是動(dòng)態(tài)變化的。隨著眼睛移動(dòng),新的眼跳落點(diǎn)位置所對(duì)應(yīng)的知覺(jué)廣度范圍內(nèi)的漢字會(huì)進(jìn)入詞語(yǔ)加工模塊。當(dāng)一個(gè)詞語(yǔ)被識(shí)別了,它的所有漢字就會(huì)從詞語(yǔ)加工模塊中被移除。同時(shí),如果在之前的注視點(diǎn)上對(duì)n-1 到n+3 范圍內(nèi)的一些漢字已經(jīng)進(jìn)行了加工,那么在新注視點(diǎn)上將不再對(duì)其進(jìn)行加工。因此,很多注視點(diǎn)上詞語(yǔ)加工是從位置n開(kāi)始的,而不是n-1 位置,因?yàn)檫@個(gè)位置上的詞已經(jīng)在上一個(gè)注視點(diǎn)上完成了加工。
(1)網(wǎng)絡(luò)更新
模型中各單元的激活是不斷更新的,不同層級(jí)內(nèi)的單元以相似的方式更新,與原始交互激活模型所使用的方式相似。在一個(gè)給定的時(shí)間點(diǎn),一個(gè)單元收集與之相連的其他單元的所有輸入,然后計(jì)算所有輸入的加權(quán)總和,以低級(jí)到高級(jí)的順序更新激活值。
在計(jì)算單元的更新時(shí),模型用公式1 計(jì)算單元的輸入。其中ni(t)是網(wǎng)絡(luò)在給定時(shí)間t的輸入,wij是和另一個(gè)單元j(單元激活為aj(t)) 的鏈接權(quán)重,當(dāng)鏈接為興奮性鏈接時(shí)wij為正值,當(dāng)鏈接為抑制性鏈接時(shí)wij為負(fù)值。不同的鏈接的權(quán)重是不同的,將在后文介紹。free1 用于為詞語(yǔ)單元和眼跳單元添加額外的輸入(后文介紹),而對(duì)于其他單元(如漢字層的單元),free1 的值被設(shè)置為0。
公式2 將一個(gè)單元的輸入(公式1 計(jì)算得到的值)“壓縮”為一個(gè)值,以使單元激活值落在0 到1 的范圍內(nèi)。
在公式2 中,ai(t)表示一個(gè)單元在時(shí)間t的激活值。利用公式3 更新單元在時(shí)間t+Δt時(shí)的激活ai(t+Δt),表示使用公式2 進(jìn)行壓縮后的單元凈激活輸入。
使用公式4 將單元的激活保持在0 到1 之間。
(2)漢字層
每個(gè)插槽中有一組完整的漢字單元。每個(gè)漢字單元只從相同插槽的視覺(jué)單元獲取前饋輸入。從視覺(jué)單元到漢字單元(插槽i的第j個(gè)單元)的輸入見(jiàn)公式5。
在公式5 中,similarityij代表輸入圖像與該漢字單元代表的漢字模版之間的相似性,是一個(gè)自由參數(shù),調(diào)節(jié)視覺(jué)單元到相同位置的漢字單元j之間的鏈接權(quán)重(全部自由參數(shù)見(jiàn)表1)。相似度等于輸入圖像和模版之間具有相同灰度的像素個(gè)數(shù)與圖像中所有像素個(gè)數(shù)的比值。模型的詞典中一共有5692 個(gè)漢字,然而,為了簡(jiǎn)潔,模型設(shè)置只有相似分?jǐn)?shù)高于一定水平(0.5)的漢字才會(huì)被激活。
此外,模型還考慮了視覺(jué)離心率對(duì)詞語(yǔ)加工的影響。離注視點(diǎn)越近感知的效率會(huì)越高,離注視點(diǎn)越遠(yuǎn)感知的效率相應(yīng)降低。實(shí)現(xiàn)方法如下:從視覺(jué)層到漢字單元的輸入受到視覺(jué)離心率的影響。模型使用了一個(gè)以注視點(diǎn)為中心的高斯函數(shù),模擬了視敏度的影響如何隨距離變化;eccentricityi代表眼睛注視第fix個(gè)漢字時(shí)第i個(gè)插槽處視敏度的影響,由公式6 確定。
圖2 注視詞為低頻詞和高頻詞時(shí)eccentricity 與漢字位置的關(guān)系
在給定的插槽上,同一個(gè)插槽中的漢字單元之間是抑制性鏈接,其權(quán)重為inh_character_character(模型中權(quán)重信息如何被納入計(jì)算詳見(jiàn)公式1)。這使得同一個(gè)位置上的漢字單元之間相互競(jìng)爭(zhēng),最后只有一個(gè)漢字單元可以贏得競(jìng)爭(zhēng)。不同插槽位置上的漢字單元之間不存在鏈接。
(3)詞語(yǔ)層
由于中文閱讀中沒(méi)有詞間空格,因此在詞語(yǔ)識(shí)別之前,既不知道詞長(zhǎng)信息也不知道詞邊界信息。為了解決這一問(wèn)題,該模型假設(shè)每個(gè)插槽上有一組詞語(yǔ)單元,每個(gè)詞的第一個(gè)漢字都在這個(gè)插槽上。因此,詞語(yǔ)單元也是位置特異性的。一個(gè)詞語(yǔ)單元可以占用多個(gè)插槽(假如它代表一個(gè)多字詞),且占用插槽數(shù)與其字?jǐn)?shù)相等。詞語(yǔ)加工模塊中,很多詞語(yǔ)單元在空間上重疊(即,如果兩個(gè)詞語(yǔ)單元占據(jù)同一個(gè)插槽,那么它們?cè)诳臻g上重疊)??臻g上重疊的詞語(yǔ)互相競(jìng)爭(zhēng)唯一勝出者。當(dāng)詞語(yǔ)單元的激活超過(guò)閾限值詞就被識(shí)別出來(lái)了,也就同時(shí)被成功切分出來(lái)。
下面采用一個(gè)例子說(shuō)明詞切分的具體過(guò)程(見(jiàn)圖3)。如果詞語(yǔ)單元和漢字單元在空間上重疊(不管是否在同一個(gè)插槽),那么詞語(yǔ)單元將接收漢字單元的前饋鏈接。這些詞可以從不同的位置開(kāi)始,長(zhǎng)度也可以不同。比如說(shuō),如果“大”字出現(xiàn)在插槽n,它就會(huì)激活所有的在插槽n上有“大”字的詞語(yǔ)單元(“博大”、“大兵”和“大學(xué)”等)。
圖3 詞語(yǔ)加工模塊交互激活示例
模型中的鏈接使得字與詞的加工相交互。從字到詞層級(jí)可以是抑制性或興奮性鏈接。假如一個(gè)詞包含這個(gè)字且位置正確,那么漢字到詞語(yǔ)單元為興奮性鏈接(權(quán)重為,即漢字單元的激活增加詞語(yǔ)單元的激活值,且漢字激活越高,它對(duì)詞語(yǔ)單元的輸入越大。否則,前饋鏈接為抑制性(權(quán)重為即漢字的激活降低詞語(yǔ)單元的激活值,且它的激活值越高,對(duì)詞語(yǔ)單元的抑制就越大。除了前饋鏈接,還有從詞語(yǔ)到漢字單元的反饋鏈接。如果一個(gè)詞語(yǔ)在適當(dāng)?shù)奈恢冒摑h字,那么從詞語(yǔ)到漢字單元為興奮性鏈接(權(quán)重是character),例如,“博大”對(duì)“大”有興奮性的反饋鏈接,促進(jìn)它的加工。這個(gè)從詞語(yǔ)層到漢字層的鏈接可以用來(lái)解釋以往研究發(fā)現(xiàn)的詞優(yōu)效應(yīng),即當(dāng)一個(gè)字出現(xiàn)在詞語(yǔ)中時(shí),被試識(shí)別該字比 它單 獨(dú) 出 現(xiàn) 時(shí)更 快(申 薇,李 興 珊,2012)。
在詞語(yǔ)層中,空間上重疊的兩個(gè)詞單元之間就會(huì)有抑制性鏈接(權(quán)重為如,由于位置重疊“大學(xué)”和“大兵”之間有著抑制性的鏈接,而“大學(xué)”和“生活”沒(méi)有位置重疊,就不會(huì)競(jìng)爭(zhēng)而是被平行地識(shí)別加工。這些鏈接使空間重疊的詞語(yǔ)相互競(jìng)爭(zhēng),最后只有一個(gè)詞勝出。比如,由于“大兵”和“博大”只受到了漢字層“大”的支持,而“大學(xué)”受到“大”“學(xué)”兩個(gè)字的支持,因此這兩個(gè)詞在早期被激活,而到后期就會(huì)被“大學(xué)”所抑制。最后只有“大學(xué)”取得勝利,由于已知詞的開(kāi)始位置以及詞長(zhǎng),這個(gè)詞同時(shí)完成了詞切分。所以詞切分和詞激活是一個(gè)統(tǒng)一的、不可分的過(guò)程。
(4)詞頻的影響
CRM 模型通過(guò)設(shè)置詞語(yǔ)單元激活公式的常數(shù)項(xiàng)來(lái)模擬詞頻效應(yīng)。對(duì)于詞語(yǔ)單元,模型將公式1中的free1 變量設(shè)置為公式8 所示的頻率縮放變量(frequency scaling variable,CFSi)。公 式8 中,frequencyi表示詞語(yǔ)單元i的詞頻,4.0251 是當(dāng)前模型使用的詞里最大對(duì)數(shù)頻率,frequency_gain是調(diào)節(jié)詞頻對(duì)詞語(yǔ)加工影響程度的自由參數(shù)。CFSi越大則一個(gè)單元激活的速度越快。通過(guò)這個(gè)設(shè)置保證了高頻詞語(yǔ)加工的時(shí)間更快。
(5)預(yù)測(cè)性影響
模型通過(guò)增加相應(yīng)詞語(yǔ)單元的激活來(lái)實(shí)現(xiàn)詞語(yǔ)預(yù)測(cè)性效應(yīng)。詞語(yǔ)單元的激活增加了公式9 所描述的值,其中predictabilityi是詞語(yǔ)i在語(yǔ)境約束下的預(yù)測(cè)性,是一個(gè)自由參數(shù)。為簡(jiǎn)單起見(jiàn),模型假設(shè),只有收到漢字層輸入的詞語(yǔ)才被激活。因此,只有語(yǔ)境預(yù)測(cè)但沒(méi)有漢字層支持的詞語(yǔ)不被激活。此外,因?yàn)樽x者一般會(huì)用他們讀過(guò)的所有詞來(lái)預(yù)測(cè)下一個(gè)詞,模型假設(shè),只有在插槽n的激活值(激活程度最高的詞語(yǔ)單元的值)超過(guò)閾限時(shí)(模擬中為0.3),預(yù)測(cè)性才影響詞n+1 的激活。通過(guò)這一公式,模型實(shí)現(xiàn)了高預(yù)測(cè)性的詞激活程度也越高,從而可以被更快地識(shí)別。
3.2.2 眼動(dòng)控制模塊
眼動(dòng)控制模塊主要控制眼睛移動(dòng)的時(shí)間和位置。包含眼跳單元、注視詞單元、漢字激活地圖、眼跳目標(biāo)選擇以及眼跳執(zhí)行單元。
(1)眼睛移動(dòng)時(shí)間控制
在眼動(dòng)控制模塊中,注視詞單元(fixated-word unit)和眼跳單元(saccade unit)決定了何時(shí)眼動(dòng)。在當(dāng)前的模型中,注視詞的激活強(qiáng)度是眼睛何時(shí)移動(dòng)的決定性因素。模型采用注視詞單元表示當(dāng)前注視詞的加工進(jìn)度。這個(gè)單元的激活強(qiáng)度等于當(dāng)前插槽上激活值最高的詞語(yǔ)單元的激活強(qiáng)度。模型假設(shè)眼跳單元控制了眼睛何時(shí)移動(dòng)。眼跳單元接受注視詞單元的激活型鏈接(權(quán)重為在注視的時(shí)候,眼跳單元的激活持續(xù)累積,達(dá)到閾限值就會(huì)觸發(fā)眼跳。而在眼睛移動(dòng)時(shí),眼跳單元的激活恢復(fù)為0。
眼跳單元的激活公式中除了來(lái)自注視詞單元的輸入,還包括一個(gè)大于零的常量(free1 變量設(shè)置為自由參數(shù)因此,即使注視詞單元的激活為零,眼跳單元的激活仍然會(huì)增加。在公式1 中加入這個(gè)參數(shù),就為眼動(dòng)控制模塊引入了一個(gè)自動(dòng)控制成分,即使沒(méi)有感知到任何信息,眼睛也會(huì)在一段時(shí)間后移動(dòng)。
需要注意的是,雖然注視詞單元的激活會(huì)影響眼睛何時(shí)移動(dòng),但眼睛實(shí)際移動(dòng)的時(shí)間并不一定與注視詞語(yǔ)的識(shí)別時(shí)間完全相同。眼跳單元的激活決定了眼睛何時(shí)移動(dòng)(達(dá)到閾限值時(shí)立即觸發(fā)眼動(dòng)),而注視詞單元的激活只能通過(guò)影響眼跳單元的激活來(lái)間接影響眼睛的移動(dòng)時(shí)間。因此,眼睛的移動(dòng)并不能完全與詞語(yǔ)的識(shí)別時(shí)間保持一致,眼睛可能在注視詞被識(shí)別之前或之后移動(dòng),這取決于眼跳單元的激活情況。
(2)眼跳目標(biāo)的選擇
在眼動(dòng)控制模塊中,漢字激活地圖(character activation map)和眼跳目標(biāo)單元(saccade target unit)決定了向何處眼動(dòng)。關(guān)于眼跳位置的選擇,模型采用了基于加工的假設(shè)。前文提到過(guò),根據(jù)這個(gè)策略,讀者估計(jì)他們?cè)谝粋€(gè)注視點(diǎn)上能夠加工的漢字?jǐn)?shù)量,然后選擇這些漢字之后的字作為眼跳目標(biāo)。這是通過(guò)漢字激活地圖實(shí)現(xiàn)的。在地圖中,句子中所有漢字的位置都有一個(gè)對(duì)應(yīng)的單元。這些單元的激活初始值為0,當(dāng)一個(gè)漢字被識(shí)別時(shí),激活值為1。當(dāng)詞語(yǔ)加工模塊中的漢字被加工,它們的激活值會(huì)實(shí)時(shí)同步更新到漢字激活地圖中,地圖中的漢字激活單元(character-activation unit)的激活值等于對(duì)應(yīng)插槽位置上激活程度最高的漢字單元。為了實(shí)現(xiàn)這個(gè)基于加工的假設(shè),在一個(gè)眼跳被觸發(fā)后,眼動(dòng)控制模塊會(huì)從左到右依次搜索漢字激活地圖,找到第一個(gè)激活小于某一閾值的漢字單元,這個(gè)漢字則被選擇為眼跳的落點(diǎn)。
3.3.1 模型實(shí)現(xiàn)
CRM 是一個(gè)計(jì)算模型,所有關(guān)于詞語(yǔ)加工和眼動(dòng)控制的假設(shè)通過(guò)計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)。模型的輸入由一系列組成句子的漢字圖像構(gòu)成。該模型模擬了每一個(gè)注視點(diǎn)上詞語(yǔ)加工的動(dòng)態(tài)過(guò)程,并模擬了整個(gè)句子完全加工前的眼動(dòng)過(guò)程。模型的輸出是一系列被識(shí)別的詞語(yǔ),以及句子加工過(guò)程中每個(gè)注視點(diǎn)的位置、起始時(shí)間和結(jié)束時(shí)間。
3.3.2 模型的初始化
模型啟動(dòng)時(shí)隨機(jī)選擇句子的第一個(gè)或第二個(gè)漢字作為注視點(diǎn),然后啟動(dòng)詞語(yǔ)加工模塊注視該漢字,并從注視點(diǎn)左側(cè)一個(gè)漢字右側(cè)三個(gè)漢字的范圍內(nèi)獲取新信息。所有單元的激活初始值為0。
3.3.3 眼動(dòng)指標(biāo)度量
為了模擬眼動(dòng)指標(biāo),模型需要一個(gè)時(shí)間系統(tǒng)來(lái)記錄眼睛移動(dòng)的時(shí)間。CRM 模型參照交互激活模型的實(shí)現(xiàn)方式,以離散的時(shí)間單位的方式運(yùn)行。程序每循環(huán)一次稱為一個(gè)迭代。在每次迭代中,網(wǎng)絡(luò)中的所有單元的激活都會(huì)更新一次。模型使用一次迭代的持續(xù)時(shí)間作為模型計(jì)時(shí)系統(tǒng)的單位。為了將模擬數(shù)據(jù)與眼動(dòng)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行比較,CRM 模型將迭代次數(shù)乘以一定的比例以轉(zhuǎn)換為注視時(shí)間,使得模型預(yù)測(cè)的平均注視時(shí)間與觀察數(shù)據(jù)的平均注視時(shí)間一致。為了計(jì)算基于詞的眼動(dòng)測(cè)量,CRM 模型使用與眼動(dòng)研究相同的方法,計(jì)算首次注視時(shí)間、凝視時(shí)間和再注視概率來(lái)表示眼睛移動(dòng)的時(shí)間,計(jì)算跳讀率和眼跳長(zhǎng)度來(lái)表示位置信息。在一些模擬中,模型還計(jì)算了詞內(nèi)眼跳落點(diǎn)位置。注意,由于模型沒(méi)有實(shí)現(xiàn)高級(jí)認(rèn)知加工,而高級(jí)認(rèn)知語(yǔ)言加工又被認(rèn)為是回視的主要因素(Rayner,1998),因此模型只計(jì)算了首遍閱讀(first-pass reading)眼動(dòng)指標(biāo),而沒(méi)有考慮回視。
3.3.4 用于尋找最佳參數(shù)的數(shù)據(jù)集
通過(guò)擬合Wei 等人(2013)的數(shù)據(jù)來(lái)尋找最佳參數(shù)。這項(xiàng)研究記錄了21 名被試閱讀72 個(gè)句子時(shí)的眼動(dòng)數(shù)據(jù),其中36 個(gè)句子包含高頻兩字詞(每百萬(wàn)出現(xiàn)50 次以上),36 個(gè)句子包含低頻雙字詞(每百萬(wàn)出現(xiàn)不到5 次)。這些目標(biāo)詞的預(yù)測(cè)性接近于0。該研究發(fā)現(xiàn)了詞頻效應(yīng):在低頻詞條件下,首次注視時(shí)間和凝視時(shí)間顯著長(zhǎng)于高頻詞條件。另外,離開(kāi)高頻詞的眼跳長(zhǎng)度顯著長(zhǎng)于離開(kāi)低頻詞條件,低頻詞的注視概率和再注視概率顯著高于高頻詞條件。
3.3.5 模型擬合方法
CRM 模型尋找最佳模型參數(shù)的方法如下。模型加工了Wei 等人(2013)實(shí)驗(yàn)中的句子材料。采用目標(biāo)詞的首次注視時(shí)間、凝視時(shí)間、注視概率和再注視概率,離開(kāi)目標(biāo)詞的眼跳長(zhǎng)度和漢字識(shí)別準(zhǔn)確率作為擬合偏差的計(jì)算指標(biāo)。模型使用歸一化均方根偏差(nRMSD)來(lái)計(jì)算擬合偏差(公式 10)。
在公式10 中,yipredicted是模型預(yù)測(cè)數(shù)據(jù),yiobserved是觀測(cè)數(shù)據(jù),stdiobserved是觀測(cè)數(shù)據(jù)的標(biāo)準(zhǔn)差,n是模型擬合的數(shù)據(jù)點(diǎn)數(shù)。nRMSD值越小,模型擬合越好。在整個(gè)參數(shù)空間中搜索最佳參數(shù),使nRMSD最小。
因?yàn)閰?shù)空間非常大,采用并行遺傳算法(parallel genetical algorithm)尋找最佳擬合參數(shù)。找到最佳參數(shù)后,將這些最佳參數(shù)用于其他所有模擬中。正如接下來(lái)的模擬結(jié)果所示,使用相同的參數(shù)能較好地模擬不同的實(shí)驗(yàn)結(jié)果,表明CRM 模型的通用性很好。模型采用的參數(shù)如表1 所示。
首先CRM 模型模擬了眼動(dòng)控制模型的經(jīng)典效應(yīng)(詞頻效應(yīng)、預(yù)測(cè)性效應(yīng)和詞長(zhǎng)效應(yīng)),大多數(shù)拼音文字書(shū)寫(xiě)系統(tǒng)的眼動(dòng)控制模型都模擬了這些效應(yīng)(Engbert et al.,2005; Reichle et al.,1998)。學(xué)界普遍認(rèn)為眼動(dòng)控制模型都應(yīng)該能模擬這些效應(yīng)(Engbert et al.,2005)。除此之外,CRM 模型還模擬了由于詞間空格的缺失中文讀者面臨的兩個(gè)獨(dú)特的問(wèn)題,而中文眼動(dòng)閱讀模型都需要解釋這兩個(gè)問(wèn)題:中文讀者在沒(méi)有詞間空格的幫助下如何進(jìn)行眼跳目標(biāo)的選擇;讀者如何處理詞邊界歧義的兩種情況(重疊歧義字符串和組合歧義詞)。
CRM 模型成功地模擬了中文句子閱讀中眼動(dòng)研究的重要發(fā)現(xiàn),如詞頻效應(yīng)、預(yù)測(cè)性效應(yīng)和詞長(zhǎng)效應(yīng)等。
模型也能擬合以往關(guān)于眼跳目標(biāo)選擇的研究:被注視詞的詞頻越高,離開(kāi)注視詞的眼跳長(zhǎng)度就越長(zhǎng)(Wei et al.,2013);而且被注視詞的詞頻是通過(guò)影響副中央凹的加工程度來(lái)影響眼跳長(zhǎng)度:在副中央凹信息正常呈現(xiàn)時(shí),詞頻影響眼跳長(zhǎng)度,而在副中央凹信息被掩蔽時(shí),這種詞頻效應(yīng)減弱(Liu et al.,2015)。
之所以能成功模擬這些效應(yīng),是因?yàn)槟P筒捎昧嘶诩庸さ牟呗?。模型通過(guò)公式7,令副中央凹的位置上的視覺(jué)層對(duì)漢字層的輸入強(qiáng)度受中央凹詞頻的影響,從而實(shí)現(xiàn)副中央凹加工的視覺(jué)效率受到注視詞詞頻的影響。當(dāng)副中央凹信息可見(jiàn)時(shí),高頻詞導(dǎo)致右側(cè)漢字更多加工,從而使離開(kāi)高頻詞的眼跳比離開(kāi)低頻詞更長(zhǎng);當(dāng)副中央凹信息不可見(jiàn)時(shí),副中央凹的加工受掩蔽符號(hào)影響,降低了目標(biāo)詞詞頻對(duì)眼跳的影響。
模型還能模擬副中央凹預(yù)視效應(yīng),即副中央凹的詞語(yǔ)在注視中央凹時(shí)會(huì)被加工。在Gu 和Li(2015)的實(shí)驗(yàn)2 中,中文讀者閱讀了嵌入兩字目標(biāo)詞的句子。在目標(biāo)詞之前的隱形邊界之前,顯示了預(yù)視詞,當(dāng)眼睛跨過(guò)邊界時(shí),預(yù)視詞變?yōu)槟繕?biāo)詞。有效預(yù)視條件下,目標(biāo)詞與預(yù)視詞一致;無(wú)效預(yù)視條件下,目標(biāo)詞與預(yù)視詞不一致,且預(yù)視詞為隨機(jī)的兩個(gè)漢字,不能組成詞語(yǔ)。模型的結(jié)果與實(shí)驗(yàn)一致,即無(wú)效預(yù)視條件的首次注視時(shí)間和凝視時(shí)間長(zhǎng)于有效預(yù)視條件。模型能夠模擬預(yù)視效應(yīng)是因?yàn)樗僭O(shè)知覺(jué)廣度范圍內(nèi)的漢字是平行加工的。因此副中央凹的信息在有效預(yù)視條件下可以被加工到一定程度,因此在隨后被注視時(shí)花費(fèi)的時(shí)間相對(duì)于無(wú)效預(yù)視條件更少。
4.4.1 重疊歧義字符串
首先,它能夠擬合左側(cè)優(yōu)勢(shì)和詞頻對(duì)詞切分的影響。前人研究發(fā)現(xiàn)了左側(cè)詞在詞切分中的優(yōu)勢(shì)(Huang & Li,2020; Li et al.,2009; Ma et al.,2014):在其他條件相同的情況下,左側(cè)的單詞更有可能被切分成一個(gè)單詞。此外,如前文所述,Ma 等人的研究表明,詞頻高的詞更容易被切分出來(lái),且詞切分的過(guò)程可能分為兩個(gè)階段(詞語(yǔ)競(jìng)爭(zhēng)階段和隨后的信息整合階段)。
當(dāng)前的模型能模擬詞切分的第一階段,詞語(yǔ)競(jìng)爭(zhēng)階段。模型的模擬采用了Huang 等人(2021)的實(shí)驗(yàn)材料。該研究將重疊歧義字符串嵌入了句子中,操縱條件之一是左右側(cè)詞的相對(duì)頻率,具體而言操縱OAS 左側(cè)詞的詞頻高于右側(cè)詞(高-低頻條件),或左側(cè)詞的詞頻要低于右側(cè)詞(低-高頻條件)。模型模擬結(jié)果表明,高-低頻條件下,98.3% 的試次中將中間位置的漢字切分到了左側(cè)詞;低-高頻條件下,51.7%的試次中將中間位置的漢字切分到左側(cè),48.3%的試次中將中間位置的漢字切分到了右側(cè)。這一模擬結(jié)果與實(shí)驗(yàn)中左側(cè)優(yōu)勢(shì)和詞頻對(duì)詞切分的影響一致。
4.4.2 組合歧義詞
中文中詞邊界模糊的情況,除了重疊歧義字符串以外還有組合歧義詞(incremental words),即一種內(nèi)部的漢字本身也構(gòu)成詞的詞語(yǔ)。比如漢字“不斷”,可以切分為“不”“斷”“不斷”。以前的研究發(fā)現(xiàn),在加工這種詞時(shí)存在整詞優(yōu)勢(shì),即讀者更傾向于將它們識(shí)別為更長(zhǎng)的詞。例如,Yang 等人(2012)的研究發(fā)現(xiàn),雙字組合歧義詞的第一個(gè)字在句子語(yǔ)境中的合理性對(duì)閱讀時(shí)間沒(méi)有影響。這表明中文讀者更傾向于將組合歧義詞作為一個(gè)整體加工,而不是逐字加工。
模型采用了Wei 等人(2013)研究中實(shí)驗(yàn)2 的材料,在該實(shí)驗(yàn)中,中文讀者閱讀包含高頻目標(biāo)詞和低頻目標(biāo)詞的句子。其中,72 個(gè)目標(biāo)詞中有70 個(gè)詞的漢字本身可以成詞。對(duì)于這些目標(biāo)詞,模擬結(jié)果顯示,目標(biāo)詞是高頻詞時(shí),整詞切分在99.4%的試次中勝出,目標(biāo)詞是低頻詞時(shí)整詞切分在99.2%的試次中勝出。在這次模擬中整詞切分具有絕對(duì)的競(jìng)爭(zhēng)優(yōu)勢(shì),詞頻的影響非常微弱。這些結(jié)果與Yang 等人(2012)的結(jié)果一致,表明中文閱讀中組合歧義詞通常作為一個(gè)整體進(jìn)行加工。
模型中,組合歧義詞的加工機(jī)制如下。在詞語(yǔ)層,“不”、“斷”和“不斷”都會(huì)被激活,這些詞相互競(jìng)爭(zhēng)唯一的勝出者。在競(jìng)爭(zhēng)中誰(shuí)能勝出取決于以下兩點(diǎn):第一,競(jìng)爭(zhēng)會(huì)受到詞頻的影響,高頻詞更有可能勝出;第二,整詞在競(jìng)爭(zhēng)中有優(yōu)勢(shì),因?yàn)樗梢允盏礁酀h字單元的前饋激活,當(dāng)單字詞和整詞的詞頻相似時(shí),整詞勝出的可能性更大。
Li 和Pollatsek(2020)構(gòu)建了中文閱讀過(guò)程中詞語(yǔ)加工和眼動(dòng)控制的整合模型,著重解釋了中文讀者在閱讀過(guò)程中如何解決詞切分和眼跳目標(biāo)的選擇等重要問(wèn)題?;谇叭搜芯?,CRM 模型提出了幾個(gè)重要假設(shè),使研究者能解決這些關(guān)鍵的問(wèn)題。
詞語(yǔ)加工模塊中最重要的假設(shè)是,詞切分和詞語(yǔ)識(shí)別是一個(gè)統(tǒng)一的過(guò)程,它們同時(shí)發(fā)生。首先,知覺(jué)廣度范圍內(nèi)的所有漢字都(在視敏度的約束下)被平行激活。這些漢字構(gòu)成的所有詞語(yǔ)都被激活。在空間上有重疊的詞語(yǔ)會(huì)相互競(jìng)爭(zhēng),在每一輪競(jìng)爭(zhēng)中,只有一個(gè)詞可以獲得勝利。中文閱讀中詞切分的機(jī)制與英文閱讀詞切分的機(jī)制有很大不同。英文閱讀中,先依賴詞間空格將詞切分出來(lái),再進(jìn)行詞的識(shí)別。而中文閱讀中,詞切分和詞識(shí)別是一個(gè)統(tǒng)一的、不可分的過(guò)程,沒(méi)有先后。
對(duì)于何時(shí)移動(dòng)眼睛,CRM 模型假設(shè),注視詞的激活會(huì)影響眼睛移動(dòng)的時(shí)間,但是眼睛移動(dòng)的時(shí)間和完成詞語(yǔ)識(shí)別的時(shí)間并不完全一致。而對(duì)于向何處移動(dòng)眼睛,CRM 模型實(shí)現(xiàn)了基于加工的眼跳目標(biāo)選擇策略,在一個(gè)注視點(diǎn)上讀者盡可能多地加工注視點(diǎn)右側(cè)的字,將下一個(gè)眼跳落點(diǎn)選擇為未加工信息位置。CRM 模型假設(shè),漢字的激活是決定眼睛移動(dòng)的位置的主要因素。具體來(lái)說(shuō),模型主要用漢字激活地圖來(lái)確定眼跳落點(diǎn)的位置,先評(píng)估在給定注視點(diǎn)上能加工的字?jǐn)?shù),然后執(zhí)行眼跳??梢钥闯?,模型中詞語(yǔ)單元的激活并不直接影響眼睛移動(dòng)的位置,因此中文讀者不會(huì)將眼跳指向詞語(yǔ)內(nèi)部的特定位置。然而值得注意的是,由于詞語(yǔ)加工和字的加工本身是交互的,詞單元會(huì)通過(guò)反饋鏈接影響相應(yīng)的漢字單元的激活。因此詞語(yǔ)加工也會(huì)間接影響眼跳目標(biāo)的選擇。
盡管模型成功地模擬了中文句子閱讀中的詞語(yǔ)加工和眼動(dòng)控制,但仍然具有局限性。第一,出于簡(jiǎn)化的目的,模型只考慮了詞語(yǔ)加工,而沒(méi)有考慮句法加工、語(yǔ)義加工和篇章加工等高級(jí)認(rèn)知加工過(guò)程。這些加工過(guò)程也會(huì)影響眼動(dòng)行為。第二,模型沒(méi)有語(yǔ)音加工模塊和語(yǔ)義加工模塊,因此無(wú)法模擬與語(yǔ)音預(yù)視效應(yīng)和語(yǔ)義預(yù)視效應(yīng)相關(guān)的研究發(fā)現(xiàn)。同時(shí),由于模型缺乏語(yǔ)義加工模塊,因此無(wú)法模擬在加工重疊歧義字段時(shí)的回視眼動(dòng)行為。當(dāng)模型在加工的初始階段出現(xiàn)錯(cuò)誤時(shí),無(wú)法像人類讀者一樣進(jìn)行檢測(cè)和糾正。未來(lái)的工作可以考慮這些影響并進(jìn)一步發(fā)展模型。第三,當(dāng)前的模型假設(shè)漢字受到插槽的限制,即一個(gè)漢字只能鏈接到一個(gè)插槽。然而,一些研究表明漢字位置的編碼可能沒(méi)有那么嚴(yán)格,即使改變了位置,讀者仍然能夠識(shí)別詞語(yǔ)。對(duì)于這一發(fā)現(xiàn),需要進(jìn)一步研究并修改模型以做出解釋。
CRM 模型實(shí)現(xiàn)了一個(gè)模擬中文閱讀中詞語(yǔ)加工和眼動(dòng)控制之間關(guān)系的計(jì)算模型。模型解釋了中文閱讀中有關(guān)讀者如何進(jìn)行詞切分,如何進(jìn)行眼跳目標(biāo)的選擇等重要問(wèn)題。模型成功地模擬了中文閱讀中一些重要的眼動(dòng)研究發(fā)現(xiàn)。