中文句子閱讀過程中詞邊界確認(rèn)機制研究現(xiàn)狀及展望

2016-02-13 16:34:03胡俊杰李飛陳海龍通化師范學(xué)院教育科學(xué)學(xué)院吉林通化3400通化市校外教育指導(dǎo)中心吉林通化3400

通化師范學(xué)院學(xué)報 2016年3期

胡俊杰,李飛,陳海龍（.通化師范學(xué)院　教育科學(xué)學(xué)院，吉林　通化　3400；.通化市校外教育指導(dǎo)中心，吉林　通化　3400）

胡俊杰1,李飛1,陳海龍2
（1.通化師范學(xué)院教育科學(xué)學(xué)院，吉林通化134002；2.通化市校外教育指導(dǎo)中心，吉林通化134001）

中文詞間沒有顯著的物理區(qū)分標(biāo)志，但在閱讀中讀者卻能夠快速理解句子含義并能區(qū)分出詞與詞之間的界限。針對中文語詞加工的這一特點，學(xué)者們從中文語言最小意義單元的確認(rèn)、詞匯切分過程的眼動特征、詞匯切分過程的加工模型等諸多角度進(jìn)行詞邊界確認(rèn)機制的探討。在系統(tǒng)梳理已有研究成果的基礎(chǔ)上，本文認(rèn)為歧義字段的切分機制、眼動與ERP數(shù)據(jù)的共同采集及聯(lián)合分析是未來詞邊界研究的重要趨勢。

詞切分；中文閱讀；邊界確認(rèn)；眼動控制

與字母文字不同，中文詞與詞之間沒有顯著的物理區(qū)分標(biāo)志（如空格）。然而在閱讀中文文本時，閱讀者卻能夠快速理解句子含義，區(qū)分出哪些字能夠組成一個詞。這種中文閱讀的切分機制具有跨語言的特異性。正是由于中文詞與詞之間無顯著物理區(qū)分標(biāo)志這一特點，使得中文詞匯加工更加復(fù)雜。在這一問題的研究中，不同領(lǐng)域的學(xué)者具有不同的研究視角。語言學(xué)領(lǐng)域的工作者探索在漢語詞之間加入空格情況的書寫規(guī)范問題，比如：馮志偉[1]、彭澤潤[2]等人倡導(dǎo)實行漢語書面語的分詞連寫，并身體力行地進(jìn)行大量實踐。計算機和人工智能領(lǐng)域的專家們主要利用自動分詞成果從事自然語言理解和處理研究，例如語義分析、知識工程、機器翻譯、專家系統(tǒng)和智能計算機等等，孫茂松[3]、喬維[4]等人在此領(lǐng)域試圖探索在計算機領(lǐng)域中切分歧義消解、未登錄詞處理和歧義語言資源建設(shè)的相關(guān)問題。在心理學(xué)及認(rèn)知科學(xué)領(lǐng)域的研究者更加關(guān)注的確是中文閱讀者在理解句子和切分文本的過程中的認(rèn)知機制。在這一領(lǐng)域中試圖通過行為研究、眼動分析等方式探索在句子閱讀過程中的認(rèn)知進(jìn)程。本文試圖通過中文語言最小意義單元的確認(rèn)、詞匯切分過程的眼動特征、詞匯切分過程的加工模型等諸多角度進(jìn)行詞邊界確認(rèn)機制的探討，并對未來詞邊界研究的發(fā)展進(jìn)行展望。

一、中文語言最小意義單元的確認(rèn)

（一）“詞”這一概念在中文閱讀中存在的心理學(xué)證據(jù)

英文詞與詞之間是存在空格的。在閱讀英文文本時，空格可以為讀者提供明顯的視覺信息使其能夠在語言識別的早期能夠快速地確定詞與詞之間的界限。在英文閱讀的研究中發(fā)現(xiàn)：讀者的首次注視傾向于落在詞的偏好注視位置（詞的開頭和詞中心之間的位置 preferred viewing location,PVL）而不是最佳注視位置（詞的中心位置,optimal viewing position,OVP）[5]。因此絕大多數(shù)的研究者均認(rèn)為英文閱讀以詞為基本信息單元。那么在中文閱讀過程中是否是以“詞”為基本單位閱讀的呢？在古漢語中，字是基本的書寫單位和意義單元。20世紀(jì)初期受西方文化影響，章士釗首先在1907年出版的《中等國文典》中首次提出“詞”的概念。之后王力、呂叔湘亦提出語言的最小獨立運用單位是詞[6][7]。

這一觀點卻受到一些實驗結(jié)果的質(zhì)疑。已有研究表明，英文材料閱讀中刪除空格會嚴(yán)重干擾被試正常的文字理解。然而在中文閱讀過程中插入空格卻并沒有促進(jìn)中文句子的識別效率[8][9]。Liu等人發(fā)現(xiàn)通過插入空格的方法考察空格對閱讀效率的影響，結(jié)果發(fā)現(xiàn)詞間空格干擾了被試對整個句子閱讀效率的影響[10]。Bai等人卻發(fā)現(xiàn)，是否插入詞間空格對句子閱讀的眼動指標(biāo)沒有影響，但插入錯誤空格卻會阻礙被試閱讀[11]。Hsu和Huang使用難度較高且有歧義的實驗材料進(jìn)行研究時發(fā)現(xiàn)，空格對詞匯切分起到了促進(jìn)作用[12]。詞是否是中文閱讀的基本單位存在爭議。

為何同樣在中文閱讀中插入詞間空格，三位研究者得出的結(jié)論完全不同？首先難度較高、具有歧義的文本與簡單文本相比更難確定詞的邊界。對于簡單文本來說詞切分過程可能是直通的，可以同時、自動進(jìn)行。當(dāng)文本難度加大、具有歧義的情況下，自動化同時加工則無法完成這種任務(wù)，需要序列加工且需及時復(fù)查。因此對于難度大的歧義文本來說空格可以極大地提高閱讀效率。其次，在Liu等人的研究中，每個句子僅包括7個字，卻被切分成了6個詞。這種切分標(biāo)準(zhǔn)極有可能與被試切分詞的標(biāo)準(zhǔn)不一致，因此在這種切分情況下詞間空格自然阻礙被試的閱讀效率。

（二）中文詞匯切分的不確定性

中文詞間沒有空格帶來的一個顯著的問題便是每個人對何為一個詞的判斷標(biāo)準(zhǔn)不一致，在確定詞邊界時存在很大爭議。有研究者總結(jié)漢語詞切分的特點，發(fā)現(xiàn)漢語閱讀者經(jīng)常將一些短語視為詞。他們經(jīng)常把虛詞和實詞連在一起，把虛詞做為詞綴，經(jīng)常把短語視為一個詞，界定的名詞性復(fù)合詞包含3個或者更多的詞素。這一點也為中文詞匯切分研究帶來了較大干擾。閆國利等人提出“主觀詞”這一概念，認(rèn)為讀者在閱讀時表征的語義單元便是主觀詞，它反映讀者對詞的主觀表征。研究發(fā)現(xiàn)與非詞相比，主觀詞表現(xiàn)出加工優(yōu)勢[13]。

“組塊”是人腦中短時記憶的最小單位[14]。Abney曾提出了英文句子加工中的“組塊”概念[15]。在中文閱讀中，“組塊”這一形式可能也成為中文詞匯切分不確定性的重要影響因素。徐中一等人認(rèn)為漢語組塊是一種符合一定語法功能的非遞歸短語，每個組塊都有一個中心詞，并圍繞該中心詞展開，任何一種組塊內(nèi)部都不包含其他類型的組塊[16]。眾多研究者對中文組塊分類進(jìn)行研究，在計算機領(lǐng)域甚至提出了中文組塊分析的算法以及識別漢語組塊的模型，利用統(tǒng)計方法和規(guī)則方法獲得中文組塊[17]。心理意義上的組塊與計算機領(lǐng)域的組塊分析應(yīng)該存在顯著差異。這種組塊不是單純的詞，而是人閱讀的眼動軌跡的語言投射。其閱讀長度受人眼知覺廣度和認(rèn)知能力的雙重限制，且服從“短時記憶”規(guī)則。

二、中文詞切分眼動特征探索

眼動有三種方式：注視(fixation)、眼跳(saccades)和追隨運動(pursuit movement)。這三種眼動方式經(jīng)常交織在一起，起到選擇信息并將注視的刺激物呈現(xiàn)在視網(wǎng)膜的中央凹區(qū)域，形成清晰的圖像。在閱讀過程中考察眼動指標(biāo)可以為研究提供更多的分析結(jié)果，有效地推測個體的認(rèn)知過程。在中文閱讀的詞切分研究中，研究者們主要考察了注視時間、眼跳幅度（距離）、注視位置、注視次數(shù)、回視次數(shù)、跳讀次數(shù)等眼動數(shù)據(jù)來探討中文詞切分現(xiàn)象的機制。

（一）插入空格范式

拼音文字中詞與詞之間是存在空格的，以中文為主的字符文字之間一般來講是不存在空格的。如果我們將原本存在空格的文字之間的空格取消，或者將不存在空格的文字中的插入空格，文本的加工方式會發(fā)生什么樣的變化呢？這類研究最早是在拼音文字中進(jìn)行的。Rayner,Fischer和Pollatsek的研究發(fā)現(xiàn)英文文本中如果沒有空格，會使閱讀速度顯著下降[18]。破壞被試原有閱讀習(xí)慣對其閱讀產(chǎn)生的干擾，能夠推理出在正常情況下閱讀過程究竟如何進(jìn)行的結(jié)論。研究者發(fā)現(xiàn)，英文文本中的詞間空格可以提高詞匯搜索效率，且可以幫助被試將注視點放在下一個單詞的最佳注視位置上。

中文詞與詞之間是不存在空格的。采用插入空格的研究范式白學(xué)軍等人發(fā)現(xiàn)詞間空格與無空格條件并無顯著差異，但是字間空格和錯誤的插入空格條件均會干擾正常閱讀。研究者們從句子長度、閱讀難度、詞判斷合理性等幾個方面來解釋這一現(xiàn)象（見前文）。另有研究表明對于歐美留學(xué)生，詞間空格可以促進(jìn)其閱讀加工，但日韓留學(xué)生、小學(xué)生、老年人來講，詞間空格的作用并未發(fā)現(xiàn)[19]。此類范式可以驗證中文是以詞為基本單位進(jìn)行加工，并能夠考察不同類別被試在分詞能力上的差異，卻難以得出閱讀過程中詞匯切分究竟如何進(jìn)行的結(jié)論。

（二）PVL與落點位置

在閱讀研究中，有一個常用的眼動指標(biāo)是首次注視位置。Rayner和Bertera發(fā)現(xiàn)，英文閱讀過程中多數(shù)情況下注視點位置會落在詞中央偏左的位置上，這個位置被稱做偏好注視位置(preferred viewing location,PVL）[20]。中文閱讀研究與其存在差異，有研究發(fā)現(xiàn)，當(dāng)中文詞匯有一個以上注視點時PVL多在詞頭位置上，但當(dāng)詞只有一個注視點時PVL多在中央。這一現(xiàn)象可以用副中央凹-中央凹效應(yīng)加以解釋。當(dāng)中文閱讀者將眼睛注視在詞匯中央時，讀者可以用副中央窩進(jìn)行切分任務(wù)，當(dāng)眼睛注視開頭時，他們則無法進(jìn)行切分[21]。

根據(jù)副中央凹-中央凹效應(yīng)與預(yù)視效應(yīng)的若干研究范式，研究者們試圖通過眼動的落點位置探索中文詞匯的加工方式及影響因素。例如：Yan等人采用預(yù)視范式，操控邊界后N+1詞的頻率來觀察N+2詞的預(yù)視情況。結(jié)果發(fā)現(xiàn)：N+1負(fù)載程度低時，N+2存在預(yù)視效應(yīng)；N+1為信息高負(fù)載詞時，該效應(yīng)不存在。研究者認(rèn)為知覺空間的信息均能得到加工，知覺空間大小是可調(diào)的，它受到語義負(fù)載程度的影響。負(fù)載程度越低知覺空間越大，負(fù)載程度增高知覺空間會變小[22]。Li等人曾操縱靶子詞長度來考察漢語閱讀中靶子詞長度對選擇策略的影響（2字詞，4字詞），結(jié)果發(fā)現(xiàn)與短詞相比，長詞更容易將PVL右移[23]。Li等人采用隨動邊界范式（gaze-contingent boundary）發(fā)現(xiàn)，當(dāng)眼跳目標(biāo)為一個詞、任務(wù)更復(fù)雜、眼跳位置更接近詞尾時，眼跳的反應(yīng)時都會變得更短。研究者認(rèn)為，中文閱讀者能夠動態(tài)調(diào)節(jié)眼跳位置以便觀測到全部信息[24]。該類研究考察了中文詞匯加工的知覺范圍及其負(fù)載程度，卻難以得出在此知覺范圍內(nèi)的具體加工步驟。

（三）詞邊界分析與加工進(jìn)程

消失文本技術(shù)是研究句子中詞匯加工能力的重要范式。消失文本范式（disappearing text paradigm）是控制句子閱讀中注視文字視覺呈現(xiàn)時間的研究范式，一般認(rèn)為，在英文閱讀過程中50-60ms視覺呈現(xiàn)后消失文本不會影響讀者獲取注視詞信息的提取過程[25]。中文消失文本閱讀研究發(fā)現(xiàn)其呈現(xiàn)時間更短。閆國利等人發(fā)現(xiàn)中文40ms后消失文本不會影響總閱讀時間[26][27]。其他研究者在這一范式下做了深入研究。劉志芳等人發(fā)現(xiàn)，詞n-1消失嚴(yán)重影響了讀者閱讀進(jìn)程，但詞n+1消失條件卻不影響總閱讀時間，認(rèn)為中文閱讀存在認(rèn)知滯后效應(yīng)[28][29]；單字消失與單詞消失條件下總閱讀時間差異并不顯著，認(rèn)為單字消失導(dǎo)致注視詞的信息不完整，閱讀應(yīng)以詞為基本單位進(jìn)行加工[30]。然而消失文本范式在中文閱讀中的應(yīng)用存在一個不得不考慮的問題：中文詞匯間無空格，整詞消失條件下是否會為閱讀者提供有效的詞切分線索？Rayner等人的研究發(fā)現(xiàn)，英文閱讀時詞n+1在60ms后消失會影響閱讀過程，但中文卻沒有發(fā)現(xiàn)這一現(xiàn)象[31]。是否與中文提供有效詞切分有關(guān)，值得進(jìn)一步研究。

張智君等人在2012年曾經(jīng)采用隨動顯示技術(shù)考察漢語閱讀中詞匯切分的位置。結(jié)果發(fā)現(xiàn)變換詞語n及其左側(cè)文本顏色條件下與控制條件相比眼動數(shù)據(jù)無顯著差異；變換詞語n+1及其左側(cè)文本的顏色情境下的平均凝視時間與再注視興趣區(qū)都顯著低于控制條件，跳讀次數(shù)多于控制條件。張智君等人認(rèn)為讀者最先可以在一定程度上對詞n+1進(jìn)行加工，但這種預(yù)加工的效果并不徹底，如果促進(jìn)詞n+1的加工會使得加工效率增加。因此漢語閱讀中存在兩種詞切分現(xiàn)象，一種由加工詞n+1引起，一種由加工詞n引起。詞匯切分廣度范圍在0-2個之間[32]。吳俊等人采用“邊界”技術(shù)范式探索句子閱讀過程中詞匯加工的預(yù)視情況。實驗使用特殊的三字詞，這些三字詞前兩個漢字亦可成詞。例如：“服務(wù)員”和“服務(wù)部”。邊界位置在前兩個字之后。當(dāng)注視點跨過這個看不見的邊界時，邊界后的漢字會改變。結(jié)果發(fā)現(xiàn)三字詞預(yù)視條件下的注視時間顯著低于非預(yù)視條件；高頻、高預(yù)期雙字條件下的注視時間短于低頻、低預(yù)期條件下的雙字注視時間而三字條件下沒有顯著差異。因此吳俊等人認(rèn)為，注視時間應(yīng)該由“預(yù)加工時間”和“眼跳潛伏期”構(gòu)成，而“預(yù)加工時間”也可以分為“雙字詞搜索階段”和“三字詞搜索階段”兩個階段組成[33]。

三、詞匯切分、識別模式探索

（一）中文閱讀的并行分布式加工

構(gòu)建閱讀的加工模型，對于閱讀理論發(fā)展及現(xiàn)有研究結(jié)論的總結(jié)具有重要的意義。當(dāng)前閱讀加工模型大多是基于眼動控制視角下的理論構(gòu)建，若根據(jù)“詞匯加工在眼動控制過程中是否起到重要作用”這一標(biāo)準(zhǔn)，我們可以將模型分為POC模型（primary culomotor control models）和認(rèn)知控制模型（cogniive control models）兩類。POC模型主要強調(diào)物理意義上的視覺線索（如詞的長度、詞間空格等）或眼跳系統(tǒng)本身特點（如眼跳發(fā)動的時間、眼跳的幅度等）對詞匯加工過程的影響。而認(rèn)知控制模型多強調(diào)詞匯與詞匯加工對基本眼動時間的影響作用。中文由于其語言本身特征，在研究中多強調(diào)認(rèn)知控制在其加工中的作用。這類模型又可以分成兩類，強調(diào)注意資源的分配轉(zhuǎn)移和詞匯加工嚴(yán)格遵守序列程序的注意轉(zhuǎn)換理論（如：E-Z讀者模型）以及認(rèn)為注意資源一開始就被分配至閱讀知覺廣度內(nèi)的所有詞上的并行分布式理論（如：SHIFT模型）。

有研究者試圖探索在中文閱讀中讀者究竟采用單向的、序列的注意轉(zhuǎn)換策略還是能夠同時加工知覺廣度內(nèi)所有詞匯的并行分布式的加工。Inhoff和Wu選擇4字組成的字段為閱讀材料，一種是在歧義條件下，即4字為交集型歧義字段（4個連續(xù)關(guān)鍵字能組成三個詞）。例如：“?？茖W(xué)生”可以被切分為?？啤?、“科學(xué)”和“學(xué)生”；另一種是在控制條件下，4字只能組成兩個詞，中間2字為非詞。結(jié)果發(fā)現(xiàn)，歧義條件下凝視時間和中間2字的注視時間均長于控制條件，支持并行分布式假設(shè)[34]。Yan等人、Li等人的研究也支持知覺廣度內(nèi)所有詞均能得到加工的并行分布式假設(shè)，并且提出知覺廣度的范圍取決于詞匯信息的負(fù)載程度、詞匯本身的難易程度等[24][25][26]。

（二）句子中詞匯識別的整體假設(shè)

Li等人試圖探討中文詞切分進(jìn)程中究竟采用前饋假設(shè)（feedforward hypothesis）

還是整體假設(shè)（holistic hypothesis）進(jìn)行加工[35]。前饋假設(shè)認(rèn)為中文詞的認(rèn)知過程只有自下而上的前饋，而沒有自上而下的反饋；整體假設(shè)認(rèn)為中文詞的視覺信息加工、字的識別和詞的識別等各單元之間存在相互作用。Li等人采用4字字串為實驗材料，實驗分四種不同條件：條件1為四字可以構(gòu)成一個詞（1詞條件）；條件2為前兩個字組成一個詞，后兩個字組成另一個詞（2詞條件）；條件3為前兩個字是四字詞的前半部分，但后兩個字卻與前文無關(guān)系半詞條件）；條件4為四個字無法構(gòu)成任何詞（非詞條件）。要求被試短時間內(nèi)盡可能多的報告看到的字。結(jié)果發(fā)現(xiàn)被試往往能夠識別出1詞條件下的所有字，但是2詞條件下卻僅能識別出頭兩個字。Li等人認(rèn)為這種“邊界效應(yīng)”符合整體假設(shè)的推論，即中文識別是一個自下而上與自上而下交互的過程。在此基礎(chǔ)上他們提出了詞的切分和識別模型，并作出如下假設(shè)：（1）詞的切分、識別是一個統(tǒng)一的過程，二者不可區(qū)分；（2）落在知覺范圍內(nèi)的字加工是并行的，識別效率受視覺注意的影響，離注視點越遠(yuǎn)越難識別；（3）詞的識別是串行的，詞匯識別過程中一次只能有一個詞匯勝出；（4）當(dāng)一個詞被識別出后，剛剛識別出的詞和字所對應(yīng)的單元被抑制，然后開始下一輪的競爭。

（三）模型修正

首先，我們認(rèn)可“詞切分、識別是個統(tǒng)一的過程，二者不可區(qū)分是一個自下而上加工與自下而上加工交互的過程”這一假設(shè)，并贊同并行分布式理論提出的“知覺范圍內(nèi)字加工并行”假說。識別效率確實可以受到視覺注意的影響，在此基礎(chǔ)上我們還認(rèn)為知覺范圍可以受詞長、知覺負(fù)載程度等因素的影響。

其次，當(dāng)一個詞被識別后，剛剛識別的詞和字所對應(yīng)的單元真的會被抑制嗎？劉志芳等人的研究中n-1詞消失嚴(yán)重干擾了讀者的閱讀進(jìn)程，不論產(chǎn)生的原因是認(rèn)知滯后效應(yīng)還是視覺掩蔽，都說明注視點在詞n上時，詞n-1的信息仍然處于激活狀態(tài)。因此我們預(yù)測，在詞n受到加工時，n-1是做為最有力的預(yù)測依據(jù)出現(xiàn)在認(rèn)知加工平臺之上的。它可能為在其之后的詞的切分、詞義詞性的選擇提供依據(jù)。

另外，詞的識別過程一次一定只能有一個詞匯勝出，是串行加工嗎？在眾多漢語閱讀研究中均可發(fā)現(xiàn)，閱讀的眼跳落點位置并非逐詞存在的，有時甚至可以跨越2詞。張智君等人也指出詞匯切分的廣度范圍在0-2詞之間。因此在知覺范圍內(nèi)讀者可以對多個詞進(jìn)行同時切分。之后在此基礎(chǔ)上讀者會對可能存在的切分形式提出假設(shè)，并根據(jù)n-1詞的語義或語法特征對這種切分形式是否合理進(jìn)行驗證。

四、需解決的問題及研究展望

中文詞切分現(xiàn)象的探索仍然存在許多尚未解決的問題。本章節(jié)試圖將這些問題進(jìn)行簡要梳理，希望能為未來的研究提供一些思路。

（一）切分存在歧義情況下的切分方式及策略

如果中文閱讀者的確是采用“假設(shè)——考驗”的方式利用n-1詞來驗證詞n甚至詞n+1的切分是否正確，那么當(dāng)假設(shè)失敗的情況下閱讀者會采用怎樣的方式進(jìn)行再次加工呢？計算語言學(xué)中對計算機處理自動切分中文文本問題相當(dāng)感興趣。目前國內(nèi)在這一領(lǐng)域公認(rèn)的難點在于 “歧義切分字段”的處理。我們可以借助計算語言學(xué)中的歧義字段材料來考察何種材料容易令讀者產(chǎn)生假設(shè)失誤，面臨假設(shè)失誤時讀者會進(jìn)行怎樣的處理。計算語言學(xué)中還提出歧義切分字段一般分為兩大類，分別為交集型歧義切分字段與多義組合型歧義切分字段。一般來講，在字段S=a1……ai﹒b1……bj﹒c1……ck分別都構(gòu)成詞，則字段S稱為交集型歧義切分字段；在字段S= a1……ai﹒b1……bj中，如果a1……ai、b1……bj和S分別成詞，則字段S稱之為多義組合型歧義切分字段。在漢語自動切詞過程中處理歧義切分字段時一般采用的方式是建立歧義字段庫，在字庫的基礎(chǔ)上利用各種知識體系處理歧義字段的切分。比如交集型歧義切分字段一般會利用詞法知識進(jìn)行切分，而多義組合型歧義切分字段則一般會利用句法、語義、語用知識進(jìn)行切分[36]。因此我們還可以追問讀者在處理切分歧義時采用的切分策略是否與計算機采用的策略一致呢？尤其是在歧義字段的切分過程中是按照詞法、句法等知識進(jìn)行切分還是按照n-1詞的語義特征進(jìn)行切分呢？

（二）詞匯切分的抑制機制

詞匯的切分與識別過程應(yīng)該不僅僅包括對相關(guān)信息的激活，還應(yīng)該包括對無關(guān)信息的抑制。抑制是一種對無關(guān)信息進(jìn)行主動阻止和壓抑的認(rèn)知加工機制[37]。以往研究語言理解強調(diào)心理表征的建構(gòu),并用概念或信息的激活、擴散來描述這種建構(gòu)過程。隨著抑制機制在一般認(rèn)知研究中越來越受到重視,人們也開始審視其在語言理解中的作用。目前語言理解中的抑制研究涉及范圍較廣,既探討如詞匯、句法、語篇和修辭性語言等各種層次、形式的理解加工過程,也觸及抑制能力個體差異及其根源。中文詞匯的切分過程（尤其是歧義字段的切分）本身就是抑制無關(guān)信息、凸顯相關(guān)信息的過程。在這一過程中漢語詞匯切分的機制是怎如何抑制無關(guān)信息的呢？更深一步來說，這種抑制機制究竟位于詞匯加工與識別的哪一個階段？抑制機制的考察有助于我們對詞匯選擇與確認(rèn)過程的理解。

（三）詞匯切分在大腦中的加工模式

中文詞匯切分的現(xiàn)有研究成果大多集中于行為研究的實驗范型之內(nèi)。詞匯切分時腦電成分與腦成像的變化也會成為未來研究關(guān)注的焦點。通過疊加平均而獲得的ERP腦電成分可以反映與特定感覺、運動或者認(rèn)知事件相關(guān)的神經(jīng)活動。比如有研究發(fā)現(xiàn)N400是一個在單詞刺激出現(xiàn)后400ms出現(xiàn)的與語言加工有關(guān)的負(fù)電位腦波，它對語言輸入中的語義特征特別敏感[38]；P600是刺激出現(xiàn)后600ms與句法加工密切相關(guān)的正電位腦波[39]。眼動和ERP技術(shù)尤其各自研究的優(yōu)點，同步采集兩類數(shù)據(jù)可以在一定程度上互補兩者的優(yōu)勢。眼動研究很容易發(fā)現(xiàn)言語加工的先后順序及加工時程，但卻很難得出在這段時間內(nèi)大腦究竟完成哪些任務(wù)；ERP卻可以得出在語言加工的相應(yīng)階段各個腦區(qū)的協(xié)同配合情況以及每個部分腦加工強度的負(fù)載情況。眾所周知，由于神經(jīng)反射弧的長度決定了眼動與ERP數(shù)據(jù)之間存在時間延遲，但現(xiàn)有技術(shù)可以解決句子中詞匯切分的眼動、ERP數(shù)據(jù)間的這一問題。因此考察中文句子閱讀過程中某個詞匯切分過程的眼-腦同時采集具有重要意義。

[1]馮志偉.漢語書面語的分詞連寫[J].語文建設(shè),2001(3):15.

[2]彭澤潤.詞和詞式書寫研究——中國語言規(guī)劃的新前景[M].長沙：湖南人民出版社,2008.

[3]孫茂松.漢語自動分詞研究評述[J].當(dāng)代語言學(xué),2001(1):22-32.

[4]喬維,孫茂松.漢語交集型歧義切分字段關(guān)于專業(yè)領(lǐng)域的統(tǒng)計特性[J].中國信息學(xué)報.2008(4):11-18.

[5]Rayner K.Eye guidance in reading:Fixation locations within words[J].Perception,1979(8):21-30.

[6]王力.中國現(xiàn)代語法[M].北京:中華書局,1954.

[7]呂叔湘.語法學(xué)習(xí)[M].上海:復(fù)旦大學(xué)出版社,2006.

[8]Rayner K,Fischer M H&Pollatsek A.Unspaced text interferes with both word identification and eye movement control[J].Vision Research,1998(38):1129-1144.

[9]梁菲菲,白學(xué)軍.切分空間和切分方式對中文閱讀績效影響的眼動研究[J].心理研究,2010(3):21-28.

[10]Liu I M,Yeh J S,Wang L H et al.Progressive reading.Journal of the Chinese word as units on reading efficiency[J].Chinese Journal of Psychology,1974,16:25-32.

[11]Bai X J,Liversedge S P,Zang C L et al.Reading spaced and unspaced Chinese text:Evidence from eye movements[J].Journal of Experimental Psychology:Human Perception and Performance,2008,34 (5):1277-1287.

[12]Hsu S H,Huang K C.Interword spacing in Chinese text layout[J].Perceptual and Motor Skills,2000,91:355-365.

[13]閆國利,張?zhí)m蘭,張霞等.漢語閱讀中的心理詞加工[J].心理與行為研究,2012,10(3):183-189.

[14]Miller G A.The magical number seven,Plus or minus two: some limits on our capacity for Processing information[J].Psychology Review,1956,101(2):343-352.

[15]Abney S.Parsing by chunks[M].In Berwick R C,Abney S P &Tenny CL,Principle-based parsing.Dordrecht:Kluwer Academic Publishers:257-258.

[16]徐中一,胡謙,劉磊.基于CRF的中文組塊分析[J].吉林大學(xué)學(xué)報(理學(xué)版),2007,45(3):417-420.

[17]李素建,劉群,白碩.統(tǒng)計和規(guī)則相結(jié)合的漢語組塊分析[J].計算機與發(fā)展,2002,39(4):385-391.

[18]Rayner K,Fischer M H&Pollatsek A.Unspaced text interferes with both word identification and eye movement control[J].Vision Research,1998,38:1129-1144.

[19]白學(xué)軍,張慢慢,臧傳麗等.詞邊界信息在中文詞匯學(xué)習(xí)與識別中的作用：眼動研究的證據(jù)[J].心理科學(xué)進(jìn)展,2014,22(1):1-8.

[20]Rayner K&Bertera J H.Reading without a fovea[J].Science, 1979,206:468-469.

[21]Yan M,Kiegl R,Richter E et al.Flexible saccade-target selection in Chinese reading[J].The quarterly journal of experimental psychology,2010,63:705-725.

[22]Yan M,Kiegl R,Shu H et al.Parafoval load of word N+1 modulates preprocessing effectiveness of word N+2 in Chinese reading [J].Journal of experimental psychology:Human perception and performance,2010,36(6):1669-1676.

[23]Li X S,Liu P P&Rayner K.Eye movement guidance in Chinese reading:Is there a preferred viewing location?[J].Vision research, 2011,51:1146-1156.

[24]Li X S,Liu P P&Rayner K.Saccade target selection in Chinese reading[J].Psychon Bull&Review,2015,22:524-530.

[25]Rayner K,Inhoff A,Morrison R et al.Masking of foveal and parafoveal vision during eye fixations in reading[J].Journal of experimental psychology:Human perception and performance,1981,7:167-179.

[26]閆國利,王文靜,白學(xué)軍.消失文本條件下認(rèn)知控制的眼動研究[J].心理學(xué)探新,2007,4:37-41.

[27]閆國利,姜茜,李興珊等.消失文本條件下詞的預(yù)測性效應(yīng)的眼動研究[J].應(yīng)用心理學(xué),14:306-310.

[28]劉志芳,張智君,趙亞軍.漢語閱讀中眼跳目標(biāo)選擇單元以及詞匯加工方式：來自消失文本的實驗證據(jù) [J].心理學(xué)報,43(6): 608-618.

[29]劉志芳,石以萍,張智君等.中文閱讀中的認(rèn)知滯后效應(yīng)[J].心理學(xué)探新,2012,32(1):22-26.

[30]劉志芳,劉妮娜,仝文.字、詞識別加工在中文閱讀眼動控制中的作用[J].心理與行為研究,2014,12(2):182-187.

[31]Rayner K,Liversedge S P&White S J.Eyemovements when reading disappearing text:the importance of the word to the right of fixation[J].Vision Research,2006,46:310-323.

[32]張智君,劉志芳,趙亞軍等.漢語閱讀過程中詞切分的位置：一項基于眼動隨動顯示技術(shù)的研究 [J].心理學(xué)報,2012,44(1): 51-62.

[33]吳俊,莫雷,冷英.中文詞匯切分對眼動數(shù)據(jù)的影響[J].心理學(xué)探新,2008,28(2):41-48.

[34]Inhoff A,Wu C.The role of interword spaces in the processing of English compound words[J].Language and Cognitive Processes, 2005,20:291-316.

[35]Li X S,Rayner K&Cave K R.On the segmentation of Chinese words durning reading[J].Cognitive Psychology,2009,58:525-552.

[36]王彩榮,王凱麗,黃玉基.歧義字段的歸類及切分算法[J].微處理機,2005,3:33-39.

[37]楊小虎.語言理解中的抑制機制研究綜述[J].當(dāng)代語言學(xué), 2005,7(4):327-337.

[38]Kutas M,Hillyard S A.Reading senseless sentences:Brain potentials reflect semantic incongruity[J].Science,1980,207:203-205.

[39]Osterhout L,Holcomb P J.Event-related brain potentials elicited by syntactic anomaly[J].Journal of Memory and Language, 1992,31:785-806.

（責(zé)任編輯：章永林）

B842

1008—7974(2016)03—0040—04

10.13877/j.cnki.cn22-1284.2016.05.008

2015-11-11

心理學(xué)視角下漢語詞切分現(xiàn)象理論探究;通化師范學(xué)院社會科學(xué)科研項目(2014001)

胡俊杰,黑龍江齊齊哈爾人，碩士。

中文句子閱讀過程中詞邊界確認(rèn)機制研究現(xiàn)狀及展望

一、中文語言最小意義單元的確認(rèn)

二、中文詞切分眼動特征探索

三、詞匯切分、識別模式探索

四、需解決的問題及研究展望

一、中文語言最小意義單元的確認(rèn)

二、中文詞切分眼動特征探索

三、詞匯切分、識別模式探索

四、需解決的問題及研究展望