孔令躍 張 豹
(1 北京大學(xué)對外漢語教育學(xué)院,北京 100871) (2 廣州大學(xué)教育學(xué)院心理學(xué)系,廣州 510006)
詞匯識別是一個復(fù)雜過程,包括詞匯水平和亞詞匯水平上形、音、義等各種信息的激活與提取,其中亞詞匯信息的作用機制、加工單位和激活時序等都是閱讀研究領(lǐng)域內(nèi)的重要問題。大量拼音語言的行為研究發(fā)現(xiàn)亞詞匯信息如音節(jié)、字母位置等在詞匯通達(dá)中起到重要作用(Grainger &Jacobs, 1993; Perea & Carreiras, 1998)。近年來,越來越多的研究者利用ERP技術(shù)高時間分辨率的優(yōu)勢對亞詞匯加工的時間進(jìn)程進(jìn)行了探索,確定了幾個與之相關(guān)的ERP成分,如早期成分P150、P200、N250及晚期成分N400(Carreiras, Gillon-Dowens, Vergara, & Perea, 2009; Dien, 2009; Savill &Thierry, 2012),認(rèn)為這些ERP成分反映了從詞匯視覺特征分析,到亞詞匯水平的正字法表征(如字母和音節(jié)),再到整體詞形或者語義表征這一系列單詞的識別歷程(Holcomb & Grainger,2006)。其中P150和P200總體上反映了亞詞匯正字法信息的總體激活情況,前者可能反映了單詞亞詞匯成分的激活和視覺特征的最初加工,后者對形似詞的數(shù)量非常敏感,可能反映了亞詞匯水平上正字法的加工。這些研究結(jié)果加深了人們對亞詞匯信息及其作用的認(rèn)識并推動了詞匯識別模型的構(gòu)建和完善。
但是,目前研究者對早期成分P200所反映的詞匯加工過程仍有爭議(謝敏, 楊青青, 王權(quán)紅, 2016)。P200是ERP的一個內(nèi)源性成分,起始于150 ms,于200 ms達(dá)到頂峰,在275 ms結(jié)束,主要分布在額中部和頂枕葉(Kong, Zhang, Zhang, & Kang,2012; Kong et al., 2010; Liu, Perfetti, & Hart, 2003)。有些研究發(fā)現(xiàn)P200成分既與拼音文字的詞形加工有關(guān),也與其語音加工有關(guān)(Kramer & Donchin,1987; Misra & Holcomb, 2003; Rugg, 1987),但這些結(jié)果未能得到另一些研究的重復(fù)(Be nt in,Mouchetant-Rostaing, Giard, Echallier, & Pernier, 1999;Kutas & van Petten, 1994; Ziegler, Benra?ss, & Besson,1999)。這些相互矛盾的研究結(jié)果可能與拼音文字系統(tǒng)的特性有關(guān),也可能與研究者所操控的實驗任務(wù)有關(guān),但總體來說這反映了拼音文字詞匯加工中,P200成分與字形和語音加工的聯(lián)系并不穩(wěn)定。
與拼音文字相比,漢字書寫系統(tǒng)有一些顯著的獨特特征。首先,漢字是基本的書寫單元,對應(yīng)口語中的一個音節(jié),而不是一個音素。因為漢語中沒有對應(yīng)于音素的解碼單元,所以在漢語中沒有形音對應(yīng)規(guī)則(grapheme to phoneme correspondence)。其次,漢字由部件組成,而且這些部件自身可以單獨成字,現(xiàn)代漢語中約80%以上的漢字都屬于形聲字(李燕, 康加深,1993)。形聲字由功能上不同的聲旁和義旁組成,義旁為整字提供語義線索,聲旁通常為整字提供發(fā)音線索,但聲旁的總體表音度為66.04%(陳原,1993),而且絕大部分聲旁或者一部分義旁本身就是一個字,有其自身的發(fā)音和意義。
大量行為研究發(fā)現(xiàn)漢字的以上特性影響著漢字識別。比如,漢字識別中存在著發(fā)音規(guī)則性和一致性、部件位置、部件頻率、形旁家族和聲旁家族等效應(yīng),表明漢字亞詞匯水平上的聲旁和義旁的語音、位置、頻率和家族大小等信息會在漢字識別早期影響詞匯水平的加工(畢鴻燕, 胡偉, 翁旭初, 2006; 陳新葵, 張積家, 2012; 韓布新, 1998;Ding, Peng, & Taft, 2004; )。近期的ERP研究為上述行為結(jié)果提供了進(jìn)一步的認(rèn)知神經(jīng)學(xué)證據(jù)(Hsu,Tsai, Lee, & Tzeng, 2009; Wu, Mo, Tsang, & Chen,2012; Yum, Law, Su, Lau, & Mo, 2014; Zhou, Fong,Minett, Peng, & Wang, 2014)。另外,ERP研究也發(fā)現(xiàn)了穩(wěn)定地反映漢字詞匯水平的形音加工的N170和P200,其中P200成分被視為漢字早期詞匯水平形音加工的指標(biāo)(Kong et al., 2010, 2012; Liu et al., 2003; Zhang, Zhang, & Kong, 2009)。
然而,早期成分P200與漢字亞詞匯部件形音信息加工的關(guān)系還不清楚。這方面的研究不多且結(jié)果并不一致。對漢字亞詞匯部件形音信息的加工可從多個角度進(jìn)行考察。比如,語音的規(guī)則性,即亞詞匯部件語音與整字語音是否一致;或者語音的一致性,即包含某一部件的所有漢字發(fā)音的異同程度。Hsu等(2009)考察了漢字一致性ERP效應(yīng)變化,發(fā)現(xiàn)高一致性字比低一致性字產(chǎn)生更小的P200和更大的N400效應(yīng)。該研究認(rèn)為這可能是由于低一致性漢字的聲旁激活了更多的包括這一聲旁的漢字,導(dǎo)致早期詞匯語音競爭更激烈,出現(xiàn)更大波幅的P200。據(jù)此提出兩階段漢字識別模型,認(rèn)為P200和N400分別代表著漢字識別的早晚期兩個加工階段。其中P200反映了早期基于漢字聲旁部件的形音交互加工的影響(Lee et al.,2007)。這一模型的解釋主要著眼于聲旁部件的正字法分析以及由該部件激活的多個詞匯水平上的語音信息的競爭對P200效應(yīng)的影響,而亞詞匯部件自身的語音激活及其對P200效應(yīng)變化的影響卻不清楚。而且,模型關(guān)于語音競爭的解釋仍然比較籠統(tǒng),不能清楚地說明P200的產(chǎn)生機制的一些問題。比如,高一致性字有更多的相同語音激活,其語音激活在競爭中更強,但卻產(chǎn)生減弱的P200效應(yīng)。而且,低一致性字所在的同聲旁家族中可能有很多相同讀音的字,也可能該家族所有的字的讀音都不同,這兩種情況下的語音競爭有什么不同,產(chǎn)生的P200又是否一樣?另一方面,Yum等(2014)嚴(yán)格控制了不同一致性條件下的規(guī)則和不規(guī)則字?jǐn)?shù)量,同時考察漢字規(guī)則性和一致性的ERP效應(yīng),卻發(fā)現(xiàn)一致性效應(yīng)只出現(xiàn)在P200上,一致字比不一致字產(chǎn)生更大的P200效應(yīng)。這一結(jié)果與Hsu等(2009)的結(jié)果完全相反。關(guān)于規(guī)則性,Yum等則發(fā)現(xiàn)規(guī)則字比不規(guī)則字誘發(fā)了更大的N170和N400,以及減弱的P200效應(yīng)。這些分歧表明漢字亞詞匯部件形音信息加工的腦機制及早期成分(如P200)的變化模式都還有待進(jìn)一步的ERP研究來探討。
除了規(guī)則性和一致性,漢字亞詞匯部件的其它特征(如,部件可發(fā)音性)也可以用于探討亞詞匯語音信息加工的腦機制問題。簡體漢字中,有很多漢字的部件(可能是聲旁也可能是義旁)單獨成字,可以按漢語拼音規(guī)則發(fā)音,但有很多不能單獨成字,往往不發(fā)音(常稱之為某種偏旁)。利用這一屬性可從新的角度進(jìn)一步考察漢字亞詞匯部件語音加工的ERP效應(yīng)模式。基于這一思路,本研究操控漢字部件的可發(fā)音性特征來探討亞詞匯語音加工與早期ERP成分P200的關(guān)系。關(guān)鍵實驗材料為形似音異的合體字對,字對共享一個可發(fā)音或不可發(fā)音的部件(如,“吹-砍”、“揚-場”)。以往的研究表明形似字對能產(chǎn)生顯著的P200效應(yīng)(Kong et al., 2012; Liu et al.,2003)。如果亞詞匯語音確實影響或調(diào)節(jié)著P200效應(yīng),則可以預(yù)期部件可發(fā)音和不可發(fā)音形似字對之間會出現(xiàn)P200效應(yīng)差異。在規(guī)則性和一致性ERP研究數(shù)量少且存在分歧的情況下,部件發(fā)音與不發(fā)音形似字對是否存在P200效應(yīng)差異這一結(jié)果將有助于進(jìn)一步揭示亞詞匯部件語音加工的ERP機制和特性,豐富和驗證這方面的研究成果。
需要指出的是,以往考察亞詞匯語音規(guī)則性和一致性的ERP研究主要使用命名和真假字判斷任務(wù),但是命名任務(wù)有可能會強化漢字的(尤其是部件)語音加工,使用真假字判斷任務(wù)有可能會使被試更關(guān)注字的部件及其組合結(jié)構(gòu)、強化部件的加工。對于探討漢字亞詞匯部件信息早期加工的實驗來說,這兩種任務(wù)都可能對被試加工和實驗結(jié)果產(chǎn)生潛在不利影響。另一方面,大量研究證明,漢字識別過程中語音一定自動激活,即使實驗任務(wù)不需要使用漢字的語音信息(Zhou &Marslen-Wilson, 2000)。因此,本研究使用以往研究中曾使用的語義一致性判斷任務(wù),讓被試只對填充字對進(jìn)行判斷(Kong et al., 2010)。該任務(wù)中被試關(guān)注漢字的語義信息,避免了對漢字部件及其語音信息的有意關(guān)注,可以考察自動的漢字語音信息激活與加工,從而盡可能減少實驗任務(wù)帶來的潛在影響。而且使用該任務(wù)的ERP研究在漢字語音加工上有一致的發(fā)現(xiàn),也表明了該任務(wù)在探測漢字語音加工上的有效性(Kong et al., 2010,2012; Zhou et al., 2014)。
2.1.1 被試
17名本科生(平均年齡為20.76歲,8名女生,9名男生)參加實驗,視力或矯正視力正常,均為右利手,無相關(guān)實驗經(jīng)驗。實驗后獲得一定報酬。
2.1.2 材料
所有實驗用字選自常用的4574個字(北京語言學(xué)院語言教學(xué)研究所, 1986)。關(guān)鍵材料為部件發(fā)音和部件不發(fā)音高頻字對。為了方便描述,每一字對中的第一個字稱為啟動字,第二個字稱為目標(biāo)字。所有字對均為形似音異字,啟動字和目標(biāo)字共享一個部件。部件發(fā)音和不發(fā)音字對各有35對,每對字對之間沒有語義相關(guān)。實驗中還包括24對形似音異但語義相關(guān)的字對(如, “瞅-瞧”)作為填充字對。每種條件下目標(biāo)和啟動字的筆畫和字頻都進(jìn)行嚴(yán)格匹配,部件發(fā)音和不發(fā)音兩種條件下材料的筆畫和字頻也完全匹配。所有目標(biāo)字的部件家族大小都沒有差異,都在2~15個之間,屬于研究文獻(xiàn)中界定的小家族(畢鴻燕等, 2006)。實驗材料中可發(fā)音和不可發(fā)音字對目標(biāo)字的一致性也嚴(yán)格匹配(0.25與0.26,p=0.832)。每個被試接受總共94對隨機呈現(xiàn)的字對,見表1。
表1 實驗字對信息
2.1.3 程序
實驗在安靜的獨立單間內(nèi)進(jìn)行,被試坐在離屏幕約57 cm的位置。采用E-Prime1.0呈現(xiàn)刺激,收集和記錄行為數(shù)據(jù)。實驗流程圖參見圖1,每次測試開始時,首先在屏幕中央呈現(xiàn)一個“+”300 ms作為注視點,隨之相繼出現(xiàn)一個“啟動字-目標(biāo)字”字對,啟動字140 ms,目標(biāo)字呈現(xiàn)1500 ms,中間空屏360 ms后,要求被試看到目標(biāo)字后,立即用右手食指又快又準(zhǔn)地按空格鍵判斷其與先前呈現(xiàn)的啟動字是否語義相關(guān),語義無關(guān)時無需按鍵,否則視為錯誤。反應(yīng)完后目標(biāo)字消失,進(jìn)入下一測試。測試之間的時間間隔隨機設(shè)置為1800、1900、2000、2100或2200 ms。實驗過程中要求被試盡可能減少頭動。正式實驗之前先完成20個練習(xí)以熟悉實驗程序和任務(wù)要求。
圖1 實驗刺激流程圖
本研究實驗設(shè)計為單因素(字對類型:部件發(fā)音、部件不發(fā)音)被試內(nèi)實驗設(shè)計。因變量為指定時窗的ERP平均波幅。
2.1.4 ERP記錄
使用德國Brain Products公司的ERP記錄與分析系統(tǒng),按國際10-20系統(tǒng)擴展的64導(dǎo)電極帽記錄EEG。接地點在Fpz和Fz連線的中點,垂直眼電(VEOG)通過放置于左眼上下1厘米處的一對電極進(jìn)行記錄。參考電極置于左右乳突,左乳突的電極作為在線參考電極,右側(cè)乳突的電極作為離線參考電極。每個電極處的頭皮電阻保持在5 kΩ以下,濾波帶通為0.1~70 Hz,采樣頻率為500 Hz/導(dǎo)。
2.1.5 ERP數(shù)據(jù)分析
對連續(xù)記錄的EEG進(jìn)行離線迭加平均,分析窗口為目標(biāo)字出現(xiàn)的-100~900 ms,用-100~0 ms作為基線進(jìn)行矯正。自動校正VEOG,并將振幅超過75 μV的分段作為偽跡去除。只分析包含目標(biāo)字且反應(yīng)正確的測驗的ERP數(shù)據(jù),填充字對數(shù)據(jù)不納入分析。圖2為平均迭加后的ERP總平均波形圖,可以看出,兩種字對類型條件下都出現(xiàn)了顯著的 N1(100~140 ms)、P200(180~300 ms)和N400(300~450 ms)。
圖2 部件發(fā)音與不發(fā)音條件下12個電極上目標(biāo)字的平均ERP波
本研究主要關(guān)注P200,為了增加研究結(jié)果之間的可比性,數(shù)據(jù)分析時參照Kong等(2010)的研究,將P200分析時窗設(shè)定為目標(biāo)字出現(xiàn)后180~210 ms,分析的電極包括Fz,F(xiàn)3,F(xiàn)4,Cz,C3,C4,Pz,P3,P4,Oz,O1,O2,分析指標(biāo)為選定分析時窗ERP的平均波幅。所有的方差分析均使用Greenhouse-Geisser法進(jìn)行較正。
計算所有條件下的正確率發(fā)現(xiàn)填充字對的正確率為83.59%,部件可發(fā)音字對和部件不可發(fā)音字對的正確率分別為97.41%和96.12%。
2(字對類型)×12(電極)的重復(fù)測量方差分析結(jié)果發(fā)現(xiàn):字對類型主效應(yīng)顯著,F(xiàn)(1,16)=12.18,p<0.005,η=0.43;部件發(fā)音字對的P200平均波幅顯著大于部件不發(fā)音字對,電極位置主效應(yīng)顯著,F(xiàn)(11, 176)=14.34,p<0.001,η=0.47;兩者交互作用邊緣顯著,F(xiàn)(11,176)=1.68,p=0.082,η=0.10。進(jìn)一步的簡單效應(yīng)分析發(fā)現(xiàn)部件發(fā)音字對的P200波幅在額區(qū)、中央?yún)^(qū)及頂區(qū)的電極點上顯著大于部件不發(fā)音字對(F3:p=0.070; P4:p=0.089; Fz, F4, Cz, C3, C4, P3, Pz:ps<0.05)。圖3是兩種條件差異波的腦地形圖(可發(fā)音減去不可發(fā)音),表明亞詞匯聲旁的語音加工主要分布在頭皮的額中區(qū)部分,這與漢字詞匯水平的語音加工頭皮分布基本一致(Kong et al., 2010)。
圖3 部件可發(fā)音與不可發(fā)音條件下的ERP差異波腦地形圖
亞詞匯加工是詞匯識別研究中的一個重要研究領(lǐng)域,漢字亞詞匯加工同樣如此,但近年來才出現(xiàn)一些相關(guān)的ERP研究。這些研究發(fā)現(xiàn)漢字亞詞匯加工與ERP的早期成分如P150和P200以及晚期成分N400都有關(guān)系,研究者也嘗試依據(jù)這些結(jié)果構(gòu)建漢字識別的兩階段模型(Lee et al., 2007)。但是,模型的解釋以及支撐證據(jù)都還面臨著較多問題。比如,后續(xù)的研究發(fā)現(xiàn),一致性ERP結(jié)果與支撐該類模型構(gòu)建的關(guān)鍵實驗結(jié)果完全不同(Yum et al., 2014)。因此,漢字識別的兩階段模型還有很多問題需要解決,亞詞匯語音加工的ERP機制也還待進(jìn)一步探討。當(dāng)前仍需要進(jìn)一步考察漢字亞詞匯部件加工與早期成分的確切關(guān)系及變化特性,以豐富和驗證以往的這些研究結(jié)果和模型。
本研究嘗試操控漢字亞詞匯部件的可發(fā)音性來考查早期成分P200的變化,結(jié)果發(fā)現(xiàn),與部件不發(fā)音的目標(biāo)字相比,部件可發(fā)音的目標(biāo)字產(chǎn)生了增強的P200。這可能是由于部件可發(fā)音目標(biāo)字需要更多的認(rèn)知加工資源來處理部件的語音信息及其與整字語音信息的關(guān)系。而包含不發(fā)音部件的漢字則只需要處理其整字水平的語音信息,需要較少的認(rèn)知加工資源。這一結(jié)果通過語義相關(guān)判斷任務(wù)獲得,與以往采用詞匯判斷任務(wù)所得的結(jié)果一致(Yum et al., 2014)。因此,跨實驗任務(wù)的一致性結(jié)果進(jìn)一步表明P200對于亞詞匯部件語音可發(fā)音性變化確實非常敏感,其效應(yīng)受到該種語音特性的調(diào)節(jié)。綜合以往關(guān)于漢字規(guī)則性和一致性的P200研究結(jié)果,可以確定P200能夠穩(wěn)定地反映亞詞匯部件語音加工,其效應(yīng)變化受到亞詞匯各種語音特征的調(diào)節(jié)。此外,本研究中使用的實驗材料都是高頻漢字,實驗結(jié)果也表明漢字亞詞匯部件的語音激活非常快,這種快速的亞詞匯部件語音激活不僅僅局限于低頻字的識別中(Zhou et al., 2014)。
本研究結(jié)果有助于深入認(rèn)識早期成分P200的變化與漢字形音加工之間的關(guān)系,進(jìn)一步總結(jié)相應(yīng)的P200變化模式。根據(jù)目前已有的關(guān)于漢字識別早期ERP成分的研究結(jié)果,可知P200的變化與以下幾個因素有關(guān):漢字讀音規(guī)則性或一致性(Yum et al., 2014)、部件可發(fā)音性(本研究)、部件位置性(Wu et al., 2012)、漢字視覺相似性(Kong et al., 2012; Liu et al., 2003)和漢字詞匯水平語音相似性(Kong et al., 2010; Zhang et al.,2009)。前四個因素反映了亞詞匯部件形音信息的加工,后兩個因素反映了詞匯水平形音信息的加工。因此可以確定,P200是早期漢字詞匯和亞詞匯部件形音等信息加工的綜合反映。詞匯和亞詞匯水平上的字形或語音信息都能單獨調(diào)節(jié)其變化。
以往研究發(fā)現(xiàn)漢字的形、音信息對P200的影響存在差異。例如形異音同字對比非同音控制字對所激活的P200更強(如,“梏-雇”、“甥-雇”)(Kong et al., 2010; Liu et al., 2003),但音異形似的獨體字對和合體字對都比形音皆異的控制字對誘發(fā)更小的P200,而且音異形似的合體字對的P200顯著大于獨體字對的(如,“目-且”、“讀-續(xù)”)(Kong et al., 2012)。本研究結(jié)果進(jìn)一步顯示P200受到亞詞匯部件語音加工的調(diào)節(jié),部件可發(fā)音性導(dǎo)致更大的P200。這似乎說明Kong等(2012)研究中音異形似合體字對增強的P200可能是由亞詞匯部件語音相似性的加工所致。也就是說,形似字對中若同時共享相同的亞詞匯語音信息(如合體字共有部件),也會導(dǎo)致P200效應(yīng)增大。
綜上所述,可以嘗試總結(jié)P200的變化特性,即在漢字識別的過程中,同一水平上的詞匯或亞詞匯信息加工,如字形加工會使P200減弱(Kong et al., 2010; Liu et al., 2003),但語音加工會使P200增強(Kong et al., 2012)。因此,形似音異字對可能誘發(fā)最小的P200波幅,形異音同字對可能誘發(fā)最大的P200波幅,而形似音同字對誘發(fā)的P200波幅則可能處于前兩者之間。這一推測也能解釋以往研究中發(fā)現(xiàn)的一致性P200效應(yīng)(Yum et al., 2014),即一致字比不一致字導(dǎo)致更大的P200效應(yīng),原因在于其具有更多相同的詞匯水平上的語音激活。另一方面,漢字詞匯與亞詞匯兩個水平上的語音信息的相似性P200變化又不同于同一水平上的P200變化特征。當(dāng)詞匯和亞詞匯兩個水平上語音相同時(即規(guī)則字),會導(dǎo)致整字水平上的語音加工更快,因此會出現(xiàn)減弱的P200效應(yīng)而非增強的P200效應(yīng)(Yum et al., 2014)。概括而言,可以推測同一(詞匯或亞詞匯)水平上的字形相似性和語音相似性產(chǎn)生相反的P200效應(yīng)變化,前者更小,后者更大;而詞匯和亞詞匯兩個水平上的語音相似性產(chǎn)生更小的P200效應(yīng)變化。這一變化模式不符合漢字識別兩階段模型的預(yù)測(Hsu et al., 2009; Lee et al., 2007),但更符合也能更合理地解釋漢字規(guī)則性和一致性P200效應(yīng)(Yum et al., 2014)。
另一方面,基于漢字加工的這些推測與拼音文字中的P200的研究結(jié)果存在差異(Barnea &Breznitz, 1998; Kramer & Donchin, 1987)。拼音文字中發(fā)現(xiàn)形音都不匹配的詞對產(chǎn)生最大的P200效應(yīng),形異音同或音異形似時P200效應(yīng)為中等水平,而形似音同時P200效應(yīng)最小。這種不同書寫系統(tǒng)之間的詞匯加工P200效應(yīng)差異的深層機制值得進(jìn)一步探討。
本研究結(jié)果表明,P200對漢字亞詞匯水平的語音信息加工非常敏感,其效應(yīng)變化受到亞詞匯部件語音特性的調(diào)節(jié)。而且,P200效應(yīng)變化模式在漢字與拼音文字中可能存在著極大差異。