摘 要 詞頻分布對(duì)跨情境詞匯學(xué)習(xí)至關(guān)重要。然而,以往研究主要考察了基于均勻分布的跨情境詞匯學(xué)習(xí),相對(duì)忽視了真實(shí)情境中基于Zipfian 分布等偏態(tài)分布的跨情境詞匯學(xué)習(xí),而僅有的研究對(duì)Zipfian 分布究竟促進(jìn)還是抑制跨情境詞匯學(xué)習(xí)爭(zhēng)論激烈。為此,這項(xiàng)研究率先建立了學(xué)習(xí)機(jī)制的宏觀視角,提出單個(gè)詞匯的學(xué)習(xí)效果取決于學(xué)習(xí)環(huán)境中其他詞匯的整體學(xué)習(xí)效果,據(jù)此首次提出基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng),認(rèn)為互斥性策略的有效使用是產(chǎn)生Zipfian 頻率促進(jìn)效應(yīng)的關(guān)鍵。
關(guān)鍵詞 跨情境詞匯學(xué)習(xí) 語(yǔ)言學(xué)習(xí) 宏觀學(xué)習(xí)視角 偏態(tài)學(xué)習(xí) 互斥性策略 詞匯爆炸
1 引言
詞匯是語(yǔ)言的基石,詞匯學(xué)習(xí)的認(rèn)知機(jī)制一直是語(yǔ)言學(xué)習(xí)領(lǐng)域的研究重點(diǎn)和熱點(diǎn)(Bassani amp;Araujo, 2019; Mak et al., 2021; Qu et al., 2021; Repnik etal., 2021)。詞匯學(xué)習(xí)的本質(zhì)是消除語(yǔ)義模糊性,即從模糊情境中習(xí)得詞匯(label / word)和語(yǔ)義(referent/ meaning) 的匹配關(guān)系(mapping)(Frank et al.,2009;Vlach amp; DeBrock, 2017)。學(xué)習(xí)者主要通過(guò)跨情境詞匯學(xué)習(xí)(cross-situational word learning, CSWL)消除語(yǔ)義模糊性(Blythe et al., 2010; Roembke amp;McMurray, 2021)。CSWL 指利用詞匯和語(yǔ)義在多個(gè)情境中反復(fù)共現(xiàn)的規(guī)律,習(xí)得詞匯和語(yǔ)義匹配關(guān)系的過(guò)程(Blythe et al., 2010; Reisenauer et al., 2013)。因此,目標(biāo)詞在多個(gè)情境中重復(fù)出現(xiàn)有利于該詞匯的學(xué)習(xí)。并且詞頻越高,該詞的學(xué)習(xí)效果越好(Kanamp; Sadagopan, 2015)。
然而,只提高目標(biāo)詞的詞頻并非一定有益于詞匯學(xué)習(xí),還應(yīng)當(dāng)考慮詞頻分布的作用。一方面,學(xué)習(xí)者需要掌握的目標(biāo)詞數(shù)量龐大,每個(gè)目標(biāo)詞都多次重復(fù)出現(xiàn)需要花費(fèi)大量不切實(shí)際的學(xué)習(xí)時(shí)間。另一方面,不同于每個(gè)情境中只出現(xiàn)一個(gè)詞匯和一個(gè)語(yǔ)義的快速映射(fast mapping)詞匯學(xué)習(xí)(Mulaket al., 2019),在真實(shí)語(yǔ)言學(xué)習(xí)情境中,同一情境往往包含多種詞匯與語(yǔ)義的匹配,且語(yǔ)義模糊性較高。同時(shí),學(xué)習(xí)者還需要推斷詞匯和語(yǔ)義的匹配關(guān)系,只提高目標(biāo)詞的詞頻并不能促進(jìn)語(yǔ)義模糊性的消除。然而,在目標(biāo)詞數(shù)量龐大、語(yǔ)義模糊性高的情況下,嬰兒卻表現(xiàn)出了驚人的詞匯學(xué)習(xí)能力,并在大約18個(gè)月時(shí)出現(xiàn)詞匯爆炸現(xiàn)象(Bloom, 2001)。本文認(rèn)為,這種高效而體量龐大的CSWL 與詞頻分布密切相關(guān)。相比于詞頻均勻分布,偏態(tài)分布下只有少數(shù)目標(biāo)詞為高頻出現(xiàn)。這一方面節(jié)約了學(xué)習(xí)時(shí)間,另一方面也能夠促進(jìn)學(xué)習(xí)者利用高頻詞消除其他目標(biāo)詞的語(yǔ)義模糊性,從而促進(jìn)了CSWL。
雖然詞頻分布對(duì)CSWL 至關(guān)重要,但是以往研究忽視了真實(shí)詞匯學(xué)習(xí)情境中詞頻呈偏態(tài)Zipfian分布的特點(diǎn),導(dǎo)致以往理論未能反映真實(shí)的詞匯學(xué)習(xí)(Hendrickson amp; Perfors, 2019; Zipf, 1949)。以往研究通常將待學(xué)詞庫(kù)中所有目標(biāo)詞的頻率保持一致,從而構(gòu)建詞頻服從均勻分布的待學(xué)詞庫(kù)(Benitez et al., 2016; Hu, 2017; Vlach amp; DeBrock,2017; Zettersten amp; Saffran, 2021)。近期雖有少量研究考察了Zipfian 分布下的CSWL,但這些研究之間還存在著激烈的爭(zhēng)論。本文認(rèn)為,深入探究Zipfian 分布對(duì)CSWL 的作用,不僅能夠解釋嬰兒強(qiáng)大的語(yǔ)義模糊性消除能力,而且能夠揭示真實(shí)情境的詞匯學(xué)習(xí)。
鑒于此,本文首先梳理Zipfian 分布下CSWL 的研究進(jìn)展,探討詞頻分布對(duì)CSWL的作用機(jī)制。然后,圍繞詞頻分布類(lèi)型與互斥性策略的耦合,提出基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng)。最后,通過(guò)分析互斥性策略的作用機(jī)制,完善基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng)。
2 Zipfian 分布下的跨情境詞匯學(xué)習(xí)
Zipfian 分布是一種長(zhǎng)尾的偏態(tài)分布(見(jiàn)圖1),最早由美國(guó)語(yǔ)言學(xué)家George Kingsley Zipf 用來(lái)描述真實(shí)詞匯學(xué)習(xí)情境中詞頻的分布規(guī)律,即Zipfian定律。Zipfian 定律指出詞頻隨詞匯在頻率表中秩的增加呈冪函數(shù)遞減(Hendrickson amp; Perfors, 2019;Lavi-Rotbain amp; Arnon, 2021; Zipf, 1949)。其他研究者對(duì)多種語(yǔ)料庫(kù)的分析也證實(shí)了Zipfian 定律在人類(lèi)語(yǔ)言中的普適性(Lavi-Rotbain amp; Arnon,2021)。Zipfian 分布下的CSWL 指CSWL 中整個(gè)待學(xué)詞庫(kù)的詞頻分布形態(tài)滿足Zipfian 分布。均勻分布下的CSWL 中每個(gè)目標(biāo)詞的出現(xiàn)頻率相同,而Zipfian 分布下的CSWL 只有少數(shù)幾個(gè)目標(biāo)詞的頻率非常高,而大部分目標(biāo)詞的詞頻都較低。
多次重復(fù)學(xué)習(xí)新知識(shí)能夠提升新知識(shí)的學(xué)習(xí)效果,詞頻越高,該詞的學(xué)習(xí)效果越好(Kan amp;Sadagopan, 2015)。Zipfian 分布中大量的低頻詞沒(méi)有被多次重復(fù)學(xué)習(xí),有可能導(dǎo)致學(xué)習(xí)效果較差。然而,這種只通過(guò)改變單個(gè)目標(biāo)詞學(xué)習(xí)頻率而影響學(xué)習(xí)效果的方式是一種微觀學(xué)習(xí)視角。微觀學(xué)習(xí)視角關(guān)注單個(gè)詞匯的詞頻與學(xué)習(xí)效果的關(guān)系,割裂了整個(gè)待學(xué)詞庫(kù)中詞與詞之間的統(tǒng)計(jì)規(guī)律。因此,根據(jù)微觀學(xué)習(xí)視角,通過(guò)增加學(xué)習(xí)頻率而提高學(xué)習(xí)效果必然增加時(shí)間成本。但是,微觀學(xué)習(xí)視角很難解釋嬰兒的詞匯爆炸現(xiàn)象。
鑒于此,本文首次提出宏觀學(xué)習(xí)視角,關(guān)注整個(gè)待學(xué)詞庫(kù),特別強(qiáng)調(diào)單個(gè)詞匯的學(xué)習(xí)與其他詞匯學(xué)習(xí)的相互作用。宏觀學(xué)習(xí)視角下,學(xué)習(xí)者在同一學(xué)習(xí)情境中不僅能夠獲得詞匯及語(yǔ)義的共現(xiàn)規(guī)律信息,而且還能獲得匹配關(guān)系間的互斥性信息。這種匹配關(guān)系的互斥性指正確匹配的詞匯與語(yǔ)義是一一對(duì)應(yīng)的,沒(méi)有兩個(gè)詞匯擁有相同的語(yǔ)義。下面將梳理有關(guān)Zipfian 分布的CSWL 研究,分析宏觀學(xué)習(xí)視角的理論優(yōu)勢(shì),探討詞頻分布對(duì)CSWL 的作用機(jī)制。
2.1 Zipfian 分布對(duì)跨情境詞匯學(xué)習(xí)的促進(jìn)作用
呈Zipfian 分布的偏態(tài)分布能夠減輕學(xué)習(xí)者的記憶負(fù)擔(dān),從而促進(jìn)CSWL。這種促進(jìn)效應(yīng)被稱為Zipfian 頻率效應(yīng)(Schuler et al., 2017)。Hendrickson和 Perfors(2019) 考察了成年人在均勻分布和Zipfian 分布條件下的CSWL。結(jié)果顯示,Zipfian 分布能夠提高詞匯學(xué)習(xí)效率,因?yàn)閆ipfian 分布下高頻詞能被快速習(xí)得,促進(jìn)了其他詞匯的歧義消除。最關(guān)鍵的是,盡管均勻分布下所有詞匯的詞頻均高于Zipfian 分布下低頻詞的詞頻,但是均勻分布下詞匯的學(xué)習(xí)效率卻低于Zipfian 分布下低頻詞的學(xué)習(xí)效率。研究者認(rèn)為,相比于均勻分布,Zipfian 分布能夠通過(guò)更好地消除語(yǔ)義模糊性促進(jìn)CSWL。這種高頻詞對(duì)其他詞匯學(xué)習(xí)的促進(jìn)機(jī)制,充分體現(xiàn)了宏觀學(xué)習(xí)視角下互斥性的作用。
研究者還從詞匯學(xué)習(xí)要素的角度驗(yàn)證了Zipfian頻率效應(yīng)。學(xué)習(xí)者學(xué)會(huì)一個(gè)單詞意味著學(xué)會(huì)了三個(gè)要素——詞匯、語(yǔ)義以及它們的匹配關(guān)系(Frank etal., 2009; Vlach amp; DeBrock, 2017)。詞匯包括詞形和語(yǔ)音。上述Hendrickson 和 Perfors(2019)的研究表明Zipfian 分布能夠促進(jìn)詞匯和語(yǔ)義間匹配關(guān)系的學(xué)習(xí)。
其次, 針對(duì)詞匯這一要素, 研究者還發(fā)現(xiàn)Zipfian 分布促進(jìn)了成人和兒童的詞匯分隔(wordsegmentation)(Kurumada et al., 2013; Lavi-Rotbainamp; Arnon, 2019, 2020)。Kurumada 等人(2013) 采用正字法分割任務(wù),要求被試對(duì)文本進(jìn)行詞匯劃分。結(jié)果顯示,當(dāng)文本的詞頻呈均勻分布時(shí),被試無(wú)法正確完成分割任務(wù),而Zipfian 分布下,被試快速熟悉了反復(fù)接觸的高頻詞,對(duì)高頻詞的熟悉有助于被試分割相鄰的材料,即語(yǔ)境促進(jìn)效應(yīng)。并且,這些促進(jìn)學(xué)習(xí)者完成分割材料任務(wù)的語(yǔ)境經(jīng)驗(yàn)有助于學(xué)習(xí)者在之后的學(xué)習(xí)中發(fā)揮優(yōu)勢(shì),即語(yǔ)境引導(dǎo)效應(yīng)。這種高頻詞對(duì)其他材料詞匯分隔的促進(jìn)機(jī)制體現(xiàn)了宏觀學(xué)習(xí)視角下互斥性的作用。
再次, 針對(duì)語(yǔ)義這一要素, 研究者還發(fā)現(xiàn)Zipfian 分布促進(jìn)了視覺(jué)領(lǐng)域的統(tǒng)計(jì)學(xué)習(xí)。Lavi-Rotbain 和 Arnon(2021)采用視覺(jué)圖片流刺激,以三張固定順序的圖片流為一個(gè)三元組,操縱不同三元組的出現(xiàn)頻率,探討均勻分布和Zipfian 分布下學(xué)習(xí)者對(duì)視覺(jué)圖片組合的學(xué)習(xí)。結(jié)果顯示,盡管Zipfian 分布下存在很多低頻三元組,但是Zipfian 分布比均勻分布的圖片組合劃分成績(jī)更好。這種高頻圖片組合對(duì)其他圖片組合劃分的促進(jìn)效應(yīng)也體現(xiàn)了宏觀學(xué)習(xí)視角下互斥性的作用。
綜上所述,在宏觀視角下,學(xué)習(xí)者能夠利用整個(gè)待學(xué)詞庫(kù)中學(xué)習(xí)材料的互斥性進(jìn)行學(xué)習(xí)。偏態(tài)分布下,學(xué)習(xí)者如果采用宏觀學(xué)習(xí)視角,利用高頻材料與其他材料間的互斥性便能夠有效地提高學(xué)習(xí)效率。
2.2 Zipfian 分布對(duì)跨情境詞匯學(xué)習(xí)的抑制作用
少量研究者發(fā)現(xiàn)Zipfian 分布不利于學(xué)習(xí)者學(xué)習(xí)詞匯。他們認(rèn)為Zipfian 分布下低頻詞存在顯著的學(xué)習(xí)劣勢(shì),會(huì)增加學(xué)習(xí)時(shí)間,從而抑制了CSWL。Blythe 等人(2010)運(yùn)用數(shù)學(xué)模型模擬CSWL,發(fā)現(xiàn)Zipfian 分布下CSWL 比均勻分布花費(fèi)了更多時(shí)間。這是因?yàn)閆ipfian 分布下低頻詞的詞頻極低,導(dǎo)致學(xué)習(xí)者難以發(fā)現(xiàn)低頻詞及其語(yǔ)義的共現(xiàn)規(guī)律。并且,Zipfian 分布下低頻詞數(shù)量眾多,學(xué)習(xí)者為消除大量低頻詞的語(yǔ)義模糊性,需要花費(fèi)大量時(shí)間積累不同情境下的共現(xiàn)規(guī)律信息。同時(shí),Zipfian 分布下高頻詞數(shù)量較少而詞頻較高,幾乎在每個(gè)情境下都出現(xiàn),導(dǎo)致學(xué)習(xí)者很難消除語(yǔ)義模糊性。這種單獨(dú)考察高頻詞與低頻詞學(xué)習(xí)效果的方式即微觀學(xué)習(xí)視角。該研究沒(méi)有考慮待學(xué)詞庫(kù)中詞匯間的互斥性,所以不能說(shuō)明Zipfian 分布抑制CSWL。
Vogt(2012)使用數(shù)學(xué)建模的方法,揭示了Zipfian 分布下CSWL 的局限性。研究發(fā)現(xiàn),當(dāng)詞頻滿足Zipfian 分布時(shí),學(xué)習(xí)者只能在語(yǔ)義模糊性較低時(shí)才能學(xué)會(huì)含有大量詞匯的待學(xué)詞庫(kù)。當(dāng)語(yǔ)義模糊性較高時(shí),學(xué)習(xí)者要耗費(fèi)大量超乎實(shí)際的時(shí)間,才能學(xué)會(huì)眾多的低頻詞。這種方式只強(qiáng)調(diào)通過(guò)共現(xiàn)規(guī)律消除語(yǔ)義模糊性,沒(méi)有考慮詞與詞之間匹配關(guān)系的互斥性,是一種典型的微觀學(xué)習(xí)視角,不能說(shuō)明Zipfian 分布抑制CSWL。
綜上,學(xué)習(xí)者只有采用宏觀學(xué)習(xí)視角,利用互斥性進(jìn)行學(xué)習(xí),才能體現(xiàn)出Zipfian 分布對(duì)CSWL的促進(jìn)。如果不考慮互斥性,Zipfian 分布反而會(huì)抑制CSWL。
3 基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng)
通過(guò)分析以往Zipfian 分布研究中存在的矛盾,本文認(rèn)為導(dǎo)致上述矛盾的原因是以往研究忽視了學(xué)習(xí)過(guò)程中所學(xué)詞匯間的相互作用,特別是互斥性偏好(mutual exclusivity bias)的影響。互斥性偏好指學(xué)習(xí)者假定沒(méi)有兩個(gè)詞匯有完全相同的語(yǔ)義,若某語(yǔ)義匹配了詞匯A,那么該語(yǔ)義就不會(huì)匹配詞匯B。
在CSWL 中,學(xué)習(xí)者能夠通過(guò)互斥性偏好消除語(yǔ)義模糊性,從而習(xí)得詞義(Frank et al., 2009;Zettersten amp; Saffran,2021)。如圖2 所示,學(xué)習(xí)者看到“□”和“○”,同時(shí)聽(tīng)到“circle”和“square”。學(xué)習(xí)者根據(jù)共現(xiàn)規(guī)律能夠建立四種匹配假設(shè)并保持在記憶中,即“□是circle”,“□是square”,“○是circle”和“○是square”。然后,學(xué)習(xí)者依據(jù)快速映射學(xué)習(xí)習(xí)得“○是circle”。進(jìn)而,學(xué)習(xí)者以習(xí)得的詞匯“circle”作為錨點(diǎn),結(jié)合之前建立的四種匹配假設(shè),根據(jù)互斥性偏好推論“○不是square”,進(jìn)一步推論習(xí)得“square 是□”。本文將這種通過(guò)已習(xí)得詞匯排除新詞語(yǔ)義干擾項(xiàng),從而降低新詞語(yǔ)義模糊性的詞匯學(xué)習(xí)方法稱為互斥性策略。
以往認(rèn)為Zipfian 分布抑制CSWL 的研究大多著眼于微觀學(xué)習(xí)視角,忽視了詞與詞之間匹配關(guān)系的互斥性。對(duì)此,本文從宏觀學(xué)習(xí)視角出發(fā),提出基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng),認(rèn)為使用互斥性策略學(xué)習(xí)詞匯,能夠充分發(fā)揮詞頻偏態(tài)分布的優(yōu)勢(shì)。具體而言,Zipfian 分布下學(xué)習(xí)者能夠快速習(xí)得高頻詞并建立錨點(diǎn),遇到新詞時(shí),使用互斥性策略排除錨點(diǎn)詞對(duì)應(yīng)的語(yǔ)義后,建立新詞和剩余候選語(yǔ)義的匹配假設(shè)。因此,采用互斥性策略可以降低新詞的語(yǔ)義模糊性,減少被試需要保持和驗(yàn)證的匹配假設(shè)數(shù)量,從而減輕學(xué)習(xí)者的記憶負(fù)擔(dān),提高CSWL 的效率。
如果學(xué)習(xí)者結(jié)合積累的匹配假設(shè),反復(fù)使用互斥性策略進(jìn)行語(yǔ)義推斷,則可能快速學(xué)會(huì)多個(gè)目標(biāo)詞,實(shí)現(xiàn)詞匯爆炸。這也能夠解釋嬰兒的詞匯爆炸現(xiàn)象。在圖3 所示的CSWL 中,學(xué)習(xí)者結(jié)合試次5 之前積累的多個(gè)匹配,反復(fù)使用互斥性策略,在試次5 快速學(xué)會(huì)了三個(gè)目標(biāo)詞(Reisenauer et al.,2013)。具體而言,學(xué)習(xí)者利用共現(xiàn)規(guī)律,在試次5 習(xí)得“□是square”。這時(shí),學(xué)習(xí)者將“square”作為錨點(diǎn),結(jié)合試次3 的兩個(gè)匹配假設(shè),第一次使用互斥性策略,得出“□不是circle”,進(jìn)而推論習(xí)得“○是circle”。這時(shí)“square”和“circle”都能作為錨點(diǎn),結(jié)合試次4 的三個(gè)匹配假設(shè),學(xué)習(xí)者再次使用互斥性策略,推論習(xí)得“△是triangle”。因此,Zipfian 分布下學(xué)習(xí)者結(jié)合以往積累的匹配假設(shè),使用互斥性策略能夠激發(fā)巨大的學(xué)習(xí)潛能,達(dá)到詞匯爆炸的學(xué)習(xí)效果。
更重要的是,Zipfian 分布能夠促進(jìn)學(xué)習(xí)者使用互斥性策略(見(jiàn)圖4)。當(dāng)詞頻滿足均勻分布時(shí),每個(gè)目標(biāo)詞被學(xué)會(huì)的概率均等。在詞匯學(xué)習(xí)初期,學(xué)習(xí)者的學(xué)習(xí)效率低于Zipfian 分布,導(dǎo)致學(xué)習(xí)者無(wú)法快速建立錨點(diǎn),抑制互斥性策略的使用。當(dāng)詞頻滿足Zipfian 分布時(shí),學(xué)習(xí)者快速習(xí)得的高頻詞成為錨點(diǎn),促進(jìn)了互斥性策略的使用。此外,Zipfian分布下學(xué)習(xí)者更快地學(xué)會(huì)目標(biāo)詞,無(wú)需再記憶有關(guān)這些目標(biāo)詞的匹配假設(shè),從而減輕記憶負(fù)擔(dān),促進(jìn)CSWL。
4 偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng)中互斥性策略的影響因素
基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng)認(rèn)為,使用互斥性策略降低新詞的語(yǔ)義模糊性,必須建立正確錨點(diǎn),并結(jié)合多個(gè)匹配假設(shè)進(jìn)行互斥推論。而語(yǔ)言背景、被試年齡和情境模糊性均會(huì)影響互斥性策略的使用方式,進(jìn)而影響基于互斥性策略的偏態(tài)詞匯學(xué)習(xí)效果。下面將針對(duì)上述三個(gè)相關(guān)因素,解釋互斥性策略的影響因素,完善基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng)。
4.1 語(yǔ)言背景
語(yǔ)言背景(language learning history)指學(xué)習(xí)者的母語(yǔ)及第二語(yǔ)言學(xué)習(xí)經(jīng)歷。CSWL 中候選語(yǔ)義間的競(jìng)爭(zhēng)關(guān)系與語(yǔ)言背景有關(guān)。當(dāng)學(xué)習(xí)者學(xué)習(xí)一個(gè)詞匯與兩個(gè)物體間的匹配關(guān)系時(shí),單語(yǔ)者存在顯著的候選語(yǔ)義競(jìng)爭(zhēng),而雙語(yǔ)者不存在(Benitez et al.,2016; Poepsel amp; Weiss, 2016)。這表明單語(yǔ)者比雙語(yǔ)者更傾向于建立一對(duì)一的詞- 物匹配假設(shè),而雙語(yǔ)者更擅長(zhǎng)建立并保持多個(gè)匹配假設(shè)。這種差異導(dǎo)致單語(yǔ)者和雙語(yǔ)者使用互斥性策略的方式不同(見(jiàn)表1)。
在詞頻均勻分布的CSWL 中,單語(yǔ)者建立一對(duì)一匹配的傾向性使其比雙語(yǔ)者更快地確定詞匯的語(yǔ)義,因此建立的錨點(diǎn)更多、速度更快,但容易出錯(cuò)。而雙語(yǔ)者保持多個(gè)匹配假設(shè)的傾向性則使其在詞匯學(xué)習(xí)中更為保守,其建立的錨點(diǎn)更少、速度更慢,但更準(zhǔn)確。雙語(yǔ)者一旦確定了某個(gè)詞匯的語(yǔ)義,將同時(shí)搜索記憶中相關(guān)的多個(gè)匹配假設(shè),使用互斥性策略進(jìn)行推斷。因此,雙語(yǔ)者的詞匯學(xué)習(xí)后期容易出現(xiàn)詞匯爆炸現(xiàn)象。
在詞頻偏態(tài)分布的CSWL 中,單語(yǔ)者和雙語(yǔ)者均體現(xiàn)出基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì),但其促進(jìn)機(jī)制不同。相比于均勻分布,Zipfian 分布下單語(yǔ)者和雙語(yǔ)者均能更快、更準(zhǔn)確地掌握高頻詞。快速掌握高頻詞能夠提高單語(yǔ)者建立錨點(diǎn)的效率,促進(jìn)雙語(yǔ)者更快建立錨點(diǎn),同時(shí)減少雙語(yǔ)者記憶系統(tǒng)中匹配假設(shè)的數(shù)量,從而減輕雙語(yǔ)者的記憶負(fù)擔(dān)。在此基礎(chǔ)上使用互斥性策略,均能產(chǎn)生Zipfian 頻率效應(yīng)。
此外,二語(yǔ)學(xué)習(xí)者難以對(duì)聽(tīng)到的詞匯進(jìn)行語(yǔ)音編碼(Hu,2017)。Zipfian 分布下高頻詞的語(yǔ)音編碼比均勻分布更容易。因此,Zipfian 分布有助于二語(yǔ)學(xué)習(xí)者建立錨點(diǎn)、完成編碼和使用互斥性策略,從而促進(jìn)CSWL。
4.2 被試年齡
兩歲半的兒童可以進(jìn)行CSWL。但是,當(dāng)語(yǔ)義模糊性高時(shí),兒童的詞匯學(xué)習(xí)容易被高頻語(yǔ)義干擾(Bunce amp; Scott, 2017)。有證據(jù)表明,隨著年齡的增長(zhǎng),CSWL 過(guò)程也在發(fā)展變化。例如Fitneva 和Christiansen(2017)操縱CSWL 中初始匹配的正誤,考察4 歲兒童、10 歲兒童以及成人的CSWL。結(jié)果顯示,4 歲幼兒初始正確的匹配數(shù)與學(xué)習(xí)效果呈正相關(guān),而成人則相反,沒(méi)有發(fā)現(xiàn)10 歲兒童的初始匹配正誤與學(xué)習(xí)效果的關(guān)聯(lián)。當(dāng)初始匹配錯(cuò)誤時(shí),學(xué)習(xí)者只有在學(xué)習(xí)過(guò)程中保持多個(gè)匹配假設(shè),才能排除錯(cuò)誤匹配,推斷出正確匹配。該結(jié)果表明,兒童難以保持多個(gè)匹配假設(shè),但成人可以。并且,這種保持多個(gè)匹配假設(shè)的能力很可能在10 歲左右出現(xiàn)。
Trueswell 等人(2013)的研究卻發(fā)現(xiàn)成人難以保持多個(gè)匹配假設(shè)。該研究的不同結(jié)果可能是由于該研究范式語(yǔ)義模糊性太高,不利于保持匹配假設(shè)。此外,Hu(2017)發(fā)現(xiàn),兒童即使不具備保持多個(gè)匹配假設(shè)的能力,也能在目標(biāo)詞語(yǔ)義模糊的情況下區(qū)分已學(xué)過(guò)的目標(biāo)詞和陌生詞。兒童這種區(qū)分能力是對(duì)互斥性信息的初步積累,預(yù)示著兒童具有保持多個(gè)匹配假設(shè)的潛能。
成人能否保持多個(gè)匹配假設(shè)還有待研究,但以往研究的初步發(fā)現(xiàn)表明,學(xué)習(xí)者保持多個(gè)匹配假設(shè)是困難的,尤其對(duì)于低齡學(xué)習(xí)者。因此,不同年齡段學(xué)習(xí)者在CSWL 中使用互斥性策略的方式不同,并以不同的機(jī)制促成了基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)(見(jiàn)表1)。
4.3 情境模糊性
情境模糊性指與目標(biāo)詞同時(shí)出現(xiàn)在一個(gè)情境內(nèi)的語(yǔ)義數(shù)量,同時(shí)出現(xiàn)的語(yǔ)義越多,情境模糊性越高。CSWL 研究常把情境模糊性的操作性定義設(shè)置為同一個(gè)試次中出現(xiàn)的語(yǔ)義個(gè)數(shù)(Hendrickson amp; Perfors,2019; Mulak et al., 2019)。在基于均勻分布的CSWL中,隨情境模糊性增高,CSWL效果逐漸降低(Mulaket al., 2019)。
Zipfian 分布扭轉(zhuǎn)了情境模糊性對(duì)CSWL的影響。Hendrickson 和 Perfors(2019)發(fā)現(xiàn),當(dāng)同一試次內(nèi)呈現(xiàn)3 對(duì)詞匯- 語(yǔ)義匹配時(shí),Zipfian 分布和均勻分布下詞匯學(xué)習(xí)的正確率沒(méi)有顯著差異;而當(dāng)同一試次內(nèi)呈現(xiàn)4 對(duì)詞匯- 語(yǔ)義匹配時(shí),Zipfian 分布下詞匯學(xué)習(xí)的正確率顯著高于均勻分布,特別是低頻詞的正確率也符合這一結(jié)果。
Zipfian 分布能夠促進(jìn)高情境模糊性的CSWL,很可能是因?yàn)橄啾扔诘颓榫衬:裕瑢W(xué)習(xí)者從高情境模糊性的CSWL 中獲得了更多的匹配假設(shè)。當(dāng)同一試次內(nèi)共同出現(xiàn)多個(gè)詞匯和語(yǔ)義時(shí),學(xué)習(xí)者可以按照詞匯- 語(yǔ)義共現(xiàn)規(guī)律,建立多個(gè)匹配假設(shè)。情境模糊性越高,從單一試次內(nèi)獲得的匹配假設(shè)越多。這些匹配假設(shè)有利于學(xué)習(xí)者使用互斥性策略推斷語(yǔ)義。因此,不同情境模糊性條件下,學(xué)習(xí)者能夠建立的匹配假設(shè)數(shù)量不同,導(dǎo)致學(xué)習(xí)者使用互斥性策略的方式不同,并以不同的機(jī)制促成了基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)(見(jiàn)表1)。
5 總結(jié)與展望
目前,CSWL 理論均建立在詞頻均勻分布的基礎(chǔ)上,而真實(shí)的語(yǔ)言學(xué)習(xí)情境為Zipfian 分布。因此,以往的CSWL 理論較難推及真實(shí)的語(yǔ)言學(xué)習(xí)情境。近期研究開(kāi)始關(guān)注Zipfian 分布下的CSWL,但不同的研究結(jié)論之間存在著激烈的爭(zhēng)論。為彌合以往研究之爭(zhēng),本文提出基于互斥性策略的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng),認(rèn)為Zipfian 分布下采用互斥性策略的CSWL具有明顯優(yōu)勢(shì)。
但是,目前偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng)仍是一種推測(cè),未來(lái)研究還需進(jìn)一步驗(yàn)證。現(xiàn)有研究考察的Zipfian 分布內(nèi)涵較為單一,不能覆蓋語(yǔ)言學(xué)研究中對(duì)Zipfian 分布的最新界定;外延比較局限,局限于拼音文字;主要以實(shí)驗(yàn)室研究為主,缺乏具備生態(tài)效度的真實(shí)情境研究。因此,未來(lái)研究應(yīng)從拓展Zipfian 分布的內(nèi)涵和擴(kuò)大Zipfian 分布的外延兩個(gè)方面豐富偏態(tài)優(yōu)勢(shì)效應(yīng)的基礎(chǔ)研究,以構(gòu)建新的語(yǔ)言學(xué)習(xí)理論;嘗試將基于Zipfian 分布的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng)應(yīng)用于真實(shí)詞匯學(xué)習(xí)情境,探討如何利用偏態(tài)優(yōu)勢(shì)效應(yīng)促進(jìn)語(yǔ)言學(xué)習(xí),以開(kāi)發(fā)新的語(yǔ)言學(xué)習(xí)方法。
第一,探究詞性與語(yǔ)義共同形成的Zipfian 分布下的CSWL。詞匯分為不同的詞性類(lèi)別,不同詞性類(lèi)別包含的詞匯量差異巨大。Lestrade(2017)對(duì)英文的語(yǔ)義和詞性進(jìn)行分析發(fā)現(xiàn),詞匯的這兩種特征在單獨(dú)作用下,均不足以形成詞頻的Zipfian 分布,但共同考察語(yǔ)義和詞性則可以。然而,目前有關(guān)Zipfian 分布的研究尚停留在語(yǔ)義層面。因此,未來(lái)研究應(yīng)探究詞性與語(yǔ)義共同形成的Zipfian 分布下的CSWL,并考察偏態(tài)學(xué)習(xí)優(yōu)勢(shì)效應(yīng)。
第二,考察并驗(yàn)證中文語(yǔ)料庫(kù)的Zipfian 定律和Zipfian 頻率效應(yīng)。有關(guān)Zipfian 定律的發(fā)現(xiàn)和研究主要針對(duì)拼音文字。即便是對(duì)中英雙語(yǔ)者的研究也只是關(guān)注第二語(yǔ)言——英語(yǔ)的學(xué)習(xí),尚未有研究使用中文材料探討Zipfian 定律和Zipfian 頻率效應(yīng)。然而,中文和英文分屬不同語(yǔ)系,兩種語(yǔ)言差異巨大。因此,未來(lái)研究應(yīng)考察中文語(yǔ)料庫(kù)是否符合Zipfian 定律,拓展有關(guān)Zipfian 分布的CSWL 研究,考察中文的偏態(tài)學(xué)習(xí)優(yōu)勢(shì)。
第三,系統(tǒng)考察社交線索等語(yǔ)言信息在CSWL中的作用。語(yǔ)言習(xí)得的社會(huì)語(yǔ)用理論強(qiáng)調(diào)社交線索對(duì)詞匯學(xué)習(xí)的重要性(Clark, 2009; Tsuji etal., 2020)。已有研究發(fā)現(xiàn)社交線索間接作用于CSWL。例如,社交線索增強(qiáng)學(xué)習(xí)者對(duì)目標(biāo)語(yǔ)義的識(shí)別,引導(dǎo)對(duì)語(yǔ)義目標(biāo)特征信息進(jìn)行優(yōu)先編碼等(Hadley amp; Dickinson,2019;MacDonald et al.,2017)。因此,未來(lái)研究應(yīng)考慮社交線索如何影響Zipfian 分布的CSWL,特別應(yīng)考察認(rèn)知策略(如互斥性策略等)與社交線索的雙重作用,完善和豐富CSWL 理論。
參考文獻(xiàn)
Bassani, H. F., amp; Araujo, A. F. R. (2019). A neural network architecture forlearning word-referent associations in multiple contexts. Neural Networks,117, 249-267.
Benitez, V. L., Yurovsky, D., amp; Smith, L. B. (2016). Competition between multiplewords for a referent in cross-situational word learning. Journal of Memory andLanguage, 90, 31-48.
Bloom, P. (2001). Précis of how children learn the meanings of words. Behavioraland Brain Sciences, 24 (6), 1095-1103.
Blythe, R. A., Smith, K., amp; Smith, A. D. M. (2010). Learning times for largelexicons through cross-situational learning. Cognitive Science, 34 (4), 620-642.
Bunce, J. P., amp; Scott, R. M. (2017). Finding meaning in a noisy world: Exploringthe effects of referential ambiguity and competition on 2·5-year-olds’cross-situational word learning. Journal of Child Language, 44(3), 650-676.
Clark, E. V. (2009). First language acquisition . Cambridge University Press.Fitneva, S. A., amp; Christiansen, M. H. (2017). Developmental changes in crosssituationalword learning: The inverse effect of initial accuracy. CognitiveScience, 41 (1), 141-161.
Frank, M. C., Goodman, N. D., amp; Tenenbaum, J. B. (2009). Using speakers'referential intentions to model early cross-situational word learning.Psychological Science, 20 (5), 578-585.
Hadley, E. B., amp; Dickinson, D. K. (2019). Cues for word-learning during sharedbook-reading and guided play in preschool. Journal of Child Language, 46(6),1202-1227.
Hendrickson, A. T., amp; Perfors, A. (2019). Cross-situational learning in a Zipfianenvironment. Cognition, 189, 11-22.
Hu, C. F. (2017). Resolving referential ambiguity across ambiguous situations inyoung foreign language learners. Applied Psycholinguistics, 38 (3), 633-656.
Kan, P. F., amp; Sadagopan, N. (2015). Speech practice effects on bilingual children'sfast mapping performance. Seminars in Speech and Language, 36 (2), 109-119.
Kurumada, C., Meylan, S. C., amp; Frank, M. C. (2013). Zipfian frequencydistributions facilitate word segmentation in context. Cognition, 127 (3), 439-453.
Lavi-Rotbain, O., amp; Arnon, I. (2019). Children learn words better in low entropy.Proceedings of the 41st Annual Conference of the Cognitive Science Society,Cognitive Science Society.
Lavi-Rotbain, O., amp; Arnon, I. (2020). The learnability consequences ofZipfian distributions: Word segmentation is facilitated in more predictabledistributions. PsychArchives.
Lavi-Rotbain, O., amp; Arnon, I. (2021). Visual statistical learning is facilitated inZipfian distributions. Cognition, 206, Article 104492.
Lestrade, S. (2017). Unzipping Zipf' s law. PLoS ONE, 12 (8), Article e0181987.MacDonald, K., Yurovsky, D., amp; Frank, M. C. (2017). Social cues modulate therepresentations underlying cross-situational learning. Cognitive Psychology,94, 67-84.
Mak, M. H. C., Hsiao, Y., amp; Nation, K. (2021). Anchoring and contextual variationin the early stages of incidental word learning during reading. Journal ofMemory and Language, 118, Article 104203.
Mulak, K. E., Vlach, H. A., amp; Escudero, P. (2019). Cross-situational learningof phonologically overlapping words across degrees of ambiguity. CognitiveScience, 43 (5), Article e12731.
Poepsel, T. J., amp; Weiss, D. J. (2016). The influence of bilingualism on statisticalword learning. Cognition, 152, 9-19.
Qu, J., Hu, L., Liu, X., Dong, J., Yang, R., amp; Mei, L. (2021). The contributions ofthe left hippocampus and bilateral inferior parietal lobule to form-meaningassociative learning. Psychophysiology, 58 (8), Article e13834.
Reisenauer, R., Smith, K., amp; Blythe, R. A. (2013). Stochastic dynamics of lexiconlearning in an uncertain and nonuniform world. Physical Review Letters,110 (25), Article 258701.
Repnik, K. M., Chondrogianni, V., amp; Sorace, A. (2021). Linking disambiguationand retention in a developmental eye-tracking study with monolingual andmultilingual children. Journal of Experimental Child Psychology, 206 , Article105072.
Roembke, T. C., amp; McMurray, B. (2021). Multiple components of statisticalword learning are resource dependent: Evidence from a dual-task learningparadigm. Memory and Cognition, 49 (5), 984-997.
Schuler, K. D., Reeder, P. A., Newport, E. L., amp; Aslin, R. N. (2017). The effect ofZipfian frequency variations on category formation in adult artificial languagelearning. Language Learning and Development, 13(4), 357-374.
Trueswell, J. C., Medina, T. N., Hafri, A., amp; Gleitman, L. R. (2013). Proposebut verify: Fast mapping meets cross-situational word learning. CognitivePsychology, 66 (1), 126-156.
Tsuji, S., Jincho, N., Mazuka, R., amp; Cristia, A. (2020). Communicative cues in theabsence of a human interaction partner enhance 12-month-old infants' wordlearning. Journal of Experimental Child Psychology, 191, Article 104740.
Vlach, H. A., amp; DeBrock, C. A. (2017). Remember dax? Relations betweenchildren’s cross-situational word learning, memory, and language abilities.Journal of Memory and Language, 93, 217-230.
Vogt, P. (2012). Exploring the robustness of cross-situational learning underZipfian distributions. Cognitive Science, 36 (4), 726-739.
Zettersten, M., amp; Saffran, J. R. (2021). Sampling to learn words: Adults andchildren sample words that reduce referential ambiguity. DevelopmentalScience, 24 (3), Article e13064.
Zipf, G. K. (1949). Human behavior and the principle of least effort: An introductionto human ecology. Addison-Wesley Press.
本研究得到教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目(20YJC190007)、國(guó)家自然科學(xué)基金青年項(xiàng)目(32200875)和江蘇省自然科學(xué)基金青年項(xiàng)目(BK20210564,BK20190701)的資助。