• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      兒童語言習(xí)得機(jī)制跨學(xué)科研究:進(jìn)展、問題和前景

      2021-01-11 08:33:35周鵬
      語言戰(zhàn)略研究 2021年1期
      關(guān)鍵詞:認(rèn)知科學(xué)跨學(xué)科人工智能

      周鵬

      提要 語言是由人類神經(jīng)生物屬性決定的一套認(rèn)知計算系統(tǒng),它使我們可以理解和產(chǎn)出無限的具有內(nèi)在結(jié)構(gòu)的語言單元。這套認(rèn)知計算系統(tǒng)在嬰兒出生后飛速發(fā)展,5歲左右的幼兒已經(jīng)接近成人水平。語言的發(fā)展和其他生物系統(tǒng)的發(fā)展一樣受內(nèi)在機(jī)制和外在環(huán)境的制約。本文回顧過去50年兒童語言習(xí)得研究領(lǐng)域關(guān)注的主要問題與爭論焦點,在此基礎(chǔ)上,闡釋了從跨學(xué)科視角對主要問題進(jìn)行的探索,對今后兒童語言習(xí)得研究實現(xiàn)語言學(xué)、認(rèn)知科學(xué)、發(fā)展心理學(xué)、神經(jīng)科學(xué)和人工智能等多學(xué)科融合的方向和路徑進(jìn)行展望,并提出,要真正實現(xiàn)多學(xué)科融合這一目標(biāo),新一代兒童語言習(xí)得研究者既要掌握語言學(xué)理論和認(rèn)知科學(xué)的實驗方法,還要善于同其他學(xué)科的研究者開展合作,以跨學(xué)科的方式來理解更為廣闊的語言、心智與大腦的關(guān)系。

      關(guān)鍵詞 兒童語言習(xí)得;跨學(xué)科;認(rèn)知科學(xué);神經(jīng)科學(xué);人工智能

      中圖分類號 H002 文獻(xiàn)標(biāo)識碼 A 文章編號 2096-1014(2021)01-0048-12

      一、引言

      語言是由人類神經(jīng)生物屬性決定的一套認(rèn)知計算系統(tǒng),它使我們可以理解和產(chǎn)出無限的具有內(nèi)在結(jié)構(gòu)的語言單元。這套認(rèn)知計算系統(tǒng)在嬰兒出生后飛速發(fā)展,5歲左右的幼兒已經(jīng)接近成人水平。語言的發(fā)展和其他生物系統(tǒng)的發(fā)展一樣受內(nèi)在機(jī)制和外在環(huán)境的制約。過去50年,語言習(xí)得研究者對決定兒童語言發(fā)展的內(nèi)在機(jī)制和外在因素進(jìn)行了廣泛而深入的研究,取得了一定的成果,但語言習(xí)得的內(nèi)在機(jī)制究竟是什么,外在環(huán)境因素究竟如何起作用,對這兩個問題的研究還存在較大的爭議和分歧。我們首先通過比較兒童語言習(xí)得領(lǐng)域的兩大主流理論——語言習(xí)得先天論和語言習(xí)得經(jīng)驗論——來討論該領(lǐng)域的主要研究問題和爭論焦點;然后闡釋從跨學(xué)科視角對主要問題進(jìn)行的探索,并對今后兒童語言習(xí)得研究的跨學(xué)科方向和路徑進(jìn)行展望(實現(xiàn)語言學(xué)、認(rèn)知科學(xué)、發(fā)展心理學(xué)、神經(jīng)科學(xué)和人工智能研究真正的交叉與融合)。

      語言習(xí)得先天論以普遍語法框架下的語言習(xí)得理論為代表,在Chomsky(1965)提出的生成語言學(xué)理論的基礎(chǔ)上發(fā)展而來,強(qiáng)調(diào)語言的特殊性與兒童語言習(xí)得的內(nèi)在性和先天性。語言習(xí)得先天論認(rèn)為兒童習(xí)得母語的過程中存在一個“柏拉圖問題”,即兒童早期獲得的語言知識與來自外界環(huán)境的語言輸入之間存在著極大的不一致和不對稱,他們獲得的語言知識遠(yuǎn)超外界語言輸入所能提供的信息。為了解決這一問題,語言習(xí)得先天論提出嬰兒出生時就已經(jīng)具備了一定的語言知識,這些內(nèi)在的、抽象的語言知識構(gòu)成了語言習(xí)得的初始狀態(tài),是兒童語言發(fā)展的基礎(chǔ)。隨著生成語言學(xué)理論的發(fā)展,關(guān)于內(nèi)在語言機(jī)制究竟以何種狀態(tài)存在的探討也在發(fā)生變化,但最核心的觀點始終是嬰兒一出生就具備先天的初始語言結(jié)構(gòu),該初始結(jié)構(gòu)指導(dǎo)他們的語言習(xí)得。

      語言習(xí)得經(jīng)驗論以基于語言使用框架的語言習(xí)得理論為代表,強(qiáng)調(diào)語言和語言習(xí)得的社會性和后天性,提出語言能力是社會認(rèn)知能力的一部分,兒童在語言交際和使用語言的過程中習(xí)得語言。語言習(xí)得經(jīng)驗論否認(rèn)先天語言知識的存在,提出兒童獲得語言需要依賴社會認(rèn)知能力的發(fā)展,通過觀察某個結(jié)構(gòu)在語境中的使用,慢慢掌握該結(jié)構(gòu)的功能和用法。該理論認(rèn)為語法知識就像一個庫存,里面存儲了所有通過語言輸入所習(xí)得的不同的語法結(jié)構(gòu)。每一個語法結(jié)構(gòu)都有一個特定的功能,兒童通過語境中的互動掌握該結(jié)構(gòu)和與其匹配的功能。語言習(xí)得經(jīng)驗論的一個基本觀點是:某個句法結(jié)構(gòu)在語言輸入中的頻率越高,就越容易被兒童抽象化,也就會越早地被習(xí)得。

      如果仔細(xì)分析以上兩大主流理論,就可以發(fā)現(xiàn)爭論的焦點主要集中在3個方面。(1)先天與后天的爭論,或者說先天與后天的關(guān)系問題,即嬰兒出生時就具備先天的語言結(jié)構(gòu)來指導(dǎo)其后天的學(xué)習(xí),還是所有的語言知識都是通過后天的學(xué)習(xí)獲得的。(2)語言的內(nèi)在表征究竟是什么?如果存在先天的語言結(jié)構(gòu),那先天結(jié)構(gòu)的表征方式是什么?(3)語言能力與非語言的認(rèn)知能力之間存在何種關(guān)系?過去50年,兒童語言習(xí)得研究者從跨學(xué)科的視角對這3方面的問題做了廣泛而深入的研究,但還遠(yuǎn)沒有定論。下面簡要回顧過去50年兒童語言習(xí)得研究者對上述問題的跨學(xué)科探索。

      二、語言學(xué)理論與認(rèn)知科學(xué)研究方法的結(jié)合

      首先是語言學(xué)理論與認(rèn)知科學(xué)研究方法的結(jié)合。從語言學(xué)視角對語言能力進(jìn)行理論建構(gòu),尤其是生成語言學(xué)借助數(shù)學(xué)和形式化的手段對語言能力進(jìn)行描寫和假設(shè),這使得語言學(xué)作為一門可檢測的科學(xué)成為可能。把語言學(xué)理論作為對人類語言能力的一種假設(shè),從而可以用科學(xué)實證的方法對其進(jìn)行檢驗,這是語言學(xué)發(fā)展歷程上的重要一步。洪堡特(Wilhelm von Humboldt)1836年就提出人類語言是“對有限規(guī)則的無限使用”,這是人類語言最本質(zhì)的特征。以喬姆斯基為代表的生成語言學(xué)理論的最大貢獻(xiàn)之一是采用數(shù)學(xué)等手段把洪堡特的上述論斷加以形式化,提出了一套用有限句法規(guī)則生成無限句子的關(guān)于人類語言能力的科學(xué)假設(shè),被稱為普遍語法理論。生成語言學(xué)理論為人類語言的內(nèi)在表征提供了一種假設(shè),也為兒童語言習(xí)得的初始結(jié)構(gòu)提供了一種假設(shè)。以遞歸性這一語言屬性為例,生成語言學(xué)提出人類語言具有自我生成的能力,小的結(jié)構(gòu)可以合并到大的結(jié)構(gòu)里,從而產(chǎn)生無限的新的結(jié)構(gòu)。在生成語言學(xué)框架下,通過合并實現(xiàn)的遞歸操作被認(rèn)為是人類語言的本質(zhì)屬性,也是狹義的語言機(jī)制的唯一組成部分,它從根本上區(qū)分了人類語言和動物有限的交際系統(tǒng)(Hauser et al.2002)。根據(jù)該理論,遞歸性應(yīng)該是作為先天的語言結(jié)構(gòu)的一部分存在于大腦中。但是,語言能力本質(zhì)上是一種認(rèn)知能力,純粹借助邏輯和形式化手段建構(gòu)出來的假設(shè)能在多大程度上被認(rèn)為是描述和解釋這種認(rèn)知能力的一種科學(xué)理論?隨著認(rèn)知科學(xué)和腦科學(xué)的發(fā)展,研究者普遍認(rèn)為對語言能力的理論建構(gòu)必須要結(jié)合心理學(xué)和生物學(xué)視角。

      20世紀(jì)50年代以來,研究者采用認(rèn)知科學(xué)的研究方法,從兒童“可學(xué)性”的視角檢驗生成語言學(xué)理論對語言能力本質(zhì)屬性的假設(shè)是否準(zhǔn)確。兒童語言習(xí)得的研究方法隨著認(rèn)知科學(xué)手段的不斷改進(jìn)和更新也在不斷完善,并逐漸走向系統(tǒng)化和標(biāo)準(zhǔn)化。兒童語言習(xí)得主要通過兒童的語言行為研究其語言能力。語言能力是人類內(nèi)在語言知識的總和,包含語音、詞匯、句法、語義、語用等各個方面的知識;語言行為則是語言在使用中的行為,是語言能力具體的、外在的反映。由于語言能力是抽象、內(nèi)在的,研究者無法直接對其進(jìn)行測量,只能通過對語言行為的考察,間接檢測語言能力。而語言行為往往會受到工作記憶、注意力、疲勞、壓力等非語言因素的影響,因此要通過語言行為有效檢測語言能力,必須找到合適的研究方法控制這些非語言因素的干擾。語言能力又可以從產(chǎn)出和理解兩方面考察,分別為產(chǎn)出性語言和理解性語言。產(chǎn)出性語言是指語言產(chǎn)出的能力,其語言行為主要考察指標(biāo)是兒童能否產(chǎn)出合乎語法的語言結(jié)構(gòu);理解性語言是指語言理解的能力,其語言行為主要考察指標(biāo)是兒童能否正確理解語言結(jié)構(gòu)。對產(chǎn)出性語言和理解性語言的考察往往采用不同的實證研究方法。

      兒童語言習(xí)得的研究方法一般分為兩類:自然語料法和實驗方法。自然語料法指的是研究者通過觀察和采集自然情境下兒童自發(fā)性產(chǎn)出的語料來研究兒童獲得的語言知識的方法。一般自然語料法多用在考察兒童的產(chǎn)出性語言(如李宇明2019)。實驗方法指的是研究者通過控制實驗任務(wù)中不同的實驗條件來考察兒童的語言行為,從而推斷其獲得的語言知識的方法。實驗方法又可分為行為實驗和神經(jīng)影像實驗方法。研究兒童語言獲得的行為實驗方法主要包括:圖片辨識任務(wù)、動作演示任務(wù)、真值判斷任務(wù)、誘發(fā)性產(chǎn)出任務(wù)、跨通道注視偏好范式以及眼動追蹤的視覺一情境范式等。研究兒童語言獲得的神經(jīng)影像學(xué)方法主要包括:腦電圖(EEG)、腦磁圖(MEG)、功能性磁共振成像(fMRI)以及功能性近紅外光學(xué)成像(fNIRS)等。

      研究兒童語言的一條重要原則是,無論采用何種實驗方法,都要把握兒童友好化的任務(wù)設(shè)計要求。其中兩個具有代表性的行為實驗方法是真值判斷任務(wù)和誘發(fā)性產(chǎn)出任務(wù)(Crain&Thornton 1998)。真值判斷任務(wù)考察兒童的理解性語言。該實驗任務(wù)需要兩位實驗者,一位用玩具表演故事,另一位扮演小木偶和兒童一起觀看表演。表演結(jié)束時,“小木偶”要告訴兒童故事講了什么,兒童的任務(wù)是評判“小木偶”說得對不對?!靶∧九肌睂适碌拿枋鐾褪菍嶒炚呦M疾斓恼Z言知識,而兒童對“小木偶”描述的判斷可以準(zhǔn)確反映他是否掌握了該語言知識。誘發(fā)性產(chǎn)出任務(wù)考察兒童的產(chǎn)出性語言。該實驗任務(wù)同樣需要兩位實驗者,一位用玩具表演故事,另一位扮演小木偶和兒童一起觀看表演。實驗中的“小木偶”往往被設(shè)置成注意力不集中,也非常健忘的角色,所以他經(jīng)常會忘記故事里面發(fā)生了什么。表演結(jié)束時,“小木偶”會問孩子一個問題,兒童的任務(wù)是回答這個問題,從而幫“小木偶”更好地理解故事?!靶∧九肌钡膯栴}一般是誘發(fā)兒童產(chǎn)出目標(biāo)語言結(jié)構(gòu)的關(guān)鍵,而兒童對問題的回答可以準(zhǔn)確反映出他是否能夠產(chǎn)出目標(biāo)結(jié)構(gòu)。這兩個實驗任務(wù)的共同點在于實驗者通過故事創(chuàng)造了考察目標(biāo)語言結(jié)構(gòu)的合理語境,減輕了兒童受到的認(rèn)知加工等非語言因素的干擾;同時通過“小木偶”與兒童的互動創(chuàng)造了兒童友好的環(huán)境,讓兒童能夠在輕松的環(huán)境中更真實地展現(xiàn)出其語言能力。

      我們以“遞歸”為例,展示如何使用實驗方法來考察語言學(xué)的理論假設(shè),尤其是對于先天語言結(jié)構(gòu)的假設(shè)。上文已討論,生成語言學(xué)理論提出通過合并實現(xiàn)的遞歸操作是人類語言的本質(zhì)屬性,它從根本上區(qū)分了人類語言和動物的有限交際系統(tǒng)。根據(jù)該理論,“遞歸”應(yīng)該是作為先天語言結(jié)構(gòu)的一部分存在于大腦中。而作為先天結(jié)構(gòu),它應(yīng)該呈現(xiàn)以下3個特征:(1)兒童在語言發(fā)展早期就應(yīng)該能夠理解遞歸結(jié)構(gòu),使用遞歸操作;(2)兒童對語言遞歸性的掌握應(yīng)具有普遍性,不受某種特定語言的制約,換言之,英語母語、漢語母語以及其他母語背景的兒童都應(yīng)具備遞歸操作的能力;(3)對語言遞歸性的掌握不依賴于外界的語言刺激,在語言刺激貧乏的條件下,兒童也應(yīng)該具備遞歸操作的能力(Chomsky 1959,1980)。研究者采用上文介紹的真值判斷任務(wù)和誘發(fā)性產(chǎn)出任務(wù)對該理論假設(shè)進(jìn)行了檢驗,結(jié)果發(fā)現(xiàn)英語和漢語母語兒童利用少量的語言輸入便可以理解和產(chǎn)出無限的句子,且通常情況下他們都是利用小的句法單元(如詞和短語)組合成大的句法單元(如句子)(詳見施嘉偉,等2019;Giblin et al.2019)。這些研究結(jié)果從兒童語言習(xí)得的角度支持了“遞歸”是人類語言能力的本質(zhì)屬性之一。兒童在先天結(jié)構(gòu)的指導(dǎo)下利用少量語言輸入便可以迅速有效地習(xí)得相關(guān)語言知識。

      通過上文的闡釋,我們也想強(qiáng)調(diào)語言學(xué)理論與認(rèn)知科學(xué)研究方法相融合的兒童語言習(xí)得研究的重要性。語言學(xué)理論為理解兒童的語言行為和語言發(fā)展提供了一個視角和框架,幫助我們更清晰地解釋和預(yù)測相關(guān)現(xiàn)象。沒有一個語言現(xiàn)象是孤立存在的。要更好地理解這些現(xiàn)象及其彼此間的關(guān)聯(lián),就必須要有理論體系的指導(dǎo)。語言學(xué)理論可以讓我們在描述兒童語言行為的同時解釋其語言行為背后的機(jī)制。通過語言學(xué)理論所提供的概念和技術(shù)手段,我們可以更清楚合理地解釋兒童如何習(xí)得語言,為什么語言習(xí)得會呈現(xiàn)特定的軌跡和發(fā)展特征,以及不同的語言成分在習(xí)得過程中如何互動。語言學(xué)理論是兒童語言習(xí)得研究的基礎(chǔ)和出發(fā)點。研究者從理論出發(fā),形成自己的研究假設(shè),并用兒童語言實驗檢驗研究假設(shè)。同時,實驗所獲得的兒童語言數(shù)據(jù)又可以回饋理論,檢驗現(xiàn)有的語言學(xué)理論是否正確反映兒童語言的內(nèi)在表征和初始結(jié)構(gòu)。

      三、兒童語言習(xí)得與神經(jīng)科學(xué)的結(jié)合

      對語言本質(zhì)問題的探究離不開神經(jīng)科學(xué),要探討語言結(jié)構(gòu)的初始狀態(tài)就必須研究語言發(fā)展的神經(jīng)生物基礎(chǔ)。但人類大腦極其復(fù)雜,可能是人類所認(rèn)知的宇宙中最復(fù)雜的系統(tǒng)。人類大腦約有860億個神經(jīng)元,每個神經(jīng)元又有上千個突觸和其他神經(jīng)元相連接,構(gòu)成非常復(fù)雜的連接網(wǎng)絡(luò),而每一個突觸又都是一個復(fù)雜的個體,內(nèi)含數(shù)千種不同的信號傳輸?shù)鞍?。同時,人的大腦又是高度結(jié)構(gòu)化的,不同的腦區(qū)有不同的功能。大腦活動在代謝上是有代價的,是消耗大腦資源的。我們做任何活動,使用的都只是大腦整合的部分資源,在這個過程中,有一些腦區(qū)是活躍的,另一些是不活躍的。如枕葉皮層一般在實施視覺功能時是活躍的,小腦一般在實施動知覺協(xié)調(diào)功能時是活躍的。我們所有的認(rèn)知活動都是通過特定腦區(qū)的神經(jīng)活動產(chǎn)生和實現(xiàn)的。由于大腦的高度復(fù)雜化,對大腦語言機(jī)制的研究還遠(yuǎn)遠(yuǎn)沒有定論,對處理語言的大腦結(jié)構(gòu)的認(rèn)知還遠(yuǎn)遠(yuǎn)不足,對兒童語言發(fā)展的大腦機(jī)制的探討則更為有限。

      自Lenneberg(1967)探討語言的生物機(jī)制,提出語言習(xí)得的關(guān)鍵期假說以來,研究者開始探索兒童如何能在如此短的時間內(nèi)獲得如此多的語言知識,其背后的神經(jīng)生物基礎(chǔ)是什么。但至今相關(guān)研究仍然較少,尤其是針對0~3歲這個語言發(fā)展關(guān)鍵階段的內(nèi)在生物機(jī)制的探討。此外,基于目前研究得出的結(jié)論仍有待實證研究的進(jìn)一步檢驗。有研究提出,大腦發(fā)育過程中灰質(zhì)減少和白質(zhì)增加可能與語言習(xí)得的敏感度及語言習(xí)得的關(guān)鍵期存在緊密關(guān)聯(lián)。其中比較有影響的一個猜想是由德國神經(jīng)科學(xué)和分子生物學(xué)家Nave提出的,他認(rèn)為白質(zhì)纖維束的髓鞘化(新生兒神經(jīng)系統(tǒng)發(fā)育必不可少的過程,神經(jīng)節(jié)細(xì)胞制造出絕緣的脂質(zhì)鞘包裹在某些神經(jīng)元的軸突外,起到絕緣作用,可以提高神經(jīng)沖動的傳導(dǎo)速度和保護(hù)軸突)和語言學(xué)習(xí)的敏感度直接關(guān)聯(lián);髓鞘化的過程強(qiáng)化了已經(jīng)建立的神經(jīng)網(wǎng)絡(luò)連接,并抑制了目標(biāo)區(qū)域新的神經(jīng)元的生長。運用到語言習(xí)得上,白質(zhì)髓鞘化尚未完成時,白質(zhì)纖維束是靈活、具有可塑性的,因此大腦學(xué)習(xí)語言的能力就比較強(qiáng);而隨著髓鞘的增加及髓鞘化的完成,白質(zhì)纖維束就固定了,因此大腦的可塑性就降低了,語言學(xué)習(xí)的能力也就變?nèi)趿?。Berwick&Chomsky(2016)也提出核心句法能力的發(fā)展或許與連接大腦語言區(qū)域的弓狀束的發(fā)育存在關(guān)聯(lián)。圖1是成人和新生兒大腦弓狀束的對比(灰影部分):和成人相比,新生兒負(fù)責(zé)句法層級結(jié)構(gòu)加工等核心操作的弓狀束部分尚未髓鞘化,該大腦結(jié)構(gòu)特征可能和語言習(xí)得的關(guān)鍵期和敏感度直接相關(guān)。顯然,探討白質(zhì)纖維束的發(fā)育和語言學(xué)習(xí)敏感度之間的關(guān)聯(lián)是今后研究語言習(xí)得的神經(jīng)生物基礎(chǔ)的一個重要方向和突破口。我們需要探討:是髓鞘的增加導(dǎo)致了句法核心操作的產(chǎn)生,還是因為復(fù)雜句法的產(chǎn)生導(dǎo)致了髓鞘的增加?

      四、兒童語言習(xí)得與人工智能的結(jié)合

      兒童語言習(xí)得的一個重要研究目的是探索人類語言能力的本質(zhì),而人工智能的重要研究領(lǐng)域之一是對人類語言智能的模擬。兩者都是從學(xué)習(xí)的角度探索如何獲得語言這一人類最高智能。但是目前的人工智能研究對語言智能的模擬顯然存在明顯的短板。我們首先簡要概述人工智能在自然語言處理方面的困境和不足,然后對比兒童語言習(xí)得的特征,探討兒童認(rèn)知啟發(fā)下的語言智能研究以及兒童語言習(xí)得與人工智能相融合的路徑。

      諾貝爾經(jīng)濟(jì)學(xué)獎獲得者、心理學(xué)家Kahneman在他的暢銷書《思考,快與慢》中把人的認(rèn)知過程分成兩個范疇:系統(tǒng)一和系統(tǒng)二。當(dāng)前人工智能發(fā)展主要依賴于深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),其優(yōu)勢在于能夠準(zhǔn)確識別視覺、聽覺等客觀世界的實體,基本實現(xiàn)了人腦的感知功能,該部分通常被稱為系統(tǒng)一。人腦跟今天的人工智能相比,還存在記憶、語言和符號推理這樣的內(nèi)生體系,可以脫離物理世界的實體,獨立演化并支撐人腦的高級認(rèn)知功能,從而讓人類智能呈現(xiàn)更強(qiáng)的泛化能力、可解釋性以及創(chuàng)造力,這部分通常被稱為系統(tǒng)二。而當(dāng)前的人工智能對系統(tǒng)二的模擬存在著較大的困境,尤其是對語言的理解與認(rèn)知。

      深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種方法。機(jī)器學(xué)習(xí)是讓機(jī)器通過數(shù)據(jù)進(jìn)行學(xué)習(xí),它是人工智能的一個子領(lǐng)域,其背后的主要推動力是大數(shù)據(jù)。Rosenblatt早在20世紀(jì)50年代就建立了一個神經(jīng)網(wǎng)絡(luò),它是最早的機(jī)器學(xué)習(xí)系統(tǒng)之一,建立的目的是希望機(jī)器純粹依靠數(shù)據(jù)就能夠進(jìn)行物體識別。但是顯然那個時候的神經(jīng)網(wǎng)絡(luò)系統(tǒng)能力不足,主要是硬件能力不足和數(shù)據(jù)量不足。2012年左右,大數(shù)據(jù)革命的到來改變了這種困境。這種改變的發(fā)生其實不是因為神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)算法有了重大突破,大多數(shù)的算法在20世紀(jì)80年代就已經(jīng)存在了。重大突破主要源自硬件上的突破,深度學(xué)習(xí)的代表人物Hinton、Bengio和LeCun找到了利用圖形處理器(graphics processing unit,GPU)極大提高神經(jīng)網(wǎng)絡(luò)性能的方法。圖形處理器使訓(xùn)練更深度的神經(jīng)網(wǎng)絡(luò)(即包含更多層級的類似神經(jīng)元的網(wǎng)絡(luò)節(jié)點組合)成為了可能,因而極大提高了訓(xùn)練的速度和效果。

      盡管深度學(xué)習(xí)網(wǎng)絡(luò)在視覺等感知領(lǐng)域取得了重大的突破,但是在更高階的抽象思維、語言和符號推理等方面還存在較大的困境。對系統(tǒng)二的突破以及系統(tǒng)一與系統(tǒng)二的融合必然將占據(jù)第三代人工智能發(fā)展的關(guān)鍵位置。機(jī)器學(xué)習(xí)要實現(xiàn)抽象思維能力,就必須解決如何模擬表達(dá)復(fù)雜思維的語言系統(tǒng)的問題。深度學(xué)習(xí)網(wǎng)絡(luò)非常擅長學(xué)習(xí)關(guān)聯(lián),如圖像/聲音和對應(yīng)標(biāo)簽之間的關(guān)聯(lián),但在句子理解上卻存在很大的困難。這主要有兩個原因。

      第一,缺乏對句子結(jié)構(gòu)化的內(nèi)在表征,缺乏對抽象語義的準(zhǔn)確表征。我們首先來看一看深度學(xué)習(xí)網(wǎng)絡(luò)是如何模擬語言的。該領(lǐng)域的開創(chuàng)者和領(lǐng)軍人Hinton提出了一個“思維向量(thought vectors)”的概念(Hinton et al.1999)。簡單來說,一個向量就是一個數(shù)字串,如[39.9042°N,116.4074°E]表示的是北京這座城市的經(jīng)緯度。在深度學(xué)習(xí)網(wǎng)絡(luò)中,每一個輸入和輸出都是用向量來表示的,網(wǎng)絡(luò)中的每一個神經(jīng)元節(jié)點都給相關(guān)的向量貢獻(xiàn)一個數(shù)字。思維最基本的單元如果是詞的話,那么在深度學(xué)習(xí)網(wǎng)絡(luò)中就需要用向量來給詞編碼。用向量來給詞語編碼也是目前深度學(xué)習(xí)領(lǐng)域正在嘗試和探索的,其中一個重要編碼方式是“任何兩個意義相近的詞都用相似的向量來表示”。例如,如果“貓”這個詞用數(shù)字串[0,1,-0.3,0.3]來編碼,那么“狗”這個詞可能就用另一個相近的數(shù)字串[0,1,-0.25,0.35]來編碼。Mikolov等人發(fā)明的詞向量模型(Word2Vec)就是運用這個理念來給詞語編碼的。這個詞向量模型里的每一個詞向量都由200~300個數(shù)字組成,這些數(shù)字是基于大量文本中大概率出現(xiàn)在它附近的詞所得出的。以“鋼琴”這個詞為例,通過大量的文本分析,可以發(fā)現(xiàn)它經(jīng)常出現(xiàn)在“彈”和“音樂”這樣的詞,以及人名“莫扎特”“貝多芬”“肖邦”和“舒伯特”的附近。同樣,它出現(xiàn)在“小提琴”和“大提琴”附近的概率要顯著高于“金融”和“基金”這樣的詞。搜索引擎就是利用詞向量這樣的技術(shù)來確定近義詞的,亞馬遜的產(chǎn)品搜索引擎也是采用了相同的技術(shù)。

      詞向量模型也可以在一定程度上進(jìn)行語言類推。例如,當(dāng)給出英語句子“Man is to woman as king is to_____”,并要求在橫線處填補(bǔ)合適的詞語時,通過詞向量模型,把表征詞語“king”和“woman”的數(shù)字相加,然后減去表征“man”的數(shù)字,這樣得到的最近向量表征就是正確答案“queen”??雌饋碓~向量模型似乎不需要借助詞語的內(nèi)在概念表征(如“king”的概念、“woman”的概念等)就可以準(zhǔn)確進(jìn)行語言類推?;趯ο嚓P(guān)語言現(xiàn)象的研究成果,Hinton提出可以把詞向量擴(kuò)展到句子向量,從而最終實現(xiàn)思維向量這個理念。他提出,既然用向量的方法可以表示詞匯,那么也可以用向量的形式表示句子。用向量來表示句子,就可以完全擺脫用語言學(xué)概念(如層級樹形圖的方式)來表征句子,因為層級樹形結(jié)構(gòu)和深度神經(jīng)網(wǎng)絡(luò)在技術(shù)層面能夠?qū)崿F(xiàn)的互動非常不理想。

      但是,我們需要指出的是,句子和詞是非常不同的。詞向量模型在某些條件下可以不借助詞的內(nèi)在概念表征,而直接通過考察該詞在不同語境下的使用情況,用向量去推測該詞的意義。通過模擬在不同語境中的使用,基本可以準(zhǔn)確表達(dá)一個詞的意義,比如“貓”這個詞的意義基本可以近似為大數(shù)據(jù)語境中所有對“貓”的使用情況的一個平均值,深度學(xué)習(xí)網(wǎng)絡(luò)中通常用向量空間中的點云來表示。但詞義是相對穩(wěn)定的,而句子則不同,我們每天都產(chǎn)出和理解非常多的新句子,并且每個句子都不一樣。以漢語中“不”“怕”和“辣”為例,可以組合成5個合語法的句子結(jié)構(gòu):“辣不怕”“不怕辣”“怕不辣”“辣怕不”和“怕辣不”(不可以說“不辣怕”)。該例子說明,簡單變換一下詞序,句子的意義就會不同。用向量方式把看起來相似的句子簡單組合起來,是很難表征復(fù)雜的句子結(jié)構(gòu)關(guān)系的。事實上,句子的結(jié)構(gòu)關(guān)系可以更復(fù)雜,上述5個句子結(jié)構(gòu)又可以各自自我生成,從而產(chǎn)生無限的新句子,而每個新句都具有不一樣的意義。以“不怕辣”為例,可以擴(kuò)展為“恬恬不怕辣”“康康說過恬恬不怕辣”“美美記得康康說過恬恬不怕辣”,以至無窮。這種通過遞歸操作實現(xiàn)的人類語言和思維的組合性是實現(xiàn)句子理解的關(guān)鍵,句子的語義不是簡單統(tǒng)計意義上各個組成部分的語義的平均。

      上文說過,生成語言學(xué)家用層級樹形圖來表征句子的內(nèi)部結(jié)構(gòu)。通過高度結(jié)構(gòu)化的內(nèi)在表征,句子中的每一個成分都有自己特定的位置,每個成分之間都有特定的關(guān)系。因此,盡管有些句子由相同成分組成,但是由于其成分之間句法結(jié)構(gòu)關(guān)系的不同,最終的句法結(jié)構(gòu)也就不一樣,這就決定了它們有不同的語義解讀。缺乏這樣高度結(jié)構(gòu)化的句子內(nèi)在表征方式,深度學(xué)習(xí)網(wǎng)絡(luò)在表征人類復(fù)雜語言結(jié)構(gòu)時就會出現(xiàn)困境,也就談不上表征復(fù)雜思維了。深度學(xué)習(xí)網(wǎng)絡(luò)要在該問題上有所突破,就必須解決一個核心問題:如何從句子成分的意義得出句子的整體意義?目前用向量來表征的方式顯然不能解決該核心問題。此外,語言理解中至關(guān)重要的一環(huán)是對抽象語義的表征,而深度學(xué)習(xí)似乎是故意模糊這種對抽象語義的準(zhǔn)確表征。用向量來模糊表示相關(guān)語義特征,缺乏準(zhǔn)確性,因此很難做到可靠,魯棒性(robustness)也就會大打折扣。這也就不難理解深度學(xué)習(xí)網(wǎng)絡(luò)為什么很難進(jìn)行抽象的推論,缺乏對知識進(jìn)行準(zhǔn)確內(nèi)在表征的學(xué)習(xí)模型是很難對知識進(jìn)行可靠的抽象類推的。正如機(jī)器學(xué)習(xí)領(lǐng)域知名學(xué)者Geman所指出的:深度學(xué)習(xí)網(wǎng)絡(luò)的最大挑戰(zhàn)不是學(xué)習(xí)本身,而是如何建立準(zhǔn)確的知識表征(Geman et al.1992)。要突破語言理解(尤其是句子理解)的困境,最重要的方向之一就是建立準(zhǔn)確的句子表征方式。

      兒童語言習(xí)得的特征可以很好地啟發(fā)人工智能對語言理解的探索。上文已經(jīng)討論,先天的語言結(jié)構(gòu)在兒童語言習(xí)得中的重要作用,尤其是兒童先天具備的通過遞歸操作實現(xiàn)的人類語言和思維的組合性更是抽象思維發(fā)展的關(guān)鍵。兒童在先天結(jié)構(gòu)的指導(dǎo)下,通過后天與語言環(huán)境的互動,迅速習(xí)得抽象句法和語義概念。我們已經(jīng)討論過兒童對遞歸的習(xí)得,下面來看兒童對抽象語義推理的習(xí)得。這是發(fā)生在一對父母及其5歲兒子Alexander之間的一段簡短對話(詳見Marcus&Davis 2019):

      Alexander:What's chest-deep water?

      Mama:Chest-deep water is water that comes up to your chest.

      Papa:It's different for each person.Chest-deep for me is higher than it would be for you.

      Alexander:Chest-deep for you is head-deep for me.

      我們發(fā)現(xiàn),Alexander只需極少的語言輸入就可以對語義概念進(jìn)行靈活的擴(kuò)展和類推。他掌握了“chest-deep”(齊胸深)后,迅速靈活地類推和擴(kuò)展到“head-deep”(齊頭深)。而這樣的推理方式是兒童習(xí)得抽象語義的重要手段(另見De Villiers&Roeper 2011)。通過對比機(jī)器學(xué)習(xí)和兒童語言習(xí)得,我們發(fā)現(xiàn)兒童的習(xí)得方式是:先天結(jié)構(gòu)(高度結(jié)構(gòu)化的內(nèi)在表征)+小數(shù)據(jù),而這樣的學(xué)習(xí)效果要顯著優(yōu)于主要依靠大數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)的效果。從中我們能夠得到一個重要啟發(fā):初始結(jié)構(gòu)越豐富,最終的學(xué)習(xí)效果越佳。但是目前人工智能領(lǐng)域似乎還是被“白板說”思想所支配,認(rèn)為一切知識都來源于學(xué)習(xí),而忽視先天結(jié)構(gòu)的重要作用。

      第二,缺乏多樣化的語言加工方式。人類理解世界的方式從來都是自上而下和自下而上方式的融合。我們用自己的先驗知識指導(dǎo)我們對接收到的新信息的處理,而新信息也會讓我們對已有知識結(jié)構(gòu)進(jìn)行調(diào)整。語言理解也是如此。先驗知識在理解非字面意思時扮演著至關(guān)重要的角色。例如,餐廳的兩個服務(wù)員在聊天,一個說“剛才那個紅帽子要了一塊蛋糕”,另一個說“我那桌的青椒肉絲點了一杯橙汁”。聽到這兩句對話,沒有人會理解為“有一頂紅色的帽子突然感到饑餓,所以點了一塊蛋糕”,或者“桌子上的那盤青椒肉絲突然感到口渴,所以點了一杯橙汁”,所有人都能推論出“紅帽子”和“青椒肉絲”在該語境中指的是餐廳中特定的顧客,因為我們的世界知識告訴我們“紅帽子”和“青椒肉絲”是沒有生命和感知的。

      同樣,在語言加工過程中,我們可以迅速利用已經(jīng)獲得的語言信息自上而下去預(yù)測即將出現(xiàn)的語言信息,從而快速有效地理解相關(guān)語言結(jié)構(gòu)。這是人類信息整合加工的一項重要能力。大量研究表明,兒童剛出生時,句法加工裝置就具備了利用已有語言信息對未出現(xiàn)的語言信息進(jìn)行預(yù)測的能力。這種能力通常被稱為漸進(jìn)式語言加工。漸進(jìn)式語言加工作為先天屬性,使得兒童可以在聽到句子時利用已有信息建立臨時句法和語義表征,從而預(yù)測即將出現(xiàn)的語言信息,并及時把相關(guān)信息整合到已有的表征中,達(dá)到迅速有效地理解句子的效果。例如,Zhou et al,(2019)對3歲漢語普通話兒童進(jìn)行了利用已有語言信息預(yù)測即將出現(xiàn)的語言信息的眼動模式實驗:聽句(1)和句(2),同時給他們看視覺場景(圖2)。

      (1)康康要去吃地上的蛋糕。

      (2)康康要去找地上的蛋糕。

      句(1)中的動詞“吃”只能選擇視覺場景中的蛋糕作為它的論元,而句(2)中的動詞“找”可以選擇視覺場景中的任何一個物體作為它的論元。Zhou et al.(2019)發(fā)現(xiàn),3歲兒童聽到“吃”時比聽到“找”時要更多地看向視覺場景中的蛋糕區(qū)域。這個眼動效應(yīng)出現(xiàn)在他們聽到“蛋糕”之前,說明3歲兒童呈現(xiàn)出利用已有語言信息預(yù)測即將出現(xiàn)的語言信息的眼動模式。這種眼動模式通常被稱為預(yù)測性眼動,是證明兒童自上而下加工語言信息的重要行為指標(biāo)。

      從兒童語言加工的視角,我們發(fā)現(xiàn)嬰兒剛出生時對語言信息的處理就采用自上而下和自下而上相融合的模式,是先天規(guī)則結(jié)構(gòu)與后天數(shù)據(jù)相結(jié)合的混合處理系統(tǒng)。英語兒童對動詞過去式的習(xí)得是混合處理模式的一個經(jīng)典例子。英語動詞過去式的形成有兩種方式:一是直接在動詞后加上“ed”,被稱為規(guī)則形式;另一種是不規(guī)則形式,如go-went、break-broke。Marcus et al.(1992)考察了英語兒童在習(xí)得動詞過去式的過程中出現(xiàn)的過度規(guī)則化現(xiàn)象,即用規(guī)則形式“+ed”來表示不規(guī)則動詞,如他們經(jīng)常在對話中使用的“breaked”“goed”,提出了英語兒童動詞過去式習(xí)得的混合模型:兒童產(chǎn)出規(guī)則動詞形式是通過運用規(guī)則,產(chǎn)出不規(guī)則動詞形式是通過關(guān)聯(lián)網(wǎng)絡(luò)。這個混合系統(tǒng)中兩條通路共存并互相補(bǔ)充;兒童對規(guī)則動詞過去式的習(xí)得只需要使用規(guī)則類推,很少消耗記憶資源;而對不規(guī)則動詞過去式的習(xí)得則需要消耗記憶資源,需要記憶資源建立動詞原形和過去式形態(tài)之間的關(guān)聯(lián)。

      但目前機(jī)器學(xué)習(xí)的主流趨勢似乎是和兒童的混合加工方式相反的,它趨向建構(gòu)端到端模型,模型使用單一的加工方式和簡單的同質(zhì)性機(jī)制,缺乏內(nèi)在的復(fù)雜結(jié)構(gòu)。但是忽視認(rèn)知系統(tǒng)的復(fù)雜性,而用一條簡單的放之四海而皆準(zhǔn)的萬能原則(算法)去模擬人類智能,似乎是錯誤的方向,因為自然界中復(fù)雜生物智能的特點,或者說真正具備智能的系統(tǒng),一般都是極其復(fù)雜的,就像人類的大腦一樣。任何提出把智能還原成一條簡單的萬能原則(算法)的理論基本上都是不可能實現(xiàn)的(Marcus&Davis 2019)。現(xiàn)在的機(jī)器學(xué)習(xí)要有所突破,必須解決的一個問題就是如何找到自上而下和自下而上加工的融合方式。

      五、跨學(xué)科探索的總結(jié)與展望

      上文介紹了兒童語言習(xí)得研究關(guān)注的主要問題以及跨學(xué)科視角下的嘗試和探索,研究的爭論焦點是語言習(xí)得先天與后天的問題。先天是自然進(jìn)化的產(chǎn)物,是作為基因遺傳的方式而先天存在的知識結(jié)構(gòu),后天則是需要通過學(xué)習(xí)獲得的知識結(jié)構(gòu)。過去50年的兒童語言習(xí)得研究告訴我們,這樣的截然兩分是有問題的。生物學(xué)、腦科學(xué)和發(fā)展心理學(xué)等研究也都有充足的證據(jù),表明對高級智能的發(fā)展進(jìn)行先天與后天的截然兩分和對立并不合理,先天和后天在生物個體的發(fā)展過程中是密不可分、緊密協(xié)作的。Marcus(2004)對兩者的關(guān)系作了形象的比喻:個體基因是先天和后天合作的一個杠桿。每一個基因就像計算機(jī)程序中的“IF-THEN”條件語句,其中“THEN”主句規(guī)定了某個組成基因的特定的蛋白質(zhì),但這個特定的蛋白質(zhì)只有在某些特定的化學(xué)信號得到滿足的條件下才能形成,這就是“Ⅲ”從句所規(guī)定的條件,每一個基因都有它特定的“Ⅲ”條件。這個結(jié)果就像一套自適應(yīng)但又高度壓縮的電腦程序(它有特定的公式和算法),個體細(xì)胞可以根據(jù)它們的環(huán)境自主實施這套程序。學(xué)習(xí)的產(chǎn)生就是基于這樣一套系統(tǒng),先天和后天交互作用的過程就是學(xué)習(xí)產(chǎn)生的過程。同樣,過去50年兒童語言習(xí)得的跨學(xué)科研究已經(jīng)表明,語言發(fā)展是先天結(jié)構(gòu)與外在語言環(huán)境交互作用的結(jié)果。

      但是很多學(xué)者(包括人工智能研究者)似乎都忽略了自然界生物智能的這一特點,忽視或者低估了大腦中的先天結(jié)構(gòu)在智能架構(gòu)和學(xué)習(xí)中的重要性,而過分強(qiáng)調(diào)學(xué)習(xí)的重要性。我想很大一個原因是這些研究者存在一個理解上的誤區(qū),認(rèn)為他們研究的主體是學(xué)習(xí),先天知識結(jié)構(gòu)在該過程中并沒有太大的價值。但是正如我們在上文所討論的,在自然界生物體的發(fā)展過程中,先天的知識結(jié)構(gòu)起著非常重要的作用,先天和后天并不矛盾,而高級智能體(如人類)的學(xué)習(xí)正是基于這樣一種先天和后天互動的架構(gòu)。

      與其關(guān)注先天與后天的爭論,今后的兒童語言習(xí)得研究更應(yīng)該以一個開放的心態(tài)從跨學(xué)科的視角去解決:語言的先天結(jié)構(gòu)有哪些?這些先天結(jié)構(gòu)的內(nèi)在表征和神經(jīng)生物基礎(chǔ)是什么?先天結(jié)構(gòu)和后天語言輸入之間如何互動?語言能力和其他認(rèn)知能力在兒童語言發(fā)展中如何互動?能否借鑒兒童語言習(xí)得的特征,構(gòu)建一個“人類語言模擬器”,把超大規(guī)模預(yù)訓(xùn)練語言模型與大腦中的先天語言結(jié)構(gòu)加以融合,走一條先天結(jié)構(gòu)+數(shù)據(jù)的迭代進(jìn)化之路,使機(jī)器學(xué)習(xí)可以展現(xiàn)人類水平的“語言理解”?從這些研究問題出發(fā),走語言學(xué)與認(rèn)知科學(xué)、神經(jīng)科學(xué)、人工智能研究的真正融合之路。正如前文所討論的,兒童語言習(xí)得研究的跨學(xué)科方向是清晰的,而真正融合的路徑要在跨學(xué)科的實踐中進(jìn)一步明確。

      要做到多學(xué)科的交叉和融合,就需要培養(yǎng)真正具有跨學(xué)科背景和視野的新一代兒童語言習(xí)得研究者。新一代的兒童語言習(xí)得研究者既要有良好的語言學(xué)理論訓(xùn)練,又要靈活掌握認(rèn)知科學(xué)的實驗方法。同時,他們還需要有跨學(xué)科的視野,能夠和認(rèn)知科學(xué)、發(fā)展心理學(xué)、神經(jīng)科學(xué)、計算機(jī)科學(xué)的研究者開展合作,要善于采納和融合這些相關(guān)學(xué)科的研究成果。新一代的兒童語言習(xí)得研究者或許可以暫時擱置目前理論之間的爭議(如語言能力是否獨立于其他認(rèn)知能力,以及大腦是否由不同心智模塊組成這樣的問題),而把語言發(fā)展放到更廣闊的框架下,更多地關(guān)注人類共有的、在物種進(jìn)化過程中發(fā)揮重要作用的、以基因遺傳方式存在的語言能力部分和其他需要后天環(huán)境和社會文化闡釋的認(rèn)知能力之間是如何互動的,以真正跨學(xué)科的方式來理解更為廣闊的語言、心智與大腦的關(guān)系。相信隨著科學(xué)的發(fā)展,學(xué)科之間新的融合會持續(xù)涌現(xiàn),對已有研究問題的探索也會持續(xù)深入,對相關(guān)理論問題的認(rèn)識也會不斷更新。新一代的兒童語言習(xí)得研究者也要有更強(qiáng)的社會使命感和擔(dān)當(dāng),不僅要重視研究的科學(xué)價值,也要注重科研成果的社會價值和影響,把科研成果及時轉(zhuǎn)化為能為社會服務(wù)的產(chǎn)品。兒童語言能力的發(fā)展對于其后期表達(dá)能力、思維能力和學(xué)習(xí)能力的發(fā)展都具有重要意義。因此,從跨學(xué)科視角考察兒童語言能力的發(fā)展及其病變的異常機(jī)制,可以幫助我們更好地推動兒童語言智能的開發(fā)以及兒童語言障礙的早期診斷與干預(yù),直接推動健康中國的建設(shè),服務(wù)國家戰(zhàn)略。

      特約編輯:王飆

      猜你喜歡
      認(rèn)知科學(xué)跨學(xué)科人工智能
      跨學(xué)科教學(xué)在高中生物課堂教學(xué)中的應(yīng)用實踐
      初中歷史跨學(xué)科主題學(xué)習(xí)活動的實踐與思考
      應(yīng)用型高校推進(jìn)跨學(xué)科人才培養(yǎng)的路徑探索
      大學(xué)(2021年2期)2021-06-11 01:13:32
      2019:人工智能
      商界(2019年12期)2019-01-03 06:59:05
      人工智能與就業(yè)
      貴州民族大學(xué)“認(rèn)知科學(xué)與技術(shù)”實驗班
      腦與認(rèn)知科學(xué)貴陽宣言
      意識的自然化之后——評《神經(jīng)現(xiàn)象學(xué):整合腦與意識經(jīng)驗的認(rèn)知科學(xué)哲學(xué)進(jìn)路》
      數(shù)讀人工智能
      小康(2017年16期)2017-06-07 09:00:59
      商標(biāo)跨類保護(hù)的跨學(xué)科解釋
      双辽市| 马山县| 澄城县| 兖州市| 奉节县| 宝鸡市| 太谷县| 黄浦区| 调兵山市| 上杭县| 襄汾县| 赞皇县| 石家庄市| 鹿泉市| 深州市| 绥滨县| 松原市| 甘南县| 通化县| 象州县| 浠水县| 永泰县| 辽源市| 凤山县| 南平市| 五常市| 托里县| 平舆县| 晋城| 府谷县| 新邵县| 图们市| 炉霍县| 玉环县| 藁城市| 广德县| 竹北市| 进贤县| 绍兴市| 田东县| 承德县|