李 慧
(北京師范大學人文和社會科學高等研究院,珠海 519000)
人類語言是以發(fā)聲解剖結構和神經認知為基礎構件,可實現(xiàn)聲音與意義相互映射的一整套機能。因此,我們對語言的理解,不僅應借鑒語言學的數(shù)據(jù)和理論,更應來源于生物學研究。調控廣泛物種發(fā)育的基因集合、蛋白質序列和細胞機制在進化過程中具有廣泛的保守性,這激發(fā)了人們使用模式生物來研究更復雜的系統(tǒng)。而識別種間差異對于探索人類的特性以及生物多樣性的產生至關重要。近二十年來,許多模式生物的基因組計劃相繼完成,大量的基因組數(shù)據(jù)被存入數(shù)據(jù)庫,涉及的物種種類不斷增加,其中包括兩種滅絕的古人類——尼安德特人和丹尼索瓦人,為比較生物語言學的實證研究提供了重要機遇。
目前,將比較生物學方法運用于語言研究已形成共識,即利用動物模型、古人類研究的數(shù)據(jù)來幫助分析人類關鍵特征的機制和進化基礎。例如叉頭框P(forkhead box P,F(xiàn)OXP)轉錄因子是一個古老的蛋白質亞家族,在脊椎動物體內協(xié)調多個器官系統(tǒng)的發(fā)育。研究發(fā)現(xiàn)FOXP 基因與神經發(fā)育障礙相關聯(lián),人們開始特別關注該基因在腦中的表達模式和功能。研究FOXP 在人腦中的表達以及在脊椎動物腦發(fā)育中的作用,為了解認知行為背后的分子路徑和腦回路提供了重要的參考。通過靶向不同腦回路來挽救動物模型中的行為缺陷是未來該領域研究的一個重要方向[1]。
人類獨特的語言能力是通過對古老的神經、生理和解剖系統(tǒng)以新型配置的方式組合在一起而產生的,這一觀點已得到比較生物語言學研究的支持。例如Lieberman[2]提出,產生言語的基本節(jié)奏頻率模式的解剖學器官——肺和喉有著深刻的進化史。連接皮層、基底神經節(jié)和其他皮層下結構的神經回路組織可執(zhí)行運動和認知行為,從而產生言語、吟唱的節(jié)奏。本文將從現(xiàn)代人群中語言的比較遺傳學、現(xiàn)代人類與古人類的比較遺傳學和發(fā)聲學習的動物模型這三個方面討論語言的比較生物學研究進展,為理解語言等復雜、高級的認知行為可能涉及的神經機制、遺傳變異和進化歷程提供見解。
研究人類個體發(fā)育、特異性和進化起源等問題的核心是了解其遺傳機制。研究人類如何獲得復雜的言語和語言能力對遺傳學家構成了挑戰(zhàn),因為發(fā)現(xiàn)其中的關鍵遺傳機制必須依賴于對“我們”的研究,即把人群視為一種自然實驗對象來尋找基因型和表型之間的聯(lián)系。長期以來,語言學家把語言視為在“現(xiàn)代人類”中恒定的特征,專注于對語言“普遍性”的研究。盡管語言研究中包含了研究病理語言學的觀點,但并未大力開發(fā)人群中差異化的語言資源,因此,目前并沒有得到相關表型變異程度的完全圖示。然而,比較分析已成為在多種水平上揭示生物學機制的強有力的實證工具。目前,我們對語言分子遺傳水平的“保守”與“變異”有了更多的認識。
現(xiàn)代人群中包含一系列的基因組變異,如大規(guī)模的染色體重排、基因拷貝數(shù)變化和DNA 單個堿基變化。變異范圍從非常常見的“多態(tài)性”到特定家庭或個人的極為罕見的突變。基因組中許多突變屬于沉默突變,對基因功能及表型影響不明顯。然而,如果變異發(fā)生在基因的編碼區(qū)序列,這可能改變編碼蛋白的氨基酸序列,從而影響蛋白功能。如果變異位于調控區(qū),也能改變蛋白質編碼基因表達的方式。在發(fā)育或成熟的生物體中,蛋白質何時何地表達以及表達的數(shù)量多少,可對神經元增殖、遷移、連接和可塑性等過程產生影響,從而導致發(fā)育和功能的改變。這些原則、方法和技術也適用于研究包括言語和語言在內的人類認知和行為特征。如研究者已發(fā)現(xiàn)一些罕見的基因突變有巨大的效應,如FOXP2突變導致兒童言語失用。
此外,對特異性語言損傷(specific language impairment,SLI)病例的研究揭示了語言損傷與常見基因變異之間復雜的聯(lián)系。如當SLI兒童中ATP酶2C2(ATP2C2) 和/或c-Maf 誘 導 蛋 白(C-Maf inducing protein,CMIP)(16 號染色體上的兩個相鄰基因)發(fā)生常見基因變異時,在重復無義單詞等語言能力測試中顯示出成績偏低[3]。有時同一基因的不同變體會促成不同類型的障礙。如接觸蛋白相關蛋白樣2(contactin-associated protein-like 2,CNTNAP2) 的 常見基因變體是SLI的風險因子,而其罕見的編碼區(qū)突變可與腦皮質發(fā)育不全伴病灶性癲癇綜合征(cortical dysplasia-focal epilepsy syndrome,CDFES)、智力障礙(intellectual disability,ID)等神經發(fā)育障礙相關[4]。
隨著分子生物學的發(fā)展,人們對基因和基因組之間的差異有了比較全面的了解。但是如何尋找言語和語言相關機能的潛在遺傳學基礎,還需要不斷探索。
首先從發(fā)育性交流障礙著手。有5%~10%的兒童存在永久性獲得的嚴重的口語和書面語障礙[5],足以影響其教育與社交發(fā)展。其中一些病例是在認知功能相對保留以及有充分語言輸入的背景下,其感知和產生語言的能力受限,例如耳聾和腭裂。另有一些病例是在更廣泛的認知缺陷的背景下出現(xiàn)言語和語言問題,如腦創(chuàng)傷、ID 或者是自閉癥譜系障礙(autistic spectrum disorder,ASD)。還有相當一部分兒童在沒有任何明顯的解釋性原因的情況下存在言語和語言問題。以上問題統(tǒng)一稱為“發(fā)育性交流障礙”[6]。在行為水平上,不同的言語和語言障礙之間,“語言特異(language specific)”障礙與影響更廣泛的認知功能的障礙之間,以及“障礙”與“偏低的正常能力”之間,都鮮有清晰的界限,其部分原因是障礙的診斷基于心理測量和對交流能力的臨床觀察,在正常與異常表現(xiàn)之間沒有絕對的分界線。此外,每一兒童有獨特的缺陷譜系,隨著兒童發(fā)育而變化,大多數(shù)障礙都存在高水平的“共病”現(xiàn)象。其固有原因是:言語、語言和閱讀大致依賴于共同的認知過程,同時也與其他認知系統(tǒng)密不可分。因此,每種發(fā)育性交流障礙都是一個籠統(tǒng)的術語,它不僅涵蓋了許多表型變異,也有巨大的基因型差異。例如罕見的言語和語言障礙是由單一基因促成。但常見形式的障礙都是非孟德爾遺傳形式,來源于大量常見變體的累加效應。也許最典型的場景是:多種罕見和常見變體組合起來決定了風險的水平,后者又受到環(huán)境影響以及神經發(fā)育中隨機過程的調控[6]。
再者從正常的語言變異以及非凡的語言能力著手。在非語言損傷人群中鑒定語言能力的個體間變異,最近在語言學研究中得到了重視。過去傾向于集中鑒定語言獲得和處理過程中“普遍性”的方面。其中一些變異是由于環(huán)境因素以及神經發(fā)育中的隨機效應。但雙生子研究和雙生子收養(yǎng)研究顯示,很大比例的語言變異是可遺傳的,例如在口語和書面語獲得的發(fā)育軌跡、詞匯量等參數(shù)的最終成就水平,以及兒童期過后的語言學習能力等方面[7]。因此,語言能力的正常變異也是言語和語言遺傳基礎研究的新型資源,目前正使用全基因組關聯(lián)(genome-wide association studies,GWAS)進行研究。未來,人們通過探索語言能力譜系的最高端(在口語和書面語獲得以及有優(yōu)異語言能力的成年人中該研究尤其成功),將會對語言的遺傳基礎有更深入的了解。還有一些經常發(fā)生在ASD背景下,且伴隨其他認知區(qū)域損傷的異常卓越的語言能力(如閱讀早慧與通曉數(shù)種語言)[6]的病例,也是亟待發(fā)掘的語言遺傳研究資源。
鑒定語言遺傳基礎可為實證研究人類語言的演化提供重要線索。把語言相關基因的DNA和蛋白質序列與不同動物物種的相應序列進行比對,有可能重構該基因的進化史,從而判斷其出現(xiàn)的時間段、在不同世系中如何改變,以及在人類最近的祖先中是否表現(xiàn)出獨特的變化特征。另外,在發(fā)育人群以及成年人群腦的不同組織結構中,確定該基因產物何時何地具有活性,并把它的神經表達模式與其他物種進行比較。如果在目標基因中探測到潛在的進化差異,可用模型系統(tǒng)評估其功能影響。例如比較研究發(fā)現(xiàn)[8],F(xiàn)OXP2遠非人類獨有,其有深遠的進化史,且在遠緣脊椎動物物種中以同源的形式存在。該基因不僅在DNA/蛋白質序列水平,而且在神經表達模式上都相對保守。在鳴禽中其同源基因(FoxP2)似乎通過影響特定腦區(qū)(如X區(qū))參與鳴曲學習和可塑性,而小鼠Foxp2影響運動協(xié)調、學習、超聲發(fā)聲(ultrasonic vocalizations)以及腦發(fā)育,顯示該基因在包括皮層、基底核和小腦某些回路的發(fā)育和功能中有著古老的作用,也與感覺運動整合和運動技能學習有關;當把關鍵的進化氨基酸變化序列插入到小鼠中時,小鼠在皮層基底回路中顯示出更高水平的突觸可塑性;相反,持KE家族Foxp2基因突變的鼠在皮層基底回路中顯示出更低水平的突觸可塑性。這些研究結果提示FOXP2 具有重要的進化意義。
ASD 是一種神經發(fā)育障礙,其特征是社交障礙以及受限和重復的行為模式。雖然語言和社會交際方面的缺陷是自閉癥譜系障礙的一個顯著特征,但結構語言能力,尤其是語義和句法,存在顯著的個體差異[9]。使用動物模型來分析分子通路,并將其與認知障礙的行為內表型聯(lián)系起來,已被證明是開發(fā)和測試疾病相關療法的有效方法。最近開發(fā)出與ASD 相關的脆性X 智力低下蛋白1(fragile X mental retardation1,F(xiàn)mr1)、神經配蛋白3(neuroligin-3,Nlgn3)和神經突觸黏附分子1-α(neurexin1-α,Nrxn1-α)的基因敲除大鼠模型。雖然Fmr1 或Nlgn3 敲除大鼠表現(xiàn)出與ASD 相關的一些行為改變,但在幼鼠社交互動中的超聲發(fā)聲沒有顯著差異。相比之下,F(xiàn)mr1 KO 大鼠表現(xiàn)出對聽覺刺激的反應減弱,與在脆性X 綜合征患者中聽覺皮層反應異常相一致[10]。此外,比較常見的非遺傳動物模型是產前或產后早期給藥的丙戊酸鈉(valproic acid,VPA)誘導的大鼠和小鼠ASD模型[11]。雖然在人類ASD 病例中,只有少數(shù)與產前暴露于VPA相關,但VPA 動物模型仍然是探討ASD 病因學中基因-環(huán)境相互作用的有價值的研究工具,尤其是在表觀基因組修飾的背景下[12]。目前的動物模型對進一步了解與ASD 相關的行為缺陷、基因突變和生理學方面非常有價值,為開發(fā)出新的治療策略提供了條件。但ASD 核心癥狀的動物模型仍面臨著缺乏生物標志物、癥狀嚴重程度的異質性和適當?shù)脑u價終點等問題。盡管如此,來自動物模型的研究數(shù)據(jù)已經促使幾種藥物進入臨床試驗[13]。
語言障礙是精神分裂癥臨床診斷的重要方面,但它或許是語言功能的特定缺陷,例如句法理解準確性損傷,而并非整體性認知缺陷,或作為普遍思維障礙的指征,而非言語或語言上的特定缺陷。除了少數(shù)基因之外,精神分裂癥領域一直缺乏研究與這種疾病有關的生物學和大腦回路的遺傳模型[10]。然而,最近一項大規(guī)模的全基因組關聯(lián)研究已經確認,精神分裂癥相關108 個基因位點集中于大約90 個基因。一些誘發(fā)大鼠精神分裂癥樣癥狀的藥理學模型已被用于研究發(fā)聲效果。例如甲基氧化偶氮甲醇(methyl azoxy methanol,MAM)會使DNA 甲基化,明顯增加足底電擊誘發(fā)的超聲發(fā)聲等應激反應,從而使嚙齒動物的超聲發(fā)聲及其他行為和神經解剖學特征發(fā)生類似于精神分裂癥的改變[10]。
兩種滅絕的古人類基因組高質量測序結果,已經并繼續(xù)革新著人們對人類進化的理解?,F(xiàn)代人類、人類祖先、尼安德特人、丹尼索瓦人和類人猿的完整基因組序列的獲得對描述人類特征的起源發(fā)揮了巨大價值。在古DNA證據(jù)出現(xiàn)之前,通常認為人類語言是相對新近的特征,出現(xiàn)于大約5~10 萬年前;語言的出現(xiàn)是單個、驟然的突變導致形成的完整的“現(xiàn)代裝備”。尼安德特人缺乏特異的言語裝備、更高水平的語言適應以及有效利用語言的整體認知靈活性。例如Pinker等[14]曾提出,語言是為了實現(xiàn)交流的自然選擇壓力下進化的復雜適應系統(tǒng),語言演化的時間段是在過去5 萬年間。Chomsky[15]認為,大約在10 萬年前,第一個問題(為什么會有語言?)并沒有出現(xiàn),因為沒有語言,而腦的重構僅僅發(fā)生在“我們”這個物種中的某一個體中,生成了無限合并的操作,運用于具有錯綜復雜(而鮮少了解的)屬性的概念中。而認為“尼安德特人缺乏語言,而使用某種形式的原語言”的證據(jù)包括:首先,尼安德特人與現(xiàn)代人類的整體解剖結構差異提示,他們之間有相當大的進化距離,尼安德特人的強健身形被認為是力量對受限的智力的補償;其二,早期對古DNA 的提取和分析專注于線粒體DNA,從而認為現(xiàn)代人與尼安德特人的基因組有顯著區(qū)別,所以他們是不同的物種;其三,復原的部分聲道和聽力系統(tǒng)的化石也顯示兩者之間在言語能力上存在重要差異;第四,兩者之間的文化產品存在差距,這似乎也可從語言是否有缺陷中得到解釋[16]。
遺傳學的最新進步使人們能夠從古人類化石上提取和分析DNA。如前所述,對復原的尼安德特人線粒體DNA進行分析,結果似乎支持了它們對現(xiàn)代人類基因多樣性沒有貢獻的觀點;可能原因包括,他們與現(xiàn)代人類完全沒有雜交,或僅是最初有低水平的雜交,而后來消失了。然而隨著下一代測序技術的進步,完整的尼安德特人和丹尼索瓦人的基因組序列得以發(fā)布,揭示了3種古人類支系之間的復雜交錯的遺傳史。Dan等[16]總結了3種古人類基因組的比較數(shù)據(jù),并進行了詳盡的分析,認為:
(1)“我們”的進化史遠非單一世系的簡單而持續(xù)的進程,而是反映了一個網狀的歷史,包含至少3 種緊密相關的支系之間(反復)互換基因的可能。隨著古人類化石的進一步發(fā)現(xiàn),這一網絡也許會變得更復雜。由于在不同的現(xiàn)代人類個體中發(fā)現(xiàn)了不同的尼安德特人基因,說明了兩者之間基因組混合的機會并不是非常少。也許一些尼安德特人和丹尼索瓦人的基因在“走出非洲”后被賦予了強大的選擇優(yōu)勢,尤其是在免疫系統(tǒng)方面,從而對現(xiàn)代人群有了高頻率的基因貢獻,其中包括在人類白細胞抗原(human leukocyte antigen,HLA)系統(tǒng)中的免疫系統(tǒng)基因、STAT2 基因和OAS 基因簇。尼安德特人和丹尼索瓦人有現(xiàn)代人言語和語言的基本遺傳基礎,可能現(xiàn)代人在一些參數(shù)上會更勝一籌(也許是言語聲音或言語的快速,句法的復雜度、詞匯量大小等)。
(2)語言是把聲音映射于意義的全套能力,包含了支持它的基礎設施(如聲道結構、神經認知、交流行為學和心智理論等)。這些先決條件發(fā)生在深度時間內。因此,言語和語言是古老的,存在于50多萬年前尼安德特人和現(xiàn)代人的共同祖先中,即從直立人進化而來的海德堡古人類?,F(xiàn)代語言的時間深度應該是在語言科學文獻中經常提到時間深度(典型的是5~10萬年)的約10倍,而這樣一個錯綜復雜的系統(tǒng)不可能僅僅在幾千代內進化出來。在海德堡人之后,生物和文化進化在每一人類支系中繼續(xù)著,一個在非洲,一個在非洲外,從而導致文化的累積。當然還有支持言語和語言的一些微小的生物差異。因此,簡化的突變論不再成立。人們必須從語言認知能力累積的進化軌跡來思考,語言演化在今天仍然在延續(xù)。
(3)言語和語言兩者之間大致是協(xié)同進化的機能。研究言語的生成與理解應以研究呼吸、舌、腭帆和聲帶的皮層控制為核心,而非過度強調句法,因為前者給予了更多了解語言進化的線索和實證理據(jù)。例如,鏡像神經元的發(fā)現(xiàn)使“人類語言最初經歷了一個手勢語言的階段”的觀點再度流行起來;這是因為發(fā)現(xiàn)類人猿缺乏皮層和喉之間直接聯(lián)系的側皮層系統(tǒng),從而判斷類人猿的手勢與意向性交流相關,而其發(fā)聲更多的是本能反應。
(4)人類基因和語言多樣性之間有著充分的相互影響。某些參與腦生長和發(fā)育的基因如異常紡錘體樣小頭畸形相關蛋白基因(abnormal spindle microtubule assembly,ASPM)和小腦癥基因(microcephalin)的頻率與聲調語言的流行有相關性,說明人群基因中微小的差異可充當文化的“引子”,使某種語言類型更可能散布,稱為“遺傳偏向性”。隨著對它們功能以及它們在人群中變體功能的了解不斷加深,可推測它們在語言的文化進化中發(fā)揮著特定作用。
廣義上講,發(fā)聲學習是在經驗基礎上改變發(fā)聲輸出的能力。區(qū)分發(fā)聲能力的一種依據(jù)是:一些發(fā)聲是天生的,不需依賴經驗;另一些發(fā)聲不僅依賴天生技能,也依賴經驗。前者為大多數(shù)動物所常見,例如哭和笑。后者相對不廣泛,大致包含3 種亞型:(1)將聲音與行為反應聯(lián)系起來的能力,如犬對人的命令的回應;(2)學習“發(fā)聲語境”的能力,例如長尾猴對捕食者的發(fā)聲回應;(3)根據(jù)經驗修改發(fā)聲的能力,可以與發(fā)聲模型偏離或趨同,例如鳥鳴,該能力稱為聲音產生學習(vocal production learning),簡稱為發(fā)聲學習(vocal learning)[17]。發(fā)聲學習并非人類所獨有,其存在于多種遠緣物種中。到目前為止,已經無可爭議地確認了鯨目動物、鰭足類動物、大象、某些蝙蝠物種、三目鳥類(鳴禽、鸚鵡和蜂鳥)和人類一樣均具有發(fā)聲學習能力[18]。
發(fā)聲學習的研究有助于闡明感覺運動通路、發(fā)聲運動控制和聽覺運動整合機制。Tyack等[19]對不同的發(fā)聲動物模型進行了分類,認為人類和一些鳴禽通過聆聽聲音來學習語言或鳴唱,形成聽覺模板,然后產生與模板匹配的聲音。這些類群已經進化出專門的端腦通路來完成這種復雜的發(fā)聲學習形式。還有許多哺乳動物和鳴禽,可以通過傾聽同類的聲音或噪音來調整遺傳的聲音運動模式的聲學特征。這些有限形式的發(fā)聲學習可能涉及不同于復雜聲樂學習的神經機制,如腦干、中腦和/或端腦網絡。相比之下,大多數(shù)動物發(fā)聲的聲學結構是由特定物種腦干中的發(fā)聲運動程序產生的,不需要聽覺反饋,不屬于發(fā)聲學習的范疇。要理解人類語言的基礎——復雜的發(fā)聲學習,需要仔細分析哪些物種具備哪些形式的發(fā)聲學習能力。選擇多種動物模型來比較產生這些不同學習形式的神經通路,將為了解復雜發(fā)聲學習的進化和其神經機制提供更豐富的觀點。在研究人類語言神經機制時成功采用的非侵入性方法應廣泛應用于發(fā)聲學習的其他分類群。另外,許多有發(fā)聲學習能力的物種都瀕臨滅絕,或受到威脅或列于保護范圍內,因此發(fā)聲學習的研究不應對野生種群產生負面影響。
發(fā)聲學習物種也用于研究人類言語的進化。Martins 等[20]認為,語言進化應為鑲嵌式,不同的語言組分有各自的進化模式。最近他們在發(fā)聲學習“連續(xù)體(continuum)”的概念之上提出了發(fā)聲學習“聯(lián)合體(contiguum)”的概念?!奥?lián)合體”是“連續(xù)體”的延伸,在這一形態(tài)空間內,有不同的力讓一個物種接近某種行為或遠離它?!斑B續(xù)體”可視為“聯(lián)合體”的向量。該模型主張從多維視角研究發(fā)聲學習,使對發(fā)聲學習特征的描述更加復雜,也更加準確,并能促進進一步的比較生物學研究。
馴化和發(fā)聲學習物種可作為研究人類世系中應激性攻擊減少和語言出現(xiàn)的模型生物。越來越多的證據(jù)表明,馴化可以改變不同物種的發(fā)聲技能。在人類和鳴禽中,發(fā)聲學習似乎依賴于共享的神經生物學基質,這也許是趨同進化的結果。白腰文鳥和馴化的孟加拉雀之間的鳴曲對比研究可為人類物種的自我馴化和發(fā)聲學習演化機制提供線索[18]。最近O'Rourke等[18]把研究重點放在馴化的孟加拉雀上,孟加拉雀的鳴曲比野生的白腰文鳥更復雜。O'Rourke 等[18]對這種效應的解釋圍繞谷氨酸神經遞質系統(tǒng)展開,認為谷氨酸信號與鳴曲學習有關,它控制對發(fā)聲學習至關重要的神經回路中的多巴胺活動,調節(jié)應激反應和馴化后攻擊行為的減弱,而應激相關神經回路的興奮減弱可通過多巴胺能信號的改變來增強發(fā)聲學習能力。
比較生物語言學強調了認知系統(tǒng)的保守性和語言發(fā)育的可塑性,而只有足夠了解其他物種的認知體系以及人類非語言認知區(qū)域的特征才能對現(xiàn)代語言機能的構建作出合理的推斷。通過比較現(xiàn)代人群語言中的罕見變異與常見變異,研究人類交流障礙,將對教育、科學、經濟和社會進步都有重要意義,而對其潛在風險因子的了解有利于早鑒定、早干預和早治療。在ASD、ID、癲癇失語譜系障礙(epileptic-aphasia spectrum,EAS)病例中,遺傳學研究已經革新了人們對這些障礙病因的理解,而且開啟了從“表型為先”到“基因型為先”的診斷轉型。分子生物學技術進步正在加速研究語言障礙中基因型-表型之間聯(lián)系的步伐,其中一個關鍵進步是高通量基因分型DNA芯片的生產。通過DNA芯片,每人只需幾百美元,就可在基因組中同時篩查百萬個不同的遺傳標記,靶向到每一基因內所有已知的變異位點[21]。因此研究者可以開展全基因組關聯(lián)的大規(guī)模篩查,從而揭示特定基因與目標表型之間的新型關聯(lián)。然而這種研究需要成百甚至成千的人群才能取得充分的數(shù)據(jù)效能。全基因組關聯(lián)篩查已經使用于常見語言相關障礙研究,但由于較之人類基因學其他領域來說樣本規(guī)模太小,因此需招募大量的受試者以及描述其語言機能,而且不同領域的國際合作才能獲得成功。此外還需要實驗研究來確定基因變體對蛋白質功能的影響,這些實驗包括分子和細胞生物學實驗、動物模型實驗和腦成像實驗等。腦成像遺傳學實驗是一項用非侵入性神經成像技術評估基因組變體與腦結構和功能之間關聯(lián)的新興技術。例如ProcessGeneLists(PGL)通過使用與疾病相關的基因并計算這些基因在每個大腦區(qū)域的標準化mRNA 表達平均值,將遺傳學和人類大腦成像聯(lián)系起來。這些基因表達最多的共同腦區(qū)域成為感興趣區(qū)域,用于在有或沒有疾病的受試者中進行腦成像,從而減少了多重比較[22]。
基因組大數(shù)據(jù)的涌入也為語言進化研究者提供了獨特的新希望。許多現(xiàn)存物種以及不斷增加的滅絕動物(包括古人類)的豐富的遺傳數(shù)據(jù)都可在網上自由取用。這些數(shù)據(jù)之間相互參考對于在語言進化的多因子背景下確定哪些候選基因顯示出人類祖先中有趣的變化模式很有價值。古人類遺傳學研究類似時光機器,可重構人類交流的起點,從而使語言起源研究從“推測”和“假說”過渡到實證科學。發(fā)聲學習是人類語言的一個重要特征,顯示發(fā)聲學習能力的物種是有關人類語言本質和進化的重要信息來源,尤其是關于語音方面。
同時參與語言進化研究的有認知神經科學、考古學、行為學、計算機科學、人類學和理論語言學等。這種跨學科的討論對于語言學家來說可能是一個警鐘,因為語言學界長期從事內部專業(yè)化的理論研究,這可能成為一道阻礙跨學科合作的防火墻。然而大數(shù)據(jù)的涌入以及學科的異質性對研究也造成了挑戰(zhàn)。例如,需要在極為異質的實證證據(jù)中找到一個趨同點,能集中多學科知識,妥協(xié)一些對立的立場,排除僅僅在單一學科內適用的解決辦法,從而實現(xiàn)對語言進化的全面了解。而且不同學科領域的交流需要一個共同的基礎,即一個可以在多樣性學科中構建聯(lián)系的共享概念空間。共享概念空間的建立需通過每種學科各自的不斷發(fā)展以及構建,能夠對不同數(shù)據(jù)提供統(tǒng)一視角的動態(tài)開放解釋性模型。比較生物語言學著力在人類語言與其他生物的認知構件中尋找普遍性和變異性,已成為生物語言學繁榮的動因。這可能為語言研究提供一個共享的概念區(qū),用以處理異質的數(shù)據(jù),實現(xiàn)語言跨學科研究的深入發(fā)展。
[利益聲明Declaration of Interest]
作者聲明本文不存在利益沖突。