程張根,何 瓊
(武漢科技大學(xué) 外國語學(xué)院,湖北 武漢430081)
隨著國際交流日趨頻繁和我國文化軟實力提升,越來越多的國內(nèi)高校都在網(wǎng)站增設(shè)了英文界面。其目的主要是加強對外宣傳,提高國際知名度,尋求合作辦學(xué),促進學(xué)術(shù)交流與合作。尤其是對于一些知名大學(xué)來說,英文網(wǎng)站不僅是有意來校深造的國外學(xué)生了解本校的窗口,也是向海外科研機構(gòu)及學(xué)者傳達信息的主要方式。
本研究擬通過對比分析國內(nèi)外高校英文簡介的詞匯難度、詞頻、詞塊、主題詞、詞性分布等措辭特征,以回答如下問題:中國財經(jīng)類知名高校與商科排名靠前的英語國家高校的英文簡介在詞匯層面上各自有何特征,這些詞匯特征有何語篇意義,其背后原因是什么。
為了回答上述問題,筆者自建了兩個語料庫即中國高校簡介語料庫 AUMC(About University in Mainland China)和英語國家高校簡介語料庫 AUEC(About University in English-speaking Countries),各含20所高校的英文簡介文本,均采自各高校校園網(wǎng)英文版的類似“About the University”部分。本研究將對象鎖定為財經(jīng)類高校,國內(nèi)高校選取各種排名靠前的 20所財經(jīng)類高校,包括上海財經(jīng)大學(xué), 中央財經(jīng)大學(xué)等;因國外少見中國式的財經(jīng)類大學(xué),故國外高校選取2011年度QS經(jīng)濟類專業(yè)世界排名的前25位高校,包括哈佛大學(xué),麻省理工等,但是只保留以英語為母語國家的20所高校,剔除東京大學(xué)等本族語為非英語的國家高校,以保證語料庫語言的純正性和地道性。
詞匯難度分析工具采用AntWordProfiler,該軟件的基本原理是“將某一個文本中的詞匯與某一詞匯表進行比較,通過觀察哪些詞出現(xiàn)或未出現(xiàn)在該詞匯表中以及出現(xiàn)在該詞匯表中詞匯的比率,就可以知道該文本的用詞情況了”(鳳群,2011)。AntWordProfiler內(nèi)置了三個詞匯表,這三級詞匯表代表了英語中出現(xiàn)頻率較高的詞匯,每一級詞匯難度遞增。運行該軟件,它會將所分析的文本中的詞匯與上述三級常用詞匯表做比較,用以衡量文本的詞匯難度。文本可讀性分析采用中國外語教育研究中心的許家金博士與賈云龍老師研發(fā)的 Readability Analyzer。該軟件能統(tǒng)計文本的詞次、詞形、詞目、平均詞長、平均句長,并提供文本易度、難度、水平等數(shù)據(jù)。測試結(jié)果表明(侯廣旭等,2009),在文體、題材、風(fēng)格相近的情況下,尤其是對于說明文和論述文體,該軟件對文本難度分析的結(jié)果具有較強的真實性。此外,本研究使用 AntConc對詞頻、詞塊、主題詞、詞性分布等詞匯特征進行研究。AntConc具有生詞詞表,詞塊,提取主題詞和索引等多項詞匯分析功能,信度效度已得到語言學(xué)界的普遍認可。AntWordProfiler和AntConc均由日本早稻田大學(xué)Antony教授研發(fā),二者皆為免費軟件。
本研究首先使用 AntWordProfiler和 Readability Analyzer量化分析比較兩個語料庫的用詞難度和文本可讀性(難度),用以對國內(nèi)外高校簡介的文本特征進行分析和比較。其次,利用 AntConc生成詞表和詞塊表,用以分析比較兩個語料庫的重點信息有何差異;然后,借助AntConc生成主題詞表,考察兩個語料庫的主題差異;最后,對兩個語料庫進行詞性賦碼,借助AntConc的詞表和索引行功能揭示兩個語料庫的詞性分布,句法特征以及主題差異。
1. 總體文本特征
利用 AntConc的詞表功能可以得出兩個語料庫的形符數(shù)和類符數(shù),據(jù)此可以計算出標(biāo)準(zhǔn)化類符/形符比。如表 1所示,AUEC形符數(shù)為 6051,AUMC形符數(shù)達到11708,說明中國高校英文簡介的平均篇幅明顯大于國外高校簡介,字?jǐn)?shù)相差近一倍。國外高校簡介特點是簡明扼要,重點突出,瀏覽原始網(wǎng)頁發(fā)現(xiàn),次要信息常通過超鏈接等形式進行補充說明;而中國高校多半將所有信息不分輕重緩急以一篇文本的形式進行羅列,追求大而全,容易使讀者產(chǎn)生閱讀倦怠和信息迷失,不利于重點信息的傳達。從標(biāo)準(zhǔn)化類符/形符比來看,AUEC和AUMC分別是45.33和42.55。標(biāo)準(zhǔn)化類符/形符比常用來衡量語料庫的詞匯密度,而“詞匯密度在一定程度上反映出文本用詞的多樣性”。由此可以推斷中國高校簡介用詞變化較小,不如國外高校簡介用詞豐富。
表1 國內(nèi)外高校簡介語料庫的總體文本特征
2. 詞匯難度
借助AntWordProfiler,分別得出國內(nèi)外高校簡介用詞難度的量化數(shù)據(jù),結(jié)果如表2。
表2 國內(nèi)外高校簡介的詞匯難度
如表2所示,AUEC文本中一級詞匯形符數(shù)為4282,類符數(shù)為747,分別占總詞數(shù)的70.50%和45.16%。AUMC文本中一級詞匯形符數(shù)為7645,類符數(shù)為774,分別占總詞數(shù)的65.04%和40.42%??梢钥闯?,無論從形符數(shù)還是類符數(shù)來看,代表難度系數(shù)最低的一級詞匯在國外高校簡介中比例均高于中國高校簡介(相差約 5個百分點),即國外高校簡介中用的簡單詞匯比例更大。以同樣的方法對二級詞匯、三級詞匯以及不在這三級的詞匯進行分析,得出結(jié)論:二級詞匯,兩個語料庫差別不大;代表難度系數(shù)較大的三級詞匯以及不在這三級的詞匯在國外高校簡介中比例明顯低于中國高校簡介,即國外高校簡介中使用的高難詞匯比例較小??偠灾c國外高校相比較,中國高校簡介中使用的詞匯偏難、用詞更正式。
3. 文本難度(可讀性)
表3 國內(nèi)外高校簡介文本可讀性參數(shù)
表3顯示,AUEC的易讀性指數(shù)(Reading Ease)為23.50,而AUMC為10.00,可見國外高校簡介閱讀起來更為舒適,換言之,其文本綜合難度低于中國高校簡介文本。易讀性指數(shù)是基于平均詞長、平均句長、標(biāo)準(zhǔn)化詞目/形符比等參數(shù)得出來的。從Flesch-Kincaid等級水平(Grade Level)來看,AUMC(17.30)大于 AUEC(15.10),即中國高校簡介文本的閱讀難度系數(shù)更高,這主要是基于文本的平均詞長(AWL)和平均句長(ASL)決定的。中國高校簡介平均詞長和平均句長都大于國外高校簡介,尤其是平均句長的差異(27.50:20.70)從某種程度上反映出中國高校簡介遣詞造句的復(fù)雜。就標(biāo)準(zhǔn)化詞目/形符比(Lemma STTR)來看,AUMC(0.17)小于AUEC(0.24),說明中國高校簡介用詞豐富度偏低,即用詞單一,不如國外高校簡介靈活多變,這與前文標(biāo)準(zhǔn)化類符/形符比得出的結(jié)論一致。
1. 詞表
詞表是一個語料庫的高頻詞列表,即語料庫文本大篇幅使用到哪些詞匯,重點傳達出什么樣的語篇信息。運行AntConc,依次生成兩個與語料庫的詞表。AUEC 的前 20 個高頻詞匯依次為:the,and,of,in,a,to,university,students,is ,’s,for,its,are,as,research,world,with,by,on,that,at,from,all,campus,an,was,teaching,one,more,than。AUMC的前20個高頻詞匯依次是:and,the,of,in,university,a,to,research,economics,has,is,for,with,students,as,are,education,’s,finance,school,center,china,level,management,programs,by,over,its,key,international。兩個語料庫的前20高頻詞匯大部分相同或類似,尤其是功能詞,實詞部分重復(fù)的是 university,student和 research,說明國內(nèi)外高校簡介都重視招生和科研。劃線部分詞匯為兩個語料庫之間不重復(fù)的實詞。國外高校簡介中高頻實詞是world, campus和teaching,參照索引行,能發(fā)現(xiàn)國外高校在篇幅有限的簡介中注重強調(diào)自身的世界頂尖級別,重視介紹教學(xué)和校園建筑特色和配套服務(wù)。國內(nèi)高校則強調(diào)自身在經(jīng)濟學(xué)(economics)、金融學(xué)(finance)和管理(management)等學(xué)科中的優(yōu)勢。因為所選的國內(nèi)高校都是財經(jīng)類大學(xué),而國外高校多是綜合性大學(xué),所以這不難理解。此外,國內(nèi)高校還習(xí)慣在簡介中羅列下屬各個學(xué)院(school)以及各種合作辦學(xué)項目(program),尤其是國際性的(international)。
2. 詞塊
比較不同文本試圖傳達的重點信息有何差異,除了觀察高頻詞表,還可以分析高頻詞塊。使用AntConc的N元組(N-Gram)功能,分別提取兩個語料庫的高頻三詞詞塊(3-Gram)。AUEC 的前20個高頻詞塊依次為:one of the,the world ’s,The University of,undergraduate and graduate,the University ’s,ANU College of,of the University,of the world,the University of,around the world,world ’s leading,both undergraduate and,is one of,members of the ,research and teaching,teaching and research ,the United States,University of California,University of Chicago,as well as。AUMC的前20個高頻詞塊依次是:of Finance and,Ministry of Education,the Ministry of,F(xiàn)inance and Economics,one of the,University of Finance,as well as,by the Ministry,economics and management,of Economics and,the university has,In recent years,’s degrees in,an area of,of the top,the State Council,is ranked No,of Applied Sciences,Research Institute of,University of Applied。同詞表分析一樣,能凸顯信息差異的詞塊分別標(biāo)注下劃線,然后參照索引行進行分析總結(jié)。得出結(jié)論是,國外高校普遍慣于交代自己是世界級名校(the world ’s,around the world,world ’s leading,),擁有院士級別的教授(members of the)和強大的教學(xué)和科研實力(research and teaching,teaching and research)。國內(nèi)高校大篇幅強調(diào)自身在財經(jīng)類學(xué)科方面的優(yōu)勢(Finance and Economics,economics and management),具備授予各種學(xué)位的資質(zhì)(’s degrees in),近些年(In recent years)取得的各種成就和榮譽,以及學(xué)校校區(qū)面積(an area of)等。尤其值得注意的是,國內(nèi)高校普遍熱衷強調(diào)自身與政府各級行政機構(gòu)的隸屬關(guān)系(Ministry of Education,the State Council),以此彰顯自己的實力和地位。這與中國高校的教育體制密切相關(guān)。
基本詞表統(tǒng)計能提供一個語料庫文本的詞語頻率和分布信息,卻難以說明詞語在語境中的用法與詞語之間的關(guān)系;而“主題詞統(tǒng)計能提供語篇層面詞語的分布與文本主題的關(guān)系以及詞語之間的關(guān)系”[6]。為了揭示兩個語料庫文本的主題差異,本研究進行了主題詞對比分析。由于AUEC和AUMC兩個語料庫屬于可比語料庫,即主題和體裁相同,而且后者庫容相當(dāng)于前者的近兩倍,因此本研究中將AUEC作為觀察語料庫,將AUMC作為參照語料庫,利用 AntConc的主題詞功能同時生成正負關(guān)鍵詞表。其中,正關(guān)鍵詞表是指在國外大學(xué)簡介中出現(xiàn)頻率明顯高于中國大學(xué)簡介的詞匯,負關(guān)鍵詞表所列詞匯在中國大學(xué)簡介中出現(xiàn)頻率顯著高于國外大學(xué)簡介。限于篇幅,本研究截取關(guān)鍵性值keyness大于10的關(guān)鍵詞進行分析討論。
從詞義角度分析,正關(guān)鍵詞表的詞匯主要分六大類:(1)國外高校校名,如ANU,Oxford,Berkeley等;(2)與學(xué)習(xí)相關(guān)的詞匯,如knowledge,intellectual,discovery,scholarship;(3)配套設(shè)施和服務(wù)方面,如accommodation,museum,service等;(4)體育運動,如athletic,sport;(5)學(xué)術(shù)文化特征,如original,diverse等;(6)女性(女學(xué)生),women;(7)其他,如 community,opportunities等。由于正關(guān)鍵詞表反映的是國外高校簡介的主題特色,可以看出:有別于中國高校,國外高校在簡介中內(nèi)容側(cè)重學(xué)習(xí)和學(xué)術(shù),強調(diào)學(xué)生對未知的探索和發(fā)現(xiàn);除了學(xué)術(shù)科研,高校亦注重自身對社會社區(qū)的服務(wù)功能,將服務(wù)社會視為辦學(xué)宗旨中不可或缺的組成部分。此外,簡介中務(wù)實地介紹學(xué)校食宿、體育運動設(shè)施、獎學(xué)金、各種成長成才機會、文化的多元性、甚至男女平等理念,以“人性化”的設(shè)施、服務(wù)和理念吸引莘莘學(xué)子前來就讀。
負關(guān)鍵詞主要分以下六大類:(1)專業(yè)設(shè)置,如economics,management,business,administration,disciplines等;(2)學(xué)校級別和檔次,如 key,level等;(3)師資力量,如teacher,professor等;(4)學(xué)位,如doctoral,master等;(5)下設(shè)研究所,如 institute,center;(6)學(xué)校的發(fā)展,如development。參照索引行,可以推斷:與國外高校相比較,中國高校簡介的主題特色在于詳細介紹所設(shè)專業(yè)和學(xué)位授予權(quán),強調(diào)學(xué)校在政府機構(gòu)的級別和師資力量(尤其是教授比例),以此彰顯自身實力。
使用tree tagger對兩個語料庫進行自動詞性賦碼,然后分別加載兩個賦碼語料庫到AntConc,利用其詞表功能對高頻詞性進行排序。通過觀察對比兩個語料庫的高頻詞性的差異,并借助索引行可以窺探國內(nèi)外高校簡介使用詞匯手段來傳達語篇意義的差異,統(tǒng)計結(jié)果見表4。
表4 國內(nèi)外高校簡介中詞類頻次及千分率
續(xù)表4
如表4所示,AUEC的高頻詞性依次為:專有名詞,名詞單數(shù),介詞,名詞復(fù)數(shù),形容詞,限定詞,并列連詞,基數(shù)詞,過去分詞,副詞,現(xiàn)在分詞,三單,人稱代詞,has,am/is,are,動詞原形,所有格,過去式,比較級,關(guān)系代詞,was/were。AUMC的高頻詞性依次是:名詞單數(shù),介詞,專有名詞,限定詞,形容詞,名詞復(fù)數(shù),并列連詞,基數(shù)詞,副詞,過去分詞,人稱代詞,動詞原形,過去式,現(xiàn)在分詞,am/is,三單,are,所有格,動詞復(fù)數(shù),關(guān)系代詞,比較級,was/were 。表4中,兩個語料庫出現(xiàn)比例差別較大的詞性詞類分別加粗并標(biāo)注下劃線,可以看出:相比較而言,國內(nèi)高校簡介較多使用專有名詞,基數(shù)詞,has;國外高校簡介更多使用人稱代詞,動詞原形和動詞過去式。
(1)專有名詞。AUMC的專有名詞使用率明顯高于AUEC,說明中國高校簡介中專有名詞使用比國外高校明顯更多、更頻繁。觀察索引行發(fā)現(xiàn),國內(nèi)外高校簡介中均使用專有名詞表示“校名,學(xué)校地理位置,下設(shè)的科研機構(gòu),與知名學(xué)術(shù)團體的關(guān)系”等,但中國高校簡介中專有名詞還大量表示“學(xué)校下設(shè)院系、專業(yè)和科研機構(gòu),與政府行政部門的關(guān)系,國家領(lǐng)導(dǎo)人名字,榮譽獎項”, 凸顯出鮮明的“高校管理行政化”特征,而國外高校簡介中的專有名詞少見或未見傳達這些信息。
(2)基數(shù)詞。AUMC的基數(shù)詞使用率明顯高于AUEC,說明較國外高校,中國高校簡介更多、更頻繁地采用量化數(shù)據(jù)介紹學(xué)校信息。通過觀察索引行發(fā)現(xiàn),國內(nèi)高校使用基數(shù)詞主要用來介紹學(xué)校重點學(xué)科、一級或二級學(xué)科數(shù)目,碩士點或博士點數(shù)量,學(xué)校面積,教師(尤其是教授)數(shù)量,學(xué)生人數(shù),下設(shè)學(xué)院或研究中心數(shù)量,藏書數(shù)量。不同的是,國外高校的簡介中出現(xiàn)的數(shù)字主要是年份,用以介紹校史,學(xué)校重大事件發(fā)生的年份。
(3)Has。通過對索引行的觀察,發(fā)現(xiàn)國內(nèi)外高校簡介中 has的主語基本上都是校名或指代校名的第三人稱代詞“it”。區(qū)別在于國內(nèi)高校更多使用第三人稱視角進行自我介紹。
(4)人稱代詞。AUEC的人稱代詞使用比例是AUMC的兩倍(22:11),說明國外高校簡介中更多采用人稱代詞。載入賦碼語料庫,使用 AntConc的單詞列表功能,在檢索項輸入“*_PP”,發(fā)現(xiàn)兩個語料庫均使用到“Its,it,their,them,itself”等介詞。不同的是,AUEC還普遍使用“we,our,you”,據(jù)此可以初步推斷國外高校簡介中慣于使用第一人稱的敘事視角。為了明確國內(nèi)外高校簡介中第一、二人稱代詞使用頻率的差異,利用AntConc的索引行功能,輸入檢索項“we|our|you|us|your|yours|ours”,發(fā)現(xiàn)AUEC出現(xiàn)23次,AUMC出現(xiàn)9次。借助SPSS16.0進行卡方檢驗,得出卡方值 Chi-Square=93.9670,P=0.000,可見兩個語料庫中第一、二人稱代詞的出現(xiàn)頻率的差異具有統(tǒng)計學(xué)意義上的顯著性。說明,較中國高校,國外高校在簡介中明顯更多使用第一人稱的敘事視角,敘述過程中暗示受眾 you的存在,強調(diào)互動,注重與讀者建立起親近的關(guān)系,拉近大學(xué)與讀者之間的心理距離。
(5)動詞原形和動詞過去式。AUEC動詞原形和過去式的使用率明顯高于 AUMC。觀察索引行發(fā)現(xiàn),兩個語料庫的動詞原形主要用于“情態(tài)動詞+動詞”和動詞不定式兩種結(jié)構(gòu),用法差異不大。從語義角度分析,AUEC中動詞過去式主要用來描述學(xué)校歷史變遷,如founded,established,became等;而AUMC中動詞不定式比例較少,并側(cè)重于表述學(xué)校獲取的各種成就,如 achieved,awarded,ranked等。
借助語料庫的各種統(tǒng)計手段,研究發(fā)現(xiàn),國內(nèi)外高校英文簡介的用詞差異主要體現(xiàn)在三個方面,即文本特征,語篇信息和敘事視角。文本特征方面,中國高校簡介篇幅更大,用詞更難,句子更長,結(jié)構(gòu)也更為復(fù)雜,文本難度更大;國外高校簡介短小精悍,用詞難度和句長適中。語篇信息方面,中國高校簡介中慣于詳細地列舉各種教科研信息,如下設(shè)院系、學(xué)科、專業(yè)、碩士點或博士點、科研機構(gòu)、教授比例乃至所獲的各種榮譽獎項,而且一再強調(diào)自身與官方、政府機構(gòu)的關(guān)系,如211院校、省級重點專業(yè)等,以此說明自己的實力和地位;國外高校側(cè)重介紹自身和社會、社區(qū)的緊密聯(lián)系,鼓勵學(xué)生對未知的探索,并提供食宿、體育運動設(shè)施、獎學(xué)金、各種成長成才機會、文化的多元性、甚至男女平等理念等“人性化”信息,借此打動和吸引學(xué)生前來求學(xué)。敘事視角方面,中國高校簡介主要采用第三人稱敘事視角,刻板地描述各種信息;國外高校慣于采用第一人稱的敘事視角,注重拉近與讀者的距離,文本偏向“促銷”體裁。
高校英文簡介,乃至其他的英文外宣材料都是功能性很強的文本。由于國內(nèi)高校的英文簡介主要源于對中文版本的翻譯,因此建議翻譯時以國外高校簡介為平行文本,做到譯文符合目的語讀者的思維習(xí)慣,認知特點甚至興趣偏好。利用各種免費的語料庫工具,可以深度挖掘文本潛在的單詞、句子、語篇、信息等層面的特點,幫助研究者準(zhǔn)確、高效地把握平行文本的特征,以便更好仿照平行文本進行翻譯,提高翻譯的質(zhì)量和效率。
[1]Hunston, S.Starting with the small words: patterns,lexis and semantic sequences[J]. International Journal of Corpus Linguistics,2008, (3): 271~295.
[2]陳雋,黃玉虹. 高校英文網(wǎng)頁的翻譯失誤探析---以福建重點本科院校為例[J]. 福建農(nóng)林大學(xué)學(xué)報, 2012,(6).
[3]鳳群. 基于語料庫的中美大學(xué)生英語演講詞匯特征研究[J]. 合肥工業(yè)大學(xué)學(xué)報, 2011,(2).
[4]郭虹字.中國大學(xué)介紹辭漢英翻譯原則研究… 評部分“211工程"大學(xué)網(wǎng)站英譯[D]. 南京:杭州:浙江工商大學(xué),2010.
[5]侯廣旭,等. 用ReadabilityAnalyzer1.0 分析《大學(xué)英語綜合教程》課文難度的循序漸進性[J]. 考試周刊,2009,(41).
[6]李文中. 基于英語學(xué)習(xí)者語料庫的主題詞研究[J]. 現(xiàn)代外語,2003,(3): 283-293.
[7]梁茂成,等. 語料庫應(yīng)用教程[M]. 北京:外語教學(xué)與研究出版社,2010.
[8]楊惠中. 語料庫語言學(xué)導(dǎo)論[M]. 上海:上海外語教育出版社,2002.