蔣麗平
(廣州大學華軟軟件學院 外語系,廣東 廣州510990)
IT文本英漢平行語料庫輔助翻譯實踐的實證研究
蔣麗平
(廣州大學華軟軟件學院 外語系,廣東 廣州510990)
由于IT英語語體、詞法以及句法特征的特殊性,IT英漢平行語料庫在輔助翻譯實踐時能否提高翻譯質(zhì)量和效率,還存在疑問。該研究基于自行創(chuàng)建的IT文本英漢雙語平行語料庫,以某IT學院的大三軟件開發(fā)專業(yè)學生為實驗對象,檢索工具為ParaCon,實驗采取60分鐘限時翻譯的形式。實驗結(jié)束后,對收集的多項數(shù)據(jù)進行統(tǒng)計分析研究,基于數(shù)據(jù)的統(tǒng)計結(jié)果,得出結(jié)論:在當前條件下,平行語料庫在翻譯實踐中,很難提高IT人士的翻譯速度和工作效率,但是,平行語料庫可以提高IT翻譯質(zhì)量。
平行語料庫;IT翻譯;實證研究
平行語料庫(parallel corpus)、可比語料庫(comparable corpus)和多語語料庫(multilingual corpus)是目前用于翻譯研究最主要的三種語料庫[1],在這三種語料庫中,與翻譯實踐結(jié)合得最緊密的當屬平行語料庫,在輔助翻譯實踐時,平行語料庫備受學者的推崇[2-5]。一般情況下,人們在翻譯實踐時對于不會譯的字、詞,一般都會借助翻譯工具書,最常用的當屬雙語詞典,雙語詞典里有比較豐富的釋義和例句,可以為譯者提供很好的參考。但是語言通常是變化的,隨著時代的發(fā)展,雙語詞典里的詞條釋義可能不夠豐富、完善,從而無法滿足翻譯的需求。而平行語料庫輔助翻譯具有比較明顯的優(yōu)勢,具體體現(xiàn)在: 輔助準確翻譯術(shù)語,譯文更加地道自然,適應目的語的文體風格,幫助譯者研究借鑒前人的翻譯策略[2,5]。在前期研究中,我們搜集了500萬字符的IT文本雙語語料[6],并對部分語料進行了加工和標注,建成了20萬左右字符的IT文本平行語料庫,根據(jù)平行語料庫的詞頻統(tǒng)計,該平行語料庫是以IT為主題的平行語料庫。IT文本平行語料庫作為一種新的資源和方法,在涉及IT領(lǐng)域的翻譯實踐中,正在不斷發(fā)揮、利用其作用。 國內(nèi)有學者認為,使用平行語料庫不僅提高了翻譯質(zhì)量[7-9],而且翻譯的 “速度大大提高”[8];還有的研究認為平行語料庫能提高翻譯效率[10]。由于平行語料庫在輔助翻譯實踐方面的結(jié)論不一,再者,IT英語在語體、詞法以及句法特征方面具有比較鮮明的特點,與文學等體裁的語言之間存在比較明顯的語言差異[11-12],因此,借助平行語料庫,通過實證研究的方式檢驗IT平行語料庫是否可以幫助譯者提高IT翻譯的速度、效率和翻譯質(zhì)量,具有一定的積極意義。
1.研究對象
在前期研究基礎上,本研究試圖利用IT文本平行語料庫輔助翻譯實踐,探索IT平行語料庫在提高IT翻譯速度、效率和質(zhì)量方面所能發(fā)揮的作用。本研究的實驗對象為某學院大三第二學期的軟件開發(fā)專業(yè)的80名學生,這80名學生全都選修過《IT英語》課程,對IT英語專業(yè)詞匯、IT翻譯等有一定的了解。為使兩組實驗對象的英語翻譯能力保持客觀平等,我們參照了他們大三第一學期的大學英語四級考試(CET4)的翻譯題的成績進行了分組:實驗組40人(使用教材配套語料庫資源輔助翻譯)和參照組40人(使用雙語詞典等常規(guī)參考資料進行IT翻譯)。在實驗進行之前,我們對實驗組的研究對象進行過兩個小時的語料庫軟件使用培訓,以確保他們都能掌握軟件使用方法。實驗安排在第二學期的第15教學周進行。
2.研究內(nèi)容
IT英語翻譯實驗的條件為:實驗組的學生利用IT平行語料庫進行輔助翻譯,參照組學生利用詞典進行輔助翻譯。為方便對實驗組和參照組的數(shù)據(jù)進行比較,我們對實驗的變量進行了控制,翻譯實踐時間為60分鐘。除使用的參考工具不一樣外,其他條件完全相同。此次翻譯實驗采取的形式為英譯漢形式。為了解翻譯過程中,參考資源的使用情況,翻譯完后,我們對學生進行了翻譯實驗相關(guān)的訪談,最后利用SPSS軟件對實驗的相關(guān)數(shù)據(jù)進行統(tǒng)計分析。
3.研究采用的平行語料庫、和實驗翻譯原文
本次實驗采取的是我們自己研制的中英句級對齊的IT文本英漢平行語料庫,其中標注的中文語料110,465字符,英語語料庫133,657字符。 出現(xiàn)頻率最高并有實際意義的實詞分別為:windows,use,network,information,[6:91]從文本涉及的主題來源來看,本實驗采用的語料庫為IT文本平行語料庫。平行語料庫采用的免費軟件為ParaConc V1.0,本檢索軟件可以進行詞和短語的檢索,還可以進行跨距的句型檢索。翻譯實驗的原文選用的是紫光教育專業(yè)組編著,外文出版社出版的《軟件與服務外包英語》中的一篇英語文章,英文字數(shù)460,此文章未包含在IT平行語料庫中,通過軟件檢索,此實驗原文的六個主題實詞與IT平行語料庫出現(xiàn)頻率在前二十位的主題實詞一致,所以該實驗短文屬于IT主題文本,符合我們實驗目的。
4.實驗環(huán)境
翻譯實驗的環(huán)境為配備了接入互聯(lián)網(wǎng)的多媒體電腦的教室。每個學生被告知,在規(guī)定的時間內(nèi)從內(nèi)網(wǎng)FTP文件區(qū)下載翻譯原文,IT平行語料庫和檢索工具。翻譯結(jié)束后,每個學生被要求將譯文通過網(wǎng)絡上傳到教師教學平臺。本次實驗除實驗工具不同外,其他實驗條件都完全一樣。
根據(jù)實驗目標,我們收集和統(tǒng)計了受試譯文在翻譯效率和翻譯質(zhì)量方面的數(shù)據(jù),然后利用SPSS軟件進行統(tǒng)計學分析。
1.反映翻譯效率的數(shù)據(jù)
翻譯效率主要體現(xiàn)在完成翻譯任務的學生數(shù)比、完成的翻譯任務量和IT專業(yè)術(shù)語翻譯結(jié)果上。根據(jù)實驗組和參照組的數(shù)據(jù)對譯文進行分析,收集了3組數(shù)據(jù),分別從3個不同角度進行考察。分別見表1、表2和表3。
表1 完成翻譯任務的人數(shù)比
表2 完成翻譯任務的量比較
表3 IT專業(yè)術(shù)語翻譯統(tǒng)計表
根據(jù)表1,在全部完成翻譯任務的學生數(shù)方面,實驗組要落后于參照組。這可能是由于實驗組的學生在翻譯的時候需要不斷借助檢索軟件查找語料庫,這個過程相對比較耗時,其次,雖然在實驗前有教授實驗組學生如何使用平行語料庫,但是在具體實操過程中,有些學生對操作方法和科學利用方面還不是很熟練。根據(jù)表2的結(jié)果,利用SPSS軟件進行統(tǒng)計分析發(fā)現(xiàn),實驗組和參照組在完成翻譯總字數(shù)方面存在顯著差異。
由于IT術(shù)語的翻譯是否準確可以作為驗證翻譯質(zhì)量的一個重要標準,同時也可以作為平行語料庫的一個重要優(yōu)勢[5][9]。所以我們將兩組譯文中的IT專業(yè)術(shù)語(22個,其中重復的2個)翻譯情況進行比較,借此用來對兩組的翻譯質(zhì)量進行統(tǒng)計和評估。從表3中可以發(fā)現(xiàn),實驗組和參照組在IT專業(yè)術(shù)語翻譯方面具有一定的差異。經(jīng)過SPSS軟件進行統(tǒng)計分析發(fā)現(xiàn),P 大于等于0.05,無顯著性差異。
2.反映譯文質(zhì)量的數(shù)據(jù)分析
在數(shù)據(jù)統(tǒng)計學原理下,有兩個參數(shù)可以用來評價翻譯質(zhì)量:一是術(shù)語翻譯的準確率,二是句子翻譯的完整性。見表4。
表4 IT術(shù)語翻譯的正確率對比
實驗采用的原文是一篇主題為IT軟件服務外包的英語段落,英文原文呈現(xiàn)句式完整、論述客觀、結(jié)構(gòu)嚴謹具有很強的科技英語特征。由于英漢語言在構(gòu)建句子的方式上的差異,由于漢語語言特點,在將原文翻譯成中文譯文時,基本呈現(xiàn)無明顯人稱代詞、少主語的特點,因此,在將英語原文轉(zhuǎn)換成中文譯本的時候,需要根據(jù)具體情況確定句子的主語并補充相應的人稱代詞,并且主動語態(tài)使用頻率高[13]。這是翻譯時候的一種翻譯策略,能否順利運用這一策略,將對譯文產(chǎn)生很大的影響。如果是句對句的逐詞翻譯,則中英文句子數(shù)量應該很接近,其次,根據(jù)IT文本英漢平行語料庫的中英文句子數(shù)量,可知,中文句子數(shù)量要遠低于英文句。為方便對兩組數(shù)據(jù)進行比較,需要統(tǒng)計各自完成譯文句子的總數(shù)和運用相應翻譯技巧構(gòu)建譯文句子的數(shù)量。見表5。
表5 運用翻譯增詞構(gòu)建譯文句子的數(shù)據(jù)統(tǒng)計
從表5中可知,P小于0.05,實驗組和參照組的數(shù)據(jù)有顯著性差異,再利用SPSS進行卡方檢驗,實驗組翻譯術(shù)語的準確性要較參照組有優(yōu)勢。其次,從表5的數(shù)據(jù)中看出,實驗組在翻譯時,句子轉(zhuǎn)換策略構(gòu)建的合法中文句子方面具有明顯優(yōu)勢。
由于實驗對象的實際英語水平以及他們的翻譯能力,術(shù)語準確率以及句子的完整性可以做為區(qū)別譯文高低的重要參數(shù)。所以,根據(jù)實驗的數(shù)據(jù)判斷,我們認為平行語料庫在一定程度上可以提高IT譯文的質(zhì)量。我們認為原因有三:首先,由于平行語料庫有比雙語詞典更多的優(yōu)勢,不僅僅可以為翻譯提供對譯詞語的雙語檢索,而且對IT術(shù)語和詞匯翻譯具有促進作用。 其次,由于本次實驗采用的的語料庫和翻譯原文文本的主題內(nèi)容基本一致,相關(guān)性比較高,實驗組的學生在利用平行語料庫時,輔助翻譯效果比較明顯。最后,語料庫對原文中的術(shù)語覆蓋率比較高。為證明這一假設,我們對實驗文本中的22個IT術(shù)語查全率做了統(tǒng)計。見表6。從表中的數(shù)據(jù)可以看到,完全可以查到和部分可查的術(shù)語占了90.9%。 換句話說,這些IT術(shù)語可以從所提供的IT平行語料庫中查找。其次,不僅僅是IT術(shù)語,一些出現(xiàn)在翻譯原文中的IT高頻動詞也都可以從語料庫中查到對應翻譯。見表7。
表6 抽查的IT專業(yè)術(shù)語查全率統(tǒng)計
表7 原文中10個動詞在IT平行語料庫中的頻率
與雙語詞典相比,平行語料庫覆蓋面廣,譯文范例眾多,具有很強的時效性[9:21],所以在IT詞語、IT語和短語方面的翻譯上具備明顯優(yōu)勢,這一點在實驗研究中得到了證實。另一方面,由于IT平行語料庫提供了大量豐富而翔實的語境,可以幫助譯者通過上下文確定選詞,還可以幫助譯者翻譯一些IT詞語、IT術(shù)語和短語方面無法對應的內(nèi)容。在IT平行語料庫的幫助下,實驗組的學生就能很好的將英文句子轉(zhuǎn)換成相對完整的中文句子。
在句子層面,由于中英文在句子結(jié)構(gòu)上存在很大的差異,英文屬形合語言,句式上比較完整,講究句法結(jié)構(gòu)完整,主語和人稱比較齊全。而漢語屬于意合語言,在句法形式上不太受約束,在對于非專業(yè)的譯者來說,要實現(xiàn)兩種語言自由順利地轉(zhuǎn)換,難度比較大。然而,IT平行語料庫可以為譯者提供大量豐富的語言環(huán)境,譯者可以從上下文中得到啟發(fā),從而運用相應的翻譯策略,從而順利地實現(xiàn)了翻譯。
比如實驗原文:“The company has been developing a self intellectual property SOA middle ware platform product in the last ten years called Resource One and there were four major versions that have been upgraded.”在語料庫中搜索該文本中的“developing”時,有275個實例(包括屈折形式),其中和“developing”右邊第一個搭配“一套”完全匹配的結(jié)果就有20個。
下面的例句1-2均來自語料庫的原文和譯文,通過觀察這兩個例子??梢詭椭鶬T譯者確定詞語對應的翻譯單位,還能幫助譯者找出句子結(jié)構(gòu)之間的差異,進而幫助譯者準確進行翻譯選詞,然后采用相應翻譯技巧,轉(zhuǎn)換成對應的完整、符合語法的譯文。
例 1:To portray human emotions, they rely on a unique facial animation system developed at PDI/DreamWorks.
譯文:為了表現(xiàn)人類的感情,他們靠的是PDI/夢工廠研發(fā)出來的一套獨特的臉部動畫系統(tǒng)。
例 2:The company has been developing a self intellectual property SOA middle ware platform product in the last ten years called Resource One and there were four major versions that have been upgraded.
譯文:去年,公司研發(fā)了一套自主知識產(chǎn)權(quán)的SOA中間件平臺產(chǎn)品,叫做中間件軟件R1,并對版本進行了四次升級。
在翻譯實踐中,如果只使用詞雙語詞典輔助翻譯,也能查到部分術(shù)語的對譯詞,但更多的是直接將詞典中的意義照抄進譯文,而沒有考慮到由于語境不同,句子結(jié)構(gòu)和意義也可能也不一樣。通過本次實驗,實驗組與參照組的翻譯結(jié)果正好驗證了這一點,究其原因,主要和翻譯實驗對象的英語水平有關(guān),其次還與雙語詞典缺乏相應的句子語境有關(guān)。
由于IT英語在語體、詞法以及句法特征方面具有比較鮮明的特點,IT文本英漢語料庫在輔助翻譯實踐時,在翻譯的質(zhì)量和效率方面,具有一定特殊性。通過本次翻譯實驗,我們可以得出兩個結(jié)論。結(jié)論一,實驗組在翻譯效率方面落后于參照組,沒有優(yōu)勢。這一結(jié)果符合理論推理,但是與一些學者研究的結(jié)果[8,10]有出入,但與[14]研究結(jié)果一致。平行語料庫的語料具有海量、最新的IT語料,在借助相關(guān)軟件的幫助下,可以為譯者提供翻譯輔助,語料越豐富,譯例也越豐富,從理論上來說,應該可以大大的促進翻譯效率,但是從本次實驗結(jié)果來看,結(jié)果卻截然相反。原因可能是:首先,由于平行語料庫提供的譯文范例過多,給譯者的挑選造成了很大的困難,而且過程非常耗時。再次,很多實驗組的學生反映,由于對軟件的使用不熟練,導致最后放棄對一些術(shù)語或者詞組的檢索,這反而使檢索軟件成為了一種累贅。結(jié)論二,IT譯者在翻譯中碰到的IT詞組、IT術(shù)語可以借助IT平行語料庫的幫助進行研究和思考,從而有可能提高翻譯質(zhì)量,這點與研究結(jié)果[14]保持一致。此次翻譯實驗驗證了平行語料庫具有提高IT譯文質(zhì)量的作用,而且平行語料庫的主題內(nèi)容與翻譯材料的相關(guān)性越高,譯文的質(zhì)量也越高。本次實驗也有一定的局限性,首先,平行語料庫的IT語料獲得比較困難,而且語料加工、句級對齊和實現(xiàn)標注尤其繁雜[15],其次,由于本次實驗的對象是本科院校IT專業(yè)大三學生,本次實驗的結(jié)論不一定具有普遍性,要使結(jié)論具有普遍性,實驗對象還需要多樣化,最后,IT翻譯質(zhì)量評價的模式還需要增加評估的參數(shù),以便使得數(shù)據(jù)更為可信和權(quán)威。
[1] 甄鳳超. 語料庫語言學在中國的成長與發(fā)展[J]. 當代外語研究,2010,(2):36-40.
[2] WILLIAMS A. A translator’s reference needs: dictionaries or parallel texts [J]. Target, 1996,8(2): 277-299.
[3] ASTON GUY. Corpus use and learning to translate [EB/OL]. [2009-10-28]. http://www. sslmit. unibo. it/~guy/ textus.htm.
[4] ZANETTIN FEDERICO. Corpora in Translation Practice [EB/OL].[2012-10-28]. http://www. ifi. unizh. ch/cl/yuste/postworkshop/repository/fzanettin. pdf.
[5] OLOHANM. Introducing corpora in Translation Studies:An Introduction[M].London and New York:Routledge, 2004.
[6] 蔣麗平. IT文本英漢平行語料庫的研制與應用[J],廣州大學學報,2013,(8):88-93.
[7] 謝家成.“一……就”的英譯——兼談英漢平行語料庫輔助漢譯英調(diào)查[J].中國科技翻譯,2004,(2):27-29.
[8] 韋瑤瑜,雷 蕾.雙語平行語料庫輔助中國英語學習者翻譯實踐[J].基礎教育外語教學研究,2006(4):28-30
[9] BOWKER, LYNNE. Using Specialized Monolingual Native-Language Corpora as a Translation Resource: A Pilot Study[J]. Meta,1998, (4),631-651.
[10] SOMERS H. Computers and translation: A translator’s guide[M].Amsterdam: John Benjamins,2003.
[11] 程世祿 蔣麗平. IT英語語體的語言特征—基于IT英語語料庫的分析[J].廣州大學學報,2012,(10): 54-58.
[12] 桂詩春,楊惠中.中國學習者英語語料庫[M]. 上海: 上海外語教育出版社,2003:11.
[13] 蔡 軍. 英語被動結(jié)構(gòu)與系補結(jié)構(gòu)句法語義對比研究[J].中南林業(yè)科技大學學報(社會科學版),2013,7(3):158-162.
[14] 賀文照. 平行語料庫輔助翻譯實踐實證研究[J].嘉興學院學報,2013, (3):64-69.
[15] 王克非. 新型雙語對應語料庫的設計與構(gòu)建[J]. 中國翻譯,2004,(6):73-76.
An Empirical Study of IT Text Parallel Corpus Assisting Translation Practice
JIANG Li-ping
(Foreign Languages Department, South-china Institute Software Engineering, Guangzhou 510990, Guangdong, China)
This study is based on an IT specialized Chinese-English parallel corpus with a specially designed concordancer for bilingual searching. These subjects are from the Software engineering majors who are in the their college year, required to fi nish the translation in 60 minutes. Data collected are calculated and analyzed after the experiment before the conclusion has been drawn that it is diff i cult for IT professionals to raise their translation production by using the IT text parallel corpus, however,the experiment shows the justif i cation that the IT parallel corpus can improve translation quality.
parallel corpus; IT translation practice; empirical study
H315.9
A
1673-9272(2014)04-0000-00
2014-05-28
廣東省教育科研“十二五規(guī)劃”課題(編號:2012JK169);北京外國語大學中國外語教育研究中心第六批中國外語教育基金資助“IT文本英漢雙語平行語料庫的開發(fā)與利用”(編號:ZGWYJYJJ2012A39);校級教科研課題“專用平行語語料庫在提高IT翻譯能力中的應用” (編號:ky201305)。
蔣麗平(1978-),男,湖南溆浦人,廣州大學華軟軟件學院講師,碩士,研究方向:語料庫英語語言學,英語翻譯理論與實踐,商務英語教學。
[本文編校:羅 列]