匡可風
摘 要: 本文從“汽車技術文獻翻譯語料庫”中隨機抽取2510句,通過機器譯文和人工譯文進行平行對比研究,對機器譯文中出現(xiàn)的各類句法和詞匯錯誤進行分類標注與統(tǒng)計。研究發(fā)現(xiàn),被動態(tài)類在機器翻譯中幾乎無一成功,英譯漢別扭趨異。本文旨在從句法學的角度分析被動態(tài)句型翻譯失敗的原因,找尋較為合適的翻譯方式。
關鍵詞: 機器翻譯 被動態(tài) 句法學 錯誤分析
一、引言
從句法學理論的角度分析英譯漢機器翻譯的錯誤問題,有利于清晰地整合統(tǒng)計錯誤類型,便于程序設計的進一步完善。然而,漢語在句法學理論中一直是一個特殊存在。英語是形合的語言,句法將一個個短語成分,如NP、VP等銜接在一起,形成完整嚴密的邏輯意群;漢語是意合的語言,所謂“形散而意不散”,句子短語成分較為離散,這一差異在被動語態(tài)中尤為明顯。因此,本文旨在分析被動態(tài)句型在英譯漢機器翻譯中失敗的原因,尋找錯譯的規(guī)律及可能的解決方法。
二、機器翻譯背景簡概
人工智能時代催生了一個重要的時代課題——機器翻譯。它是實現(xiàn)全球無障礙交際的重要技術手段。機器翻譯又稱自動化翻譯,是應用語言學中的一門新興的實驗性學科,研究如何利用計算機按一定程序自動進行自然語言間的翻譯問題。由于機器翻譯是將提供的源語形式化和代碼化,進行程序設計并輸出目標語,其適用翻譯范圍客觀性較強,一般適用于如法律行政文件、科技說明、宣傳手冊及科普文獻等,情感色彩濃厚的文學修辭類作品不適用于機器翻譯。
“十五”期間,中國科學院計算機研究所對我國現(xiàn)有的機器翻譯系統(tǒng)進行了測評,結(jié)合機器翻譯系統(tǒng)對詩歌、散文和受限語言等不同體裁風格的文本翻譯,在對譯文進行具體分析對比和綜合評價的基礎上,確定了英漢機器翻譯在受限語言處理中取得了最高的5級適用級別和85%以上的可翻譯度(張政,2006:131-162)。機器翻譯對外推廣已經(jīng)產(chǎn)生了巨大的經(jīng)濟和社會效益。然而,目前機器翻譯系統(tǒng)在翻譯質(zhì)量上無法滿足客戶的需求是機器翻譯無法真正實現(xiàn)市場化最大的障礙(羅季美,李梅,2012:84)?;诖藛栴},更多語言學領域的學者對機器翻譯的完善與提高進行了深入的探究。本文將在已有英漢被動態(tài)差異研究的基礎上,簡析2510句機器譯文中的被動語態(tài)錯譯,以圖找尋錯譯的規(guī)律及解決方法。
三、語料庫錯譯研究內(nèi)容
1.研究對象
基于對機器翻譯適用范疇的研究成果,本文以同濟大學汽車學院的“汽車技術文獻翻譯語料庫”中某一知名品牌汽車操作手冊為研究對象,對十萬句機器譯文和人工譯文展開了平行對比研究。語料中的機器譯文由“華建機器翻譯系統(tǒng)”(中國科學院計算機語言信息工程研究中心研發(fā))生成獲取,人工譯文來源于該學院資料翻譯研究所專業(yè)技術人員。
2.錯譯數(shù)據(jù)統(tǒng)計
根據(jù)研究人員從句法學的角度設立了詞匯類、句法類和其他類三大錯誤類型,其中詞匯類錯誤有詞匯術語、詞匯詞性、詞匯贅譯和詞匯漏譯;句法類錯誤包括句法詞序、句法分詞、句法名詞短語、句法動詞短語、句法介詞短語、句法被動態(tài)、句法不定式及句法分詞;其他類錯誤則是一些符號類的細枝末節(jié)問題?;陔S機抽取的2510句樣本,進行人工譯文和機器譯文的平行對比研究,發(fā)現(xiàn)以上三大錯誤類型,在樣本中總計3318處。其中句法類錯誤中,句法詞序錯誤399處,占12%;句法被動態(tài)錯誤124處,占3.7%;句法名詞短語錯誤8處,占0.2%;句法動詞短語錯誤45處,占1.4%;句法介詞短語錯誤118處,占3.6%;句法不定式錯誤13處,占0.4%;句法分詞錯誤24處,占0.7%。
由此可見,句法詞序錯誤發(fā)生幾率最頻繁,達到399處,占所有錯誤率的12%。句法詞序錯誤成因較為復雜,與句法動詞短語、句法分詞等錯誤交叉成因,無法單獨分析。錯誤率排名第二的被動態(tài)將是本文分析的核心。
四、被動態(tài)錯誤實例分析
1.句法學中被動態(tài)構(gòu)造
根據(jù)格理論的實質(zhì)——格檢驗式(case filter),句中的每一個名詞短語都必須得到抽象格(Haegeman,1994:181)。被動態(tài)的主要結(jié)構(gòu)是“be done”,其活動的施動者(agent)在被動態(tài)中需有介詞“by”引導,一般放在句尾。在主動態(tài)轉(zhuǎn)為被動態(tài)的過程中,動詞曲折變化受到影響,動詞外在論元角色(external theta role)和結(jié)構(gòu)格被吸納,轉(zhuǎn)化為分詞的動詞內(nèi)在論元角色移動到它能被任格的句首。根據(jù)格檢驗式理論,被賦格內(nèi)在論元角色的名詞短語從賓語移動主語的位置是必需的,因為主語位置在被動化中出現(xiàn)了空缺。
一般來說,被動態(tài)強調(diào)受動者(patient),介詞“by”引導的施動者在許多語言中往往不予表達。然而,在漢語中卻是例外,王力先生在《中國語法理論》里說:“中國正常的被動式是必須把主事者說出的。”這就導致了英譯漢過程中的一大別扭,“被”字究竟該不該省譯,若不能省譯,則“被”字要如何轉(zhuǎn)換才能成為最地道的漢語表達?下面一節(jié)將通過人工譯文與機器譯文的對比,指出被動態(tài)翻譯錯誤,分析英文被動態(tài)應該如何順利過渡為漢語被動態(tài)。
2.被動態(tài)構(gòu)造實例
通過對機器翻譯被動句進行詳細剖析,發(fā)現(xiàn)樣本中被動句一般分為兩種,一是獨立VP,即為“be done”,二是VP后出現(xiàn)介詞“by”跟隨的施動者,或其他介詞短語,即為“VP+PP”,兩種類型翻譯大相徑庭。首先請看“be done”實例。
例1:
例1,與句法被動態(tài)相關的是“is not required”,只是單一的“論元+謂詞結(jié)構(gòu)”,謂詞中攜帶的內(nèi)在論元角色在被動轉(zhuǎn)換中填補了主語位置的空缺,可看到機器翻譯是逐字對譯,人工翻譯將被動語序還原成主動語序,將受試者后移,避免了“被”字的別扭使用,同時省略主語——操縱員。特殊的一點是例1中被動語態(tài)前的名詞短語在人工翻譯中動詞化,還原成主動態(tài)后是“謂詞結(jié)構(gòu)+VP”,這是機器翻譯的一大障礙,英文習慣使用靜態(tài)的名詞短語,漢語趨向動態(tài)的動詞短語。
例2:
例3:
例2與句法被動態(tài)相關的是“is not completed”,例3為“is centered”,這兩句也是單一的“論元+謂詞結(jié)構(gòu)”,句法形成原理與上面一樣,但是人工翻譯中,被動語序并未還原成主動態(tài),把受試者后移。例2中,關鍵因素就在VP “complete”?!安襟E完成”和“完成步驟”在漢語中均為正確表達,即“V+NP”與“NP+V”語法上均正確,類似的還有“達成協(xié)議=協(xié)議達成”、“吃飯了=飯吃了”,然而像“得出結(jié)論”就不能替換成“NP+V”,這類漢語搭配也是句法學特殊的現(xiàn)象,在機器翻譯中應單獨被挑出,機器翻譯時只需去掉“被”字即可。例3中的“be centered”方向性、地點性動詞更特殊,翻譯成漢語只能是“NP+V”,即使加上主語,“the steering is centered by the operator”,也只能譯為”操縱員使方向盤位于正中”,“方向盤”依舊是“正中的邏輯主語,這也是機器翻譯程序設計中需要特殊標記的。
例4:
例5:
第二大類型即為“VP+PP”,例4的介詞短語“in the HEIGHT SET screen”不是謂詞的施動者,是狀語成分,在機器翻譯中只需注意該類狀語在漢語中習慣的擺放位置。一般來講,狀語在句中修飾謂詞,那么在譯成漢語的位置應變?yōu)椤癙P+謂詞+內(nèi)在論元”,還原成省略主語的主動態(tài),“被”字刪除。
例5為“by”引導的介詞短語,在機器翻譯程序設計中應進行特殊標注?!癰y”后面的NP是整個句子的邏輯主語,是主動態(tài)謂詞的外在論元角色,然而,此結(jié)論建立的前提是“by”后的施動者為有生命體。在機器翻譯中,需劃分“by”后面的施動者是否有生命性。倘若施動者是有生命體,翻譯語序可直接調(diào)整為“‘by后生命體+謂詞+內(nèi)在論元”,即“NP1+VP+by+NP2”轉(zhuǎn)換為“NP2+VP+NP1”,省略“by”。若該施動者是無生命體,除非是文學修辭中的擬人手法,否則外在論元提升為謂詞主語,不符合漢語表達習慣,如例5的機器翻譯就犯了此類錯誤?!癆ctive Test”是無生命體,是謂詞“switch”表現(xiàn)的方式,對于這一系列句子,翻譯時可以添加“by”的原始意義“通過”,即順序調(diào)整由“NP1+VP+by+NP2”轉(zhuǎn)變?yōu)椤巴ㄟ^+NP2+VP+NP1”,那么機器輸出的譯文“通過主動測試切換前內(nèi)腳燈狀態(tài)”,即視為正確譯本。此外,我們也不容忽視by的一些特殊用法,如“by bike”、“by air|”、“by the end of the year”,這些固定搭配應如專業(yè)術語一般提前錄入程序,在翻譯排序中列于最前面。
五、 結(jié)語
在對“汽車技術文獻翻譯語料庫”進行樣本抽查和平行研究后發(fā)現(xiàn),機器翻譯前景較為可觀,華建機器翻譯系統(tǒng)已經(jīng)具備了一定的英漢互譯能力,一些英譯漢文字雖較為不自然,但仍具有可讀性。然而,機器翻譯在處理長難句時,依舊面臨不知道如何劃分意群、調(diào)整詞序等障礙,無法清晰認識句子的整體結(jié)構(gòu)。因此,要想讓機器翻譯更完善,語言學家需要不斷分析英漢兩種文字在句法構(gòu)造上的差異,除特殊的專業(yè)術語需要嚴格統(tǒng)計、一一對應外,還要進行大規(guī)模地分類漢語中不符合英語句法學規(guī)則的系列短語。此外,在面臨諸如被動態(tài)系列問題處理時,計算機可根據(jù)源語句法構(gòu)成進行嚴格的劃分排序,如單一的“論元+謂詞”,則計算機采取將謂詞提前的方式翻譯,這樣便可提高系列翻譯句型的準確性。
參考文獻:
[1]劉群.機器翻譯研究新進展[J].當代語言學,2009(2):147-158.
[2]羅季美,李梅.機器翻譯譯文錯誤分析[J].中國翻譯,2012(5):84-89.
[3]熊德意,劉群,劉守勛.基于句法的統(tǒng)計機器翻譯綜述[J].中文信息學報,2008(3):28-39.
[4]朱躍.英漢機器翻譯現(xiàn)狀與可信賴機器翻譯[J].天津外國語學院學報,2003(7):14-18.
[5]張政.計算機翻譯研究[M].北京:清華大學出版社,2006.