郭會曼 劉采敏
摘 要:隨著機器翻譯和我國知識產(chǎn)權(quán)事業(yè)的快速發(fā)展,機器翻譯技術(shù)開始廣泛應(yīng)用于專利文本翻譯,提高翻譯效率的同時也存在一定翻譯錯誤。本文選取60篇近兩年國內(nèi)申請機械領(lǐng)域?qū)@M行英譯測試,將機器翻譯中錯誤類型歸納為詞匯、句法、語篇及其他四個層面,通過分析機器譯文錯誤類型,指出人工在提高機器譯文質(zhì)量中的作用,以期為從事專利摘要翻譯的譯者提供有益思考。
關(guān)鍵詞:機器翻譯;專利摘要;錯誤類型;解決方法
中圖分類號:H315.9 文獻標識碼:A 文章編號:2095-9052(2020)06-0137-02
機器翻譯又稱自動翻譯。目前最優(yōu)質(zhì)的機器翻譯模型是谷歌首創(chuàng)的神經(jīng)網(wǎng)絡(luò)機器翻譯[1],在科技型文本等相對限定領(lǐng)域翻譯中取得了可喜成果。專利文本作為垂直領(lǐng)域?qū)嵱妙愇谋镜闹匾糠?,也是機器翻譯的主要應(yīng)用領(lǐng)域[2]。但機器翻譯對于長句或復(fù)雜句,譯文質(zhì)量不能令人滿意。機器翻譯的成功只是局部的、有限的[3],翻譯質(zhì)量仍然無法與人工翻譯相提并論。官鳳霞[4]指出,目前專利漢英機器翻譯仍存在術(shù)語錯誤、語義錯誤、語法錯誤等質(zhì)量問題。
一、機器翻譯錯誤類型
本文隨機選取知識產(chǎn)權(quán)局網(wǎng)站60篇國內(nèi)申請機械領(lǐng)域?qū)@鳛闃颖?,使用谷歌翻譯軟件英譯,并與官方英文摘要比較,歸納分析谷歌翻譯的錯誤類型。雖然機器譯文質(zhì)量評價標準不盡相同,但最終都落到可懂度和忠實度[5]。機器翻譯質(zhì)量評估方法大致分為人工評估法和自動評估法[6],本文采用人工評估法,并參照相關(guān)學(xué)者的研究對樣本進行人工標注、分類和匯總,得出的結(jié)果見表1。
據(jù)統(tǒng)計,本次共計312處機器翻譯錯誤。錯誤類型分為四類一級錯誤,進一步細化得出二級錯誤類型,其中詞匯層面包括3個子類:詞匯錯譯(術(shù)語錯譯、普通詞匯錯譯、詞性錯譯)、詞匯漏譯、詞匯重復(fù)。句法層面包括3個子類:結(jié)構(gòu)錯誤、句段漏譯和被動態(tài)使用錯誤。語篇層面包括2個子類:邏輯缺失、邏輯錯誤。其他錯誤包括3個子類:大小寫錯譯、標點符號錯譯和空格錯誤。
各類翻譯錯誤如圖1所示,詞匯層面出錯率最多,依次為其他錯誤、句法錯誤和語篇錯誤,其中其他錯誤為格式錯誤,是專利摘要固有格式要求下機器翻譯高出錯類型。
二、錯誤類型分析
(一)詞匯層面錯誤類型
由圖1可知,詞匯翻譯錯誤率達51%,具體可分為詞匯錯譯、詞匯漏譯和詞匯重復(fù),接下來逐一分析。
1.詞匯錯譯
第一,術(shù)語錯譯。詞匯層面中術(shù)語錯譯占比32%。如“生物樣本儲存庫”,譯文為“biological sample storage library”。使用必應(yīng)詞典和COCA語料庫查詢驗證,該術(shù)語翻譯是錯誤的。該類錯誤不僅表現(xiàn)為術(shù)語翻譯不準確,還表現(xiàn)為同一文本中標題與正文、正文與正文之間術(shù)語翻譯的不一致。
第二,普通詞匯錯譯。該分類涵蓋名詞單復(fù)數(shù)、冠詞、介詞錯譯。其中冠詞錯譯占比49%,包括不定冠詞和定冠詞之間混用及遺漏。專利摘要冠詞使用有嚴格要求,第一次出現(xiàn)單數(shù)可數(shù)名詞,使用不定冠詞a/an,之后則使用定冠詞the。機器翻譯無法遵循這一格式要求,難免出現(xiàn)錯誤。
第三,詞性錯譯。翻譯中適當(dāng)詞性轉(zhuǎn)換可使譯文更符合譯入語表達習(xí)慣,反之則會產(chǎn)生相反效果。如“使得電磁閥電磁力獲得一致性”,機器譯文為“so that the electromagnetic force of the solenoid valve can be consistent”,中式表達明顯且詞性出現(xiàn)錯譯。英文是靜態(tài)語言,中文是動態(tài)語言,機器譯文的處理方式忽視了中英文詞性使用上的差異,不符合英文的地道表達。
2.詞匯漏譯
漏譯是指因系統(tǒng)問題或疏忽大意等原因,在譯文中意外漏掉原文中某些詞的翻譯[7]。此次谷歌翻譯詞匯漏譯占比15%,如“本發(fā)明……尤其是一種機械手上執(zhí)行移動的機械臂”,機器譯文為“The invention … in particular to a manipulator arm that performs movement”,原文中第二個“機械手”被漏譯。如果原文增加方位介詞“在”,想必此處的漏譯就可以避免。由此可見,原文表述的準確性也將產(chǎn)生直接作用。
3.詞匯重復(fù)
該類錯誤如“to move different types of materials. Materials.”“and the The problem of…”,這兩句中“material”和“the”在前文已出現(xiàn)且表達完整,但后面又出現(xiàn)了該詞,這是機器翻譯特有的錯誤特征,出現(xiàn)頻率不高,但需要譯者再次核對檢查。
(二)句法層面錯誤類型
樣本句法錯誤分為語序混亂、句段漏譯和被動態(tài)使用錯誤,總錯誤率為18%,其中語序混亂在同類錯誤中占比高達79%。
1.語序混亂
專利摘要中同一主語會搭配多個修飾性定語,同一步驟包含多個動詞。如“垃圾被次級擠壓器擠壓后呈條狀排至廢料箱”,機器譯文為“and the garbage is squeezed by the secondary squeezer It is discharged to the waste bin in the form of a bar”,機器譯文斷句錯誤,多個動詞的前后關(guān)系混亂模糊,譯文并不完全符合原意。
2.句段漏譯
專利文本表達嚴謹,詞語重復(fù)較多;機械領(lǐng)域多裝配設(shè)置的表述且多限定性描述詞,這些都易導(dǎo)致漏譯。如“另一端連接有總管體,總管體連接有設(shè)置在冷卻液盛放箱的泵體,泵體上連接有第二分管”,機器譯文為“The other end is connected with a main pipe body. The pump body of the cooling liquid containing box is connected with a second branch pipe”,仔細對比可知,“總管體連接泵體”這一層意思在機器譯文中并沒有被翻譯出來,即產(chǎn)生了句段漏譯。
3.被動態(tài)使用錯誤
英文科技型文本注重表達的客觀性,多使用被動態(tài),機器翻譯無法完全準確使用語態(tài),如“改中心處理器主動指令控制車床全部運行進程”,機器譯文為“The central processor actively instructs to …”,原文沒有明確的動作實施者,也無需強行將主語翻譯出來,對比原譯文“Active instructions of a central processing unit are used for…”被動態(tài)的處理更為妥帖,也更符合英文科技文本的行文習(xí)慣。
(三)語篇層面錯誤類型
專利摘要譯文要語言凝練、邏輯清晰,這也正是語言語篇所應(yīng)具備的普遍特征。本研究中語篇層面錯誤占比4%,主要表現(xiàn)為邏輯缺失和邏輯錯誤,即機器譯文看似為完整句且語義通順,但仔細分析會發(fā)現(xiàn)明顯邏輯關(guān)系缺失或者邏輯關(guān)系錯誤,導(dǎo)致譯文語句松散、邏輯性不強,影響譯文整體質(zhì)量。
(四)其他錯誤
其他錯誤包括大小寫錯譯、標點符號錯譯和空格錯誤,占比40%,值得重視。大小寫錯誤總結(jié)可分為在分號、逗號、冒號后面及句中大小寫錯誤;標點符號錯譯多為分號、逗號和句號誤用;空格錯誤即多空格,屬于機器翻譯技術(shù)格式問題。
三、錯誤類型解決方法
從上文得知,專利摘要機器譯文仍存在四大錯誤,這些錯誤可通過人工優(yōu)化翻譯流程和改進翻譯技術(shù)來提高譯文質(zhì)量。
翻譯流程方面,增加譯前編輯流程,通過人工分析原文本的可讀性,對原文進行句段調(diào)整,確保原文完整度,減少機器譯文出錯率,這對譯者專業(yè)知識儲備有一定要求。譯中引入計算機輔助翻譯工具,借助Trados軟件建立術(shù)語庫,確保術(shù)語準確度;建立專利垂直領(lǐng)域語料庫,規(guī)范專利摘要固定表達和常用句式譯法。采用機器翻譯+譯后編輯模式,譯者要熟悉專利文本的語言特點和固定格式及表達要求,了解機器譯文中常見錯誤類型,做到有所側(cè)重。還可借助Xbench質(zhì)檢工具,對機器譯文中術(shù)語進行質(zhì)檢,確保術(shù)語表達一致性。
翻譯技術(shù)方面,雖然機器翻譯技術(shù)取得巨大進步,但仍不能與人工相媲美。針對上述錯誤類型,還要加大機器翻譯技術(shù)在句子切分、語義識別、格式轉(zhuǎn)換等方面研究,提出更符合專利文本翻譯的可行性方案。
四、結(jié)語
機器翻譯廣泛應(yīng)用于專利文獻的翻譯,改變了傳統(tǒng)專利摘要的翻譯模式,但仍出現(xiàn)一定程度的錯誤,影響譯文的翻譯質(zhì)量,而人工的加入在優(yōu)化翻譯流程和技術(shù)改進方面仍不可或缺。面對機器翻譯時代的強勢來襲,譯者要根據(jù)這一趨勢,合理調(diào)整自我角色定位,提升相關(guān)專業(yè)技能,要做到擁抱技術(shù)而不依賴技術(shù)。
參考文獻:
[1]蔡強,董冬冬.基于GOOGLE神經(jīng)網(wǎng)絡(luò)漢英翻譯的譯后編輯研究——以科技文本為例[J].西南石油大學(xué)學(xué)報(社會科學(xué)版),2020(1):107-112.
[2]董連棋,李梅.譯后編輯角度的機器翻譯系統(tǒng)的性能對比[J].譯苑新譚,2019(1):53-58.
[3]張政.機器翻譯難點所在[J].外語研究,2005(5):59-62.
[4]官鳳霞,費一楠.人機時代專利翻譯前景分析[J].中國發(fā)明與專利,2019,16(11):64-67.
[5]羅季美,李梅.機器翻譯譯文錯誤分析[J].中國翻譯,2012,33(5):84-89.
[6]馬鳴皓.機器翻譯質(zhì)量評估芻議[J].寧波教育學(xué)院學(xué)報,2019,21(6):76-78+93.
[7]崔啟亮,李聞.譯后編輯錯誤類型研究——基于科技文本英漢機器翻譯[J].中國科技翻譯,2015,28(4):19-22.
(責(zé)任編輯:林麗華)