潘正芹,羅華珍,易永忠
(桂林電子科技大學(xué)外國(guó)語(yǔ)學(xué)院,廣西 桂林541004)
機(jī)器翻譯的困境、前景和出路
潘正芹,羅華珍,易永忠
(桂林電子科技大學(xué)外國(guó)語(yǔ)學(xué)院,廣西 桂林541004)
文章總結(jié)機(jī)器翻譯的發(fā)展現(xiàn)狀,闡述機(jī)器翻譯目前遇到的難于突破的瓶頸,揭示傳統(tǒng)的機(jī)器翻譯的局限性和遇到的困境,最后指出機(jī)器翻譯的前景和出路在于:(1)加強(qiáng)語(yǔ)言研究成果的計(jì)算機(jī)語(yǔ)言轉(zhuǎn)換,更好服務(wù)機(jī)器翻譯;(2)語(yǔ)料庫(kù)的應(yīng)用。應(yīng)用翻譯平行語(yǔ)料庫(kù),結(jié)合大數(shù)據(jù),云計(jì)算,實(shí)現(xiàn)云翻譯,在云翻譯平臺(tái)上資源共享,探討交流,達(dá)到翻譯效率倍增的效果。
機(jī)器翻譯;困境;數(shù)據(jù)庫(kù);云計(jì)算;云翻譯
機(jī)器翻譯通過(guò)應(yīng)用計(jì)算機(jī)技術(shù),將書(shū)寫(xiě)形式或聲音形式的自然語(yǔ)言,翻譯成另一種書(shū)寫(xiě)形式或聲音形式的自然語(yǔ)言,是一項(xiàng)集計(jì)算機(jī)科學(xué)、人工智能、數(shù)理邏輯和語(yǔ)言科學(xué)于一身的應(yīng)用工程,它的定位是交叉學(xué)科或邊緣學(xué)科。機(jī)器翻譯大概始于上世紀(jì)50年代的美國(guó),如今機(jī)器翻譯的應(yīng)用已經(jīng)遍布全球所有具備計(jì)算機(jī)和互聯(lián)網(wǎng)條件的國(guó)家。隨著計(jì)算機(jī)技術(shù)進(jìn)一步發(fā)展和普及,機(jī)器翻譯軟件的處理能力也隨之增強(qiáng)。在發(fā)達(dá)國(guó)家和地區(qū),機(jī)器翻譯不僅用于文字處理系統(tǒng),分擔(dān)很大一部分以前由翻譯工作者承擔(dān)的日常工作,而且正在朝著智能聲控翻譯通信技術(shù)的方向發(fā)展,例如,現(xiàn)在很多款智能手機(jī)具有語(yǔ)音識(shí)別能力,可以執(zhí)行簡(jiǎn)單的聲控翻譯了,不懂外語(yǔ)的人只要選擇手機(jī)上的相應(yīng)功能按鈕,就可以通過(guò)有聲語(yǔ)言輸入,轉(zhuǎn)換成所需要的外語(yǔ),不過(guò)這個(gè)翻譯技術(shù)還處于簡(jiǎn)單的語(yǔ)言處理階段。 由于機(jī)器翻譯速度快,成本低,已經(jīng)成為翻譯界最受青睞的翻譯工具。在我國(guó),機(jī)器翻譯進(jìn)入百姓生活應(yīng)該是始于上世紀(jì)90年代的,金山詞霸就是最初的詞對(duì)詞的翻譯軟件,如今機(jī)器翻譯已經(jīng)可以在幾分鐘內(nèi)處理大篇幅的文章,成了最重要的翻譯手段。機(jī)器翻譯的開(kāi)發(fā)呈現(xiàn)多元化和多種模式,包括翻譯軟件、在線翻譯網(wǎng)絡(luò)平臺(tái)(如百度在線翻譯、谷歌在線翻譯和有道在線翻譯)等等,開(kāi)發(fā)規(guī)模也不斷壯大,開(kāi)發(fā)機(jī)構(gòu)和軟件不再限于著名的大公司和企業(yè) (如天津大通通譯計(jì)算機(jī)軟件研究所的“通譯”、中軟總公司的“譯星智能翻譯平臺(tái)”、北京交大銘泰信息技術(shù)有限公司的雅信CAT計(jì)輔翻譯系統(tǒng)),全國(guó)各大城市都有機(jī)器翻譯的軟件開(kāi)發(fā)公司,越來(lái)越多的電腦公司也已經(jīng)把目光和精力投向了機(jī)器翻譯的開(kāi)發(fā)市場(chǎng),目前,基于語(yǔ)料庫(kù)的翻譯英漢互譯實(shí)例正成為未來(lái)發(fā)展的方向,少數(shù)民族語(yǔ)言的翻譯也開(kāi)始初露端倪。
問(wèn)題是:當(dāng)翻譯工具或軟件普遍流行之后,很多人會(huì)認(rèn)為有了這些東西,不懂外語(yǔ)也能做翻譯了,事實(shí)真的如此嗎?
我們先借用羅季美、李梅(2012、2014)以“汽車(chē)技術(shù)文獻(xiàn)翻譯語(yǔ)料庫(kù)”為基礎(chǔ),對(duì)機(jī)器譯文和人工譯文進(jìn)行的平行對(duì)比研究所得出的數(shù)據(jù)來(lái)說(shuō)明問(wèn)題。他們通過(guò)1000句的抽象對(duì)比,發(fā)現(xiàn)機(jī)器翻譯獲得的標(biāo)準(zhǔn)譯文只占10.3%,而錯(cuò)誤譯文達(dá)89.7%,把譯文錯(cuò)誤劃分成一級(jí)錯(cuò)誤和二級(jí)錯(cuò)誤,一級(jí)錯(cuò)誤包括詞匯錯(cuò)誤,句法錯(cuò)誤,符號(hào)錯(cuò)誤,分別占84.13%,42.45和4.95的比率。詞匯錯(cuò)誤包括:術(shù)語(yǔ)錯(cuò)譯、連詞錯(cuò)譯、詞性錯(cuò)譯、詞匯縮寫(xiě)錯(cuò)譯、詞匯漏譯、詞匯替代錯(cuò)譯、詞匯不譯;句法錯(cuò)誤包括:詞序錯(cuò)譯、名詞短語(yǔ)錯(cuò)譯、動(dòng)詞短語(yǔ)錯(cuò)譯、介詞短語(yǔ)錯(cuò)譯、被動(dòng)語(yǔ)態(tài)錯(cuò)譯、動(dòng)詞不定式錯(cuò)譯、分詞錯(cuò)譯。至于二級(jí)錯(cuò)誤在這里就不再詳細(xì)說(shuō)明。對(duì)于真正懂外語(yǔ)的人來(lái)說(shuō),機(jī)器翻譯和人工翻譯很容易區(qū)分,機(jī)器翻譯得譯文第一眼就能讓人看出問(wèn)題:表達(dá)僵硬、結(jié)構(gòu)混亂、邏輯不嚴(yán)、意義不清。這樣描述豈不是全面否定了當(dāng)今社會(huì)機(jī)器翻譯的成果和否定機(jī)器翻譯的發(fā)展大趨勢(shì)?當(dāng)然不是,首先要樹(shù)立兩個(gè)觀點(diǎn):第一、機(jī)器翻譯在批量上確實(shí)解決了很多詞匯問(wèn)題,在譯文方面完成了粗加工,形成了半成品,這個(gè)過(guò)程的工作量非常之大,占據(jù)了人工翻譯的大部分時(shí)間和精力,有了機(jī)器翻譯,節(jié)省人力和大量時(shí)間,提高翻譯的速度,從質(zhì)的角度來(lái)說(shuō),它可能沒(méi)發(fā)揮太大作用,只有10.3%的標(biāo)準(zhǔn),但從量的角度說(shuō),它發(fā)揮了關(guān)鍵性作用;第二、機(jī)器翻譯的譯后編輯是機(jī)器翻譯不可缺少的組成部分,從質(zhì)的角度說(shuō),它是關(guān)鍵的階段,操作和使用翻譯軟件很容易,譯后編輯才是翻譯人員專(zhuān)業(yè)素質(zhì)的體現(xiàn)。
機(jī)器翻譯至今存在的問(wèn)題依然是結(jié)構(gòu)歧義和語(yǔ)義歧義,這些問(wèn)題的出現(xiàn)是隨著機(jī)器翻譯的發(fā)展帶來(lái)的。機(jī)器翻譯經(jīng)歷了三個(gè)階段:第一代的機(jī)器翻譯,只能做詞對(duì)詞的簡(jiǎn)單翻譯,只起到查詞典的作用,并不能進(jìn)行真正的語(yǔ)言翻譯;第二代機(jī)器翻譯開(kāi)始重視語(yǔ)法,尤其是句法的分析。正是語(yǔ)言學(xué)理論的突破,導(dǎo)致了機(jī)器翻譯的發(fā)展;第三代機(jī)器翻譯具有較強(qiáng)的語(yǔ)義分析手段,較多地采用了語(yǔ)義學(xué)和語(yǔ)用學(xué)信息,能較好地解決句子歧義問(wèn)題。這些發(fā)展階段放在中國(guó)的歷史背景下,我們今天才進(jìn)入第二、第三階段。張政(2005)把出現(xiàn)的問(wèn)題歸因?yàn)椋?)翻譯本身的復(fù)雜性;2)自然語(yǔ)言的復(fù)雜性和3)機(jī)器自身的局限性。翻譯的復(fù)雜性表現(xiàn)在翻譯涉及到各種因素和各個(gè)學(xué)科的綜合運(yùn)用,包括譯者的目的、讀者對(duì)象、語(yǔ)體、跨文化、宗教、美學(xué)、語(yǔ)境等多因素的考量和詞匯學(xué)、語(yǔ)法學(xué)、語(yǔ)義學(xué)、語(yǔ)用學(xué)等多學(xué)科的綜合應(yīng)用,加上翻譯技巧的多樣性和翻譯策略的多元化;自然語(yǔ)言的復(fù)雜性主要表現(xiàn)在(a)句法的復(fù)雜性,句法成為專(zhuān)門(mén)的學(xué)科,句法的差異直接影響到意義的表達(dá)效果,(b)語(yǔ)義的復(fù)雜性,語(yǔ)言詞匯豐富,一詞多義,一義多詞,近義詞,反義詞,褒義詞,貶義詞,中性詞,相互交織,錯(cuò)綜復(fù)雜,(c)語(yǔ)篇的復(fù)雜性,包括語(yǔ)篇結(jié)構(gòu)、思想、邏輯、主題和構(gòu)建語(yǔ)篇的語(yǔ)言技巧和策略。目前的機(jī)器翻譯尚未能夠有效地納入這些因素,翻譯效果遠(yuǎn)未達(dá)到人工水平。結(jié)構(gòu)歧義表現(xiàn)在句子凌亂、語(yǔ)法錯(cuò)誤,句與句之間意義不連貫,語(yǔ)義歧義表現(xiàn)在措辭不當(dāng),詞義錯(cuò)誤,甚至導(dǎo)致前后矛盾、不知所云。
機(jī)器翻譯最早只能是詞對(duì)詞的翻譯,只起到詞典的功能和作用,句法的應(yīng)用使得句子的翻譯得以進(jìn)行,使用直接翻譯法可以解決,以英漢為例,用百度在線翻譯做實(shí)驗(yàn),當(dāng)原文和譯語(yǔ)(目的語(yǔ))有高度的相似性時(shí),可以直接對(duì)應(yīng)翻譯,如原文“他是個(gè)老師?!蹦康恼Z(yǔ)就是“He is a teacher.”,隨著原文結(jié)構(gòu)復(fù)雜程度的增加,我們看看機(jī)器翻譯是否還能保持正確的目的語(yǔ)。
1)【原文】 他是個(gè)老師。 【機(jī)譯】He is a teacher.(百度)
2)【原文】他是一個(gè)對(duì)學(xué)生很?chē)?yán)格的老師。
【機(jī)譯】He is a teacher who is very strict with his students.(百度)
3)【原文】他是一個(gè)對(duì)學(xué)生很?chē)?yán)格,但又很有愛(ài)心的老師。
【機(jī)譯】He is a very strict to the students,but also very loving teacher.(百度)
【人譯】He is a loving teacher who is very strict with his students.
4)【原文】這本實(shí)用書(shū)是為那些已經(jīng)掌握英語(yǔ)基本知識(shí),而現(xiàn)在想用已學(xué)到的語(yǔ)言知識(shí)來(lái)閱讀自己相關(guān)科目的書(shū)籍的外國(guó)工程人員和工程專(zhuān)業(yè)學(xué)生而編寫(xiě)的。
【機(jī)譯】This book is for those who have mastered the basic knowledge of English,and now want to use the knowledge of the language to read their own books related to the subject of foreign engineers and engineering students and the preparation of.(百度)
【人譯】。 This practice book is intended for foreign engineer or students of engineering who have already mastered the elements of English,and who now want to use their knowledge of the language to read books on their own subjects.
從第三步開(kāi)始,我們發(fā)現(xiàn)原文和目的語(yǔ)開(kāi)始出現(xiàn)偏差了,當(dāng)我們反過(guò)來(lái)把目的語(yǔ)當(dāng)原文時(shí),看看原來(lái)的原文是否成了目的語(yǔ)。
5)【原文】 He is a teacher.【機(jī)譯】他是一位老師。(百度)
6)【原文】 He is a teacher who is very strict with his students.
【機(jī)譯】他是一個(gè)對(duì)他的學(xué)生很?chē)?yán)格的老師。(百度)
7)【原文】 He is a very strict to the students,but also very loving teacher.
【機(jī)譯】他是一個(gè)很?chē)?yán)格的學(xué)生,也是很愛(ài)老師的老師。(百度)
我們?cè)儆玫谌降膮⒖即鸢缸鳛樵模词鞘裁唇Y(jié)果:
【原文】He is a loving teacher who is very strict with his students.
【機(jī)譯】他是一個(gè)愛(ài)的老師,他對(duì)學(xué)生要求很?chē)?yán)格。(百度)
8)【原文]This book is for those who have mastered the basic knowledge of English,and now want to use the knowledge of the language to read their own books related to the subject of foreign engineers and engineering students and the preparation of.
【機(jī)譯】這本書(shū)是為那些掌握了英語(yǔ)的基礎(chǔ)知識(shí),現(xiàn)在想用語(yǔ)言的知識(shí)來(lái)閱讀自己的書(shū)籍,有關(guān)外國(guó)工程師和工程專(zhuān)業(yè)的學(xué)生和準(zhǔn)備的。(百度)
現(xiàn)在把人譯部分變成原文,看看是什么結(jié)果:
9)【原文】 This practice book is intended for foreign engineer or students of engineering who have already mastered the elements of English,and who now want to use their knowledge of the language to read books on their own subjects.
【機(jī)譯】這本練習(xí)本是專(zhuān)為那些已經(jīng)掌握了英語(yǔ)的元素的外國(guó)工程師或?qū)W生,誰(shuí)現(xiàn)在想用他們的知識(shí)的語(yǔ)言來(lái)閱讀自己的科目的書(shū)籍。(百度)
即使我們用參考答案作為原文,我們也得不到預(yù)想的效果,說(shuō)明句法復(fù)雜后,英漢開(kāi)始出現(xiàn)偏差,機(jī)器翻譯的效果開(kāi)始打折扣,如果原文是一段話,機(jī)器翻譯的規(guī)則要求會(huì)更嚴(yán),如果機(jī)器翻譯在規(guī)則上不成熟,翻譯結(jié)果會(huì)是怎樣呢?
10)【原文】學(xué)院校園面積880多畝,環(huán)境優(yōu)美宜人。學(xué)院面向全國(guó)招生,并招收港澳臺(tái)學(xué)生和外國(guó)留學(xué)生,現(xiàn)在校學(xué)生13000人。
【機(jī)譯】College campus area of more than and 880 acres,the environment is beautiful and pleasant.Institute for the national enrollment,and to recruit students and students from Hong Kong,Macao and Taiwan,and now school students 13000.(百度)
【人譯】The university campus occupies an area of 145.2 acres with pleasing environment for 13000 in-school students who are enrolled from all over China including Hong Kong,Macao,Taiwan and evenabroad.
11)【原文】There is nothing more disappointing to a hostess who has gone to a lot of trouble or expense than to have her guest so interested in talking politics or business with her husband that he fails to notice the flavor of the coffee,the lightness of the cake,or the attractiveness of the house,which may be her chief interest and pride.
【機(jī)譯】沒(méi)有什么更令人失望的一個(gè)女主人誰(shuí)去了很多麻煩或費(fèi)用比有她的客人如此感興趣,與她的丈夫談?wù)撜位驑I(yè)務(wù),他沒(méi)有注意到咖啡的味道,蛋糕的亮度,或房子的吸引力,這可能是她的主要興趣和自豪。(百度)
【機(jī)譯】沒(méi)有什么更令人失望的誰(shuí)去了很多麻煩和費(fèi)用,比有她的客人讓興趣談?wù)撜位蛏虡I(yè)與她的丈夫,他沒(méi)有注意到咖啡的味道女主人,蛋糕的亮度,或房子的吸引力,這可能是她最感興趣和驕傲。(谷歌)
【人譯】令女主人失望的是,她花了很多心神和費(fèi)用來(lái)招待客人,可是這位客人只顧津津有味地與她丈夫談?wù)?談生意,卻沒(méi)有注意到香噴噴的咖啡,松軟的蛋糕,或房間內(nèi)講究的陳設(shè),因?yàn)檫@些卻可能是她最感興趣并最引以為榮的東西。
從以上的例子我們看到,進(jìn)入語(yǔ)段翻譯環(huán)節(jié),機(jī)器翻譯效果更加大打折扣,所以在句法層面上說(shuō),機(jī)器翻譯依然停留在結(jié)構(gòu)比較簡(jiǎn)單的句子上,同時(shí)我們發(fā)現(xiàn),原文和機(jī)譯譯文并不能對(duì)等互換操作,說(shuō)明英漢互譯隨機(jī)性比較強(qiáng),自由空間很大,還沒(méi)有足夠的嚴(yán)謹(jǐn)和科學(xué)。
其實(shí)從上面的例子我們就已經(jīng)看出,英漢句法上的差異已經(jīng)影響到語(yǔ)義了,機(jī)器翻譯傾向于對(duì)等處理,而實(shí)際上不對(duì)等現(xiàn)象導(dǎo)致了機(jī)譯的錯(cuò)誤,人工翻譯能超越不對(duì)等,從深層意義去處理表層的差異,但總的來(lái)說(shuō),句法上的問(wèn)題導(dǎo)致的翻譯錯(cuò)誤主要是邏輯混亂,無(wú)法在句與句之間形成意義鏈,而語(yǔ)義上的問(wèn)題,主要體現(xiàn)的概念上,即詞義選擇上。語(yǔ)義部分問(wèn)題需要運(yùn)用到語(yǔ)義學(xué)的語(yǔ)素分析和翻譯中的語(yǔ)素選擇問(wèn)題,對(duì)于多義詞(字)要考慮語(yǔ)境的制約。語(yǔ)義歧義主要根源在于一詞多義,機(jī)器翻譯首先選擇高頻詞義,但詞義要依賴具體語(yǔ)境需要,以字為基本單位的漢語(yǔ),在漢譯英中更容易出現(xiàn)語(yǔ)義上的錯(cuò)誤。例如:
【原文】語(yǔ)言語(yǔ)際轉(zhuǎn)換研究所創(chuàng)建于2013年3月,為了配合我院2013年翻譯碩點(diǎn)的申報(bào)和作為今后翻譯碩點(diǎn)建設(shè)的一個(gè)重要依托,研究所的成立將更好地整合學(xué)院翻譯研究的資源,建立翻譯學(xué)科研團(tuán)隊(duì),加強(qiáng)我院的翻譯研究科研力量,構(gòu)建年齡、職稱(chēng)、學(xué)歷和學(xué)緣結(jié)構(gòu)的合理配置,注重理論與實(shí)踐相結(jié)合,推動(dòng)學(xué)科學(xué)術(shù)梯隊(duì)的持續(xù)發(fā)展和翻譯專(zhuān)業(yè)課程建設(shè)。
【機(jī)譯】Language Translation Research Institute was founded in 2013 March,in order to cope with an important support of our hospital in 2013.At the declaration and translation as the future construction of translation",the establishment of the Institute will be better integrated school of translation studies resources,the establishment of translatology research team,strengthen our translation of scientific research strength,reasonable allocation construction of age,title,education and education related structure,pay attention to the combination of theory and practice,to promote the construction of the sustainable development of academic echelon discipline and professional translation course.(百度)
【機(jī)譯】Language translation conversion Institute,founded in March 2013,in line with our hospital in 2013 and translated Shuo point declaration as a translation for the future construction of an important support point-seok,the establishment of the Institute will be better integration of resources Institute of Translation Studies the establishment of translation studies research team,strengthen our hospital translation studies research efforts,build a reasonable configuration age,title,qualificationsand academic structure,focusing on the theory and practice,to promote sustainable development and translation of the Curriculum for the academic teams.(谷歌)
以百度為例分析,這里把“院”翻譯成“hospital”是明顯的錯(cuò)誤,“翻譯碩點(diǎn)的申報(bào)和作為今后翻譯碩點(diǎn)建設(shè)的一個(gè)重要依托”翻譯成了:“At the declaration and translation as the future construction of translation”,不僅錯(cuò)誤,還出現(xiàn)信息丟失。
機(jī)器翻譯段落,句法和語(yǔ)義問(wèn)題都全部暴露,我們無(wú)法看到具有語(yǔ)篇特征,句與句之間有邏輯和語(yǔ)義連貫的譯文,而很大程度上像是一堆文字?!襁@樣的情況,我們需要制定更加宏觀的,能夠駕馭段落,甚至篇章的翻譯規(guī)則。
語(yǔ)用因素也是翻譯中不可忽略的部分,由于語(yǔ)境的制約和文化差異,有些材料需要做出歸化或異化的處理,語(yǔ)用規(guī)則的介入將解決語(yǔ)境和文化制約的翻譯過(guò)程。例如成語(yǔ)或習(xí)語(yǔ)的翻譯,就非常需要考慮文化差異的制約作用,不過(guò)現(xiàn)有的成語(yǔ)(習(xí)語(yǔ))詞典可以解決了這個(gè)問(wèn)題,也可以通過(guò)語(yǔ)料庫(kù)來(lái)解決,最棘手的問(wèn)題還是上下文語(yǔ)境問(wèn)題,目前在機(jī)器翻譯領(lǐng)域,語(yǔ)用問(wèn)題還沒(méi)有真正得到解決。我們對(duì)百度、谷歌、有道、金山、必應(yīng)等多家在線機(jī)器翻譯做了大量的實(shí)驗(yàn),發(fā)現(xiàn)句法問(wèn)題和語(yǔ)義問(wèn)題依然是個(gè)機(jī)器翻譯中最大的問(wèn)題。
除了句法和語(yǔ)義,人工翻譯遇到的其他問(wèn)題機(jī)器翻譯也同樣遇到,甚至還多,而且人工能做到的機(jī)器不一定能做到。人工翻譯可以在宏觀上為語(yǔ)篇上進(jìn)行布局,也可以在微觀上斟酌詞句,機(jī)器翻譯往往做不到。人工很難翻譯的地方,機(jī)器同樣也很難處理,這些方面包括:(1)人名、地名;(2)歇后語(yǔ) ;(3)雙關(guān)語(yǔ);(4)成語(yǔ);(5)俚語(yǔ);(6)格言;(7)名言雋語(yǔ);(8)習(xí)慣用法 等等。 “She is a cat” 無(wú)論如何機(jī)器翻譯都很難翻譯成“她陰險(xiǎn)狡詐”,因?yàn)檫@要跨越文化范疇和視角來(lái)進(jìn)行翻譯。人工翻譯能統(tǒng)籌各種因素,包括語(yǔ)言、語(yǔ)境、語(yǔ)法、語(yǔ)用、跨文化、美學(xué)、以及讀者對(duì)象、翻譯目的和各種翻譯技巧和策略的綜合應(yīng)用,機(jī)器目前做不到。從以上句法、語(yǔ)義和其他各個(gè)層面的觀察,我們發(fā)現(xiàn)機(jī)器翻譯效果與標(biāo)準(zhǔn)要求依然很遠(yuǎn),必須加強(qiáng)句法學(xué)、語(yǔ)義學(xué)向計(jì)算機(jī)語(yǔ)言的轉(zhuǎn)換的研究和實(shí)踐,目前這方面似乎遇到了瓶頸,機(jī)器翻譯后編輯工作依然是一個(gè)繁重而且關(guān)鍵的工作。
語(yǔ)料庫(kù)語(yǔ)言學(xué)的誕生和應(yīng)用,為機(jī)器翻譯提供了新的思路。談到機(jī)器翻譯的發(fā)展前景和出路,離不開(kāi)三個(gè)關(guān)鍵詞:語(yǔ)料庫(kù)、大數(shù)據(jù)和云計(jì)算。以英漢為例,漢英互譯平行語(yǔ)料庫(kù)的誕生,是計(jì)算機(jī)輔助翻譯的里程碑意義的大事,單純依賴后臺(tái)編程來(lái)實(shí)現(xiàn)規(guī)則的應(yīng)用的機(jī)器翻譯,已經(jīng)遇到了難于突破的瓶頸,至于原因上面已經(jīng)提到:翻譯自身的復(fù)雜性、自然語(yǔ)言的復(fù)雜性和機(jī)器自身的局限性,復(fù)雜到什么程度上面也已經(jīng)提到了。語(yǔ)料庫(kù)的開(kāi)發(fā)和應(yīng)用,開(kāi)創(chuàng)了機(jī)器翻譯一個(gè)全新的思路,語(yǔ)料庫(kù)可以用于查詢,也可以對(duì)語(yǔ)料進(jìn)行分類(lèi)和分析,對(duì)翻譯實(shí)踐和翻譯研究都非常有幫助。翻譯平行語(yǔ)料庫(kù)的原理是呈現(xiàn)原文和譯文進(jìn)行對(duì)比,我們可以通過(guò)輸入所需要翻譯的原文,計(jì)算機(jī)在語(yǔ)料庫(kù)中查詢與此相同或相近的表達(dá),語(yǔ)料庫(kù)不一定給提供直接的譯文,但是能夠提供大量可供選擇的參考資料,語(yǔ)料越豐富,與對(duì)比的原文就有更多更高的相似度,語(yǔ)料庫(kù)的發(fā)展使得原文與語(yǔ)料的相似度無(wú)限接近。由于翻譯的復(fù)雜性,影響翻譯的因素很多,現(xiàn)在很多翻譯軟件都已經(jīng)考慮到這一點(diǎn),在語(yǔ)料庫(kù)的操作上加入了很多參數(shù)標(biāo)簽,縮小搜尋的范圍,這些標(biāo)簽包括各種語(yǔ)境標(biāo)簽、文化標(biāo)簽、文體標(biāo)簽、行業(yè)術(shù)語(yǔ)標(biāo)簽、技巧策略標(biāo)簽等等,往往是標(biāo)簽越詳細(xì),得到的結(jié)果越精確。應(yīng)用語(yǔ)料庫(kù)的優(yōu)勢(shì)在于翻譯會(huì)更加統(tǒng)一,討論和借鑒的空間會(huì)更大,不再存在句法語(yǔ)義的錯(cuò)亂問(wèn)題。
目前語(yǔ)料庫(kù)尚不成熟的地方是不容易找到與原文一摸一樣的平行對(duì)比語(yǔ)料,通過(guò)不斷擴(kuò)大平行語(yǔ)料庫(kù)的規(guī)模,原文區(qū)與語(yǔ)料庫(kù)的相似度才能不斷地接近,這就需要更多的數(shù)據(jù),所以跟隨語(yǔ)料庫(kù)而來(lái)的是大數(shù)據(jù)問(wèn)題,我們所處的大數(shù)據(jù)時(shí)代含義很寬泛,但與翻譯相關(guān)的是平行語(yǔ)料庫(kù)的應(yīng)用。語(yǔ)料庫(kù)越來(lái)越大,說(shuō)明數(shù)據(jù)越來(lái)越大,數(shù)據(jù)的運(yùn)行速度和運(yùn)行安全成為必須解決的問(wèn)題了,云計(jì)算就成為計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)新的發(fā)展趨勢(shì)了。
“云”(李莉等人2010)指的是系統(tǒng)中的計(jì)算機(jī)群,其規(guī)模和能力理論上不受限制,而且可以在網(wǎng)絡(luò)中的任意地方,如谷歌的網(wǎng)絡(luò)服務(wù)(包括搜索引擎 谷歌地球等)架構(gòu)在由多達(dá)200多萬(wàn)臺(tái)計(jì)算機(jī)構(gòu)成的云計(jì)算平臺(tái)之上,Amazon、微軟、IBM等的云計(jì)算平臺(tái)也都達(dá)到了幾十萬(wàn)臺(tái)計(jì)算機(jī)的規(guī)模。云計(jì)算(董洪學(xué)等 2016)是一種新型的網(wǎng)絡(luò)服務(wù)計(jì)算模型,可以將存儲(chǔ)在任何聯(lián)網(wǎng)設(shè)備上的海量信息和處理器資源集中在一起遷移到“云”上,用戶借助任何終端設(shè)備(電腦、PDA、智能手機(jī)等)通過(guò)網(wǎng)絡(luò)就可以在任何時(shí)間、任何地點(diǎn)最大限度地使用這些資源,輕松完成協(xié)作任務(wù)。借助云計(jì)算,網(wǎng)絡(luò)服務(wù)提供者可以在瞬息之間,處理數(shù)以千萬(wàn)計(jì)甚至億計(jì)的信息,實(shí)現(xiàn)和超級(jí)計(jì)算機(jī)同樣強(qiáng)大的效能。傳統(tǒng)的數(shù)據(jù)存放和處理都在本地電腦或某個(gè)固定的網(wǎng)絡(luò)服務(wù)器上,云計(jì)算則把這一切都放在互聯(lián)網(wǎng)上,只有通過(guò)賬戶和特別的加密和安全系統(tǒng)保護(hù)的賬戶信息,除擁有權(quán)限的人以為,其他人都無(wú)法接觸,這是非常安全的。所以,語(yǔ)料庫(kù)規(guī)模越來(lái)越龐大,云翻譯將是我們未來(lái)機(jī)器翻譯的發(fā)展方向。云翻譯可以對(duì)海量的語(yǔ)料庫(kù)信息進(jìn)行采集、傳輸、存儲(chǔ)和利用。在云翻譯平臺(tái)上,翻譯公司可以將人才儲(chǔ)備達(dá)到數(shù)萬(wàn)人,還有龐大的專(zhuān)家隊(duì)伍,涵蓋各行各業(yè),方便交流,翻譯的速度和效率會(huì)倍增。
通過(guò)大量的實(shí)驗(yàn)觀察,我們發(fā)現(xiàn)阻礙機(jī)器翻譯發(fā)展的瓶頸問(wèn)題依然是結(jié)構(gòu)歧義和語(yǔ)義歧義,原因歸結(jié)為三大點(diǎn):翻譯的復(fù)雜性、自然語(yǔ)言本身的復(fù)雜性和機(jī)器翻譯的局限性,我們認(rèn)為更重要的是句法學(xué)、語(yǔ)義學(xué)、甚至語(yǔ)用學(xué)和其他各個(gè)語(yǔ)言學(xué)科的研究成果,沒(méi)有及時(shí)轉(zhuǎn)換成計(jì)算機(jī)語(yǔ)言,服務(wù)于機(jī)器翻譯,要實(shí)現(xiàn)這一目標(biāo),語(yǔ)言研究專(zhuān)家與計(jì)算機(jī)專(zhuān)家共同合作才行;另一個(gè)發(fā)展趨勢(shì)是翻譯平行語(yǔ)料庫(kù)的誕生、應(yīng)用和發(fā)展,需要大數(shù)據(jù)的推動(dòng)和計(jì)算機(jī)云計(jì)算的應(yīng)用,以保證數(shù)據(jù)的安全和高效采集、傳輸、存儲(chǔ)和利用。所以歸納起來(lái),機(jī)器翻譯未來(lái)的發(fā)展有兩條路,第一、加強(qiáng)語(yǔ)言學(xué)研究成果向計(jì)算機(jī)語(yǔ)言轉(zhuǎn)化,以突破目前的結(jié)構(gòu)歧義和語(yǔ)義歧義瓶頸;第二、利用翻譯平行語(yǔ)料庫(kù),通過(guò)大數(shù)據(jù)驅(qū)動(dòng)和云計(jì)算技術(shù),實(shí)現(xiàn)翻譯的安全和高效,第二條路正迎合當(dāng)前的大數(shù)據(jù)和云計(jì)算時(shí)代需要,前途似乎更加廣闊。
[1]董洪學(xué)、張坤媛.云計(jì)算學(xué)習(xí)平臺(tái)下MTI翻譯工作坊教學(xué)模式研究.《外語(yǔ)電話教學(xué)》2016年第2期.
[2]李 莉、廖劍偉、歐靈.云計(jì)算初探,《計(jì)算機(jī)應(yīng)用研究》2010年12月.
[3]羅季美、李梅.機(jī)器翻譯譯文錯(cuò)誤分析,《中國(guó)翻譯》2012第5期.
[4]羅季美.機(jī)器翻譯句法錯(cuò)誤分析,《同濟(jì)大學(xué)學(xué)報(bào)》(社科版)2014第2期.
[5]張政.機(jī)器翻譯難點(diǎn)所在[J].外語(yǔ)研究.2005年第5期.
編輯:董剛
The Predicament,Prospect and Solution of Machine Translation
PAN Zhengqin,LUO Huazhen,YI Yongzhong
(College of Foreign Studies,Guilin University of Electronic,Guilin Guangxi 541004)
This paper summarizes the development of machine translation,illustrates the difficult bottleneck encountered in machine translation and reveals the limitations and difficulties of traditional machine translation.Finally,it concludes that the prospects and the solutions of machine translation lie in two aspects:(1)the enhancement of findings in language research of computer language conversion so as to better serve the machine translation;(2)the application of corpus.Cloud translation will be achieved by utilizing translation parallel corpus,coupled with big data and cloud computing.In this way,it’s convenience for people to share information and make exchanges,and thus increase the efficiency of translation.
machine translation;predicament;database,cloud computing;cloud translation
H059
A
2095-7327(2017)-09-0044-06
潘正芹,桂林電子科技大學(xué)外國(guó)語(yǔ)學(xué)院副教授,研究方向:翻譯和第二語(yǔ)言習(xí)得。羅華珍,桂林電子科技大學(xué)外國(guó)語(yǔ)學(xué)院副教授,研究方向:英語(yǔ)教學(xué)。易永忠,桂林電子科技大學(xué)外國(guó)語(yǔ)學(xué)院教授,研究反向:翻譯,英語(yǔ)教學(xué)法。
廣西教育廳“英漢機(jī)器翻譯與語(yǔ)言學(xué)接口研究:?jiǎn)栴}與出路”,編號(hào):KY2015YB115。