內(nèi)容摘要:本文選取《三體》譯者劉宇昆的譯著及其原創(chuàng)作品,通過語料庫統(tǒng)計分析手段,試圖探索母語譯者的譯文與其原創(chuàng)作品在詞匯層面的異同之處,進(jìn)而歸納和揭示母語譯者的選詞特點,供中文譯者參考。通過分析發(fā)現(xiàn),譯著詞匯密度和豐富程度不及原創(chuàng)作品,但平均詞長和可讀性高于原創(chuàng)作品。
關(guān)鍵詞:《三體》英譯 語料庫 譯者風(fēng)格
隨著中外文化交流日益頻繁,越來越多優(yōu)秀中文文學(xué)作品在海外獲得廣泛傳播和認(rèn)可,中國科幻作家劉慈欣所著《三體》系列便是其中典型代表。而該系列科幻小說能夠在英文世界風(fēng)靡,英文版譯者劉宇昆功不可沒。他不僅翻譯中文科幻文學(xué)作品,還是一位成功的英文科幻小說原創(chuàng)作者,曾多次榮獲科幻文學(xué)界著名獎項“雨果獎”、“星云獎”。本文通過自建語料庫探究劉譯本詞匯特征,并將其譯著與原創(chuàng)作品進(jìn)行比較分析,意圖發(fā)現(xiàn)劉譯文的典型特征。
一.劉宇昆譯著及原創(chuàng)作品選取及語料庫創(chuàng)建
語料庫翻譯學(xué)以語言理論和翻譯理論為研究上的指導(dǎo),以概率和統(tǒng)計為手段,以大規(guī)模雙語真實語料為對象,采用語內(nèi)對比與語際對比相結(jié)合的方法,為研究翻譯、語言特征提供了新的視角。
本文選取劉宇昆的兩部譯著:Pan Macmillan 2016年出版的三體譯本《The Three-Body Problem》和2017年出版的《Death's End》。以及他的兩部原創(chuàng)科幻文學(xué)作品:《The Grace of Kings》(Saga Press,2015)和《The Paper Menagerie and Other Stories》(Saga Press,2016)。采集到上述文本后,首先對其進(jìn)行了清潔降噪和詞性賦碼處理,清除其中多余的文本、標(biāo)點、空格、空段等,降低文本噪音,后使用CLAWS詞性賦碼器進(jìn)行自動詞性賦碼,得到初步語料庫數(shù)據(jù),并使用WordSmith等軟件進(jìn)行檢索,著重分析詞匯特點及其成因。
二.劉宇昆譯著及原創(chuàng)作品詞匯特征
1.詞匯密度
標(biāo)準(zhǔn)化類符/形符比(STTR)是衡量詞匯密度(lexical density)的常用方法。形符(token)指語料庫中所有單詞,而類符(type)指語料庫文本中任何一個獨(dú)特的詞形(word form)。類符/形符比指的就是文本中使用的不同詞語的比率,反映了文本中詞語的豐富度和變化度[3]。
通過WordSmith語料庫分析軟件發(fā)現(xiàn),標(biāo)準(zhǔn)類符/形符比(STTR)從高到低依次為《The Three-Bod
y Problem》(譯著)、《Death's End》(譯著)、《The Paper Menagerie and Other Stories》(原創(chuàng))、《The Grace of Kings》(原創(chuàng)),表明同一作者的原創(chuàng)作品詞匯密度略高于譯著,其中STTR最高的《The Grace of Kings》分別比譯著《The Three-Body Problem》和《Death's End》高+3.03和+2.28,而布朗語料庫科幻小說類別下的形符/類符比為4.48,同樣略高于譯著,說明譯著詞匯不及原創(chuàng)作品豐富。雖然譯著詞匯密度可能受原著影響,但考慮到劉宇昆的另一部譯著《Folding Beijing》(作者為科幻作家郝景芳)STTR比為43.18,同樣低于原創(chuàng)作品,這從某種程度上排除了原著用詞單一對譯者造成影響的可能。因此可以認(rèn)為,劉譯著詞匯豐富程度不及他自己的其他原創(chuàng)作品,且略低于英文原創(chuàng)科幻小說。
2.詞類分布
詞類分布能夠體現(xiàn)文體特征。本文對劉宇昆兩部譯著和兩部同類型、字?jǐn)?shù)相仿原創(chuàng)作品的詞類分布及詞匯密度進(jìn)行了統(tǒng)計比較,并匯總了實詞數(shù)量及比重。
經(jīng)統(tǒng)計分析發(fā)現(xiàn),名詞和動詞出現(xiàn)次數(shù)最多,兩者之和占比幾乎均超越50%。除名詞、動詞之外,表格還統(tǒng)計了形容詞和副詞等英語實詞,這類詞語表示實在的意義,且意義穩(wěn)定。實詞占比越高,就可以認(rèn)為信息負(fù)載度越大,文本也越難,反之越簡單。從表中可以看到,兩部原創(chuàng)作品的實詞比重顯著高于兩部譯著,說明原創(chuàng)作品用詞更為豐富,而譯著相對較低。由此可見,即使母語譯者,也難免受原文行文、語法等方面限制,為還原原著本意,功能詞使用較多,詞匯豐富程度受到影響。
3.詞長分析
文本單詞長度也從一個側(cè)面反映了作者的行文風(fēng)格和選詞傾向,有助于識別翻譯語言與目標(biāo)原創(chuàng)語言的差異。本文使用Python自然語言處理(NLTK)模塊對劉宇昆譯本和原創(chuàng)作品的單詞詞長進(jìn)行了統(tǒng)計。經(jīng)分析發(fā)現(xiàn),兩部譯著的平均詞長(單詞中所含字母數(shù)量)為4.63和4.68,略高于兩部原創(chuàng)作品(均為4.37),初步判斷作者在譯著中傾向于使用長度較長的單詞。經(jīng)過進(jìn)一步統(tǒng)計發(fā)現(xiàn),兩部譯著短詞(由1-3個字母)占比分別為:77.41%和76.5%,兩部原創(chuàng)作品則為:78.8%和79.73%;而從包含15個字母以上的長詞占比來看,兩部譯著分別為0.21%和0.31%,而兩部原創(chuàng)作品為0.08%和0.09%,由此可見,作者在翻譯過程中,傾向于選擇長單詞表述原文含義,而創(chuàng)作原創(chuàng)作品時,則多使用簡短的單詞。
4.文本難度和可讀性
“可讀性(Readability)”又稱為易讀性,主要關(guān)注文本的表述風(fēng)格,即語言特征(如詞匯和句法)對讀者閱讀理解文本的影響。本文采取使用通用的Flesch–Kincaid可讀性測試,對比分析劉宇昆原創(chuàng)與翻譯作品可讀性。
經(jīng)過對每個作品5次隨機(jī)采樣,使用Flesch–Kincaid可讀性測試公式計算求得劉宇昆《三體》譯本及其原創(chuàng)作品平均可讀性指標(biāo)后,通過對比發(fā)現(xiàn),兩部譯著的可讀性得分均略高于參照讀本——美國刊物《Readers Digest》,均對應(yīng)美國8到9年級中學(xué)生閱讀水平;從可讀性得分看來,《三體》譯本易于閱讀,理解難度不高。這一方面符合原文科幻小說文體語言平實、受眾廣泛的特征,另一方面也符合西方讀者對譯文通俗易懂的期待。而本文選取的另外兩部劉宇昆原創(chuàng)作品,其可讀性得分顯著低于兩部譯著,并分別低于參照文本-4.5和-15.7,表明其詞匯和句法較為復(fù)雜,閱讀理解難度稍大,其中同屬長篇科幻小說的《The Grace of Kings》對應(yīng)8到9年級中學(xué)生閱讀水平,而科幻短篇小說集《The Paper Menagerie and Other Stories》閱讀難度較大,對應(yīng)美國大學(xué)生閱讀水平。
三.詞匯特征分析及結(jié)論
通過語料庫統(tǒng)計分析,本文發(fā)現(xiàn)劉宇昆譯著及原創(chuàng)作品在詞匯使用方面具有以下特點:第一,譯著詞匯密度略低于原創(chuàng)作品,且不及其他英語作者同類型原創(chuàng)作品;第二,譯著實詞所占比重不及原創(chuàng)作品,譯者受到原文影響,靈活性和生動程度不及原創(chuàng)作品;第三,譯著使用長詞較多,而原創(chuàng)作品更傾向于使用簡短詞匯;第四,譯著可讀性高于原創(chuàng)作品,更為通俗易懂。
然而,本文僅從類符/形符比、詞匯密度、詞長、可讀性等方面進(jìn)行初步分析,要揭示劉宇昆的譯著與其原創(chuàng)作品,以及其他譯者譯著更深層次的關(guān)聯(lián)與區(qū)別,還需進(jìn)行更微觀、細(xì)致的刨析。
參考文獻(xiàn)
[1]劉宇昆[EB/OL].[2020-04-10] https://zh.wikipedia.org/wiki/%E5%88%98%E5%AE%87%E6%98%86
[2]王克非,胡顯耀.基于語料庫的翻譯漢語詞匯特征研究[J].中國翻譯,2008(6):16-21,92
[3]梁茂成、李文忠、許家金.語料庫應(yīng)用教程[M].外語教學(xué)與研究出版社,2010,9
[4]王立松,趙晗.自建語料庫的漢英翻譯新聞詞匯特征分析[J].天津大學(xué)學(xué)報(社會科學(xué)版),2018(4):335-338
[5]趙秋榮,肖忠華.基于語料庫的翻譯研究:現(xiàn)狀與展望——第四屆“基于語料庫的語言對比與翻譯研究”國際學(xué)術(shù)研討會綜述[J].中國翻譯,2015(02):70-72
[6]Flesch, R. A New Readability Yardstick[J]. Journal of Applied Psychology,1948(3):221-233
[7]王蕾.可讀性公式的內(nèi)涵及研究范式——兼議對外漢語可讀性公式的研究任務(wù)[J].語言教學(xué)與研究,2008(6):46-53
基金項目:太原工業(yè)學(xué)院2019年院級科學(xué)基金資助項目(2019RW07:基于英漢雙語平行語料庫的譯者風(fēng)格研究——以劉宇昆譯《三體》為例)
(作者介紹:宋欣陽,太原工業(yè)學(xué)院外語系講師)