黃永新,張黎黎
(石家莊鐵路職業(yè)技術(shù)學(xué)院,河北石家莊 050041)
?
基于語(yǔ)料庫(kù)的莫言小說英譯語(yǔ)言特征考察
黃永新,張黎黎
(石家莊鐵路職業(yè)技術(shù)學(xué)院,河北石家莊050041)
摘要:本研究采用自制“莫言小說平行語(yǔ)料庫(kù)”,利用語(yǔ)料庫(kù)技術(shù)統(tǒng)計(jì)和整理了各部小說的基礎(chǔ)語(yǔ)料庫(kù)數(shù)據(jù)、詞匯密度以及詞長(zhǎng)分布等數(shù)據(jù),發(fā)現(xiàn)長(zhǎng)篇小說能夠較好地體現(xiàn)語(yǔ)言特征的穩(wěn)定性,亦即翻譯質(zhì)量的穩(wěn)定性,而短篇小說的語(yǔ)言特征則呈現(xiàn)出多樣性。這些研究數(shù)據(jù)和結(jié)論可以作為時(shí)代背景下中國(guó)文學(xué)翻譯參照的標(biāo)準(zhǔn)。
關(guān)鍵詞:語(yǔ)料庫(kù);語(yǔ)言特征;莫言;文學(xué)翻譯
2011年10月,中共中央審議通過了推動(dòng)中華文化大發(fā)展大繁榮的決定,制定了中華文化走出國(guó)門,不斷增強(qiáng)中華文化國(guó)際影響力的戰(zhàn)略目標(biāo)。作為中華優(yōu)秀文化對(duì)外傳播的主力軍,文學(xué)翻譯工作日益引起中國(guó)政府的重視、文學(xué)界及翻譯界的關(guān)注。但是中國(guó)文學(xué)輸出與西方文學(xué)輸入存在巨大的逆差,在西方國(guó)家的出版物中,原文是中文的翻譯作品所占份額很少,法國(guó)有10%,美國(guó)僅3%;而中國(guó)從西方國(guó)家引進(jìn)并翻譯成中文的作品達(dá)到了我國(guó)出版總量的一半以上[1]。所以整體上我國(guó)文學(xué)走出去仍然任重而道遠(yuǎn),需要中國(guó)政府及學(xué)界坦然面對(duì),冷靜分析并總結(jié)現(xiàn)有經(jīng)驗(yàn),從而更好地指導(dǎo)當(dāng)今時(shí)代背景下我國(guó)總體層面上的文學(xué)翻譯工作。
莫言獲得2012年“諾貝爾文學(xué)獎(jiǎng)”的消息在中國(guó)乃至世界掀起了一股“莫言熱”,這一事件引起了全世界范圍內(nèi)對(duì)中國(guó)文學(xué)的關(guān)注,一定程度對(duì)于推動(dòng)文學(xué)事業(yè)的對(duì)外發(fā)展具有積極意義。作為中國(guó)唯一一位諾貝爾文學(xué)獎(jiǎng)得主,莫言的作品在國(guó)際社會(huì)取得了非常好的口碑,一定程度上可以說其英譯作品是比較“成功”的譯本。本研究選取莫言的小說英譯本為研究對(duì)象,通過分析這些譯本自身詳細(xì)的語(yǔ)言學(xué)特點(diǎn),可以總結(jié)出當(dāng)今時(shí)代背景下中國(guó)文學(xué)譯本需要滿足的條件及具備的特點(diǎn)。
研究所采用的語(yǔ)料庫(kù)為自制的“莫言小說平行語(yǔ)料庫(kù)”,初步計(jì)劃庫(kù)容約100萬(wàn)字(以源文本漢語(yǔ)字?jǐn)?shù)為準(zhǔn))。收錄的語(yǔ)料為所有莫言小說的英語(yǔ)譯本,文本為全文收錄,包括長(zhǎng)篇小說和中短篇小說。所有語(yǔ)料經(jīng)掃描儀掃描、OCR字體識(shí)別、文本清潔、語(yǔ)句對(duì)齊等一系列步驟,最終滿足平行語(yǔ)料庫(kù)檢索軟件CUC_ParaConc對(duì)語(yǔ)料的檢索格式要求。研究選用的語(yǔ)料庫(kù)工具包括BFSU PowerConc、AntConc、Cuc_ParaConc、Readability Analyzer及NLPIR漢語(yǔ)分詞軟件等。在借鑒前人經(jīng)驗(yàn)的基礎(chǔ)上,本研究將從標(biāo)準(zhǔn)化類符/形符比、平均詞長(zhǎng)、平均句長(zhǎng)、語(yǔ)篇可讀性、詞長(zhǎng)分布、詞匯密度等方面探討莫言小說英譯本的語(yǔ)言特征。
語(yǔ)料庫(kù)翻譯研究現(xiàn)階段一個(gè)明顯的趨勢(shì)即打破之前單語(yǔ)類比或單語(yǔ)加雙語(yǔ)平行的研究模式,變?yōu)楦鶕?jù)研究需要而建立的多重復(fù)合對(duì)比模式,語(yǔ)料庫(kù)可分可合[2]。本研究選取莫言的8部短篇小說和5部長(zhǎng)篇小說的英語(yǔ)譯本。巧合的是這些莫言小說全部是由被稱作“中國(guó)現(xiàn)當(dāng)代文學(xué)首席翻譯家”葛浩文先生翻譯的,這樣有助于莫言規(guī)律性的一些語(yǔ)言特征在譯文中得以較為統(tǒng)一的重現(xiàn),亦即有助于保證翻譯質(zhì)量的一致性。本研究將采用多視角的切入點(diǎn),從各個(gè)角度提取語(yǔ)料數(shù)據(jù),從宏觀視角而非特定的某部作品來描述莫言小說英譯本具備的語(yǔ)言特征,以總結(jié)出滿足時(shí)代需要的中國(guó)文學(xué)譯文的語(yǔ)言條件和特點(diǎn)。
1.基礎(chǔ)語(yǔ)料庫(kù)數(shù)據(jù)
借助語(yǔ)料庫(kù)工具AntConc及Readability Analyzer可分別獲取莫言各部小說的詞、句等基礎(chǔ)語(yǔ)言數(shù)據(jù)(表1)。
類符/形符比(type/token ratio,TTR)指文本中所使用的不同詞匯與總詞匯數(shù)量的比率,通常用來衡量某個(gè)文本中使用詞匯的多樣性[3]。但是文本越長(zhǎng),形符數(shù)越多,類符數(shù)則不一定增多,這樣的話類符/形符比就會(huì)越來越小。因此,通常以標(biāo)準(zhǔn)化類符/形符比為準(zhǔn)(STTR),計(jì)算出文本中每1000詞的TTR,然后取平均值[4]。統(tǒng)計(jì)結(jié)果顯示,短篇小說的STTR變化幅度較大(圖1),最大0.3695,最小0.2242;而長(zhǎng)篇小說的STTR則變化幅度較小(圖2),均為0.12左右。
就平均詞長(zhǎng)來說,短篇小說亦呈現(xiàn)出較大的變化性,最大為4.3,最小3.9;而長(zhǎng)篇小說有三部平均詞長(zhǎng)均為4.3,另兩部為4.1和4.3,變化幅度很小。而且,相對(duì)而言短篇小說整體上不如長(zhǎng)篇小說的平均詞長(zhǎng)數(shù)值大,說明長(zhǎng)篇小說使用的長(zhǎng)詞數(shù)量較多。表1顯示,短篇小說的平均句長(zhǎng)基本與長(zhǎng)篇小說相同,說明這些翻譯作品在句子層面的變化幅度基本相等。但長(zhǎng)、短篇小說分開來看,依然是短篇小說的平均句長(zhǎng)變化幅度高于長(zhǎng)篇小說。
語(yǔ)篇可讀性是衡量文章難易程度的一個(gè)指標(biāo),能在宏觀層面發(fā)現(xiàn)翻譯文本是否存在簡(jiǎn)化特征。Flesch Reading Ease(弗萊士易讀度)是反映文本可讀性指標(biāo)的一種常用統(tǒng)計(jì)方法,其計(jì)算依據(jù)是句子的詞數(shù)和句子中含的音節(jié)數(shù)等,數(shù)值介于0到100之間,數(shù)目越大,文章越容易讀。大多數(shù)英語(yǔ)原創(chuàng)文本的易讀度數(shù)值約為60-70,數(shù)值為70-79均屬于相當(dāng)容易(fairly easy)的范圍。本研究采用語(yǔ)篇可讀性分析軟件Readability 1.0統(tǒng)計(jì)得出每一部莫言小說的易讀度數(shù)據(jù)。表1顯示全部作品的易讀度數(shù)據(jù)為80.0左右,說明難度要遠(yuǎn)遠(yuǎn)低于英語(yǔ)原創(chuàng)文本,印證了翻譯文本的簡(jiǎn)化特征。具體來說,短篇小說的易讀度介于74.3-88.2,變化幅度大;而長(zhǎng)篇小說的該數(shù)據(jù)為76.0-80.2,變化程度較為平緩。
總體而言,短篇小說的各項(xiàng)基礎(chǔ)語(yǔ)料庫(kù)數(shù)據(jù)變化幅度較大,而長(zhǎng)篇小說相應(yīng)數(shù)據(jù)的變化則趨于平緩,變化較小。說明長(zhǎng)篇小說能夠較好地體現(xiàn)語(yǔ)言特征的穩(wěn)定性,更應(yīng)該針對(duì)長(zhǎng)篇小說來提煉總結(jié)其翻譯經(jīng)驗(yàn)。下文我們將通過其他數(shù)據(jù)形式來進(jìn)一步驗(yàn)證該結(jié)論。
表1 莫言小說語(yǔ)料庫(kù)詞、句等基礎(chǔ)語(yǔ)言數(shù)據(jù)表
圖1 短篇小說STTR變化曲線
2.詞匯密度及實(shí)詞比例
詞匯密度(Lexical Density)指實(shí)詞與總詞數(shù)比值的百分比,可以衡量語(yǔ)篇的信息負(fù)載量[5]。實(shí)詞包括名詞、實(shí)義動(dòng)詞、形容詞和副詞。Laviosa曾證實(shí)英語(yǔ)譯語(yǔ)的詞匯密度為52.87%,英語(yǔ)源語(yǔ)的詞匯密度為54.95%,并得出結(jié)論:譯語(yǔ)具有詞匯密度較低的特點(diǎn)[6]。經(jīng)詞性標(biāo)注及分類統(tǒng)計(jì)后,我們得出莫言小說英譯本的詞匯密度介于57.2%與62.4%之間(表2)。說明這些譯本的詞匯密度都高于Laviosa統(tǒng)計(jì)出的譯語(yǔ)詞匯密度值,表明這些莫言小說英譯本不具備明顯的翻譯文本語(yǔ)言特征,詞匯豐富度高于原創(chuàng)英語(yǔ)源語(yǔ),整體上這些莫言小說英譯本的信息負(fù)載量較大。相比較而言,短篇小說的詞匯密度變化幅度大(圖3),長(zhǎng)篇小說的詞匯密度則趨于穩(wěn)定(圖4)。
圖2 長(zhǎng)篇小說標(biāo)STTR變化曲線
至于從每部作品中各項(xiàng)實(shí)詞的比例來看,名詞比例最高,達(dá)到25%左右;動(dòng)詞比例次之,略低于20%;形容詞和副詞所占比例約為7%。相對(duì)而言,依然是長(zhǎng)篇小說的四項(xiàng)實(shí)詞比例的變化幅度小于短篇小說。
表2 莫言小說語(yǔ)料庫(kù)實(shí)詞比例統(tǒng)計(jì)表
圖3 短篇小說詞匯密度變化曲線
圖4 長(zhǎng)篇小說詞匯密度變化曲線
3.詞長(zhǎng)統(tǒng)計(jì)
就平均詞長(zhǎng)來看,短篇小說的平均值為4.1,長(zhǎng)篇小說的平均值為4.3,說明短篇小說詞匯較簡(jiǎn)單,閱讀難度相對(duì)容易。進(jìn)一步觀察發(fā)現(xiàn)(表3),長(zhǎng)、短篇小說都是3個(gè)字母的單詞所占比例最大,短篇小說平均占22.1%,長(zhǎng)篇小說平均占22.2%,二者基本相同。其他長(zhǎng)度的單詞所占比例由高到低依次為4個(gè)字母(16.0%-18.9%),2個(gè)字母(13.7%-16.9%),5個(gè)字母(12.4%-15.4%),6個(gè)字母(9.0%-10.9%)。整體來看各種長(zhǎng)度的單詞分布情況,長(zhǎng)、短篇小說基本呈現(xiàn)出相同的趨勢(shì)(圖5,圖6)。另外,2-6個(gè)字母的單詞總量分別占短篇小說的78.6%和長(zhǎng)篇小說的76.9%,二者相近且總值接近80%,說明這些小說主要采用2-6個(gè)字母的單詞,單詞較短,閱讀難度較低。
表3 莫言小說語(yǔ)料庫(kù)詞長(zhǎng)分布統(tǒng)計(jì)表
圖5 短篇小說詞長(zhǎng)分布圖
圖6 長(zhǎng)篇小說詞長(zhǎng)分布圖
從基本語(yǔ)料庫(kù)統(tǒng)計(jì)數(shù)據(jù)來看,如標(biāo)準(zhǔn)化類符/形符比、平均詞長(zhǎng)、平均句長(zhǎng)、易讀度等,莫言小說中的短篇小說相應(yīng)的數(shù)據(jù)變化幅度較大,而長(zhǎng)篇小說的相應(yīng)數(shù)據(jù)則變化平緩,說明長(zhǎng)篇小說能夠較好地體現(xiàn)語(yǔ)言特征的穩(wěn)定性,亦即翻譯質(zhì)量的穩(wěn)定性。而且,實(shí)詞比例以及詞長(zhǎng)分布亦能很好支持上述觀點(diǎn)。當(dāng)然,并非短篇小說的翻譯質(zhì)量不均衡,其統(tǒng)計(jì)數(shù)據(jù)的不穩(wěn)定性可能由于源文語(yǔ)言特征的多變性而導(dǎo)致譯文的語(yǔ)言特征多樣性。但無(wú)論如何,畢竟長(zhǎng)篇小說的各項(xiàng)語(yǔ)言數(shù)據(jù)較為穩(wěn)定,可以作為我們的重點(diǎn)研究對(duì)象,通過長(zhǎng)篇小說總結(jié)出的語(yǔ)言數(shù)據(jù)可以作為時(shí)代背景下中國(guó)文學(xué)翻譯參考的標(biāo)準(zhǔn)。具體來說,這些數(shù)據(jù)標(biāo)準(zhǔn)化類符/形符比為0.1203、平均詞長(zhǎng)為4.3、平均句長(zhǎng)為16.2、易讀度為77.7、詞匯密度為58.4%(其中名詞27.5%,動(dòng)詞18.1%,形容詞7.3%,副詞5.4%),詞長(zhǎng)分布中3個(gè)字母的比例最高,為22.2%,2-6字母的單詞所占比例接近80%。
盡管本研究取得了上述一些發(fā)現(xiàn),但上述研究結(jié)果仍舊需要在更大規(guī)模的語(yǔ)料庫(kù)中進(jìn)行驗(yàn)證,如這些語(yǔ)言特征是否在譯者葛浩文先生的其他譯著中同樣能夠得以體現(xiàn)。如果能夠體現(xiàn),則說明這個(gè)標(biāo)準(zhǔn)可以推行;如果不能體現(xiàn),就需要進(jìn)一步研究導(dǎo)致這些差異的原因。另外,即使這個(gè)標(biāo)準(zhǔn)成立,在具體推行時(shí)仍需要進(jìn)一步細(xì)化,以進(jìn)一步提升這個(gè)標(biāo)準(zhǔn)的可實(shí)施性。
參考文獻(xiàn):
[1]許方,許鈞.翻譯與創(chuàng)作——許鈞教授談莫言獲獎(jiǎng)及其作品的翻譯[J].小說譯介與傳播研究,2013(2):4-10.
[2]黃立波,王克非.語(yǔ)料庫(kù)翻譯學(xué):課題與進(jìn)展[J].外語(yǔ)教學(xué)與研究,2011(6):911-923.
[3]黃立波.基于語(yǔ)料庫(kù)的翻譯文體研究[M].上海:上海交通大學(xué)出版社,2014:52.
[4]梁茂成,李文中,許家金.語(yǔ)料庫(kù)應(yīng)用教程[M].北京:外語(yǔ)教學(xué)與研究出版社,2010:9.
[5]Libo Huang.Style in Translation:A Corpus-based Perspective[M].Shanghai and Berlin:Shanghai Jiao Tong University Press and Springer-Verlag Berlin Heidelberg,2015:84.
[6]Laviosa,Sara.Core patterns of lexical use in a comparable corpus of English narrative prose[J].Meta,1998(4):557-570.
On Corpus-based Language Features of Mo Yan’s Novels
HUANG Yongxin,ZHANG Lili
(Shijiazhuang Institute of Railway Technology,Shijiazhuang, 050041,China)
Abstract:Based on the self-built Parallel Corpus of Mo Yan’s Novels,this study statistically calculates and sorts the diverse basic corpus data,lexical density and distribution of word length of every novel by using corpus technologies.The results show that long novels are capable of symbolizing stability of various language features,that is,the stability of translation quality;while short novels present language diversity.These research data and conclusions can be taken as referential standards in the background of Chinese literary translation nowadays.
Key words:corpus;language feature;Mo Yan;literature translation
中圖分類號(hào):H059
文獻(xiàn)標(biāo)識(shí)碼:
文章編號(hào):1008-469X(2016)02-0054-05
收稿日期:2016-02-14
基金項(xiàng)目:2014年度河北省社會(huì)科學(xué)基金項(xiàng)目《基于語(yǔ)料庫(kù)的莫言小說英譯語(yǔ)言特征研究》(HB14YY008)
作者簡(jiǎn)介:黃永新(1978-),男,河北鹿泉人,教育學(xué)碩士,副教授,主要從事語(yǔ)料庫(kù)翻譯、外語(yǔ)教學(xué)研究。