張慧婷
(江蘇省有色金屬華東地質(zhì)勘查局,江蘇 南京 210007)
語(yǔ)料庫(kù)是按照一定的語(yǔ)言原則,運(yùn)用文本或話語(yǔ)片段而建成具有一定容量的大型電子文本庫(kù)。1999 年廣東外語(yǔ)外貿(mào)大學(xué)桂詩(shī)春教授和上海交通大學(xué)楊惠中教授牽頭開(kāi)發(fā)建成“中國(guó)學(xué)習(xí)者語(yǔ)料庫(kù)”(CLEC)。許多高校研究者個(gè)人也建立了適合自己的小型專用英語(yǔ)語(yǔ)料庫(kù),如廣州體育學(xué)院陳建生建立了美國(guó)職業(yè)籃球比賽賽事報(bào)道語(yǔ)料庫(kù),并探討了體育英語(yǔ)語(yǔ)料庫(kù)的建設(shè);在工作中積累了很多專用詞匯,結(jié)合實(shí)際,本文主要進(jìn)行后者的研究,探討構(gòu)建個(gè)性化的,專門(mén)化以及行業(yè)化的語(yǔ)料庫(kù)的設(shè)想。
(1)對(duì)外發(fā)展需要。隨著礦業(yè)對(duì)外的發(fā)展,對(duì)外的交流就越來(lái)越需要得到重視,建立一個(gè)有色金屬行業(yè)英語(yǔ)語(yǔ)料庫(kù),對(duì)ECE的涉外業(yè)務(wù)的發(fā)展也會(huì)添磚加瓦。
(2)資源綜合利用。ECE下設(shè)的翻譯中心承擔(dān)對(duì)外業(yè)務(wù)文件翻譯,每年約280萬(wàn)字的翻譯量。翻譯過(guò)的資料都未整理成庫(kù),建設(shè)專用語(yǔ)料庫(kù),可以將之前工作積累的一部分資源轉(zhuǎn)換為語(yǔ)料,服務(wù)于自行建立的語(yǔ)料庫(kù),倡導(dǎo)資源綜合利用。
(3)有色金屬行業(yè)創(chuàng)新性。目前經(jīng)過(guò)初步調(diào)研,有色金屬行業(yè)還未出現(xiàn)專業(yè)的語(yǔ)料庫(kù),而語(yǔ)料庫(kù)語(yǔ)言學(xué)又的確提供了研究專門(mén)英語(yǔ)的新方法與新視角,建立一個(gè)有色金屬行業(yè)專用語(yǔ)料庫(kù)是大勢(shì)所趨,也具有行業(yè)創(chuàng)新性,將給有色金屬翻譯研究者注入新的活力[1]。
語(yǔ)料庫(kù)的建設(shè)要考慮的因素很多,構(gòu)建方面如建庫(kù)目的,建庫(kù)內(nèi)容,建庫(kù)原則。構(gòu)建步驟可分為語(yǔ)料采集、語(yǔ)料校對(duì)、語(yǔ)料標(biāo)注等。本文從以下幾個(gè)方面闡述構(gòu)建ECE專用英語(yǔ)語(yǔ)料庫(kù)的主要參數(shù)。
依據(jù)Mona Baker的理論,用于翻譯研究的語(yǔ)料庫(kù)主要有三種類型:平行語(yǔ)料庫(kù)(parallel corpus)、可比語(yǔ)料庫(kù)(comparable corpus)和多語(yǔ)語(yǔ)料庫(kù)(multilingual corpus)。在這三類語(yǔ)料庫(kù)中,平行語(yǔ)料庫(kù)與翻譯實(shí)踐之間結(jié)合最為緊密。翻譯人員在遇到一些無(wú)法翻譯的詞語(yǔ)或者搭配時(shí),可以通過(guò)查詢工作,從語(yǔ)料庫(kù)中找出相關(guān)內(nèi)容,從而輔助翻譯者的翻譯。譯者通過(guò)檢索語(yǔ)料可以有效、即時(shí)地提高翻譯速度和譯文質(zhì)量。語(yǔ)料庫(kù)建設(shè)的初衷就是更好的服務(wù)于翻譯,資源的綜合利用,因此ECE專用英語(yǔ)語(yǔ)料庫(kù)構(gòu)建的是平行語(yǔ)料庫(kù)[2]。
為了滿足對(duì)有色金屬英語(yǔ)詞匯、句法、篇章等多方面的定量與定性分析研究的需要,有色金屬英語(yǔ)語(yǔ)料庫(kù)需要遵循以下原則:
①抽樣隨機(jī)原則:對(duì)有色金屬語(yǔ)言素材進(jìn)行分層次、分類別地收集,從而建立盡可能全面反映有色金屬英語(yǔ)語(yǔ)言事實(shí)的語(yǔ)料庫(kù)。保證語(yǔ)料的質(zhì)量和樣本的代表性。②內(nèi)容真實(shí)原則:收集的語(yǔ)料不進(jìn)行刻意的改正與修飾,盡量保證語(yǔ)料的原汁原味。③庫(kù)容適度原則:語(yǔ)料規(guī)模是中小型。建庫(kù)第一階段,只考慮書(shū)面語(yǔ)文本,暫不收口語(yǔ)語(yǔ)料。④質(zhì)量過(guò)硬原則:收錄的語(yǔ)料要挑選語(yǔ)言質(zhì)量高的原本,特別注意譯本的質(zhì)量。
圖1 建庫(kù)步驟
(1)人工翻譯轉(zhuǎn)換為機(jī)器翻譯,提高工作效率。利用專用英語(yǔ)語(yǔ)料庫(kù),把制作好的語(yǔ)料庫(kù)按照規(guī)定的格式編輯好,然后利用計(jì)算機(jī)輔助翻譯軟件的詞庫(kù)和例句庫(kù)導(dǎo)入功能,把該語(yǔ)料導(dǎo)入到翻譯軟件,如果遇到庫(kù)中儲(chǔ)存的詞語(yǔ)和例句,可以利用軟件的翻譯記憶和計(jì)算機(jī)匹配技術(shù),既提高翻譯效率,又提高翻譯的準(zhǔn)確性和一致性。
(2)加深有色金屬英語(yǔ)語(yǔ)言規(guī)律的認(rèn)識(shí)。建立語(yǔ)料庫(kù)能夠?qū)τ猩饘儆⒄Z(yǔ)的各種現(xiàn)象做出全面細(xì)致的描寫(xiě),易于觀察發(fā)現(xiàn)其特點(diǎn)與規(guī)律。專用語(yǔ)料庫(kù)針對(duì)性強(qiáng),語(yǔ)料新,語(yǔ)境豐富,利用檢索功能,可以對(duì)有色金屬行業(yè)的英語(yǔ)措辭,詞語(yǔ)搭配等進(jìn)行研究,可以了解行業(yè)英語(yǔ)規(guī)律。
(3)學(xué)習(xí)材料與辭典編纂。語(yǔ)料庫(kù)不僅能夠提供更完備和詳盡的關(guān)于詞義和詞匯搭配的信息,而且利用語(yǔ)料庫(kù)中的頻率統(tǒng)計(jì)可以直觀的反映詞匯用法的使用情況。由于語(yǔ)料庫(kù)的素材來(lái)自實(shí)際使用的語(yǔ)言,利用其素材作為詞典的例句更具真實(shí)性和準(zhǔn)確性。利用語(yǔ)料庫(kù)編撰詞典不僅能反映語(yǔ)言的真實(shí)變化,而且編撰周期也會(huì)大大縮短。待語(yǔ)料庫(kù)庫(kù)容逐漸擴(kuò)大后,可以整理一些學(xué)習(xí)材料并且適當(dāng)時(shí)編撰專屬于ECE的學(xué)習(xí)詞典[3]。
目前國(guó)內(nèi)沒(méi)有有色金屬的英語(yǔ)語(yǔ)料庫(kù),因此建立一個(gè)專門(mén)用途的有色金屬語(yǔ)料庫(kù),使有色金屬語(yǔ)料更廣泛,操作更簡(jiǎn)便,更具即時(shí)性,集學(xué)習(xí)、研究和使用為一體,是一個(gè)值得研究的話題。本文對(duì)建立有色金屬語(yǔ)料庫(kù)進(jìn)行了可行性研究,語(yǔ)料庫(kù)建設(shè)是一項(xiàng)復(fù)雜、繁重的工作,更好的服務(wù)工作。語(yǔ)料庫(kù)是有用的參考工具或工作平臺(tái),具有廣闊的使用前景和潛在開(kāi)發(fā)價(jià)值。無(wú)論從深度上還是從廣度上,該領(lǐng)域的研究還有進(jìn)一步提高的空間。