周衍
(遼寧科技大學(xué),遼寧 鞍山 114051)
語(yǔ)料庫(kù)是為一個(gè)或多個(gè)應(yīng)用目標(biāo)而專門收集的、有一定結(jié)構(gòu)的、有代表性的、可被計(jì)算機(jī)程序檢索的、具有一定規(guī)模的語(yǔ)料集合[1]。20 世紀(jì)60 年代,最先興起的是電子語(yǔ)料庫(kù)。而后在經(jīng)過(guò)五十多年的發(fā)展,語(yǔ)料庫(kù)種類越來(lái)越多,分類越來(lái)越細(xì)化。按語(yǔ)種分類,可分為單語(yǔ)語(yǔ)料庫(kù),雙語(yǔ)語(yǔ)料庫(kù)和多語(yǔ)語(yǔ)料庫(kù);按對(duì)應(yīng)關(guān)系,分為平行語(yǔ)料庫(kù)和類比語(yǔ)料庫(kù);按用途分類,可分為通用語(yǔ)料庫(kù)和專門語(yǔ)料庫(kù)。
近年來(lái)許多學(xué)者研究開(kāi)發(fā)雙語(yǔ)平行語(yǔ)料庫(kù),采用原文與譯文對(duì)齊的方式,實(shí)現(xiàn)詞匯、短語(yǔ)、句子、段落、篇章等層面的雙語(yǔ)自動(dòng)對(duì)齊,用戶可以根據(jù)自己的需要精確地檢索各層面的對(duì)應(yīng)翻譯,有很強(qiáng)的針對(duì)性和實(shí)用性。國(guó)外雙語(yǔ)平行語(yǔ)料庫(kù)的建設(shè)開(kāi)始于20 世紀(jì)90 年代中期,其中著名的平行語(yǔ)料庫(kù)當(dāng)屬加拿大的英法雙語(yǔ)議會(huì)會(huì)議錄(the Canadian Hansards Corpus)、英國(guó)曼徹斯特大學(xué)的翻譯語(yǔ)料庫(kù)(TEC)、奧斯陸大學(xué)的英語(yǔ)-挪威語(yǔ)雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù)(ENPC) 等。國(guó)內(nèi)平行語(yǔ)料庫(kù)的研究主要集中在英漢平行語(yǔ)料庫(kù)的構(gòu)建上。研究的重點(diǎn)主要集中在語(yǔ)料庫(kù)的建設(shè)與發(fā)展技術(shù)、平行語(yǔ)料庫(kù)在教學(xué)或翻譯、語(yǔ)料庫(kù)相關(guān)內(nèi)容的分析與比較等領(lǐng)域中的應(yīng)用等。目前國(guó)內(nèi)規(guī)模最大的雙語(yǔ)平行語(yǔ)料庫(kù)是王克非教授主持建設(shè)的——漢英通用型對(duì)應(yīng)語(yǔ)料庫(kù)(PCCE)。與此同時(shí),各地紛紛建立起了多種平行語(yǔ)料庫(kù)研究,如衢州生態(tài)旅游漢英雙語(yǔ)平行語(yǔ)料庫(kù),河?xùn)|文化旅游資源漢英平行語(yǔ)料庫(kù),江西英漢平行語(yǔ)料庫(kù)等。國(guó)內(nèi)語(yǔ)料庫(kù)的構(gòu)建存在一些需改進(jìn)的方面:1.語(yǔ)料庫(kù)類別少,各種不同用途語(yǔ)料庫(kù)急需豐富增加;2.小型語(yǔ)料庫(kù)較多,沒(méi)形成共聯(lián),可以實(shí)現(xiàn)同類型或者用途的多個(gè)小型語(yǔ)料庫(kù)的聯(lián)合應(yīng)用;3.語(yǔ)料庫(kù)沒(méi)有大規(guī)模應(yīng)用,利用率極低,應(yīng)采取不同方式宣傳推廣;4.語(yǔ)料庫(kù)中句子段落的對(duì)齊方式有待改進(jìn),不僅要實(shí)現(xiàn)句子、段落層面的對(duì)齊,更要實(shí)現(xiàn)深層含義的對(duì)應(yīng)?;谝陨喜蛔?,在語(yǔ)料庫(kù)構(gòu)建時(shí),研究者應(yīng)構(gòu)建有一定規(guī)模,符合約定對(duì)齊標(biāo)準(zhǔn)的專門用途語(yǔ)料庫(kù),以滿足更多專業(yè)語(yǔ)料庫(kù)研究的需要。語(yǔ)料庫(kù)的應(yīng)用也應(yīng)便于今后更大范圍的連接和推廣,實(shí)現(xiàn)共建共聯(lián)。
鞍山的旅游資源包括:世界第一玉佛、亞洲著名溫泉、國(guó)家名勝千山、中華寶玉之都和祖國(guó)鋼鐵之都。除此之外,鞍山擁有的國(guó)家級(jí)非物質(zhì)文化遺產(chǎn)數(shù)量居全省首位,多達(dá)11 項(xiàng),如岫巖滿族民間剪紙,岫巖皮影、岫巖玉雕、海城高蹺、評(píng)書、千山寺廟音樂(lè),海城民間鼓樂(lè)、岫巖東北大鼓等。除了旅游民俗等相關(guān)的自然風(fēng)光、景點(diǎn)介紹、地方民俗風(fēng)情、傳統(tǒng)文藝及傳統(tǒng)技藝之外,將旅游相關(guān)語(yǔ)料,例如:城市概況、賓館飯店、交通指南、購(gòu)物美食等語(yǔ)料也搜集進(jìn)語(yǔ)料庫(kù),為游客更好地提供服務(wù)。
所有語(yǔ)料的搜集都將編入鞍山旅游英漢平行語(yǔ)料庫(kù),該語(yǔ)料庫(kù)的設(shè)計(jì)主要參考北京外國(guó)語(yǔ)大學(xué)王克非教授在《雙語(yǔ)平行語(yǔ)料庫(kù)∶研究與應(yīng)用》[2]一書中描述的雙語(yǔ)平行語(yǔ)料庫(kù)設(shè)計(jì)思路進(jìn)行設(shè)計(jì)。語(yǔ)料庫(kù)的建立旨在整合相關(guān)旅游資料,進(jìn)行旅游資料中英文本的合理分類、篩選、翻譯、對(duì)齊、加工、標(biāo)注,最終建成一定規(guī)模的雙語(yǔ)平行語(yǔ)料庫(kù)。
語(yǔ)料庫(kù)的基本構(gòu)建過(guò)程包括語(yǔ)料采集、語(yǔ)料錄入、語(yǔ)料標(biāo)注和對(duì)齊,以及語(yǔ)料的檢索四個(gè)部分。首先是對(duì)原始語(yǔ)料進(jìn)行全面搜集,篩選出較為專業(yè)的語(yǔ)料翻譯,之后將所有語(yǔ)料在電子文檔中保存。所有語(yǔ)料都應(yīng)在經(jīng)專家的審定之后使用錄入,專家要著重對(duì)民族文化特色詞匯進(jìn)行漢英譯文審定,并對(duì)缺少英語(yǔ)譯文的中文語(yǔ)料,進(jìn)行翻譯,補(bǔ)齊雙語(yǔ)語(yǔ)料,至此,原始語(yǔ)料采集階段工作基本完成,形成原始語(yǔ)料電子文本庫(kù)。接下來(lái)錄入原始語(yǔ)料,首先是對(duì)語(yǔ)料進(jìn)行校對(duì),刪除消除無(wú)用的語(yǔ)言信息,之后分別對(duì)英文語(yǔ)料進(jìn)行基本的詞性標(biāo)注,最后采取計(jì)算機(jī)軟件和人工標(biāo)注相結(jié)合的方式進(jìn)行雙語(yǔ)語(yǔ)料平行對(duì)齊,形成漢英雙語(yǔ)平行語(yǔ)料庫(kù)。最后一個(gè)階段是實(shí)現(xiàn)語(yǔ)料檢索。通過(guò)平行語(yǔ)料檢索工具,對(duì)語(yǔ)料庫(kù)的檢索功能進(jìn)行測(cè)試、修正、再測(cè)試,最終達(dá)到可以進(jìn)行在線檢索的目標(biāo)。
鞍山旅游雙語(yǔ)平行語(yǔ)料庫(kù)立足小型專業(yè)語(yǔ)料庫(kù),在語(yǔ)料的收集過(guò)程中要保證語(yǔ)料的代表性和專業(yè)性[3]。因此,采集所有關(guān)于鞍山旅游的原始語(yǔ)料,主要語(yǔ)料來(lái)源包括:鞍山政府相關(guān)外宣文件、宣傳手冊(cè)、調(diào)查報(bào)告、網(wǎng)站資料、正式出版的書籍、博物館的資料、論文。將旅游相關(guān)中英文本進(jìn)行篩選,盡量選出最新的翻譯譯文進(jìn)行文本的保存。
采集后對(duì)語(yǔ)料進(jìn)行整理分類。按照自然風(fēng)光、民俗文化、交通食宿等進(jìn)行分類。對(duì)中文語(yǔ)料進(jìn)行重新梳理,借助翻譯工具對(duì)語(yǔ)料進(jìn)行翻譯,之后進(jìn)行人工校對(duì)。在對(duì)其中文進(jìn)行翻譯時(shí),要注意:特別是對(duì)英文譯文文本,在充分理解了解內(nèi)涵含義的基礎(chǔ)上,要進(jìn)行修正和改進(jìn)使其更加標(biāo)準(zhǔn)化,更加符合慣例,這也以便于將來(lái)與其他各地的語(yǔ)料庫(kù)接軌。另外,人工校對(duì)時(shí)一定要保證統(tǒng)一性,尤其是專有名詞,地名等。對(duì)于其它沒(méi)有英譯文的純中文的語(yǔ)料,翻譯時(shí)要多參考查閱資料,做到翻譯盡量準(zhǔn)確,符合翻譯原則。最后用軟件的翻譯質(zhì)量保證功能來(lái)評(píng)估翻譯的整理語(yǔ)言質(zhì)量,生成翻譯報(bào)告后,請(qǐng)專家再次審核和校對(duì)譯文,之后保存譯文進(jìn)行文本錄入。
語(yǔ)料的標(biāo)注指詞性標(biāo)注,又稱詞性賦碼,是指對(duì)語(yǔ)料中的每一個(gè)字詞按其在句子中的語(yǔ)法功能對(duì)其加注詞性標(biāo)記,如單數(shù)普通名詞、動(dòng)詞的過(guò)去分詞、形容詞的比較級(jí)等[4]。
語(yǔ)料的標(biāo)注和對(duì)齊是建好語(yǔ)料庫(kù)的關(guān)鍵,它直接影響到語(yǔ)料庫(kù)建成之后檢索功能的精確性和實(shí)用性[5]。標(biāo)注和對(duì)齊采用人工結(jié)合軟件的方式進(jìn)行。先用軟件進(jìn)行標(biāo)注和對(duì)齊,然后輔之人工方式校對(duì)。用tagger 賦碼器對(duì)詞性進(jìn)行標(biāo)注。再用tmxmall在線語(yǔ)料對(duì)齊工具對(duì)語(yǔ)料對(duì)齊,語(yǔ)料對(duì)齊以句子為單位實(shí)現(xiàn)漢英對(duì)照。再具體實(shí)施中,在處理翻譯對(duì)照時(shí),由于中英文語(yǔ)序的不同,對(duì)句子邏輯關(guān)系的處理也不同,有時(shí)英文的一個(gè)長(zhǎng)句會(huì)翻譯成幾句中文的短句,中文的多個(gè)句子也會(huì)合譯為一個(gè)英文長(zhǎng)句,以便更好地符合中英文語(yǔ)言規(guī)則。所以,鑒于中英文句法的差異,翻譯就不能以句子一一對(duì)應(yīng)為對(duì)齊方式,應(yīng)該以句意為對(duì)齊方式,以體現(xiàn)完整的意思為基礎(chǔ)。正確使用翻譯技巧來(lái)保證中英文文本意義的完整表達(dá),這也體現(xiàn)了翻譯技巧的運(yùn)用,對(duì)翻譯的教學(xué)研究都有一定的實(shí)際意義和借鑒作用。此外,專用名詞的翻譯可按詞組方式對(duì)齊,檢索時(shí),翻譯結(jié)果應(yīng)關(guān)聯(lián)一些原文的出處,以便游客和學(xué)生進(jìn)一步了解相關(guān)背景從而對(duì)檢索詞有清楚的理解。最后,使用語(yǔ)料庫(kù)軟件進(jìn)行詞組和句子對(duì)齊,軟件對(duì)齊完成后,需人工進(jìn)行調(diào)整。
語(yǔ)料標(biāo)注對(duì)齊后,就需要用語(yǔ)料庫(kù)軟件將所有語(yǔ)料按一定方式整合起來(lái),實(shí)現(xiàn)檢索功能。由于軟件涉及計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)技術(shù)層面的問(wèn)題,而語(yǔ)料庫(kù)軟件又屬于小眾型應(yīng)用軟件,所以現(xiàn)成的軟件并不多?,F(xiàn)成的軟件可以使用ParaConc等語(yǔ)料庫(kù)檢索軟件語(yǔ)料整合完成后還需經(jīng)過(guò)網(wǎng)絡(luò)測(cè)試,測(cè)試成功后便可以放在網(wǎng)站上對(duì)用戶開(kāi)放,建成后根據(jù)用戶體驗(yàn)不斷持續(xù)完善語(yǔ)料庫(kù)。
鞍山旅游雙語(yǔ)平行語(yǔ)料庫(kù)的建立能夠助力區(qū)域經(jīng)濟(jì)發(fā)展,提升鞍山外宣水平,助力智慧旅游、智慧城市發(fā)展,對(duì)鞍山旅游文化的國(guó)際傳播具有十分重要的意義。其一,翻譯研究中越來(lái)越關(guān)注地方化特色。旅游民俗方面的翻譯時(shí),地方化特色的最佳代表,這無(wú)疑豐富了此方面的研究成果,為對(duì)外宣傳研究提供了可借鑒參考的英文宣傳范本和詳實(shí)的實(shí)踐例句。其二,根據(jù)詳盡豐富的語(yǔ)料資源,可開(kāi)發(fā)新型技術(shù)軟件。在此基礎(chǔ)上,探索更實(shí)用的檢索方法,創(chuàng)造更多語(yǔ)料庫(kù)的互聯(lián)互通,運(yùn)用軟件升級(jí)等技術(shù)手段推廣鞍山旅游雙語(yǔ)語(yǔ)料庫(kù)。
鞍山旅游文化平行語(yǔ)料庫(kù)可以為相關(guān)學(xué)術(shù)研究提供借鑒,為語(yǔ)言研究者提供語(yǔ)料豐富的對(duì)比平臺(tái)。研究者可以通過(guò)語(yǔ)料庫(kù)研究鞍山文化的語(yǔ)言特征的差異和共性,為進(jìn)一步研究旅游文化提供了方法和途徑。依托鞍山旅游雙語(yǔ)語(yǔ)料庫(kù)在鞍山高校內(nèi)開(kāi)展語(yǔ)言與文化對(duì)比研究,可根據(jù)語(yǔ)料庫(kù)的文本搜索功能獲取的大量原始資料,可對(duì)旅游雙語(yǔ)文本的風(fēng)格、句法、詞匯等進(jìn)行比對(duì)和分析,進(jìn)行定量和定性結(jié)合的研究。
鞍山旅游文化雙語(yǔ)平行語(yǔ)料庫(kù)還可以為鞍山地區(qū)高校的翻譯教學(xué),相關(guān)專業(yè)的培養(yǎng)提供豐富、有針對(duì)性的翻譯實(shí)例。這些語(yǔ)料庫(kù)中的直觀文本能夠成為學(xué)生學(xué)習(xí)翻譯提供資料,激發(fā)學(xué)生的學(xué)習(xí)熱情和對(duì)城市的熱愛(ài),提升課堂教學(xué)效果,對(duì)培養(yǎng)翻譯人才、旅游從業(yè)人才的培養(yǎng)都有積極的作用。
目前我國(guó)已經(jīng)建立了一些地域性的雙語(yǔ)平行語(yǔ)料庫(kù)、有力的服務(wù)和推動(dòng)當(dāng)?shù)芈糜萎a(chǎn)業(yè)的發(fā)展。為順應(yīng)旅游國(guó)際化的趨勢(shì),促進(jìn)對(duì)外宣傳,各地建立本土化的旅游雙語(yǔ)平行語(yǔ)料庫(kù)勢(shì)在必行。因此,廣泛搜集鞍山旅游資源,構(gòu)建旅游文化平行語(yǔ)料庫(kù)是為廣大游客提供優(yōu)質(zhì)的旅游翻譯服務(wù),幫助人們充分認(rèn)識(shí)旅游資源文化的內(nèi)涵,從而提升品牌質(zhì)量以及旅游市場(chǎng)價(jià)值。