陳拔萃
(嶺南師范學(xué)院外國(guó)語學(xué)院翻譯系,廣東 湛江524048)
在語言學(xué)研究中,語料庫(corpus)指的是“應(yīng)用計(jì)算機(jī)技術(shù),按照一定的語言學(xué)原則,根據(jù)特定的語言研究目的而大規(guī)模收集并貯存在計(jì)算機(jī)中的真實(shí)語料,這些語料經(jīng)過一定程度的標(biāo)注,便于檢索,可用于描述研究和實(shí)證研究”[1]。自20 世紀(jì)90 年代以來,語料庫得到了明顯的發(fā)展,各種平行/雙語語料庫、口語和筆頭語語料庫、學(xué)習(xí)者語料庫等的相繼建立,使得語料庫在語言描寫和語言分析中的作用和優(yōu)勢(shì)越來越顯著。 事實(shí)上,語料庫語言學(xué)的興起是20 世紀(jì)以來語言學(xué)領(lǐng)域的重大變革之一,在研究對(duì)象的真實(shí)性,研究方法的系統(tǒng)性,研究結(jié)果的可復(fù)制和可驗(yàn)證性等方面有著其他語言研究范式所不可比擬的巨大優(yōu)勢(shì),正在成為“語言學(xué)研究的主流趨勢(shì)”[2]。
目前,在嶺南師范學(xué)院翻譯系還沒有面向?qū)W生的口譯語料庫。建立此庫,我們認(rèn)為至少基于以下三方面的考慮:
(1)口譯教學(xué)的輔助工具
口譯教學(xué)目前在我校方興未艾。我校從2004 年開設(shè)英語專業(yè)(翻譯方向),2012 年獲教育部批準(zhǔn)開設(shè)本科翻譯專業(yè)。幾年來,我校的口譯教學(xué)與培訓(xùn)取得了驕人的戰(zhàn)績(jī),例如本校學(xué)生曾獲得第五屆廣東省大學(xué)生“藍(lán)鴿杯”英語口譯大賽三等獎(jiǎng)、廣東省翻譯大賽口譯三等獎(jiǎng)等。盡管如此, 在口譯教學(xué)實(shí)踐中依然呈現(xiàn)出一系列急需解決的研究課題, 如何科學(xué)有效地設(shè)置適合本校的口譯教學(xué)大綱、完善口譯課程體系和教學(xué)方法等等。
(2)口譯研究的堅(jiān)實(shí)基礎(chǔ)
相比起口譯教學(xué)而言, 我校翻譯系的口譯研究還處于初始階段。據(jù)不完全統(tǒng)計(jì),在翻譯系教師公開發(fā)表的關(guān)于口譯研究論文中, 往往是基于個(gè)人教學(xué)或?qū)嵺`經(jīng)驗(yàn)的反思和總結(jié),或是對(duì)理論的比較和評(píng)析,而暫時(shí)缺乏系統(tǒng)的描寫性研究。 然而一門科學(xué)學(xué)科的創(chuàng)立和發(fā)展需要一個(gè)“描寫”(description)的基礎(chǔ)[3],而在本系口譯教師所做研究中目前尚缺乏系統(tǒng)獲取描寫型數(shù)據(jù),并采用科學(xué)有效分析方法進(jìn)行研究的成果。 而建立口譯語料庫正是可望彌補(bǔ)這一缺陷,為下一步進(jìn)行口譯理論的研究采集可靠的數(shù)據(jù),打下堅(jiān)實(shí)的基礎(chǔ)。
(3)口譯實(shí)踐的理想平臺(tái)
目前國(guó)內(nèi)外針對(duì)外語學(xué)習(xí)開發(fā)的軟件平臺(tái)早已顯示出強(qiáng)大的市場(chǎng)生命力。 但據(jù)公開資料顯示, 針對(duì)口譯學(xué)習(xí)者的口譯訓(xùn)練軟件的研發(fā), 國(guó)內(nèi)目前尚處于初始階段。 而目前我院學(xué)生參加口譯實(shí)踐活動(dòng)的機(jī)會(huì)日益增多,如2014 中國(guó)國(guó)際水產(chǎn)博覽會(huì)、2014 中國(guó)海洋經(jīng)濟(jì)博覽會(huì)、各屆廣交會(huì)等等,如果現(xiàn)場(chǎng)語料加以轉(zhuǎn)寫收集進(jìn)入語料庫,將會(huì)成為口譯課堂教學(xué)中自主學(xué)習(xí)實(shí)施的理想平臺(tái)。 學(xué)生口譯語料庫不僅方便口譯學(xué)習(xí)者進(jìn)行自我練習(xí),也可以使合作式學(xué)習(xí)成為可能。 此外,通過口譯語料庫, 學(xué)生可以更加客觀清晰地認(rèn)識(shí)自己口譯中的失誤現(xiàn)象,使其口譯教學(xué)更加有效率和更加具有針對(duì)性。
參考了國(guó)內(nèi)外在口譯語料庫建設(shè)方面的經(jīng)驗(yàn), 鑒于我校的實(shí)際情況,擬在嶺南師范學(xué)院翻譯系建立一個(gè)學(xué)生口譯語料庫,計(jì)劃在兩年內(nèi)建成三個(gè)子庫,分別為:學(xué)生課堂練習(xí)語料庫、學(xué)生期末考試語料庫、學(xué)生課外實(shí)踐語料庫, 均為雙語平行語料庫。 初步計(jì)劃兩年內(nèi)轉(zhuǎn)寫語料十萬字。
本語料庫的性質(zhì)屬于翻譯語料庫。這是因?yàn)榭谧g是一種特殊的翻譯活動(dòng), 涉及源語與譯語的口頭表達(dá)和轉(zhuǎn)換。同時(shí),根據(jù)語料的對(duì)應(yīng)層次,也屬于對(duì)應(yīng)語料庫的一種[4]6-7。
本語料庫的語料來源主要是課堂錄音、 期末考試學(xué)生的錄音,以及學(xué)生口譯實(shí)踐中的錄音。
本語料庫的語料內(nèi)容主要按照專題來進(jìn)行分類,可分為經(jīng)濟(jì)口譯、政治口譯、旅游口譯等等。
本語料庫的方向分別有漢-英、英-漢兩大類。
本語料庫的對(duì)象為翻譯專業(yè)本科學(xué)生, 初步考慮年級(jí)為大三和大四。 這主要基于學(xué)生的英語基礎(chǔ)和口譯課程的設(shè)置來考慮。
語料收集的工作方式和應(yīng)用場(chǎng)合:基于學(xué)生水平、語料收集和研究目的等因素的考慮,在口譯工作方式方面,本語料庫以交替?zhèn)髯g為主;根據(jù)口譯的應(yīng)用場(chǎng)合,主要以聯(lián)絡(luò)口譯、隨同口譯和社區(qū)口譯為主。
根據(jù)對(duì)國(guó)內(nèi)外主要口譯語料庫的經(jīng)驗(yàn)借鑒, 結(jié)合本口譯語料庫的實(shí)際情況,主要步驟如下:
(1)收集語料(錄音/影)
如果收集口譯課堂和期末考試的語料, 則使用我校同聲傳譯實(shí)訓(xùn)室相關(guān)設(shè)備和軟件,對(duì)口譯訓(xùn)練過程和學(xué)生的口譯進(jìn)行錄音。 這類材料一方面可以用于學(xué)生自主進(jìn)行課后口譯學(xué)習(xí), 一方面還可用作本??谧g教學(xué)研究的真實(shí)素材。 如果是在口譯實(shí)踐現(xiàn)場(chǎng),應(yīng)注意的是,需獲取多方許可,如活動(dòng)組織方、講者和譯者等,方可進(jìn)行錄音或者錄影。 由于本研究主要對(duì)象為交替?zhèn)髯g, 在錄音上屬于單聲道,相對(duì)比較簡(jiǎn)單,現(xiàn)有的設(shè)備可完全覆蓋。但如果可以把錄音過程設(shè)法轉(zhuǎn)為錄影過程,視頻的信息可為日后的研究提供更為重要的分析材料。
(2) 語料的數(shù)字化(使用軟件)
通過現(xiàn)有設(shè)備所獲取的錄音/影材料,有些需要通過一定的軟件處理,才能成為計(jì)算機(jī)可讀取或分析的音視頻材料。 口譯材料的數(shù)字化通常由聲音編輯軟件實(shí)現(xiàn),例如:Cooledit-Pro 2.0,格式為.wav;采樣速率為32k;聲道為單聲道; 采樣分別率達(dá)到8 Bit。 在語料收集階段需要盡可能收集到好的音質(zhì)的音視頻,這樣才可以為研究副語言特征,如停頓、猶豫等提供可能性[5]。
(3)語料的文字轉(zhuǎn)寫
由于所采集語料多為音頻或者視頻模式, 因此需要進(jìn)行文字轉(zhuǎn)寫。 雖然在技術(shù)層面上, 可以利用某些軟件包進(jìn)行語言識(shí)別,例如Dragon Naturally Speaking 及IBM Via Voice 等,但目前此類技術(shù)還不完全成熟,結(jié)果并不可靠。 因此,只適合用來獲得初稿。 文字轉(zhuǎn)寫大部分工作還是要依靠人工完成, 并且在轉(zhuǎn)寫完成后還需要反復(fù)精聽,進(jìn)行核對(duì)。 在理想的狀態(tài)下,轉(zhuǎn)寫時(shí)除了要求寫出文字以外,還需要注意對(duì)副語言(如停頓、支吾等) 的標(biāo)注,但如何對(duì)副語言進(jìn)行標(biāo)注,是下一步值得在研究中探討的難點(diǎn)[6]。
(4)文本標(biāo)注
在轉(zhuǎn)寫完成以后,下一步是對(duì)文字材料進(jìn)行標(biāo)注,為以后的分析語料打下基礎(chǔ)。 參考王斌華、葉亮[3]對(duì)口譯教學(xué)語料庫的語料標(biāo)注參數(shù)的分類,結(jié)合學(xué)生實(shí)際情況,本語料庫的標(biāo)注參數(shù)擬分為五個(gè)類別:1)按口譯主題來分,分為政治、經(jīng)濟(jì)、社會(huì)等;2)按口譯場(chǎng)合來分,分為新聞發(fā)布會(huì)現(xiàn)場(chǎng)口譯、導(dǎo)游口譯、商務(wù)談判口譯等; 3)按專業(yè)難度來分,可分為專業(yè)化、一般化、大眾化三個(gè)級(jí)別;4)按語速來分,可分為快、中、慢三個(gè)等級(jí);5)時(shí)長(zhǎng)及字?jǐn)?shù)(具體語篇具體分析)。
(5)語料入庫及檢索統(tǒng)計(jì)
在完成了前面幾個(gè)步驟以后, 就可以把語料導(dǎo)入平行語料庫軟件, 以便進(jìn)行下一步的檢索統(tǒng)計(jì)分析。 本研究擬采用國(guó)內(nèi)比較通行也比較多借鑒經(jīng)驗(yàn)的ParaConc。經(jīng)過對(duì)文本的處理,將漢語和英語文本分批導(dǎo)入,點(diǎn)擊平行文本對(duì)齊,即可建成平行語料庫。 在建成以后,既可以對(duì)所標(biāo)注的信息進(jìn)行檢索和統(tǒng)計(jì),也可以批量提取相關(guān)語料。
本口譯語料庫建成的使用潛力主要在于對(duì)本專業(yè)口譯教學(xué)與研究的新突破。 近年來, 隨著全國(guó)翻譯專業(yè)的蓬勃發(fā)展,地區(qū)院校的口譯教學(xué)與研究亦呈現(xiàn)興旺發(fā)展的勢(shì)頭。 然而多年以來, 我院口譯教學(xué)教師之間僅僅是停留在“經(jīng)驗(yàn)傳授”的階段,并沒有一個(gè)“口譯教學(xué)資源庫”,也沒有將現(xiàn)有口譯教學(xué)資源進(jìn)行很好的整合。 本語料庫建成以后,在口譯教學(xué)實(shí)際操作中,可以把該語料庫的音頻或視頻作為口譯現(xiàn)場(chǎng)模擬材料,或者把某些譯得好的口譯片段作為模范,從而使學(xué)生通過比較,提高對(duì)自己口譯質(zhì)量和存在問題的認(rèn)識(shí)。 其次,基于本庫,學(xué)生可以在其中選取來自于真實(shí)場(chǎng)景的語料作為口譯自主練習(xí)材料,教師也可以直接運(yùn)用其中的某些錄音或通過音頻剪輯軟件(如cooledit)對(duì)語料進(jìn)行切分加工,或調(diào)整語速,使其符合學(xué)生的實(shí)際口譯學(xué)習(xí)水平。
在研究方面, 我院口譯研究多數(shù)基于經(jīng)驗(yàn)總結(jié)、主觀內(nèi)省,或是對(duì)翻譯理論的比較和評(píng)析。 而此類研究往往缺乏口譯研究本該有的 “生態(tài)效度”(ecological validity)[7]。 另外,鑒于目前我院的口譯研究幾乎都是例證或者以某幾個(gè)學(xué)生的語料為研究對(duì)象,而科學(xué)研究中的假設(shè)和求證均需要規(guī)模較大的有效的數(shù)據(jù)。 因此,目前我校的口譯研究目前難以得出具有普遍性意義的研究結(jié)論。
而要改變以上的狀況, 必須要在研究視角和方法上有新的突破,才會(huì)使我院口譯研究有更好的發(fā)展,更上一臺(tái)階, 為我院翻譯碩士的申請(qǐng)打下良好的基礎(chǔ)。 而一個(gè)具有良好前景的目前國(guó)內(nèi)國(guó)外都比較認(rèn)可的突破口便是, 建立屬于我系的學(xué)生口譯語料庫。 對(duì)學(xué)生現(xiàn)場(chǎng)口譯的真實(shí)語料進(jìn)行系統(tǒng)描寫,再采用科學(xué)認(rèn)可的方法進(jìn)行轉(zhuǎn)寫入庫,探究具有我院特色的學(xué)生的口譯現(xiàn)象以及尋找內(nèi)在的規(guī)律和存在問題, 以此為逐步建構(gòu)口譯研究的基礎(chǔ)理論的基礎(chǔ)。
[1] 王克非.語料庫翻譯學(xué)探討[M].上海:上海交通大學(xué)出版社,2012.
[2] 張威. 口譯語料庫的建設(shè)與應(yīng)用——理論、 方法與實(shí)踐[M].北京:北京語言大學(xué)出版社,2013.
[3] 王斌華,葉亮.面向教學(xué)的口譯語料庫建設(shè):理論與實(shí)踐[J].外語界,2009(2):23-32.
[4] 王克非等.雙語對(duì)應(yīng)語料庫研制與應(yīng)用[M]. 北京:外語教學(xué)與研究出版社,2004.
[5] 胡開寶,陶慶.漢英會(huì)議口譯語料庫的創(chuàng)建與應(yīng)用研究[J].中國(guó)翻譯,2010(5):49-56.
[6] 鄒兵,王斌華.口譯語料庫中副語言信息的轉(zhuǎn)寫及標(biāo)注:現(xiàn)狀、問題與方法[J].山東外語教學(xué),2014(4):17-23.
[7] Pchhacker, F. Introducing interpreting studies [M]. London/New York:Routledge.