陳 璇
近年來(lái),開(kāi)設(shè)翻譯本科專業(yè)與翻譯碩士專業(yè)的高校數(shù)量逐年攀升,口譯人才的培養(yǎng)模式亟待規(guī)范化和系統(tǒng)化,而建設(shè)口譯教學(xué)資源庫(kù)便是其中非常重要的一個(gè)環(huán)節(jié)(仲偉合,2017)。 當(dāng)前信息技術(shù)快速發(fā)展,在這樣的背景下,口譯教學(xué)資源的種類也日益豐富。然而,面對(duì)互聯(lián)網(wǎng)上海量的學(xué)習(xí)資源,學(xué)習(xí)者究竟該如何快速、準(zhǔn)確地將其與自己當(dāng)前的學(xué)習(xí)目標(biāo)和學(xué)習(xí)需求進(jìn)行匹配,是所有口譯專業(yè)師生共同面臨的一個(gè)重要問(wèn)題。 從教師角度來(lái)講,教師需要使用與自己的教學(xué)內(nèi)容和教學(xué)手段相契合的教學(xué)資源來(lái)組織安排教學(xué)活動(dòng)。 與此同時(shí),學(xué)生也需要及時(shí)地獲取到與自己能力水平和學(xué)習(xí)需求相一致的學(xué)習(xí)資源來(lái)有效地進(jìn)行自主學(xué)習(xí)。 智能化口譯教學(xué)資源平臺(tái)的開(kāi)發(fā),旨在運(yùn)用現(xiàn)代化信息技術(shù)手段,實(shí)現(xiàn)對(duì)口譯教學(xué)資源的智能化開(kāi)發(fā)、管理與維護(hù)。 文章從資源分類、屬性標(biāo)注以及資源的獲取與加工等角度,深入探討智能化口譯教學(xué)平臺(tái)的資源管理機(jī)制,從而實(shí)現(xiàn)對(duì)智能化口譯教學(xué)資源管理系統(tǒng)研究的初步探索。
實(shí)現(xiàn)對(duì)口譯教學(xué)資源智能化管理的前提是要建立一套科學(xué)化的資源層級(jí)分類體系。 科學(xué)合理的層級(jí)劃分體系有助于增強(qiáng)數(shù)字化資源在口譯教學(xué)中的適用性與針對(duì)性,為學(xué)習(xí)者提供個(gè)性化與精準(zhǔn)化的資源選擇方案,進(jìn)而保持學(xué)習(xí)的信心與興趣,保障學(xué)習(xí)效果(鄧軍濤,古煜奎,2017)。
智能化口譯教學(xué)平臺(tái)的資源管理需要以口譯教學(xué)為導(dǎo)向,綜合考慮口譯專題與媒體類型等其他要素。因此,本次資源分類系統(tǒng)的設(shè)計(jì)以學(xué)生的能力目標(biāo)為主要的資源組織方式,綜合考慮口譯專題、媒體類型等其他資源分類。 口譯能力主要包括:語(yǔ)言能力、知識(shí)能力、口譯技能、心理素質(zhì)、職業(yè)素質(zhì)等方面,所有分類都可以繼續(xù)往下進(jìn)行深入的細(xì)分,在對(duì)《中國(guó)英語(yǔ)能力等級(jí)量表》和翻譯協(xié)會(huì)《口譯服務(wù)標(biāo)準(zhǔn)》進(jìn)行深入研究的基礎(chǔ)上,對(duì)口譯專業(yè)學(xué)生的能力需求做出如下分解:
表1 口譯技能分類參數(shù)列表
續(xù)表
此外,按口譯專題進(jìn)行分類,口譯教學(xué)資源還可分為:教育、文化、旅游、商務(wù)、經(jīng)濟(jì)、政治、外交、法律、體育、科技、環(huán)保、社會(huì)以及其他不同子類。 不同子類還可以進(jìn)行細(xì)分。 如:教育可以分為教育論壇、出國(guó)留學(xué)、會(huì)議致辭等子類;文化可分為:飲食文化、時(shí)尚潮流、歷史文化、節(jié)日風(fēng)俗、藝術(shù)天地、人物訪談等;旅游可分為:國(guó)內(nèi)旅游、海外旅游等;商務(wù)可分為:商務(wù)接待、商務(wù)洽談等;經(jīng)濟(jì)分為:國(guó)內(nèi)經(jīng)濟(jì)、世界經(jīng)濟(jì)等;政治分為:國(guó)內(nèi)政治、國(guó)際政治等;環(huán)保分為:城市衛(wèi)生、全球環(huán)境等。 按媒體類型,口譯資源可分為視頻、音頻、課件、圖片、文本材料、考試試題等。
本系統(tǒng)主要是針對(duì)所有與口譯教學(xué)相關(guān)的資源:包括文本資料、視頻、音頻、圖片、課件、試題等設(shè)計(jì),因此對(duì)資源進(jìn)行屬性標(biāo)注時(shí),研究者主要依據(jù)國(guó)家標(biāo)準(zhǔn)LOM(學(xué)習(xí)對(duì)象元數(shù)據(jù))信息模型規(guī)范和CELTS-31 教育資源建設(shè)技術(shù)規(guī)范,并綜合之前設(shè)計(jì)的口譯教學(xué)資源需求模型和上述口譯資源分類方法進(jìn)行資源元數(shù)據(jù)的標(biāo)注。 下面以音視頻類資源屬性標(biāo)注為例,選取表2 所示的一些資源屬性進(jìn)行元數(shù)據(jù)標(biāo)注。
表2 音視頻類資源元數(shù)據(jù)標(biāo)注表
續(xù)表
資源的收集途徑:就目前的口譯教學(xué)資源庫(kù)建設(shè)現(xiàn)狀來(lái)說(shuō),口譯教學(xué)資源的收集主要有以下幾種:1.高校自主開(kāi)發(fā)的微課、慕課、多媒體、音頻、課件等。 這些資源一般都是由教師親自制作,并在教學(xué)使用過(guò)程中經(jīng)過(guò)多次的修改和完善,因此具有很高的使用價(jià)值,是口譯教學(xué)資源庫(kù)必不可少的資源之一;2. 網(wǎng)絡(luò)資源、有聲報(bào)紙雜志等;網(wǎng)絡(luò)資源往往具有數(shù)量大、種類多、文件類型復(fù)雜等特點(diǎn),因此需要資源建設(shè)者耗費(fèi)較多的時(shí)間進(jìn)行整理和加工;3. 出版社與高校聯(lián)合發(fā)行的口譯教科書(shū)及配套的練習(xí)冊(cè)、音像帶和多媒體光盤等;4. 廣播影視節(jié)目、錄音、錄像資源等;5. 以“全國(guó)翻譯專業(yè)資格水平考試”為代表的考證資源等。 媒體資源類別主要包括文本、視頻、音頻、圖像、課件等。 對(duì)于不同媒體素材的處理,所采用的工具有所不同。
口譯教學(xué)資源的加工要按照教師和學(xué)生對(duì)資源的具體需求情況來(lái)進(jìn)行。 因此,資源的加工可參考研究者設(shè)計(jì)的口譯教學(xué)資源需求模型,并根據(jù)具體課程的教學(xué)模式、教學(xué)內(nèi)容和課程設(shè)置情況進(jìn)行資源的獲取與加工。 對(duì)于文本文件的制作,可以采用一些操作簡(jiǎn)單且兼容性比較強(qiáng)的文本抓取工具,如Snagit。 圖形素材的采集主要通過(guò)掃描儀、數(shù)碼相機(jī)、屏幕抓取軟件等來(lái)完成。 對(duì)于音頻視頻文件的加工,由于本次設(shè)計(jì)的教學(xué)資源平臺(tái)中的播放器采用Adobe Flex 進(jìn)行架構(gòu),可以直接使用Elan 標(biāo)注軟件對(duì)音視頻文件進(jìn)行標(biāo)注和處理。 Elan(EUDICO Linguistic Annotator)是由荷蘭紐梅因馬克斯布朗克心理語(yǔ)言學(xué)研究所開(kāi)發(fā)的一個(gè)跨平臺(tái)多媒體轉(zhuǎn)寫標(biāo)注軟件,可在Windows、Linux 等主流操作系統(tǒng)上使用。 Elan 支持多種音頻與視頻文件格式的轉(zhuǎn)寫和標(biāo)注,媒體與文本直接關(guān)聯(lián)。 對(duì)于搜集到的音頻視頻文件可使用Elan 進(jìn)行如下處理:
通過(guò)在Elan 的音頻識(shí)別器中設(shè)置最小靜音時(shí)長(zhǎng)和最小非靜音時(shí)長(zhǎng),可將視頻或音頻文件中較長(zhǎng)時(shí)間的停頓(如演講者思考時(shí)的停頓)和較短時(shí)間的噪聲(如咳嗽、東西掉落的聲音等)進(jìn)行去噪處理。 使用Elan 音量速度控制功能可以對(duì)語(yǔ)料的音量和音速進(jìn)行控制和調(diào)節(jié)。
語(yǔ)料切分的目的在于方便師生按照教學(xué)的需要進(jìn)行相應(yīng)的口譯練習(xí)。 語(yǔ)料切分過(guò)程應(yīng)在具體課程設(shè)置的基礎(chǔ)上,根據(jù)語(yǔ)料的內(nèi)容特點(diǎn),按照其詞匯密度、語(yǔ)法結(jié)構(gòu)以及數(shù)字與日期的占比等情況進(jìn)行適當(dāng)?shù)那蟹?鄧軍濤,劉夢(mèng)蓮;2020)。 在Elan 分割模式狀態(tài)下,可以將語(yǔ)料按照實(shí)際語(yǔ)流的速度進(jìn)行分割。
圖1 語(yǔ)料的分割處理
語(yǔ)料的轉(zhuǎn)寫即對(duì)音視頻中的所有聲音進(jìn)行文字的轉(zhuǎn)寫。 語(yǔ)料的標(biāo)注即對(duì)口譯語(yǔ)料分別進(jìn)行語(yǔ)言信息、副語(yǔ)言信息和超語(yǔ)言信息等層面的標(biāo)注(鄒賓,王斌華;2014)。 在Elan 語(yǔ)料標(biāo)注系統(tǒng)中,可以在分割模式中完成對(duì)轉(zhuǎn)寫內(nèi)容的逐段分割標(biāo)記后,切換到轉(zhuǎn)寫模式,在表格中逐句轉(zhuǎn)寫。 轉(zhuǎn)寫后進(jìn)入標(biāo)注模式對(duì)語(yǔ)料進(jìn)行標(biāo)注。
圖2 語(yǔ)料的轉(zhuǎn)寫與標(biāo)注
所有加工后的資源需要進(jìn)行統(tǒng)一的入庫(kù)管理。 資源的入庫(kù)包括對(duì)所有結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)。 結(jié)構(gòu)化數(shù)據(jù)主要指的是文本信息及資源的元數(shù)據(jù)信息。 非結(jié)構(gòu)化數(shù)據(jù)主要指的是視頻、音頻、圖片、動(dòng)畫等多媒體文件。 結(jié)構(gòu)化數(shù)據(jù)主要存儲(chǔ)在數(shù)據(jù)庫(kù)當(dāng)中,以利于信息的檢索與查詢。 而非結(jié)構(gòu)化的數(shù)據(jù)主要是以文件的形式存儲(chǔ)在計(jì)算機(jī)當(dāng)中。 系統(tǒng)主要通過(guò)檢索數(shù)據(jù)庫(kù)中的元數(shù)據(jù)信息實(shí)現(xiàn)對(duì)非結(jié)構(gòu)化數(shù)據(jù)的訪問(wèn)。 元數(shù)據(jù)是用戶對(duì)資源進(jìn)行檢索與查詢、選擇與篩選的主要依據(jù),因此資源在加工完畢后,需要按照資源元數(shù)據(jù)標(biāo)注表對(duì)資源的屬性進(jìn)行詳細(xì)的標(biāo)注與描述。
文章分別從口譯教學(xué)資源的分類、標(biāo)注、獲取與加工等角度進(jìn)行了智能化口譯教學(xué)平臺(tái)資源管理系統(tǒng)的探索性研究。 口譯教學(xué)資源的智能化開(kāi)發(fā)與管理需要充分利用前沿的信息技術(shù)成果,將信息技術(shù)的功能優(yōu)勢(shì)與口譯教師和學(xué)生的具體需求結(jié)合起來(lái),使其在資源的獲取、分類、加工、存儲(chǔ)與應(yīng)用等方面發(fā)揮更重要的作用。