• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    粵港澳大灣區(qū)文化遺產漢英多模態(tài)語料庫的構建初探

    2021-11-25 22:38:58劉文欣梁曉欣黃雪瑩陳健樂黃梓深
    科技信息·學術版 2021年28期
    關鍵詞:多模態(tài)粵港澳大灣區(qū)語料庫

    劉文欣 梁曉欣 黃雪瑩 陳健樂 黃梓深

    摘要:隨著粵港澳大灣區(qū)建設的不斷推進,粵港澳大灣區(qū)的文化遺產作為聯(lián)結灣區(qū)各地的重要橋梁,也是在國內外傳揚嶺南文化的重要載體。因此,加強粵港澳大灣區(qū)文化遺產的語言建設,培養(yǎng)面向世界的語言服務人才是重要的一環(huán)。以此為背景,本文探討了粵港澳大灣區(qū)文化遺產多模態(tài)語料庫的重要性、構建方法以及其對于培養(yǎng)粵港澳大灣區(qū)語言服務者的意義。

    關鍵詞:粵港澳大灣區(qū);多模態(tài);語料庫;語言服務者

    一、前言

    粵港澳大灣區(qū)是中國文化遺產的重要聚集地,文化遺產展覽和人文活動豐富。在粵港澳大灣區(qū)快速發(fā)展以及文化交流日趨增多的背景下,根據(jù)《粵港澳大灣區(qū)發(fā)展規(guī)劃綱要》的要求,各界將聯(lián)合開展大灣區(qū)文化保護、發(fā)展等工作,“弘揚以粵劇、龍舟、武術、醒獅等為代表的嶺南文化,彰顯獨特文化魅力”、“增強大灣區(qū)文化軟實力”、“發(fā)揮大灣區(qū)中西文化長期交匯共存等綜合優(yōu)勢,促進中華文化與其他文化的交流合作”,需要越來越多的語言工作者參與到粵港澳大灣區(qū)文化遺產的傳承中。隨著文化傳播的數(shù)字化進程,以中英雙語文本材料結合多模態(tài)的語料庫建設將為傳播粵港澳文化遺產提供全新的途徑。

    二、多模態(tài)語料庫的發(fā)展

    “語料庫”(Corpus)是指語料的集合或者語料的倉庫,英文詞Corpus來源于拉丁文,為Body的意思,有“全集”的含義。語料庫是樣本的集合,作為專業(yè)術語的語料庫指的是為某一個或多個應用而專門收集的、有一定結構的、有代表性的、可以被計算機程序檢索的、具有一定規(guī)模的語料的集合 (何婷婷,2003)。

    Mona Baker[1]對語料庫翻譯研究理論做出很大貢獻,她曾對語料庫翻譯研究的理論構想提出過一系列極有價值的主張。在初期語料庫翻譯研究的發(fā)展中,Mona Baker指出了語料庫翻譯研究的三個基本方面:(1)語料庫翻譯研究同以目標語為導向的研究方法之間的聯(lián)系;(2)語料庫翻譯研究所使用的獨特方法;(3)這一方法在研究翻譯的語言學性質的方面中具有的潛力[2]。Mona Baker[1]認為語料庫翻譯的最終目的在于探索翻譯語言中規(guī)律性存在的原因和驅動因素,而這些原因和驅動因素可能與原文在目標語文化中的地位相關。

    在國內,基于專門用途的語料庫的起步相對較晚,但發(fā)展迅速。國內近年來建成了一些專門用途語料庫,如上海交通大學的莎士比亞戲劇英漢平行語料庫、燕山大學的《紅樓夢》譯本平行語料庫、紹興文理學院的魯迅小說漢英平行語料庫等。但是這些語料庫因為是專門性的,所以語料來源單一,規(guī)模比較小。此外,雙語平行語料庫的建設近10年來也取得了重大進展,已有多個英漢、漢英雙語平行語料庫建成。如北京大學計算語言學研究所的漢英平行語料庫(5萬多句對)及其所承擔的863項目所建的英漢平行語料庫(20萬句對)、哈爾濱工業(yè)大學的英漢雙語語料庫(40—50萬句對)。但是這些語料庫都有一個共同之處,即建庫的目的主要是自然語言處理而非語言學研究,因此所獲得的句子通常都是脫離語境和順序雜亂的句子,英譯漢與漢譯英的語料夾雜,使用者不易于識別翻譯方向[3]。

    為了能夠更好的開發(fā)語料庫的功能,補充語言傳達的信息,近年,越來越多的人注意到多模態(tài)語料庫的發(fā)展。多模態(tài)語料庫(Multimodal Corpus)指的是把文字、音頻和靜態(tài)、動態(tài)圖像語料一樣進行轉寫、處理和標注,使用者進行檢索、統(tǒng)計等操作的數(shù)據(jù)庫。相對于純文本的語料庫,多模態(tài)語料庫具有可實現(xiàn)語境化、言語活動信息豐富、語料可信度高、語料來源容易確認等優(yōu)點[4]。

    當今現(xiàn)有的多模態(tài)語料多為某一領域的小型語料庫,在研制更多的小型專用語料庫同時應發(fā)展大中型通用語料庫[5]。我們在引進國外現(xiàn)成的多模態(tài)語料庫的同時,要在吸收國外建設經驗的基礎上,去建設和開發(fā)有各個地方特色的多模態(tài)語料庫,注重語料庫建設的設計和規(guī)劃、語料的采集、加工及轉化、語料庫管理系統(tǒng)建設的規(guī)范化,促進語料庫資源共享,提高語料庫的使用效率,避免重復建設帶來的資源浪費。

    語料庫規(guī)模的建設還受到資金、版權、人力、技術等因素的限制。主要雙語庫對專門類型的文本都有一定程度的收錄,但是在數(shù)量上還是遠遠不能滿足現(xiàn)階段各專門用途類的研究需求,語料的文類對研究結果也有一定的影響。

    目前國內語料庫翻譯學研究成果雖然較多,但是在研究粵港澳大灣區(qū)文化遺產漢英語料庫這一領域還比較少人研究,而且鮮有整合的語料資源供語言工作者使用?;谡Z料庫的研究正日益受到學界的關注,作為新興語料庫研究領域,為填補這一空白,粵港澳大灣區(qū)文化遺產漢英語料庫項目旨在為語言工作者提供翔實可靠的漢英平行語料以及相關圖片等副文本信息。

    三、粵港澳大灣區(qū)多模態(tài)語料庫的建設與用途

    粵港澳大灣區(qū)文化遺產漢英語料庫的構建,旨在為研究粵港澳大灣區(qū)文化遺產此領域的相關學者提供正確的漢英互譯的參考信息,傳承中華優(yōu)秀文化,推動中國文化走向世界。主要內容:本項目主要針對的是對粵港澳大灣區(qū)內的文化遺產信息的收集、整合與翻譯。本語料庫將收錄了豐富的雙語文化遺產資源,其中,資源的收錄將分別來自權威文化遺產雙語網站,還有相關的紙質書報,以及粵港澳大灣區(qū)內博物館的雙語導覽。

    本語料庫為自建語料庫,建設過程主要包括語料庫平臺搭建和語料采集與加工兩大部分。其中,平臺搭建的步驟包括門戶網站的建立,搜索引擎嵌入,模塊劃分和 XML信息標注過程。在語料采集與加工過程中,團隊將首先搜集粵港澳大灣區(qū)關于文化遺產的權威漢英平行語料以及相關資源,采用 OCR 等、文字編輯器等工具進行純文本提取,并通過文本對齊工具進行漢英語料對齊,形成平行語料 XML 文件。在 XML漢英平行語料載入平臺之后,還將為平行文本補充相應的粵港澳大灣區(qū)文化遺產的圖片及其它副文本,形成完整的語料庫。

    在語料選取上,本語料庫基于顧曰國[7]提出的語料庫選取的三個特點,充分考慮其語料代表性,應用價值及研究價值及語料質量。就語料代表性而言,本語料庫所選取的所有語料緊貼粵港澳大灣區(qū)文化遺產內容,包含文化遺產項目介紹文本,宣傳文本及相關技術文本。就應用價值及研究價值而言,本語料庫所選取的漢英平行語料及多模態(tài)材料結合的形式可為廣大語言學習者、語言服務者及文化愛好者提供大量的文本與副文本,幫助他們在提高雙語能力的同時加深對文化的理解;語言研究者以及文化研究者可以使用該語料庫中的平行語料及進行漢英雙語語言研究、翻譯研究、多模態(tài)研究以及大灣區(qū)地區(qū)文化研究。就語料質量而言,本語料庫所收集的所有語料來自真實的漢英文本,例如博物館展品簡介、民俗文化館介紹、大灣區(qū)文化雙語新聞等等。為了保證漢英平行語料的關聯(lián)性,所有文本在語料清理的過程中,無法對齊為平行語料的部分被刪除,盡可能的保持了漢英語料的對應,所選擇的多模態(tài)內容與平行語料相關聯(lián),與平行語料互為補充,并導入語料庫。語料庫生成之后,用戶可以在搜索欄鍵入關鍵詞信息,得到漢英對應雙語表達、相關語境及相關圖片、音頻、視頻材料。例如,在搜索欄中鍵入“陳家祠”可得到對應包含該關鍵詞的漢英平行文本以及相應的圖片信息:

    中文文本:陳家祠是在廣州的一座祠堂。

    英文文本:Chen Clan Academy is an academic temple in Guangzhou.

    又如,在搜索欄中鍵入“醒獅”,其搜索結果為:

    中文文本:該皮膚形象也成為了“南海醒獅非遺推廣大使”。

    英文文本:At the same time,the skin image has become the "Nanhai Awakening Lion Intangible Cultural Heritage Promotion Ambassador".

    通過關鍵詞搜索,可以得到,“陳家祠”對應的英文譯文為“Chen Clan Academy”,“南海醒獅”的相關英文譯文為“Nanhai Awakening Lion”。同時,用戶可了解中英文所使用的語境以及簡單介紹或相關新聞。此外,圖片信息展示了陳家祠的外觀以及南海醒獅的場景,使用戶對陳家祠、南海醒獅有更直觀的了解。而嵌入的鏈接,則鏈接到到陳家祠、南海醒獅的相關中英文介紹,形成強大的信息互聯(lián),打破傳統(tǒng)語料庫單一的語言信息模式。

    四、結束語

    多模態(tài)語料庫以其多維度、多功能的特性,為語言工作者提供更為全面的體驗。而隨著粵港澳大灣區(qū)文化傳播與跨文化傳播的日益頻繁,粵港澳大灣區(qū)文化遺產漢英多模態(tài)語料庫的構建及探索的實踐意義更為凸顯?;浉郯拇鬄硡^(qū)文化遺產漢英語料庫為外語人才提供豐富的漢英雙語學習資料,充分利用好其優(yōu)勢,積極探索其在跨文化交際能力培養(yǎng)中的應用價值,為大灣區(qū)歷史傳承工作培養(yǎng)后備人才,從而更好地應對全球化發(fā)展。

    參考文獻:

    [1]Baker,Mona. "Corpus-based translation studies:The challenges that lie ahead." Benjamins Translation Library 18 (1996):175-186.

    [2]劉敬國,陶友蘭.語料庫翻譯研究的歷史與進展——兼評《語料庫翻譯研究:理論、發(fā)現(xiàn)和應用》[J].外國語(上海外國語大學學報),2006(02):66-71.

    [3]王克非.中國英漢平行語料庫的設計與研制[J].中國外語,2012,9(06):23-27

    [4]黃偉.多模態(tài)漢語中介語語料庫建設芻議[J].國際漢語教學研究,2015(03):60-66.

    [5]梁燕玲.多模態(tài)語料庫建設與外語教學——現(xiàn)狀與前瞻[J].昭通學院學報,2016,38(03):114-117+121.

    [6]顧曰國.北京地區(qū)現(xiàn)場即席話語語料庫的取樣與代表性問題[R]//中國社會科學院世界經濟研究中心.全球化與21世紀.北京:社會科學文獻出版社,2002:484-500

    基金來源:廣東白云學院2020 年度大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目“粵港澳大灣區(qū)文化遺產漢英語料庫(202010822137)”資助。

    作者簡介:

    劉文欣(1999,12—),女,漢族,廣東廣州人,本科學歷,廣東白云學院,英語專業(yè)教育。

    黃雪瑩(1999,6—),女,漢族,廣東廣州人,本科學歷,廣東白云學院,英語專業(yè)商務。

    梁曉欣(1999,11—),女,漢族,廣東江門人,本科學歷,廣東白云學院,英語專業(yè)教育。

    陳健樂(1995,12—),女,漢族,廣東深圳人,本科學歷,廣東白云學院,英語專業(yè)翻譯。

    黃梓深 (1997,3—),男,漢族,廣東河源人,本科在讀,廣東白云學院,英語專業(yè)翻譯。

    猜你喜歡
    多模態(tài)粵港澳大灣區(qū)語料庫
    《語料庫翻譯文體學》評介
    把課文的優(yōu)美表達存進語料庫
    “粵港澳大灣區(qū)”,即將崛起的世界級城市群
    “粵港澳大灣區(qū)”,即將崛起的世界級城市群
    網絡環(huán)境下大學英語多模態(tài)交互式閱讀教學模式研究
    戲劇之家(2016年22期)2016-11-30 18:20:43
    多模態(tài)理論視角下大學英語課堂的構建
    科教導刊(2016年26期)2016-11-15 19:54:13
    新媒體環(huán)境下多模態(tài)商務英語課堂教師角色定位
    基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
    語言與翻譯(2015年4期)2015-07-18 11:07:45
    語料庫語言學未來發(fā)展趨勢
    崇州市| 张家港市| 建宁县| 绿春县| 尚志市| 钟祥市| 赤壁市| 荥经县| 桑日县| 桓仁| 若羌县| 高清| 大竹县| 永德县| 临夏县| 会宁县| 彩票| 惠来县| 大渡口区| 余庆县| 慈利县| 玉山县| 左权县| 灵璧县| 会东县| 宕昌县| 南安市| 彩票| 独山县| 南华县| 元谋县| 原平市| 平远县| 禄丰县| 湖北省| 凤冈县| 和硕县| 班玛县| 麻江县| 淮安市| 延吉市|