• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中國瀕危語言有聲語檔數(shù)據(jù)規(guī)則

      2016-02-19 00:11:01范俊軍
      關(guān)鍵詞:錄音語料話語

      范俊軍

      (暨南大學(xué) 文學(xué)院,廣東 廣州 510632)

      ?

      中國瀕危語言有聲語檔數(shù)據(jù)規(guī)則

      范俊軍

      (暨南大學(xué) 文學(xué)院,廣東 廣州 510632)

      中國瀕危語言有聲語檔數(shù)據(jù)規(guī)則分五個(gè)部分:一、瀕危語言的語檔數(shù)據(jù)構(gòu)成;二、語檔數(shù)據(jù)文件格式;三、語檔音像數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn);四、語料采錄和數(shù)據(jù)處理工具;五、音像語料采錄環(huán)境和設(shè)備匹配建議。該規(guī)范適用于中國瀕危語言的記錄和建檔,也可作為中國語言田野調(diào)查記錄和語料處理的參考準(zhǔn)則。

      瀕危語言;語檔;數(shù)據(jù)規(guī)范

      瀕危語言有聲語檔是以音頻文件及其轉(zhuǎn)寫文件為數(shù)據(jù)主體的瀕危語言口語資料集。本文定義了瀕危語言語檔的數(shù)據(jù)構(gòu)成、語料數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、語料采錄的環(huán)境和設(shè)備匹配規(guī)范,適用于中國瀕危語言的記錄和建檔,也可作為中國語言田野調(diào)查記錄和語料處理的參考準(zhǔn)則。*本文內(nèi)容曾在“中國瀕危語言有聲資源采錄與立檔技術(shù)高級講習(xí)班”暨南二期(2014年)、暨南三期(2015年)上講解并征求學(xué)員意見,此次公開發(fā)表希望能更廣泛征求意見。技術(shù)部分承蒙廣東得勝電子有限公司周雨程和有關(guān)技術(shù)人員提出建議。在此一并致謝。

      一、瀕危語言的語檔數(shù)據(jù)構(gòu)成

      瀕危語言有聲語檔由媒體數(shù)據(jù)、轉(zhuǎn)寫數(shù)據(jù)、描寫數(shù)據(jù)、元數(shù)據(jù)等四類數(shù)據(jù)構(gòu)成。此外,也可包括多模態(tài)數(shù)據(jù)。媒體數(shù)據(jù)是以音頻文件、視頻文件、圖形文件記錄和存儲的語言音像資料。轉(zhuǎn)寫數(shù)據(jù)是音頻和視頻的同步轉(zhuǎn)寫標(biāo)注文本。描寫數(shù)據(jù)是描寫語言特點(diǎn)和相關(guān)知識的文字資料。元數(shù)據(jù)是標(biāo)識瀕危語言語檔資源的標(biāo)簽數(shù)據(jù)。多模態(tài)數(shù)據(jù)是對語音和言語行為多學(xué)科測定和分析而獲得的數(shù)據(jù)。

      每類數(shù)據(jù)設(shè)必備項(xiàng)和可選項(xiàng)。必備項(xiàng)是語檔的必備數(shù)據(jù)??蛇x項(xiàng)為非必需數(shù)據(jù),以“可選”注明。適用于特定語言的數(shù)據(jù)項(xiàng),加括號說明。

      (一)媒體數(shù)據(jù)

      媒體數(shù)據(jù)內(nèi)容項(xiàng)包括基本錄音資料和話語錄音資料。基本錄音主要是基本的字、詞、句發(fā)音錄音資料。話語錄音主要是瀕危語言社區(qū)日常生活中的個(gè)人口述和情景對話音像資料。這些音像資料應(yīng)適應(yīng)語言學(xué)習(xí)和語言恢復(fù)的需要。

      1. 基本錄音

      a. 聲母、韻母、聲調(diào)例字或例詞發(fā)音(適用于聲調(diào)語言)

      b. 元音、輔音例詞發(fā)音(適用于非聲調(diào)語言)c. 連讀變調(diào)例詞發(fā)音(適用于聲調(diào)語言)

      d. 重音、弱讀、元音和諧等重要語音特點(diǎn)例詞發(fā)音(適用于非聲調(diào)語言)

      e. 約2500個(gè)常用字讀音(適用于漢語方言)f. 約3000個(gè)常用詞讀音

      g. 約600個(gè)常用句讀音h. 約100個(gè)常用句型例句讀音

      i. 上述a~d全程錄音或全景攝像j. 上述a~d發(fā)音人面部攝像(可選)

      2. 話語錄音

      話語指自然口語,分為個(gè)人口述、對話、游戲娛樂話語、歌唱話語、表演話語、民俗宗教禮儀話語等六類體裁。話語體裁設(shè)必備體裁和可選體裁,必備體裁涵蓋瀕危語言現(xiàn)存主要口語形式,是語檔必需的話語體裁??蛇x體裁(如民歌、演唱等),在有的語言中可能不復(fù)存在,因而不作要求。每類體裁擬定若干話題。必備體裁每個(gè)話題錄音時(shí)長應(yīng)不少于20分鐘。

      (1)個(gè)人口述

      a. 介紹本地農(nóng)業(yè)生產(chǎn)和耕作知識經(jīng)驗(yàn)b. 介紹本地畜牧和狩獵知識經(jīng)驗(yàn)

      c. 介紹本地器具制作工藝和流程d. 介紹本地食品制作程序和方法

      e. 本地小集會或會議報(bào)告或發(fā)言f. 本地口傳歷史故事或口傳文學(xué)

      g. 本地社會生活近年發(fā)生的大事件h. 個(gè)人生活經(jīng)歷或親身經(jīng)歷的事件

      (2)對話

      a. 室內(nèi)座談、采訪或聊天b. 室外各種情景對話

      (3)游戲娛樂(可選)

      a. 童謠和游戲情景話語b. 謎語、玩笑

      (4)歌唱(可選)

      a. 獨(dú)唱b. 對唱、合唱或輪唱c. 歌舞

      (5)戲劇和表演(可選)

      (6)民俗宗教禮儀

      a. 節(jié)慶活動正式話語和自由言談b. 民俗和宗教儀式的俗話、套話

      c. 行話、暗語、秘密語(可選)d. 魔語、咒語、鬼語和其他神祗言語(可選)

      (二)轉(zhuǎn)寫數(shù)據(jù)

      轉(zhuǎn)寫瀕危語言錄音錄像資料所用到的文字符號,包括漢字、國際音標(biāo)、少數(shù)民族文字和其他符號。瀕危語言音像資料應(yīng)有國際音標(biāo)注音、中文翻譯和解釋說明,能夠確保夠永久閱讀和理解。轉(zhuǎn)寫數(shù)據(jù)包括基本錄音轉(zhuǎn)寫和話語錄音轉(zhuǎn)寫。

      1. 基本錄音轉(zhuǎn)寫

      (1)少數(shù)民族瀕危語言

      a. 聲母、韻母、聲調(diào)列表、例詞音標(biāo)注音、中文對譯、發(fā)音說明(適用于聲調(diào)語言)

      c. 元音和輔音列表、例詞音標(biāo)注音、發(fā)音說明(適用于非聲調(diào)語言)

      d. 其他重要語音特點(diǎn)列表和例詞

      e. 約3000個(gè)常用詞音標(biāo)注音、中文對譯、意譯、釋義

      f. 約600個(gè)日常用句音標(biāo)注音、中文逐詞對譯、中文意譯、語法標(biāo)記

      g. 約100個(gè)常用句型例句音標(biāo)注音、中文逐詞對譯、中文意譯、語法標(biāo)記

      h. 羅馬字母拼音方案(可選)

      i. 約3000個(gè)常用詞羅馬拼音轉(zhuǎn)寫或民族文字轉(zhuǎn)寫(可選)

      j. 約600個(gè)日常用句羅馬拼音轉(zhuǎn)寫或民族文字轉(zhuǎn)寫(可選)

      100例患者中94例患者均搶救成功,通過有效治療后好轉(zhuǎn)或痊愈出院,有效率占94.00%。其余6例患者通過綜合會診后緊急轉(zhuǎn)入上級醫(yī)院診治。

      k. 約100個(gè)常用句型例句羅馬拼音轉(zhuǎn)寫或民族文字轉(zhuǎn)寫(可選)

      (2)瀕危漢語方言

      a. 聲母、韻母、聲調(diào)列表、例字、音標(biāo)注音和發(fā)音說明

      b. 連讀變調(diào)例詞、音標(biāo)注音和變調(diào)規(guī)律描述

      c. 約2500個(gè)常用字的音標(biāo)注音

      d. 約3000個(gè)常用詞的方言字轉(zhuǎn)寫、音標(biāo)注音和某些必要的注釋說明,其中200個(gè)最常用詞的詳細(xì)釋義

      e. 約600個(gè)日常用句的音標(biāo)注音、方言字轉(zhuǎn)寫、普通話意譯

      f. 約100個(gè)常用句型例句的音標(biāo)注音、方言字轉(zhuǎn)寫、普通話意譯、語法標(biāo)注

      g. 羅馬字母拼音方案(可選)

      h. 約2500個(gè)常用字拼音注音(可選)

      i. 約3000個(gè)常用詞語拼音轉(zhuǎn)寫(可選)

      j. 常用詞用法例句(可選)

      2. 話語錄音轉(zhuǎn)寫

      (1)少數(shù)民族瀕危語言

      a. 音標(biāo)注音b. 普通話逐詞對譯

      c. 普通話逐句意譯d. 非言語聲音標(biāo)記

      e. 語法現(xiàn)象標(biāo)記f. 羅馬字母拼音轉(zhuǎn)寫或民族文字轉(zhuǎn)寫(可選)

      g. 地方通用語逐詞對譯*地方通用語常常是省內(nèi)通用的漢語方言。(可選)h. 地方通用語逐句意譯(可選)

      i. 言語行為或其他多模態(tài)標(biāo)記(可選)

      (2)瀕危漢語方言

      a. 方言字轉(zhuǎn)寫b. 音標(biāo)注音

      c. 普通話逐句翻譯d. 羅馬字母拼音轉(zhuǎn)寫(可選)

      e. 非言語聲音標(biāo)記f. 語法現(xiàn)象標(biāo)記

      g. 言語行為或其他多模態(tài)標(biāo)記(可選)

      (三)描寫數(shù)據(jù)

      對一種瀕危語言的描寫,應(yīng)包括基本狀況概述和語言特點(diǎn)描寫。

      1. 瀕危語言基本狀況概述

      (1)語言名稱

      a. 正名b. 別名c. ISO639-3標(biāo)準(zhǔn)代碼

      (2)語言系屬

      a. 語系b. 語族和語支

      (3)方言

      a. 方言土話分布(可選)b. 方言互通程度(可選)

      (4)縣內(nèi)人口

      a. 語言所在地全縣總?cè)丝赽. 各民族人口及鄉(xiāng)鎮(zhèn)分布

      c. 各語言或方言的鄉(xiāng)鎮(zhèn)分布及使用人口

      (5)鄉(xiāng)鎮(zhèn)和調(diào)查點(diǎn)人口

      a. 鄉(xiāng)鎮(zhèn)總?cè)丝?,各語言或方言人口及村組分布b. 調(diào)查點(diǎn)瀕危語言群體人口

      c. 調(diào)查點(diǎn)瀕危語言使用人口d. 調(diào)查點(diǎn)瀕危語言群體單語和雙語人口

      e. 瀕危語言境外分布狀況(可選)

      (6)語言地位和使用范圍

      a. 瀕危語言是否法定少數(shù)民族的語言b. 瀕危語言所在縣市的通用語言

      c. 瀕危語言所在鄉(xiāng)鎮(zhèn)的通用語言d. 瀕危語言族群內(nèi)部使用的語言

      e. 瀕危語言社區(qū)家庭使用的語言f. 與相鄰其他族群交流使用的語言

      (7)語言與民俗宗教

      a. 語言族群宗教信仰(可選)b. 宗教活動使用的語言(可選)

      c. 民俗活動使用的語言d. 法師道士等神職人員使用的語言

      (8)語言態(tài)度

      a. 積極/中性/消極b. 不同年齡、性別、職業(yè)和教育人群的語言態(tài)度

      (9)語言發(fā)展(可選)

      a. 鄉(xiāng)村中小幼教學(xué)語言和校園語言b. 中小幼語言課程

      c. 族群社區(qū)語言培訓(xùn)d. 語言學(xué)習(xí)出版物(含在線語言產(chǎn)品)

      e. 廣播電視語言節(jié)目

      (10)語言活力和瀕危等級

      a. 脆弱b. 瀕危c. 重度d. 極度e. 滅絕

      (11)語言能力

      a. 瀕危語言族群普通話能力及人口比例b. 瀕危語言族群漢語識字率

      c. 瀕危語言族群地方共通語能力及人口比例d. 瀕危語言有無文字

      (12)語言點(diǎn)的人文地理

      a. 瀕危語言分布地經(jīng)緯度b. 瀕危語言調(diào)查點(diǎn)與縣城和集鎮(zhèn)的距離

      c. 瀕危語言調(diào)查點(diǎn)的地形地貌d. 瀕危語言調(diào)查點(diǎn)與外界交通狀況

      e. 瀕危語言社區(qū)人口流動情況f. 衛(wèi)星地圖

      2. 瀕危語言特點(diǎn)描寫

      (1)瀕危漢語方言

      a. 音系表及語音特點(diǎn)b. 聲韻調(diào)配合表

      c. 同音字匯d. 詞匯表

      e. 構(gòu)詞法概述f. 詞類特點(diǎn)概述

      g. 句法特點(diǎn)概述

      (2)少數(shù)民族瀕危語言

      a. 音系表及語音特點(diǎn)b. 音節(jié)表c. 詞匯表

      d. 構(gòu)詞和形態(tài)概述e. 句法特點(diǎn)概述

      (四)元數(shù)據(jù)

      元數(shù)據(jù)設(shè)通用元數(shù)據(jù)和專用元數(shù)據(jù)。通用元數(shù)據(jù)標(biāo)識語檔整體,專用元數(shù)據(jù)標(biāo)識話語資料。

      1.通用元數(shù)據(jù)

      (1)項(xiàng)目名稱:語檔相關(guān)的基金項(xiàng)目、課題或資助計(jì)劃名稱。

      (2)語檔標(biāo)題:語檔名稱。

      (2)創(chuàng)建日期:創(chuàng)建語檔的日期,以年月日表示。

      (3)創(chuàng)建地點(diǎn)和日期:語檔創(chuàng)建的時(shí)間和地點(diǎn)范圍。

      (4)內(nèi)容描述:語檔數(shù)據(jù)資料內(nèi)容簡要描述,或語檔數(shù)據(jù)資料目錄。

      (5)創(chuàng)建人:創(chuàng)建語檔的主要責(zé)任人。

      (6)貢獻(xiàn)者:對創(chuàng)建語檔有貢獻(xiàn)的人員,包括發(fā)音人、說話人、唱歌人、表演人、采訪人、錄音人、攝像人、翻譯員、轉(zhuǎn)寫員、編校員等等??蓞⒄誒LAC角色詞匯。

      (7)文件格式:語檔數(shù)據(jù)資料的文件格式,包括音頻文件、視頻文件、轉(zhuǎn)寫文件和其他數(shù)字文件格式。

      (8)統(tǒng)一資源定位符:語檔存儲和讀取的網(wǎng)站地址。

      (9)元語言:用來描述瀕危語言的語言,一般使用中文。

      (10)對象語言:被記錄和立檔保存的瀕危語言。

      (11)語料來源:語檔資料數(shù)據(jù)的出處和采錄地點(diǎn)。

      (12)學(xué)科分類:語檔數(shù)據(jù)資料所屬的學(xué)科領(lǐng)域。通常用語言學(xué)術(shù)語表示。

      (13)版權(quán)信息:語檔數(shù)據(jù)資料的版權(quán)說明,包括作者、貢獻(xiàn)者、出版社、館藏者、數(shù)據(jù)服務(wù)商等。

      (14)使用權(quán)限:基于隱私、安全等對訪問使用瀕危語言語檔數(shù)據(jù)資料的限制規(guī)定。

      (15)介質(zhì):語檔數(shù)據(jù)的物理載體,如紙質(zhì)出版物、磁帶、光盤、存儲卡、硬盤等。

      (16)設(shè)備:采錄和處理語檔數(shù)據(jù)資料的器材,如:錄音機(jī)、攝像機(jī)、聲卡、麥克風(fēng)等。注明產(chǎn)品名稱、型號和語料采錄處理的相關(guān)參數(shù)設(shè)置。

      (17)軟件:創(chuàng)建和處理語檔數(shù)據(jù)資料的操作系統(tǒng)、軟件。如:音頻和視頻處理軟件,轉(zhuǎn)寫標(biāo)注軟件,字庫文件,數(shù)據(jù)轉(zhuǎn)換軟件等等。

      2.專用元數(shù)據(jù)

      (1)話題名稱:一個(gè)獨(dú)立完整的話語錄音或錄像文件的名稱。

      (2)背景介紹:話語事件的背景知識。

      (3)體裁:按(一)2.話語錄音所列6類體裁標(biāo)識。

      (4)交流方式:話語發(fā)生方式,如:座談、采訪、自由聊天、電話、網(wǎng)絡(luò)通話等等。

      (5)項(xiàng)目名稱:語檔數(shù)據(jù)采集的資助項(xiàng)目。

      (6)話語來源:話語資料的獲取途徑。如:實(shí)地采集或錄制,電話錄音或網(wǎng)絡(luò)下載,來自廣播電視節(jié)目,或已有出版物,轉(zhuǎn)錄和復(fù)制個(gè)人的收藏物。

      (7)說話人:話語錄音中的說話人姓名。為保護(hù)隱私,可用假名或代號。

      (8)語言:說話人的語言,即瀕危語言。

      (9)元語言:描寫和解釋話語錄音資料的語言,通常用中文。

      (10)日期和地點(diǎn):話語事件發(fā)生的時(shí)間和地點(diǎn)。

      (11)錄音文件:話語錄音文件名、時(shí)長、文件大小、錄音設(shè)備名稱和型號。

      (12)轉(zhuǎn)寫狀態(tài):錄音錄像文件的轉(zhuǎn)寫標(biāo)注信息。包括:

      a. 轉(zhuǎn)寫文件名

      b. 與媒體同步狀況:完全同步,部分同步,未同步c. 媒體音段的切分層次

      d. 轉(zhuǎn)寫標(biāo)注規(guī)則

      e. 轉(zhuǎn)寫精度等級:未轉(zhuǎn)寫,簡單轉(zhuǎn)寫,基本轉(zhuǎn)寫,復(fù)雜轉(zhuǎn)寫

      f. 轉(zhuǎn)寫軟件名稱及版本g. 轉(zhuǎn)寫文件在線瀏覽鏈接地址(可選)

      h. 轉(zhuǎn)寫文本的其他文件格式(可選)

      二、語檔數(shù)據(jù)文件格式

      語檔數(shù)據(jù)文件格式設(shè)必備格式和可選格式。必備格式是創(chuàng)建數(shù)據(jù)資料的原始格式,可選格式是數(shù)據(jù)轉(zhuǎn)換格式。

      (一)媒體文件格式

      1.音頻文件

      a. wavb. mp3(可選)

      2. 視頻文件

      a. mts(可選)b. avi(可選)c. mov(可選)d. mp4(可選)

      3. 圖像文件

      a. jpegb. tiff(可選)c. png(可選)

      (二)轉(zhuǎn)寫文件格式

      1.通用格式

      a. xmlb. Unicode txt(可選)c. html(可選)

      2. 專用軟件格式

      a. Elan格式eafb. EXMAraLDA格式exb

      c. Praat格式textGrid(可選)d. Transcriber格式trs(可選)

      (三)文本文件格式

      a. docb. Unicode txtc. pdf

      三、語檔音像數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)

      語檔音像資料的質(zhì)量評估標(biāo)準(zhǔn)分主觀評價(jià)標(biāo)準(zhǔn)和客觀評價(jià)標(biāo)準(zhǔn)。主觀評價(jià)根據(jù)人耳聽辨判斷。音質(zhì)評估對象主要是語音。參照國標(biāo)GB9375-88《收音機(jī)、錄音機(jī)聽音試驗(yàn)》五級主觀評價(jià)標(biāo)準(zhǔn)。客觀評價(jià)設(shè)定音頻、視頻錄制的相關(guān)技術(shù)參數(shù)要求。

      (一)主觀評價(jià)標(biāo)準(zhǔn)

      1. 人聲主觀評價(jià)

      一級:優(yōu)。不察覺失真,錄制的人聲(即重建語音)和原始人聲之間只有很細(xì)微差異,若不對照聽比,覺察不出這種差異。

      二級:良。剛察覺失真,但不討厭,重建語音的畸變或失真不明顯,不注意聽則感覺不到。

      三級:中。察覺失真,稍微討厭,重建語音有較明顯可感知的畸變或失真,但語音自然度和清晰度仍好,且聽起來沒有疲勞感。

      四級:差。討厭但不令人反感,重建語音有較強(qiáng)畸變或失真,聽起來有疲勞感。

      五級:劣。極其討厭,令人反感,重建語音質(zhì)量極差,聽覺無法忍受。

      語言田野調(diào)查中室內(nèi)錄制的語音音質(zhì)應(yīng)達(dá)到二級,室外應(yīng)達(dá)到三級。

      2. 噪聲主觀評判

      除了評估人聲語音外,還需要評估背景噪聲。噪聲評估也可參照上述國標(biāo)分為五級:

      一級:優(yōu)。錄音中聽不到持續(xù)“嘶嘶”低頻噪聲,沒有偶發(fā)的短暫噪聲人聲交疊現(xiàn)象。

      二級:良。有少量微弱的低頻噪聲,如交流電源和微風(fēng)造成的“嘶嘶”聲,但對人聲聽辨幾乎無干擾。

      三級:中。有較明顯可感知的持續(xù)低噪聲,對人聲有輕微或少量遮蓋,聽覺略顯疲勞,但可以接受。

      四級:差。有明顯可感知的噪聲,人聲不時(shí)被噪聲遮蓋,聽起來有疲勞感。

      五級:劣。有大量明顯可感知的噪聲,遮蓋了大部分人聲,聽覺無法忍受。

      (二)客觀評價(jià)標(biāo)準(zhǔn)

      1. 音頻參數(shù)

      背景噪聲:小于-50dB

      發(fā)音說話聲:大于-18dB,小于-4dB

      采樣率:大于或等于44kHz

      采樣精度:16位或24位

      聲道:單聲道。

      2. 視頻采錄

      分辨率:存檔片不低于1920x1080像素,網(wǎng)絡(luò)上傳片不低于1080×720像素。

      幀率:25fps/29.97fps(fps:每秒幀數(shù))。

      碼率:存檔版本不低于8Mbps,網(wǎng)絡(luò)發(fā)布版本不低于2Mbps

      效果:白平衡正確,無明顯偏色(特效除外),無明顯色差。圖像不過亮、不過暗。人、物移動時(shí)無拖影耀光。全片圖像同步性能穩(wěn)定,無失步現(xiàn)象;圖像無抖動跳躍,色彩無突變。人像臉部無重影、虛焦,單色背景與人像分明。無其它圖像質(zhì)量問題。

      信噪比:不低于55dB,無明顯雜波。

      3. 圖片

      分辨率:不低于1024×768,高清標(biāo)準(zhǔn)。

      四、語料采錄和數(shù)據(jù)處理工具

      工具指瀕危語言音像資料采錄軟件和數(shù)據(jù)處理軟件。軟件設(shè)指定軟件和可選軟件,指定軟件是創(chuàng)建和處理數(shù)據(jù)資料的必用工具,可選軟件是臨時(shí)替代工具和數(shù)據(jù)轉(zhuǎn)換工具。

      (1)錄音軟件

      a. SonicFieldb. Audacityc. byly(可選)

      d. Praat(可選)e. Soundforge(可選)

      (2)話語轉(zhuǎn)寫軟件

      a. ELANb. EXAMARaLDAPartitur-editorc. Anvil(可選)

      d. FOLKER(可選)

      (3)多模態(tài)分析軟件software of multimodal

      a. Anvilb. Praatc. SFS(可選)

      d. Sound analyzer(可選)e. 其他(可選)

      (4)音頻處理軟件

      a. Audacityb. Adobe audition(可選)c. Soundforge(可選)

      d. Cubase(可選)

      (5)視頻處理軟件

      a. Sony Vegas prob. EDIUS(可選)

      c. Adobe Premiere(可選)d. Final Cut(可選)

      五、音像語料采錄環(huán)境和設(shè)備匹配

      采錄瀕危語言音像語料,應(yīng)根據(jù)語料類別確定錄音環(huán)境和匹配錄音設(shè)備。錄音環(huán)境分室內(nèi)和室外,室內(nèi)環(huán)境適合采錄字詞句基本音像語料,室外環(huán)境主要采錄自然話語。錄音設(shè)備有麥克風(fēng)、聲卡、錄音機(jī)、攝像機(jī)等。

      (一)錄音環(huán)境

      I類錄音環(huán)境。安靜的室內(nèi)環(huán)境。典型情況是:室內(nèi)無噪聲,無電磁波干擾,無外界噪聲傳入,隔音墻面,消聲板或地毯地面。面積大約15m2。這類場所有:專業(yè)錄音室(棚),廣播電視臺播音室,演播室。

      II類錄音環(huán)境。較安靜的室內(nèi)環(huán)境。外面偶爾有噪聲傳入。典型情況是:內(nèi)墻為絨布或皮革等軟質(zhì)裝修,鋪有地毯,面積約15m2。室外不臨公路、街市、工廠、工地、娛樂廳、變壓器、電訊基站、廣播電視發(fā)射塔等。這類場所有:城鎮(zhèn)的高中檔賓館客房、小會議室,政府機(jī)構(gòu)的小會議室。

      III類錄音環(huán)境。普通的室內(nèi)環(huán)境。外界有持續(xù)低噪聲和間歇強(qiáng)噪聲傳入。硬質(zhì)光滑內(nèi)墻,水泥、瓷磚或木板地面。室外不臨街市、公路、溪流、工廠、工地、娛樂廳、高壓變電器、移動電訊基站和廣播電視發(fā)射塔。這類場所有:鄉(xiāng)村民宅、公館、祠堂、普通旅館。光滑硬質(zhì)墻面和地面,可在說話人左側(cè)、右側(cè)、背面圍掛布簾,地上鋪設(shè)墊布,消除聲音反射,減少室內(nèi)和腿腳挪動噪聲。

      IV類錄音環(huán)境。戶外活動和勞作場所。有各種不可避免的持續(xù)噪聲。說話人位置相對固定或不停走動。

      (二)語料種類

      不同發(fā)音和說話狀態(tài)下產(chǎn)生的言語聲音樣本。瀕危語言的有聲語料包括單字錄音、詞匯錄音、句子錄音、話語錄音等四大類。具體數(shù)據(jù)項(xiàng)見本文第一部分“瀕危語言的語檔數(shù)據(jù)構(gòu)成”。

      (三)設(shè)備匹配

      錄音設(shè)備有錄音機(jī)、麥克風(fēng)、聲卡等。麥克風(fēng)分為槍式、頭戴式、領(lǐng)夾式、手握式等形式。錄音機(jī)分臺式、便攜式和微型。應(yīng)根據(jù)所要采錄的語料種類選擇錄音場所,匹配相應(yīng)的錄音器材。設(shè)備應(yīng)選用品牌產(chǎn)品。麥克風(fēng)品牌如AdioTechnica(鐵三角)、Sennheiser(森海塞爾)、Shure(舒爾)、Lewitt(利威特)、得勝(Takstar)等。數(shù)字錄音機(jī)品牌如ZOOM、Sony。錄音聲卡品牌如M-audio、Mbox、Tascam、Prosonusaudiobox等。

      1.I類環(huán)境設(shè)備匹配

      (1)方案:專業(yè)錄音話筒+專業(yè)錄音聲卡+臺式或筆記本電腦+專業(yè)監(jiān)聽耳機(jī)+錄音軟件

      (2)采錄語料:漢語方言聲韻調(diào)例字、單字,少數(shù)民族語言音系詞,詞匯和短語,日常用句,語法例句,個(gè)人講述,三人以下座談。

      2. II類環(huán)境錄音設(shè)備匹配

      (1)方案

      a. 麥克風(fēng)+(聲卡)+筆記本電腦+監(jiān)聽耳機(jī)+錄音軟件

      b. 頭戴麥克風(fēng)+聲卡+筆記本電腦+監(jiān)聽耳機(jī)+錄音軟件

      (2)采錄語料

      方言聲韻調(diào)例字、單字,少數(shù)民族語言音系詞,詞匯和短語,日常用句,語法例句,個(gè)人長篇講述,三人以下座談,室內(nèi)自由聊天、言談;室內(nèi)電話或手機(jī)通話。

      3. III類環(huán)境錄音設(shè)備匹配

      (1)方案

      a. 頭戴式麥克風(fēng)+聲卡+筆記本電腦+監(jiān)聽耳機(jī)+錄音軟件

      b. 槍式麥克風(fēng)+數(shù)字錄音機(jī)c. 頭戴式麥克風(fēng)+錄音機(jī)

      (2)采錄語料

      詞匯和短語,日常用句,語法例句,個(gè)人講述,室內(nèi)對話,室內(nèi)電話或手機(jī)通話,工藝制作人言談。

      4. IV類環(huán)境錄音設(shè)備匹配

      (1)方案

      a. 槍式麥克風(fēng)+錄音機(jī)(適用于說話人位置相對固定的場合)

      b. 頭戴式麥克風(fēng)+錄音機(jī)(適用于走動和勞動的說話人)

      c. 攝像機(jī)+槍式麥克風(fēng)+監(jiān)聽耳機(jī)(適用于場景和人聲一起錄制)

      d. 頭戴/領(lǐng)夾式無線話筒+發(fā)射機(jī)+接收機(jī)+聲卡+錄音機(jī)(適用于多人活動場合)

      (2)采錄語料

      戶外各種情景對話、演唱、演說等活動。包括:自由聚集聊天、自由聚會;村民會議發(fā)言;民俗儀式;游戲;婚姻、喪葬、生育或宗教、造屋、商貿(mào)集市等儀式和場景;宴席;生產(chǎn)勞動情景;生產(chǎn)勞動、工藝制作介紹;群體演唱、競技活動。

      5. 品牌產(chǎn)品目錄(部分)

      Audio Technica 2035鐵三角大振膜電容話筒

      Lewitt DGT 650 USB利威特專業(yè)錄音麥克風(fēng)

      Takstar SGC-568得勝采訪話筒

      Shure beta 53舒爾頭戴式話筒

      Audio Technica鐵三角頭戴話筒

      TS-8807A UHF得勝無線麥克風(fēng)系統(tǒng)

      ZOOM H4n便攜式數(shù)字錄音機(jī)

      ZOOM H6便攜式數(shù)字錄音機(jī)

      Takstar PRO 80得勝專業(yè)監(jiān)聽耳機(jī)

      ProsonusAudioBox 22VSL USB2.0專業(yè)錄音聲卡

      Canon XF100佳能攝像機(jī)

      Takstar SGC-598得勝攝像機(jī)話筒

      3米~6米卡儂線,話筒支架、攝像機(jī)支架。

      (四)錄音環(huán)境觀測和噪聲處理建議

      1. 室外周邊環(huán)境噪聲源觀察

      (1)是否臨近公路、街市。

      (2)是否有建筑工地。

      (3)是否有歌舞娛樂場所。

      (4)是否有工廠。

      (5)是否有廚房、鍋爐房、洗衣房。

      (6)是否有變壓器或廣電通訊發(fā)射站。

      (7)是否有家禽牲畜。

      2. 測定室內(nèi)回聲和噪聲

      (1)(關(guān)門窗、雙擊掌,是否聽到回聲,回聲大小。

      (2)(關(guān)閉空調(diào)、冰箱、風(fēng)扇、排氣扇、電視、路由器、日光燈等室內(nèi)電器。

      (3)(開啟錄音機(jī)內(nèi)置話筒,將輸入電平增益調(diào)至最大,在安靜狀態(tài)下錄音采樣,同時(shí)戴耳機(jī)監(jiān)聽噪聲狀況;再將增益降至60%~80%,進(jìn)行二次采樣和監(jiān)聽。

      (4)(打開電腦,連接麥克風(fēng)和聲卡,用Audacity軟件查看噪聲等級。專業(yè)錄音室噪聲小于-60dB,較好室內(nèi)噪聲一般應(yīng)小于-50dB。發(fā)音人和說話人言語聲一般不超過0dB,以12dB左右合適。

      (5)(在光滑地面鋪上墊布,在光滑墻壁掛上布簾,減少聲音反射。

      (6)(正式錄音時(shí),使用遙控器操作錄音機(jī),避免錄入按鍵聲。

      (責(zé)任編輯戴正責(zé)任校對戴正)

      Data Standards of Audio-visual Documents of Endangered Languages in China

      Fan Junjun

      (College of Literal Arts,Jinan University, Guangzhou, Guangdong, 510632)

      There are five parts in the draft of The Data Standards of Audio-visual Documents of Endangered Languages in China: 1.Data structure of language documents of endangered languages; 2.File formats of language documents; 3. Quality standards of audio-visual data of language archives;4. Language documents collecting and recording, and data processing tools; 5. Environment for audio-visual data collecting and recording, and recommendation of equipment. These standards work for the recording and archiving of endangered languages in China, and can also be a referential norm for language fieldwork and corpus processing in China.

      endangered languages; language documents; data standards

      1001-5140(2016)03-0053-09

      2016-03-20

      國家社科基金重點(diǎn)項(xiàng)目“中國瀕危語言有聲語檔建設(shè)的理論規(guī)范、實(shí)踐規(guī)程和技術(shù)準(zhǔn)則研究”(項(xiàng)目編號:12AYY002)

      范俊軍(1963—),男,湖南桂陽縣人,暨南大學(xué)文學(xué)院教授、博士生導(dǎo)師,主要研究瀕危語言。

      ABC

      A

      猜你喜歡
      錄音語料話語
      Listen and Paint, etc.
      現(xiàn)代美術(shù)批評及其話語表達(dá)
      Funny Phonics
      Colorful Seasons多彩四季
      A New Term
      基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
      華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
      《苗防備覽》中的湘西語料
      國內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
      話語新聞
      浙江人大(2014年6期)2014-03-20 16:20:34
      荆门市| 乐至县| 普安县| 赤壁市| 浮山县| 赣州市| 邵武市| 溆浦县| 乌兰察布市| 亚东县| 宿迁市| 晋州市| 西华县| 商南县| 长岛县| 临沂市| 鲁甸县| 康平县| 习水县| 万全县| 周宁县| 高青县| 江山市| 社会| 北安市| 乐陵市| 镇远县| 清镇市| 嘉义市| 宜川县| 泽普县| 延安市| 肃南| 民勤县| 垫江县| 文昌市| 安阳市| 涞水县| 慈溪市| 安新县| 广昌县|