• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    對(duì)外漢語教學(xué)領(lǐng)域話題語料庫(kù)的研究與構(gòu)建

    2015-04-12 11:30:52胡韌奮朱琦楊麗姣
    中文信息學(xué)報(bào) 2015年6期
    關(guān)鍵詞:文段語料語料庫(kù)

    胡韌奮,朱琦,楊麗姣

    (北京師范大學(xué)中文信息處理研究所,北京100875)

    1 引言

    話題是文本內(nèi)容的體現(xiàn),也是銜接語言和文化的重要橋梁。在對(duì)外漢語教材中,課文通常圍繞一個(gè)話題展開,語言技能和文化知識(shí)以該話題為語言環(huán)境進(jìn)行組織和呈現(xiàn),從而達(dá)到教學(xué)目的。關(guān)于話題在漢語教學(xué)中的重要性,朱志平等[1]在對(duì)548種對(duì)外漢語教材進(jìn)行調(diào)研后提出,話題是教學(xué)內(nèi)容設(shè)計(jì)思想的集中體現(xiàn)。李亞麗[2]指出,話題的選擇是課文編排的重要內(nèi)容之一,直接關(guān)系到學(xué)生綜合語言運(yùn)用能力的培養(yǎng)。課文話題的選擇不但決定著常用詞語的選擇取向,而且影響著語法結(jié)構(gòu)、功能項(xiàng)目及文化項(xiàng)目的融入等。

    國(guó)家漢辦出版的《國(guó)際漢語教學(xué)通用課程大綱》[3]給出了《漢語教學(xué)話題及內(nèi)容建議表》,該表列有以下22類話題,是教材編寫及課堂教學(xué)中話題選擇與編排的重要參考:

    個(gè)人信息、情感與態(tài)度、社會(huì)交往、日常生活、學(xué)校生活、家庭生活、文化娛樂、節(jié)日活動(dòng)、身心健康、習(xí)俗與禁忌、旅游與交通、語言與文化、價(jià)值觀念、文學(xué)與藝術(shù)、政治、歷史與地理、科學(xué)與技術(shù)、全球與環(huán)境、計(jì)劃與未來、熱門話題、教育、植物與動(dòng)物、自然景觀

    為了幫助教材編寫者和漢語教師更好地把握話題設(shè)計(jì),蘇新春等[4]對(duì)部分教材中的話題分布情況進(jìn)行了調(diào)研和統(tǒng)計(jì),余千華[5]、羅洋天[6]、李欣蓓[7]等則從學(xué)習(xí)者出發(fā),通過問卷和訪談?wù){(diào)查學(xué)習(xí)者的話題興趣及其與教材課文的匹配情況,進(jìn)一步豐富了話題選擇與編排的參考依據(jù)。然而,現(xiàn)有研究也存在以下局限因素:(1)研究范圍限于特定級(jí)別(如漢語中級(jí)水平)或特定類型(如口語)教材,未能提供全面的參考和參照;(2)研究中,話題的選取和分類體系缺乏大規(guī)模語料的驗(yàn)證,具有一定的主觀性。

    為了避免主觀因素影響,向不同等級(jí)、不同類型的教材編寫及漢語教學(xué)提供話題參考依據(jù),本文基于大規(guī)模教材語料庫(kù)開展話題類型研究,對(duì)197冊(cè)經(jīng)典對(duì)外漢語教材中的課文進(jìn)行調(diào)研和標(biāo)注,以此為依據(jù)制訂較為綜合和全面的話題標(biāo)注框架,該框架設(shè)置三級(jí)節(jié)點(diǎn),包含四個(gè)一級(jí)話題、23個(gè)二級(jí)話題和246個(gè)三級(jí)話題。標(biāo)注工作面向教材語料庫(kù)中的5 457個(gè)文段展開,每個(gè)文段依次被標(biāo)注一級(jí)話題、二級(jí)話題和三級(jí)話題,例如,《跟我學(xué)漢語》第二冊(cè)第七課《給你一張電影票》第一個(gè)文段(如下)在語料庫(kù)中被標(biāo)注為“一級(jí)話題:日常生活;二級(jí)話題:娛樂休閑;三級(jí)話題:看電影”。

    安妮:小雨,你想不想看電影?

    小雨:什么電影?

    安妮:《花木蘭》。

    小雨:太好了!今天的還是明天的?

    安妮:今天下午4:30的。劉老師給我兩張票,我給你一張。

    小雨:今天不行,我沒空兒。

    安妮:你要干什么?

    小雨:我要做海報(bào)。你給馬明吧!他是個(gè)電影迷。

    安妮:好吧。再見!

    經(jīng)過人工標(biāo)注及校對(duì),我們構(gòu)建了一個(gè)面向漢語教學(xué)的綜合話題信息語料庫(kù),以期為不同水平、不同類型的漢語教學(xué)及教材編寫提供參考。語料庫(kù)中的文段除了標(biāo)注詳細(xì)的話題信息外,還標(biāo)注了該文段包含的語法點(diǎn)及HSK詞語等級(jí)信息,以幫助漢語教師及教材編寫者更好地選擇和使用庫(kù)中資源。

    2 語料來源

    語料的選擇對(duì)于面向漢語教學(xué)的話題語料庫(kù)建設(shè)而言十分重要,因?yàn)檎Z料既是標(biāo)注的對(duì)象,又是標(biāo)注體系(即話題類別體系)制訂的參考和依據(jù)。從漢語教學(xué)的實(shí)際需求出發(fā),我們將經(jīng)典對(duì)外漢語教材文本作為主要研究對(duì)象。首先從漢語國(guó)際教育動(dòng)態(tài)語料庫(kù)①漢語國(guó)際教育動(dòng)態(tài)語料庫(kù)由北京師范大學(xué)中文信息處理研究所和漢語文化學(xué)院共同建設(shè),主要收錄對(duì)外漢語教學(xué)領(lǐng)域經(jīng)典教材和新HSK樣卷文本語料,并提供多層次的語言信息標(biāo)注,目前規(guī)模約14萬句,240余萬詞次。中提取了122 458句對(duì)外漢語教材語料,共計(jì)5 457個(gè)文段及其來源教材、單元、課文名稱等信息。

    所選取語料來源于197冊(cè)經(jīng)典對(duì)外漢語教材。動(dòng)態(tài)語料庫(kù)在采集教材時(shí)充分考慮了教材類型、適用水平、出版年代、影響因子等屬性特征[8]。話題信息的標(biāo)注結(jié)果將融入漢語國(guó)際教育動(dòng)態(tài)語料庫(kù),作為其中一項(xiàng)功能供用戶檢索和使用。

    3 話題分類研究及標(biāo)注框架設(shè)計(jì)

    為了制訂科學(xué)合理的話題標(biāo)注框架,除了《國(guó)際漢語教學(xué)通用課程大綱》中給出的《漢語教學(xué)話題及內(nèi)容建議表》外,我們也對(duì)汲傳波[9]、蘇新春[4]、李亞麗[2]、劉華[10]等人關(guān)于話題分類的研究進(jìn)行了細(xì)致考察,認(rèn)為框架設(shè)計(jì)應(yīng)充分考慮話題的層次性、內(nèi)容的涵蓋面、類與類之間的區(qū)別度、每個(gè)節(jié)點(diǎn)的重要程度與顆粒度等因素。基于以上考量,我們?cè)O(shè)計(jì)了一個(gè)包含三個(gè)層次的話題節(jié)點(diǎn)表作為標(biāo)注框架,參見表1。

    表1 面向?qū)ν鉂h語教學(xué)的話題節(jié)點(diǎn)表

    續(xù)表

    除了語言技能(如詞匯、語法)的傳授外,語言在生活中的運(yùn)用也是教學(xué)中的重要關(guān)注點(diǎn),故而,話題的選擇應(yīng)盡量貼近生活。一級(jí)話題的設(shè)計(jì)從物質(zhì)生活和精神生活兩個(gè)維度出發(fā),物質(zhì)生活可落實(shí)到“日常生活”和“社會(huì)生活”這兩個(gè)節(jié)點(diǎn),精神生活在教學(xué)中主要表現(xiàn)為文化元素的融入,故而我們?cè)O(shè)置了“文化生活”節(jié)點(diǎn)。此外,在漢語學(xué)習(xí)的初級(jí)階段,大部分內(nèi)容是關(guān)于人物、事物基本信息的討論,故設(shè)置“基本信息”這一節(jié)點(diǎn)。四個(gè)一級(jí)話題按順序排列為:基本信息、日常生活、社會(huì)生活、文化生活,這體現(xiàn)了與學(xué)習(xí)者個(gè)人關(guān)聯(lián)的遠(yuǎn)近和內(nèi)容層次的提升。

    二級(jí)話題的設(shè)計(jì)上,“基本信息”所包含內(nèi)容較為明確,可分為“人物”和“事物”兩個(gè)二級(jí)節(jié)點(diǎn)。“日常生活”和“社會(huì)生活”下設(shè)二級(jí)節(jié)點(diǎn)的設(shè)計(jì)則主要基于教材中常出現(xiàn)的單元主題,并綜合考慮學(xué)習(xí)者興趣和話題的頻度信息?!拔幕睢钡恼归_方式較為特殊,我們參考楊麗姣[11]提出的漢語教學(xué)文化項(xiàng)目整理思路,借鑒美國(guó)《21世紀(jì)外語學(xué)習(xí)標(biāo)準(zhǔn)》[12]在文化教學(xué)上提出的“文化三角觀”來對(duì)文化生活進(jìn)行歸類。所謂“文化三角觀”,即文化包括一個(gè)社會(huì)所有的哲學(xué)觀念、行為習(xí)俗和社會(huì)產(chǎn)物(有形的和無形的)。故而,我們?cè)凇拔幕睢痹掝}下設(shè)“文化習(xí)俗”、“文化產(chǎn)物”和“文化觀念”節(jié)點(diǎn),并結(jié)合教材中的課文選題增加了“語言文化”、“文藝作品”、“地理與歷史”、“自然與科學(xué)”節(jié)點(diǎn)。此外,我們注意到跨文化交際是漢語教學(xué)中的一項(xiàng)重要內(nèi)容,也是每個(gè)二語學(xué)習(xí)者在學(xué)習(xí)和使用漢語時(shí)都會(huì)面臨的問題,因而增設(shè)“多元文化”節(jié)點(diǎn)作為一項(xiàng)二級(jí)話題。

    三級(jí)話題在大綱及現(xiàn)有的話題分類研究成果的基礎(chǔ)上,結(jié)合對(duì)不同類型教材課文的調(diào)研結(jié)果給出,并由專家作補(bǔ)充和完善。值得一提的是,話題節(jié)點(diǎn)表需要經(jīng)過大規(guī)模實(shí)際語料的檢驗(yàn),因而我們通過語料標(biāo)注來對(duì)已有節(jié)點(diǎn)表進(jìn)行修訂。首先,對(duì)語料庫(kù)中的兩萬句教材語料進(jìn)行試標(biāo)注,并對(duì)節(jié)點(diǎn)表進(jìn)行初步修訂,一級(jí)話題和二級(jí)話題的框架在這一階段基本得到確定。隨后,在后期十萬句人工標(biāo)注中不斷收集標(biāo)注者的反饋建議,進(jìn)一步修訂節(jié)點(diǎn)表中的三級(jí)話題,從而得到表1中的分類結(jié)果。標(biāo)注修訂的方法綜合考慮了節(jié)點(diǎn)的頻次、顆粒度等信息。

    4 話題信息的標(biāo)注實(shí)踐

    為了保證話題信息的標(biāo)注質(zhì)量,我們組織了九名語言學(xué)及相關(guān)專業(yè)本科生、研究生參與人工標(biāo)注,標(biāo)注人員經(jīng)培訓(xùn)及試標(biāo)注檢驗(yàn)合格后,進(jìn)入正式標(biāo)注。標(biāo)注結(jié)果經(jīng)人工校對(duì),存疑處由專家討論確認(rèn)。如上文所述,話題節(jié)點(diǎn)表在標(biāo)注中得到不斷地檢驗(yàn)和修訂,具體工作分為以下九個(gè)步驟:

    步驟1 切分文段邊界,確認(rèn)話題標(biāo)注單位①語料庫(kù)中的語料以句子為單位存儲(chǔ),并按照其在教材中出現(xiàn)的順序排列,在為文段標(biāo)注話題之前,首先要做段落邊界切分,確認(rèn)一個(gè)文段的起始句和結(jié)束句。;

    步驟2 為文段標(biāo)注一級(jí)話題和二級(jí)話題;

    步驟3 收集一級(jí)、二級(jí)話題的標(biāo)注反饋并調(diào)整節(jié)點(diǎn)表;

    步驟4 根據(jù)更新節(jié)點(diǎn)表修訂標(biāo)注結(jié)果;

    步驟5 為文段標(biāo)注三級(jí)話題;

    步驟6 收集三級(jí)話題的標(biāo)注反饋并調(diào)整節(jié)點(diǎn)表;

    步驟7 根據(jù)更新節(jié)點(diǎn)表修訂標(biāo)注結(jié)果;

    步驟8 人工校對(duì)所有標(biāo)注信息;

    步驟9 確認(rèn)最終話題節(jié)點(diǎn)表和標(biāo)注結(jié)果。

    在步驟2和步驟5的話題信息標(biāo)注中,標(biāo)注者需注意對(duì)以下幾種特殊情況的處理。

    (1)文段涉及多個(gè)話題:如果認(rèn)為文段涉及兩個(gè)話題(包括二級(jí)話題和三級(jí)話題)的情況,可為該段落標(biāo)注兩個(gè)話題,如果認(rèn)為文段涉及三個(gè)及以上話題,則為該段落標(biāo)注最為凸顯的兩個(gè)話題。

    (2)文段內(nèi)部涉及話題跳轉(zhuǎn):如果文段前后圍繞不同話題展開,比如《中文起步》第一冊(cè)第19課《中國(guó)城》這篇課文為一段長(zhǎng)對(duì)話,甲乙兩人首先討論了怎么去中國(guó)城(“日常生活-出行”),然后討論了在中國(guó)城一家飯館點(diǎn)餐吃飯的經(jīng)歷(“日常生活-餐飲”),在標(biāo)注時(shí)需要給出段落原話題、跳轉(zhuǎn)新話題及跳轉(zhuǎn)句的語料編號(hào)。

    (3)文段內(nèi)容無法按照已有的話題節(jié)點(diǎn)表進(jìn)行標(biāo)注:標(biāo)注者在備注欄給出問題描述及對(duì)話題節(jié)點(diǎn)進(jìn)行增加或修改的建議。對(duì)于其他標(biāo)注者無法確定的話題標(biāo)注信息,也可在備注欄給出問題描述及相關(guān)建議。

    (4)三種情況暫不做標(biāo)注:①課文內(nèi)容為簡(jiǎn)單句子,不構(gòu)成文段(多見于入門階段的漢語教材);②課文為簡(jiǎn)單的1-3輪短對(duì)話,不圍繞特定話題展開,而強(qiáng)調(diào)交際功能(比如問好、道歉等,同樣多見于入門階段的漢語教材),將在語料庫(kù)的交際功能項(xiàng)目中得到標(biāo)注;③課文內(nèi)容時(shí)代性、政治性較強(qiáng)(例如以知青、承包責(zé)任制等為背景的短文或小說),不適于作為當(dāng)前漢語教學(xué)及教材編寫參考。

    在步驟3和步驟6中,我們收集并總結(jié)標(biāo)注者在備注欄給出的問題及建議,并側(cè)重對(duì)涉及以上四種特殊情況的文段進(jìn)行考察,通過專家討論確定標(biāo)注方案,以對(duì)已有話題節(jié)點(diǎn)表進(jìn)行調(diào)整。

    標(biāo)注結(jié)果存儲(chǔ)為XML格式,以下為一個(gè)文段的話題標(biāo)注示例:

    5 標(biāo)注數(shù)據(jù)分析及應(yīng)用

    按照上述步驟,我們對(duì)從語料庫(kù)中采集的5 457個(gè)文段進(jìn)行了人工標(biāo)注及校對(duì),共有5 168個(gè)文段被標(biāo)注話題信息(涉及兩個(gè)話題的文段在此計(jì)為兩段)。話題信息的標(biāo)注結(jié)果可以直接反映當(dāng)前漢語教學(xué)中的內(nèi)容選擇和關(guān)注傾向,接下來,將對(duì)一級(jí)話題、二級(jí)話題和三級(jí)話題的標(biāo)注數(shù)據(jù)分別進(jìn)行統(tǒng)計(jì)分析,挖掘其中規(guī)律,并進(jìn)一步探討標(biāo)注結(jié)果在漢語教學(xué)中的應(yīng)用問題。

    5.1 話題信息數(shù)據(jù)分析

    一級(jí)話題共有“基本信息”、“日常生活”、“社會(huì)生活”和“文化生活”四個(gè)類別,其分布情況如圖1所示。從標(biāo)注結(jié)果來看,共有402個(gè)文段被標(biāo)注為“基本信息”,數(shù)量與其他三個(gè)類別相比較少,主要是由于“基本信息”話題通常僅出現(xiàn)于初級(jí)階段的漢語教材中。“日常生活”話題頻度最高,達(dá)1 759,因?yàn)樗c初級(jí)、中級(jí)漢語教學(xué)均息息相關(guān),是這兩個(gè)階段的主體學(xué)習(xí)內(nèi)容。“社會(huì)生活”話題涉及中級(jí)、高級(jí)漢語及商務(wù)、職場(chǎng)漢語等專門領(lǐng)域的漢語教學(xué),屬于該話題的文段數(shù)量?jī)H次于“日常生活”,為1 671。“文化生活”多出現(xiàn)于中級(jí)、高級(jí)漢語教材,該話題下的文段數(shù)量為1 336。

    圖1 一級(jí)話題數(shù)量分布情況

    話題節(jié)點(diǎn)表中設(shè)有二級(jí)話題23個(gè),其中,“日常生活”和“文化生活”各包含八個(gè)二級(jí)話題,“社會(huì)生活”下有五個(gè)二級(jí)話題,“基本信息”包含兩個(gè)二級(jí)話題,這些二級(jí)話題在語料庫(kù)中的數(shù)量分布情況如圖2所示,其頻度從高到低排列為:

    社會(huì)現(xiàn)象、人際交往、出行、運(yùn)動(dòng)與健康、學(xué)習(xí)與成長(zhǎng)、地理與歷史、日常事務(wù)、語言文化、人物、工作職場(chǎng)、經(jīng)濟(jì)生活、家庭與社區(qū)、購(gòu)物、娛樂休閑、餐飲、事物、多元文化、文藝作品、自然與科學(xué)、文化習(xí)俗、文化觀念、文化產(chǎn)物、時(shí)尚

    圖2 二級(jí)話題數(shù)量分布情況

    “社會(huì)現(xiàn)象”是最為高頻的二級(jí)節(jié)點(diǎn),這體現(xiàn)了教材對(duì)時(shí)事熱點(diǎn)問題的關(guān)注,有助于學(xué)生在習(xí)得詞匯、語法等語言知識(shí)的同時(shí),對(duì)中國(guó)的社會(huì)現(xiàn)實(shí)背景有所了解。同時(shí),可以注意到,除了“語言文化”外,“文化生活”下屬的與中國(guó)文化直接相關(guān)的二級(jí)話題如“文化習(xí)俗”、“文化產(chǎn)物”、“文化觀念”等在數(shù)量上并不占優(yōu)勢(shì),說明當(dāng)前的漢語教材在文化項(xiàng)目的整理和呈現(xiàn)方面尚有待進(jìn)一步挖掘和提升。

    二級(jí)話題是對(duì)課文內(nèi)容較為抽象的概括,近似單元主題,三級(jí)話題則較為具體,直接與課文(文段)內(nèi)容對(duì)應(yīng)。經(jīng)過對(duì)教學(xué)內(nèi)容的調(diào)研總結(jié)及語料標(biāo)注實(shí)踐,話題節(jié)點(diǎn)表在第三層給出了246個(gè)三級(jí)話題。我們對(duì)語料庫(kù)中的三級(jí)話題標(biāo)注結(jié)果進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)頻度≥50的節(jié)點(diǎn)有25個(gè),從高到低排列如下:

    買東西、經(jīng)濟(jì)發(fā)展與社會(huì)變化、人物信息、旅游、看病、歷史人文故事、文學(xué)作品、交通方式、友誼、漢語漢字、戀愛擇偶、文化比較、節(jié)日、方位、人生哲理、家人與朋友、問路、親子關(guān)系、異文化印象、成語/俗語故事、點(diǎn)餐、景觀/景點(diǎn)、運(yùn)動(dòng)、親情、天氣與氣候

    頻度最高的節(jié)點(diǎn)是“買東西”,共有172個(gè)文段被標(biāo)注該話題,這與學(xué)習(xí)者的實(shí)際使用需求密切相關(guān)。其他頻度較高的三級(jí)節(jié)點(diǎn)分布在不同的二級(jí)話題及一級(jí)話題下,反映了教材中較為典型的課文內(nèi)容。

    5.2 話題語料庫(kù)的實(shí)踐應(yīng)用

    通過較為系統(tǒng)的調(diào)查研究及大規(guī)模的語料標(biāo)注實(shí)踐,我們構(gòu)建了一個(gè)漢語教學(xué)話題節(jié)點(diǎn)表和標(biāo)注了三級(jí)話題信息的語料庫(kù)。資源的開發(fā)需要面向?qū)嶋H的需求,為了更好地服務(wù)于對(duì)外漢語教學(xué)及相關(guān)研究工作,我們對(duì)該領(lǐng)域的用戶需求進(jìn)行分析,并據(jù)此設(shè)計(jì)了基于話題信息的綜合查詢功能。

    話題標(biāo)注對(duì)象雖然是語段,但漢語教學(xué)卻覆蓋了語言的各個(gè)層次:詞匯、短語、句子、段落等。因此,我們?cè)谠O(shè)計(jì)話題信息的查詢功能時(shí),需要充分考慮不同層次的語言教學(xué)要點(diǎn)。楊寄洲[13]在研究教材編寫問題時(shí)指出:課文編寫的最大難點(diǎn)除了生詞量的控制和常用詞出現(xiàn)的比例問題以外,還有個(gè)語法點(diǎn)與課文內(nèi)容相協(xié)調(diào)相匹配的問題。由此可見,對(duì)于教材語料來說,語段話題與其包含的詞匯、語法點(diǎn)之間的關(guān)聯(lián)也是漢語教學(xué)的關(guān)注點(diǎn)之一?;谝陨峡紤],我們從漢語國(guó)際教育動(dòng)態(tài)語料庫(kù)語法點(diǎn)標(biāo)注項(xiàng)目[14]中提取了句子包含的語法點(diǎn)信息,并自主開發(fā)HSK詞語等級(jí)計(jì)算工具,以自動(dòng)計(jì)算每個(gè)文段所包含的各等級(jí)HSK詞語數(shù)量及比例。國(guó)家漢辦發(fā)布的《新漢語水平考試大綱》[15]中列出了HSK一級(jí)至六級(jí)詞匯大綱,我們分別讀取HSK一級(jí)至六級(jí)詞匯表,并基于語料分詞和詞性標(biāo)注結(jié)果進(jìn)行詞語匹配。計(jì)算各等級(jí)詞語比例時(shí)不計(jì)標(biāo)點(diǎn)、英文、數(shù)字和姓名。

    通過語法點(diǎn)信息的抽取和詞匯等級(jí)計(jì)算,我們將語段的詞匯、語法點(diǎn)和話題信息進(jìn)行了整合,實(shí)現(xiàn)了以話題為基礎(chǔ)、輻射詞匯和語法層面的資源建設(shè)。因而,用戶在進(jìn)入話題信息在線查詢系統(tǒng)后,可以在話題列表中點(diǎn)擊一個(gè)節(jié)點(diǎn),以獲取被標(biāo)注該話題的語段,并得到語段的詳細(xì)信息,包括語段內(nèi)容、語段來源、語法點(diǎn)、新HSK詞語等級(jí)信息等,基本體例如圖3所示。

    圖3 話題查詢界面示例

    6 總結(jié)

    話題是教材文本內(nèi)容的體現(xiàn),也與教學(xué)中的其他語言知識(shí)密切相關(guān)。本文基于大規(guī)模教材語料庫(kù)研究教學(xué)話題分類體系,設(shè)計(jì)了一個(gè)包含四個(gè)一級(jí)話題、23個(gè)二級(jí)話題和246個(gè)三級(jí)話題的三層話題框架,并據(jù)此對(duì)197冊(cè)經(jīng)典對(duì)外漢語教材中的5 457個(gè)文段進(jìn)行了人工標(biāo)注及校對(duì)。為了更好地服務(wù)于漢語教學(xué)及相關(guān)研究工作,我們從用戶實(shí)際需求出發(fā),抽取并計(jì)算了文段的語法點(diǎn)信息和新HSK詞語等級(jí)信息,以期為漢語教學(xué)及研究提供較為全面的話題信息參考。

    基于上述研究工作,我們希望從以下幾個(gè)方面做出嘗試,以改進(jìn)和提升現(xiàn)有的資源,并探索新的應(yīng)用空間:第一,將話題語料庫(kù)及綜合查詢功能部署上線,廣泛地收集用戶使用意見,以修訂和改善現(xiàn)有的資源及功能設(shè)計(jì);第二,隨著時(shí)代的發(fā)展和國(guó)力的增強(qiáng),對(duì)外漢語教學(xué)的內(nèi)容需求仍在不斷地增長(zhǎng)和變化,在現(xiàn)有的標(biāo)注框架及資源的基礎(chǔ)上,我們需要持續(xù)關(guān)注社會(huì)現(xiàn)象、流行時(shí)尚等開放話題,選擇合適的新聞媒體報(bào)道作為補(bǔ)充語料,同時(shí),需側(cè)重對(duì)文化項(xiàng)目的整理和挖掘,除了中國(guó)傳統(tǒng)文化外,中國(guó)的現(xiàn)當(dāng)代文化、其他國(guó)家的文化也應(yīng)作為節(jié)點(diǎn)設(shè)計(jì)和資源補(bǔ)充的重點(diǎn)關(guān)注對(duì)象;第三,開展話題關(guān)鍵詞提取、話題自動(dòng)識(shí)別等技術(shù)的研究,以豐富現(xiàn)有資源庫(kù)建設(shè)維度,拓展資源的應(yīng)用空間。

    [1] 朱志平,江麗莉,馬思宇.1998-2008十年對(duì)外漢語教材述評(píng)[J].北京師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2008,05:131-137.

    [2] 李亞麗.對(duì)外漢語中級(jí)教材課文話題分析[J].大眾文藝,2012,03:263-264.

    [3] 孔子學(xué)院總部,國(guó)家漢辦.國(guó)際漢語教學(xué)通用課程大綱[S].北京:北京語言大學(xué)出版社,2014.

    [4] 蘇新春,唐師瑤,周娟等.話題分析模塊及七套海外漢語教材的話題分析[J].江西科技師范學(xué)院學(xué)報(bào),2011,06:58-65.

    [5] 余千華,樊葳葳,陳琴.漢語學(xué)習(xí)者話題興趣及其與對(duì)外漢語教材話題匹配情況調(diào)查研究[J].語言教學(xué)與研究,2012,01:23-29.

    [6] 羅洋天.《匈牙利漢語課本》課文話題設(shè)計(jì)[J].云南師范大學(xué)學(xué)報(bào)(對(duì)外漢語教學(xué)與研究版),2013,06:58-68.

    [7] 李欣蓓.從對(duì)外漢語教材話題的選擇看編寫者文化態(tài)度——基于三部對(duì)外漢語教材話題的分析[J].云南師范大學(xué)學(xué)報(bào)(對(duì)外漢語教學(xué)與研究版),2014,05:25-32.

    [8] 楊麗姣,肖航.面向語義搜索的語料庫(kù)語境信息標(biāo)注研究[J].語言文字應(yīng)用,2015,01:107-116.

    [9] 汲傳波.對(duì)外漢語口語教材的話題選擇[J].云南師范大學(xué)學(xué)報(bào),2005,06:14-18.

    [10] 劉華,方沁.漢語教學(xué)用話題庫(kù)及話題分類影視資源庫(kù)構(gòu)建[J].世界漢語教學(xué),2014,03:378-392.

    [11] 楊麗姣.文化項(xiàng)目的歸類與國(guó)別化漢語教材的話題選點(diǎn)[C].廈門大學(xué)漢語國(guó)際推廣南方基地.2009年漢語國(guó)別化教材國(guó)際學(xué)術(shù)研討會(huì)論文集.廈門:廈門大學(xué)漢語國(guó)際推廣南方基地.2009:6.

    [12] American Council on the Teaching of Foreign Languages.Standards for Foreign Language Learning:Preparing for the 21st Century[S].Kansas,USA:Allen Press Inc,1999.

    [13] 楊寄洲.編寫初級(jí)漢語教材的幾個(gè)問題[J].語言教學(xué)與研究,2003,04:52-57.

    [14] 譚曉平,楊麗姣,陳穎.基于語料庫(kù)的漢語語言點(diǎn)標(biāo)注研究[J].曲靖師范學(xué)院學(xué)報(bào),2015,02:103-108.

    [15] 孔子學(xué)院總部.新漢語水平考試大綱(HSK一級(jí)至六級(jí))[S].北京:商務(wù)印書館,2009.

    猜你喜歡
    文段語料語料庫(kù)
    《桃花源記》閱讀
    《說文段注》之“同意”及其理論意義
    《語料庫(kù)翻譯文體學(xué)》評(píng)介
    單一·連貫·完整
    把課文的優(yōu)美表達(dá)存進(jìn)語料庫(kù)
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    基于JAVAEE的維吾爾中介語語料庫(kù)開發(fā)與實(shí)現(xiàn)
    語言與翻譯(2015年4期)2015-07-18 11:07:45
    《苗防備覽》中的湘西語料
    國(guó)內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
    光泽县| 江津市| 荔波县| 三门县| 盱眙县| 黄冈市| 绥中县| 天峨县| 原平市| 万全县| 普兰店市| 如东县| 赤峰市| 天峨县| 旬阳县| 长宁县| 康定县| 安国市| 闽清县| 黑水县| 麦盖提县| 遂平县| 南宁市| 义乌市| 罗源县| 虞城县| 湖南省| 赤峰市| 革吉县| 湖口县| 昌乐县| 海宁市| 寿光市| 自治县| 双流县| 珲春市| 翁牛特旗| 红河县| 华池县| 托克托县| 信阳市|