• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于偏誤反饋的對韓漢語詞匯教學(xué)信息庫建設(shè)①

      2013-10-13 07:39:30焉德才胡曉清
      華文教學(xué)與研究 2013年2期
      關(guān)鍵詞:信息庫偏誤大綱

      焉德才,胡曉清

      (1.2.魯東大學(xué)國際交流學(xué)院,山東,煙臺264025)

      0.引言

      “語料庫的建設(shè)和語料庫語言學(xué)的崛起,是語言學(xué)戰(zhàn)略目標(biāo)轉(zhuǎn)移的一個重要標(biāo)志?!保T志偉,2011:13)語料庫語言學(xué) “包含兩方面的內(nèi)容,一是對自然語料進(jìn)行加工、標(biāo)注,二是用已經(jīng)標(biāo)注好的語料進(jìn)行語言研究和應(yīng)用開發(fā)?!?(黃昌寧、李涓子,2007:3)當(dāng)語料庫建設(shè)的 “加工”和 “標(biāo)注”工作基本完成以后,從哪些方面開發(fā)其應(yīng)用價值就成為語料庫建設(shè)者關(guān)注的重要問題。一般認(rèn)為,漢語中介語語料庫的應(yīng)用開發(fā)價值主要體現(xiàn)在 “語言研究”、 “教材編寫”和 “詞典編纂”三個大的方面。除此以外,如果我們能從服務(wù)課堂詞匯教學(xué)的角度去思考漢語中介語語料庫的應(yīng)用價值,就不難發(fā)現(xiàn),還有一項重要的應(yīng)用開發(fā)工程需要提上議事日程,那就是:基于偏誤反饋的漢語詞匯教學(xué)信息庫的建設(shè)。

      眾所周知,語料庫語言學(xué)的優(yōu)勢在于:它在很大程度上避免了傳統(tǒng)語言研究 “重例解,輕覆蓋”、 “重直覺內(nèi)省,輕數(shù)據(jù)量化”的不足,引領(lǐng)著語言研究向 “實證化”和 “精細(xì)化”的方向發(fā)展。迄今為止,對于 “實證化”這一概念,學(xué)界基本沒有異議。但對于 “精細(xì)化”這一概念,學(xué)界的理解卻未必一致。有人從語言研究精細(xì)化的角度認(rèn)為, “語料庫研究在本質(zhì)上是描寫性的” (何安平,2004:127),因此,語料庫建設(shè)的目的之一是培養(yǎng)精細(xì)化和實證性的科研能力;從語料標(biāo)注的精細(xì)化角度看,我們會要求語料庫信息的標(biāo)注盡可能的詳盡,比如從標(biāo)點、字、詞、句、篇等五個層面進(jìn)行偏誤標(biāo)注,每個層面都有一系列復(fù)雜的標(biāo)注代碼。除此以外,還有一種精細(xì)化,我們卻常常忽略,那就是從服務(wù)于課堂教學(xué)的應(yīng)用角度,給HSK大綱詞②本文涉及的HSK大綱詞是北語1992年編寫的 《漢語水平詞匯與漢字等級大綱》中的8822個詞。附加上一些來自于偏誤反饋的教學(xué)提示信息,這些信息可以組織成一個詞匯教學(xué)的自主應(yīng)用平臺,為教師備課和教學(xué)發(fā)揮重要的參考作用。這樣的信息平臺,其內(nèi)容起碼應(yīng)該包括:每個大綱詞的語音、漢字、語法、廣義語義的編碼難度等級的標(biāo)注信息,認(rèn)知難度的評價信息,常見遷移情況的描寫信息,典型偏誤的展示信息等。目前,這些來自于偏誤反饋的、服務(wù)于教學(xué)的中介語描寫信息尚未完全納入到漢語語料庫建設(shè)的視野。

      “基于語料庫的語言描述的應(yīng)用是語料庫進(jìn)化中最具有創(chuàng)新性的一項活動?!?(黃昌寧、李涓子,2007:20)下面,本文將從服務(wù)課堂詞匯教學(xué)的應(yīng)用角度對 “基于偏誤反饋的對韓漢語詞匯教學(xué)信息庫”的建設(shè)談一下初步的設(shè)想。

      1.基于偏誤反饋的對韓漢語詞匯教學(xué)信息庫的建設(shè)設(shè)想

      1.1 對韓漢語詞匯教學(xué)信息庫的建庫原則

      1.1.1 服務(wù)教學(xué)

      不同的語料庫,其主要功能也不盡相同。就二語中介語語料庫來說,有的偏重 “研究導(dǎo)向” (Research guidance), 有的偏重 “教學(xué)導(dǎo)向” (Teaching guidance)??傮w來講,國內(nèi)已知的漢語中介語語料庫大部分偏重 “研究導(dǎo)向”。 “基于偏誤反饋的對韓漢語詞匯教學(xué)信息庫”則是一種偏重 “教學(xué)導(dǎo)向”的信息庫。它主要服務(wù)于從事對韓漢語教學(xué)的國內(nèi)外廣大教師,向他們提供詞匯教學(xué)上的參考。我們的設(shè)想是通過這個開放型的信息庫,讓每個從事對韓漢語教學(xué)的教師都能夠?qū)n國學(xué)生習(xí)得漢語HSK大綱詞的認(rèn)知難度、常見遷移情況以及典型的偏誤形態(tài)有一個比較全面和充分的了解,可以隨查隨用。

      1.1.2 聚焦偏誤

      本信息庫的關(guān)注焦點是中介語中的偏誤因素。偏誤語料主要是以漢語HSK大綱詞為搜索項,從已經(jīng)建成的 “韓國留學(xué)生漢語中介語語料庫”中提取偏誤句,建成子庫,為漢語詞匯教學(xué)信息庫的建設(shè)提供數(shù)據(jù)和信息支持。

      1.1.3 語料真實

      基于偏誤反饋的對韓漢語詞匯教學(xué)信息庫所搜集的偏誤語料必須是真實自然的,所有偏誤形式都必須是在學(xué)生的書面作業(yè)或者口頭話語中出現(xiàn)的真實句子。這一點無需贅言。

      1.1.4 開放共享

      信息庫的 “開放”包含兩個層面的內(nèi)容:一是信息庫的建設(shè)是一個長期的開放過程,二是信息庫會不斷吸收學(xué)界最新的研究成果,隨時修正和完善相關(guān)內(nèi)容;信息庫的 “共享”是指所有從事對韓漢語教學(xué)的國內(nèi)外教師,均可通過固定網(wǎng)址憑密碼登錄這個信息庫免費查詢所需要的信息和語料。語料庫的 “開放”和“共享”是未來的大趨勢,崔希亮和張寶林先生 (2011)所倡導(dǎo)的 “全球漢語學(xué)習(xí)者語料庫”就預(yù)示著這一趨勢即將到來。

      1.2 對韓漢語詞匯教學(xué)信息庫的內(nèi)容和框架

      1.2.1 對韓漢語詞匯教學(xué)信息庫的內(nèi)容構(gòu)成

      對韓漢語詞匯教學(xué)信息庫直接面向查詢者的內(nèi)容分五大部分,即:基礎(chǔ)附碼、編碼度標(biāo)注、認(rèn)知難度評價、遷移情況描寫、典型偏誤展示。在這五部分中, “典型偏誤展示”是最關(guān)鍵的內(nèi)容,因為其他內(nèi)容的撰寫大多來源于對這些偏誤信息的分析和歸納。

      具體來說, “基礎(chǔ)附碼”分 “詞性附碼”、“詞法附碼”和 “詞調(diào)附碼”三種。比如 “半天”一詞的詞性附碼是 “n” (名詞),詞法附碼是 “pz” (偏正結(jié)構(gòu)), 詞調(diào)附碼是 “41”(四聲+一聲); “編碼度標(biāo)注”是對每個詞從語音、漢字、語法和廣義語義四個維度標(biāo)注認(rèn)知難度系數(shù); “認(rèn)知難度評價”是對詞匯的“認(rèn)知難度”做出解釋和評價; “遷移情況描寫”是在對偏誤語料綜合分析的基礎(chǔ)上對詞的正負(fù)遷移情況做出描寫和說明; “典型偏誤展示”呈現(xiàn)的是搜集到的典型偏誤例句。面向查詢者的信息庫簡化界面如圖1:

      圖1 :對韓漢語詞匯教學(xué)信息庫界面

      查詢者進(jìn)入此界面,只要輸入查詢的單詞,然后點擊搜索鍵,就會進(jìn)入該詞的頁面瀏覽需要的信息。同樣,輸入不同的基礎(chǔ)附碼,也可以檢索出具有相同屬性的某一類詞。比如,輸入詞性附碼 “l(fā)hc”,就可以將大綱詞中所有離合詞檢索出來,輸入詞法附碼 “pz”,就可以將所有偏正結(jié)構(gòu)的單詞檢索出來,輸入詞調(diào)附碼 “32”,就可以將所有聲調(diào)是 “三聲+二聲”的單詞檢索出來。單擊檢索出來的詞,就可以直接進(jìn)入該詞的信息頁面。所有檢索出來的信息,既可以用于課堂教學(xué),也可以用于大規(guī)模的集合研究。

      1.2.2 對韓漢語詞匯教學(xué)信息庫的主體框架

      對韓漢語詞匯教學(xué)信息庫的主體框架包括“語料處理系統(tǒng)”、 “數(shù)據(jù)庫”和 “用戶檢索系統(tǒng)”三個部分。 “語料處理系統(tǒng)”中存儲的是從 “韓國留學(xué)生漢語中介語語料庫”中提取的所有偏誤語料以及韓國留學(xué)生漢語音頻語料的偏誤信息; “數(shù)據(jù)庫”中包括HSK大綱詞、大綱詞基礎(chǔ)附碼集、大綱詞詞頻統(tǒng)計、大綱詞漢字偏誤統(tǒng)計、大綱詞認(rèn)知編碼度集等各種信息;“用戶檢索系統(tǒng)”的內(nèi)容分基礎(chǔ)附碼、編碼度標(biāo)注、認(rèn)知難度評價、遷移情況描寫、典型偏誤展示五大部分。信息庫的主體框架,如圖2:

      圖2 :信息庫的主體框架

      2.需要處理的其他問題

      2.1 語料收集的形式

      本信息庫語料收集的形式,主要是學(xué)生的書面作業(yè),包括造句作業(yè)、語段作業(yè)和作文,除此以外,還有一部分音頻語料。書面語料和音頻語料互補可以使語料的收集更加全面。比如,韓國學(xué)生受母語口語 “”語調(diào)上挑的影響,其漢語對應(yīng)詞 “再見”的發(fā)音也出現(xiàn)了上挑現(xiàn)象。再比如,我們在考察初級階段韓國學(xué)生 “因為”的遷移情況時,本來發(fā)現(xiàn) “為”字有典型的母語負(fù)遷移現(xiàn)象發(fā)生,即韓國學(xué)生在讀漢語 “為”的發(fā)音時,常發(fā)成類似 “雨衣” (“雨衣”二字快速連讀)的音,這是可以預(yù)測到的。但是我們從學(xué)生的音頻語料中居然發(fā)現(xiàn)了連讀變異的情況。 “因為”這個詞,有的學(xué)生讀成了 “in+ [nu+ei]” 的音 ([nu+ei]快速連讀),這完全是由韓國語母語發(fā)音的連讀習(xí)慣造成的。以上兩種現(xiàn)象,在常規(guī)的語音對比中很難被發(fā)現(xiàn)。類似現(xiàn)象都需要在信息庫中加以提示和說明。

      英國應(yīng)用語言學(xué)家Corder曾經(jīng)將學(xué)習(xí)者偏誤分為 “前系統(tǒng)偏誤” (presystematic errors)、“系統(tǒng)偏誤” (systematic errors)和 “后系統(tǒng)偏誤” (postsystematic errors)三種類型 (王建勤,2011:41)。這種分類缺乏操作性,但有其 “心理現(xiàn)實性”。在語料收集的過程中,我們也確實能感覺到不同階段語料在質(zhì)量上的差異。一般來說,初級上半學(xué)期的偏誤語料基本上是屬于 “前系統(tǒng)偏誤”,有人認(rèn)為這一時期的偏誤語料的研究價值不大,所以收錄的積極性不高。我們收錄的原因有二:一是基于偏誤研究本身的需要,二是基于縱向研究的考慮。比如以下音頻語料:

      (1)老師,字小,我不看。 (老師,字太小了,我看不清楚。)

      (2)他常常幫忙我,他真好人。 (他常常幫助我,他真是個好人/他真好。)

      (3)他很學(xué)習(xí)努力,所以他很好成績。(他學(xué)習(xí)很努力,所以成績很好。)

      (4)旅游以后,我太病了。 (旅游回來以后,我得了一場大?。也〉煤軈柡?。)

      以上的語料就比較有價值,我們可以從中更細(xì)致、更直觀地觀察到學(xué)生漢語習(xí)得的某些歷時特點,也有利于我們更全面地認(rèn)識漢語中介語這一特殊的語言系統(tǒng)。

      2.2 偏誤句的判定及偏誤焦點的確定

      偏誤句的判定是建設(shè)對韓漢語詞匯教學(xué)信息庫過程中不得不面對的一個現(xiàn)實問題。比如以下幾個造句偏誤語料:

      (5)我Λ看書。 (想、要、愛、常常、喜歡)

      (6)我Λ和媽媽去商店買東西。 (想、要、每天、常常、喜歡)

      (7)昨天,我去市里買了Λ衣服。 (一件)

      (8)我想聽說課的老師很聰明。 (覺得)(9)你今天為什么打扮得Λ漂亮? (這么)

      以上五個句子,如果有特定的上下文語境,基本上都能成立。但如果只是這樣孤立地出現(xiàn),語義的自足性不充分,就很可能被判為偏誤句。至于究竟如何處理這一問題,見仁見智。我們的原則是 “階段側(cè)重、從嚴(yán)把握”。

      另外,在處理語料的過程中,偏誤焦點的確定也是一個比較棘手的問題。比如上文例句(6),偏誤焦點究竟是哪些詞,就很難做出準(zhǔn)確的判斷。再比如以下例句:

      (10)a.以前他很壞了,3年以后,他變成非常好人。

      b.以前他很壞Λ,3年以后,他卻變成 了 一個 非常好 的 人。

      c.以前他很壞Λ,3年以后,他變成了非常好的人。

      嚴(yán)格來講,例句 (10)a起碼有5個偏誤焦點,分別是: “了1”誤加、 “了1”遺漏、副詞 “卻”遺漏、數(shù)量詞 “一個”遺漏、結(jié)構(gòu)助詞 “的”遺漏。在常規(guī)操作時,一般會將這個句子分別編入 “了”、 “卻”、 “一”、“個”、 “的”五個詞的偏誤語料中??墒沁@么做,標(biāo)準(zhǔn)似乎過于嚴(yán)格,操作起來也比較繁瑣,因此不如根據(jù) (10)c句確定為3個偏誤焦點,即 “了1” 誤加、 “了1” 遺漏和 “的”遺漏。這樣, (10)a句就只需納入 “了”和“的”這兩個詞的偏誤用例就可以了。當(dāng)然,在研究的過程中,還需要本著實事求是的態(tài)度,具體問題具體分析。

      2.3 如何處理語言形式的回避問題

      在信息庫的建設(shè)過程中,我們也發(fā)現(xiàn),有些語言形式會被學(xué)生回避。語言形式的回避問題是第二語言習(xí)得過程中普遍存在的現(xiàn)象,它的產(chǎn)生跟語言形式實用度、詞匯的教材復(fù)現(xiàn)率、個體表達(dá)的語體風(fēng)格和學(xué)習(xí)者的心理狀態(tài)等因素都有直接關(guān)系。比如以下副詞:

      很 太 真 最 更 挺 極了 非常特別 有點兒

      好 夠 多么 十分 極其 格外 分外更加 越發(fā) 尤其

      語料顯示,在這20個副詞中,前10個詞的偏誤語料非常多,而后10個詞,不只偏誤語料極少,甚至在學(xué)生的語篇作業(yè)中都很難見到這些詞。為解決這一語料失衡的問題,我們通常的做法是布置作業(yè)讓學(xué)生用目標(biāo)詞造一些語義自足的單句,或者讓他們用給出的單詞或語言結(jié)構(gòu)去進(jìn)行語段或篇章表達(dá)。通過這樣的方式,語料分布的失衡問題 (稀疏)可以得到一定程度的緩解。

      2.4 影響認(rèn)知編碼度標(biāo)注的相關(guān)因素

      在對韓漢語詞匯教學(xué)信息庫的建設(shè)過程中, “編碼度標(biāo)注”是一個比較重要的內(nèi)容。這里的 “編碼度”是一種衡量韓國學(xué)生認(rèn)知漢語詞匯難易程度的量化指標(biāo)。對漢語大綱詞進(jìn)行編碼度的標(biāo)注,有助于對韓漢語教師比較直觀地了解韓國學(xué)生學(xué)習(xí)漢語詞匯的難點,以便采取針對性的教學(xué)方法和教學(xué)策略,實現(xiàn)教學(xué)效果的最大化。

      漢語詞匯編碼度的標(biāo)注,可以簡單概括為“四維五級”。 “四維”是指編碼度的標(biāo)注分“語音”、 “漢字”、 “語法” 和 “廣義語義”四個維度; “五級”是指學(xué)生認(rèn)知漢語詞匯的五個難度等級,認(rèn)知難度最高的詞標(biāo)為5,最低的標(biāo)為1,其他的根據(jù)偏誤率、詞頻等指標(biāo)信息分別標(biāo)為2級、3級和4級,各級都有相應(yīng)的級差標(biāo)準(zhǔn)。需要指出的是,這里的難度等級主要是指韓國學(xué)生學(xué)習(xí)漢語詞匯動態(tài)過程中起點時的相對靜態(tài)的難度評價系數(shù),它既包含預(yù)測的信息,比如語音,也包含基于偏誤反饋的信息,比如語法。

      具體來說,語音編碼度的確定,需要跟韓國語的語音進(jìn)行比照,找出難音的偏誤規(guī)律,同時要兼顧聲調(diào)難點、語流音變、音頻語料的反饋信息等。比如,發(fā)音方面, “ü、ue、f、p、 b、 zh、 ch、 sh、 r、 z、 c、 s” 等 是難音 ;聲調(diào)方面,漢語的 “三聲 + 二聲”、 “三聲 +三聲”和 “四聲+四聲”、 “二聲 +二聲”等四類雙音節(jié)詞的聲調(diào)以及 “一” “不”的變調(diào)對韓國人來說是最難的,這些難音難調(diào)會導(dǎo)致詞匯的語音認(rèn)知難度系數(shù)高。相反, “不得不、不得已、新郎、不滿”等詞的韓語發(fā)音跟漢語差不多,有正遷移因素,語音的認(rèn)知難度系數(shù)就低。

      漢字編碼度的確定起碼要考慮如下幾方面的因素:漢字筆畫數(shù) (一、繁)、漢字結(jié)構(gòu)的復(fù)雜度 (舊、翻)、與其他漢字的相似度(愛、受)、簡繁體因素 (韓、韓)、漢韓字體筆畫相似度 (呂、)、漢字偏誤的數(shù)量等。

      語法編碼度的確定起碼要綜合考慮如下幾方面的因素:這個詞能否納入 “介賓 +謂詞”框架 (對…感興趣、為…操心)、是否是語法詞 (了、的、反而、還有、隨著)、是否屬于高難認(rèn)知的副詞 (就、才、都、還、再、又)、是否是離合詞 (見面、聊天)、是否常以高難的特殊句式呈現(xiàn) (把字句、被字句、得字補語句、存現(xiàn)句、主謂謂語句)等等,當(dāng)然這些最終也要參考語法偏誤的數(shù)量才能確定。

      廣義語義編碼度的標(biāo)注起碼要考慮如下幾方面的因素:是否是漢字詞 (不滿、新郎)、語義實用度 (非常、極其)、語義差異 (經(jīng)歷、經(jīng)驗)、語義負(fù)遷移 (朝、對、向、沖)、語體差異 (勤奮、勤勉)、詞彩差異 (造成、快樂)、文化義差異 (白手、黃色)以及語義偏誤的數(shù)量等。

      3.結(jié)語

      本文從服務(wù)課堂詞匯教學(xué)的應(yīng)用角度,闡述了 “基于偏誤反饋的對韓漢語詞匯教學(xué)信息庫”的建設(shè)設(shè)想。我們認(rèn)為:首先,漢語中介語語料庫若想跟課堂教學(xué)實現(xiàn)更緊密的對接與融合, “基于偏誤反饋的漢語詞匯教學(xué)信息庫”的建設(shè)需要提上議事日程;其次,對韓漢語詞匯教學(xué)信息庫的建設(shè)有利于為對韓漢語教學(xué)和研究提供精細(xì)化的信息,這些信息所組建的教學(xué)自主應(yīng)用平臺可以實現(xiàn)對韓漢語中介語語料庫建設(shè)與對韓漢語課堂教學(xué)的對接和融合;第三,從基礎(chǔ)附碼、編碼度標(biāo)注、認(rèn)知難度評價、遷移情況描寫和典型偏誤展示等五方面呈現(xiàn)信息庫內(nèi)容的建庫范式,是我們在借鑒了二語習(xí)得及語料庫語言學(xué)相關(guān)理論成果的基礎(chǔ)上提出來的;第四,詞匯編碼度的研究可資借鑒的前人成果偏少,一方面,我們要開創(chuàng)性地展開研究,另一方面,如何避免主觀因素對編碼度標(biāo)注的干擾是我們需要著力解決的問題;最后,對韓漢語詞匯教學(xué)信息庫的建設(shè)是一種探索,我們的目標(biāo)是以此為范例,提煉國別化漢語詞匯教學(xué)信息庫的建庫規(guī)范,用以指導(dǎo)其他國別化信息庫的建設(shè),力爭在未來形成系列化、國別化的漢語詞匯教學(xué)信息庫,共同為漢語教學(xué)、漢語研究以及漢語國際推廣服務(wù)。

      崔希亮,張寶林 2011 全球漢語學(xué)習(xí)者語料庫建設(shè)方案[J].語言文字應(yīng)用(2):100-108.

      馮志偉 2011 從語料中挖掘知識[A].肖奚強,張旺熹(編).首屆漢語中介語語料庫建設(shè)與應(yīng)用國際學(xué)術(shù)討論會論文選集[C].北京:世界圖書出版公司:9-22.

      何安平 2004 語料庫語言學(xué)與英語教學(xué)[M].北京:外語教學(xué)與研究出版社:127.

      黃昌寧,李涓子 2007 語料庫語言學(xué) (第二版)[M].北京:商務(wù)印書館:3.

      ———2007語料庫語言學(xué)(第二版)[M].北京:商務(wù)印書館:20.

      王建勤 2011 第二語言習(xí)得研究[M].北京:商務(wù)印書館:41.

      猜你喜歡
      信息庫偏誤大綱
      民政部啟用中國·國家地名信息庫2022版
      50個重要的知識點 一份“學(xué)習(xí)大綱”幫您梳理黨的二十大報告
      工會博覽(2022年33期)2023-01-12 08:53:34
      借助BIM構(gòu)建動態(tài)造價信息庫的新思路
      新生代(2018年16期)2018-11-13 23:14:18
      “一……就……”句式偏誤研究
      新HSK六級縮寫常見偏誤及對策
      緊貼實戰(zhàn)落實《大綱》要求推進(jìn)航空體育訓(xùn)練創(chuàng)新發(fā)展
      介詞框架“對……來說”的偏誤分析
      人民軍隊第一部政治工作大綱
      軍事歷史(1992年3期)1992-01-18 05:21:26
      我軍最早的政治工作大綱——黨代表工作大綱
      軍事歷史(1988年1期)1988-08-22 12:22:50
      祁东县| 固安县| 闽清县| 新营市| 丹凤县| 东乌珠穆沁旗| 莱西市| 镇坪县| 栾川县| 定陶县| 乐都县| 呼图壁县| 夏邑县| 建宁县| 九江市| 白城市| 苗栗县| 凤台县| 巴彦县| 安平县| 景东| 白玉县| 台湾省| 紫金县| 时尚| 开鲁县| 自贡市| 巴里| 会理县| 个旧市| 读书| 万全县| 手机| 合江县| 盐边县| 余干县| 肃北| 武安市| 逊克县| 通许县| 夹江县|