□ 彭煒明 宋繼華 趙 敏
面向國際漢語教學(xué)的語法資源庫建設(shè)*
□ 彭煒明 宋繼華 趙 敏
隨著信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的發(fā)展,遠(yuǎn)程教學(xué)引發(fā)了教育的深刻變革,作為一種重要的教育手段,它已經(jīng)滲透到國民教育的各個(gè)領(lǐng)域。而在面向世界各地不同國家和地區(qū)、具有不同文化背景和需求的學(xué)習(xí)者的國際漢語教育領(lǐng)域,遠(yuǎn)程教學(xué)的開展卻明顯滯后。原因之一就是各類教學(xué)資源的混亂無序、簡單重復(fù)和缺乏共享,其中語法教學(xué)資源問題尤為顯著。近年來,我們從梳理語法《大綱》入手,進(jìn)行了教學(xué)語法資源庫構(gòu)建的探索實(shí)踐。本文總結(jié)了國際漢語教學(xué)領(lǐng)域語法資源建設(shè)的現(xiàn)狀,提出基于語法《大綱》構(gòu)建國際漢語教學(xué)語法資源庫的任務(wù)。在工程實(shí)踐中首先重構(gòu)了《大綱》語法點(diǎn),并通過豐富語法點(diǎn)的描述語和正則表達(dá)式屬性,構(gòu)建了一個(gè)規(guī)模化、知識(shí)庫化的語法資源庫,并利用該資源庫實(shí)現(xiàn)了基于正則模式匹配的語法點(diǎn)動(dòng)態(tài)獲取應(yīng)用。
國際漢語教學(xué);語法點(diǎn);資源庫;正則表達(dá)式
大規(guī)模開放在線課程(MOOC)作為一種新的開放教育資源模式受到全世界的矚目[1],再一次讓人們感受到遠(yuǎn)程教育在信息時(shí)代教育領(lǐng)域的巨大優(yōu)勢和潛力。當(dāng)前,國際漢語教育蓬勃發(fā)展,而面向世界各地不同國家和地區(qū)、具有不同文化背景和需求的學(xué)習(xí)者開展遠(yuǎn)程教學(xué)顯然是一個(gè)不容忽視的廣闊領(lǐng)域。但是相比其他教育領(lǐng)域,國際漢語領(lǐng)域的遠(yuǎn)程教學(xué)卻相對(duì)滯后。究其原因,教育信息化在特定領(lǐng)域的深入開展均依賴于教學(xué)資源的有力支持,而目前國際漢語教學(xué)資源建設(shè)在規(guī)范化、規(guī)?;凸蚕頇C(jī)制等方面還存在諸多問題,其中語法教學(xué)資源的問題尤為嚴(yán)重。借鑒MOOC的實(shí)踐經(jīng)驗(yàn),反思國際漢語語法教學(xué)資源建設(shè)的現(xiàn)狀,我們不難發(fā)現(xiàn)存在如下問題:
(1)知識(shí)點(diǎn)的組織框架不明確
MOOC以知識(shí)點(diǎn)為單元開展教學(xué)資源研發(fā)和建設(shè),知識(shí)點(diǎn)的組織框架依賴于特定的學(xué)科和課程體系。語法教學(xué)中的知識(shí)點(diǎn)一般稱為“語法點(diǎn)”,而語法點(diǎn)的項(xiàng)目設(shè)置和等級(jí)劃分一直以來就是國際漢語教學(xué)中的難點(diǎn)問題,對(duì)具體課程教學(xué)乃至教材編寫而言并沒有形成一套成熟、公認(rèn)的標(biāo)準(zhǔn)規(guī)范。由于漢語語法理論研究中本就有各家體系之爭,因而國際漢語教學(xué)領(lǐng)域的所謂“語法大綱”[2][3][4]也是多家并存的局面,且它們?cè)谡Z法點(diǎn)的立項(xiàng)、分級(jí)以及語法術(shù)語的使用上均存在一定的差異。
(2)語法資源的信息化程度不高
MOOC教學(xué)資源建設(shè)中,知識(shí)點(diǎn)作為資源創(chuàng)新的基本單位[5],在碎片化分解的基礎(chǔ)上又可進(jìn)行資源共享和重組,從而有效地避免了資源的重復(fù)建設(shè)。反觀國際漢語教學(xué)領(lǐng)域,各類語法大綱大多停留在紙質(zhì)的指導(dǎo)性文件層面,很少有人系統(tǒng)地將其中語法點(diǎn)轉(zhuǎn)化為可供信息檢索和定量統(tǒng)計(jì)分析的資源庫或知識(shí)庫。國際漢語教學(xué)中的語法點(diǎn)總量有多少,實(shí)際教材中課后講解的語法點(diǎn)該如何分布等,許多類似的問題都只能“參照”大綱做定性的回答。
(3)信息技術(shù)在資源利用過程中的學(xué)習(xí)支持不夠
MOOC中對(duì)教學(xué)資源的有效利用很大程度上決定于信息技術(shù)所能提供的學(xué)習(xí)支持。只有在學(xué)習(xí)者之間開展充分的分享、交流和協(xié)作,實(shí)現(xiàn)學(xué)習(xí)的自組織和他組織的動(dòng)態(tài)平衡[6],才能使大規(guī)模教學(xué)資源真正發(fā)揮積極作用。在國際漢語教學(xué)領(lǐng)域,一方面由于語法資源本身的信息化程度不高,另一方面也受制于當(dāng)前中文信息處理技術(shù)水平,語法點(diǎn)與動(dòng)態(tài)語言文本之間未能建立起有效的互動(dòng)關(guān)系,這使得為語法資源配備的例詞、例句只能是一種靜態(tài)羅列,語法點(diǎn)講解就顯得枯燥乏味,近乎語言規(guī)則的說教。
語法教學(xué)之所以成為漢語國際推廣中的困難之一,與傳統(tǒng)的教學(xué)模式和固化的教學(xué)內(nèi)容有很大的關(guān)系,而這種不利于遠(yuǎn)程教學(xué)的局面亟待改變。在當(dāng)前這個(gè)互聯(lián)網(wǎng)高度發(fā)達(dá)的大數(shù)據(jù)時(shí)代,利用信息技術(shù)逐步解決語法資源建設(shè)中的問題不僅是必要的,也應(yīng)該是可行的。近年來,我們從梳理語法大綱入手,提出構(gòu)建國際漢語語法資源庫的解決方案,并結(jié)合國際漢語教材語料庫和中文信息處理基礎(chǔ)數(shù)據(jù)資源,進(jìn)行了具體的工程實(shí)踐探索。
1.構(gòu)建方案和依據(jù)
針對(duì)上一節(jié)提出的問題,構(gòu)建國際漢語語法資源庫的目標(biāo)是:框架體系穩(wěn)定,具體語法點(diǎn)開放,并能夠?qū)崿F(xiàn)資源庫語法點(diǎn)與教學(xué)語言材料之間的動(dòng)態(tài)關(guān)聯(lián)。根據(jù)文獻(xiàn)調(diào)研,我們尚未發(fā)現(xiàn)符合以上目標(biāo)的教學(xué)語法資源庫,也就是說,沒有現(xiàn)成案例可供參考。因此,我們確立的語法資源庫構(gòu)建方案是:首先,參照某一語法大綱,建立反映教學(xué)語法系統(tǒng)性的穩(wěn)定結(jié)構(gòu)框架;其次,利用已有國際漢語教材庫或其他類型的語法知識(shí)庫充實(shí)語法框架下的具體語法點(diǎn),即最大限度地收羅語法教學(xué)中可能會(huì)出現(xiàn)的語法點(diǎn),并通過屬性建立語法點(diǎn)的難度等級(jí)、知識(shí)關(guān)聯(lián)和描述語等信息;最后,完善各類語法點(diǎn)對(duì)應(yīng)語言文本的特征屬性,為從語言文本中動(dòng)態(tài)獲取語法點(diǎn)奠定基礎(chǔ)。
由國家漢辦頒布并推廣的《漢語水平等級(jí)標(biāo)準(zhǔn)與語法等級(jí)大綱》(以下簡稱《大綱》)在語法資源庫的建設(shè)中顯然占據(jù)著無可質(zhì)疑的基礎(chǔ)框架地位。
首先,《大綱》中語法點(diǎn)的體系性基本上是周全的,從語素、詞類、詞組、句子成分、句子分類、特殊句型,一直到復(fù)句和句群,都有所覆蓋。在目前所見的各類語法大綱中,它是最全面的。
其次,《大綱》本身又是一部分“等級(jí)標(biāo)準(zhǔn)和水平大綱”,其中的語法點(diǎn)按照甲、乙、丙、丁四個(gè)等級(jí)排布,并且分級(jí)標(biāo)準(zhǔn)是在“多學(xué)科定量統(tǒng)計(jì)與群體性定性、定位分析相結(jié)合”的綜合集成方法下制定的。也就是說,《大綱》中的語法點(diǎn)帶有相對(duì)合理的等級(jí)劃分信息。
最后,《大綱》頒布后,由于其指導(dǎo)和示范作用,后來絕大多數(shù)對(duì)外漢語教材的編寫都以其作為標(biāo)準(zhǔn),有的教材甚至直接從中選取具體語法點(diǎn)內(nèi)容。由于教材語法點(diǎn)通常都與課文文本有一定的相關(guān)性,因而《大綱》語法點(diǎn)具有最廣泛的教材語料基礎(chǔ),也就最適合作為語法資源庫的基礎(chǔ)框架。
2.實(shí)施步驟和成果說明
(1)《大綱》語法點(diǎn)重構(gòu)
雖然《大綱》可以用來作為建立語法資源庫的基礎(chǔ)框架,但它與實(shí)用的語法資源庫之間還存在著較大的差距,具體表現(xiàn)在:《大綱》按甲乙丙丁四級(jí)編排語法點(diǎn),各級(jí)語法點(diǎn)的分類標(biāo)準(zhǔn)不統(tǒng)一,甲、乙級(jí)稱為“語法項(xiàng)”,丙、丁級(jí)稱為“語法點(diǎn)”。也就是說,共計(jì)1168個(gè)“語法項(xiàng)點(diǎn)”不是勻質(zhì)的,有的是“盡舉性的”,有的是“舉例性的”,還有的是“介乎二者之間”[7]。圖1表示了分散在各級(jí)中“詞類·名詞”相關(guān)的語法項(xiàng)點(diǎn),顯然,對(duì)于資源庫的結(jié)構(gòu)化要求來說,這種語法點(diǎn)編排是不合適的。
圖1 《大綱》“名詞”相關(guān)的語法項(xiàng)點(diǎn)
因此,我們首先將《大綱》中1168個(gè)項(xiàng)點(diǎn)按“大類→小類→語法項(xiàng)→語法點(diǎn)”的層級(jí)重新組織,如圖2所示,“語法項(xiàng)”以上不分等級(jí),它代表了穩(wěn)態(tài)的語法知識(shí)體系,原《大綱》中的項(xiàng)、點(diǎn)統(tǒng)一作為“語法點(diǎn)”分級(jí)依附在“語法項(xiàng)”之下。從“語法項(xiàng)”到“語法點(diǎn)”的細(xì)分,有的是依據(jù)語法講解本身的深入程度,有的是依據(jù)用詞、用語的難易等級(jí),屬于一種動(dòng)態(tài)知識(shí)。重構(gòu)后的語法庫共計(jì)8個(gè)大類、39個(gè)小類和183個(gè)語法項(xiàng)。
(2)語法點(diǎn)的擴(kuò)充
對(duì)于《大綱》中“舉例性的”語法點(diǎn),只要是有教學(xué)價(jià)值的,從資源庫構(gòu)建的角度出發(fā)都應(yīng)該進(jìn)行類推收羅。最典型的例子就是“固定短語”和“成語、四字格”?!洞缶V》中收錄的具體固定短語和成語、四字格非常有限,而漢語中這兩類實(shí)際存在的總量遠(yuǎn)遠(yuǎn)不止這些。我們采用的措施是借助《現(xiàn)代漢語語法信息詞典》[8]等中文信息處理領(lǐng)域的成熟語言知識(shí)庫,將其中成語子庫和習(xí)用語子庫中的詞語作為擴(kuò)充語法點(diǎn)加入到資源庫中。擴(kuò)充語法點(diǎn)的等級(jí)則參考它們?cè)诖笠?guī)模國際漢語教材語料庫中出現(xiàn)的頻次來決定。
圖2 《大綱》語法點(diǎn)重構(gòu)
更多類別的語法點(diǎn)擴(kuò)充卻沒有直接的語言知識(shí)庫可資利用,比如“固定搭配”、“口語句式”和“復(fù)句格式”等,必需從大規(guī)模國際漢語教材的課后講解中獲得。對(duì)此,我們采用“機(jī)器識(shí)別+人工校對(duì)”的方式對(duì)752冊(cè)國際漢語教材的課后語法講解進(jìn)行了切分標(biāo)注。如圖3所示,機(jī)器識(shí)別主要根據(jù)語法講解標(biāo)題文本中出現(xiàn)的語法術(shù)語與資源庫中語法點(diǎn)描述語的匹配情況,通過少量人工校對(duì),既補(bǔ)足了《大綱》未列的語法點(diǎn),同時(shí)也在不斷豐富各個(gè)語法項(xiàng)的描述語集合,使機(jī)器識(shí)別的召回率逐步提高。
圖3 教材課后語法點(diǎn)標(biāo)注
語法描述語的豐富和完善是資源庫信息化的一個(gè)重要內(nèi)容。比如,許多教材不使用《大綱》的“詞組”術(shù)語而稱“短語”,將其補(bǔ)充至語法項(xiàng)描述語集合中,有利于提高各種不同教材或教學(xué)過程中語法點(diǎn)的信息檢索率。此外,許多特定語法點(diǎn)在實(shí)際教材中的不同表述也需要進(jìn)行適當(dāng)?shù)臍w并,比如,在“固定搭配”中常見的“從……來看”、“從……來說/來講”、“從……來說/來看”等即可被歸并為一個(gè)語法點(diǎn)——“從……來說/來講/來看”。
(3)建立語法點(diǎn)的文本特征屬性
不同類別的語法點(diǎn)對(duì)應(yīng)著不同的文本特征,在當(dāng)前中文信息處理自動(dòng)句法分析還未達(dá)到實(shí)用水平的情況下,可以采用正則表達(dá)式先行解決一部分語法點(diǎn)的特征屬性問題。所謂正則表達(dá)式是用某種模式去匹配一類字符串的一種公式,它廣泛運(yùn)用于計(jì)算機(jī)程序設(shè)計(jì)中。利用正則表達(dá)式對(duì)文本字符串進(jìn)行相應(yīng)的模式匹配,可以找出其中蘊(yùn)含的特定語法點(diǎn)。
例如圖4表示了部分語法點(diǎn)對(duì)應(yīng)的正則表達(dá)式,其中“p{han}”為Perl正則表達(dá)式中“任一漢字”的簡寫形式,加號(hào)“+”表示前面符號(hào)出現(xiàn)1次或1次以上,故“因?yàn)閜{han}+,所以p{han}+”可以匹配帶關(guān)聯(lián)詞“因?yàn)椤浴钡囊蚬麖?fù)句?!??<!)”和“(?!)”分別表示“向左看”和“向右看”情況下邏輯“非”的條件。比如“把”字句,首先可確定的文本模式只有一個(gè)“把”字,為了保證匹配的準(zhǔn)確率,需排除像“把手”、“把握機(jī)會(huì)”、“一把椅子”等“把”字構(gòu)詞或作量詞的情況,限制“把”字前后數(shù)字及可構(gòu)詞漢字的出現(xiàn),如圖4所示(當(dāng)然,這也許會(huì)造成漏匹配,具體分析詳后)。
圖4 部分語法點(diǎn)對(duì)應(yīng)的正則表達(dá)式范例
(4)成果說明
采用前述步驟,目前構(gòu)建的國際漢語語法資源庫規(guī)模大致如表1所示。其中“構(gòu)詞”、“詞類用法”和“詞組類型”和“句子成分”四類因涉及深層的詞法、句法結(jié)構(gòu)信息,無法從字符表層進(jìn)行正則匹配?!霸~類”中有教學(xué)價(jià)值的語法點(diǎn)主要集中在幾個(gè)封閉的虛詞詞類(如副詞、介詞、助詞),而名詞、動(dòng)詞、形容詞等實(shí)詞詞類作為語法點(diǎn)進(jìn)行匹配的意義不大,因此,資源庫中“詞類”相關(guān)的正則屬性也較少。
表1 國際漢語語法資源庫統(tǒng)計(jì)表
通過與大規(guī)模國際漢語教材庫的互動(dòng),語法資源庫基本上實(shí)現(xiàn)了一個(gè)穩(wěn)定的體系框架。有了基本的體系框架,新編教材或教學(xué)過程中新產(chǎn)生的語法點(diǎn)便可通過描述語信息找到其所屬語法項(xiàng)位置,從而納入到語法資源庫的體系結(jié)構(gòu)之中,這樣便形成了語法資源的一個(gè)開放系統(tǒng)。
由于結(jié)構(gòu)框架建立在《大綱》語法體系基礎(chǔ)之上,并且語法點(diǎn)和描述語信息的擴(kuò)展豐富又是通過與大規(guī)模國際漢語教材語料庫互動(dòng)實(shí)施的,并且經(jīng)過嚴(yán)格的人工校對(duì),因此,不管是從語法點(diǎn)的等級(jí)劃分,還是從組織體系的合理性和合法性角度,語法資源庫都有了可靠的保障。而其創(chuàng)新性則體現(xiàn)在:在國際漢語教學(xué)領(lǐng)域首次建立了一個(gè)具有相當(dāng)規(guī)模的信息化語法資源庫,其中語法點(diǎn)不僅停留在本身的信息化,而且初步具備了與真實(shí)語言文本建立聯(lián)系的正則特征屬性,有助于在語法點(diǎn)動(dòng)態(tài)獲取的基礎(chǔ)上開展以學(xué)習(xí)者為中心的遠(yuǎn)程語法教學(xué)。
1.語法點(diǎn)動(dòng)態(tài)獲取的意義
利用信息技術(shù)從語言文本中動(dòng)態(tài)獲取語法點(diǎn)也許是一個(gè)具有爭議性的命題。爭議可能來自兩個(gè)方面:其一,若不結(jié)合實(shí)際教學(xué)環(huán)境(包括學(xué)習(xí)者水平、教學(xué)目標(biāo)等因素),籠統(tǒng)地考察句子中存在的語法現(xiàn)象,則每個(gè)句子都蘊(yùn)含著多個(gè)語法點(diǎn)。因?yàn)閺臉?gòu)詞講到詞類、詞組、成分、句型句式,乃至復(fù)句、篇章關(guān)系,不同的視角便會(huì)產(chǎn)生不同的語法點(diǎn);其二,在中文信息處理現(xiàn)有自動(dòng)析句水平下,單純依靠技術(shù)很難保證語法點(diǎn)識(shí)別的準(zhǔn)確率和召回率,那么動(dòng)態(tài)獲取語法點(diǎn)的合理性和有效性如何保證呢?
根據(jù)我們的實(shí)踐經(jīng)驗(yàn),這兩方面問題在工程中確實(shí)客觀存在著,但是開展語法點(diǎn)的動(dòng)態(tài)獲取仍然有其現(xiàn)實(shí)意義。對(duì)于第一個(gè)問題,其實(shí)不管是否采用動(dòng)態(tài)獲取的技術(shù)手段,都是無法回避的,而若能借助信息技術(shù)手段動(dòng)態(tài)發(fā)掘出文本中的各類語法點(diǎn),那么不管對(duì)施教者還是對(duì)學(xué)習(xí)者而言,都已經(jīng)在很大程度上減輕了逐句分析的任務(wù)量。傳統(tǒng)的語法教學(xué)之所以難以開展教學(xué)互動(dòng)和自主學(xué)習(xí),很大程度上也是受制于人工析句任務(wù)的煩瑣。語法點(diǎn)動(dòng)態(tài)獲取并非技術(shù)對(duì)人力的完全替代,而是通過技術(shù)手段盡量節(jié)省人力,從而達(dá)到優(yōu)化教學(xué)質(zhì)量的目的。
對(duì)于第二個(gè)問題,在計(jì)算機(jī)自然語言理解問題獲得徹底解決之前(應(yīng)當(dāng)承認(rèn)離實(shí)現(xiàn)這一目標(biāo)還相當(dāng)遙遠(yuǎn)),高準(zhǔn)確率和高召回率不可能兼得,應(yīng)根據(jù)教學(xué)實(shí)際靈活取舍。比如上節(jié)所舉“把”字句的正則模式中,我們對(duì)“把”字前后做了較強(qiáng)的排除限制,在獲取該語法點(diǎn)時(shí)就可能會(huì)將“我把門打開了”、“我把手伸過去”這樣的句子漏掉。但是,漢語文本中“把”字句并不稀缺,從學(xué)習(xí)者角度看,更需要的是信息系統(tǒng)能在遇到“把”字句時(shí)將其他相關(guān)例句準(zhǔn)確地類聚出來,而不是為了求全而給出像“我來把門”、“車把手壞了”這樣的誤匹配例句。
總之,盡管目前基于正則的語法點(diǎn)動(dòng)態(tài)獲取方法仍存在技術(shù)上的漏洞,但仍不失為一種可以改進(jìn)的有效方法,在大規(guī)模真實(shí)文本的語法點(diǎn)獲取中其效果還是可以接受的。
2.語法點(diǎn)動(dòng)態(tài)獲取的實(shí)現(xiàn)和應(yīng)用
動(dòng)態(tài)獲取真實(shí)文本中的語法點(diǎn)是以句子為單位進(jìn)行的,先將待分析文本按照“。|?|!”的斷句標(biāo)點(diǎn)切句,再利用正則表達(dá)式循環(huán)匹配切分好的句子。由于“固定短語”類和“成語、四字格”類的語法點(diǎn)數(shù)量較多(在目前資源庫中分別有2627條和6902條),考慮到計(jì)算機(jī)處理的效率問題,對(duì)這兩類進(jìn)行了特殊處理,即將這兩類語法點(diǎn)對(duì)應(yīng)的正則表達(dá)式采用邏輯“或”運(yùn)算,各自合并為一條規(guī)則后再去匹配。比如“成語、四字格”的語法點(diǎn)正則表達(dá)式為:“(一絲不茍|一舉一動(dòng)|一舉兩得|一舉成名|……)”。
為了檢驗(yàn)語法點(diǎn)動(dòng)態(tài)獲取的效果,我們選擇新聞?lì)愇谋咀鳛橄到y(tǒng)應(yīng)用的測試語料,因?yàn)樾侣務(wù)Z料是國際漢語教學(xué)素材的重要來源之一,它代表了最真實(shí)、最鮮活的現(xiàn)代漢語。其中一篇關(guān)于“中國科考船雪龍?zhí)栐庥銎娈愖匀滑F(xiàn)象”的新聞報(bào)道,其動(dòng)態(tài)獲取語法點(diǎn)的部分結(jié)果如圖5所示。
圖5 語法點(diǎn)自動(dòng)獲取效果示例
從中可以看到,系統(tǒng)自動(dòng)獲取語法點(diǎn)的準(zhǔn)確率還是很高的(根據(jù)大規(guī)模測試結(jié)果,準(zhǔn)確率可達(dá)95%以上),基本可以滿足實(shí)用需求,并且通過不斷完善正則表達(dá)式可使錯(cuò)誤率降至一個(gè)可接受的最低限度。
在開放教育思想的影響下,“共享優(yōu)質(zhì)資源,開展規(guī)模教學(xué)”的理念已經(jīng)逐漸成為教育界的共識(shí)[9],以互聯(lián)網(wǎng)為核心的信息技術(shù)的高速發(fā)展讓這種理念更加接近現(xiàn)實(shí)。國際漢語教學(xué)也不例外。當(dāng)各類教學(xué)資源不斷豐富至一定規(guī)模時(shí),如何實(shí)現(xiàn)資源的共享共建和教學(xué)應(yīng)用就成為本領(lǐng)域迫切需要解決的問題。而這兩方面又是相輔相成、相互促進(jìn)的。
在以往國際漢語教學(xué)資源建設(shè)中,受信息化程度的制約,能夠開展共享共建的資源類別多為字、詞或語料庫層面,語法資源的建設(shè)和共享都處在一個(gè)比較初級(jí)的階段,也未成規(guī)模地應(yīng)用于動(dòng)態(tài)語料的教學(xué)。我們基于《大綱》構(gòu)建的語法資源庫在這方面有了較大的進(jìn)步,不論從資源的體系性還是從語法點(diǎn)的規(guī)模來看,都已開始走向?qū)嵱脤用妗⒄Z法資源庫應(yīng)用于網(wǎng)絡(luò)教學(xué)平臺(tái),我們初步實(shí)現(xiàn)了資源的共享共建和教學(xué)互動(dòng)。具體體現(xiàn)在:
(1)以目前語法資源庫的語法點(diǎn)作為標(biāo)注體系,對(duì)752冊(cè)國際漢語教材的課后語法講解及部分課文語料進(jìn)行了信息標(biāo)注。這樣便建立了語法資源與教材資源、語料資源乃至字、詞資源的關(guān)聯(lián),有利于今后各類教學(xué)資源的深度整合和系統(tǒng)集成。
(2)因?yàn)閷?shí)現(xiàn)了動(dòng)態(tài)語法點(diǎn)獲取的機(jī)制,語法教學(xué)的素材突破了傳統(tǒng)備課內(nèi)容的限制,極大地拓寬了教師和學(xué)生的互動(dòng)空間,為國際漢語語法遠(yuǎn)程教學(xué)的開展奠定了基礎(chǔ)。
(3)資源建設(shè)和教學(xué)過程也形成了良性的互動(dòng)關(guān)系。如前所述,語法點(diǎn)動(dòng)態(tài)獲取所依賴的正則表達(dá)式有一定的局限性,但是,通過網(wǎng)絡(luò)教學(xué)平臺(tái)可以收集到來自教師或?qū)W生的反饋信息,促使語法點(diǎn)正則模式的不斷優(yōu)化。比如,前舉“‘把’字句”正則表達(dá)式,就是在教學(xué)中匹配到“一卷史冊(cè),皇皇二十四朝,本紀(jì)、列傳之類,大多是帝王將相,弄個(gè)把江湖人物進(jìn)去,統(tǒng)算是很另類、很體貼了。”這樣的句子后,才優(yōu)化到目前狀態(tài)的。
當(dāng)前國際漢語教學(xué)領(lǐng)域的許多問題都折射出基礎(chǔ)資源建設(shè)方面的相對(duì)薄弱,而后者很大程度上又源于資源信息化和共享共建意識(shí)的缺失。不管是詞匯教學(xué)還是語法教學(xué),國際漢語教學(xué)中許多標(biāo)準(zhǔn)和大綱都還停留在“文件”層面(不管是紙質(zhì)的還是電子的),尚未實(shí)現(xiàn)資源的結(jié)構(gòu)化和知識(shí)庫化。其中有相當(dāng)一部分標(biāo)準(zhǔn)規(guī)范是必需進(jìn)行規(guī)則類推才能真正用于信息處理的,如新HSK的六級(jí)詞匯大綱等。國際漢語教學(xué)界對(duì)標(biāo)準(zhǔn)和大綱的信息化工作或者熱情不高,或者因技術(shù)門檻而力所不及,而在具有信息技術(shù)背景的研究者看來,這些工作只不過是最基本的數(shù)據(jù)庫技術(shù),不值得過多關(guān)注,因此造成了這種特定學(xué)科領(lǐng)域亟需進(jìn)行深層次的信息化、規(guī)范化、基礎(chǔ)資源建設(shè)等重要問題,這不僅需要信息技術(shù)自身的領(lǐng)域化,也需要特定領(lǐng)域?qū)W科規(guī)律的深度挖掘和整理,而這也是開放教育時(shí)代發(fā)展的必然。只有跨越邊界,深入實(shí)際問題,才能促使信息技術(shù)切實(shí)為推動(dòng)漢語國際教育這一特定領(lǐng)域的健康發(fā)展貢獻(xiàn)力量。
[1]王海榮,王美靜.國外MOOC評(píng)估報(bào)告對(duì)我國高校教學(xué)改革的啟示[J].中國遠(yuǎn)程教育,2014,(03).
[2]王還.對(duì)外漢語語法大綱[M].北京:北京語言學(xué)院出版社,1994.
[3][7]劉英林.漢語水平等級(jí)標(biāo)準(zhǔn)與語法等級(jí)大綱[M].北京:高等教育出版社,1996.
[4]楊寄洲.對(duì)外漢語教學(xué)初級(jí)階段語法大綱[M].北京:北京語言文化大學(xué)出版社,1999.
[5][6][9]王鵬,邊琦,肖鳳艷等.MOOC背景下教學(xué)資源建設(shè)的發(fā)展方向——基于對(duì)國家精品開放課程工作的回顧[J].現(xiàn)代教育技術(shù),2014,(04).
[8]俞士汶.《現(xiàn)代漢語語法信息詞典》詳解[M].北京:清華大學(xué)出版社,2003.
G434
A
1009—458x(2014)08—0090—05
2014-02-25
彭煒明,博士后,北京大學(xué)計(jì)算語言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室(100871)。
責(zé)任編輯 日 新
中國博士后科學(xué)基金面上資助項(xiàng)目(2013M530455);國家社科重大項(xiàng)目“面向網(wǎng)絡(luò)文本的多視角語義分析方法、語言知識(shí)庫及平臺(tái)建設(shè)研究”(12&ZD227)
宋繼華,教授,博士生導(dǎo)師;趙敏,碩士研究生,北京師范大學(xué)信息科學(xué)與技術(shù)學(xué)院(100875)。