潘宗瀚
(廣州城建職業(yè)學院 廣東·廣州 510925)
伴隨著電子計算機技術領域的發(fā)展以及研究者對于實證性研究方法的重視,基于語料庫的語言學研究取得了極大的進步,迸發(fā)出了大量優(yōu)秀成果。各類語料庫也隨之出現,為研究者提供了大量豐富、充實的素材。語料庫主要應用在教材編訂和詞典編纂等語言教學方面,但是也有不少學者提出語料庫可以直接應用于語言學習中,教師在課堂上所能展示的例子數量較少而且存在很多不自然的語句。而運用語料庫,學習者可以接觸到大量的自然語言,相類似的表達中哪個表達的使用頻率更高也可以通過語料庫的檢索得知,有利于學生自主性地學習。而且,語料庫提供了一個觀察語言的學習環(huán)境,通過反復地觀察,能夠提高學生對語言的分析能力,記憶也能夠保持得更加持久。在這個意義上,運用語料庫進行自主學習和布魯納認知發(fā)現學習理論如出一轍。
除此之外,Chris Tribble、Mike Scott、Guy Aston、Sylvia Bernardini 等研究者基于“學習者即探究者(learner as researcher)”的教育理念,也對語料庫在教學中的應用給予充分肯定。但是布魯納認知發(fā)現學習理論并沒有得到廣泛的認識和實踐應用。因此,本文將重點探討基于布魯納認知發(fā)現學習理論的語料庫的使用方法及其效果、存在的問題和改善措施。
近年來,越來越多的語料庫提供給學習者免費使用,使得利用語料庫進行自主學習成為了可能。和英語語料庫相比,日語語料庫的建設一直處在相對停滯的狀態(tài)?,F有的日語語料庫普遍都存在著語料類型單一、未經系統(tǒng)抽樣、選擇范圍過窄、均衡性較差等問題,難以為語言學研究的進一步發(fā)展提供充足有效數據支撐?,F代日語書面語均衡語料庫(簡稱BCCWJ)的建設在一定程度上解決了這個問題。該語料庫對語料的采集以及后期加工進行了細致的規(guī)劃,在數據規(guī)模、均衡性和代表性等方面取得了極大進步,可以說這是目前日語語料庫建設的最高水平。然而現在能夠應用數據驅動型學習進行日語教學的只有KOTONOHA 和JPwac-L2,前者共計4600 萬詞,后者1300 萬詞。下面分別就它們的功能展開說明。
KOTONOHA 是日本國立國語研究所在網上公開的語料庫搜素平臺,可以通過此平臺從該研究所創(chuàng)建的現代日語書面語均衡語料庫(簡稱BCCWJ)里進行檢索。BCCWJ 里包含了日文書籍、白皮書、Yahoo Japan 里的語料,共計4600 萬詞。其中,書籍語料8821 條,約2500 萬詞;日本政府刊行白皮書1500條,約500 萬詞;過去30 年間的日本國會會議錄(159 場會議,共計500 萬詞);2005 年度版鑒定教科書語料約100 萬詞,「Yahoo!知恵袋」45725 條,約500 萬詞)、「Yahoo!ブログ」24027 條,約500 萬詞。檢索時,可以使用check box 功能來設定語料的題材和發(fā)布時間。點擊各個題材后還可以進一步細化題材。
Jpwac-L2 原本是搭載在語料庫檢索工具Sketch Engine 的語料庫JPwac 中的數據。Jpwac 是5 萬個網頁中收集整理的4億個詞條規(guī)模的語料庫,而Jpwac-L2 是從這些語料中抽取出的小型語料庫,共計1 億個詞條。Jpwac-L2 語料庫形成的條件如下:(1)每句話的長度在25 個詞匯以內;(2)不包含20%以上的記號和數字;(3)不包含除日語之外的詞匯;(4)以句號結句;(5)至少包含一個動詞、形容詞、形容動詞或者助動詞。檢索時,通過top down list 功能來設置語料庫的難易度,包含日語能力考試4 級~1 級,檢索結果和KOTONOHA 一樣,會顯示詞類、各個詞匯的難易度,還能夠對關鍵詞前后的詞匯進行分類。
在教學中語料庫有兩大應用,一種是將語料庫中得到的數據編制成教學大綱或教材,另外一種則是學習者直接使用語料庫檢索系統(tǒng)來學習,而在實踐教學當中則大多數是綜合運用這兩種方式,教師給學生提供基于語料庫編寫的教材,學習者直接利用語料庫來完成教材里的任務。任務包括在語料庫里檢索前后搭配并將其分類等。另外,學習者直接利用語料庫,從語料庫中得到的信息運用到日語寫作上??梢赃M行系統(tǒng)性的學習是語料庫學習的一大特點。使用語料庫的檢索系統(tǒng),可以幫助學習者從龐大的數據中檢索到所需的用例,由此可以輕松歸納總結出詞組的搭配使用以及語法的規(guī)則,并找出詞匯的相似表達。有學者將語料庫在語言教學中的應用方式分為分散型和收斂型。分散型是讓學生觀察數據探索出答案,答案并不唯一。收斂型則是教師預先準備好標準答案,最后讓學生獲得共同的認識。雖然這種方式教師直接告訴學生答案可以節(jié)省一些教學時間,但是不益于學生的自主探究性學習。
在日語漢字詞匯教學中有很多方法,其中最有效的學習方法之一就是詞語搭配的學習。只要掌握詞匯的前后搭配關系,就可以構筑詞匯的網絡體系,有效地增加詞匯量,也有助于正確理解詞匯的意思及用法。在學習過程中,不能只把目光局限于單個詞匯,還需要了解語法上的前后關系和固定搭配。寺嶋他(2009)嘗試在教材中提供要學習的詞匯和固定搭配,學習者用這些詞匯造句。但是教材中的固定搭配有限,需要指導學習者自行在語料庫檢索。
在“中級日語2”的課程,總共18 周,每周4 次課(每次課80 分鐘),基于每次授課的主題,都會安排閱讀、發(fā)表、報告等授課環(huán)節(jié)。比如,有一期的主題是環(huán)境問題,教材中安排了便利店24 小時營業(yè)及塑料袋的收費化等話題。因為在有限的授課時間里,教師往往將教學重點放在讀和寫的技巧訓練上,無法充分地講解詞匯,所以按照以往的授課方式,教師會選定和主題相關的詞匯制成單詞表,指導學生自行學習。然而,這樣不利于學生對于詞匯搭配的掌握以及課文前后文關系的理解。
在運用布魯納學習理論指導語料庫教學中,需要先跟學生說明使用語料庫學習的目的(如糾正錯誤表達、找出類似表達中的常用表達、不同詞類的前后連接等)和使用方法。然后利用KOTONOHA、JPwac-L2 將詞組和短句輸入到“かぼす”(Kanji and Vocabulary Learning Support tool)中,系統(tǒng)就會自動生成flash card、kani card、填空題等練習,指導學生進行詞匯學習。因為每次學習的詞匯有60-70 個,所以需要分組完成任務。
首先,各個語料庫的難易度和所涉及的主題不一,要解決這一問題,需要在搜索引擎上下一些功夫。比如,在日本國立國語研究所公開的KOTONOHA 語料庫能夠選擇語料的文體及文獻時間,東京國際大學的川村氏他推出的Jpwac-L2,可以依據日語能力考試的等級選擇不同的語料。通過這些功能可以減少語料庫本身所存在的問題。其次是學生對待布魯納認知發(fā)現學習理論的態(tài)度。對于這種顛覆傳統(tǒng)教學方式的新型的學習法,很多學生還不習慣,覺得這種學習方法不適合自己,因此,導入布魯納認知發(fā)現學習理論時需要教師進行耐心指導,闡明該理論的優(yōu)勢。但是語料庫的檢索系統(tǒng)功能較多,即使對其使用方法進行了說明,不善于電腦操作的同學也未必能完全掌握,此時小組合作式學習就顯得尤為重要,小組內同學們互幫互助共同完成語料庫的檢索任務,如果小組討論之后仍然無法解決困難時則求助老師指導,這樣既有助于學生進行自主探索式學習,又提高了學效率。
將日語語料庫應用于日語教學中可以提高日語學習者整體語言水平,在促進學習者跨文化交際能力、職業(yè)素養(yǎng)的培養(yǎng)等方面也起著積極的作用。在實際的課堂教學中,不需要限制詞匯教學的形式,但必須建立在相應的理論和實踐經驗的基礎上,培養(yǎng)學生自行運用語料庫甄別有用的詞匯,掌握詞匯學習技能,切實提高學生對詞匯的實際運用能力,這樣方能保證學習的效果。從方法論的角度來看,運用語料庫來學習日語,在詞匯的研究中加入統(tǒng)計學的手段可以為日語教學提供積極的指導。日語語料庫的相關研究人員應根據現有的語料庫,合理設置練習任務,讓學生能夠加強對詞匯的理解和應用能力,保證日語語料庫的應用可以落到實處。