胡光明
(無錫科技職業(yè)學(xué)院,江蘇 無錫 214028)
?
基于大數(shù)據(jù)的高職學(xué)生英語寫作錯誤特點分析
——以中介語為載體
胡光明
(無錫科技職業(yè)學(xué)院,江蘇 無錫 214028)
大數(shù)據(jù)技術(shù)目前已經(jīng)應(yīng)用于學(xué)生英語作文的自動批改,從中介語理論和錯誤分析理論入手對英語作文進行分析,可以得出較可靠的結(jié)論。本文采集“百萬同題英語寫作”相關(guān)數(shù)據(jù),結(jié)合中介語理論對高職學(xué)生英語寫作特點進行分析和歸因,在此基礎(chǔ)上提出改進教學(xué)策略的幾點建議。
大數(shù)據(jù)高職英語寫作中介語
大數(shù)據(jù)(big data)概念是由英國牛津大學(xué)教授Viktor Mayer-Sch?nberger和《經(jīng)濟學(xué)人》雜志數(shù)據(jù)編輯Kenneth Cukier在2008年提出的,目前已在計算機、信息科學(xué)、統(tǒng)計學(xué)等學(xué)科研究中廣泛應(yīng)用。上述兩人在他們的知名論著《大數(shù)據(jù)時代》中將這一概念描述為“不用隨機分析法(抽樣調(diào)查)這樣的捷徑,而是采用所有數(shù)據(jù)進行分析處理”,并指出大數(shù)據(jù)不是隨機樣本,而是全體數(shù)據(jù);其特點不是精確性,而是混雜性;數(shù)據(jù)間不是因果關(guān)系,而是相關(guān)關(guān)系[1]。
現(xiàn)有的大數(shù)據(jù)處理技術(shù),包括數(shù)據(jù)采集、數(shù)據(jù)存取、基礎(chǔ)架構(gòu)、數(shù)據(jù)處理、數(shù)據(jù)挖掘、模型預(yù)測、結(jié)果呈現(xiàn)等,原則上基于五個方面的目的:一是可視化分析(Analytic Visualizations),直觀展示數(shù)據(jù),讓數(shù)據(jù)自己說話;二是數(shù)據(jù)挖掘算法 (Data Mining Algorithms),深入數(shù)據(jù)內(nèi)部,挖掘分析價值;三是預(yù)測性分析能力(Predictive Analytic Capabilities),根據(jù)可視化分析和數(shù)據(jù)挖掘的結(jié)果做出預(yù)測性判斷;四是語義引擎(Semantic Engines),即開發(fā)智能解析、提取、分析數(shù)據(jù)的工具;五是數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理(Data Quality and Master Data Management),標準化流程和工具,確保預(yù)先定義好的高質(zhì)量分析結(jié)果[2]。就外語教學(xué)研究來說,目前對大數(shù)據(jù)的應(yīng)用主要集中在可視化分析和數(shù)據(jù)挖掘兩個方面。
中介語(interlanguage)也可譯為“過渡語”或“語際語”,是美國語言學(xué)家Larry Selinker在1972年提出的重要語言學(xué)概念。它是指在第二語言習(xí)得過程中,學(xué)習(xí)者通過一定的學(xué)習(xí)策略,在目的語輸入的基礎(chǔ)上形成的一種既不同于其母語,也不同于目的語,伴隨學(xué)習(xí)過程向目的語逐漸過渡的、動態(tài)的語言系統(tǒng)[3]。幾十年來,中介語的相關(guān)理論已經(jīng)成為解析第二語言學(xué)習(xí)過程中產(chǎn)生偏誤的主要研究工具之一。
Selinker的研究認為,學(xué)習(xí)者自己輸出的任何語言都有一定語法規(guī)范的,只是這個語法規(guī)則發(fā)源于他自己,而不與目的語規(guī)則相對應(yīng),這樣就出現(xiàn)了以中介語為表現(xiàn)形式的錯誤。中介語的石化(Fossilization)現(xiàn)象是中介語理論的重要組成部分,它是指學(xué)習(xí)者的語言都存在一個共同的問題:經(jīng)常犯同樣的錯誤, 而且學(xué)到一定程度便停滯不前,這就是石化的癥狀,所有的中介語都存在著石化問題。中介語石化的原因有很多,包括年齡因素影響、母語負遷移、語言輸入錯誤、學(xué)習(xí)策略偏差等等[4]。
較長時間處于同一群體的外語學(xué)習(xí)者,在他們學(xué)習(xí)的環(huán)境、時間、策略、語言基本能力、溝通壓力等方面都非常相似,使他們中介語石化的原因和石化后錯誤輸出的類型也趨于相同。以往基于類似視角的研究只能采取抽樣的方式來進行分析,近年來在大數(shù)據(jù)相關(guān)理論指導(dǎo)下,可對相同群體學(xué)習(xí)者具有共性的石化中介語進行大數(shù)據(jù)挖掘,先總結(jié)出錯誤特點,再分析錯誤成因,進而改進教師的教學(xué)策略,并引導(dǎo)學(xué)習(xí)者自我糾正、強化,避免出現(xiàn)中介語的石化現(xiàn)象。
北京詞網(wǎng)科技公司開發(fā)的批改網(wǎng),是目前中國最大的英文在線寫作平臺,可實時指出學(xué)生的英語作文語法、詞匯、篇章等方面的錯誤,并提出修改意見,幫助學(xué)生對寫作錯誤進行更新、改進和替換式的修改,并通過即時反饋不斷改進,提升英語寫作水平。在使用批改網(wǎng)寫作過程中留存下來的數(shù)據(jù)庫,包含全國使用該平臺寫作的每位學(xué)習(xí)者的每篇作文的詞匯、搭配、語法等常規(guī)錯誤,均已被云計算系統(tǒng)分別指出并歸類,這些數(shù)據(jù)便是典型的大數(shù)據(jù)。如該公司2015 年開展的“百萬同題英語寫作”活動,就收到來自全國31個省市地區(qū)的學(xué)生作文1,093,126 篇。筆者希望結(jié)合中介語理論,通過該次比賽批改網(wǎng)平臺作文留存下來的數(shù)據(jù),找到其中高職學(xué)生英語寫作的錯誤特點加以分析,并提出教與學(xué)策略的改進建議。
批改網(wǎng)系統(tǒng)可對學(xué)生提交的作文從詞匯、句子、篇章結(jié)構(gòu)、內(nèi)容相關(guān)度 4個大類 192 個維度進行拆分,每個維度在與英語本族語語料庫對比后,對作文的內(nèi)容、組織、語體、詞匯、語法和格式等進行單項打分,同時給出個性化的反饋。在此平臺進行作文提交并實時查看學(xué)生的反饋,根據(jù)反饋建議進行多次修改,以期望達到能力所及的分數(shù)。
統(tǒng)計顯示,本次同題寫作有71%的學(xué)生在提交后至少修改了1次,有39%的學(xué)生修改5次以上,甚至有超過1%的學(xué)生修改超過50次。通過初版與終版作文的對比,這些修改使原始錯誤在10個錯誤類型上有33.88-56.79%的修正(見表1)。中介語理論認為,改正錯誤是一種使學(xué)習(xí)者的中介語向目的語趨進的方法,而且能夠根據(jù)指示進行自我修正,也從另一個層面說明了學(xué)習(xí)者的這些可自我改正的中介語并未真正石化。
表1 初、終版作文典型錯誤對比情況
(一)寫作錯誤分類
本次同題作文題目為“We are what we read(閱讀成就你我)”,是聚焦“閱讀是學(xué)習(xí)和成長的重要部分(reading is a critical part of learning and growth)”和“實踐中學(xué)習(xí)(learn by doing)”的觀點辯論。結(jié)合大數(shù)據(jù)的統(tǒng)計,我們可以按照Carl James對中介語錯誤的分類[5],即本體錯誤、詞匯錯誤、語法錯誤和語篇錯誤四個層次,每個層次再根據(jù)平臺網(wǎng)的維度進行二級分類歸納,便可總結(jié)出高職學(xué)生英語寫作中介語的主要特點。依據(jù)Carl James的錯誤分析理論和平臺錯誤的分類,可將此次寫作數(shù)據(jù)中的中介語錯誤二級分類如下: (1)本體錯誤:拼寫、大小寫、標點符號等錯誤;(2)詞匯錯誤:詞性誤用,動詞錯用(如不定式、分詞、動詞連用、情態(tài)動詞等)以及形容詞,冠詞,介詞,副詞等的錯誤使用;(3)語法錯誤:時態(tài)錯誤、語態(tài)錯誤、主謂一致錯誤、搭配錯誤;(4)語篇錯誤:成分缺失、成分冗余等。
(二)寫作錯誤歸因
根據(jù)本次比賽的大數(shù)據(jù)報告分析,統(tǒng)計出高職院校學(xué)生的高頻錯誤的前9項(見表2)。由于對語篇錯誤的判斷往往取決于對寫作主題的主觀呼應(yīng),在比較多的情況下難以用正誤來機械判斷,故以下略去語篇錯誤,從本體錯誤、詞匯錯誤、語法錯誤三個方面進行歸因分析。
表2 高職院校學(xué)生高頻錯誤統(tǒng)計
1.本體錯誤
從表2可清晰看出,高職院校學(xué)生英語寫作的本體錯誤出現(xiàn)最多,其中拼寫、大小寫、標點符號三項的錯誤之和就占了總體錯誤的43.53%。以下是一些實例,相關(guān)錯誤標為黑體斜體:
例1(大寫錯誤):First of all, Give a man a rod rather than give a man a fish.
例2(小寫錯誤):When i was a little girl, i always wondering why my mom just are addicted to the book every second once she got time.
例3(單引號錯誤):As a vivid saying:“there is a long distance between theory and practice.”
例4(拼寫錯誤):…,it can boarden our horizons, to inspire our potential, so that we learn more useful information from books.
相比之下,高職院校學(xué)生所犯的上述本體錯誤比“985”本科院校的學(xué)生多出了11.6% (數(shù)據(jù)來自北京語言智能協(xié)同研究院發(fā)布的《2015百萬同題英語寫作大數(shù)據(jù)分析報告(全學(xué)段·詳盡版)》) 。一方面,這反映了高職學(xué)生的英語詞匯基礎(chǔ)較差,詞形記憶不牢,發(fā)音和拼寫對應(yīng)記憶能力也不強(如例4中的“boarden”的錯誤就源于學(xué)生將“broad”和“board”兩個詞的發(fā)音和字形混淆,并已形成石化中介語);另一方面,也反映出高職學(xué)生對寫作中的細節(jié)檢查不仔細。
2. 詞匯錯誤
此項錯誤中的動詞錯用、詞性誤用、名詞數(shù)格錯用等占錯誤總數(shù)的15.74%。實例如下:
例5(雙謂語錯誤):But therearestill a large number of peoplestandon the side of reading.
例6:(情態(tài)動詞錯誤)Itiscanbecome some possible development.
例7:(名詞單復(fù)數(shù)錯誤)So we can gain many old and newknowledgesfrom the books.
例8:(連詞錯誤)Althoughit is funny,butalso from the side reflects the books for the role of a man’s life’s achievement.
詞匯錯誤中,詞性混淆使用、兩個動詞連用、不定式的“to”錯用、介詞錯用或缺失、混淆名詞的可數(shù)性和修飾詞錯誤等是常見的錯誤類型。在例8中“although”和“but”出現(xiàn)在同一句中,很明顯是受了漢語的“雖然……但是……”關(guān)聯(lián)詞的影響,在其學(xué)習(xí)英語連詞時對此語法不夠重視,于是在寫出此句子時,其“although…but”表示轉(zhuǎn)折的中介語是石化的,這種石化只有當學(xué)習(xí)者自己認識到錯誤的原因并主動學(xué)習(xí)改正時,才會逐漸消除。
3.語法錯誤
語法錯誤中主謂一致錯誤和搭配錯誤最為突出,占24.17%。實例如下:
例9(主謂一致錯誤):Itteachus work and behave, practice thinking , too.
例10(搭配錯誤):We cangrowthmuchknowledgewhich we do not achieve in classes.
例11(搭配錯誤):As we all know,readmillionsofbooks,travelmillionsmiles.
例9和例10同時還存在詞性錯用問題。從例10和11可知,學(xué)生的寫作受到了母語的影響,意圖使用一一對應(yīng)的方式來表達漢語中的“增長知識”和“讀萬卷書,行萬里路”的意思,卻沒有顧及英語本族語中是否有這種表述的規(guī)則。這種現(xiàn)象在中介語的理論中稱為母語負遷移,即學(xué)習(xí)者用母語規(guī)則獲得的知識技能對目的語知識技能的習(xí)得產(chǎn)生了負面影響。缺少外語學(xué)習(xí)的語言環(huán)境, 缺乏對所學(xué)語言的文化和社會背景的了解, 根深蒂固的母語語言思維方式和表達方式的影響等等,都會造成外語學(xué)習(xí)的母語負遷移現(xiàn)象。在高職學(xué)生的英語作文中,這種“中式英語”的錯誤尤為突出。
應(yīng)用大數(shù)據(jù)技術(shù)批改英語作文的一個優(yōu)勢是,平臺對比的是英語本族語語料庫,盡管系統(tǒng)或網(wǎng)絡(luò)出現(xiàn)大量重復(fù)的中式英語表達法,但不會被該平臺采用,同時平臺可以通過關(guān)鍵詞進行對比,挑選和指出寫作者的中式英語錯誤,如本次比賽總結(jié)出的高頻中式英語搭配30組(見表3)。同時,平臺實時將中式英語錯誤反饋給寫作者,有利于其后續(xù)的探究式自學(xué)。
表3 高頻中式英語搭配30組
目前,高職學(xué)生的英語寫作教學(xué),大多傾向于教授邀請信、求職信、報價詢盤等應(yīng)用文的寫作,或為了應(yīng)試而機械訓(xùn)練學(xué)生使用所謂寫作“模板”來進行三段式議論文的寫作。這種教和學(xué)的方式實際上源于實用主義至上的指導(dǎo)思想,導(dǎo)致學(xué)生的語言基礎(chǔ)不牢、寫作知識出現(xiàn)斷層等問題?;诖?,提出如下建議。
(一)鞏固基礎(chǔ)知識,提高寫作能力
寫作能力的提高與學(xué)生詞匯的掌握及正確使用、語法知識的鞏固以及閱讀和口語交流量的增加有著密不可分的關(guān)系。在總授課時數(shù)有限的情況下,有機結(jié)合讀與寫、詞匯學(xué)習(xí)與語篇訓(xùn)練,利用批改網(wǎng)、電子書包等網(wǎng)絡(luò)學(xué)習(xí)平臺督促學(xué)生課后自學(xué)和訓(xùn)練,可大幅度提高學(xué)習(xí)效果。如教師要布置一篇議論文“It pays to be honest”,可在布置前通過相關(guān)平臺發(fā)布與honesty、integrity、merit等關(guān)鍵詞相關(guān)的短文,供學(xué)生課后閱讀,然后在課上點評,隨后教授文中一些重點詞匯用法,最后將寫作任務(wù)布置下去。這種基于網(wǎng)絡(luò)平臺的知識鞏固與能力訓(xùn)練的有機結(jié)合,有助于學(xué)生在不斷嘗試和輸入中使自己的中介語逐漸向目的語靠近。
(二)實現(xiàn)由結(jié)果教學(xué)法向過程教學(xué)法轉(zhuǎn)變
結(jié)果教學(xué)法關(guān)注“最終結(jié)果”,教師關(guān)注的重點就是檢查學(xué)習(xí)者的作文是否順暢、語法是否正確、論述是否符合外語習(xí)慣等。而過程教學(xué)法則有一系列發(fā)展、變化的階段性教學(xué)目標,即指導(dǎo)學(xué)習(xí)者制定寫前計劃;營造交互氛圍、鼓勵全員參與、收集寫作素材、 理清寫作思路、形成新穎想法;寫出初稿;審視、評價初稿;重復(fù)以上步驟并完成終稿[6]。在大數(shù)據(jù)寫作平臺上,上述過程在人機互動的同時,如果再加上教師觀察學(xué)生修改過程后的點評,不僅有助于提高學(xué)生寫作興趣,還有助于對癥下藥,及時糾正中介語錯誤。
(三)借助大數(shù)據(jù)平臺訓(xùn)練學(xué)生自我糾錯能力
語言學(xué)習(xí)是一個不斷犯錯誤又不斷糾正錯誤的過程,在諸如批改網(wǎng)這樣的可實時反饋寫作者錯誤并給出意見的平臺上,可以更加快捷地呈現(xiàn)自我糾錯的過程。數(shù)據(jù)統(tǒng)計顯示,對于詞匯、標點等主體錯誤,寫作者往往能在第一次反饋后就修改正確;而對于綜合性的語法錯誤, 或由于受母語負遷移的影響產(chǎn)生的中式英語錯誤,大多數(shù)寫作者無法在第一次修改后得到徹底改正,往往是由新的錯誤替代舊的錯誤。此時,教師的作用極為重要,只有及時指出并講清楚錯誤的類型后,學(xué)生才能意識到錯誤并進行糾正,并通過正面的評價反饋,激發(fā)學(xué)生的寫作興趣。
總之,大數(shù)據(jù)技術(shù)是提供高職學(xué)生英語寫作實時提交、反饋和修改驗證的平臺,但大數(shù)據(jù)的特點是只負責(zé)提供“是什么”的材料,而從數(shù)據(jù)中看出端倪、找出規(guī)律的原因探究,以及利用數(shù)據(jù)分析原因、探索“怎么做”的路徑規(guī)劃等,都是數(shù)據(jù)使用者的工作。本文將大數(shù)據(jù)與基于中介語的錯誤分析理論相結(jié)合,找出高職學(xué)生英語寫作錯誤的一些特點,針對這些特點,利用大數(shù)據(jù)平臺,高職英語教師可以在寫作課上嘗試更多教學(xué)和訓(xùn)練手段,收集更多精準的、不同維度的語料并加以分析,以促進高職英語寫作教學(xué)水平的提高。畢竟,大數(shù)據(jù)平臺和技術(shù)是“器”,只有正確使用它的理念和方法的“術(shù)”,才能使其更好地發(fā)揮作用。
[1][英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2012:31.
[2] 大數(shù)據(jù)分析與處理方法介紹[EB/OL].36大數(shù)據(jù),http://www.36dsj.com/archives/3512,2013-09-23.
[3] Selinker, L..Interlanguage[J]. International Review of Applied Linguistics in Language Teaching,1972(10):209.
[4] 姚鳳華.中介語的石化及教學(xué)對策[J].常州信息職業(yè)技術(shù)學(xué)院學(xué)報,2009(5) : 48-50.
[5] James,C.Errors in Language and Use: Exploring Error Analysis[M].Beijing: Foreign Language Teaching &Research Press,2001: 98-99.
[6] 秦旭.中介語的石化現(xiàn)象與英語寫作的學(xué)習(xí)過程[J].北京第二外國語學(xué)院學(xué)報,2002(2) .
(責(zé)任編輯:趙淑梅)
On the Characteristics of Students’ English Compositional Errors in Higher Vocational College Based on Big Data——Taking the Theories of Interlanguage as the Carrier
HU Guangming
(WuxiProfessionalCollegeofScienceandTechnology,Wuxi,Jiangsu214028,China)
The technology of big data has been applied in marking and correcting students’ compositions. With more than a million participants submitting compositions of the same topic in 2005, the contest has gathered massive amount of data. Reliable and systematic conclusions can be reached by using originated from the theories of interlanguage and error analysis to analyze compositions. The paper collects corresponding data from the contest and analyzes them based on theories of interlanguage, so as to find higher vocational college students’ traits and attribution on English writing, therefore puts forward relevant constructive suggestions on teaching strategies.
big data; higher vocational colleges; English writing; interlanguage
2016-05-26
教育部職業(yè)院校外語類專業(yè)教學(xué)指導(dǎo)委員會課題“基于大數(shù)據(jù)的高職英語寫作教學(xué)創(chuàng)新研究”之重點課題“基于大數(shù)據(jù)的高職學(xué)生英語寫作特點研究——以中介語為載體”(課題編號GZGZ5414-13)。
胡光明(1972—),男,湖南寧鄉(xiāng)人,無錫科技職業(yè)學(xué)院外語與基礎(chǔ)教育學(xué)院院長、副教授;研究方向:英語聽說與多媒體教學(xué),高職教育管理。
G642.3
A
1005-5843(2016)09-0071-05
10.13980/j.cnki.xdjykx.2016.09.014