劉娜娜
摘要:文章選擇了部分四級閱讀材料創(chuàng)建語料庫,運用RANGE、AntConc、GoTagger等自然語言處理軟件對語料進行了處理提取,并使用社會科學(xué)統(tǒng)計軟件SPSS對數(shù)據(jù)進行計算分析。分析發(fā)現(xiàn)《全國大學(xué)英語四、六級考試改革方案(試行)》發(fā)布前后的四級閱讀材料沒有顯著的差異性,但是,詞匯難度有所增加。鑒于增加的詞匯多為非常用詞匯,建議降低該部分詞匯數(shù)量。
關(guān)鍵詞:四級閱讀 自然語言處理 統(tǒng)計 詞匯
一、研究初衷
全國大學(xué)英語四級考試是教育部主管的全國性的教學(xué)考試,目的就是對大學(xué)生的實際英語能力進行客觀、準(zhǔn)確的測量,為大學(xué)英語教學(xué)提供服務(wù)。根據(jù)觀察大連海事大學(xué)圖書館網(wǎng)站提供的銀符考試題庫B12的部分英語四級真題試卷,我們發(fā)現(xiàn)1998年6月到2006年1月的試卷分值為100分,2006年6月到2012年6月的試卷分值為710分。
教育部網(wǎng)站提供的《全國大學(xué)英語四、六級考試改革方案(試行)》指出,“自2005年6月考試(試點)起,四、六級考試成績將采用滿分為710分的計分體制,不設(shè)及格線;在考試內(nèi)容和形式上,四、六級考試將加增加快速閱讀理解測試。閱讀理解部分比例調(diào)整為35%,其中仔細閱讀部分(careful reading)占25%,快速閱讀部分(fast reading)占10%。仔細閱讀部分除測試篇章閱讀理解外,還包括對篇章語境中的詞匯理解的測試;快速閱讀部分測試各種快速閱讀技能?!保ㄖ袊逃诰€:20050325)
基于以上事實,我們搜集整理了1998年6月到2006年1月的四級閱讀材料和2006年6月到2012年6月的四級閱讀材料,建立了兩個語料庫,對比分析《全國大學(xué)英語四、六級考試改革方案(試行)》發(fā)布前后的四級閱讀材料的差異性。
二、研究方法
(一)研究目的
通過語料分析,研究《全國大學(xué)英語四、六級考試改革方案(試行)》發(fā)布前后的四級閱讀材料的差異性,為四級考試閱讀材料的選用提供參考性意見。
(二)研究對象
本研究的對象是1998年6月到2006年1月的四級閱讀材料(以下簡稱“語料1”)和2006年6月到2012年6月的四級閱讀材料(以下簡稱“語料2”)。這些材料均來自大連海事大學(xué)圖書館銀符考試題庫B12英語四級真題題庫。
(三)研究工具
本研究主要采用自然語言處理工具GoTagger、AntConc和Range對語料進行標(biāo)注、抽取和對比分析,并使用社會科學(xué)統(tǒng)計軟件SPSS對數(shù)據(jù)進行計算分析。
(四)數(shù)據(jù)的采集和分析
語料1共采集16次考試,64篇文章;語料2共采集14次考試,42篇文章。
三、結(jié)果分析
為了比較語料1和語料2的差異,我們將在詞匯分布、句長頻數(shù)、段長和詞類分布四方面進行分析。
(一)詞匯分布分析
1.類符型符比(TTR)
類符形符比可以考察語料用詞的變化。類符(type)是語料庫中不同的詞語,形符(token) 則是指語料庫中所有的詞形。類符形符比可以在一定程度上反映語料的用詞變化情況。類符形符比越大,表明該語料覆蓋的詞匯量越大,反之則越少。利用自然語言處理工具AntConc,得出語料1和語料2的類符、型符數(shù)據(jù)。如下:
表1 類符型符數(shù)據(jù)比較
■
2.NATION三千詞表比對
利用自然語言處理工具RANGE,得出語料1和語料2的類符、型符與NATION三千詞表的對比數(shù)據(jù)。如下:
表2 NATION三千詞表對比
■
表1和表2僅是提供了兩個語料在類符、型符、類符型符比等方面的客觀數(shù)據(jù)。為了比較二者的差異性,還需運用SPSS對其進行分析。經(jīng)計算得出如下表格:
表3 詞匯分布統(tǒng)計
■
經(jīng)Mann-Whitney檢驗,概率值P(0.894),大于顯著性水平0.05,因此語料1和語料2的單詞分布沒有典型性差別。
(二)句長頻數(shù)比較
通過運用Search and Replace工具和Excel工具,我們對兩篇語料進行了處理。語料1提取了1043個句子,語料2提取了1322個句子,并對每句話的單詞數(shù)量進行了計算。一般情況下,平均句長越長,文本的句法結(jié)構(gòu)越復(fù)雜;而平均句長越短,則文本的句法復(fù)雜程度就越低。句長是語料特征的一個重要方面。經(jīng)SPSS計算分析后得出如下表格:
表4 句長分析
■
經(jīng)Mann-Whitney檢驗,概率值P(0.155),大于顯著性水平0.05,因此,語料1和語料2的句子長度沒有典型性差別。
(三)段長比較
與句長頻數(shù)一樣,段落長度也是比較兩個語料的重要參數(shù)。為此,我們首先統(tǒng)計了兩個語料的段落數(shù),并以字母為單位,計算了兩個語料的段長。語料1和語料2的段落數(shù)分別是338和474。語料1的段落標(biāo)準(zhǔn)差(172.507)小于語料2的段落(222.836),段落長度更加均衡。經(jīng)Mann-Whitney檢驗的概率值P(0.017) 小于顯著性水平0.05,樣本變量觀察值之間有顯著性差異。具體表格如下:
表5 段落描述
■
表6 段長分析
■
(四)詞類分布比較
實詞包括名詞、動詞、形容詞和副詞。這些詞反映了語料的信息承載量。為了更好地分析兩個語料的差異,我們對詞類的分布進行了分析。利用自然語言處理軟件GoTagger對文本做完標(biāo)注后,通過AntConc對兩篇預(yù)料的名詞、動詞、形容詞和副詞的數(shù)量進行了提取,并做了計算分析。如下表所示:
表7 不同詞性單詞統(tǒng)計
■
表8 不同詞性單詞差異性分析
■
統(tǒng)計顯示,在α=0.05,df=6時,卡方檢驗的關(guān)鍵值為7.8147,檢驗統(tǒng)計量2.418小于關(guān)鍵值,概率值P(0.490)大于顯著性水平0.05,因此樣本變量觀察值之間沒有顯著性差異。
四、結(jié)論
為了比較《全國大學(xué)英語四、六級考試改革方案(試行)》發(fā)布前后的四級閱讀材料的差異性,我們以2006年為界,對前后兩部分四級閱讀語料在詞匯分布、句長頻數(shù)、段長和詞類分布四方面進行了分析。結(jié)果顯示,改革方案發(fā)布前后的四級閱讀語料在詞匯分布、句長頻數(shù)和詞類分布方面沒有顯著性差異,僅有的區(qū)別存在于段長上。改革方案顯示,新的四級閱讀部分增加了快速閱讀理解測試,這就解釋了語料1的段落長度較之于語料2更加齊整,語料2段落長度長短不一。由此可見,改革方案發(fā)布之后,四級閱讀的難度并沒有顯著增加。
我國大學(xué)英語課程的教學(xué)目標(biāo)是培養(yǎng)學(xué)生的英語綜合應(yīng)用能力,使他們在今后的工作和社會交往中能用英語有效地進行口頭和書面的信息交流。大學(xué)英語四、六級考試作為一種標(biāo)準(zhǔn)化考試,其目標(biāo)就是更準(zhǔn)確地測量我國在校大學(xué)生的英語綜合應(yīng)用能力,就是要對大學(xué)英語教學(xué)產(chǎn)生正面的導(dǎo)向作用,引導(dǎo)師生正確處理教學(xué)與考試的關(guān)系。但是,在詞匯的分布分析中,盡管兩個語料沒有顯著性差異,但是表2卻揭示了一個不容忽視的事實:單詞難度在增加。NATION最常用的一千個詞中,語料2占40.1%,在接下里的第二個和第三個一千詞中,則分別占14.8%和14.2%,較語料1都有所下降。而不在詞表中的詞,語料2已經(jīng)上升到了30.9%。這部分詞匯并不是常用詞匯,所占比例卻很大,無疑增加了學(xué)生的學(xué)習(xí)難度,且應(yīng)用性不強。
大學(xué)英語考試目的在于測量我國在校大學(xué)生的英語綜合應(yīng)用能力,選用710分值標(biāo)準(zhǔn)分,可以檢測考生個體原始分在整體中的分布情況。根據(jù)前述分析,若考生為了應(yīng)試而掌握不常用的詞匯,分數(shù)固然會升高,但并不能體現(xiàn)對英語的綜合應(yīng)用能力,考試也就難以實現(xiàn)對英語教學(xué)的正面導(dǎo)向作用。因此建議該部分詞匯做大幅縮減,引導(dǎo)學(xué)生把注意力集中到英語的實際應(yīng)用,而非應(yīng)試性的記憶詞匯。
參考文獻:
[1]桂詩春,寧春巖.語言學(xué)研究方法[M].北京:外語教學(xué)與研究出版社, 2005.
[2]胡顯耀.基于語料庫的漢語翻譯小說詞語特征研究[J].外語教學(xué)與研究,2007(3):214-220.
[3]劉康龍,穆雷.語料庫語言學(xué)與翻譯研究[J].中國翻譯,2006(1):59-64.
[4]王家義.譯文分析的語料庫途徑[J].外語學(xué)刊,2011(1):128-131.
[5]余國良.語料庫語言學(xué)的研究與應(yīng)用[M].四川:四川大學(xué)出版社,2008.
[6]中國教育在線.http://www.eol.cn/article/20050325/3132232.shtml.
作者簡介:
劉娜娜(1983- ),女,山東淄博人,碩士研究生,助理研究員。
(責(zé)編 張亞欣)