摘 要:本文以2020年至2023年英語新高考I卷閱讀理解測試為研究對象,基于測試和測試反應(yīng),進(jìn)行內(nèi)容效度的檢測研究。研究發(fā)現(xiàn),4年內(nèi)的英語閱讀文本長度基本合理,主題語境、話題、體裁和多模態(tài)形式多樣,生詞量少、試題難度低,但不同年份試題難度略有波動,低階思維層次提問居多,高階思維層次提問較少,且高低階思維層次的提問比例不是特別均勻。
關(guān)鍵詞:英語新高考I卷;內(nèi)容有效性;測試輸入;測試反應(yīng)
作者簡介:胡敏敏(1993.12-),女,浙江永嘉人,浙江省永嘉第二高級中學(xué),中學(xué)二級教師,研究方向:高中英語教育。
一、簡介
全國高考英語考試是中國最具影響力的選拔考試,參加人數(shù)最多。作為國家高考英語考試改革的試點省份,浙江省于2023年加入全國高考英語測試第一卷(簡稱新高考I卷)。改革后,英語新高考I卷試題類型分布發(fā)生巨大變化,尤其體現(xiàn)在閱讀理解測試(新增一篇文本且七選五閱讀分值從每題2分提高到2.5分)部分。這意味著在新高考改革后,閱讀理解測試更加受到重視。閱讀理解是測試學(xué)生各種能力,特別是高階思維能力的有效途徑。
高考試題的科學(xué)性主要體現(xiàn)在其試題內(nèi)容的信度和效度。閱讀理解能否達(dá)到預(yù)期的測試目標(biāo)取決于對其有效性的檢測。通過知乎檢索,發(fā)現(xiàn)目前針對分析浙江省新高考閱讀理解測試內(nèi)容有效性的研究較少,其中較有代表性的是范春樂和葛炳芳,其基于語言能力測試的意圖、情境和思維三個基本點,評估了2022年英語新高考I卷。然而,2020-2023年英語新高考I卷尚未被研究。因此,本文以2020年至2023年的英語新高考I卷為研究對象,從兩個角度對其內(nèi)容效度進(jìn)行了歷時性研究:測試輸入的特征(涉及主題語境、體裁、長度、話題、難度等)和測試反應(yīng)(提問方式和不同提問方式的分布),從而為英語新高考I卷的閱讀理解測試提出一些有效建議,并增強測試對考生的反作用。
二、概念構(gòu)建
概念是指在考試中衡量什么樣的語言知識、技能或能力,或在考試中回答“要考什么”。結(jié)構(gòu)定義主要被視為設(shè)計測試任務(wù)的指導(dǎo)原則,也是解釋測試結(jié)果的有效方法。
(一)閱讀理解
閱讀理解是培養(yǎng)學(xué)生英語核心素養(yǎng)的有效方式,而英語核心素養(yǎng)中思維能力是至關(guān)重要的一部分。為了實現(xiàn)思維能力目標(biāo),學(xué)生應(yīng)理解和分析文本相關(guān)的特征,組織和總結(jié)文本信息,分析和推斷文本語句間的邏輯,思辨并評論文章,創(chuàng)造性地表達(dá)個人觀點。
(二)內(nèi)容效度和測試
有效性通常涉及兩個方面。一是測試內(nèi)容或測試問題是否有效反映預(yù)期目標(biāo);二是測試的有效度,即測試題多大程度達(dá)到預(yù)期測量效果。換而言之,效度即測試產(chǎn)生假定效果,或與檢測前的假設(shè)相比,達(dá)到何種程度。
內(nèi)容效度涉及效度關(guān)聯(lián)性和效度涵蓋率,主要考慮三個維度:1.測試內(nèi)容是否反映測試目標(biāo);2. 測試內(nèi)容是否典型;3.測試內(nèi)容是否合理恰當(dāng)。
基于Bachman與Palmer提出的任務(wù)特征框架,本文將從測試輸入特征和測試反應(yīng)兩個方面分析2020年至2023年英語新高考I卷閱讀理解測試試題的內(nèi)容效度。Bachman和Palmer的任務(wù)特征框架如下(見表1)。
根據(jù)上述定義,將閱讀理解測試的內(nèi)容效度分析框架安排如下(見表2):
三、測試設(shè)計
一旦“測試什么”這一重要問題得到解決,接下來的“如何測試”問題應(yīng)該由命題者來解決?!叭绾螠y試”是指測試的具體設(shè)計,尤其是問題的設(shè)計。
思維能力具體指被測試者的思維品質(zhì),主要圍繞邏輯、批判和創(chuàng)新等維度。基于布魯姆的教育目標(biāo)分類理論,低級思維能力和高級思維能力的考點分布如下。
七選五閱讀理解是對于文本結(jié)構(gòu)和句間、段間、句段間邏輯推理的檢測。該任務(wù)不僅測試考生理解整體文本內(nèi)容能力,還測試考生分析文本結(jié)構(gòu)的能力和邏輯思考推理能力。
四、研究方法
(一)研究對象
本論文以2020年至2023年英語新高考I卷的閱讀理解課為基礎(chǔ),共包含20篇文本和80個問題。新高考I卷改革(自2020年6月起由全國部分省市實施)后,雖然分值略有提升,但閱讀的命題形式仍一樣,主要測試考生綜合閱讀理解能力。
(二)研究問題
分析2020年至2023年英語新高考I卷閱讀理解文本特點和內(nèi)容效度。研究問題如下:
1. 2020年至2023年英語新高考I卷閱讀理解文本和試題的特點是什么?
2. 2020年至2023年英語新高考I卷閱讀理解文本和試題內(nèi)容效度如何?
(三)研究方法
基于Bachmann和Palmer提出的任務(wù)特征框架,本文采用文本分析方法對2020-2023年新高考I卷閱讀理解的內(nèi)容效度進(jìn)行歷時性研究,并比較2020-2023年試題閱讀理解部分的差異。首先,從測試輸入特征的角度出發(fā),分析了四種閱讀理解測試的體裁、題材、話題、難度、長度和生詞。話題是指新課標(biāo)規(guī)定的24個主題,可讀性和難度則通過文本中新單詞的數(shù)量來體現(xiàn)。然后,根據(jù)測試反應(yīng)進(jìn)行統(tǒng)計分析。最后,基于新課標(biāo)、《考試說明》和相關(guān)理論,對2020年至2023年英語新高考I卷閱讀理解的內(nèi)容效度作出總結(jié)。
五、發(fā)現(xiàn)與討論
作為新高考I卷的試點省份,浙江省于2023年1月完成了第一輪全國新高考I卷考試。筆者參考《考試說明》和新課標(biāo),從語言測試的四個方面(效度、信度、難度、區(qū)分度)對2020至2023年英語新高考I卷進(jìn)行深入分析。
(一)測試輸入特性
1.文本長度?!犊荚囌f明》要求試題中閱讀理解文本總長度不得少于1200詞,七選五閱讀的文本長度約為400詞。英語新高考I卷閱讀理解中每一篇文本和問題長度見表1。
根據(jù)表4,每一份試題中閱讀理解第一部分的文本詞匯數(shù)量均超過1200,第二部分文本詞匯數(shù)量則不到400,符合《考試說明》中的相關(guān)規(guī)定,且每份試題五篇文本中的詞匯數(shù)量較為均衡。
2.生詞數(shù)。生詞是指沒有列入《考試說明》中,且試題中未標(biāo)注中文的詞語。《考試說明》未明確限制生詞的數(shù)量,為更詳細(xì)了解文本的難易程度,作者統(tǒng)計了文本中的生數(shù)量(如表5)。
如表5所示,每份試題中的生詞量遠(yuǎn)低于3%,標(biāo)記詞(含中文)的新詞基本波動在4-10個,文本閱讀障礙較低,文本的閱讀理解難度控制在一定水平。
3.主題語境?!犊荚囌f明》要求考生閱讀熟悉基于主題語境24大話題下的文本,如通告、廣告、科技文等短文。筆者發(fā)現(xiàn),閱讀文本圍繞三大主題語境,涉獵廣泛話題,包括生活和學(xué)習(xí)、環(huán)境與保護(hù)、科學(xué)與技術(shù)、良好的人際關(guān)系以及社會互動。文本的話題廣泛性在某種程度上可以更客觀、更全面、更有效地測試考生的閱讀思維能力。
4.多模態(tài)形式、題材和體裁。新課標(biāo)指出,多模態(tài)主要是語言、圖形、符號等多種學(xué)習(xí)材料呈現(xiàn)形式。閱讀文本的多模態(tài)形式、題材和體裁如表6所示。
從表6可以看出,閱讀文本的多模態(tài)形式單一,主要以語言為主。
(二)測試反應(yīng)
新課標(biāo)明確指出,閱讀理解測試第一部分重視考查考生的綜合能力,具體包括:主旨概括能力、定位細(xì)節(jié)并加以理解的能力、根據(jù)前后文推測新詞詞義的能力、基于文本信息進(jìn)行合理推理或者判斷作者觀點態(tài)度的能力。第二部分側(cè)重于考查學(xué)生在本文語境中的邏輯推理能力。表7羅列出了閱讀理解題型和七選五閱讀題型分布。
如表7所示,低階思維中的細(xì)節(jié)題占50%,高階思維的推理判斷題占28.3%,每年的題型分布波動略有差異且近4年的試題能較好地檢測考生辨析新舊信息組織模式和句子之間的邏輯語義能力。雖然總體題型分布較為均勻,但是每年題型分布變動較大。
六、結(jié)語
長期以來,以往高考忽視考查考生的綜合英語閱讀能力,特別是高階思維能力。與舊高考試題相比,新高考試題在信度和效度之間取得了較好的平衡,且仍然保持了區(qū)分度和難度。為提高信度,新高考增加閱讀理解測試問題數(shù)量,要求考生將其思維能力應(yīng)用于語言實踐。為了提高考試的有效性,新高考還增加高階思維層次題型的占比,有效地測試考生的英語思維能力。至于難度,閱讀材料可讀性得到適當(dāng)控制。就試題區(qū)分度而言,新高考在考查學(xué)生的思維能力方面進(jìn)行了一系列改革,且符合學(xué)生應(yīng)該綜合運用各種語言技能來實現(xiàn)日常生活中的學(xué)習(xí)和交流的要求。一定程度上,新高考試題科學(xué)地解決了如何有效地衡量思維能力的問題,但不同年份試題難度略有波動,低階思維層次提問居多,高階思維層次提問較少,且高低階思維層次的提問類型比例不是特別均勻。
參考文獻(xiàn):
[1]Bachman L F. What is the construct? The dialectic of abilities and context in defining constructs in language assessment. In J. Fox, D. Bayliss M. Wesche L. Cheng & C. Turner (eds.). Language Testing Reconsidered[M]. Ottawa, Ontario: University of Ottawa Press, 2007.
[2]Bachman L F, Palmer A S. Language Assessment in Practice: Developing Language Assessments and Justifying Their Use in the Real World[M]. Oxford: Oxford University Press, 2010.