• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    中學(xué)英語測試有效性之我見

    2017-10-21 17:13:07李飛
    學(xué)校教育研究 2017年27期
    關(guān)鍵詞:有效性測試語言

    李飛

    摘要:本篇論文的主題是探討英語測試的有效性,主要采用研究綜述的研究方法。理論部分主要分為語言測試的定義及其意義,對于有效性的定義,語言測試的形式等,論文的后半部分以高考卷為例,分析其題型的有效性。

    關(guān)鍵詞:語言;測試;有效性

    引言:測試是學(xué)生和老師在英語的學(xué)習(xí)和教學(xué)中必不可少的一環(huán),測試能讓學(xué)生對于本單元或者本學(xué)期學(xué)習(xí)情況有一個清楚的掌握,同時對于教師的教學(xué)有指導(dǎo)意義,以利于下一學(xué)習(xí)階段學(xué)生改進(jìn)學(xué)法,教師完善教法。因此,對于測試的研究是我們教學(xué)工作者所不可缺少的。國內(nèi)外學(xué)者在語言測試評價體系的研究方面,主要認(rèn)為信度,效度,和實用性這三者可用于測試評價的標(biāo)準(zhǔn)。而陳佑林教授在教育部人文科學(xué)重點研究項目“語言測試的評價標(biāo)準(zhǔn)研究”中提出:語言測試的評價標(biāo)準(zhǔn)應(yīng)由,思想性,可靠性,有效性,公平性,規(guī)范性,實用性,后效性等七個一級指標(biāo)構(gòu)成。(語言測試的評價標(biāo)準(zhǔn)研究,陳佑林1)本文重點研究語言測試中的有效性。

    一、相關(guān)理論的研究綜述

    (一)測試

    根據(jù)教育測量學(xué),測試是一種特殊測量技術(shù),以獲取量化的信息為目的,該信息反應(yīng)應(yīng)試者所掌握的某一方面的知識或能力的程度。(現(xiàn)代語言測試模型---王振中2)。典型的測試由一套問題構(gòu)成,每一個問題都有一個正確答案。在中學(xué)教育階段,測試一般是書面作答。對于測試問題答案的正確性來說,一套測試問卷一般有相應(yīng)的參考答案作為該次測試的評價標(biāo)準(zhǔn)。但現(xiàn)今國內(nèi)的英語測試體系還存在很多不足,這一點將在后文闡述。

    測試主要可以分為,學(xué)業(yè)測試、進(jìn)展測試、水平測試、學(xué)能測試、診斷測試和分級測試。(現(xiàn)代語言測試模型---王振中,3-6)

    學(xué)業(yè)測試主要是考察學(xué)習(xí)者掌握教學(xué)大綱規(guī)定學(xué)習(xí)內(nèi)容的情況。學(xué)業(yè)測試通常在一門課程結(jié)束的時候?qū)嵤?/p>

    進(jìn)展測試和學(xué)業(yè)測試類似,可以在一門課程的不同階段或結(jié)束時實施。水平測試考察學(xué)習(xí)者掌握學(xué)科知識的水平,不以教學(xué)大綱,課程計劃或教材為命題依據(jù)。

    學(xué)能測試用來考察應(yīng)試者學(xué)習(xí)某一學(xué)科的潛能。例如:J. Carroll 和 S. Sapon 所設(shè)計的MLAT(Modern Language Aptitude Test ) 以及 Pimsleur 設(shè)計的PLAB( Pimsleur Language Aptitude Battery ) 都是著名的語言學(xué)能測試。其中MLAT適用于成人,即高年級學(xué)生。而PLAB適用于中學(xué)階段的學(xué)生。

    診斷測試其目的在于確定學(xué)習(xí)者尚未完全掌握或掌握得不完全的知識,以便于學(xué)習(xí)者自身查漏補缺,也有利于教師采取措施補救。學(xué)業(yè)測試和進(jìn)展測試都可用于診斷目的。

    分級測試考察應(yīng)試者的運用知識的水平,并以此為依據(jù)劃分等級。例如,分班考試,大學(xué)公共英語四六級考試等等。

    (二)測試的有效性

    陳佑林教授(2015)指出有效性即指想要檢測的事物與實際檢測到的事物之間的吻合程度。這兩者有賴于測試題目的主題,難度,學(xué)生的配合度等,如果測試者想要測試學(xué)生語音的準(zhǔn)確度,而給出的單詞又超出了學(xué)生的能力范圍,這個測試自然是失敗的,測試的結(jié)果并不能反映出學(xué)生的語音。再者,如果一場考試出現(xiàn)了大量的作弊行為,那么這場考試所實際檢測到的事物就缺乏真實性。那么這也是無效的。

    下圖取自陳佑林教授語言測試評價標(biāo)準(zhǔn)一文中對于有效性標(biāo)準(zhǔn)的總結(jié):

    一級指標(biāo) 二級指標(biāo) 三級指標(biāo) 四級指標(biāo) 五級指標(biāo)

    有效性

    檢測

    目的

    的有

    效性

    內(nèi)容的有效性

    語言能力 語言要素:語音,語法,詞匯

    語言技能:聽力,口語,閱讀,寫作,翻譯

    語言交際能力 口語交際能力

    書面語交際能力

    理論的有效性 語言學(xué)習(xí)潛能

    結(jié)果

    使用

    目的

    的有

    效性 選拔的有效性

    區(qū)分的有效性

    達(dá)標(biāo)的有效性

    預(yù)測的有效性

    驗證的有效性

    管理的有效性

    而王振中教授(2008)在其《現(xiàn)代語言測試模型》中提到效度研究就是為支持我們根據(jù)測試分?jǐn)?shù)做出的推論取得證據(jù)的過程。他認(rèn)為,內(nèi)容效度效度研究,準(zhǔn)則關(guān)聯(lián)效度研究,以及結(jié)構(gòu)效度研究是效度研究的主要形式。其中內(nèi)容效度與測試的內(nèi)容有關(guān),準(zhǔn)則關(guān)聯(lián)研究與測試的結(jié)果和其他測試或者測量評估方法有關(guān),結(jié)構(gòu)效度則與語言本身有關(guān)。

    Bachman and Palmer(1999)認(rèn)為有效性應(yīng)包括信度,構(gòu)念效度,真實性,相互作用性,返校作用,可行性。

    Lenning(1987)認(rèn)為有效性指的是一種測試或者測試的組成部分的適效性,一種測試有效在某種意義上是說它能測試出預(yù)期所要測出的東西。

    由上可知,英語測試應(yīng)結(jié)合縱橫向,既要考慮語言本身,也要考慮測試的結(jié)果和內(nèi)容以及其他評估的方法。在內(nèi)容方面,應(yīng)包括語言能力方面和語言交際方面,它應(yīng)有適當(dāng)?shù)碾y度,能將不同層次,已達(dá)標(biāo),未達(dá)標(biāo)的學(xué)生區(qū)分開來。教師還應(yīng)就測試的內(nèi)容以及學(xué)生的現(xiàn)有狀況對測試的結(jié)果做出預(yù)測,并加以驗證以求發(fā)現(xiàn)、改進(jìn)教學(xué)中的問題。本文將會采用陳佑林教授的最新成果,利用檢測目的的有效性和結(jié)果使用目的的有效性對試題加以分析。

    一、二、英語測試的內(nèi)容和試題種類

    (一)英語測試的內(nèi)容

    根據(jù)國家英語課程標(biāo)準(zhǔn),英語課程具有工具性和人文性的雙重性質(zhì)。就工具性而言,要求學(xué)生要掌握基本的英語語言知識(詞匯,語法,語音等)和英語語言技能即聽說讀寫四種,并初步形成利用英語與人交流的能力,進(jìn)一步促進(jìn)思維能力的發(fā)展。而人文性則對學(xué)生的綜合人文素養(yǎng)做出了要求,主要包括情感態(tài)度,學(xué)習(xí)策略,文化意識等方面。 教師在日常授課中應(yīng)注意結(jié)合隱形課程和顯性課程來培養(yǎng)學(xué)生,在測試中也應(yīng)不僅考慮到基本的語言知識和語言技能,還要包括情感態(tài)度,學(xué)習(xí)策略,和文化意識等方面。

    (二)英語試題的種類

    到目前為止,國內(nèi)外專家(例如: Harris,1969; Valette,1977; Heaton,1988; Alderson,1999; 王振中,2008等)都對試題的種類做過專門介紹。主要有以下幾種:

    1.封閉類試題

    :多項選擇,正誤判斷,完形填空等。

    2.開放類試題

    :完形填空(無選項),簡短答案題(多存在于閱讀與聽力),寫作,口語。

    3.單獨性與綜合性試題

    :單獨性試題指只對一項內(nèi)容進(jìn)行測試,例如:詞匯測試,聽力測試,閱讀測試等。綜合性試題指融合了聽說讀寫,語法,詞匯,語音等因素在內(nèi)的考察。

    二三、英語測驗的有效性分析實例分析

    以成都市某區(qū)高中三年級2014年12月英語月考考卷為例:

    主要類型 子類型及數(shù)量 主要考察內(nèi)容

    選擇題 單選(10) 冠詞,主謂關(guān)系,時態(tài),詞義(2),連詞(2),助動詞,代詞,數(shù)詞

    完形填空(20) 詞義,語義,搭配,連詞

    閱讀理解(20) 細(xì)節(jié),單詞理解,推斷,主旨,語義理解

    補全對話(5) 語義理解

    非選擇題 閱讀表達(dá)(5) 標(biāo)題,細(xì)節(jié)題

    改錯(10) 時態(tài),語態(tài),介詞,連詞,搭配,主謂

    寫作 半控制型

    (一) (一)檢測目的的有效性

    檢測目的的有效性是指檢測目的所要檢測事物與實際能檢測的事物之間的吻合程度。它包括內(nèi)容的有效性和理論的有效性。

    1. 內(nèi)容的有效性

    內(nèi)容的有效性是指檢測目的所要檢測的內(nèi)容與試卷實際檢測的內(nèi)容是否一致。內(nèi)容有效性可能涉及到語言能力或者是語言交際能力。語言能力又可分為語言要素與語言技能。語言要素包括語音、語法、詞匯。語言技能包括聽力、口語、閱讀、寫作和翻譯。語言交際能力包括口語交際能力和書面語交際能力。從語言能力方面來說,該套試卷涉及了語言要素的,語法,詞匯等方面以及語言技能的閱讀,寫作方面。并未涉及口語,翻譯,聽力,語音四方面的內(nèi)容。在英語語言學(xué)中有一個普及的觀點:口語(speaking)先于書寫(writing),但目前為止在四川地區(qū)中學(xué)對英語的測試中,口語這一測試形式少之又少。這就存在一個問題。我們學(xué)習(xí)英語是為了什么?為什么國家會要求我們的學(xué)生學(xué)習(xí)英語?為什么有的學(xué)生英語考試的分?jǐn)?shù)很高,但在日常生活中還是不能流利的用口語使用他們在寫作中所使用的句子?從這一方面來說,這套試卷是不太符合檢測目的有效性中內(nèi)容的有效性的。

    2. 理論的有效性之語言學(xué)習(xí)潛能

    理論的有效性指的是試卷所體現(xiàn)出的理論與相關(guān)的理論研究的成果是否一致。根據(jù)Pimsleur 設(shè)計的PLAB( Pimsleur Language Aptitude Battery ) ——著名的語言學(xué)習(xí)潛能測試,PLAB主要考察學(xué)生的言語智能(對詞語的熟悉程度和分析言語材料的能力),學(xué)習(xí)動力,聽覺能力。該套試卷能測試出學(xué)生的言語智能——通過閱讀理解等,但不能測試出學(xué)生的學(xué)習(xí)動力,聽覺能力。

    (二)結(jié)果使用目的的有效性

    1.選拔的有效性、區(qū)分的有效性、達(dá)標(biāo)的有效性

    選拔的有效性指的測試結(jié)果用來有效地選拔語言能力優(yōu)秀的學(xué)生。那么這就要求測試的內(nèi)容要有一定的難度,測試結(jié)果要有高低之分,這樣才會有利于選優(yōu)。區(qū)分的有效性指的是測試的結(jié)果能將不同層次的考生區(qū)分開。例如,在高考中,如果考生的成績在某一分?jǐn)?shù)段的人數(shù)特別多,而在其他分?jǐn)?shù)段的人數(shù)又特別少,這樣的結(jié)果肯定不利于不同層次的高校選拔人才。達(dá)標(biāo)的有效性指的是測試的結(jié)果能將已達(dá)標(biāo)的考生和未達(dá)標(biāo)的考生區(qū)分開。

    根據(jù)上述英語月考高三一班的考卷,采用中小學(xué)成績分析系統(tǒng)軟件,將學(xué)生月考成績分為,高,中,低三線。所計算出,年級總?cè)藬?shù)為159,達(dá)到高線(理110分,文115分)人數(shù)為23,比例為14%。達(dá)到中線人數(shù)(理95分,文101分)為86,比例為54%。達(dá)到低線人數(shù)(理85分,文92分)為114,比例為64%。

    總參考人數(shù) 分?jǐn)?shù)線 達(dá)標(biāo)人數(shù) 達(dá)標(biāo)比例

    159 高線 23 14%

    中線 86 54%

    低線 113 71%

    (此圖為根據(jù)此次月考學(xué)科上線統(tǒng)計表人工計算而成)

    由上圖可見,此次月考能根據(jù)測試結(jié)果,運用相應(yīng)軟件分析出達(dá)到高中低分?jǐn)?shù)線情況,因此該次月考具有選拔有效性、區(qū)分的有效性和達(dá)標(biāo)的有效性。

    2.預(yù)測的有效性

    預(yù)測的有效性指的是基于測試結(jié)果所做預(yù)測的準(zhǔn)確性。

    根據(jù)此次月考學(xué)科上線統(tǒng)計表,各班主任估計達(dá)到低線人數(shù)為114,比例為百分之七十二。但實際上低線人數(shù)為113,比例為百分之七十一。由此證明,此次測試預(yù)測的基本具有有效性。

    3.驗證的有效性

    驗證的有效性指的是測試結(jié)果用來驗證某事的準(zhǔn)確性。例如,在語言教學(xué)的研究中,我們認(rèn)為某種新方法的使用能夠提高學(xué)生的英語口語學(xué)習(xí)成績。為了證明這種想法,我們決定做個實驗,實驗結(jié)束后,我們通過測試來檢驗實驗班和對比班學(xué)生的口語學(xué)習(xí)效果。如果我們所用的測試對實驗班的學(xué)生有利,而對對比班的學(xué)生不利,即使測試結(jié)果能說明試驗班的英語成績優(yōu)于對比班的成績,這樣的結(jié)果也不能用來驗證該方法的效果。因為這樣的測試沒有驗證的有效性。而此次考試并無明確要驗證的東西。

    4.管理的有效性

    管理的有效性指的是測試結(jié)果可用來作為教學(xué)管理決策的依據(jù)。此次測試結(jié)果,分析出了學(xué)生達(dá)到既定分?jǐn)?shù)線的實際人數(shù),其實際分?jǐn)?shù)又與教師所預(yù)測的分?jǐn)?shù)有一定的差距,這無疑是對教師的教學(xué)和領(lǐng)導(dǎo)層的決策具有指導(dǎo)性的。

    (三)對以上實例分析的總結(jié)

    上述月考卷,覆蓋了語言技能中的讀和寫,聽說技能卻沒有涉及。在16年高考改革后,情況有所緩解,聽力又重新被納入一般的考察范圍之內(nèi),但在中學(xué)階段,說的方面還是沒有一個正式的合理的測試系統(tǒng),能就同學(xué)們的語音和口語進(jìn)行測評和分析。這樣不僅不利于學(xué)生語音的標(biāo)準(zhǔn),也不利于學(xué)生發(fā)展流利的口語,和使用英語進(jìn)行口語交際的能力。因此,在我們平時的測試和課堂中,教師應(yīng)注意對學(xué)生聽說技能的訓(xùn)練,做到學(xué)之有用。

    在語言知識方面,涉及了基本的詞匯和語法方面,語音,翻譯等方面卻并無提及,詞匯和語法固然重要,很多語言學(xué)家也認(rèn)為詞匯是英語學(xué)習(xí)的基礎(chǔ),但實際上,學(xué)好詞匯和語法并不等于這個學(xué)生有很高的英語水平。

    關(guān)于學(xué)習(xí)潛能方面,上述考卷并未能測出學(xué)生的學(xué)習(xí)動力,個人認(rèn)為學(xué)生的學(xué)習(xí)動力很難被量化,陳佑林教授也沒有列出詳細(xì)的方法來量化這一方面。但我們也應(yīng)重視學(xué)習(xí)動力在學(xué)生英語學(xué)習(xí)中的重要性,所以我們的教師應(yīng)該考慮,怎么去提高學(xué)生的學(xué)習(xí)動力?關(guān)于這一點,本人將會在下文做一個粗略的不成熟的闡述。

    在結(jié)果使用的有效性中,我們可以上述考卷的預(yù)測是基本有效的,但是還有一個問題多少的差距是正常值?多少的差距說明此次預(yù)測屬于無效預(yù)測?陳佑林教授并未做出更進(jìn)一步的闡述。

    三四、怎樣才能提高英語測試的有效性?

    基于陳佑林教授的研究,本人認(rèn)為提高英語測試的有效性首先,就要從測試內(nèi)容入手,即選擇相應(yīng)的語言知識和語言技能。但英語語言知識包括的范圍太廣,教師在出題的時候如何選擇須考的知識是一個問題。在編寫一本教材的過程里,有一個重要的方面是編寫者所必須要注意到的東西,那就是知識點的復(fù)現(xiàn)率。知識的復(fù)現(xiàn)能加深學(xué)習(xí)者對于之前所學(xué)的印象,以在無形中達(dá)到鞏固知識的目的。因此,教師在出題時也應(yīng)注意對之前所學(xué)重要知識點的涵蓋。這樣才能實現(xiàn)課堂,教材,考卷三者的有機(jī)結(jié)合。

    再者,語言技能的方面,聽說讀寫翻譯,是語言學(xué)習(xí)中必不可少的,但由于說這一方面的測試太過于繁雜,高考也并未涉及這一方面的內(nèi)容,因此被大家所忽略,而翻譯對于語言學(xué)習(xí)者的要求過高,因此在中小學(xué)階段的測試中對于翻譯的考慮有限。但,這五者的結(jié)合對于英語學(xué)習(xí)者來說的意義重大,哪一項技能都不應(yīng)被放棄,因此,在日常課堂中,我們的教師應(yīng)加大對于學(xué)生的產(chǎn)出能力,特別是對學(xué)生的口語表達(dá)能力上的培養(yǎng),將聽說課進(jìn)行得更為活躍,避免學(xué)生成為,分?jǐn)?shù)上的巨人,口語交流上的矮子。

    關(guān)于學(xué)習(xí)動機(jī)方面,最后,因其難以量化的特性,所以需要教師在日常的授課中,應(yīng)注意關(guān)注學(xué)生的情感(affect),好的情感能激發(fā)學(xué)生的學(xué)習(xí)動機(jī)。,教師應(yīng)加大對于學(xué)生思想工作的力度,避免學(xué)生產(chǎn)生對于考試的抑制情感??荚嚭蠼處熕龅目偨Y(jié)在給予學(xué)生適當(dāng)壓力的同時,給予一定的表揚。

    除此之外,對于新課標(biāo)中要求的文化意識,情感態(tài)度以及學(xué)習(xí)策略等方面,我們對英語的測試中也應(yīng)有體現(xiàn)。而閱讀理解是包含上述三方面最理想的題型。

    在確定所須考察的內(nèi)容之后,接下來便應(yīng)著重考慮題型的選擇。目前為止,英語大型考試中常用的題型就是閱讀理解,完形填空,寫作,改錯,單選。這其中,一半以上的都是選擇題,選擇題雖便于教師改卷,能讓學(xué)生在相對短的時間內(nèi)做完大量的題目,即有利于教師擴(kuò)大考察的范圍,但卻不利于學(xué)生的書寫方面的產(chǎn)出。因此,在日常的考察中,教師在選擇選擇題這一題型時,應(yīng)慎重。

    要做出一份絕對有效的試卷來說,對于命題者的要求是很高的,但我們教師也不能放棄對于這一點的追求。首先,在測試之前,年級英語學(xué)科備課組集全組教師智慧梳理出所測試范圍的測試內(nèi)容(考點),制作出一個試題雙向細(xì)目表,再分工,但這個分工也并不絕對,可以是一人負(fù)責(zé)一套試題的命制,或者多人分題型共同命制一套試題,但命題和審題人必須分開。在成功完成一套試卷的命題工作之后,應(yīng)對該次的工作內(nèi)容給予總結(jié),并加以保存,以待下次命題者參考并做出方法上的調(diào)整和完善,達(dá)到資源共享,從而減少教師工作量,提高教學(xué)質(zhì)量,當(dāng)然,新學(xué)期各年級備課組間進(jìn)行教學(xué)課件、教學(xué)設(shè)計、教學(xué)素材、考題的電子、紙質(zhì)文檔移交是實現(xiàn)資源共享的重要環(huán)節(jié)。

    結(jié)語:英語測試命題要從測試內(nèi)容、語言技能、學(xué)習(xí)動機(jī)、文化意識、情感態(tài)度及學(xué)習(xí)策略等方面去考慮并力爭在試題中加以體現(xiàn),方能確保測試的有效性。

    參考文獻(xiàn)索引:

    1.王振中《現(xiàn)代語言測試模型》(2008)

    2.陳佑林《語言測試的評價標(biāo)準(zhǔn)研究》(2015)

    猜你喜歡
    有效性測試語言
    幽默大測試
    幽默大師(2020年11期)2020-11-26 06:12:12
    如何提高英語教學(xué)的有效性
    甘肅教育(2020年6期)2020-09-11 07:45:28
    制造業(yè)內(nèi)部控制有效性的實現(xiàn)
    語言是刀
    文苑(2020年4期)2020-05-30 12:35:30
    提高家庭作業(yè)有效性的理論思考
    甘肅教育(2020年12期)2020-04-13 06:24:56
    “攝問”測試
    “攝問”測試
    “攝問”測試
    讓語言描寫搖曳多姿
    累積動態(tài)分析下的同聲傳譯語言壓縮
    灵寿县| 宁阳县| 宁都县| 凤城市| 长泰县| 固镇县| 和政县| 洞口县| 沁阳市| 永年县| 平阳县| 湄潭县| 双柏县| 潍坊市| 同德县| 福清市| 永州市| 宜城市| 于田县| 桃江县| 怀安县| 许昌市| 陆川县| 阿拉尔市| 达州市| 崇明县| 封开县| 内江市| 昆明市| 河北区| 金平| 昂仁县| 富平县| 台南市| 安国市| 土默特右旗| 玉环县| 安阳县| 翁牛特旗| 元氏县| 社旗县|