• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      如何對紙筆考試測試結(jié)果作質(zhì)量分析

      2019-06-07 14:59:03陳基
      內(nèi)蒙古教育·綜合版 2019年4期
      關(guān)鍵詞:區(qū)分度測驗信度

      陳基

      一個學(xué)期即將結(jié)束,老師們又將在期末的紙筆考試測驗后,對紙筆考試測驗的結(jié)果進(jìn)行質(zhì)量分析了。對考試測驗結(jié)果進(jìn)行質(zhì)量分析在教學(xué)和學(xué)業(yè)評價上有著重要的作用:有利于評價考試測驗的質(zhì)量;有利于改進(jìn)考試測驗工作;有利于改進(jìn)教學(xué)工作。

      但遺憾的是,課改至今,我們的質(zhì)量分析還是沿用課改前的傳統(tǒng)經(jīng)驗型質(zhì)量分析。經(jīng)驗型質(zhì)量分析,是在設(shè)定紙筆考試試卷編制是沒有一點問題的基礎(chǔ)上進(jìn)行的,僅憑成績的優(yōu)秀率和合格率,以及平均分和學(xué)生做題出現(xiàn)的狀況進(jìn)行分析,從而得出教與學(xué)的優(yōu)劣和存在的問題。我們都知道,影響紙筆考試測驗結(jié)果的因素有三個:紙筆考試測驗卷的編制、教師的教學(xué)和學(xué)生的學(xué)習(xí)。而傳統(tǒng)經(jīng)驗型質(zhì)量分析是把“紙筆考試測驗卷的編制”這個影響紙筆考試測驗結(jié)果的因素剔除在外而進(jìn)行的質(zhì)量分析。因此,分析的結(jié)論是不科學(xué)的、不準(zhǔn)確的,是無法實現(xiàn)質(zhì)量分析在教學(xué)和學(xué)業(yè)評價上的重要意義的。

      科學(xué)的考試測驗結(jié)果質(zhì)量分析應(yīng)該包括分析考試測驗卷編制的質(zhì)量和分析教與學(xué)的情況,從而得出考試測驗結(jié)果質(zhì)量分析的結(jié)論及教與學(xué)改進(jìn)的意見。通常的步驟為:采集樣本──統(tǒng)計分析──作出結(jié)論和意見。

      采集樣本。一個班人數(shù)不多,一般全部采集。一個年級或一個片區(qū),因人數(shù)多,根據(jù)教育教學(xué)統(tǒng)計的要求,隨機采集30%的樣本進(jìn)行統(tǒng)計分析,基本可以說明問題了。

      統(tǒng)計分析。需作的分析有:效度分析、信度分析、難度分析、區(qū)分度分析和試題編制技術(shù)規(guī)范的分析;需作的統(tǒng)計有:難度系數(shù)(通常用P表示)、區(qū)分度、全距(最高分與最低分的差距,通常用R表示)、各分?jǐn)?shù)段百分比(該分?jǐn)?shù)段人數(shù)/總?cè)藬?shù))、平均分(全體得分之和/總?cè)藬?shù))、標(biāo)準(zhǔn)差(表示學(xué)生成績水平的差異程度,通常用SD表示)。

      在進(jìn)行考試測驗結(jié)果質(zhì)量分析之前,我們還要弄清該考試測驗的目的,因為目的不同,有些數(shù)據(jù)說明的問題就不同,直接影響到做出的結(jié)論和意見。

      從分?jǐn)?shù)解釋參照標(biāo)準(zhǔn)分,考試測驗可以分為目標(biāo)參照評價模式和常模參照評價模式。目標(biāo)參照評價模式又稱水平評價模式,它不以評定學(xué)生之間的差別為目的,而是以教學(xué)目標(biāo)為評價標(biāo)準(zhǔn),依據(jù)課程標(biāo)準(zhǔn)的教學(xué)目標(biāo)和教科書編制試題來測量學(xué)生的學(xué)業(yè)成績,判斷學(xué)生是否達(dá)到了教學(xué)目標(biāo)的要求,即是否“及格”。如升級考試、畢業(yè)考試、合格考試,不適用于甄選人才。常模參照評價模式則以評定學(xué)生之間的差別為目的,依據(jù)學(xué)生個人的成績在該次成績序列中所處的位置來評價和決定他的成績優(yōu)劣,不以是否“及格”為標(biāo)準(zhǔn),不考慮他是否達(dá)到教學(xué)目標(biāo)的要求。如高考、學(xué)科競賽,適用于甄選人才。由此可見,小學(xué)階段的所有考試測驗,都是目標(biāo)參照評價模式,只判斷學(xué)生是否達(dá)到教學(xué)目標(biāo)的要求,而不是甄別學(xué)生成績所處的位置。

      進(jìn)行考試測驗結(jié)果質(zhì)量分析,首先要做的是對考試測驗的題目作效度分析、信度分析和試題編制技術(shù)規(guī)范的分析。

      1.效度分析。這里的效度是指內(nèi)容效度。所謂內(nèi)容效度是指測驗?zāi)艽硭麥y量的內(nèi)容和引起預(yù)期反應(yīng)的程度。拿語文課程舉例,“所欲測量的內(nèi)容”是指語文課程內(nèi)容,“預(yù)期反應(yīng)”是指學(xué)生的行為活動,如對語文課程內(nèi)容的記憶、理解和應(yīng)用等。

      內(nèi)容效度的分析,一般由教師和專家對考試測驗內(nèi)容進(jìn)行判斷而定。

      內(nèi)容效度的判斷依據(jù)有兩個:(1)分析考試測驗編制依據(jù)的教科書和考試測驗對象學(xué)習(xí)的教科書的一致性程度;(2)比較考試測驗題目內(nèi)容與課程標(biāo)準(zhǔn)教學(xué)目標(biāo)和教科書呈示的課程內(nèi)容的一致性程度。

      分析測驗編制依據(jù)的教科書和考試測驗對象學(xué)習(xí)的教科書的一致性程度。在判斷內(nèi)容效度時,首先考慮考試測驗編制者是根據(jù)什么教科書來編制的,是用來考試測驗誰的。如果兩者一致,那么,此考試測驗可期望獲得較高的內(nèi)容效度。反之,此考試測驗的內(nèi)容效度就低。如,小學(xué)語文教學(xué)考試測驗編制者根據(jù)人民教育出版社所編制的教科書出的題目,用來測驗學(xué)習(xí)語文社S版小學(xué)語文教科書的學(xué)生,由于這套題目不能代表語文社S版語文教科書內(nèi)容,所以測驗的內(nèi)容效度就低。

      比較考試測驗題目內(nèi)容與課程標(biāo)準(zhǔn)教學(xué)目標(biāo)和教科書語文課程內(nèi)容的一致性程度,這“一致性”包含內(nèi)容的一致和水平的一致。如要求會認(rèn)的字,就不能要求寫。這是內(nèi)容上不一致,沒有效度。又如,使用人教版教科書的地區(qū),命題考試測驗修改病句、改寫成雙重否定句等題目內(nèi)容,由于教科書語文課程內(nèi)容中沒有這些內(nèi)容,所以是沒有效度的。又如,陳述句與反問句的認(rèn)識比較,其目標(biāo)水平是認(rèn)識這兩種句式以及了解它們在表情達(dá)意上的異同,就不能考試測驗這兩種句式的相互改寫,因為這是目標(biāo)水平不一致,沒有效度。

      2.信度分析。信度即考試測驗的可靠性,它是指對相同的應(yīng)試者多次測驗結(jié)果的一致性的程度。如果在大體相同的條件下,幾次測驗得到了大體相同的結(jié)果,那么這個測驗的信度是較高的;反之信度較低。評估信度一般有下列幾種方法:(1)再測法;(2)復(fù)份法;(3)半分法。但是,這只是編制考試測驗題目的要求,那么,考試測驗結(jié)果質(zhì)量分析應(yīng)如何進(jìn)行信度分析呢?由于高信度也是實現(xiàn)考試測驗效度高的一個必要條件,所以,我們可以從考試測驗題目的操作形式與考試測驗內(nèi)容的操作形式是否一致來分析題目的信度。比如,用紙筆考試測驗卷考查口語交際和綜合性學(xué)習(xí)的題目,因口語交際和綜合性學(xué)習(xí)的教學(xué)目標(biāo)或是一種能力,或是一種體驗性目標(biāo),只能在實踐過程中通過其他考查形式進(jìn)行評價,所以,這類題目就失去了信度和效度了。又如,紙筆考試測驗試卷中的感情朗讀應(yīng)該選擇用怎樣的語氣、情感的題目,也因感情朗讀是操作性的內(nèi)容而失去了信度和效度。再如,題目“用自己的話概括短文的主要內(nèi)容(在20個字以內(nèi))”,短文的主要內(nèi)容按照教科書的要求,是將各部分的內(nèi)容連起來表示,是不可能用20個字就能表達(dá)的,因此,這個題目也失去了信度和效度。

      3.試題編制技術(shù)規(guī)范的分析。小學(xué)語文考試測驗卷的編制有一定的技術(shù)規(guī)范要求,以保證學(xué)生不受到別的因素的干擾,能正確答題。常見的不符合編制技術(shù)規(guī)范要求的有:題目內(nèi)容有語法性、知識性的錯誤;題干導(dǎo)語講述不明確,指向不夠清楚;題型的編制不符合題型要求,如判斷題本身蘊含暗示性詞匯,選擇題的選項表述形式不一致或少于三項,填充題的語境不完整等。下面以某小學(xué)語文考卷的三道題為例談?wù)劊ㄆ查_效度和信度,僅就編制規(guī)范而言)。

      例一:修改下面這段話中的病句、錯別字和標(biāo)點方面的毛?。ㄔ谠渖闲薷模?/p>

      題干導(dǎo)語中“病句”“錯別字”“標(biāo)點”并列,犯了邏輯分類不當(dāng)?shù)腻e誤,“病句”包含錯別字、標(biāo)點符號錯用。

      例二:“這一切,都得感謝浦東開發(fā)呢!”的“這一切”是指( )。選擇合適的答案把序號填在括號里。

      1.“憐憐”改名為“歡歡”。

      2.浦東的開發(fā)。

      3.“我”家搬進(jìn)了新公房,“我”有了玩具角,“憐憐”也就有了許多好伙伴,變成了“歡歡”。

      該題犯了選項表述不一致的錯誤,選項3的句式與1、2明顯不同,易給學(xué)生暗示。

      例三:按照詞語含義的深淺,把下面三個近義詞按照意思由淺到深的順序排列起來。(將數(shù)字填在括號內(nèi))

      (1)擊?。?)擊退(3)擊潰

      “詞語含義的深淺”“按照意思由淺到深的順序”這樣的導(dǎo)語對一個小學(xué)生的理解能力而言實在是太深奧了。

      當(dāng)對考試測驗的題目作了效度分析、信度分析和試題編制技術(shù)規(guī)范的分析后,考試測驗的題目符合了要求后,就可以進(jìn)行難度分析和區(qū)分度分析了。

      1.難度分析。難度是指一組考生對該題作答的困難程度,一般用難度系數(shù)(P)表示。難度是衡量試題質(zhì)量的基本指標(biāo)之一。

      難度系數(shù)(P)=答對人數(shù)/總?cè)藬?shù)。如五年級某次語文測驗中概括各部分內(nèi)容一題,已知參試人數(shù)為50,答對此題有24人。P=24/50=0.48。

      如果是常模參照評價,難度系數(shù)P以0.5為適宜。P越大,說明此題難度越小;P越小,說明此題難度越大。該例P=0.48,小于常數(shù)0.5,說明有些難度。但如果是目標(biāo)參照評價,不存在設(shè)置難度的問題,P=0.48則說明該試題偏離了水平評價的目標(biāo)了。

      2.區(qū)分度分析。區(qū)分度是表示試題區(qū)分能力大小的指標(biāo),即試題能把各個層次能力的學(xué)生區(qū)分開來的指標(biāo)。區(qū)分度也是衡量試題質(zhì)量的基本指標(biāo)之一。

      試題的區(qū)分度計算步驟如下:

      (1)將參試學(xué)生的試卷按分?jǐn)?shù)由高至低排列。

      (2)將學(xué)生參試人數(shù)乘以0.27,小數(shù)點后四舍五入,取整數(shù)n。

      (3) 取n個最高分?jǐn)?shù),組成上組,再取n個最低分?jǐn)?shù),組成下組。

      (4)用該題上組答對人數(shù)減去下組答對人數(shù),再除以n。

      即:區(qū)分度=(上組答對人數(shù)-下組答對人數(shù))/每組人數(shù)(n)。

      如:某題參試學(xué)生總數(shù)為58人,n=58×0.27=15.66≈16,該題上組答對人數(shù)為8,下組答對人數(shù)為3,(8-3)/16=5/16=0.31,得出區(qū)分度為0.31。

      一般區(qū)分度總在-1和1之間。如果是常模參照評價模式,如區(qū)分度大于0.3,說明此題能很好地區(qū)分出學(xué)生水平;如區(qū)分度大于0.2且小于0.29說明此題尚能區(qū)分出學(xué)生水平,需改進(jìn);如區(qū)分度小于0.19甚至為0的話,說明此題將淘汰或作較大修改。上例區(qū)分度為0.31,說明該題能很好地區(qū)分出學(xué)生水平。但如果是目標(biāo)參照評價模式,則區(qū)分度就應(yīng)該小于0.19或為0,因為這是目標(biāo)參照評價模式的目的決定的,只檢驗學(xué)生是否達(dá)到教學(xué)目標(biāo),而不區(qū)分學(xué)生水平高低。

      在這些分析的基礎(chǔ)上,排除了試卷的問題,就應(yīng)該結(jié)合其他的統(tǒng)計數(shù)字,對教師教學(xué)行為和學(xué)生學(xué)習(xí)行為進(jìn)行分析,找出問題的所在以改進(jìn)教和學(xué)了。

      猜你喜歡
      區(qū)分度測驗信度
      《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識量表》的信度和效度研究
      淺談試卷分析常用的幾個參數(shù)及其應(yīng)用
      圖形推理測量指標(biāo)相關(guān)性考察*
      江淮論壇(2018年4期)2018-08-24 01:22:30
      《新年大測驗》大揭榜
      趣味(語文)(2018年7期)2018-06-26 08:13:48
      淺觀一道題的“區(qū)分度”
      兩個處理t測驗與F測驗的數(shù)學(xué)關(guān)系
      考試周刊(2016年88期)2016-11-24 13:30:50
      科技成果評價的信度分析及模型優(yōu)化
      單維參數(shù)型與非參數(shù)型項目反應(yīng)理論項目參數(shù)的比較研究*
      體育社會調(diào)查問卷信度檢驗的方法學(xué)探索——基于中文核心體育期刊163篇文章分析
      中文版腦性癱瘓兒童生活質(zhì)量問卷的信度
      绥德县| 新巴尔虎右旗| 德安县| 延津县| 确山县| 尉犁县| 和田县| 安新县| 兖州市| 石泉县| 三都| 清原| 张北县| 云南省| 小金县| 彭山县| 铜川市| 女性| 乌什县| 普宁市| 太谷县| 浮山县| 屯留县| 馆陶县| 共和县| 惠东县| 修武县| 潮州市| 宜兴市| 永福县| 舒城县| 天津市| 湘乡市| 聂荣县| 高邑县| 阳江市| 平泉县| 博爱县| 周口市| 凤翔县| 日土县|