• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      高考選考科目定級(jí)計(jì)分和校準(zhǔn)的若干問(wèn)題

      2020-06-23 09:54:34溫忠麟
      關(guān)鍵詞:標(biāo)準(zhǔn)分計(jì)分科目

      溫忠麟

      (華南師范大學(xué)心理應(yīng)用研究中心/心理學(xué)院,廣州 510631)

      從2006 年開始,陸續(xù)有文章指出,高考選考科目成績(jī)(分?jǐn)?shù)或者等級(jí))有必要使用必考科目成績(jī)進(jìn)行校準(zhǔn)(羅冠中,2013;溫忠麟,2014,2017;溫忠麟,羅冠中,2006,2008,2010),其中包含了兩層意思:第一,選考科目成績(jī)不做校準(zhǔn)是有問(wèn)題的,這對(duì)考生整體能力較強(qiáng)的選考科目不利;第二,利用必考科目成績(jī)對(duì)選考科目成績(jī)進(jìn)行校準(zhǔn)是合理可行的。關(guān)于第一層意思,實(shí)踐已經(jīng)一再證明了選考科目成績(jī)不校準(zhǔn)會(huì)帶來(lái)問(wèn)題。而且,實(shí)踐也證明,如果沒(méi)有用一個(gè)合理的方法去校準(zhǔn)選考科目成績(jī),而是碰到一個(gè)問(wèn)題就出臺(tái)一個(gè)應(yīng)對(duì)措施,這樣的結(jié)果只能是一個(gè)問(wèn)題解決了,另一個(gè)問(wèn)題又出來(lái)了,“按下葫蘆浮起瓢”。關(guān)于第二層意思,國(guó)內(nèi)(特指中國(guó)內(nèi)地)高考至今沒(méi)有采取用必考科目成績(jī)?nèi)バ?zhǔn)選考科目成績(jī)的方法,主要原因在于政策制定者甚至部分專家對(duì)這種校準(zhǔn)方法有疑慮。

      本文首先回顧了選考科目成績(jī)不校準(zhǔn)帶來(lái)的問(wèn)題,舉了幾個(gè)典型的計(jì)分方案作為例子,這一部分屬于問(wèn)題的討論部分,觀前預(yù)后。隨后,文章解答了有關(guān)采用必考科目成績(jī)?nèi)バ?zhǔn)選考科目成績(jī)方面的問(wèn)題,設(shè)計(jì)了校準(zhǔn)方法的簡(jiǎn)單變式(包括只加不減方案),這一部分屬于問(wèn)題的澄清部分,釋疑解惑。

      一、問(wèn)題從試圖擺平各科難度開始

      如大家所知,考試分?jǐn)?shù)反映了兩個(gè)關(guān)鍵指標(biāo),一個(gè)是考生能力,一個(gè)是試題難度。抓住能力和難度就可以把很多問(wèn)題說(shuō)清楚。

      一次考試結(jié)束之后,就固定一個(gè)科目而言,試題難度就固定了,分?jǐn)?shù)高低反映了考生在該科目上的能力高低;就固定一個(gè)大的考生群體(如一個(gè)省或全國(guó)考生)而言,考生能力就固定了,科目的平均分(即均值)大小反映了該科試題難度的高低(如果各科滿分不同,難度為均值除以滿分值)。如果要比較考試分?jǐn)?shù),要么是用固定科目去比考生能力,要么是用固定考生群體去比科目試題難度(簡(jiǎn)稱科目難度)。若要各科分?jǐn)?shù)具有可比性,前提是要各科的難度相同。難度不同的科目,直接比較分?jǐn)?shù)是有問(wèn)題的。

      高考的目的是評(píng)價(jià)考生能力以選拔考生,最后要比較的是考生能力而不是科目難度。所以,合理的高考評(píng)分計(jì)分方案應(yīng)當(dāng)力求消除不同科目難度的差異,也就是說(shuō),設(shè)法讓各科難度盡可能相同。

      考試分?jǐn)?shù)的分布在很大程度上由均值和標(biāo)準(zhǔn)差決定(正態(tài)分布,則完全由均值和標(biāo)準(zhǔn)差決定)。均值反映難度,而標(biāo)準(zhǔn)差與區(qū)分度有關(guān)。本文在重點(diǎn)考慮均值之外,也會(huì)考慮標(biāo)準(zhǔn)差,或者兩者一并考慮的分?jǐn)?shù)分布。簡(jiǎn)言之,考慮均值相當(dāng)于考慮了難度,考慮標(biāo)準(zhǔn)差則在某種程度上考慮了區(qū)分度。

      (一)沒(méi)有選考科目的情形

      在沒(méi)有選考科目的時(shí)候,各科考生群體可以認(rèn)為是相同的,個(gè)別缺考的情況可以忽略不計(jì)。這時(shí)候,用平均分除以滿分值就反映了難度。如果滿分值相同,兩科的難度相同當(dāng)且僅當(dāng)平均分相同。

      當(dāng)然,如果能在出試題的時(shí)候就讓各科試題難度相同,那就沒(méi)有后面的問(wèn)題了,比如,據(jù)說(shuō)有的考試機(jī)構(gòu)會(huì)在事前規(guī)定一個(gè)難度指標(biāo)(如0.7)。但是,難度是考試以后才能計(jì)算出來(lái)的。由于不同科目的命題、評(píng)卷人員不同,因此很難提前設(shè)置一個(gè)評(píng)分標(biāo)準(zhǔn)使得難度等于預(yù)設(shè)的數(shù)值。例如,同是滿分值150,語(yǔ)文和數(shù)學(xué)的原始分?jǐn)?shù)平均分可能會(huì)相差30 多分(溫忠麟,羅冠中,2008)。

      在1985—2006 年間,我國(guó)許多省份在高考中采用了平均分為500、標(biāo)準(zhǔn)差為100 的標(biāo)準(zhǔn)分(范圍100~900)。在沒(méi)有選考科目的情形下,使用標(biāo)準(zhǔn)分可以消除各科難度差異(同時(shí)消除了各科區(qū)分度差異),擺平不同科目的難度,是比較合理的做法。具體來(lái)說(shuō)就是,各科標(biāo)準(zhǔn)分的平均分(都是500)相同、滿分值(都是900)相同,各科的難度也就相同了。因此,使用標(biāo)準(zhǔn)分,各科分?jǐn)?shù)有可比性,而這個(gè)可比性提高了合成高考總分的合理性。

      (二)有選考科目的情形

      在有選考科目的時(shí)候,即使各科能設(shè)置評(píng)分標(biāo)準(zhǔn)使得難度等于預(yù)設(shè)的數(shù)值(如0.7),也不能說(shuō)各科的難度就真的相同了,因?yàn)楦骺瓶忌恼w能力可能是不同的,原始分均值已經(jīng)無(wú)法反映難度了。

      而且,在有選考科目的時(shí)候,通常的計(jì)算標(biāo)準(zhǔn)分的方法也有問(wèn)題(溫忠麟,羅冠中,2006)。這種做法不僅將各個(gè)選考科目的難度變成一樣了,而且將不同選考科目考生群體的分?jǐn)?shù)分布也弄成相同了。由于分?jǐn)?shù)反映了能力,因此這就相當(dāng)于將各科考生的能力分布也弄成一樣的了。如果各個(gè)選考科目考生群體的整體能力相近(就像隨機(jī)分派那樣),這樣做的問(wèn)題不大,但現(xiàn)實(shí)是選考物理的考生整體能力較高(溫忠麟,2017),因此使用標(biāo)準(zhǔn)分對(duì)物理科考生(尤其是中位數(shù)以下的考生)最不利。廣東省從1999 年開始實(shí)行“3+X”并沿用1985 年開始使用的標(biāo)準(zhǔn)分以來(lái),選考物理的考生比例逐年下降得很厲害,因此在2007 年又退回去使用原始分。但使用原始分還是有問(wèn)題(各科難度擺不平),結(jié)果便是在 2010 年放棄了選考科目。由此可見(jiàn),在有選考科目的情形下,使用原始分不妥,使用通常的標(biāo)準(zhǔn)分算法也不妥。

      二、選考科目擺平難度引發(fā)的連串問(wèn)題

      在有選考科目的情形下,由于考生群體的能力高低不平,此時(shí)要擺平各科難度的做法是有問(wèn)題的。因?yàn)樵跀[平難度的時(shí)候,各科考生群體的成績(jī)(以及成績(jī)反映的能力)也被抹平了。

      (一)新高考第一批試點(diǎn)的選考科目計(jì)分問(wèn)題

      新高考第一批試點(diǎn)省(市)(上海和浙江)選考科目使用的是所謂的比例等級(jí)制計(jì)分,不少學(xué)者對(duì)此計(jì)分方法所導(dǎo)致的問(wèn)題多有討論(例如:陳愛(ài)文,胡銀泉,2017;柯政,2016;王小虎等,2017;于涵等,2018)。為了比較前后三批試點(diǎn)的選考科目計(jì)分方案及其問(wèn)題,這里對(duì)第一批的計(jì)分方案也作一些簡(jiǎn)要介紹。比例等級(jí)制的做法是預(yù)設(shè)比例按考生分?jǐn)?shù)排位劃分等級(jí)并賦分。以上海為例,11 個(gè)等級(jí)從高到底的比例依次為:最高的A+占5%,接著的9 個(gè)等級(jí)各占10%,最低等級(jí)E 占5%(見(jiàn)表1)。由于相等成績(jī)的考生等級(jí)要相同,而最低等級(jí)的劃分還有其他規(guī)定條件,因此在實(shí)踐中上述百分比只是一個(gè)約數(shù)。這就意味著,一個(gè)考生在選考科目上的最后得分,與該科試題的難易沒(méi)有關(guān)系,而是取決于他在該科分?jǐn)?shù)上的排位。在這一點(diǎn)上,選考科目實(shí)行比例等級(jí)制賦分與在選考科目使用標(biāo)準(zhǔn)分(這是1999 年—2006 年間廣東實(shí)行“3+X”時(shí)的做法)在本質(zhì)上是相同的。也就是說(shuō),如果成績(jī)(按百分等級(jí))的排位相同,那么最后的得分也就相同。這種做法在擺平選考科目難度的同時(shí),也抹平了不同選考科目考生整體能力的差異。

      表1 2017 年上海高考選考科目等級(jí)、比例與賦分

      這個(gè)方案的問(wèn)題出在兩個(gè)方面:一個(gè)與難度有關(guān),另一個(gè)與區(qū)分度有關(guān)。先說(shuō)第一個(gè)問(wèn)題。因?yàn)楸壤燃?jí)制類似于標(biāo)準(zhǔn)分,在擺平難度的同時(shí)也抹平了不同選考科目考生的整體能力差異,因而對(duì)科目整體能力較高的考生不利。這對(duì)物理科的影響較大,容易直接導(dǎo)致選考物理的考生變少。為了補(bǔ)救,上海和浙江都出臺(tái)了“保底”措施:如果物理考生人數(shù)少于保底人數(shù),按保底人數(shù)(上海物理保底人數(shù)是15000)計(jì)算,從高到低給考生定級(jí)賦分。這種設(shè)計(jì)的不合理之處很明顯:如果該科考生人數(shù)超過(guò)保底人數(shù),考生會(huì)繼續(xù)吃虧;如果該科考生人數(shù)只有保底人數(shù)的一半左右,那么最差的一個(gè)考生也可以得到C+等級(jí)(55 分),也是不合理的。第二個(gè)問(wèn)題是分?jǐn)?shù)區(qū)間[40,70]的全距(最大值減去最小值)只有30,與必考科目的全距150 比較,標(biāo)準(zhǔn)差小了很多,因而區(qū)分度也低了很多。這種計(jì)分方法會(huì)讓選考科目變得不重要,因?yàn)樵谶@些科目上付出再多的努力也多不了幾分。

      第一個(gè)問(wèn)題會(huì)導(dǎo)致選考物理的人數(shù)受到影響,第二個(gè)問(wèn)題會(huì)讓選考科目發(fā)揮的作用不大。設(shè)想一下:如果非常多的人不愿意選考物理,或者說(shuō)選了的人也不會(huì)怎么努力學(xué)習(xí),這將產(chǎn)生什么樣的結(jié)果?不難想象,這樣的選考科目計(jì)分方案會(huì)對(duì)我們國(guó)家的教育乃至社會(huì)發(fā)展產(chǎn)生什么不可估量的影響。

      (二)新高考第二批試點(diǎn)的選考科目計(jì)分問(wèn)題

      在新高考第二批試點(diǎn)中,山東方案是一個(gè)代表。它與前面選考科目相同的地方在于還是采用比例等級(jí)制,不同的則是等級(jí)比例的設(shè)置和賦分規(guī)則:將每個(gè)選考科目的卷面原始分?jǐn)?shù),參照正態(tài)分布劃分為8 個(gè)等級(jí)并確定相應(yīng)比例(見(jiàn)表2);將8 個(gè)等級(jí)內(nèi)考生的原始分?jǐn)?shù)依照等比例轉(zhuǎn)換法則分別轉(zhuǎn)換到8 個(gè)分?jǐn)?shù)區(qū)間(最后一列),得到考生的等級(jí)成績(jī)(見(jiàn)圖1)(山東省人民政府,2018)。

      表2 山東高考選考科目等級(jí)、比例與賦分

      圖1 山東高考選考科目等級(jí)比例及計(jì)分規(guī)則

      相對(duì)于上海的方案而言,山東方案確實(shí)改進(jìn)了不少:一是分?jǐn)?shù)區(qū)間變大,增加了區(qū)分度;二是使用正態(tài)化等級(jí)比例而不是上海那樣的均勻等級(jí)比例(兩端除外);三是避免了同級(jí)必定同分的現(xiàn)象,使同一等級(jí)內(nèi)原始分?jǐn)?shù)的差異信息得以保留(于涵等,2018)。然而,這個(gè)方案還是在把各科難度擺平(嚴(yán)格來(lái)說(shuō)是幾乎擺平)了的同時(shí)也抹平了不同選考科目考生的整體能力差異。下面給出詳細(xì)解釋。

      以B 級(jí)為例。得到B 級(jí)考生的原始分?jǐn)?shù)有一個(gè)區(qū)間,原始分?jǐn)?shù)在區(qū)間中點(diǎn)以上(以下)的考生得分高于(低于)75.5(區(qū)間71~80 的中點(diǎn))。如果原始分?jǐn)?shù)在區(qū)間中點(diǎn)以上和以下的考生人數(shù)一樣多,那么B 級(jí)考生的等級(jí)成績(jī)平均分正好就是75.5。如果所有級(jí)別都是這種理想狀態(tài),那么考生的等級(jí)成績(jī)平均分為:

      其實(shí),根據(jù)等級(jí)比例的對(duì)稱性,我們也容易知道平均分等于最小值21 與最大值100 的均值。一般情況下,沒(méi)有上述的那么理想(通常是越靠近科目平均分的人數(shù)越密集),因而每個(gè)等級(jí)的平均分與理想狀態(tài)會(huì)有少許差異,但每個(gè)等級(jí)上的差異往往有正有負(fù)。正負(fù)抵消的結(jié)果是每個(gè)選考科目平均分與60.5 會(huì)很接近,尤其是當(dāng)考生人數(shù)比較多的時(shí)候(一個(gè)選考科目的考生一般都過(guò)萬(wàn)人)。

      退一步說(shuō),即使各科的等級(jí)成績(jī)平均分不完全相同,也改變不了對(duì)物理考生不利的狀況,甚至可能物理考生的這個(gè)平均分還比其他科考生的低呢。所以說(shuō),山東方案,還是和上海方案一樣對(duì)物理考生不利。而且,因?yàn)檫x考科目的分?jǐn)?shù)范圍比上海方案大,選考科目的重要性比較高,因而對(duì)物理考生的不利情況也會(huì)超過(guò)上海方案。

      第二批試點(diǎn)中的海南方案值得提一下:等級(jí)考試成績(jī)使用標(biāo)準(zhǔn)分計(jì)入高考總成績(jī);高考錄取總成績(jī)將由統(tǒng)一高考的語(yǔ)文、數(shù)學(xué)、外語(yǔ)3 個(gè)科目成績(jī)和考生自主選擇的學(xué)業(yè)水平等級(jí)考試的3 個(gè)科目成績(jī)組成,以標(biāo)準(zhǔn)分呈現(xiàn)(海南省人民政府,2018)。具體來(lái)說(shuō)就是,必考科目和選考科目都轉(zhuǎn)換為正態(tài)化標(biāo)準(zhǔn)分作為單科分:均值180、標(biāo)準(zhǔn)差30、分?jǐn)?shù)區(qū)間[60, 300]。在合成總分的時(shí)候,必考科目權(quán)重為1.5,選考科目權(quán)重為1,6 科相加成總分,然后再將總分轉(zhuǎn)換為正態(tài)化標(biāo)準(zhǔn)分作為高考綜合分:均值500、標(biāo)準(zhǔn)差100、分?jǐn)?shù)區(qū)間[100, 900](海南省教育廳,2020)。

      首先,海南方案在必考科目使用標(biāo)準(zhǔn)分,比其他使用原始分的方案要合理,這一點(diǎn)是很值得肯定的。其次,我們可以看一下選考科目在方案中的重要性。選考科目與必考科目的分?jǐn)?shù)全距比值,上海的是0.20,山東的是0.53,海南的是0.67。這個(gè)比值越小,說(shuō)明選考科目在高考總分中越不重要,其考生越?jīng)]有努力的動(dòng)機(jī);反之,這個(gè)比值越大,選考科目越重要,對(duì)整體能力高的選考科目考生群體越不利(在選考科目使用標(biāo)準(zhǔn)分或者比例計(jì)分的情況下)。

      相對(duì)于上海方案和山東方案來(lái)說(shuō),海南方案的選考科目重要性較高,對(duì)整體能力高的選考科目考生群體比較不利,但與當(dāng)年廣東“3+X”的標(biāo)準(zhǔn)分方案(溫忠麟, 羅冠中, 2006)相比較而言,海南新高考方案有下面幾方面的改進(jìn):一是當(dāng)年廣東方案中選考科目與必考科目的標(biāo)準(zhǔn)分合成總分的權(quán)重相同,即選考科目與必考科目的分?jǐn)?shù)全距比值是1,而海南方案的這個(gè)比值降為0.67;二是當(dāng)年廣東方案只有1 個(gè)選考科目,海南方案有3 個(gè)選考科目。綜合上面兩點(diǎn)可知,海南方案中的任何單個(gè)選考科目的重要性遠(yuǎn)低于當(dāng)年廣東方案的選考科目,這樣就減少了因?yàn)槭褂脴?biāo)準(zhǔn)分對(duì)某些科目帶來(lái)的不利結(jié)果。具體來(lái)說(shuō)就是,與當(dāng)年廣東使用的標(biāo)準(zhǔn)分方案比較,海南方案對(duì)物理科考生的不利程度減輕了很多。

      海南新高考方案還有一個(gè)改進(jìn)就是,單科標(biāo)準(zhǔn)分的區(qū)間由[100, 900]變成[60, 300],壓縮了分?jǐn)?shù)間距,可以解決新高考選考模式下選考人數(shù)少的科目分?jǐn)?shù)稀疏的現(xiàn)象。這可以避免單科原始分的一分之差可能導(dǎo)致單科標(biāo)準(zhǔn)分甚至綜合標(biāo)準(zhǔn)分的不合理差距。

      (三)新高考第三批試點(diǎn)的選考科目計(jì)分問(wèn)題

      與前兩批試點(diǎn)相比,以江蘇省為代表的第三批方案有較大的變化:必考物理或歷史。具體來(lái)說(shuō)就是,除了語(yǔ)文、數(shù)學(xué)、外語(yǔ)3 科必考外,首先在物理、歷史中選擇1 科,再?gòu)乃枷胝?、地理、化學(xué)、生物中選擇兩科,考試分?jǐn)?shù)計(jì)入考生總分。必考三科使用滿分值150 的原始分(這與上海、山東的一樣),選考科目滿分值為100 分。物理、歷史科目以原始分計(jì)入總分;其余科目以等級(jí)分計(jì)入總分(江蘇省人民政府,2019)。

      這種做法可以解決前面兩批試點(diǎn)中許多考生不愿選考物理(還有歷史)的問(wèn)題,但得到的結(jié)果是:“理科生”必選物理,“文科生”必選歷史。如果招生的時(shí)候嚴(yán)格走兩條線(如計(jì)算機(jī)專業(yè)招物理考生、文學(xué)專業(yè)招歷史考生),就不存在這兩科分?jǐn)?shù)的可比性問(wèn)題,但在現(xiàn)實(shí)中有不少專業(yè)是兼招的(如心理學(xué)專業(yè)同時(shí)招物理和歷史考生),這樣就有選擇物理或歷史哪科更有利的問(wèn)題。與在選考科目使用比例等級(jí)制相比,直接使用原始分有可能對(duì)物理科考生更加不利,因?yàn)槲锢砜频钠骄直葰v史科的低。

      既然物理或歷史必考,那剩下四個(gè)選考科目對(duì)哪一科考生會(huì)比較不利?多數(shù)人擔(dān)心的是化學(xué)。原因有兩個(gè):一是重點(diǎn)大學(xué)需要化學(xué)的專業(yè)比需要生物的專業(yè)多,因而這兩科相比有更多優(yōu)秀考生選考化學(xué)(一般考生避強(qiáng)選弱就可能不會(huì)選化學(xué));二是化學(xué)的內(nèi)容較多、備考需要較長(zhǎng)時(shí)間(一般考生避難選易也可能不會(huì)選化學(xué))。四個(gè)選考科目如果還是使用比例等級(jí)制(加上“如果”是因?yàn)檫€未見(jiàn)公布具體做法),江蘇方案中的化學(xué)科可能會(huì)面臨第一批方案中物理科的局面,即選考化學(xué)的人數(shù)會(huì)減少。

      三、選考科目成績(jī)合理的校準(zhǔn)方法:擺平各科難度但不抹平考生群體成績(jī)

      從上面討論可知,目前國(guó)內(nèi)選考科目的定級(jí)和計(jì)分方法都是在擺平各選考科目難度的同時(shí)也抹平了各科考生的群體成績(jī),而抹平成績(jī)與各科考生群體實(shí)際上的能力差異是矛盾的,這就是問(wèn)題的根源。一種合理的做法是基于必考科目成績(jī)對(duì)選考科目成績(jī)進(jìn)行校準(zhǔn)(溫忠麟,2014,2017)。校準(zhǔn)方法有多種變式,其中一種變式是組別能力指數(shù)(羅冠中,2013)。從2012 年開始,香港就在中學(xué)文憑考試中采納了該方法。多年的實(shí)踐證明,該方法合理可行,不會(huì)系統(tǒng)出現(xiàn)考生選科時(shí)的“避強(qiáng)選弱”和“避難選易”的問(wèn)題(溫忠麟,2017)。

      為何國(guó)內(nèi)高考不設(shè)計(jì)一種基于必考科目成績(jī)對(duì)選考科目成績(jī)進(jìn)行校準(zhǔn)的方案呢?從部分政策制定者和專家那里,我們了解到了緣由,并收到了有代表性的看法和意見(jiàn)反饋:

      (1)基于必考科目的校準(zhǔn)方法復(fù)雜,難以接受;

      (2)對(duì)于考生而言,加分容易接受,減分很難接受;

      (3)回歸分析不能用來(lái)做等值;必考科目與選考科目沒(méi)有因果關(guān)系,不適合用回歸來(lái)做預(yù)測(cè);

      (4)用必考科目成績(jī)來(lái)校準(zhǔn)的話,如果一個(gè)考生很拔尖但他的選考科目考生群體在必考科目上的表現(xiàn)比較差,那么他會(huì)吃虧。

      下面我會(huì)逐一回答并澄清這些問(wèn)題。

      (一)基于必考科目成績(jī)的選考科目成績(jī)校準(zhǔn)方法可以很簡(jiǎn)單

      基于必考科目成績(jī)對(duì)選考科目成績(jī)進(jìn)行校準(zhǔn),這是一類方法,它有多個(gè)不同的變式,有的設(shè)計(jì)得比較復(fù)雜(溫忠麟,2017),但也可以設(shè)計(jì)得很簡(jiǎn)單。這里介紹一種比較簡(jiǎn)單的方法。

      首先,使用規(guī)定的比例等級(jí)表對(duì)全體考生的必考科目進(jìn)行定級(jí)。為了明確起見(jiàn),這里以山東省的等級(jí)賦分表為例(見(jiàn)上表2),但暫時(shí)不會(huì)涉及等級(jí)賦分,只用到等級(jí)比例(如A 等級(jí)占3%,等等)。根據(jù)這個(gè)等級(jí)表,每個(gè)考生在語(yǔ)文科和數(shù)學(xué)科各有一個(gè)等級(jí)。

      考慮到必考科目語(yǔ)文、數(shù)學(xué)和英語(yǔ)中有兩個(gè)都是文科科目,所以比較公平合理且簡(jiǎn)單的做法是:只基于語(yǔ)文和數(shù)學(xué)兩科成績(jī)對(duì)選考科目進(jìn)行校準(zhǔn)?,F(xiàn)在考慮某個(gè)選考科目,我們以物理科為例。假設(shè)物理科考生有4%的人在語(yǔ)文科獲得A 等級(jí),有10%的人在數(shù)學(xué)科獲得A 等級(jí),則物理科考生在語(yǔ)文和數(shù)學(xué)兩科獲得A 等級(jí)比例的平均值為7%。那么,就規(guī)定物理科考生7%的人獲得A 等級(jí)(而不是等級(jí)表上的3%)。同理可以計(jì)算物理科其他等級(jí)的人數(shù)比例。有了等級(jí)比例就可以得到等級(jí)切分點(diǎn),然后就可以按等比例轉(zhuǎn)換法則(見(jiàn)上圖1)計(jì)分了。

      這種校準(zhǔn)方法的優(yōu)勢(shì)在于,一方面它使物理科等級(jí)比例與物理科試題難度無(wú)關(guān),不論物理科試題的難易程度如何,其等級(jí)比例完全由物理科考生在語(yǔ)文和數(shù)學(xué)上的表現(xiàn)所決定。另一方面,它沒(méi)有把物理科考生的成績(jī)拉平到與其他選考科目上的一樣。

      關(guān)于這種校準(zhǔn)方法的合理性我在以前的有關(guān)文章中有詳細(xì)討論(溫忠麟,羅冠中,2006,2010),簡(jiǎn)單來(lái)說(shuō)就是:既然不同選考科目的試題難度不同,考生群體能力也不同,而最后的成績(jī)又要有可比性(計(jì)入總分進(jìn)行比較),那我們只好以考生在必考科目上的表現(xiàn)來(lái)進(jìn)行比較,以確定各科考生的群體能力。具體到每個(gè)考生,雖然不一定考生的語(yǔ)文、數(shù)學(xué)成績(jī)好,其選考科目成績(jī)就一定好,但選考科目考生群體(往往上萬(wàn)人),在各個(gè)科目上的能力分布可以認(rèn)為是近似的。

      (二)一個(gè)變式:校準(zhǔn)選考科目成績(jī)時(shí)只加不減

      對(duì)于考生及其家長(zhǎng)而言,加分容易接受,減分很難接受。校準(zhǔn)選考科目成績(jī)一個(gè)妥協(xié)的變式是在比例等級(jí)制基礎(chǔ)上只加不減,這樣也比不校準(zhǔn)要好很多。

      還是以山東方案的等級(jí)比例表為例。對(duì)選考科目只加不減的做法是,從高級(jí)別到低級(jí)別依次往下,使用累計(jì)比例進(jìn)行計(jì)算和比較,然后按只加不減的規(guī)則來(lái)定等級(jí)比例。首先考慮A 等級(jí)比例:如果按校準(zhǔn)方法計(jì)算的A 等級(jí)比例為5%(高于表中比例3%),則使用5%;如果計(jì)算的A 等級(jí)比例為2%(低于表中比例3%),則使用3%。然后考慮“B+及以上等級(jí)”比例(即累計(jì)比例),如果計(jì)算的“B+及以上等級(jí)”比例為11%(高于表中累計(jì)比例10%),則使用11%;如果計(jì)算的“B+及以上等級(jí)”比例為9%(低于表中累計(jì)比例10%),則使用10%。往下依次考慮“B 及以上等級(jí)”比例,“C+及以上等級(jí)”比例……最后是“E 及以上等級(jí)”比例為100%(有可能之前某一步的累計(jì)比例已經(jīng)達(dá)到100%,后面的就不用計(jì)算了)。

      表3 是選考科目X 科只加不減校準(zhǔn)方案的一個(gè)示例。第二、三行是設(shè)計(jì)的比例和累計(jì)比例(來(lái)自表2)。第四、五行是X 科考生在必考科目獲得的等級(jí)比例和累計(jì)比例。在每個(gè)等級(jí),取設(shè)計(jì)的等級(jí)累計(jì)(%)和X 科考生的必考科目等級(jí)累計(jì)(%)較大者,作為X 科等級(jí)累計(jì)(%)(倒數(shù)第二行),就可以計(jì)算X 科等級(jí)比例(%)(最后一行)。例如B+等級(jí),有11%的X 科考生在必考科目上獲得“B+及以上等級(jí)”,大于10%(設(shè)計(jì)的“B+及以上等級(jí)”),則X 科獲得“B+及以上等級(jí)”的比例為11%(這時(shí)比設(shè)計(jì)的高就是加了)。又如B 等級(jí),有24%的X 科考生在必考科目上獲得“B 及以上等級(jí)”,小于26%(設(shè)計(jì)的“B 及以上等級(jí)”),則X 科獲得“B 及以上等級(jí)”的比例為26%(這時(shí)跟隨設(shè)計(jì)就是不減)。

      表3 X 科只加不減的等級(jí)及其比例

      有了上面的那些累計(jì)比例,自然也就可以從上到下地計(jì)算每一個(gè)等級(jí)的比例。其實(shí),根據(jù)累計(jì)比例,已經(jīng)可以得到每個(gè)等級(jí)的切分點(diǎn),也就劃分了等級(jí)。但要留意的是,必須按表3 示范的那樣用等級(jí)累計(jì)比例去只加不減,而不能像本文第三部分第一節(jié)中所介紹的那樣計(jì)算每個(gè)等級(jí)比例去只加不減。原因很簡(jiǎn)單,如果每個(gè)等級(jí)比例都只加不減,那么所有等級(jí)比例之和就不止100%了。

      還有一種只加不減的校準(zhǔn)方法是:只對(duì)某個(gè)或某幾個(gè)選考科目進(jìn)行校準(zhǔn),也就是針對(duì)那些不校準(zhǔn)便對(duì)考生不利的科目。只加不減的校準(zhǔn)方法比一般的可加可減的校準(zhǔn)方法更容易被接受,尤其是在剛開始的時(shí)候。

      (三)選考科目分?jǐn)?shù)校準(zhǔn)中回歸分析的作用

      因?yàn)榛诒乜伎颇砍煽?jī)的選考科目成績(jī)校準(zhǔn)方法的一些變式在某個(gè)環(huán)節(jié)會(huì)涉及回歸分析,例如香港的中學(xué)文憑考試中使用的組別能力指數(shù)校準(zhǔn)方法(羅冠中,2013)就有回歸分析的環(huán)節(jié),因此有人質(zhì)疑“回歸方法不能用來(lái)做等值”“必考科目與選考科目沒(méi)有因果關(guān)系,不適合用回歸方法做預(yù)測(cè)”等等。前一個(gè)質(zhì)疑說(shuō)明質(zhì)疑者沒(méi)有理解回歸在其中扮演的角色,而后一個(gè)質(zhì)疑說(shuō)明質(zhì)疑者沒(méi)有明白回歸與因果的邏輯關(guān)系。由于兩個(gè)質(zhì)疑都與回歸有關(guān),所以我放在本小節(jié)一起討論。

      沒(méi)錯(cuò),回歸不能用來(lái)做等值,所以明晰回歸在選考科目成績(jī)校準(zhǔn)方法中的作用很重要。香港在中學(xué)文憑考試中使用的組別能力指數(shù)校準(zhǔn)方法中的回歸分析,是用來(lái)找權(quán)重的,而不是用來(lái)做等值的。本文第三部分第一節(jié)中介紹的方法,其實(shí)是將語(yǔ)文和數(shù)學(xué)的權(quán)重當(dāng)作一樣來(lái)看待,所以用的是等級(jí)比例的平均值。實(shí)際上,物理與數(shù)學(xué)的相關(guān)往往大于物理與語(yǔ)文的相關(guān),而歷史與語(yǔ)文的相關(guān)往往大于歷史與數(shù)學(xué)的相關(guān)。所以,用必考科目成績(jī)校準(zhǔn)選考科目成績(jī)的時(shí)候,使用不同的權(quán)重是更好的做法:校準(zhǔn)物理科成績(jī)的時(shí)候,數(shù)學(xué)權(quán)重大于語(yǔ)文權(quán)重;校準(zhǔn)歷史科成績(jī)的時(shí)候,語(yǔ)文權(quán)重大于數(shù)學(xué)權(quán)重。香港中學(xué)文憑考試中必考的四科(中文、英文、數(shù)學(xué)和通識(shí))都用來(lái)校準(zhǔn)選考科目成績(jī),使用了回歸方法去找四科的權(quán)重。不難理解,這樣找出來(lái)的權(quán)重,比用各科相等權(quán)重去校準(zhǔn)要好。

      按溫忠麟(2017)的分類,香港中學(xué)文憑考試的組別能力指數(shù)校準(zhǔn)方法屬于強(qiáng)假設(shè)下的校準(zhǔn)方法。此外,筆者也還提出了一種弱假設(shè)下的校準(zhǔn)方法,其中用到了多重相關(guān)系數(shù)R,這也是通過(guò)回歸分析得到的,而這里就涉及到了回歸預(yù)測(cè)的問(wèn)題。

      回歸不能做等值轉(zhuǎn)換的一個(gè)原因是,回歸方程中兩個(gè)變量的地位是不平等的,而等值關(guān)系中兩個(gè)變量是平等的。但如果只是用回歸來(lái)做預(yù)測(cè),關(guān)鍵就在于能否精準(zhǔn)預(yù)測(cè)到誤差可以忽略不計(jì)的問(wèn)題。用一個(gè)(或多個(gè))變量去預(yù)測(cè)另一個(gè)變量,能否通過(guò)回歸精準(zhǔn)地預(yù)測(cè),這取決于相關(guān)系數(shù)(或多重相關(guān)系數(shù))的大小,因?yàn)橹挥邢嚓P(guān)系數(shù)(或多重相關(guān)系數(shù))很接近1 時(shí),才能進(jìn)行精準(zhǔn)地預(yù)測(cè)。不同科目的成績(jī),通常相關(guān)系數(shù)都遠(yuǎn)小于1,所以單個(gè)的測(cè)驗(yàn)分?jǐn)?shù)不能通過(guò)回歸去預(yù)測(cè)。但就群體均值的預(yù)測(cè)而言,如果群體比較大,誤差則會(huì)很小。這里以通過(guò)身高來(lái)預(yù)測(cè)體重為例,試作說(shuō)明。假如只是預(yù)測(cè)一個(gè)身高1.7 米的單個(gè)人的體重,那么預(yù)測(cè)出來(lái)的體重與實(shí)際體重出入超過(guò)10 公斤都可能,預(yù)測(cè)誤差很大。但對(duì)于平均值為1.7 米的一群男性來(lái)說(shuō),預(yù)測(cè)他們的平均體重,會(huì)相當(dāng)準(zhǔn)確。而如果要預(yù)測(cè)的男性群體有1 萬(wàn)人,那么誤差大約是0.1 公斤(溫忠麟,2017)。在這里,身高與體重談不上等值的問(wèn)題,但卻可以用一個(gè)變量去做另一個(gè)變量的均值預(yù)測(cè)。

      或許有人會(huì)接著質(zhì)疑:上面說(shuō)的群體均值的預(yù)測(cè)誤差很小,指的是從大總體中隨機(jī)抽取的一群人,而現(xiàn)在選考科目考生群體不是隨機(jī)抽取的,那還可以預(yù)測(cè)嗎?這個(gè)說(shuō)法有點(diǎn)道理。以選考物理科的考生為例,如果放到全體考生來(lái)看,選考物理科的考生的物理平均成績(jī),應(yīng)當(dāng)比隨機(jī)抽取的一群考生(該群考生的語(yǔ)文和數(shù)學(xué)成績(jī)與選考物理的考生群體的語(yǔ)文和數(shù)學(xué)成績(jī)相當(dāng))的物理成績(jī)要好。這就說(shuō)明,回歸預(yù)測(cè)的成績(jī)只是選考物理科的考生平均成績(jī)的一個(gè)下限,選考物理科的考生平均成績(jī)至少應(yīng)當(dāng)校準(zhǔn)到預(yù)測(cè)值那里。換句話說(shuō),物理科考生用回歸預(yù)測(cè)值去校準(zhǔn)還是太保守了,這就是為什么可以建議在R 與1 之間讓專家設(shè)置一個(gè)值去校準(zhǔn)(溫忠麟,2017)。

      對(duì)于“必考科目與選考科目沒(méi)有因果關(guān)系,不適合用回歸方法做預(yù)測(cè)”這個(gè)質(zhì)疑,也很容易證明它是一個(gè)錯(cuò)誤的看法。這個(gè)質(zhì)疑的逆否命題為“適合用回歸方法做預(yù)測(cè)的關(guān)系,是因果關(guān)系”。一個(gè)命題與它的逆否命題等價(jià)。眾所周知,“適合用回歸方法做預(yù)測(cè)的關(guān)系,是因果關(guān)系”是錯(cuò)誤的,所以“必考科目與選考科目沒(méi)有因果關(guān)系,不適合用回歸方法做預(yù)測(cè)”也是錯(cuò)誤的。

      (四)選考科目分?jǐn)?shù)校準(zhǔn)后拔尖考生不會(huì)吃虧

      選考科目的分?jǐn)?shù)校準(zhǔn)是在群體層面進(jìn)行的,如果一個(gè)選考科目群體在必考科目上的表現(xiàn)較差,意味著校準(zhǔn)后該群體在選考科目上的成績(jī)也比較差。那么,一個(gè)拔尖的考生,如果其所在群體的必考科目成績(jī)比較差,他會(huì)不會(huì)吃虧呢?

      如果考生甲在一個(gè)選考科目上拔尖,那么只要該選考科目群體有少數(shù)人在必考科目上獲得A 等級(jí),考生甲在該選考科目就可以獲得A 等級(jí)了。如果考生甲在必考科目上拔尖,在選考科目上應(yīng)當(dāng)也不會(huì)太差(因?yàn)樗梢赃x考他比較擅長(zhǎng)的科目)。如果他的選考科目群體在必考科目上的表現(xiàn)較差,說(shuō)明該科考生整體能力較低,那么他的必考科目表現(xiàn)會(huì)更加突出,即所謂的“小塘大魚效應(yīng)”(Ludtke et al.,2005)。就算他的選考科目成績(jī)一般,在錄取的競(jìng)爭(zhēng)中也還是更有對(duì)比優(yōu)勢(shì)。道理很簡(jiǎn)單,因?yàn)榧自诒乜伎颇可习渭?,而與其競(jìng)爭(zhēng)的同科考生群體又在必考科目上表現(xiàn)較差,他就像一個(gè)在全球都算得上是富豪的人去到一個(gè)窮國(guó)一樣,顯得更加富有。

      還有一個(gè)相反的問(wèn)題就是:一個(gè)很差的考生,在一個(gè)最出色的選考科目群體中會(huì)不會(huì)占便宜?這是有可能的。一個(gè)最差的考生,在所有的選考科目都是墊底的話,這時(shí)他如果在最出色的選考科目群體中墊底是比較合算的。就像一個(gè)最窮的人,與其在一個(gè)窮國(guó)當(dāng)窮人,不如在一個(gè)富國(guó)當(dāng)窮人。不過(guò),這樣的考生,不管他選考什么都改變不了會(huì)落榜的結(jié)果。

      當(dāng)然,人們總可以舉出一些特定的個(gè)案,認(rèn)為用必考科目成績(jī)校準(zhǔn)選考科目成績(jī)時(shí)或多或少會(huì)吃虧,但這種選考科目校準(zhǔn)方法的關(guān)鍵在于,它對(duì)各科公平。必考科目是每位考生都要考的,用必考科目作為校準(zhǔn)的依據(jù),對(duì)每一個(gè)選考科目的考生而言都是比較公平的。

      四、結(jié)語(yǔ)

      新高考中的選考科目定級(jí)計(jì)分方法,第一批的兩個(gè)省(市)在實(shí)施一次后就需要推出“保底”措施。以山東為代表的第二批試點(diǎn)省份在同一等級(jí)上做分?jǐn)?shù)細(xì)化計(jì)分,但還是在把各選考科目難度擺平的同時(shí)也抹平了不同選考科目考生的整體能力差異,沒(méi)有解決根本問(wèn)題。與第一批試點(diǎn)省份一樣,第二批試點(diǎn)改革對(duì)物理科考生不利。

      以江蘇省為代表的第三批試點(diǎn)省份,要求物理和歷史必選一科。如果大學(xué)在招生的時(shí)候沒(méi)有交叉錄取,那就沒(méi)有問(wèn)題,否則這兩科也存在分?jǐn)?shù)比較的問(wèn)題。因?yàn)?,直接使用原始分有可能?duì)物理科考生更加不利。至于其余四科(化學(xué)、生物、政治、地理)由于是自由選考,如果還是使用比例等級(jí)制計(jì)分的話,對(duì)差生及少人去選的科目比較不利,并且會(huì)惡性循環(huán)。

      新高考改革從第一批試點(diǎn)到第三批試點(diǎn)所采用的選考科目定級(jí)計(jì)分方法表明,前一批的方法有問(wèn)題,而后一批出現(xiàn)的問(wèn)題也亟待規(guī)避和解決。一個(gè)問(wèn)題解決了,另一個(gè)問(wèn)題又來(lái)了:在用簡(jiǎn)單的方法擺平選考科目難度的同時(shí),也抹平了選考科目考生整體能力實(shí)際上存在的差異。

      選考科目考生群體能力是動(dòng)態(tài)變化的,不同科目考生群體之間是存在差異的,而這種差異在不同年份之間也會(huì)發(fā)生變化。如果不將上述差異和變化考慮在內(nèi)的任何定級(jí)計(jì)分方法,都注定會(huì)有問(wèn)題。例如,發(fā)現(xiàn)某科考生吃虧了,就將其分?jǐn)?shù)提高(提高平均分),雖然有可能會(huì)吸引更多差生去選考,但下一年該科考生的整體能力就下降了,因此繼續(xù)按上一年方法來(lái)處理就會(huì)有問(wèn)題。根據(jù)必考科目成績(jī)校準(zhǔn)選考科目成績(jī)的方法,依據(jù)的是每一年每一科選考群體的必考科目成績(jī),因此能夠同時(shí)考慮到上述的差異和變化,可以系統(tǒng)性地解決問(wèn)題。

      嚴(yán)格來(lái)說(shuō),不同的選考科目成績(jī)不好比較。如果不需要合成高考總分,只需分別報(bào)告各科成績(jī),然后由高校根據(jù)各科成績(jī)?nèi)フ猩?,那么?duì)選考科目成績(jī)不進(jìn)行校準(zhǔn),問(wèn)題也不大。但既然要合成高考總分,相當(dāng)于要比較選考科目成績(jī),那么用必考科目成績(jī)做參照去校準(zhǔn)選考科目成績(jī)是比較合理的。它雖然不是最好的方法,但卻是經(jīng)實(shí)踐檢驗(yàn)過(guò)的可行的方法。此外,我們還可以結(jié)合基于課程標(biāo)準(zhǔn)的專家校準(zhǔn),做出比較合理的選考科目計(jì)分方案。

      猜你喜歡
      標(biāo)準(zhǔn)分計(jì)分科目
      2024年擬在河北招生的普通高校招生專業(yè)選考科目要求發(fā)布
      考試與招生(2022年2期)2022-03-18 08:10:02
      帶定性判斷的計(jì)分投票制及其公理刻畫
      引導(dǎo)素質(zhì)教育的新高考計(jì)分模式構(gòu)想:線性轉(zhuǎn)化計(jì)分模式
      基于單片機(jī)的中國(guó)式摔跤比賽計(jì)分器開發(fā)設(shè)計(jì)
      電子制作(2019年9期)2019-05-30 09:42:06
      EXCEL在數(shù)據(jù)處理中的實(shí)踐分析
      大科技(2016年11期)2016-08-04 00:51:44
      讓討厭的科目“牛”起來(lái)
      計(jì)分考核表在績(jī)效管理中的應(yīng)用效果
      重新認(rèn)識(shí)成績(jī)
      CET評(píng)分標(biāo)準(zhǔn)改革分析
      理性回歸標(biāo)準(zhǔn)分
      考試周刊(2009年28期)2009-09-10 06:26:24
      四会市| 洛阳市| 弥渡县| 屯门区| 马边| 东城区| 河西区| 化德县| 郯城县| 长武县| 普兰县| 皋兰县| 庆城县| 达孜县| 渝北区| 博爱县| 白水县| 永靖县| 长武县| 汤阴县| 织金县| 安仁县| 盐边县| 济宁市| 德保县| 万宁市| 含山县| 涞水县| 安西县| 平阴县| 盐山县| 尼木县| 邯郸市| 思南县| 西乡县| 邹平县| 庆阳市| 台北市| 开化县| 三台县| 广河县|