張勁英 孫凱
[摘要]學(xué)業(yè)成績是高校學(xué)生學(xué)業(yè)成就評價的主要指標(biāo),也是高等教育評價的核心內(nèi)容??茖W(xué)的學(xué)生成績評定對反映教學(xué)的真實情況、提高教學(xué)質(zhì)量和促進教學(xué)改革至關(guān)重要。本文在把握相關(guān)研究與實踐成果的基礎(chǔ)上,針對我國高校學(xué)生成績評定的現(xiàn)狀,在觀測點選擇、數(shù)據(jù)分析方面提出了一些操作性較強的改進方案。
[關(guān)鍵詞]高等教育 學(xué)業(yè)成績 教育評價
[中圖分類號]G647
[文獻標(biāo)識碼]A
[文章編號]1005-5843(2013)02-0011-04
學(xué)生學(xué)習(xí)成效的評價對于高校檢查和提高教學(xué)質(zhì)量、優(yōu)化學(xué)生管理以及推動教育教學(xué)改革都具有極其重要的意義。如何在教育部下一輪本科教學(xué)評估中加強對學(xué)生學(xué)習(xí)成效的關(guān)注,已成為高等教育理論與實踐關(guān)注的熱點。高校學(xué)生學(xué)習(xí)成績是反映學(xué)生專業(yè)發(fā)展成果與潛力的一個重要指標(biāo),也是高校甄選學(xué)生、評定獎學(xué)金、授予學(xué)位等活動的重要依據(jù),是高等學(xué)校教學(xué)和學(xué)生管理的重要內(nèi)容。學(xué)業(yè)成績評價是否科學(xué)、嚴(yán)謹(jǐn),關(guān)乎高校教學(xué)與管理的權(quán)威性與公正性。然而,對比學(xué)業(yè)成績所蘊含的豐富教育質(zhì)量信息和實際利害關(guān)系,我國高等教育管理的理論研究與實踐所做的探討與分析并不多見。這固然與高校有關(guān)部門的管理模式和技術(shù)平臺不一、信息共享和數(shù)據(jù)交換缺乏相應(yīng)的規(guī)范與標(biāo)準(zhǔn)所造成的“信息孤島”有關(guān),而更重要的原因在于高校的教學(xué)、科研、管理活動對于如何從學(xué)業(yè)成績的數(shù)據(jù)資源人手,考察學(xué)生的學(xué)術(shù)成長、提高教育教學(xué)質(zhì)量管理,缺乏必要的理論與實踐準(zhǔn)備。
有鑒于此,本文在把握相關(guān)研究與實踐發(fā)展成果的基礎(chǔ)上,針對我國高校學(xué)業(yè)成績評價的現(xiàn)實與問題,在觀測點選擇、數(shù)據(jù)分析等方面提出了一些操作性較強的方案,以期對我國當(dāng)前高校的教育質(zhì)量管理相關(guān)研究與實踐有所助益。
一、高校學(xué)生成績的評價應(yīng)用與適切性探討:國外的經(jīng)驗
高等教育階段的學(xué)生學(xué)業(yè)成績評價主要依賴國家統(tǒng)一進行的標(biāo)準(zhǔn)化考試和高校校內(nèi)考試系統(tǒng)。以美國高等教育的研究與實踐為例,研究生入學(xué)考試等標(biāo)準(zhǔn)化學(xué)業(yè)考試成績、就學(xué)期間常規(guī)學(xué)習(xí)的成績表現(xiàn)——平均學(xué)分績點等往往作為典型指標(biāo)為研究者所采用。根據(jù)研究與實踐的需要,研究者與管理部門可以計算學(xué)生的所有課程平均學(xué)分績點、必修課程平均學(xué)分績點或核心課程平均績點等,以便更細致地了解學(xué)生的學(xué)業(yè)發(fā)展情況。
學(xué)習(xí)成績相對于其他的學(xué)業(yè)表現(xiàn)反饋有便于量化、反饋及時、客觀可靠、可比性強等優(yōu)點,其局限之處則在于考試成績對短期記憶是很好的衡量工具,對長期的學(xué)習(xí)效果評價效果則未必理想。而就平均學(xué)分績點這一指標(biāo)而言,由于計入了學(xué)生多樣化的課程成績,平均學(xué)分績點對學(xué)生的綜合能力是一個很好的反映;局限之處也正在于平均學(xué)分績點往往以學(xué)生的科目期末成績?yōu)榛A(chǔ),反映的是學(xué)生課程學(xué)習(xí)的整體情況,但不能反映學(xué)生在特定學(xué)習(xí)任務(wù)中的表現(xiàn)。而且,成績實際上是教師在特定環(huán)境下對學(xué)生表現(xiàn)的評價,具體的評價結(jié)果受教師的個人背景因素和環(huán)境因素(包括宏觀層面的社會、院校、學(xué)科結(jié)構(gòu))的影響。而具體到每一項課程考試成績,影響因素則不僅有教師的授課質(zhì)量、學(xué)生掌握知識的程度、考題的取樣、命題的方法和難度等,還有考試的組織形式以及學(xué)生的臨場發(fā)揮等諸多方面。
此外,當(dāng)前大學(xué)生在校學(xué)習(xí)的成績的確也面臨一些公信力質(zhì)疑,主要體現(xiàn)為研究者對“分?jǐn)?shù)膨脹”、“分?jǐn)?shù)壓縮”和“成績不對等”等問題的關(guān)注。分?jǐn)?shù)膨脹即學(xué)習(xí)成績的“水分”,有隱性和顯性之分。隱性的分?jǐn)?shù)膨脹指的是教師背景相似、背景和學(xué)業(yè)表現(xiàn)具有可比性的兩組學(xué)生,后期的學(xué)生比早期的學(xué)生得到的成績普遍較高的現(xiàn)象;顯性的分?jǐn)?shù)膨脹則是由于教師特點、院校政策等原因造成的。分?jǐn)?shù)壓縮是指分?jǐn)?shù)在體現(xiàn)學(xué)生表現(xiàn)上的區(qū)分功能下降。當(dāng)分?jǐn)?shù)膨脹問題出現(xiàn)時,由于分?jǐn)?shù)過于集中,不能很好地區(qū)分學(xué)生的表現(xiàn)。成績不對等指的是不同學(xué)科、課程的打分標(biāo)準(zhǔn)存在實質(zhì)性差異所帶來的分?jǐn)?shù)可比性問題。
國外的實證研究中,分?jǐn)?shù)不對等的確是一個比較嚴(yán)重的問題。為此,研究者們需要借助計算標(biāo)準(zhǔn)分成績等方法使成績相對可比。高等教育的實際工作者們更關(guān)注的是分?jǐn)?shù)膨脹和壓縮所帶來的學(xué)業(yè)成就評價權(quán)威性與公正性問題。美國的實證研究證實,院校層面的GPA的確有逐年上升的趨勢,但分?jǐn)?shù)膨脹的問題尚不嚴(yán)重。其中,顯性的分?jǐn)?shù)膨脹并不普遍,隱性的分?jǐn)?shù)膨脹則相對得到了較多實證研究的確認。其原因在于,學(xué)生選課是推高學(xué)生個人和院校GPA的機制。雖然分?jǐn)?shù)上升和分?jǐn)?shù)膨脹會導(dǎo)致分?jǐn)?shù)的區(qū)分度下降,但國外的文獻回顧表明,實證研究尚未發(fā)現(xiàn)分?jǐn)?shù)壓縮的現(xiàn)象。當(dāng)然,如果分?jǐn)?shù)持續(xù)上升,分?jǐn)?shù)壓縮可能就不可避免了。
二、我國高校學(xué)生成績評價的實踐與問題
我國高等教育階段的學(xué)生學(xué)業(yè)成就評價也依賴標(biāo)準(zhǔn)化考試和高校校內(nèi)考試系統(tǒng)。目前,我國高校學(xué)生參與程度較高的大規(guī)模標(biāo)準(zhǔn)化考試是大學(xué)英語考試。作為一項全國性的標(biāo)準(zhǔn)化英語水平綜合測試,大學(xué)英語考試成績的分?jǐn)?shù)具有客觀、權(quán)威等優(yōu)點,其局限在于考試的內(nèi)容只是英語語言知識和語言技能,且基本形式為多項選擇題,對學(xué)生語言綜合運用能力和語言交際能力的考查相對不足。對學(xué)生大學(xué)英語考試成績的考查,可以采取考試等級、考試成績、考試成績是否通過、是否首次參加考試即通過等觀測指標(biāo)。
受標(biāo)準(zhǔn)化考試的實施條件限制,校內(nèi)紙筆考試、課程論文、課堂學(xué)習(xí)評價、專業(yè)實踐(包括綜合實踐、實驗、實習(xí)和實訓(xùn))構(gòu)成了學(xué)生學(xué)習(xí)評價的主要環(huán)節(jié)。校內(nèi)考試是評價的核心,具有簡單易行、省時經(jīng)濟、適應(yīng)性強等特點,缺點則在于由于高校中許多課程沒有統(tǒng)一的課程綱要,更沒有學(xué)科教學(xué)質(zhì)量評價指標(biāo)體系,教師命題主觀性很強,可能談不上考題的信度、效度、難度和區(qū)分度。
每一種學(xué)習(xí)評價的指標(biāo)都有其利弊優(yōu)長。作為學(xué)生學(xué)習(xí)成效的關(guān)鍵量化指標(biāo),國外的研究與實際工作者對學(xué)習(xí)成績指標(biāo)的精確性與適切性進行了不斷的推敲、驗證。對比國外的經(jīng)驗,我國對于把考試成績作為唯一評價標(biāo)準(zhǔn)和考試成績評定偏頗之處的批評不絕于耳;與此同時,考試成績作為高校甄選優(yōu)秀學(xué)生、評定獎學(xué)金、授予學(xué)位等工作的重要依據(jù),由于評價制度與技術(shù)都欠缺規(guī)范,其權(quán)威性和公正性都受到質(zhì)疑。另外,由于不明晰指標(biāo)的結(jié)構(gòu)與功能,考試成績本身也被寄予了過于理想化的預(yù)期??荚嚦煽兪菍W(xué)習(xí)評價的“硬數(shù)據(jù)”,但它無法體現(xiàn)教育產(chǎn)出的其他重要表現(xiàn)形式,如學(xué)生的態(tài)度和價值觀的轉(zhuǎn)變等等。嚴(yán)格地講,這也不是考試成績作為學(xué)業(yè)成就評價指標(biāo)的題中應(yīng)有之義。構(gòu)建有利于學(xué)生全面發(fā)展的學(xué)習(xí)評價體系是一個系統(tǒng)的工程,需要理論的積累、技術(shù)的普及以及大規(guī)模調(diào)查數(shù)據(jù)和實證研究的支持與驗證,因而尚待時日。然而,基于已有的理論與實踐積累,針對我們目前在學(xué)習(xí)成績評定中的現(xiàn)實問題,盡量科學(xué)、嚴(yán)謹(jǐn)?shù)亓炕治鰧W(xué)習(xí)成績,是頗為自然的現(xiàn)實選擇。因此,筆者將就我國高校學(xué)生平均學(xué)分績點的計算與分析提出一些方法上的探討,以期對評價的規(guī)范化有所助益。
三、高校學(xué)生平均學(xué)分績點分析與計算方法探討
1 計分制度與分?jǐn)?shù)計算
按照國外的高等教育傳統(tǒng),課程成績評定較多采用五級制評分或多級制評分制度,并以相對應(yīng)的數(shù)值計分,這種數(shù)值就稱為績點。學(xué)生的課程平均成績也就相應(yīng)按點計算,其他教學(xué)管理也都以此為基礎(chǔ)。計算平均學(xué)分績點一般是將學(xué)生某一教學(xué)階段的每門課程的成績乘以學(xué)分,加起來以后除以總的學(xué)分得出平均分。我國高校主要采取百分制的課程計分方式。但自從20世紀(jì)90年代推行學(xué)分制以來,高?;旧隙疾捎每凕c制作為其配套措施,于是產(chǎn)生了課程考核成績與績點的轉(zhuǎn)換問題。不少研究者圍繞如何將百分制成績、五級制成績和二級制成績轉(zhuǎn)化成相應(yīng)績點的科學(xué)性和合理性進行探討,提出了不同的思路和方法。教學(xué)管理實踐中多將百分制成績硬性轉(zhuǎn)換為績點制,采用的績點換算方法不一,有段——點型、點——點型、連續(xù)型。由于早期五點制績點數(shù)之間跨度過大,不易區(qū)分學(xué)生成績的差別,部分學(xué)校將學(xué)生成績由5個分?jǐn)?shù)段增加到8個或更多,并增加相應(yīng)的績點等級。也有研究者認為,學(xué)分制客觀上并不需要進行成績與績點的轉(zhuǎn)換,而且成績與績點轉(zhuǎn)換雖然逐步得到細化,但績點制的精確度和區(qū)分度始終不如百分制,因此這種轉(zhuǎn)化總會產(chǎn)生誤差,所以以百分制直接計算平均學(xué)分績點是最合理的。這種做法的局限在于在國際交流中可能會造成一些溝通的障礙。我們在進行校內(nèi)教學(xué)管理或者科研用途的成績分析時,可以不必顧慮這一局限。
除百分制之外,國內(nèi)高校往往還同時存在特殊計分制度——二級制、四級制的情況。處理采用特殊計分制度的課程成績,可以采取不同的方案。方案一是對特殊計分成績按一定換算方法進行百分制換算。如某高校的學(xué)籍管理規(guī)定中的《考核與成績記載》規(guī)定,百分制與四級制的換算標(biāo)準(zhǔn)是:85~100分為優(yōu)秀(A);70~84分為良好(B);60~69分為及格(C);未達60分為不及格(F)。而該高校的教學(xué)管理部門在實際操作中,將四級制成績按上述標(biāo)準(zhǔn)換算成百分制,按每一個四級制計分標(biāo)準(zhǔn)中所對應(yīng)的最高百分制分?jǐn)?shù)計入。兩級制成績則不計入加權(quán)平均成績。
將特殊計分轉(zhuǎn)化成百分制的做法并不符合統(tǒng)計科學(xué)。百分制計分對分?jǐn)?shù)的測度比四級制和二級制更精確、高級。測度精確程度不同的數(shù)據(jù)無法直接合并計算。由于高精度的數(shù)據(jù)擁有低精度數(shù)據(jù)的全部特性,我們可以將數(shù)據(jù)做精度由高到低的轉(zhuǎn)換,如將百分制計分轉(zhuǎn)化為五分制,但反之卻不行。另外,如果為了遷就特殊計分而將百分制成績轉(zhuǎn)化為四級、二級制計分,雖然可行但將極大地損失數(shù)據(jù)的精確性。
另一方案是在不同分制的科目性質(zhì)可以區(qū)分的情況下(如所考查知識類型、考試的組織形式、命題的方法等),將不同分制性質(zhì)的成績區(qū)別對待,不但能滿足成績統(tǒng)計的精確性要求,而且排除了分?jǐn)?shù)差異的課程體制等因數(shù)。實際上,高校課程中采取特殊計分方法的課程往往在教學(xué)環(huán)節(jié)、教學(xué)內(nèi)容和模式、教學(xué)要求、成績評定方式等方面也與一般的課堂教學(xué)科目有很大不同。因此某些學(xué)校在學(xué)籍管理中明確規(guī)定社會實踐不計入平均學(xué)分,或公共選修課不記入學(xué)籍。
平均學(xué)分績點計算的一個重要問題在于原始的學(xué)習(xí)成績具有不等值、無橫向可比性和不能反應(yīng)個體在團體中的相對位置等缺點,于是有研究者提出了以標(biāo)準(zhǔn)分型績點消除上述缺點的設(shè)計。成績標(biāo)準(zhǔn)化處理過程如下:
其中,Xi(S)表示某學(xué)生第i門課程的考核成績,Xi表示第i門課程的學(xué)分,δi為第i門程對應(yīng)教學(xué)群體中全體學(xué)生的該課程考核成績標(biāo)準(zhǔn)差,n表示選修i課程學(xué)生數(shù)。為了照顧計分習(xí)慣,還可將標(biāo)準(zhǔn)分?jǐn)?shù)還原成百分制分?jǐn)?shù)或者績點。經(jīng)過標(biāo)準(zhǔn)化處理后的分?jǐn)?shù)可以把不同教學(xué)群體間取得分?jǐn)?shù)的差異在算法中得到體現(xiàn),使教學(xué)群體間的學(xué)生成績比較成為可能。值得注意的是,標(biāo)準(zhǔn)分績點的具體計算方法假設(shè)成績服從正態(tài)分布,而現(xiàn)實中的課程成績分布幾乎不可能滿足這樣的理論要求。我們可以通過SPSS、Excel和Stata等統(tǒng)計軟件繪制直方圖或者密度曲線獲得學(xué)生成績的分布狀態(tài)。如果學(xué)生成績的分布與正態(tài)分布相差不大,則可基本忽略由此引起的誤差。如果實際成績分布偏離正態(tài)分布程度較大,在進行成績標(biāo)準(zhǔn)化處理之前應(yīng)先將其正態(tài)化。數(shù)據(jù)正態(tài)化的方法,要視學(xué)生成績的原始分布狀態(tài)而定(筆者根據(jù)若干種偏態(tài)可能列出了處理非正態(tài)成績的方法,如表1所示)。此外,考慮到不同課程的難易程度和重要性不同,還有研究者提出引入難度及重要性修正系數(shù)對成績加以區(qū)分。這種方法在原理和技術(shù)層面具有一定合理性,但在實際操作中很難界定不同課程的難度和重要性,因此實踐層面的可行性并不高。
2 課程范圍
選擇哪些科目的成績進入平均學(xué)分績點的計算,實踐操作中也有不同的做法。比如美國高中階段平均學(xué)分績點的計算,有些學(xué)校將全部課程都計入,有些學(xué)校則將非學(xué)術(shù)課程,如健康教育、體育、表演等排除在GPA的計算之外,只考慮“學(xué)術(shù)核心”課程的平均學(xué)分績點。這種計算方式得到的學(xué)分績點稱作核心平均學(xué)分績點。核心平均學(xué)分績點主要包括五個領(lǐng)域的學(xué)術(shù)表現(xiàn):數(shù)學(xué)、英語和語言藝術(shù)、社會科學(xué)、科學(xué)和外語。高選擇性的大學(xué)在招生過程中,也會將GPA當(dāng)中的“軟信息”剝離,只考慮學(xué)生的核心學(xué)術(shù)能力。我國也有高校在學(xué)籍管理中明確規(guī)定軍訓(xùn)、健康教育、體育課、任選課等教學(xué)環(huán)節(jié)的成績不計入平均學(xué)分績點。因此,筆者建議在計算GPA時只考察學(xué)生的智育課程成績,而將體育、德育課程另作評價。此外,由于藝術(shù)、表演等藝術(shù)類專業(yè)高校學(xué)生在入學(xué)標(biāo)準(zhǔn)、課業(yè)學(xué)習(xí)方面均與其他學(xué)科、專業(yè)的學(xué)生有本質(zhì)的區(qū)別,對他們的在校學(xué)業(yè)表現(xiàn)分析也應(yīng)有所區(qū)別。
考慮到不同課程范圍的成績對學(xué)生學(xué)習(xí)能力和興趣反應(yīng)的綜合程度不同,我們可以計算不同課程范圍的學(xué)生課程GPA。目前,高校在對學(xué)生進行與獎學(xué)金、研究生推薦等有關(guān)的成績評價時會將所有學(xué)術(shù)課程的成績計人,這樣做的優(yōu)點是能最大范圍地衡量學(xué)生的學(xué)業(yè)表現(xiàn)與興趣,但其中包含的選修課可能是學(xué)生不太重視的課程。必修課程是大多數(shù)學(xué)生都重視的課程,因此必修課程GPA能更集中體現(xiàn)學(xué)生的學(xué)習(xí)能力。另外,公共基本課程中的數(shù)學(xué)、英語反映的是學(xué)生的基本學(xué)習(xí)能力與興趣,專業(yè)必修課程反映的是學(xué)生與專業(yè)相關(guān)的能力和興趣。這兩部分課程是學(xué)生學(xué)習(xí)能力與興趣的最核心體現(xiàn)。
高校學(xué)生學(xué)業(yè)成績的評定是一項重要的教學(xué)與管理環(huán)節(jié),牽涉到學(xué)校教學(xué)質(zhì)量評估與管理、學(xué)生評價與就業(yè)等工作的實施。因此,在研討國內(nèi)外高校學(xué)生學(xué)業(yè)成績管理的基礎(chǔ)上不斷提高其科學(xué)性,既是高校教學(xué)、管理的實際問題,也是高等教育研究的重要課題??偟膩碚f,清晰的評價目的、適當(dāng)?shù)闹笜?biāo)和觀測點選擇、恰切的結(jié)果解釋、合理的統(tǒng)計技術(shù)的采用是科學(xué)、嚴(yán)謹(jǐn)?shù)膶W(xué)習(xí)成績評定始終應(yīng)遵循的原則。
(責(zé)任編輯:劉新才)