李超鋒,張勁松(中南民族大學(xué) 管理學(xué)院,武漢 430074)
2019年教育部發(fā)布的《關(guān)于深化本科教育教學(xué)改革 全面提高人才培養(yǎng)質(zhì)量的意見》把學(xué)生評價作為高校教學(xué)質(zhì)量評價與保障體系的重要維度,提出要完善高校內(nèi)部教學(xué)質(zhì)量評價體系,全面推進質(zhì)量文化建設(shè). 近年來,隨著我國高校“雙一流”建設(shè)的實施,學(xué)生評教及對評教數(shù)據(jù)的分析已經(jīng)成為各高校加強教學(xué)管理、實現(xiàn)質(zhì)量監(jiān)控、提高教育教學(xué)質(zhì)量的重要抓手. 學(xué)生評教是修課學(xué)生根據(jù)評價指標(biāo)和聽課感受對授課教師的課堂教學(xué)態(tài)度、教學(xué)規(guī)范、教學(xué)水平及教學(xué)效果等進行評價,進而通過對評價結(jié)果的分析和反饋提高教學(xué)質(zhì)量的一種活動. 對學(xué)生評教數(shù)據(jù)中有關(guān)教師背景特征與學(xué)生評教分數(shù)之間的關(guān)系進行分析,有利于高校人事管理部門和教學(xué)質(zhì)量監(jiān)控部門掌握不同背景教師的教學(xué)效果,進而為建立科學(xué)高效的教師管理制度體系提供科學(xué)依據(jù). 同時,也有利于任課教師分析自己課堂教學(xué)中存在的問題,進而有針對性地提升自己的教學(xué)素養(yǎng),落實“四個回歸”,培養(yǎng)高質(zhì)量人才.
長期以來,學(xué)界對于學(xué)評教的研究主要關(guān)注于對授課教師和學(xué)生之間的互動有確定性影響的主觀特征或因素. Google Scholar、Scopus和Web of Science被引量排名前75位的文獻研究主題都集中在學(xué)評教有效性、測量工具的構(gòu)建和驗證、利用學(xué)評教結(jié)果評估教學(xué)績效三個方面[1],而對于學(xué)生評教分數(shù)是否與教師客觀背景特征相關(guān)的研究既不全面,也不夠深入. 在國外,MACNELL研究發(fā)現(xiàn)大部分學(xué)生對男教師的評價更高[2],而WOLBRING的研究結(jié)果則與此相反[3];FIGLIO研究認為學(xué)評教分數(shù)會隨教師職稱的升高而上升[4],ALEAMONI則認為教師職稱的高低與學(xué)評教分數(shù)之間沒有相關(guān)性[5];COHEN對學(xué)評教分數(shù)分析后認為教師教齡與學(xué)評教分數(shù)之間呈現(xiàn)正向線性關(guān)系[6],NEAL則認為年長教師往往比年輕教師獲得更低的評分[7]. 在國內(nèi),教師背景特征是否影響學(xué)生評教分數(shù)的研究結(jié)論也存在爭議. 性別方面,戴璨研究發(fā)現(xiàn)教師性別顯著影響學(xué)生評教分數(shù)[8];郭娟的數(shù)據(jù)分析表明女教師好評率高于男教師,差評率低于男教師[9];趙偉春的研究結(jié)果則顯示教師的性別對學(xué)評教分數(shù)無顯著影響[10]. 職稱方面,韓明的研究結(jié)果表明,教師職稱高低會顯著影響學(xué)生評教分數(shù),教師的職稱較高,學(xué)生會傾向打高分[11];馬莉萍則認為教師職稱對學(xué)生評教分數(shù)影響的整體差異不大[12]. 年齡方面,梁志星的研究結(jié)果表明教師年齡顯著影響學(xué)生評教結(jié)果[13];李超鋒研究發(fā)現(xiàn)教師學(xué)歷和年齡對學(xué)生評教結(jié)果具有交互效應(yīng)[14];趙偉春認為教師的年齡對學(xué)評教無顯著影響[10]. 學(xué)歷方面,韓明研究認為隨著教師學(xué)歷的變化,教師綜合評價成績的差異達到了統(tǒng)計學(xué)理論上的顯著性水平[11];鄧紅的研究結(jié)果則表明學(xué)生評教結(jié)果與教師的學(xué)歷相關(guān)不明顯[15].
總之,國內(nèi)外學(xué)者對教師背景特征與學(xué)生評教結(jié)果之間關(guān)系的研究取得了一定的成果,為本研究奠定了基礎(chǔ). 然而,現(xiàn)有文獻主要以理論分析和邏輯思辨為主,實證分析相對較少. 少量文獻進行了實證研究,但采用的數(shù)據(jù)主要來自于調(diào)查問卷或選取自學(xué)校內(nèi)部部分專業(yè)的學(xué)生評教結(jié)果,可靠性和全面性略顯不足. 基于此,本文采用單因素方差模型對M大學(xué)課堂教學(xué)質(zhì)量評價系統(tǒng)收集的全校學(xué)生評教數(shù)據(jù)進行分析,探究該校教師背景特征對學(xué)生評教分數(shù)的影響狀況,以期為高校優(yōu)化教師隊伍結(jié)構(gòu)和提高課堂教學(xué)質(zhì)量提供參考依據(jù).
本文用到的數(shù)據(jù)包括學(xué)生對其所修讀課程的課堂評教數(shù)據(jù)和任課教師的背景特征數(shù)據(jù). 學(xué)生評教數(shù)據(jù)由M大學(xué)課堂教學(xué)質(zhì)量評價系統(tǒng)導(dǎo)出得到,任課教師背景特征數(shù)據(jù)由該校人事管理部門提供. 根據(jù)模型對數(shù)據(jù)的要求,在進行分析之前對原始數(shù)據(jù)進行了預(yù)處理.
M大學(xué)課堂教學(xué)質(zhì)量評估指標(biāo)體系由11項指標(biāo)構(gòu)成,其中10項為量化評分指標(biāo),1項為綜合評價指標(biāo),量化評分指標(biāo)的最高分值為10分,綜合評價指標(biāo)為描述性語言. 因而實際上在原始評教系統(tǒng)中一位同學(xué)對其所修的一門課程的最終評分分布在11條記錄中. 為此,在進行分析之前進行了如下處理:
(1)從原始數(shù)據(jù)中篩選出本文所需要的數(shù)據(jù)項,包括課程號、教師工號、學(xué)生學(xué)號、單項評分指標(biāo)和單項評分值,共計1368570條記錄.
(2)以課程號、教師工號和學(xué)生學(xué)號為關(guān)鍵字,合并單項評分并計算每位學(xué)生對所修課程的總評分,共得到124593條記錄.
(3)部分學(xué)生的單項指標(biāo)評分未填寫或明顯不合理,去除含有缺失值和異常值的數(shù)據(jù),得到123842條記錄.
(4)按課程號和教師工號分組計算各課堂的評教學(xué)生人數(shù)和該課堂平均評教分數(shù),共得到1446個課堂的平均評教分數(shù).
(5)根據(jù)該校教師課堂教學(xué)質(zhì)量評估與管理辦法的規(guī)定,少于10人的課堂因評教人數(shù)少,評分不能真實反映課堂教學(xué)質(zhì)量. 去除這部分課堂后剩余1399個課堂的平均評教分數(shù).
根據(jù)模型要求,分析之前對教師背景特征原始數(shù)據(jù)進行了如下處理:
(1)從原始數(shù)據(jù)中篩選出模型分析需要用到的教師基本數(shù)據(jù),包括教師工號、性別、職稱、學(xué)歷和出生日期.
(2)原始數(shù)據(jù)中專職教師專業(yè)技術(shù)職務(wù)名稱為教授、副教授、講師和助教,非專職教師專業(yè)技術(shù)職務(wù)名稱為正高級、副高級、中級和初級. 為統(tǒng)一專業(yè)技術(shù)職務(wù)名稱,將教授、副教授、講師和助教分別修改為正高級、副高級、中級和初級.
(3)根據(jù)出生日期計算教師年齡,并將教師年齡劃分為35歲及以下、36~40歲、41~45歲、46~50歲、51~55歲和55歲以上共6個年齡段.
最后,將學(xué)生對課堂的平均評教分數(shù)和教師背景特征數(shù)據(jù)以教師工號為關(guān)鍵字進行連接,得到本研究的基礎(chǔ)數(shù)據(jù)集,結(jié)構(gòu)如表1所示.
表1 基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)及其示例Tab.1 Basic data structure and examples
由于少部分外聘教師的背景特征數(shù)據(jù)填寫不全,導(dǎo)致44個課堂的數(shù)據(jù)中存在缺失值,去除這部分缺失值后共1355個課堂的評教數(shù)據(jù)作為本文分析所用最終數(shù)據(jù).
國內(nèi)外學(xué)者對學(xué)評教研究所采用的方法既有質(zhì)性方法也有量化方法. 質(zhì)性方法主要基于教育學(xué)、心理學(xué)、管理學(xué)和經(jīng)濟學(xué)相關(guān)理論,如利用刻板印象、利益沖突和分數(shù)膨脹等理論結(jié)合具體實例進行剖析;量化方法則根據(jù)所收集的數(shù)據(jù)特征采用描述性統(tǒng)計、相關(guān)分析、方差分析、回歸分析或元分析中的一種或幾種模型進行研究. 本文研究數(shù)據(jù)中平均評教分數(shù)屬于連續(xù)型數(shù)據(jù),而教師背景特征屬于分類型數(shù)據(jù)且不同特征之間相關(guān)性較弱,適合采用單因素方差模型進行分析.
單因素方差分析屬于數(shù)理統(tǒng)計中的假設(shè)檢驗范疇,其原假設(shè)為控制變量不同水平下各觀測變量的總體均值都相等. 觀測變量值的變化受到控制變量和隨機變量兩類因素的影響,因而可將觀測變量圍繞其均值的總變異(總平方和SST)分解為組間平方和(SSA)與組內(nèi)平方和(SSE)兩部分,其中SSA是由控制變量的不同水平造成的變異,SSE是由抽樣誤差造成的變異· 在滿足方差分析假設(shè)的前提下,可以證明SST=SSA+SSE.在SST中,如果SSA相對于SSE較大,說明觀測變量的變異主要由控制變量引起,控制變量的不同水平對觀測變量造成了顯著影響,反之則說明控制變量的不同水平對觀測變量造成的影響不顯著.
基于以上分析,單因素方差分析可以用F統(tǒng)計量進行檢驗,如公式(1)所示:
(1)
在公式(1)中,n是總樣本量,k-1是組間平方和SSA的自由度,n-k是組內(nèi)平方和SSE的自由度,MSA是組間離差平方和的平均(組間方差),MSE是組內(nèi)離差平方和的平均(組內(nèi)方差). 若原假設(shè)條件成立,則F統(tǒng)計量服從自由度為(k-1,n-k)的F分布.
本研究中課堂平均學(xué)評教分數(shù)為觀測變量,教師背景特征為控制變量. 通過考察教師特征不同水平下課堂平均學(xué)評教分數(shù)的總體均值的顯著性水平即可知教師特征是否對學(xué)生評教結(jié)果有顯著影響.
進行方差分析有四個前提假設(shè):一是所有樣本采用隨機抽樣獲?。欢歉鱾€樣本是相互獨立的;三是在控制變量的不同水平下觀測變量總體上不嚴重偏離正態(tài)分布;四是在控制變量的不同水平下觀測變量總體上具有方差齊性. 在進行方差分析之前,需要首先驗證是否滿足這四個前提條件. 隨機抽樣要求總體中的每個對象都有相等概率被抽中的可能,以保證樣本的代表性. 本研究的總體來自于M大學(xué)全體學(xué)生評教數(shù)據(jù),滿足隨機抽樣條件. 各樣本相互獨立要求在總體中抽取一個樣本時,其他樣本不受影響. 本研究根據(jù)教師背景特征數(shù)據(jù)進行分組之后保持了不同分組數(shù)據(jù)之間的獨立性. 因此,對于本研究來說,只需要驗證前提假設(shè)三和前提假設(shè)四.
基于以上分析,本文的研究方法和過程如下:
(1)驗證教師背景特征包括教師性別、學(xué)歷、職稱和年齡不同取值下課堂平均學(xué)評教分數(shù)是否總體近似服從正態(tài)分布和具有方差齊性.
(2)利用單因素方差分析模型分別考察教師性別、教師學(xué)歷、教師職稱和教師年齡是否對學(xué)生評教結(jié)果具有顯著性影響.
(3)如果確實產(chǎn)生了顯著影響,采用多重比較檢驗的LSD檢驗分析該特征的不同水平對學(xué)生評教結(jié)果的影響差異.
本研究基于R語言中單因素方差分析有關(guān)函數(shù)和圖形工具實現(xiàn).
分別對教師性別、學(xué)歷、職稱和年齡采用單因素方差分析,考察各因素對課堂平均學(xué)評教分數(shù)的影響情況.
3.1.1 正態(tài)性檢驗
檢驗數(shù)據(jù)是否滿足正態(tài)分布的方法有多種,如K-S檢驗、W檢驗等,但這些檢驗方法通常對樣本量比較敏感,可能導(dǎo)致既使數(shù)據(jù)總體滿足正態(tài)性但統(tǒng)計檢驗出來的結(jié)果卻顯示不滿足正態(tài)性的現(xiàn)象. 另外,現(xiàn)代統(tǒng)計學(xué)研究實踐表明,只要樣本量較大且總體近似服從正態(tài)分布就可以進行單因素方差分析. 因此,在進行正態(tài)性檢驗時,首選方法是畫出直方圖、P-P圖或Q-Q圖等圖形并進行觀察,如果發(fā)現(xiàn)有嚴重偏態(tài)和尖峰分布則再進行進一步的假設(shè)檢驗.
利用R語言中的qqnorm函數(shù)繪制教師性別特征在男和女兩種水平下的課堂平均學(xué)評教分數(shù)Q-Q圖,結(jié)果如圖1所示. 在圖1中,橫坐標(biāo)為期望正態(tài)值,縱坐標(biāo)為實際值,斜線為課堂平均學(xué)評教分數(shù)服從正態(tài)分布時的Q-Q線,圓圈為實際課堂平均學(xué)評教分數(shù)散點圖. 由圖1可知,男女教師的課堂平均學(xué)評教分數(shù)均集中在正態(tài)Q-Q線附近,即總體上近似服從正態(tài)分布.
圖1 不同性別教師平均學(xué)評教分數(shù)Q-Q圖Fig.1 Q-Q chart of the average teaching evaluation scores of teachers with different genders
3.1.2 方差齊性檢驗
利用R語言中的leveneTest函數(shù)對不同性別教師的課堂平均學(xué)評教分數(shù)進行l(wèi)evene方差齊性檢驗. 程序運行結(jié)果顯示男女教師平均學(xué)評教分數(shù)的方差齊性檢驗的檢驗統(tǒng)計量F的觀測值為1.10,概率P值為0.29. 當(dāng)顯著性水平α取值為0.05時,概率P值大于顯著性水平,可以認為男女教師平均學(xué)評教分數(shù)的總體方差無顯著性差異,滿足方差齊性條件.
3.1.3 單因素方差分析結(jié)果
不同性別教師的課堂平均學(xué)評教分數(shù)滿足正態(tài)性和方差齊性條件,借助R語言的aov函數(shù)進行單因素方差分析,結(jié)果如表2所示.
表2 不同性別教師的平均分數(shù)單因素方差分析結(jié)果Tab.2 Results of one-way ANOVA for the average scores of teachers with different genders
由表2可知,不同性別教師的課堂平均學(xué)評教分數(shù)單因素方差分析的P值為0.7629,大于α=0.05的顯著性水平,且F統(tǒng)計量也較小,說明男女教師課堂平均學(xué)評教分數(shù)的總體均值差距不大,即教師性別特征對學(xué)生評教分數(shù)的影響不具有顯著性.
3.2.1 正態(tài)性檢驗
同上,利用qqnorm函數(shù)繪制各年齡段教師平均學(xué)評教分數(shù)Q-Q圖,結(jié)果如圖2所示. 從圖2可以看出,不同年齡段教師的平均學(xué)評教分數(shù)總體上近似服從正態(tài)分布.
圖2 不同年齡段教師平均學(xué)評教分數(shù)Q-Q圖Fig.2 Q-Q chart of the average teaching evaluation scores of teachers with different age groups
3.2.2 方差齊性檢驗
leveneTest函數(shù)對不同年齡段教師的課堂平均學(xué)評教分數(shù)方差齊性檢驗結(jié)果顯示,檢驗統(tǒng)計量F的觀測值為1.27,概率P值為0.27. 當(dāng)顯著性水平α取值為0.05時,概率P值大于顯著性水平,可以認為不同年齡段下課堂平均學(xué)評教分數(shù)的總體方差無顯著性差異,滿足方差齊性條件.
3.2.3 單因素方差分析結(jié)果
不同年齡段教師的平均學(xué)評教分數(shù)滿足正態(tài)性和方差齊性條件,aov函數(shù)進行單因素方差分析結(jié)果表明(表3),不同年齡段教師的平均學(xué)評教分數(shù)單因素方差分析的P值為0.1541,大于α=0.05的顯著性水平,且F統(tǒng)計量也較小,說明不同年齡段教師平均學(xué)評教分數(shù)的總體均值差距不大,即教師年齡特征對學(xué)生評教分數(shù)的影響不具有顯著性.
表3 不同年齡段教師的平均分數(shù)單因素方差分析結(jié)果Tab.3 Results of one-way ANOVA for the average scores of teachers with different age groups
3.3.1 正態(tài)性檢驗
從qqnorm函數(shù)繪制的不同職稱教師平均學(xué)評教分數(shù)Q-Q圖(圖3)可以看出,不同職稱教師的平均學(xué)評教分數(shù)總體上近似服從正態(tài)分布.
圖3 不同職稱教師平均學(xué)評教分數(shù)Q-Q圖Fig.3 Q-Q chart of the average teaching evaluation scores of teachers with different professional titles
3.3.2 方差齊性檢驗
利用leveneTest函數(shù)對不同職稱教師的平均學(xué)評教分數(shù)進行方差齊性檢驗. 結(jié)果顯示檢驗統(tǒng)計量F的觀測值為0.83,概率P值為0.48. 當(dāng)顯著性水平α取值為0.05時,由于概率P值大于顯著性水平,認為不同職稱下教師平均學(xué)評教分數(shù)的總體方差無顯著性差異,滿足方差齊性條件.
3.3.3 單因素方差分析結(jié)果
不同職稱下教師的平均學(xué)評教分數(shù)滿足正態(tài)性和方差齊性條件,aov函數(shù)單因素方差分析結(jié)果顯示(表4),不同職稱下教師的平均學(xué)評教分數(shù)單因素方差分析的P值為0.2852,大于α=0.05的顯著性水平,且F統(tǒng)計量也較小,說明不同職稱下教師平均學(xué)評教分數(shù)的總體均值差距不大,即教師職稱特征對學(xué)生評教分數(shù)的影響不具有顯著性.
表4 不同職稱教師的平均分數(shù)單因素方差分析結(jié)果Tab.4 Results of one-way ANOVA for the average scores of teachers with different professional titles
3.4.1 正態(tài)性檢驗
不同學(xué)歷下教師平均學(xué)評教分數(shù)Q-Q圖(圖4)顯示,不同學(xué)歷下教師的平均學(xué)評教分數(shù)總體上近似服從正態(tài)分布.
圖4 不同學(xué)歷教師平均學(xué)評教分數(shù)Q-Q圖Fig.4 Q-Q chart of the average teaching evaluation scores of teachers with different academic qualifications
3.4.2 方差齊性檢驗
利用leveneTest函數(shù)對不同學(xué)歷下教師的平均學(xué)評教分數(shù)進行方差齊性檢驗. 結(jié)果顯示檢驗統(tǒng)計量F的觀測值為0.23,概率P值為0.79. 當(dāng)顯著性水平α取值為0.05時,由于概率P值大于顯著性水平,認為不同學(xué)歷下教師平均學(xué)評教分數(shù)的總體方差無顯著性差異,滿足方差齊性條件.
3.4.3 單因素方差分析結(jié)果
不同學(xué)歷下教師的平均學(xué)評教分數(shù)滿足正態(tài)性和方差齊性條件,aov函數(shù)進行單因素方差分析結(jié)果如表5所示. 由表5可知,不同學(xué)歷下教師的平均學(xué)評教分數(shù)單因素方差分析的P值為0.01406,小于α=0.05的顯著性水平,且F統(tǒng)計量也較大,說明不同學(xué)歷下教師平均學(xué)評教分數(shù)的總體均值差距較大,即教師學(xué)歷特征對學(xué)生評教分數(shù)的影響具有顯著性.
表5 不同學(xué)歷教師的平均分數(shù)單因素方差分析結(jié)果Tab.5 Results of one-way ANOVA for the average scores of teachers with different academic qualifications
由于教師學(xué)歷對學(xué)生評教分數(shù)具有顯著的影響,有必要通過事后分析兩兩比較,找出具體是哪些組之間差異顯著. 為此,本文采用事后多重比較檢驗的LSD檢驗進行分析,其中置信度取0.95. 檢驗結(jié)果如表6所示. 具有碩士研究生與具有博士研究生學(xué)歷的教師平均學(xué)評教分數(shù)t統(tǒng)計量的P值為0.004,在顯著性水平α為0.05時P<α,說明二者平均學(xué)評教分數(shù)的總體均值存在顯著差異. 而大學(xué)本科與博士研究生教師之間以及碩士研究生與大學(xué)本科教師之間的平均學(xué)評教分數(shù)的總體均值差異均不顯著.
表6 不同學(xué)歷教師對平均學(xué)評教分數(shù)總體均值的Tukey HSD檢驗結(jié)果Tab.6 Tukey HSD test results of overall average of the average teaching evaluation scores of teachers with different academic qualifications
本文以M大學(xué)教學(xué)質(zhì)量評價系統(tǒng)真實數(shù)據(jù)為基礎(chǔ),利用單因素方差模型分析了高校教師背景特征對學(xué)評教分數(shù)的影響狀況,結(jié)論如下:
(1)教師性別、職稱和年齡背景特征對學(xué)生最終評教分數(shù)的影響不顯著.
(2)教師學(xué)歷特征對學(xué)生最終評教分數(shù)的影響具有顯著性,其中具有碩士研究生學(xué)歷和具有博士研究生學(xué)歷的教師對評教分數(shù)的影響差異最大.
結(jié)合研究結(jié)論,本文提出如下建議:
(1)具有碩士研究生學(xué)歷的教師在教學(xué)活動中應(yīng)提升質(zhì)量意識和危機意識. 一方面,與具有博士研究生學(xué)歷的教師相比自身業(yè)務(wù)水平尚需進一步提升,本領(lǐng)域的知識儲備需要進一步加強. 另一方面,與具有大學(xué)本科學(xué)歷的教師相比評教分數(shù)偏低說明教學(xué)質(zhì)量意識和危機意識還比較缺乏.
(2)教學(xué)質(zhì)量監(jiān)控部門應(yīng)及時對學(xué)生評教數(shù)據(jù)進行統(tǒng)計和分析,并將結(jié)果進行反饋,以便教師了解自己的位次,促進教師從自身查找原因,主動采取措施,提高教學(xué)質(zhì)量.
(3)教師教學(xué)發(fā)展研究中心應(yīng)充分利用學(xué)生評教結(jié)果,精準(zhǔn)定位教師在教學(xué)中存在的問題,有針對性地開展教師教學(xué)培訓(xùn)與交流.
(4)人事管理部門應(yīng)采取措施激勵碩士研究生教師積極進修或攻讀博士學(xué)位,提高教師的業(yè)務(wù)水平. 同時,在招聘新教師時應(yīng)注重應(yīng)聘者的學(xué)歷要求.