趙祥好,朱方洲
(安徽省委黨校 信息技術(shù)中心,安徽 合肥 230022)
基于過程化管理的教學(xué)模式成為當(dāng)前教學(xué)改革的熱點[1],我國隨之出臺了一系列關(guān)于加強學(xué)習(xí)過程管理及學(xué)習(xí)過程考核的舉措,健全了能力與知識考核相結(jié)合多元化的學(xué)業(yè)考核評價體系,進一步完善了學(xué)生的學(xué)習(xí)過程中的監(jiān)測、評估及反饋機制。許彧青、程巧娟等[2]提出了針對選題階段、開題階段、設(shè)計進行階段、設(shè)計完成階段、答辯階段和答辯后六個階段的過程化考核體系;熊宗楊、薛學(xué)斌等[3]構(gòu)建了基于過程化考核的在線考試的系統(tǒng),通過成績統(tǒng)計,試卷分析及教學(xué)建議等功能進行綜合分析評估;陳昕[4]提出了階梯式遞進的“編程”考核方式;彭緒山[5]則利用問卷調(diào)查及實踐實驗的方法進行過程考核。
“新時代高教40條”提倡多樣化、過程化考核,要求課程成績不能簡單地以期末考試為準,應(yīng)改變傳統(tǒng)的考核方式,加強學(xué)生的學(xué)習(xí)過程考核?;诖?,本文提出了一種基于過程化考核的學(xué)生學(xué)習(xí)過程數(shù)據(jù)關(guān)聯(lián)分析方法,采用自主研發(fā)的智慧教學(xué)輔助系統(tǒng)采集學(xué)習(xí)過程數(shù)據(jù),并在教學(xué)實踐中證明該方法的有效性。
設(shè)I={i1,i2,…,im}是項的集合,i是項集I中的任意一個項,事務(wù)集用D表示,是進行關(guān)聯(lián)規(guī)則挖掘的所有數(shù)據(jù)的集合,而T表示事務(wù)集中的每一個事務(wù),它也是項集,由一個或者多個項i構(gòu)成,同時使得T? I。
關(guān)聯(lián)規(guī)則通常表示為從“X→Y”的形式,X表示關(guān)聯(lián)規(guī)則左側(cè)的項集,是關(guān)聯(lián)規(guī)則中的先決條件,Y表示對應(yīng)的關(guān)聯(lián)結(jié)果是右側(cè)項集,同時說明了數(shù)據(jù)內(nèi)隱含的關(guān)聯(lián)性。
支持度是指在所有的關(guān)聯(lián)規(guī)則的項集中,{X,Y}是成對出現(xiàn)的可能性,也就是指在項集中X和Y同時出現(xiàn)的概率,即:
支持度很好地衡量了當(dāng)前所考察對象關(guān)聯(lián)規(guī)則在“量”上的大小,也就是通過設(shè)定最小的閾值,保留出現(xiàn)比較頻繁的項集所隱含的規(guī)則,從而剔除出現(xiàn)頻率較小的規(guī)則。即:
其中min sup表示為最小的支持度,所有滿足式(2)的項集Z,都稱為頻繁項集。
置信度則表示在關(guān)聯(lián)前件X發(fā)生的前提下,關(guān)聯(lián)后件Y所發(fā)生的概率,即:
式(3)衡量了所考察對象在關(guān)聯(lián)規(guī)則“質(zhì)”上的可靠性。并通過支持度進行篩選出頻繁的項集后,再進一步來設(shè)定置信度的最小閾值做最終篩選,從而生成滿足條件的強關(guān)聯(lián)規(guī)則,即:
式(4)中,mincon表示為最小的支持度。
Apriori算法是指首先要列出所有項的集,再通過計算項集的支持度進行篩選,保留所有大于或等于min sup的項集;最后由上一步中所找到的規(guī)則,使用連接步方法生成下一步項集,再通過剪枝步思想利用Apriori算法的性質(zhì)產(chǎn)生候選項集,剔除出不滿足條件的候選項集。這樣逐層迭代,一直到所產(chǎn)生的項集集合全部為空集,算法才終止,列出所有頻繁項集。
本文以《網(wǎng)絡(luò)工程管理》課程教學(xué)為例,該課程的過程考核指標分配如下:出勤率為10%,課后作業(yè)為10%,課堂測驗為20%,期中考試和期末考試各為30%。在教學(xué)過程中,可進行多次課堂測驗,以便檢查學(xué)生對課堂新知識的掌握情況;教學(xué)任務(wù)結(jié)束后,采用閉卷的方式進行期末考試?;诰砻娉煽兓旧夏芊磻?yīng)出學(xué)生對知識點的掌握情況,以此作為檢驗其他各項在過程化考核中數(shù)據(jù)的主要指標。鑒于出勤率和課后作業(yè)均是手工統(tǒng)計數(shù)據(jù),準確性無法保證,本文不做進一步研究,本文重點對數(shù)據(jù)采集比較準確可信的課堂測驗、期中和期末成績?nèi)齻€維度進行研究。在樣本中選擇以上三個維度數(shù)據(jù),導(dǎo)出數(shù)據(jù)源類型為Ex?cel工作表,并采用 Apriori算法、IBM SPSS Model?er 18.0挖掘工具,挖掘?qū)W生在過程化考核中數(shù)據(jù)之間的關(guān)聯(lián)性,即找出學(xué)生平時課堂測驗、以及期中考試成績與期末考試成績?nèi)咧g的關(guān)聯(lián)關(guān)系。
文章選取某高校2017級網(wǎng)絡(luò)工程專業(yè)的3個教學(xué)班級,共計78名學(xué)生的《網(wǎng)絡(luò)工程管理》課程教學(xué)過程化數(shù)據(jù)為研究對象。數(shù)據(jù)分為課堂測驗、期中考試及期末考試三個維度,其中課堂測驗和期中考試數(shù)據(jù)均通過自主開發(fā)的課堂教學(xué)輔助系統(tǒng)收集,數(shù)據(jù)真實可靠。
由于原始數(shù)據(jù)中有異常數(shù)據(jù)存在,剔除掉6個無效的數(shù)據(jù)以后,有效的樣本量為72個。每個樣本點包括學(xué)號、姓名、專業(yè)、班級、課堂測驗、期中考試和期末考試等字段,進一步對數(shù)據(jù)進行處理,生成包含學(xué)號、課堂測驗、期中考試、期末考試這4個字段的學(xué)習(xí)過程考核數(shù)據(jù)表,其記錄共有72條,隨機選擇其中10條記錄,如表1所示。
另外,由于Apriori算法僅支持布爾型數(shù)據(jù)的關(guān)聯(lián)分析,需要將原始的連續(xù)數(shù)據(jù)通過聚類的方式轉(zhuǎn)換成離散型數(shù)據(jù)。在此步驟中需要運用到K-means聚類算法對表1數(shù)據(jù)進行聚類。為獲取最佳實驗效果,在對數(shù)據(jù)進行聚類離散化處理后,進一步通過手肘[6]找到最佳的聚類K值。
圖1 手肘法確定期末成績分類最佳K值
手肘法是通過SSE和K值之間的關(guān)系圖確認最優(yōu)的K值,最優(yōu)的K值稱為“肘部”[7]。
本文以學(xué)生的期末考試數(shù)據(jù)為例,畫出誤差平方和SSE與K值的關(guān)系圖,如圖1所示,可以找出“手肘”對應(yīng)的拐點,這時橫坐標即為最佳的K值。從圖1中可以看出期末考試中的最佳聚類K的值為3。
經(jīng)過K-means聚類算法進行離散化并采用手肘法得出最佳的K值后,期中測試得分從高到底被依次分為QZ-1、QZ-2、QZ-3和QZ-4四類,課堂測驗的正確率從高到低分布,依次分為KT-1、KT-2和KT-3三類,期末考試得分從高到底依次分為QM-1、QM-2和QM-3三類,對表1中的數(shù)據(jù)進行聚類,就得到聚類結(jié)果如表2所示。
經(jīng)過數(shù)據(jù)離散化并且確認出最佳聚類K值后,聚類對應(yīng)的分數(shù)及準確率區(qū)間如表3所示。
表2 學(xué)習(xí)過程考核數(shù)據(jù)聚類
表3 過程考核聚類類別及區(qū)間
利用IBM SPSS Modeler 18.0挖掘工具,再采用Apriori算法建立關(guān)聯(lián)分析模型,如圖2所示。
通過Apriori算法對期中考試、課堂測驗及期末考試三個字段兩兩建立關(guān)聯(lián)模型,分別得到三者之間的關(guān)聯(lián)規(guī)則。期中考試與課堂測驗之間的規(guī)則如表4所示。以表4中的規(guī)則1為例,對挖掘出的關(guān)聯(lián)規(guī)則進行分析。
圖2 Apriori關(guān)聯(lián)規(guī)則算法挖掘模型
規(guī)則1為在期中考試成績?yōu)樽罡叻謹?shù)段QZ-1時,課堂測驗正確率類別為KT-1的學(xué)習(xí)情況相互關(guān)聯(lián)情況。此規(guī)則的置信度的值為62.40%,支持度的值為20.58%,說明當(dāng)學(xué)生期中考試成績較高時,有62.40%的可能性學(xué)生在課堂測驗的答題中正確率較高,同時期中考試成績較好在最高分數(shù)段QZ-1和課堂測驗正確率最高數(shù)據(jù)段KT-1的概率是20.58%,該規(guī)則與經(jīng)驗基本相一致,說明學(xué)生在平時的課堂學(xué)習(xí)中以認真的態(tài)度對待教師教授的內(nèi)容,有助于學(xué)生在期中考試中獲得優(yōu)良的成績。
表4 期中考試與課堂測驗之間的關(guān)聯(lián)規(guī)則
表5為期中考試與期末考試之間的關(guān)聯(lián)規(guī)則。以規(guī)則1為例進行說明,在期中考試成績類別為QZ-2時,對應(yīng)的學(xué)生在期末考試中能夠獲得最高分數(shù)類別的成績,該規(guī)則的置信度為52.15%,即期中測試成績?yōu)橹械然蛘咧械绕蠈W(xué)生,有超過50.0%的可能性在期末考試中獲得優(yōu)良成績,說明學(xué)生期中考試成績的好壞,在某種程度上會直接影響學(xué)生期末考試的表現(xiàn)。
表5 期中考試與期末考試之間的關(guān)聯(lián)規(guī)則
表6為課堂測驗成績與期末考試成績之間的關(guān)聯(lián)性。以規(guī)則1為例進行分析,在期末考試成績在最高分數(shù)段區(qū)間,課堂測驗準確率類別為KT-1。這條規(guī)則的置信度的值為70.28%,支持度的值為31.29%,說明當(dāng)學(xué)生的期末考試成績處于較高的分數(shù)段時,有70.28%的可能性在課堂測驗中表現(xiàn)優(yōu)良。該規(guī)則與教學(xué)經(jīng)驗相符,說明課堂學(xué)習(xí)過程考核數(shù)據(jù)與期末考試成績呈現(xiàn)強關(guān)聯(lián)性,說明學(xué)習(xí)過程化考核對教學(xué)質(zhì)量提升大有幫助。
表6 課堂測驗與期末考試之間的關(guān)聯(lián)規(guī)則
在大數(shù)據(jù)信息時代下,基于過程化考核的學(xué)生學(xué)習(xí)過程數(shù)據(jù)關(guān)聯(lián)分析的方法體現(xiàn)出教學(xué)考核準確、及時、高效等優(yōu)越性,解決了教學(xué)過程中成績考核難的問題,提高了學(xué)習(xí)者的學(xué)習(xí)水平,促進了高等院校的教學(xué)考核工作得到有序開展,為高等院校的教學(xué)考核指明了前進的方向。
安徽職業(yè)技術(shù)學(xué)院學(xué)報2020年4期