李鳳英,許洪光,周 方,李 培
(1.河北東方學院 人工智能學院,河北 廊坊 065000;2.中國地質科學院地球物理地球化學勘查研究所,河北 廊坊 065000)
學情分析是整個教學系統(tǒng)的基礎,是遵循因材施教原則的關鍵,是教學設計的起點,其目的就是更好地了解學生,從而提高教學效果。以大學生為研究對象進行學情分析是對學生精準分類指導的重要一步,更是有效的課程教學設計的重要依據(jù)。
隨著大數(shù)據(jù)的發(fā)展,數(shù)據(jù)分析得到了廣泛的應用,其中,數(shù)據(jù)挖掘是數(shù)據(jù)分析常用的方法,但是其對學情分析的應用相對較少。姚遠[1]提出基于分層線性模型的教育數(shù)據(jù)挖掘方法。根據(jù)學生能力的官方評價報告,分析學生能力指標的自變量;采用北京市學生2011年和2014年的中高考成績?yōu)閿?shù)據(jù)基礎,構建學生能力評價指標;基于分層線性模型分析和預測學生成績的影響因素。Natek等[2]通過數(shù)據(jù)挖掘技術分析小型學生數(shù)據(jù)集,根據(jù)小型學生數(shù)據(jù)集的特點,使用決策樹算法對學生數(shù)據(jù)進行分類;分析學生的學習特征,預測學生的學情和成績。Aher等[3]利用數(shù)據(jù)挖掘技術從Moodle(模塊化面向對象的開發(fā)學習環(huán)境)等課程管理系統(tǒng)收集學生行為數(shù)據(jù)。結合聚類技術-簡單K均值和Apriori算法分析學生的學習特點并進行分類,根據(jù)學生和課程的匹配程度向學生推薦合適的課程。
基于以上研究成果,從多維度對某校物聯(lián)網(wǎng)專業(yè)近4 a的學生進行學情分析,并提出RET模型,同時采用K-Means聚類[4]方法查看學生成績的規(guī)律并可視化,實驗結果表明文中方法對提高教學效果有重要的現(xiàn)實意義。
以某校物聯(lián)網(wǎng)專業(yè)近4 a的學生為研究對象,對其專業(yè)課程的成績進行整理分析。
收集的學生數(shù)據(jù)是某校2016—2019年4個學期的成績數(shù)據(jù),包括學號、姓名、性別、平時成績、模考成績以及綜合成績等信息。
由于存在重名情況,而學號是唯一的,因此,刪除姓名列。數(shù)據(jù)集部分結果如圖1所示:
圖1 學生數(shù)據(jù)集
如圖2所示,此成績數(shù)據(jù)中存在缺考或緩考的學生,對學情分析沒有價值,屬于異常值,因此,將其刪除。
圖2 異常值
利用Python的正則表達式根據(jù)不同年級學號的特點將數(shù)據(jù)集分為4個子集,選取2017—2019年的學生子集分別對其進行研究,得到不同性別對平時成績、末考成績及綜合成績的影響規(guī)律并進行可視化。
針對不同年級,通過散點圖對比平時成績和末考成績的相關關系。
通過對學生成績的深度挖掘,構建學生標簽體系,從而在教學中準確高效地獲得學生情況,實現(xiàn)因材施教。從平時成績、末考成績和綜合成績3個方面構建學生標簽體系,并提出RET模型評價標簽。
3.3.1 高成績標簽
在綜合成績的基礎上,結合人工經(jīng)驗,對學生成績進行計算或歸類,如定義是否為高成績,需要人為設置閾值。文中選取85分作為閾值,如果學生的綜合成績大于該閾值,則將學生定義為優(yōu)秀學生。
3.3.2 不及格標簽
因材施教的另一個目標是督促“休眠”學生,即成績不合格的學生。“休眠”學生主要缺乏學習興趣,因此,喚醒“休眠”學生對因材施教具有重大意義。選取60分為閾值,如果學生的綜合成績小于該閾值,則定義為“休眠”學生。
3.3.3 規(guī)則類標簽:RET模型的計算及可視化
綜合整理學生平時成績、末考成績和綜合成績3個維度的信息,并對此進行分析,有助于全方位了解學生。文中依據(jù)這3個維度提出RET模型,該模型顯示一個學生的全部學習輪廓,為師生的個性化溝通提供了依據(jù)。
RET模型3個要素分別是:平時成績Regular_grade、末考成績Endterm_ grade和綜合成績Total_ grade。根據(jù)3個要素將學生數(shù)據(jù)進行四等分,得到不同指標的評分階梯,然后計算學生的RET總得分。計算方法如下:
1)將平時成績進行降序排列,前25%標記為4,25%~50%標記為3,50%~75%標記為2,75%~100%標記為1。
2)將末考成績進行降序排列,前25%標記為4,25%~50%標記為3,50%~75%標記為2,75%~100%標記為1。
3)將綜合成績進行降序排列,前25%標記為4,25%~50%標記為3,50%~75%標記為2,75%~100%標記為1。
4)將每個學生對應的3個評分標記相加,作為學生RET的總得分score。
將每個總得分的取值作為一個類別進行分組,統(tǒng)計不同總得分下RET的取值分布情況,并實現(xiàn)可視化。
1)算法描述。該算法具有速度快、伸縮性強等特點[5-6],因此,選用該算法對學生成績進行聚類分析[7-9]。
2)實現(xiàn)流程。①由于數(shù)據(jù)集中的數(shù)值范圍不同,所以采用sklearn模塊中的preprocessing函數(shù)將數(shù)據(jù)規(guī)整化處理。②數(shù)據(jù)建模。導入sklearn模塊中的K-Means模塊,隨機生成K值并進行評價,如圖3所示,當K取值大于5時,基本趨于穩(wěn)定,所以K取值定為5。③使用K-Means算法生成實例myKmeans,之后利用.fit()方法對數(shù)據(jù)集進行模型擬合[10-12]。④預測模型,并將聚類結果進行可視化。
圖3 誤差評價
1)17級不同性別的學生平時成績、末考成績以及綜合成績分布如圖4所示。從圖中可以看出,男生的成績波動范圍比較大,末考成績和綜合成績總體低于女生成績。
圖4 17級學生成績分布
2)18級不同性別的學生平時成績、末考成績以及綜合成績分布如圖5所示。圖5結果表明男生和女生的成績波動都較大。
圖5 18級學生成績分布
3)19級不同性別的學生平時成績、末考成績以及綜合成績分布如圖6所示。
圖6 19級學生成績分布
如圖6所示,雖然在平時成績上男生和女生存在差別,但是末考成績和綜合成績男生和女生的成績波動范圍大致相同。
綜上所述可得出如下結論:17級學生接受的是傳統(tǒng)教學方式,對于男生的學習興趣影響不大,以致男生成績低于女生成績。從18級開始,采用任務驅動、問題激發(fā)的教學方式,對男生的學習狀態(tài)有較大的激勵作用。對于19級男生同樣有較好的教學效果。
為了進一步研究平時學習狀態(tài)和期末考試的相關性,繪制散點如圖7所示。圖7中從左到右、從上到下分別是16級學生、17級學生、18級學生、19級學生成績分布散點,橫軸為平時成績,縱軸為末考成績。
如圖7所示,16級學生中平時成績和末考成績都不及格的有2名,僅末考成績不合格的有3名。17級學生末考成績較差。18級學生成績分布較均勻。19級學生有2名平時表現(xiàn)很好,但是末考成績不理想。綜上所述,如果學生末考成績好,代表他的平時表現(xiàn)較好,但是平時表現(xiàn)并不決定末考成績。
圖7 平時成績-末考成績分布散點
1)構建高成績標簽,結果如圖8所示。將原始數(shù)據(jù)中的學號number、平時成績regular_grade、末考成績endterm_grade、綜合成績total_grade保存到學生標簽表student_features中,并提取出高成績標簽high_score。可以看出綜合成績高于85分,high_score標簽為1,否則為0。
圖8 學生標簽表
2)構建及格標簽,結果如圖9所示。同上所述,其中,fail列就是所提取的是否不及格標簽??梢钥闯?,綜合成績低于60分,fail標簽為1,否則為0。
圖9 學生標簽表中fail標簽
3)RET模型的計算及可視化結果分析
如圖10所示,RET模型三要素對應的評分標記列為R_score、E_score、T_score,模型的總得分對應的列為score。根據(jù)總的得分可以把學生分為4類,對每類學生進行分析,然后做出精確的教學決策。
圖10 RET模型評分
為了更直觀地分析成績規(guī)律,對RET模型進行可視化,如圖11所示。3個子圖的縱軸標簽分別為每組學生平時成績、末考成績、綜合成績的平均值,橫軸為總得分score。
圖11 RET模型可視化
從圖11可知,隨著總得分的增大,平時成績、末考成績、綜合成績的平均值逐漸增大,證明越優(yōu)秀的學生成績越高。
為了更直觀地觀察聚類結果,設置標簽為label,如圖12所示。將聚類結果進行可視化展示,如圖13所示。
圖12 聚類模型
從圖13可知,學生被聚類為4類,邊界比較清楚,聚類效果較好。從聚類結果可以看到,學生成績大部分集中在70分和90分左右。據(jù)此教師可以及時調整教學策略,更好地因材施教,從而提高教學效果。
圖13 聚類結果
采用上述分析方法對學院近4 a的學生成績進行學情分析。首先,分析性別與成績的相關關系。其次,分析平時表現(xiàn)和期末考試成績的相關關系;利用RET模型對學生進行評分,最后采用K-Means聚類方法分析學生成績的聚類規(guī)律。文中應用了可視化技術,使教師能夠清楚地了解并挖掘出結果,做出精確的教學決策。
另外,在未來的研究中可以運用深度學習來分析學生的上課狀態(tài),通過攝像頭采集學生上課時的圖片,對圖片進行相關處理,然后用深度學習對其進行情感分析,判斷其聽課態(tài)度,并合理調整教學方式,從而提高教學效果。