• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘和K-Means算法的高校學情數(shù)據(jù)集成研究

      2022-08-18 08:28:22李鳳英許洪光
      黑龍江工程學院學報 2022年4期
      關鍵詞:平時成績可視化標簽

      李鳳英,許洪光,周 方,李 培

      (1.河北東方學院 人工智能學院,河北 廊坊 065000;2.中國地質科學院地球物理地球化學勘查研究所,河北 廊坊 065000)

      學情分析是整個教學系統(tǒng)的基礎,是遵循因材施教原則的關鍵,是教學設計的起點,其目的就是更好地了解學生,從而提高教學效果。以大學生為研究對象進行學情分析是對學生精準分類指導的重要一步,更是有效的課程教學設計的重要依據(jù)。

      隨著大數(shù)據(jù)的發(fā)展,數(shù)據(jù)分析得到了廣泛的應用,其中,數(shù)據(jù)挖掘是數(shù)據(jù)分析常用的方法,但是其對學情分析的應用相對較少。姚遠[1]提出基于分層線性模型的教育數(shù)據(jù)挖掘方法。根據(jù)學生能力的官方評價報告,分析學生能力指標的自變量;采用北京市學生2011年和2014年的中高考成績?yōu)閿?shù)據(jù)基礎,構建學生能力評價指標;基于分層線性模型分析和預測學生成績的影響因素。Natek等[2]通過數(shù)據(jù)挖掘技術分析小型學生數(shù)據(jù)集,根據(jù)小型學生數(shù)據(jù)集的特點,使用決策樹算法對學生數(shù)據(jù)進行分類;分析學生的學習特征,預測學生的學情和成績。Aher等[3]利用數(shù)據(jù)挖掘技術從Moodle(模塊化面向對象的開發(fā)學習環(huán)境)等課程管理系統(tǒng)收集學生行為數(shù)據(jù)。結合聚類技術-簡單K均值和Apriori算法分析學生的學習特點并進行分類,根據(jù)學生和課程的匹配程度向學生推薦合適的課程。

      基于以上研究成果,從多維度對某校物聯(lián)網(wǎng)專業(yè)近4 a的學生進行學情分析,并提出RET模型,同時采用K-Means聚類[4]方法查看學生成績的規(guī)律并可視化,實驗結果表明文中方法對提高教學效果有重要的現(xiàn)實意義。

      1 研究對象

      以某校物聯(lián)網(wǎng)專業(yè)近4 a的學生為研究對象,對其專業(yè)課程的成績進行整理分析。

      2 數(shù)據(jù)預處理

      收集的學生數(shù)據(jù)是某校2016—2019年4個學期的成績數(shù)據(jù),包括學號、姓名、性別、平時成績、模考成績以及綜合成績等信息。

      2.1 去除冗余列

      由于存在重名情況,而學號是唯一的,因此,刪除姓名列。數(shù)據(jù)集部分結果如圖1所示:

      圖1 學生數(shù)據(jù)集

      2.2 去除異常值

      如圖2所示,此成績數(shù)據(jù)中存在缺考或緩考的學生,對學情分析沒有價值,屬于異常值,因此,將其刪除。

      圖2 異常值

      3 研究方法

      3.1 基于Python可視化分析學生數(shù)據(jù)

      利用Python的正則表達式根據(jù)不同年級學號的特點將數(shù)據(jù)集分為4個子集,選取2017—2019年的學生子集分別對其進行研究,得到不同性別對平時成績、末考成績及綜合成績的影響規(guī)律并進行可視化。

      3.2 基于Python研究平時成績和末考成績的相關關系

      針對不同年級,通過散點圖對比平時成績和末考成績的相關關系。

      3.3 構建學生標簽

      通過對學生成績的深度挖掘,構建學生標簽體系,從而在教學中準確高效地獲得學生情況,實現(xiàn)因材施教。從平時成績、末考成績和綜合成績3個方面構建學生標簽體系,并提出RET模型評價標簽。

      3.3.1 高成績標簽

      在綜合成績的基礎上,結合人工經(jīng)驗,對學生成績進行計算或歸類,如定義是否為高成績,需要人為設置閾值。文中選取85分作為閾值,如果學生的綜合成績大于該閾值,則將學生定義為優(yōu)秀學生。

      3.3.2 不及格標簽

      因材施教的另一個目標是督促“休眠”學生,即成績不合格的學生。“休眠”學生主要缺乏學習興趣,因此,喚醒“休眠”學生對因材施教具有重大意義。選取60分為閾值,如果學生的綜合成績小于該閾值,則定義為“休眠”學生。

      3.3.3 規(guī)則類標簽:RET模型的計算及可視化

      綜合整理學生平時成績、末考成績和綜合成績3個維度的信息,并對此進行分析,有助于全方位了解學生。文中依據(jù)這3個維度提出RET模型,該模型顯示一個學生的全部學習輪廓,為師生的個性化溝通提供了依據(jù)。

      RET模型3個要素分別是:平時成績Regular_grade、末考成績Endterm_ grade和綜合成績Total_ grade。根據(jù)3個要素將學生數(shù)據(jù)進行四等分,得到不同指標的評分階梯,然后計算學生的RET總得分。計算方法如下:

      1)將平時成績進行降序排列,前25%標記為4,25%~50%標記為3,50%~75%標記為2,75%~100%標記為1。

      2)將末考成績進行降序排列,前25%標記為4,25%~50%標記為3,50%~75%標記為2,75%~100%標記為1。

      3)將綜合成績進行降序排列,前25%標記為4,25%~50%標記為3,50%~75%標記為2,75%~100%標記為1。

      4)將每個學生對應的3個評分標記相加,作為學生RET的總得分score。

      將每個總得分的取值作為一個類別進行分組,統(tǒng)計不同總得分下RET的取值分布情況,并實現(xiàn)可視化。

      3.4 利用K-Means聚類分析學生數(shù)據(jù)

      1)算法描述。該算法具有速度快、伸縮性強等特點[5-6],因此,選用該算法對學生成績進行聚類分析[7-9]。

      2)實現(xiàn)流程。①由于數(shù)據(jù)集中的數(shù)值范圍不同,所以采用sklearn模塊中的preprocessing函數(shù)將數(shù)據(jù)規(guī)整化處理。②數(shù)據(jù)建模。導入sklearn模塊中的K-Means模塊,隨機生成K值并進行評價,如圖3所示,當K取值大于5時,基本趨于穩(wěn)定,所以K取值定為5。③使用K-Means算法生成實例myKmeans,之后利用.fit()方法對數(shù)據(jù)集進行模型擬合[10-12]。④預測模型,并將聚類結果進行可視化。

      圖3 誤差評價

      4 實驗結果及分析

      4.1 基于Python針對不同年級的學生分析結果

      1)17級不同性別的學生平時成績、末考成績以及綜合成績分布如圖4所示。從圖中可以看出,男生的成績波動范圍比較大,末考成績和綜合成績總體低于女生成績。

      圖4 17級學生成績分布

      2)18級不同性別的學生平時成績、末考成績以及綜合成績分布如圖5所示。圖5結果表明男生和女生的成績波動都較大。

      圖5 18級學生成績分布

      3)19級不同性別的學生平時成績、末考成績以及綜合成績分布如圖6所示。

      圖6 19級學生成績分布

      如圖6所示,雖然在平時成績上男生和女生存在差別,但是末考成績和綜合成績男生和女生的成績波動范圍大致相同。

      綜上所述可得出如下結論:17級學生接受的是傳統(tǒng)教學方式,對于男生的學習興趣影響不大,以致男生成績低于女生成績。從18級開始,采用任務驅動、問題激發(fā)的教學方式,對男生的學習狀態(tài)有較大的激勵作用。對于19級男生同樣有較好的教學效果。

      4.2 基于Python研究平時成績和末考成績的相關關系

      為了進一步研究平時學習狀態(tài)和期末考試的相關性,繪制散點如圖7所示。圖7中從左到右、從上到下分別是16級學生、17級學生、18級學生、19級學生成績分布散點,橫軸為平時成績,縱軸為末考成績。

      如圖7所示,16級學生中平時成績和末考成績都不及格的有2名,僅末考成績不合格的有3名。17級學生末考成績較差。18級學生成績分布較均勻。19級學生有2名平時表現(xiàn)很好,但是末考成績不理想。綜上所述,如果學生末考成績好,代表他的平時表現(xiàn)較好,但是平時表現(xiàn)并不決定末考成績。

      圖7 平時成績-末考成績分布散點

      4.3 構建學生標簽結果分析

      1)構建高成績標簽,結果如圖8所示。將原始數(shù)據(jù)中的學號number、平時成績regular_grade、末考成績endterm_grade、綜合成績total_grade保存到學生標簽表student_features中,并提取出高成績標簽high_score。可以看出綜合成績高于85分,high_score標簽為1,否則為0。

      圖8 學生標簽表

      2)構建及格標簽,結果如圖9所示。同上所述,其中,fail列就是所提取的是否不及格標簽??梢钥闯?,綜合成績低于60分,fail標簽為1,否則為0。

      圖9 學生標簽表中fail標簽

      3)RET模型的計算及可視化結果分析

      如圖10所示,RET模型三要素對應的評分標記列為R_score、E_score、T_score,模型的總得分對應的列為score。根據(jù)總的得分可以把學生分為4類,對每類學生進行分析,然后做出精確的教學決策。

      圖10 RET模型評分

      為了更直觀地分析成績規(guī)律,對RET模型進行可視化,如圖11所示。3個子圖的縱軸標簽分別為每組學生平時成績、末考成績、綜合成績的平均值,橫軸為總得分score。

      圖11 RET模型可視化

      從圖11可知,隨著總得分的增大,平時成績、末考成績、綜合成績的平均值逐漸增大,證明越優(yōu)秀的學生成績越高。

      4.4 利用K-Means進行聚類分析的結果

      為了更直觀地觀察聚類結果,設置標簽為label,如圖12所示。將聚類結果進行可視化展示,如圖13所示。

      圖12 聚類模型

      從圖13可知,學生被聚類為4類,邊界比較清楚,聚類效果較好。從聚類結果可以看到,學生成績大部分集中在70分和90分左右。據(jù)此教師可以及時調整教學策略,更好地因材施教,從而提高教學效果。

      圖13 聚類結果

      5 結束語

      采用上述分析方法對學院近4 a的學生成績進行學情分析。首先,分析性別與成績的相關關系。其次,分析平時表現(xiàn)和期末考試成績的相關關系;利用RET模型對學生進行評分,最后采用K-Means聚類方法分析學生成績的聚類規(guī)律。文中應用了可視化技術,使教師能夠清楚地了解并挖掘出結果,做出精確的教學決策。

      另外,在未來的研究中可以運用深度學習來分析學生的上課狀態(tài),通過攝像頭采集學生上課時的圖片,對圖片進行相關處理,然后用深度學習對其進行情感分析,判斷其聽課態(tài)度,并合理調整教學方式,從而提高教學效果。

      猜你喜歡
      平時成績可視化標簽
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運行動態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      基于CGAL和OpenGL的海底地形三維可視化
      高校體育專業(yè)術科課程平時成績評定方法的探究
      “融評”:黨媒評論的可視化創(chuàng)新
      傳媒評論(2019年4期)2019-07-13 05:49:14
      讓平時成績回歸本真
      無懼標簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      播音與主持藝術專業(yè)的平時成績評定與構成——以河南工業(yè)大學為例
      新聞傳播(2016年13期)2016-07-19 10:12:05
      標簽化傷害了誰
      炉霍县| 中西区| 顺昌县| 长垣县| 定结县| 克山县| 呼和浩特市| 弥勒县| 丁青县| 香格里拉县| 科尔| 合川市| 高州市| 五原县| 博野县| 余姚市| 湘西| 泌阳县| 伊川县| 林甸县| 交城县| 治县。| 佛坪县| 商丘市| 镇安县| 静乐县| 娱乐| 西平县| 台州市| 左权县| 海林市| 宜兰县| 无锡市| 鲁山县| 化州市| 东乌珠穆沁旗| 龙南县| 黄山市| 松潘县| 闽清县| 安康市|