• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      適用于學(xué)生成績(jī)預(yù)測(cè)的學(xué)習(xí)數(shù)據(jù)特征綜述

      2023-10-08 13:15:04陳靜靜
      軟件工程 2023年10期
      關(guān)鍵詞:預(yù)測(cè)特征算法

      張 峰, 陳靜靜

      (山東科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院, 山東 青島 266590)

      0 引言(Introduction)

      教育數(shù)據(jù)挖掘[1](Educational Data Mining,EDM)是當(dāng)前教學(xué)技術(shù)領(lǐng)域研究的熱點(diǎn),旨在從海量的教育數(shù)據(jù)中發(fā)現(xiàn)隱藏信息。目前,已有大量工作通過分析學(xué)生學(xué)習(xí)數(shù)據(jù)的非過程性特征,如教育背景、上課出勤率等,利用決策樹[2]、樸素貝葉斯分類法[3]、線性回歸[4]和神經(jīng)網(wǎng)絡(luò)[5]等機(jī)器學(xué)習(xí)方法建立成績(jī)預(yù)測(cè)模型。然而,現(xiàn)有方法大多忽略了學(xué)生在學(xué)習(xí)過程中產(chǎn)生的一些過程性特征數(shù)據(jù),也包含有價(jià)值的學(xué)生知識(shí)水平信息,如學(xué)習(xí)過程中視頻觀看的頻次等數(shù)據(jù)。這些數(shù)據(jù)能夠反映學(xué)生真實(shí)的學(xué)習(xí)情況,可以作為預(yù)測(cè)學(xué)生學(xué)習(xí)成績(jī)的依據(jù)[6]。例如,對(duì)于一組被學(xué)生循環(huán)觀看的視頻,可以認(rèn)為學(xué)生學(xué)習(xí)視頻內(nèi)容時(shí)難度較大,也反映學(xué)生在學(xué)習(xí)部分視頻時(shí)投入精力較多[7]。目前,很少有綜述性研究從成績(jī)預(yù)測(cè)所使用的學(xué)習(xí)特征的層面對(duì)已有工作進(jìn)行梳理、分析和總結(jié)。因此,本文根據(jù)不同的學(xué)習(xí)特征對(duì)現(xiàn)有學(xué)生成績(jī)預(yù)測(cè)的研究工作進(jìn)行分類總結(jié)。

      1 基于機(jī)器學(xué)習(xí)技術(shù)的成績(jī)預(yù)測(cè)流程(Performance prediction process based on machine learning technique)

      基于機(jī)器學(xué)習(xí)技術(shù)的學(xué)生成績(jī)預(yù)測(cè)模型構(gòu)建的基本流程如圖1所示,主要包括數(shù)據(jù)采集、數(shù)據(jù)提取與預(yù)處理、構(gòu)建成績(jī)預(yù)測(cè)模型三個(gè)步驟。首先,通過在線學(xué)習(xí)平臺(tái)獲取與學(xué)生學(xué)習(xí)相關(guān)的過程性特征、非過程性特征數(shù)據(jù);其次,采用各種學(xué)習(xí)分析方法對(duì)數(shù)據(jù)進(jìn)行分析,確定可用于預(yù)測(cè)的數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括對(duì)數(shù)據(jù)進(jìn)行過濾和篩選,確保采集的數(shù)據(jù)與學(xué)習(xí)高度相關(guān)聯(lián),此外要進(jìn)行必要的數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)歸一化,以及處理大量雜亂的數(shù)據(jù)等;最后,提取數(shù)據(jù)特征,采取多種機(jī)器學(xué)習(xí)算法包括邏輯回歸、決策樹、樸素貝葉斯、支持向量機(jī)、反向傳播和隨機(jī)森林建立成績(jī)預(yù)測(cè)模型。通過對(duì)各種模型進(jìn)行對(duì)比,選擇最佳的模型對(duì)學(xué)生成績(jī)進(jìn)行預(yù)測(cè),為學(xué)生學(xué)習(xí)及教師指導(dǎo)提供意見。

      圖1 基于機(jī)器學(xué)習(xí)技術(shù)的成績(jī)預(yù)測(cè)模型構(gòu)建流程Fig.1 Construction process of performance prediction model based on machine learning technique

      2 基于學(xué)習(xí)特征的成績(jī)預(yù)測(cè)(Performance prediction based on learning data feature)

      基于學(xué)生的教育數(shù)據(jù)進(jìn)行學(xué)生成績(jī)預(yù)測(cè),是教育數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn)。如何利用這些教育數(shù)據(jù),將其轉(zhuǎn)換為有用的信息和知識(shí),為教育決策、教學(xué)優(yōu)化服務(wù)提供幫助,已經(jīng)成為教育數(shù)據(jù)挖掘的研究目標(biāo),也是教育工作者尤其是教育決策者重點(diǎn)關(guān)注的內(nèi)容[8]。研究分析學(xué)生學(xué)習(xí)的相關(guān)數(shù)據(jù),并以此為據(jù),為后續(xù)的建模工作提供充足的數(shù)據(jù)資源,是學(xué)生成績(jī)預(yù)測(cè)任務(wù)的基本前提。本文基于現(xiàn)有數(shù)據(jù)特征,從非過程性特征、過程性特征兩個(gè)方面對(duì)預(yù)測(cè)成績(jī)的研究工作進(jìn)行總結(jié)。

      2.1 基于非過程性特征的成績(jī)預(yù)測(cè)

      使用非過程性特征進(jìn)行成績(jī)預(yù)測(cè),主要包括個(gè)人教育背景、先驗(yàn)知識(shí)、認(rèn)知能力、學(xué)習(xí)成績(jī)、學(xué)習(xí)時(shí)間、學(xué)習(xí)態(tài)度等[9]。本小節(jié)將非過程性特征分為靜態(tài)數(shù)據(jù)和動(dòng)態(tài)非過程性數(shù)據(jù),并從這兩個(gè)方面梳理和總結(jié)主要工作。

      2.1.1 靜態(tài)數(shù)據(jù)

      使用靜態(tài)數(shù)據(jù)(即很長(zhǎng)時(shí)間內(nèi)不會(huì)變化的數(shù)據(jù)),主要包括學(xué)生個(gè)人教育背景、學(xué)校類型、學(xué)校排名、家長(zhǎng)受教育程度、社會(huì)關(guān)系等預(yù)測(cè)成績(jī)[10-11]。例如,ABU AMRA等[12]首先在線下收集學(xué)生的學(xué)習(xí)行為特征(基本信息、教育背景、父母受教育程度、社會(huì)關(guān)系),然后進(jìn)行數(shù)據(jù)分析以及預(yù)處理,采取多種機(jī)器學(xué)習(xí)算法預(yù)測(cè)學(xué)生的成績(jī)。ACHARYA等[13]收集整理了500名學(xué)生的信息,包括性別、出生日期、所學(xué)專業(yè)、所在城市、父母是否工作等,分別利用最近鄰算法和樸素貝葉斯算法預(yù)測(cè)學(xué)生的學(xué)習(xí)成績(jī),并進(jìn)行成績(jī)預(yù)測(cè)模型的對(duì)比,選取最佳模型預(yù)測(cè)學(xué)生的成績(jī)。PANDEY等[14]基于524名學(xué)生的性別、年齡、畢業(yè)學(xué)校等18個(gè)特征信息,利用決策樹算法預(yù)測(cè)學(xué)生完成學(xué)位的評(píng)價(jià)等級(jí),從而幫助教師了解學(xué)生的學(xué)習(xí)狀況。SAARELA等[15]利用碩士研究生之前的最終評(píng)級(jí)和他們?cè)诒究齐A段的成績(jī)作為特征,用統(tǒng)計(jì)方法預(yù)測(cè)碩士研究生在校的表現(xiàn)。DAZ MUJICA等[16]使用學(xué)生情感和情緒變量(對(duì)大學(xué)課程的滿意度、對(duì)學(xué)業(yè)成績(jī)的看法、自己壓力、自尊和疲勞等情感因素)對(duì)學(xué)生表現(xiàn)進(jìn)行早期預(yù)測(cè)。NGUYEN等[17]通過收集越南1 117名學(xué)生的數(shù)據(jù),包括個(gè)人情緒智力(Emotional Intelligence,EI)、生活滿意度、職業(yè)、情緒、學(xué)習(xí)目標(biāo)、毅力、學(xué)習(xí)環(huán)境、社交技能等,使用常見的數(shù)據(jù)分析方法分析以上數(shù)據(jù)對(duì)學(xué)生學(xué)業(yè)成績(jī)的影響。

      2.1.2 動(dòng)態(tài)非過程性數(shù)據(jù)

      使用動(dòng)態(tài)非過程性特征(即指學(xué)生在線學(xué)習(xí)過程中產(chǎn)生的一些非過程性數(shù)據(jù)),包括在線學(xué)習(xí)時(shí)間、訪問量、平均學(xué)習(xí)成績(jī)等預(yù)測(cè)成績(jī)[18]。例如,MARBOUTI等[19]利用大學(xué)一年級(jí)學(xué)生學(xué)習(xí)計(jì)算機(jī)課程前5周的行為數(shù)據(jù),包括家庭作業(yè)分?jǐn)?shù)、測(cè)驗(yàn)成績(jī)、期中考試成績(jī)等,基于多種機(jī)器學(xué)習(xí)算法(邏輯回歸、決策樹、樸素貝葉斯和隨機(jī)森林等)創(chuàng)建該課程的預(yù)測(cè)模型。HANA[20]收集了馬薩里克大學(xué)信息學(xué)院的學(xué)生提供的與學(xué)習(xí)課程相關(guān)的學(xué)分?jǐn)?shù)、平均成績(jī)等,使用支持向量機(jī)、隨機(jī)森林、基于規(guī)則的分類器、IB1和樸素貝葉斯算法預(yù)測(cè)學(xué)生的學(xué)業(yè)表現(xiàn)。HUSSAIN等[21]通過數(shù)字電子教育與設(shè)計(jì)套件(Digital Electronics Education and Design Suite,DEEDS)系統(tǒng)采集到學(xué)生在數(shù)字設(shè)計(jì)課程中各課程學(xué)習(xí)的平均時(shí)間、活動(dòng)總數(shù)、平均空閑時(shí)間、平均點(diǎn)擊時(shí)間和與學(xué)習(xí)相關(guān)的活動(dòng)總數(shù),使用人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、邏輯回歸、樸素貝葉斯和決策數(shù)等機(jī)器學(xué)習(xí)算法,預(yù)測(cè)每節(jié)課的學(xué)生成績(jī)。JIMéNEZ等[22]利用靜態(tài)數(shù)據(jù)(學(xué)習(xí)者性別、居住地、以前學(xué)校類型)和動(dòng)態(tài)數(shù)據(jù)(學(xué)生在每門課程中的學(xué)習(xí)成績(jī))為特征,提出了多目標(biāo)時(shí)間優(yōu)化模型并運(yùn)用邏輯回歸、隨機(jī)森林等機(jī)器學(xué)習(xí)算法對(duì)學(xué)習(xí)者進(jìn)行輟學(xué)預(yù)測(cè)。XU等[23]通過收集小規(guī)模在線課程(Small Private Online Course,SPOC)平臺(tái)2017年秋季和2018年春季學(xué)生學(xué)習(xí)計(jì)算機(jī)網(wǎng)絡(luò)課程的學(xué)習(xí)行為,包括點(diǎn)擊流、每次活動(dòng)花費(fèi)的時(shí)間、作業(yè)活動(dòng)取得的成績(jī)等,使用多元回歸模型預(yù)測(cè)學(xué)生的成績(jī),該成績(jī)預(yù)測(cè)工作具有實(shí)用性,為學(xué)習(xí)分析和個(gè)性化教學(xué)提供了啟示。宋丹等[24]在教學(xué)多源數(shù)據(jù)采集與處理的基礎(chǔ)上,以“操作系統(tǒng)”課程為例,基于已授專業(yè)課、單元測(cè)試(可以理解為平時(shí)測(cè)驗(yàn)或作業(yè)成績(jī))、移動(dòng)端教學(xué)數(shù)據(jù)和虛擬仿真實(shí)驗(yàn)數(shù)據(jù)等多個(gè)維度的數(shù)據(jù)進(jìn)行課程成績(jī)預(yù)測(cè)。XU等[25]將學(xué)生在線學(xué)習(xí)的時(shí)間特征、學(xué)習(xí)成績(jī)和在線課程平臺(tái)論壇內(nèi)學(xué)生互動(dòng)相關(guān)的大量屬性構(gòu)成訓(xùn)練集,提出一種新的半監(jiān)督回歸算法,用于預(yù)測(cè)遠(yuǎn)程在線課程中本科生的最終成績(jī)。HASSAN等[26]通過收集開放式大學(xué)的學(xué)習(xí)數(shù)據(jù)集中的學(xué)生論壇互動(dòng)的學(xué)習(xí)特征,使用深度長(zhǎng)期短期記憶模型預(yù)測(cè)學(xué)生的早期輟學(xué)情況。HUNG等[27]結(jié)合靜態(tài)數(shù)據(jù)(包括學(xué)生的基本信息、學(xué)生開學(xué)前的歷史成績(jī)等)和動(dòng)態(tài)數(shù)據(jù)類型(訪問課程材料的頻率、發(fā)布在線討論的頻率等),采用深度學(xué)習(xí)和集成學(xué)習(xí)作為主要算法進(jìn)行績(jī)效成績(jī)預(yù)測(cè)。

      2.2 基于過程性特征的成績(jī)預(yù)測(cè)

      3 存在的不足以及未來工作(Existing deficiencies and future work)

      根據(jù)使用非過程性特征和過程性特征兩類數(shù)據(jù)用于學(xué)生成績(jī)預(yù)測(cè)領(lǐng)域的分析和研究,發(fā)現(xiàn)其存在的不足,并對(duì)未來工作進(jìn)行展望。

      3.1 存在的不足

      第一,使用非過程性特征進(jìn)行成績(jī)預(yù)測(cè)的方法中,考慮了多種學(xué)習(xí)數(shù)據(jù),借助積累的學(xué)習(xí)數(shù)據(jù)預(yù)測(cè)學(xué)生未來的學(xué)習(xí)成績(jī),既可以幫助教師了解學(xué)生的學(xué)習(xí)狀態(tài),還能方便他們及時(shí)發(fā)現(xiàn)教學(xué)過程中存在的問題,以便及時(shí)調(diào)整教學(xué)方法;但不足之處在于難以動(dòng)態(tài)掌握學(xué)生的學(xué)習(xí)狀態(tài),忽略了學(xué)習(xí)過程中隱藏地對(duì)成績(jī)預(yù)測(cè)有效的信息,預(yù)測(cè)模型整體的準(zhǔn)確率還有待提高。第二,使用過程性特征進(jìn)行成績(jī)預(yù)測(cè)的方法中,雖然使用了學(xué)習(xí)行為過程相關(guān)的特征數(shù)據(jù),但是不足之處在于很少有工作將其用于成績(jī)預(yù)測(cè),即使在進(jìn)行成績(jī)預(yù)測(cè)時(shí)考慮了過程性特征,也只是面向某種類型的學(xué)習(xí)行為,沒有綜合考慮多種類型的學(xué)習(xí)行為,從而影響了成績(jī)預(yù)測(cè)的準(zhǔn)確性。

      3.2 未來工作

      未來可從學(xué)習(xí)數(shù)據(jù)和成績(jī)預(yù)測(cè)技術(shù)方面進(jìn)行改進(jìn)。第一,未來需要進(jìn)一步挖掘?qū)W生在學(xué)習(xí)過程中隱含的有價(jià)值的信息,可以從整個(gè)視頻學(xué)習(xí)過程的角度,考慮學(xué)習(xí)過程中更細(xì)粒度的視頻學(xué)習(xí)行為,例如某個(gè)視頻的觀看時(shí)長(zhǎng),或者觀看視頻時(shí)的拖動(dòng)、暫停等動(dòng)作,驗(yàn)證是否可以獲得更好的預(yù)測(cè)效果。第二,基于深度學(xué)習(xí)的成績(jī)預(yù)測(cè)是當(dāng)前教育數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn),下一步將視頻學(xué)習(xí)行為特征融入深度學(xué)習(xí)中。

      4 結(jié)論(Conclusion)

      隨著教育信息化的發(fā)展,在線學(xué)習(xí)平臺(tái)中積累了大量的學(xué)習(xí)行為數(shù)據(jù),為教育數(shù)據(jù)挖掘的研究提供了數(shù)據(jù)支撐。作為教育數(shù)據(jù)挖掘中的研究熱點(diǎn),基于機(jī)器學(xué)習(xí)技術(shù)的成績(jī)預(yù)測(cè)能夠及時(shí)反饋學(xué)生的學(xué)習(xí)狀態(tài),而學(xué)習(xí)行為數(shù)據(jù)是成績(jī)預(yù)測(cè)的基礎(chǔ)。本文從基于機(jī)器學(xué)習(xí)技術(shù)的學(xué)生成績(jī)預(yù)測(cè)使用的學(xué)習(xí)數(shù)據(jù)特征的角度,總結(jié)了使用非過程性特征和過程性特征進(jìn)行成績(jī)預(yù)測(cè)的相關(guān)工作,指出現(xiàn)有工作存在的不足,希望能夠?yàn)槭褂脤W(xué)習(xí)數(shù)據(jù)進(jìn)行成績(jī)預(yù)測(cè)方面的研究構(gòu)建一個(gè)較為完整的全景圖。在后續(xù)的研究中,可以進(jìn)一步深入挖掘?qū)W習(xí)過程中產(chǎn)生的各類對(duì)成績(jī)預(yù)測(cè)有效的數(shù)據(jù)特征,為構(gòu)建更加準(zhǔn)確的成績(jī)預(yù)測(cè)模型奠定基礎(chǔ)。

      猜你喜歡
      預(yù)測(cè)特征算法
      無可預(yù)測(cè)
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預(yù)測(cè)卷(A卷)
      選修2-2期中考試預(yù)測(cè)卷(B卷)
      如何表達(dá)“特征”
      基于MapReduce的改進(jìn)Eclat算法
      Travellng thg World Full—time for Rree
      不忠誠(chéng)的四個(gè)特征
      進(jìn)位加法的兩種算法
      抓住特征巧觀察
      不必預(yù)測(cè)未來,只需把握現(xiàn)在
      海原县| 武山县| 南平市| 佛坪县| 莆田市| 江北区| 张家川| 高青县| 眉山市| 沙田区| 卓资县| 镇赉县| 崇明县| 沅江市| 句容市| 金门县| 博白县| 远安县| 微山县| 临安市| 黑河市| 泗洪县| 绿春县| 宽甸| 锡林浩特市| 龙游县| 建昌县| 页游| 简阳市| 敦煌市| 荥经县| 汉寿县| 西贡区| 沈阳市| 乌恰县| 涪陵区| 永登县| 宜丰县| 若羌县| 龙游县| 安溪县|