• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于深度學(xué)習(xí)的高校學(xué)生成績(jī)預(yù)測(cè)與評(píng)價(jià)方法研究

      2023-01-07 03:09:06
      信息記錄材料 2022年11期
      關(guān)鍵詞:機(jī)器神經(jīng)網(wǎng)絡(luò)深度

      曹 摯

      (徐州幼兒師范高等??茖W(xué)校 江蘇 徐州 221004)

      0 引言

      隨著人工智能的不斷發(fā)展和應(yīng)用,尤其是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)技術(shù)的不斷進(jìn)步,促使教育數(shù)據(jù)的分析和評(píng)價(jià)有了革命性的變化。教育數(shù)據(jù)挖掘(educational data mining,EDM)應(yīng)運(yùn)而生。教育數(shù)據(jù)挖掘技術(shù)是運(yùn)用教育學(xué)、計(jì)算機(jī)科學(xué)、心理學(xué)和統(tǒng)計(jì)學(xué)等多個(gè)學(xué)科的理論和技術(shù)來(lái)解決教育研究與教學(xué)實(shí)踐中的問(wèn)題[1]。高校學(xué)生成績(jī)預(yù)測(cè)與評(píng)價(jià)正是教育數(shù)據(jù)挖掘中的重要內(nèi)容。

      機(jī)器學(xué)習(xí)技術(shù)使得高校逐步實(shí)現(xiàn)由數(shù)字校園向智慧校園的轉(zhuǎn)變。在智慧校園的建設(shè)過(guò)程中,沉淀了各種各樣的教育數(shù)據(jù),學(xué)生成績(jī)數(shù)據(jù)是其中的重要組成部分。傳統(tǒng)的學(xué)生成績(jī)管理是由教務(wù)管理系統(tǒng)進(jìn)行,只是簡(jiǎn)單的記錄保存成績(jī)數(shù)據(jù)、缺乏對(duì)學(xué)生成績(jī)信息的有效挖掘和分析,更談不上決策與應(yīng)用?;跈C(jī)器學(xué)習(xí)的高校學(xué)生成績(jī)預(yù)測(cè)與評(píng)價(jià)的方法旨在通過(guò)教育領(lǐng)域內(nèi)不斷積累的海量數(shù)據(jù)資源,通過(guò)機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和統(tǒng)計(jì)分析等相關(guān)技術(shù)和方法來(lái)分析挖掘其中的內(nèi)在規(guī)律,以期解決教學(xué)過(guò)程中的各種潛在問(wèn)題,繼而提升教學(xué)質(zhì)量和學(xué)生學(xué)業(yè)水平。鑒于目前高校每年都有一定數(shù)量的學(xué)生出現(xiàn)考試不及格、留級(jí)甚至退學(xué)現(xiàn)象,因此構(gòu)建高效的學(xué)生成績(jī)預(yù)測(cè)方法具有重要的應(yīng)用價(jià)值和實(shí)踐意義。不同角色人員使用該預(yù)測(cè)方法的目的如表1所示。

      表1 角色與預(yù)測(cè)目的表

      1 數(shù)據(jù)源、預(yù)測(cè)粒度及預(yù)測(cè)方法概述

      1.1 數(shù)據(jù)源與預(yù)測(cè)粒度

      數(shù)據(jù)源一般又稱為數(shù)據(jù)集,是預(yù)測(cè)源頭的數(shù)據(jù)集,也是預(yù)測(cè)算法的“原始材料”。預(yù)測(cè)源數(shù)據(jù)集的性質(zhì)決定了采用哪種智能算法進(jìn)行預(yù)測(cè)。預(yù)測(cè)源頭的數(shù)據(jù)在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中,有一個(gè)公認(rèn)的準(zhǔn)則,就是數(shù)據(jù)量的大小和質(zhì)量很大程度上決定著預(yù)測(cè)結(jié)果。即使算法再好,如果數(shù)據(jù)量少并且分布不均,也不會(huì)產(chǎn)生好的預(yù)測(cè)結(jié)果。反之如果數(shù)據(jù)量質(zhì)量好,數(shù)目多,即使算法一般,也會(huì)產(chǎn)生好的預(yù)測(cè)結(jié)果。本文的數(shù)據(jù)主要來(lái)源有三個(gè)方面:一是線上課程平臺(tái)日志文件,近年來(lái),微課和慕課等線上教學(xué)平臺(tái)蓬勃發(fā)展,涌現(xiàn)出了一批以MOOC(Massive Open Online Courses)為代表的在線學(xué)習(xí)平臺(tái)。這些在線平臺(tái)記錄了大量的學(xué)生在線學(xué)習(xí)日志,例如學(xué)生在線考試成績(jī)、在線學(xué)習(xí)時(shí)長(zhǎng)、學(xué)習(xí)次數(shù)、完成測(cè)驗(yàn)次數(shù)等。利用這些信息通過(guò)相關(guān)智能預(yù)測(cè)算法可以預(yù)測(cè)學(xué)生未來(lái)的學(xué)業(yè)發(fā)展情況和成績(jī);二是線下環(huán)境中積累的數(shù)據(jù),線下面對(duì)面教學(xué)仍然是高等教育的主流模式,多年來(lái)積累了海量的數(shù)據(jù),這些數(shù)據(jù)與學(xué)生信息密切相關(guān),比如學(xué)生系統(tǒng)中學(xué)生的基本信息(如性別、年齡等);教務(wù)系統(tǒng)中學(xué)生的課程成績(jī)、選課情況;一卡通系統(tǒng)中的學(xué)生消費(fèi)習(xí)慣、就餐行為;圖書(shū)管理系統(tǒng)的學(xué)生借書(shū)行為以及去圖書(shū)館自習(xí)的情況等;三是問(wèn)卷調(diào)查,這也是一種傳統(tǒng)的搜集數(shù)據(jù)源的方式。預(yù)測(cè)粒度也可以分成三種[2],分別是:試題(問(wèn)題)級(jí)別的預(yù)測(cè)、單科課程級(jí)別預(yù)測(cè)和學(xué)生綜合成績(jī)的預(yù)測(cè)。

      1.2 建模方法

      建模,就是建立模型,是為了理解事物而對(duì)事物做出的一種抽象。對(duì)于學(xué)生成績(jī)預(yù)測(cè)問(wèn)題來(lái)說(shuō),通過(guò)分析影響學(xué)生成績(jī)的因素并以此為據(jù)搜集整理建模所需的數(shù)據(jù),是獲得一個(gè)性能好的預(yù)測(cè)模型的基本要求。首先要搜集學(xué)生成績(jī)相關(guān)的數(shù)據(jù),數(shù)據(jù)來(lái)源主要是上面敘述的三個(gè)方面:一是課堂上的問(wèn)卷調(diào)查,可以通過(guò)微信小程序讓學(xué)生提交;二是通過(guò)校教務(wù)系統(tǒng)導(dǎo)出教務(wù)系統(tǒng)的相關(guān)數(shù)據(jù);三是摘取來(lái)自MOOC 平臺(tái)、云班課等網(wǎng)上慕課的成績(jī)信息,將這些異構(gòu)的成績(jī)數(shù)據(jù)進(jìn)行初步建模、歸類(lèi),化成同一種數(shù)據(jù)格式。然后運(yùn)用機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,在這里,要運(yùn)用多種機(jī)器學(xué)習(xí)算法(監(jiān)督學(xué)習(xí)算法、非監(jiān)督學(xué)習(xí)算法、深度學(xué)習(xí)算法、感知機(jī)、支持向量機(jī)算法等)和深度學(xué)習(xí)算法(神經(jīng)網(wǎng)絡(luò)算法、卷積網(wǎng)絡(luò)CNN、循環(huán)網(wǎng)絡(luò)RNN、LSTM 模型、Transformer 模型等)進(jìn)行比較測(cè)試,從不同的維度進(jìn)行比較,選擇最優(yōu)的算法進(jìn)行訓(xùn)練,并將訓(xùn)練完的模型用于學(xué)生成績(jī)的預(yù)測(cè)活動(dòng)中。具體流程如下:

      圖1 預(yù)測(cè)模型流程圖

      2 基于機(jī)器學(xué)習(xí)的預(yù)測(cè)方法

      2.1 機(jī)器學(xué)習(xí)

      機(jī)器學(xué)習(xí)的起源可以追溯到1959年Arthur Samuel[3]。機(jī)器學(xué)習(xí)方法主要分成三類(lèi):監(jiān)督學(xué)習(xí)(supervised learning,SL)、非監(jiān)督學(xué)習(xí)(unsupervised learning,UL)和強(qiáng)化學(xué)習(xí)(reinforcement learning,RL)。在監(jiān)督學(xué)習(xí)中,訓(xùn)練的數(shù)據(jù)包括示例和目標(biāo)值,其目的是為每個(gè)輸入實(shí)例分配類(lèi)別或真實(shí)的值,分配的值為類(lèi)別的情況稱為分類(lèi),分配的值為連續(xù)的真實(shí)值的情況稱為回歸。而在非監(jiān)督學(xué)習(xí)中,訓(xùn)練示例并沒(méi)有被標(biāo)記為相應(yīng)的目標(biāo)值,因此通常用于將相似的數(shù)據(jù)進(jìn)行聚類(lèi)。而強(qiáng)化學(xué)習(xí)關(guān)注的是在給定情況下找到合適的行動(dòng)以通過(guò)與周?chē)h(huán)境交互來(lái)獲得最大化的獎(jiǎng)勵(lì)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,在過(guò)去十年中迅速擴(kuò)展,深度學(xué)習(xí)將在下一節(jié)進(jìn)一步介紹。

      在監(jiān)督學(xué)習(xí)中,根據(jù)輸出的模型不同,可以分成三類(lèi):分類(lèi)預(yù)測(cè)模型、回歸預(yù)測(cè)模型和序列預(yù)測(cè)模型。分類(lèi)預(yù)測(cè)模型是一個(gè)從輸入變量(x)到離散輸出變量(y)的映射函數(shù)。這里輸出變量通常稱為標(biāo)簽或類(lèi)別。目前一些常見(jiàn)的SL 分類(lèi)器有:決策樹(shù)(DT)、支持向量機(jī)(SVM)、樸素貝葉斯(NB)、邏輯回歸(LoR)、K 近鄰(KNN)、神經(jīng)網(wǎng)絡(luò)(NN)、隨機(jī)森林(RF)?;貧w預(yù)測(cè)模型是一個(gè)從輸入變量(x)到連續(xù)輸出變量(y)的映射函數(shù)。輸出的連續(xù)變量是實(shí)數(shù),例如整數(shù)或者浮點(diǎn)值。一些常見(jiàn)的回歸模型有:線性回歸(LiR)、支持向量回歸(SVR)、逐步回歸(SWR)、分類(lèi)和回歸樹(shù)(CART)、嶺回歸和人工神經(jīng)網(wǎng)絡(luò)(ANN)等。序列預(yù)測(cè)模型中的序列建模是預(yù)測(cè)接下來(lái)會(huì)出現(xiàn)什么單詞/字母的任務(wù)。當(dāng)前輸出取決于先前的輸入,輸入的長(zhǎng)度不固定。分類(lèi)和回歸算法之間存在一些重疊。一些算法可用于分類(lèi)和回歸,只需稍做修改,例如,可以通過(guò)設(shè)置適當(dāng)?shù)拈撝祵⒕€性回歸轉(zhuǎn)換為二元分類(lèi):給定閾值(k),如果輸出(y)大于k,則文檔(d)將被標(biāo)記為1;否則,d將被標(biāo)記為0。隨著機(jī)器學(xué)習(xí)的不斷發(fā)展,又出現(xiàn)了一些高級(jí)的機(jī)器學(xué)習(xí)技術(shù),如集成學(xué)習(xí)(ensemble learning)、半監(jiān)督學(xué)習(xí)(semi-supervised learning)、主動(dòng)學(xué)習(xí)(active learning)和遷移學(xué)習(xí)(transfer learning)。

      2.2 機(jī)器學(xué)習(xí)的成績(jī)預(yù)測(cè)

      高校學(xué)生成績(jī)的數(shù)據(jù)源基本上都是具有標(biāo)簽的數(shù)據(jù)集,因此可以考慮使用監(jiān)督學(xué)習(xí)的方法進(jìn)行預(yù)測(cè)。在預(yù)測(cè)模型上,分類(lèi)和回歸都可以使用,也可以結(jié)合使用。分類(lèi)可以用作對(duì)學(xué)生成績(jī)以及相關(guān)情況類(lèi)別進(jìn)行劃分。而通過(guò)回歸模型則可以看出不同學(xué)生相關(guān)成績(jī)的連續(xù)變化情況。早期,研究者們提出了運(yùn)用貝葉斯網(wǎng)絡(luò)來(lái)構(gòu)建預(yù)測(cè)模型[4],取得了良好的效果。隨著機(jī)器學(xué)習(xí)的發(fā)展,決策樹(shù)算法[5]也被應(yīng)用到了成績(jī)預(yù)測(cè)模型中。運(yùn)用決策樹(shù)中的CART 算法進(jìn)行模型構(gòu)建,改進(jìn)了預(yù)測(cè)的準(zhǔn)確度。但是決策樹(shù)在生成模型過(guò)程中過(guò)于龐大、復(fù)雜,制約了訓(xùn)練的速度。

      預(yù)測(cè)分?jǐn)?shù)本質(zhì)上是個(gè)回歸問(wèn)題,回歸是根據(jù)特征因素預(yù)測(cè)出數(shù)值,特征可以有多個(gè),預(yù)測(cè)的數(shù)值也可以有多個(gè)。在設(shè)計(jì)實(shí)驗(yàn)的過(guò)程中,需要考慮兩個(gè)問(wèn)題,一是如何把類(lèi)別轉(zhuǎn)換成數(shù)值變量;二是如何選擇回歸模型。常見(jiàn)的回歸有線性回歸、邏輯回歸、嶺回歸和套索回歸等。可以采用獨(dú)熱碼(one-hot code)對(duì)其類(lèi)別進(jìn)行編碼。獨(dú)熱碼的效果就是把特征數(shù)字化、擴(kuò)大化。數(shù)字化顧名思義,就是把類(lèi)別變成數(shù)字,擴(kuò)大化則是把一個(gè)特征列變?yōu)槎鄠€(gè)特征列。從回歸模型上看,選擇了線性回歸模型,在該模型中,給定數(shù)據(jù)集,其中x為特征,y為真實(shí)值。線性回歸模型實(shí)際上就是求y和x的關(guān)系。它假設(shè)y和x之間存在線性關(guān)系,然后試圖學(xué)得一個(gè)線性模型,然后根據(jù)模型盡可能準(zhǔn)確地預(yù)測(cè)一個(gè)與真實(shí)值相接近的數(shù)值,表達(dá)式為:

      f(x)=w1×x1+w2×x2+…+wn×xn+d

      向量表達(dá)式為:f(x)=wTx+d,其中w=(w1,w2,……,wn)

      經(jīng)過(guò)四個(gè)模型的比較,發(fā)現(xiàn)嶺回歸模型效果較好。

      3 基于深度學(xué)習(xí)的預(yù)測(cè)方法

      3.1 深度學(xué)習(xí)

      深度學(xué)習(xí)的起源是神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)由許多稱為“神經(jīng)元”或“單元”的簡(jiǎn)單元素組成。神經(jīng)元通過(guò)連接上的權(quán)重連接在一起,以便它們可以協(xié)作處理信息并將信息存儲(chǔ)在這些權(quán)重上。一組神經(jīng)元,即所謂的“層”,在神經(jīng)網(wǎng)絡(luò)中的特定深度一起運(yùn)行。網(wǎng)絡(luò)的第一層稱為輸入層,其中包含原始訓(xùn)練數(shù)據(jù),最后一層是輸出層。每一層都可以被視為創(chuàng)建前一層輸出的抽象表示。

      深度學(xué)習(xí)中常用的有四種神經(jīng)架構(gòu):前饋神經(jīng)網(wǎng)絡(luò)(FNN)、深度信念網(wǎng)絡(luò)(DBN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)。前饋神經(jīng)網(wǎng)絡(luò)(FNN)是一系列非循環(huán)人工神經(jīng)網(wǎng)絡(luò),在輸入和輸出層之間具有一個(gè)或多個(gè)隱藏層,旨在通過(guò)使用具有多個(gè)非線性變換的模型架構(gòu)來(lái)表示數(shù)據(jù)中的高級(jí)抽象[6]。深度信念網(wǎng)絡(luò)(DBN)是一種生成圖形模型,它使用多級(jí)神經(jīng)網(wǎng)絡(luò)從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)層次表示,可以高概率地重建輸入數(shù)據(jù)的語(yǔ)義和內(nèi)容[7]。卷積神經(jīng)網(wǎng)絡(luò)(CNN)特別適合圖像識(shí)別和視頻分析任務(wù),因?yàn)镃NN 的靈感來(lái)自對(duì)哺乳動(dòng)物的視覺(jué)皮層的研究。與FNN不同,RNN 允許反向鏈接,因此可以記住事物。因此它非常適合處理文本和音頻等順序數(shù)據(jù),因?yàn)樗姆答仚C(jī)制模擬了“記憶”,因此RNN 的輸出由其當(dāng)前和先前的輸入決定[8]。雖然RNN 有記憶,但它的記憶可能不是那么好。具體來(lái)說(shuō),由于梯度消失的問(wèn)題,它只記得最近的事情,而不是前一段時(shí)間看到的內(nèi)容。為了使用標(biāo)準(zhǔn)RNN 模型解決這個(gè)問(wèn)題,SE 中廣泛采用了兩種變體,它們具有捕獲長(zhǎng)期依賴關(guān)系的機(jī)制:長(zhǎng)期短期記憶(LSTM)網(wǎng)絡(luò)[9]和門(mén)控循環(huán)單元(GRU)。2017年以后,注意力機(jī)制(Attention)得到了大家的認(rèn)可。Transformer 模型[10]為目前較為先進(jìn)的深度學(xué)習(xí)模型。

      3.2 深度學(xué)習(xí)的預(yù)測(cè)

      在運(yùn)用機(jī)器學(xué)習(xí)方法進(jìn)行學(xué)生成績(jī)的預(yù)測(cè)過(guò)程中,對(duì)樣本進(jìn)行特征工程是其重要的一個(gè)步驟環(huán)節(jié)。特征的選擇依賴于相關(guān)教育專家的知識(shí)積累和預(yù)測(cè)。深度學(xué)習(xí)則避免了人工的經(jīng)驗(yàn)缺陷,可以自動(dòng)學(xué)習(xí)到樣本的特征表示。在深度學(xué)習(xí)的模型中,成績(jī)樣本通過(guò)模型的層層傳遞和加工,消除了與預(yù)測(cè)目標(biāo)聯(lián)系不緊密的特征。這也是深度學(xué)習(xí)技術(shù)在預(yù)測(cè)過(guò)程中強(qiáng)于傳統(tǒng)機(jī)器學(xué)習(xí)方法的關(guān)鍵之處。

      由于高校學(xué)生成績(jī)的原始數(shù)據(jù)都是文本型數(shù)據(jù),因此在將數(shù)據(jù)放入模型前先要進(jìn)行特征提取。可以運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)模型(CNN)[11],首先對(duì)文本進(jìn)行分詞,轉(zhuǎn)化為詞向量。CNN 中的卷積層可以將詞向量轉(zhuǎn)化為特征矩陣。對(duì)于單個(gè)神經(jīng)元,可以引入非線性因素,使得神經(jīng)網(wǎng)絡(luò)可以模擬非線性函數(shù)的效果,運(yùn)用ReLU 反向激活函數(shù)[12]進(jìn)行非線性映射。CNN 中的池化層可以去除特征中的噪聲,保留了特征中的重要因素。由于CNN 沒(méi)有記憶功能,可以考慮結(jié)合LSTM 模型進(jìn)行特征提取。同時(shí)考慮使用帶有注意力機(jī)制的Transformer 模型進(jìn)行預(yù)測(cè),實(shí)驗(yàn)證明,Transformer模型可以更加精確地進(jìn)行預(yù)測(cè),但是也存在需要大數(shù)據(jù)量訓(xùn)練以及訓(xùn)練時(shí)間較慢的缺點(diǎn)。

      4 結(jié)論

      通過(guò)前面的論述與評(píng)價(jià),我們得出基于深度學(xué)習(xí)的學(xué)生成績(jī)數(shù)據(jù)預(yù)測(cè)方法具有較高的預(yù)測(cè)準(zhǔn)確度,性能優(yōu)于機(jī)器學(xué)習(xí)算法,更勝過(guò)傳統(tǒng)的預(yù)測(cè)方法。盡管深度學(xué)習(xí)在學(xué)生成績(jī)預(yù)測(cè)方面取得了較好的效果,但是仍然存在以下問(wèn)題有待進(jìn)一步研究和解決。

      (1)異構(gòu)數(shù)據(jù)源中仍然存在類(lèi)不平衡的問(wèn)題。為了解決數(shù)據(jù)不平衡的問(wèn)題,目前的兩種主流方法是過(guò)采樣和欠采樣問(wèn)題,但是這兩種方法都不夠完美,目前這個(gè)問(wèn)題仍然有待進(jìn)一步研究。

      (2)由于引入了深度學(xué)習(xí)的方法,導(dǎo)致運(yùn)算量變大,訓(xùn)練時(shí)間變長(zhǎng),需要調(diào)整的參數(shù)也變多,調(diào)整工作量變大。下一步要進(jìn)一步優(yōu)化模型來(lái)減少參數(shù)數(shù)目,減少訓(xùn)練的成本和時(shí)間。

      猜你喜歡
      機(jī)器神經(jīng)網(wǎng)絡(luò)深度
      機(jī)器狗
      機(jī)器狗
      深度理解一元一次方程
      神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      深度觀察
      深度觀察
      未來(lái)機(jī)器城
      電影(2018年8期)2018-09-21 08:00:06
      深度觀察
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      南郑县| 广灵县| 新绛县| 错那县| 瑞金市| 墨竹工卡县| 德兴市| 孟村| 东光县| 扶绥县| 宁乡县| 涟源市| 余干县| 自贡市| 依安县| 内丘县| 班玛县| 措勤县| 防城港市| 微博| 赫章县| 广水市| 宁明县| 高尔夫| 红桥区| 元阳县| 湖口县| 昌黎县| 呼图壁县| 保德县| 南和县| 南康市| 灵寿县| 英德市| 津南区| 龙江县| 兴和县| 满洲里市| 曲沃县| 山阳县| 德安县|