• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      教育大數(shù)據(jù)分析:方法與探索

      2017-09-05 19:45:25王宏志熊風(fēng)鄒開(kāi)發(fā)劉哲敏
      中國(guó)大學(xué)教學(xué) 2017年5期
      關(guān)鍵詞:大數(shù)據(jù)分析教育

      王宏志+熊風(fēng)+鄒開(kāi)發(fā)+劉哲敏

      摘 要:當(dāng)今社會(huì)已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,分析了大數(shù)據(jù)分析與傳統(tǒng)數(shù)據(jù)分析的不同, 綜述了在線教育大數(shù)據(jù)分析的研究現(xiàn)狀,并且介紹了基于大數(shù)據(jù)對(duì)在線教育學(xué)習(xí)者行為預(yù)測(cè)的研究成果。

      關(guān)鍵詞:大數(shù)據(jù);分析;教育;行為預(yù)測(cè)

      一、大數(shù)據(jù)與大數(shù)據(jù)分析概述

      隨著數(shù)據(jù)獲取、存儲(chǔ)等技術(shù)的不斷發(fā)展,以及人們對(duì)數(shù)據(jù)的重視程度不斷提高,大數(shù)據(jù)得到了廣泛的重視,不僅僅在IT領(lǐng)域,包括經(jīng)濟(jì)學(xué)領(lǐng)域、醫(yī)療領(lǐng)域、營(yíng)銷(xiāo)領(lǐng)域等等。例如,在移動(dòng)社交網(wǎng)絡(luò)中,用戶拍照片、上網(wǎng)、評(píng)論、點(diǎn)贊等信息積累起來(lái)都構(gòu)成大數(shù)據(jù);醫(yī)療系統(tǒng)中的病例、醫(yī)學(xué)影像等積累起來(lái)也構(gòu)成大數(shù)據(jù);在商務(wù)系統(tǒng)中,顧客購(gòu)買(mǎi)東西的行為被記錄下來(lái),也形成了大數(shù)據(jù)。

      時(shí)至今日,大數(shù)據(jù)并沒(méi)有特別公認(rèn)的定義。有三個(gè)不同角度的定義:(1)“大數(shù)據(jù)”指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)人工在合理時(shí)間內(nèi)達(dá)到截取、管理、處理并整理成為人類(lèi)所能解讀的信息[1]。(2)“大數(shù)據(jù)”指不用隨機(jī)分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理的方法的數(shù)據(jù)[2]。(3)“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。

      通常把大數(shù)據(jù)的特點(diǎn)歸納為4個(gè)V,即數(shù)據(jù)量大(Volume)、數(shù)據(jù)類(lèi)型多(Varity)、數(shù)據(jù)的價(jià)值密度低(Value)以及數(shù)據(jù)產(chǎn)生和處理的速度非??欤╒elocity)。

      對(duì)大數(shù)據(jù)進(jìn)行分析可以產(chǎn)生新的價(jià)值。數(shù)據(jù)分析的概念誕生于大數(shù)據(jù)時(shí)代之前,但傳統(tǒng)的數(shù)據(jù)分析和大數(shù)據(jù)分析是不同的。傳統(tǒng)的數(shù)據(jù)分析往往是由客戶提出一個(gè)問(wèn)題,分析者圍繞該問(wèn)題建立一個(gè)系統(tǒng),進(jìn)而基于該系統(tǒng)解釋這個(gè)問(wèn)題;而大數(shù)據(jù)分析有時(shí)候并沒(méi)有明確的問(wèn)題,而是通過(guò)搜集數(shù)據(jù),瀏覽數(shù)據(jù)來(lái)提出問(wèn)題。

      另一方面,傳統(tǒng)的數(shù)據(jù)分析是在可用的信息上進(jìn)行抽樣,大數(shù)據(jù)分析則是對(duì)數(shù)據(jù)進(jìn)行不斷的探索,通過(guò)全局分析連接數(shù)據(jù),達(dá)到數(shù)據(jù)分析的目的。

      傳統(tǒng)的數(shù)據(jù)分析的方法,往往是大膽假設(shè)小心求證,先做出假設(shè),再對(duì)數(shù)據(jù)進(jìn)行分析,從而驗(yàn)證先前的假設(shè);而大數(shù)據(jù)分析則是對(duì)大數(shù)據(jù)進(jìn)行探索來(lái)發(fā)現(xiàn)結(jié)果,甚至發(fā)現(xiàn)錯(cuò)誤的結(jié)果,之后再通過(guò)數(shù)據(jù)驗(yàn)證結(jié)果是否正確。

      因此,傳統(tǒng)的數(shù)據(jù)分析可以看成一種靜態(tài)的分析,大數(shù)據(jù)分析可以看成一種動(dòng)態(tài)的分析。盡管如此,大數(shù)據(jù)分析和傳統(tǒng)數(shù)據(jù)分析也并非是涇渭分明的,傳統(tǒng)數(shù)據(jù)分析的方法是大數(shù)據(jù)分析的基礎(chǔ),在很多大數(shù)據(jù)分析的工作中仍沿用了傳統(tǒng)數(shù)據(jù)分析的方法。

      基于上述討論,我們給出“大數(shù)據(jù)分析”的定義:用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)大數(shù)據(jù)進(jìn)行分析,提取有用信息并形成結(jié)論,從而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過(guò)程。

      大數(shù)據(jù)分析分為三個(gè)層次[3],即描述分析、預(yù)測(cè)分析和規(guī)范分析。描述分析是探索歷史數(shù)據(jù)并描述發(fā)生了什么(分析已經(jīng)發(fā)生的行為),預(yù)測(cè)分析用于預(yù)測(cè)未來(lái)的概率和趨勢(shì)(分析可能發(fā)生的行為),規(guī)范分析根據(jù)期望的結(jié)果、特定場(chǎng)景、資源以及對(duì)過(guò)去和當(dāng)前事件的了解對(duì)未來(lái)的決策給出建議(分析應(yīng)該發(fā)生的行為)。例如,對(duì)于學(xué)生學(xué)習(xí)成績(jī)的分析,描述分析是通過(guò)分析描述學(xué)生的行為,如是否成績(jī)高的同學(xué)回答問(wèn)題較多;預(yù)測(cè)分析是根據(jù)學(xué)生的學(xué)習(xí)行為數(shù)據(jù)對(duì)其分?jǐn)?shù)進(jìn)行預(yù)測(cè),如根據(jù)學(xué)生回答問(wèn)題的次數(shù)預(yù)測(cè)其成績(jī);而規(guī)范分析則是根據(jù)學(xué)生的數(shù)據(jù)得到學(xué)生下一步的學(xué)習(xí)計(jì)劃,如對(duì)學(xué)生回答問(wèn)題的最優(yōu)次數(shù)提出建議。

      大數(shù)據(jù)分析的過(guò)程可以劃分為如下7個(gè)步驟:(1)業(yè)務(wù)調(diào)研,即明確分析的目標(biāo);(2)數(shù)據(jù)

      準(zhǔn)備,收集需要的數(shù)據(jù);(3)數(shù)據(jù)瀏覽,發(fā)現(xiàn)數(shù)據(jù)可能存在的關(guān)聯(lián);(4)變量選擇,找出自變量與因變量;(5)定義模式,確定模型;(6)計(jì)算模型的參數(shù);(7)模型評(píng)估。

      我們以預(yù)測(cè)學(xué)生學(xué)習(xí)成績(jī)?yōu)槔忉屔鲜鲞^(guò)程。首先,我們的目的是根據(jù)學(xué)生的行為預(yù)測(cè)學(xué)習(xí)成績(jī)。接下來(lái),對(duì)于傳統(tǒng)的方法來(lái)說(shuō),通過(guò)專家的分析確定需要什么數(shù)據(jù),比如專家提出對(duì)學(xué)生成績(jī)有影響的數(shù)據(jù),包括出勤率、作業(yè)的完成率等,可以從數(shù)據(jù)源獲取這樣的數(shù)據(jù);大數(shù)據(jù)分析的方法有所不同,是找到所有可能相關(guān)的數(shù)據(jù),甚至包括血型等,這些數(shù)據(jù)與成績(jī)之間的關(guān)系未必有影響,就算發(fā)現(xiàn)了關(guān)系也未必可以解釋,但是獲取盡可能多的數(shù)據(jù)有可能發(fā)現(xiàn)未知的關(guān)聯(lián)關(guān)系。

      上面的步驟包括了很多因素,下面確定哪些因素會(huì)體現(xiàn)在模型中,可以通過(guò)可視化等方法發(fā)現(xiàn)哪些因素和我們的分析目標(biāo)相關(guān),也可以通過(guò)特征工程的方法選擇包含在模型中的變量,并排除一些相關(guān)的自變量,比如學(xué)生的起床時(shí)間和吃早飯的時(shí)間存在關(guān)聯(lián),在模型中可以只考慮其中之一,加快計(jì)算速度。

      再接下來(lái)是定義模型的模式,比如可以把上述問(wèn)題定義為線性回歸,再通過(guò)一些算法確定模型中的參數(shù),從而得到最后的模型。然后對(duì)模型進(jìn)行評(píng)估,檢驗(yàn)這個(gè)模型是不是真的有效,以及是否是可解釋的。有些有用的模型并不見(jiàn)得可解釋,例如發(fā)現(xiàn)了血壓對(duì)成績(jī)有影響,這個(gè)是有用的,但是未必有一個(gè)明確的解釋。

      二、在線教育大數(shù)據(jù)分析研究現(xiàn)狀

      在線教育大數(shù)據(jù)為教育研究的進(jìn)行提供了非常好的途徑和機(jī)會(huì),它構(gòu)成了一個(gè)跨國(guó)家、跨文化、跨職業(yè)、跨階層的平臺(tái),學(xué)習(xí)者的每個(gè)行為都為研究者貢獻(xiàn)了數(shù)據(jù)。而通過(guò)研究這些數(shù)據(jù),我們可以發(fā)現(xiàn)新的規(guī)律,或是指導(dǎo)學(xué)習(xí)者的行為,例如預(yù)測(cè)學(xué)生的學(xué)習(xí)情況、課程的受歡迎程度以及發(fā)現(xiàn)新的學(xué)習(xí)方法等。利用平臺(tái)得到的數(shù)據(jù),預(yù)測(cè)并回饋給平臺(tái),從而可以達(dá)到改進(jìn)平臺(tái)的目的,還可以為平臺(tái)發(fā)現(xiàn)新的業(yè)務(wù)。

      當(dāng)前在線教育大數(shù)據(jù)的研究已經(jīng)開(kāi)始,但是研究成果并不多,主要的研究對(duì)象是學(xué)生,集中在對(duì)學(xué)生學(xué)習(xí)行為的研究,而授課人員的行為和平臺(tái)的行為這兩個(gè)方面的研究比較少。我們將現(xiàn)有的主流研究?jī)?nèi)容進(jìn)行歸類(lèi),分為多個(gè)方面,包括:

      (1)學(xué)習(xí)者行為分析與預(yù)測(cè);

      (2)學(xué)習(xí)者學(xué)習(xí)效果分析與預(yù)測(cè);

      (3)平臺(tái)供應(yīng)商數(shù)據(jù)分析。

      學(xué)習(xí)者行為分析與預(yù)測(cè)的研究指的是,通過(guò)學(xué)習(xí)者在MOOC平臺(tái)上產(chǎn)生并積累的行為數(shù)據(jù),采用量化學(xué)習(xí)者行為特征的方式,對(duì)其學(xué)習(xí)行為進(jìn)行分析與預(yù)測(cè)。具體而言,文獻(xiàn)[4]研究了在MOOC平臺(tái)上有退課風(fēng)險(xiǎn)的學(xué)習(xí)者的早期預(yù)警問(wèn)題,他們基于回歸分析的方法,提出了兩種遷移學(xué)習(xí)算法,通過(guò)增添正則項(xiàng)最小化連續(xù)不間斷學(xué)習(xí)周中的失敗概率。文中提出了三個(gè)方法,分別是LR-SEQ,LR-SIM與LR-MOV,其中在AUC指標(biāo)上LR-SIM與LR-MOV效果更好,LR-SIM在開(kāi)課前兩周的預(yù)測(cè)相對(duì)于其他方法更為出色。文獻(xiàn)[5]采用了機(jī)器學(xué)習(xí)的方法研究了學(xué)習(xí)者退課率的預(yù)測(cè)方法,他們僅利用了網(wǎng)頁(yè)瀏覽流數(shù)據(jù),提出了基于支持向量機(jī)的機(jī)器學(xué)習(xí)模型以預(yù)測(cè)學(xué)習(xí)者的退課情況。他們的方法隨著課程的進(jìn)行,預(yù)測(cè)準(zhǔn)確率逐漸上升,但在開(kāi)課前幾周的預(yù)測(cè)效果不夠理想。文獻(xiàn)[6]同樣研究了學(xué)習(xí)者退課預(yù)測(cè)的問(wèn)題,他們采用的方法是構(gòu)建精確的預(yù)測(cè)模型與數(shù)據(jù)的時(shí)態(tài)與非時(shí)態(tài)表達(dá),得到了較為良好的AUC指標(biāo)。文獻(xiàn)[7]則是采用了隱形馬爾科夫模型對(duì)學(xué)習(xí)者課程滯留情況進(jìn)行了預(yù)測(cè),他們通過(guò)簡(jiǎn)單交叉乘積的方法,將連續(xù)特征編碼為單一離散可觀察狀態(tài)。文獻(xiàn)[8]同樣研究了退課問(wèn)題,他們構(gòu)建了時(shí)序模型,通過(guò)標(biāo)簽的方法,采用了LSTM單元的RNN模型。他們得到的結(jié)果說(shuō)明了在此問(wèn)題上使用LSTM單元要比普通的RNN效果更好。文獻(xiàn)[9]研究了在MOOC平臺(tái)上的學(xué)習(xí)者行為預(yù)測(cè)模型的遷移學(xué)習(xí),他們提出了學(xué)習(xí)者預(yù)測(cè)的實(shí)時(shí)方法,并提出了對(duì)于同一個(gè)預(yù)測(cè)問(wèn)題,建立表達(dá)式以改變這些方法的參數(shù)設(shè)置,實(shí)驗(yàn)證明了遷移學(xué)習(xí)可以使得兩種方法的效果等價(jià)。文獻(xiàn)[10]則首次針對(duì)中文MOOC中學(xué)習(xí)行為的特點(diǎn)將學(xué)習(xí)者分類(lèi)以考察學(xué)習(xí)行為與效果之間的關(guān)系,這項(xiàng)工作使得人們可以有效判別一個(gè)學(xué)習(xí)者是否能夠或潛在能夠完成學(xué)習(xí)任務(wù)。文獻(xiàn)[11]通過(guò)學(xué)習(xí)者積累的作業(yè)文章與MOOC瀏覽流數(shù)據(jù)對(duì)學(xué)習(xí)行為進(jìn)行了分析與預(yù)測(cè)。文獻(xiàn)[12]對(duì)學(xué)習(xí)者高風(fēng)險(xiǎn)退課進(jìn)行預(yù)警。

      學(xué)習(xí)者學(xué)習(xí)效果分析與預(yù)測(cè)旨在研究學(xué)習(xí)者通過(guò)完成何種學(xué)習(xí)過(guò)程達(dá)到了何種學(xué)習(xí)效果,建立學(xué)習(xí)過(guò)程與學(xué)習(xí)效果的關(guān)系。具體地說(shuō),文獻(xiàn)[13]預(yù)測(cè)了學(xué)習(xí)者在回答問(wèn)題時(shí),第一次是否可以回答正確。他們利用學(xué)習(xí)者觀看教學(xué)視頻的數(shù)據(jù),結(jié)合了區(qū)間估計(jì)方法與支持向量機(jī)分類(lèi)方法,建立了預(yù)測(cè)模型,并通過(guò)多項(xiàng)實(shí)驗(yàn)證明了他們的方法比傳統(tǒng)預(yù)測(cè)算法更優(yōu)。類(lèi)似地,文獻(xiàn)[14]評(píng)價(jià)了觀看視頻表現(xiàn)行為與視頻內(nèi)小測(cè)表現(xiàn)的關(guān)系,他們識(shí)別了學(xué)習(xí)者反復(fù)看視頻的行為,例如復(fù)習(xí)學(xué)習(xí)內(nèi)容與重復(fù)跳過(guò),對(duì)此,他們提出了兩種基于瀏覽流數(shù)據(jù)的方法,構(gòu)建了流數(shù)據(jù)與獲得知識(shí)的相關(guān)模型,他們通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)這些行為和學(xué)習(xí)者第一次回答正確情況與非第一次回答正確情況極度相關(guān)。同樣,文獻(xiàn)[15]研究了預(yù)測(cè)學(xué)習(xí)者第一次問(wèn)答是否正確的問(wèn)題,他們?cè)谶@個(gè)分類(lèi)問(wèn)題中應(yīng)用了協(xié)同過(guò)濾算法,并在KDD Cup 2010競(jìng)賽中取得了第三名的成績(jī)[16]。文獻(xiàn)[17]預(yù)測(cè)了學(xué)習(xí)者的學(xué)習(xí)成績(jī),他們提出的增強(qiáng)學(xué)習(xí)預(yù)測(cè)算法可以同時(shí)用做回歸與分類(lèi)。文獻(xiàn)[18]則是研究了對(duì)于預(yù)測(cè)結(jié)果通過(guò)增量交互分類(lèi)的方法建立更為精確的分類(lèi)模型是否可行。文獻(xiàn)[19]發(fā)現(xiàn)了MOOC平臺(tái)上那些通過(guò)建立多賬號(hào)以謀求獲得作業(yè)答案的學(xué)習(xí)者。

      平臺(tái)供應(yīng)商數(shù)據(jù)分析是指使用MOOC平臺(tái)供應(yīng)商上積累的數(shù)據(jù)進(jìn)行全局的分析,該項(xiàng)數(shù)據(jù)分析工作并不針對(duì)一種特定問(wèn)題,而是針對(duì)某一類(lèi)的問(wèn)題。例如,文獻(xiàn)[20]綜合分析了多個(gè)MOOC平臺(tái)上的數(shù)據(jù)得出它們具有一些相同的數(shù)據(jù)屬性。文獻(xiàn)[21]通過(guò)平臺(tái)積累的教育信息對(duì)學(xué)習(xí)者提供動(dòng)態(tài)的學(xué)習(xí)輔助材料。文獻(xiàn)[22]通過(guò)氣象數(shù)據(jù)與學(xué)習(xí)者方法日志數(shù)據(jù)通過(guò)建立回歸分析模型指出何種特征是有關(guān)聯(lián)的。

      綜上,當(dāng)前的研究有如下幾個(gè)熱點(diǎn)問(wèn)題:

      (1)學(xué)習(xí)者行為的定義。我們?nèi)绾味x學(xué)習(xí)行為,提取什么樣的特征來(lái)描述這個(gè)學(xué)習(xí)行為。

      (2)如何評(píng)價(jià)學(xué)習(xí)效果。建立什么樣的有效模型來(lái)描述學(xué)習(xí)效果,這是一個(gè)傳統(tǒng)教育學(xué)的問(wèn)題,可以通過(guò)專家的評(píng)價(jià)來(lái)解決,由于在線教育平臺(tái)搜集了大量的學(xué)習(xí)行為數(shù)據(jù),則完全可以通過(guò)學(xué)生的行為來(lái)描述學(xué)習(xí)效果。

      (3)退課現(xiàn)象。在線課程目前的通過(guò)率是非常低的,通過(guò)大數(shù)據(jù)進(jìn)行分析,研究為什么發(fā)生這樣的情況。

      (4)學(xué)習(xí)者是否可以一次回答正確問(wèn)題。由于小測(cè)問(wèn)題通常較為基礎(chǔ),該項(xiàng)研究可以驗(yàn)證學(xué)習(xí)者是否認(rèn)真學(xué)習(xí)。

      除了以上問(wèn)題,還有多種有關(guān)在線教育大數(shù)據(jù)的研究,例如針對(duì)不同身份的人群的學(xué)習(xí)者分析等[23]。總之,在線教育大數(shù)據(jù)研究工作近幾年方興未艾,出現(xiàn)了很多有價(jià)值的問(wèn)題亟待研究與解決。

      三、教育大數(shù)據(jù)分析的探索

      通過(guò)以上的分析,我們認(rèn)為,對(duì)學(xué)習(xí)者行為的研究可以通過(guò)提取學(xué)習(xí)的行為來(lái)實(shí)現(xiàn),比如課程視頻的點(diǎn)擊、回看、做題做作業(yè)的行為、討論組里面的言論等,提取特征以后對(duì)行為進(jìn)行描述可以定量和定性不同方式進(jìn)行。定量描述包括回答了幾次問(wèn)題、平均每個(gè)視頻看多長(zhǎng)時(shí)間等;定性描述包括用戶在群里面對(duì)這個(gè)老師的評(píng)價(jià)是肯定的還是消極的,或者是這個(gè)學(xué)生是不是喜歡這門(mén)課,以及這個(gè)學(xué)生是否看到這個(gè)視頻的評(píng)價(jià)。

      學(xué)習(xí)者的表現(xiàn)研究比如說(shuō)學(xué)習(xí)成績(jī)、課程的熱度,這些特征也是可以提取的,同樣有定性、定量,同樣對(duì)這些數(shù)據(jù)進(jìn)行整合,通過(guò)分析可以建立學(xué)習(xí)和行為者的表現(xiàn)關(guān)系。表現(xiàn)和行為之間是有因果關(guān)聯(lián)的,行為決定表現(xiàn),但是這個(gè)事情我們只能觀察到一方面,另外一方面并不能有效觀察或者預(yù)測(cè)。我們可以通過(guò)分析來(lái)刻畫(huà)學(xué)習(xí)的過(guò)程,確定行為與表現(xiàn)的關(guān)系,比如用戶總是看視頻時(shí)間很短,決定了不太可能獲得好成績(jī)的結(jié)果,就可以通過(guò)建立這樣的關(guān)系進(jìn)行預(yù)測(cè)。

      我們通過(guò)累計(jì)的學(xué)習(xí)行為判斷用戶是不是退課,在各種學(xué)習(xí)行為以及退課行為之間我們探究是何種因素導(dǎo)致了退課的發(fā)生。此外,對(duì)于累計(jì)的教學(xué)行為和教學(xué)效果之間的關(guān)系,我們可以通過(guò)挖掘這些老師的教學(xué)行為來(lái)分析。

      基于這些,我們對(duì)“中國(guó)大學(xué)MOOC”平臺(tái)上部分課程的后臺(tái)數(shù)據(jù)進(jìn)行了采樣和清洗,提取了我們需要的特征,如表1所示。

      我們統(tǒng)計(jì)了每個(gè)學(xué)習(xí)者在每個(gè)學(xué)習(xí)周的如上特征,之后經(jīng)過(guò)多次測(cè)試,我們選定了雙向長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(Bi-directional LSTM RNN)作為我們的學(xué)習(xí)模型,并使用這些數(shù)據(jù)作為模型的輸入。為了更全面地分析退課率的問(wèn)題,我們將該問(wèn)題細(xì)分為四個(gè)問(wèn)題,如表2所示。

      問(wèn)題1直接預(yù)測(cè)了學(xué)習(xí)者在下一周的動(dòng)態(tài),而問(wèn)題2則是預(yù)測(cè)了學(xué)習(xí)者學(xué)習(xí)的總體趨勢(shì),除此之外,授課者有時(shí)可能更加關(guān)心學(xué)習(xí)者在最后一周以及考試周的表現(xiàn),這也是我們定義了問(wèn)題3和問(wèn)題4的原因。我們將這四個(gè)問(wèn)題作為模型的輸出,并以80%的數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,20%的數(shù)據(jù)進(jìn)行測(cè)試。

      通過(guò)對(duì)編號(hào)為45002的課程測(cè)試結(jié)果分析發(fā)現(xiàn),問(wèn)題1的準(zhǔn)確率波動(dòng)幅度較大,而實(shí)際上,學(xué)習(xí)者在下一周的行為也通常是不確定的,這給模型的預(yù)測(cè)帶來(lái)了較大的困難;而對(duì)于問(wèn)題2,隨著教學(xué)周的進(jìn)行,學(xué)習(xí)者的總體學(xué)習(xí)趨勢(shì)也越來(lái)越明顯,因此其準(zhǔn)確率隨著教學(xué)周逐步上升;同理,問(wèn)題3和問(wèn)題4的結(jié)果也呈現(xiàn)出類(lèi)似的趨勢(shì)。

      實(shí)驗(yàn)結(jié)果表明,我們所使用的模型具有較高的準(zhǔn)確率,并且隨著教學(xué)周的進(jìn)行,準(zhǔn)確率會(huì)得到提升,這對(duì)于授課者掌握學(xué)習(xí)者的動(dòng)態(tài)是有利的。但對(duì)于部分課程,由于課程性質(zhì)問(wèn)題,導(dǎo)致學(xué)習(xí)者較少,我們所能獲得的數(shù)據(jù)有限,便會(huì)降低模型的準(zhǔn)確率。

      參考文獻(xiàn):

      [1] 王克迪. 數(shù)據(jù)、大數(shù)據(jù)及其本質(zhì)[N]. 學(xué)習(xí)時(shí)報(bào),2015-09-14.

      [2] 維克托·邁爾·舍恩伯格,肯尼斯·庫(kù)克耶. 大數(shù)據(jù)時(shí)代[M]. 盛楊燕,周濤,譯. 杭州:浙江人民出版社.

      [3] G. Blackett. Analytics Network-O.R. Analytics. http://www.theorsociety.com/Pages/SpecialInterest/AnalyticsNetwork_anal%ytics.aspx, 2013.

      [4] He J, Bailey J, Rubinstein B I P, et al. Identifying At-Risk Students in Massive Open Online Courses[J]. Aaai, 2015.

      [5] Kloft M, Stiehler F, Zheng Z, et al. Predicting MOOC Dropout over Weeks Using Machine Learning Methods[A]. EMNLP 2014 Workshop on Analysis of Large Scale Social Interaction in Moocs. 2014:60-65.

      [6] Taylor C, Veeramachaneni K, OReilly U M. Likely to stop? Predicting Stopout in Massive Open Online Courses[J]. Computer Science, 2014.

      [7] Balakrishnan G, Coetzee D. Predicting student retention in massive open online courses using hidden markov models[J]. Electrical Engineering and Computer Sciences University of California at Berkeley, 2013.

      [8] Fei M, Yeung D Y. Temporal Models for Predicting Student Dropout in Massive Open Online Courses[A]. IEEE International Conference on Data Mining Workshop. IEEE, 2015:256-263.

      [9] Boyer S, Veeramachaneni K. Transfer Learning for Predictive Models in Massive Open Online Courses[M]// Artificial Intelligence in Education. Springer International Publishing, 2015:54-63.

      [10] Tang S, Peterson J C, Pardos Z A. Deep Neural Networks and How They Apply to Sequential Education Data[A]. Proceedings of the Third (2016) ACM Conference on Learning@ Scale. ACM, 2016: 321-324.

      [11] 蔣卓軒, 張巖, 李曉明. 基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測(cè)[J]. 計(jì)算機(jī)研究與發(fā)展, 2015, 52(3):614-628.

      [12] Halawa S, Greene D, Mitchell J. Dropout prediction in MOOCs using learner activity features[J]. Experiences and best practices in and around MOOCs, 2014, 7.

      [13] Brinton C G, Chiang M. Mooc performance prediction via clickstream data and social learning networks[A]. Computer Communications (INFOCOM), 2015 IEEE Conference on. IEEE, 2015: 2299-2307.

      [14] Brinton C G, Buccapatnam S, Chiang M, et al. Mining MOOC Clickstreams: Video-Watching Behavior vs. In-Video Quiz Performance[J]. IEEE Transactions on Signal Processing, 2016, 64(14): 3677-3692.

      [15] Toscher A, Jahrer M. Collaborative filtering applied to educational data mining[J]. KDD cup, 2010.

      [16] KDD Cup 2010: Educational Data Mining Challenge - PSLC DataShop[EB/OL]. https://pslcdatashop.web.cmu.edu/KDDCup/.

      [17] Meier Y, Xu J, Atan O, et al. Predicting grades[J]. IEEE Transactions on Signal Processing, 2016, 64(4): 959-972.

      [18] Sanchez-Santillan M, Paule-Ruiz M P, Cerezo R, et al. Predicting Students Performance: Incremental Interaction Classifiers[A]. Proceedings of the Third (2016) ACM Conference on Learning@ Scale. ACM, 2016: 217-220.

      [19] Ruiperez-Valiente J A, Alexandron G, Chen Z, et al. Using multiple accounts for harvesting solutions in moocs[A]. Proceedings of the Third (2016) ACM Conference on Learning@ Scale. ACM, 2016: 63-70.

      [20] Pang Y, Wang T, Wang N. MOOC Data from Providers[A]. Enterprise Systems Conference (ES), 2014. IEEE, 2014: 87-90.

      [21] Williams J J, Kim J, Rafferty A, et al. Axis: Generating explanations at scale with learnersourcing and machine learning[A]. Proceedings of the Third (2016) ACM Conference on Learning@ Scale. ACM, 2016: 379-388.

      [22] McBride E, Vitale J M, Gogel H, et al. Predicting Student Learning using Log Data from Interactive Simulations on Climate Change[A]. Proceedings of the Third (2016) ACM Conference on Learning@ Scale. ACM, 2016: 185-188.

      [23] Kizilcec R, Halawa S. Attrition and Achievement Gaps in Online Learning[A]. Proceedings of the Second (2015) ACM Conference on Learning @ Scale. ACM, 2015:57-66.

      猜你喜歡
      大數(shù)據(jù)分析教育
      國(guó)外教育奇趣
      題解教育『三問(wèn)』
      隱蔽失效適航要求符合性驗(yàn)證分析
      教育有道——關(guān)于閩派教育的一點(diǎn)思考
      電力系統(tǒng)不平衡分析
      電子制作(2018年18期)2018-11-14 01:48:24
      辦好人民滿意的首都教育
      電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      勃利县| 古田县| 平阳县| 都昌县| 卢湾区| 遂昌县| 乐安县| 龙门县| 安塞县| 屯留县| 西丰县| 昌平区| 昆明市| 香河县| 通化市| 县级市| 纳雍县| 容城县| 庆云县| 会同县| 寿宁县| 西和县| 信阳市| 行唐县| 康定县| 景泰县| 高雄市| 东丽区| 朝阳县| 太白县| 龙州县| 遵义县| 广德县| 新平| 靖安县| 阿克陶县| 永城市| 古浪县| 锡林浩特市| 红原县| 宁海县|