趙楠 賈積有
【摘 要】數(shù)據(jù)挖掘是人工智能技術(shù)的一個(gè)重要研究領(lǐng)域,可以用于教學(xué)系統(tǒng)的學(xué)習(xí)者分析,對(duì)實(shí)施個(gè)性化教學(xué)提供借鑒參考。本文采用數(shù)據(jù)挖掘軟件SPSS和WEKA對(duì)一門(mén)慕課(MOOC)的學(xué)員學(xué)習(xí)行為數(shù)據(jù)進(jìn)行了詳細(xì)分析,發(fā)現(xiàn)最終取得的學(xué)生成績(jī)與在線時(shí)長(zhǎng)、平時(shí)小測(cè)成績(jī)、瀏覽網(wǎng)頁(yè)、視頻、課件的次數(shù)及發(fā)帖次數(shù)有顯著的正相關(guān);網(wǎng)頁(yè)瀏覽次數(shù)和平時(shí)小測(cè)成績(jī)對(duì)最終成績(jī)的預(yù)測(cè)力度最高?;谝陨蠑?shù)據(jù)挖掘的結(jié)果,本文對(duì)慕課教學(xué)設(shè)計(jì)提出了建議,比如根據(jù)學(xué)生個(gè)性特點(diǎn)設(shè)置個(gè)性化的考評(píng)措施、重視平時(shí)小測(cè)設(shè)計(jì)、優(yōu)化視頻和講義的設(shè)計(jì)等。
【關(guān)鍵詞】慕課;MOOC;學(xué)習(xí)分析;學(xué)習(xí)活動(dòng);數(shù)據(jù)挖掘
【中圖分類(lèi)號(hào)】G434 【文獻(xiàn)標(biāo)識(shí)碼】A
【論文編號(hào)】1671-7384(2018)02、03-0073-04
隨著Coursera等慕課(MOOC)學(xué)院的興起,學(xué)生通過(guò)在線學(xué)習(xí)可以更自由地支配自己的學(xué)習(xí)時(shí)間,把握學(xué)習(xí)進(jìn)度。在線學(xué)習(xí)活動(dòng)是指學(xué)習(xí)者在某個(gè)學(xué)習(xí)平臺(tái)或者課程管理系統(tǒng)上學(xué)習(xí)時(shí)參與的活動(dòng),包括閱讀課程網(wǎng)頁(yè)、觀看課程視頻、在線做題、討論發(fā)帖或者回帖、提交作業(yè)、同伴互評(píng)等(賈積有,于悅洋, 2017),對(duì)在線學(xué)習(xí)活動(dòng)的分析也成為教育學(xué)領(lǐng)域關(guān)注的重點(diǎn)。
數(shù)據(jù)挖掘是一個(gè)跨學(xué)科的計(jì)算機(jī)分支,是對(duì)大規(guī)模的數(shù)據(jù)進(jìn)行自動(dòng)或半自動(dòng)的分析,以提取過(guò)去未知的有價(jià)值的潛在信息。將數(shù)據(jù)挖掘應(yīng)用到教育學(xué)領(lǐng)域,可以描述、分析和預(yù)測(cè)學(xué)習(xí)者的學(xué)習(xí)行為和學(xué)習(xí)效果,優(yōu)化學(xué)習(xí)環(huán)境(Papamitsiou & Economides, 2014)。賈積有等人(2014)對(duì)Coursera上北大6門(mén)慕課的注冊(cè)學(xué)員的學(xué)習(xí)行為數(shù)據(jù)進(jìn)行了匯總與分析,結(jié)果發(fā)現(xiàn)學(xué)業(yè)成績(jī)與平時(shí)測(cè)驗(yàn)成績(jī)和論壇活躍程度(發(fā)帖、回帖)有較強(qiáng)的相關(guān)關(guān)系,并且根據(jù)分析結(jié)果建議MOOC重視課程網(wǎng)站上網(wǎng)頁(yè)、視頻、測(cè)驗(yàn)和講義的設(shè)計(jì),引導(dǎo)學(xué)生展開(kāi)網(wǎng)上論壇的討論(賈積有,繆靜敏,汪瓊,2014)。為了進(jìn)一步探究MOOC學(xué)習(xí)效果與哪些因素有關(guān),本文使用SPSS對(duì)Cousera中北大某門(mén)MOOC課程進(jìn)行大數(shù)據(jù)分析,探究學(xué)生學(xué)習(xí)行為與學(xué)習(xí)效果的關(guān)系。
本文獲取的MOOC課程的數(shù)據(jù)包括:注冊(cè)人數(shù),學(xué)生開(kāi)始學(xué)習(xí)時(shí)間,課程在線時(shí)間,瀏覽視頻、網(wǎng)頁(yè)和講義的次數(shù),參與論壇討論情況(包括發(fā)帖和回帖次數(shù)、學(xué)員投票),平時(shí)小測(cè)成績(jī)及最終成績(jī)。使用SPSS對(duì)各類(lèi)數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析、相關(guān)和線性回歸分析;使用WEKA對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)分析。
1.描述性統(tǒng)計(jì)分析
對(duì)MOOC課程學(xué)生各項(xiàng)學(xué)習(xí)活動(dòng)的指標(biāo)的描述性統(tǒng)計(jì)分析(如表1)。選修這門(mén)課程的同學(xué)共有13700人,其中最后取得學(xué)業(yè)成績(jī)的有1321人,課程完成率為9.64%,輟學(xué)率為90.36%。在取得學(xué)業(yè)成績(jī)的學(xué)生中,成績(jī)高于(含)60分的有278人,及格率為21.04%。人均開(kāi)始時(shí)間為49.18天,在線時(shí)間為20.19天。
觀看視頻、瀏覽網(wǎng)頁(yè)、觀看并下載課件都是一種重要的學(xué)習(xí)方式,大部分學(xué)生都參與了這三類(lèi)學(xué)習(xí)。除了直接瀏覽課程相關(guān)內(nèi)容,Coursera還設(shè)置了課程討論區(qū),學(xué)生可以通過(guò)發(fā)帖和回帖參與討論,也可以給別人的帖子投票,學(xué)生總體的參與度較低。
2.相關(guān)和回歸分析
分別以全體同學(xué)的在線時(shí)間、平時(shí)小測(cè)成績(jī)?yōu)闄M坐標(biāo),期末成績(jī)?yōu)榭v坐標(biāo)做散點(diǎn)圖(圖1、圖2)。對(duì)全體同學(xué)、在各個(gè)指標(biāo)取得成績(jī)的同學(xué)的最終成績(jī)與各項(xiàng)學(xué)習(xí)活動(dòng)指標(biāo)進(jìn)行相關(guān)分析(表2)。
對(duì)全體同學(xué)來(lái)說(shuō),各個(gè)指標(biāo)與最終成績(jī)均在0.001水平達(dá)到顯著相關(guān),而僅分析取得成績(jī)的同學(xué),在線時(shí)間、小測(cè)成績(jī)、瀏覽網(wǎng)頁(yè)、講義、視頻以及發(fā)帖數(shù)量與期末成績(jī)?cè)?.001水平達(dá)到顯著相關(guān);發(fā)帖得票、回帖數(shù)量和得票、論壇聲譽(yù)與期末成績(jī)沒(méi)有顯著相關(guān)。
以最終成績(jī)?yōu)橐蜃兞?,各個(gè)學(xué)習(xí)指標(biāo)為自變量建立線性回歸方程(表3)。網(wǎng)頁(yè)瀏覽次數(shù)和小測(cè)成績(jī)對(duì)最終成績(jī)的預(yù)測(cè)力度最高,而開(kāi)始時(shí)間、講義瀏覽次數(shù)和發(fā)帖得票數(shù)與最終成績(jī)呈負(fù)相關(guān)。校正后為0.945,表明線性擬合較好。
MOOC平臺(tái)給予學(xué)生更多自主學(xué)習(xí)的自由,但是同傳統(tǒng)課堂教學(xué)相比,網(wǎng)絡(luò)授課對(duì)學(xué)生的強(qiáng)制性降低,增大了輟學(xué)風(fēng)險(xiǎn),這種情況下學(xué)生的自主性對(duì)學(xué)習(xí)成績(jī)影響很大。從學(xué)習(xí)材料來(lái)看,瀏覽網(wǎng)頁(yè)、講義、視頻的人數(shù)依次遞減,這可能因?yàn)橛^看視頻更耗時(shí)間、對(duì)網(wǎng)絡(luò)的要求更高,而通過(guò)文字資料學(xué)習(xí)相對(duì)比較方便。從課程討論區(qū)表現(xiàn)來(lái)看,大部分學(xué)生對(duì)于討論的熱情度并不高,可能因?yàn)镃oursera面向全球的學(xué)生開(kāi)放,各個(gè)國(guó)家的同學(xué)在語(yǔ)言交流上不太方便,也可能是這門(mén)課程難度較低,同學(xué)們沒(méi)有太多需要討論才能解決的問(wèn)題。
相關(guān)分析表明對(duì)取得成績(jī)的同學(xué)進(jìn)行分析可以得到更具區(qū)分度的結(jié)果,而如果籠統(tǒng)地分析所有數(shù)據(jù)可能會(huì)出現(xiàn)天花板效應(yīng),表現(xiàn)為各個(gè)指標(biāo)與期末成績(jī)均有顯著相關(guān)??梢钥吹?,平時(shí)成績(jī)、瀏覽學(xué)習(xí)材料與期末成績(jī)具有很高的相關(guān)性,而論壇參與度與成績(jī)的相關(guān)度不高,根據(jù)這一結(jié)果可以將MOOC課程的學(xué)習(xí)指標(biāo)大致分為兩類(lèi):應(yīng)試類(lèi)指標(biāo)(小測(cè)、瀏覽網(wǎng)頁(yè)、講義、視頻)和興趣類(lèi)指標(biāo)(論壇發(fā)帖、回帖),前者可以顯著預(yù)測(cè)期末成績(jī),后者則與學(xué)生個(gè)性有關(guān),一定程度上可以反映其學(xué)習(xí)方式,比如熱愛(ài)發(fā)帖、回帖的同學(xué)更善于通過(guò)表達(dá)觀點(diǎn)來(lái)鞏固知識(shí),而經(jīng)常參與投票的同學(xué)更善于借鑒別人的優(yōu)勢(shì)以彌補(bǔ)自己,但是這類(lèi)指標(biāo)與最終成績(jī)關(guān)系不大。我們進(jìn)一步使用WEKA進(jìn)行聚類(lèi)分析,將數(shù)據(jù)聚為2類(lèi),seed參數(shù)設(shè)為20,結(jié)果兩類(lèi)分別解釋了46%和54%的數(shù)據(jù)變異,表明這種分類(lèi)方式是合理的。
基于以上研究結(jié)果,我們對(duì)MOOC課程設(shè)計(jì)提出如下建議:
1.根據(jù)學(xué)生個(gè)性特點(diǎn)設(shè)置個(gè)性化的考評(píng)。如對(duì)熱衷于參與論壇討論的同學(xué),可以將論壇活躍度作為10%的期末成績(jī),而對(duì)于討論興致不高的同學(xué),可以將10%的成績(jī)布置為平時(shí)作業(yè)(如文獻(xiàn)閱讀報(bào)告),以達(dá)到因材施教的目的。
2.重視平時(shí)小測(cè)設(shè)計(jì)。小測(cè)對(duì)于學(xué)生的學(xué)習(xí)情況具有至關(guān)重要的反饋?zhàn)饔?,而認(rèn)真作答小測(cè)的同學(xué)也在學(xué)習(xí)中表現(xiàn)得更加勤奮。
3.優(yōu)化視頻和講義的設(shè)計(jì),設(shè)置打卡獎(jiǎng)勵(lì)制度,激勵(lì)同學(xué)們堅(jiān)持學(xué)習(xí),減少輟學(xué)率。
參考文獻(xiàn)
[1]Papamitsiou, Zacharoula, & Economides, Anastasios A. (2014). Learning Analytics and Educational Data Mining in Practice: A Systematic Literature Review of Empirical Evidence. Journal of Educational Technology & Society, 17(4), 49-64.
賈積有,繆靜敏,汪瓊. MOOC學(xué)習(xí)行為及效果的大數(shù)據(jù)分析——以北大6門(mén)MOOC為例[J]. 工業(yè)和信息化教育,2014(9): 23-29.
賈積有,于悅洋. 學(xué)習(xí)活動(dòng)指數(shù)LAI及在線學(xué)習(xí)活動(dòng)指數(shù)OLAI的具體分析[J]. 中國(guó)遠(yuǎn)程教育:綜合版,2017(4): 15-22.
[2]
[3]