孫 笑 微
(沈陽師范大學 科信軟件學院, 沈陽 110034)
基于SPOC平臺日志數據的在線學習行為分析及其影響因素研究
孫 笑 微
(沈陽師范大學 科信軟件學院, 沈陽 110034)
MOOCs區(qū)別于傳統(tǒng)的網絡公開課和遠程教育,是基于課程與教學論以及網絡移動通訊技術發(fā)展起來的新興在線課程模式。很多全球頂尖學府如哈佛大學、加州大學伯克利分校等也在嘗試一種更加精致的課程類型----SPOC,SPOC教學模式保證了MOOCs在大學校園能夠落地生根。利用SPOC的優(yōu)勢通過對學習者在線行為學習分析對網絡課程大數據進行分析和研究,以提高教學質量、完善網絡課程系統(tǒng),既推動了大學的對外品牌效應,也提升了校內的教學質量,重新定義了教師的作用,創(chuàng)新了教學模式,賦予學生完整、深入的學習體驗,提高了課程的完成率。對SPOC網絡課程的在線學習行為分析和研究將大大推動教育測量和學習分析的發(fā)展, 促進教育質量的提升,但面臨的挑戰(zhàn)和困難也不容忽視。
MOOCs;SPOC; 大數據; 學習行為分析
大規(guī)模在線開放課程(MassiveOpenOnlineCourse,MOOC)是基于課程與教學論及網絡和移動智能技術發(fā)展起來的新興在線課程模式。2013年,哈佛大學、加州大學伯克利分校等全球頂尖名校開始跨越MOOC,嘗試一種小而精的課程類型----SPOC。SPOC(SmallPrivateOnlineCourse小規(guī)模限制性在線課程)是由加州大學伯克利分校的阿曼德??怂菇淌谧钤缣岢龊褪褂玫?。Small和Private是相對于MOOC中的Massive和Open而言,Small是指學生規(guī)模一般在幾十人到幾百人,Private是指對學生設置限制性準入條件,達到要求的申請者才能被納入SPOC課程。SPOC平臺中存有大量的日志文件和真實可靠的實時數據,這些都為數據挖掘提供了保障。
本文所研究的基于SPOC的在線學習行為分析和影響因素研究是針對學習者在SPOC網絡課堂環(huán)境中的各個學習環(huán)節(jié),跟蹤采集詳細、精確的學習行為數據,包括登錄時段的分配和登錄時間的長短,以及看視頻的時間長度、課堂測驗的準確率和通過率等,這樣的數據在傳統(tǒng)實體課堂中是難以精確采集的?;赟POC網絡課程數據庫的分析,首先打破了傳統(tǒng)的教育測量模式,即標準化考試。但教師和未來的勞動力市場雇主并不了解學習者在整個學習過程中的表現,例如學習速度、領悟能力、與其他學習者的互動與合作等。SPOC網絡課程所跟蹤的數據則可以讓教師更好地了解學習者的學習行為特征,讓未來的雇主結合學習行為和學習結果更加全面地評估學習者。因此,SPOC平臺可以應用此類教育測量結果為高校的教授和研究機構、業(yè)界的雇主等推薦人才。此外,這種對學習過程的評估極大的促進了學習行為分析和教育數據挖掘的發(fā)展和應用。
學習者在線學習行為分析主要基于SPOC平臺對師生學習過程的記錄數據,針對行為主體(教師、學生)的行為方式(登錄、瀏覽資源、觀看視頻、發(fā)帖、做練習、測試)、行為客體(各類資源、網絡課程模塊)的被使用情況以及行為發(fā)生時間進行統(tǒng)計、可視化和各類挖掘,并結合師生的人口特征數據對影響在線學習行為的因素進行挖掘。目前已有的研究多是圍繞在線學習行為描述影響因素分析及相關監(jiān)控軟件開發(fā)應用來展開。
從已有研究來看,不少研究通過教學平臺網絡日志分析來描述在線學習行為。謝偉奇采用數據挖掘方法對Web服務器日志和后臺數據庫進行挖掘[1],宋江春、陳文林利用Web使用挖掘技術來分析學生的訪問行為、頻度、內容、停留時間等[2]。袁明、陳偉杰以網絡教育學院教學平臺學習記錄為挖掘對象進行分析研究[3]。肖愛平、蔣成鳳指出在線學習的影響因素具體包括網絡環(huán)境、課程資源、網上交互以及學習者自身的原因[4]。在線學習行為分析的實際應用就是建立在線學習行為監(jiān)控系統(tǒng)[5-7]。
基于網絡日志所作的學習行為分析可以從學習時間、學習活動、學習資源、考試成績等多個角度發(fā)現更多的學習行為特點;其影響因素分析還可以更加注重內在因素即學生自身因素的分析。
本文選取沈陽師范大學軟件學院的專業(yè)必修課“數據結構”作為研究對象?!皵祿Y構”是沈陽師范大學軟件學院各專業(yè)本科生大二上學期的一門專業(yè)必修課,該課程配有文字教材和錄像教材等資源,與該課程配套的網絡課程也處在試點應用階段。以2014—2015年度上學期(根據沈陽師范大學校歷,2014—2015第1學期的起止時間是2014年8月25日—2015年1月18日,前后共計21周。課程時間為2014年8月25日—12月28日,共計126天,從2014年的第35周~第52周,共18周)為例,沈陽師范大學軟件學院2013級本科生選修本課程學生和重修生共計434人,以這434名學生為研究樣本,通過獲取這些學生的在線學習行為記錄和基本信息(如年齡、專業(yè))來開展在線學習行為描述與影響因素分析研究。
通過登錄行為后臺日志數據表,可得到學生登錄的基本情況信息,如表1所示。
表1 登錄基本情況
下面分別以登錄時間(時段為統(tǒng)計單位)作為分類字段,以統(tǒng)計各個時段學生的登錄人次;以學生學號為分類字段,以統(tǒng)計各個時段學生的登錄天數。以“某一時間登錄平臺的學生數除以學生總數”作為登錄率。
1) 以登錄時間為分類字段的統(tǒng)計分析
以時段(分為凌晨00∶00—6∶00、上午6∶00—12∶00、下午12∶00—18∶00、晚上18∶00—24∶00這4個時段)為統(tǒng)計項,計算這四個時段的登錄率,得到如表2所示的結果。
表2 學習時段分布
由表2可知,由于學校宿舍每晚進行斷電管理以保障安全和教學質量,所以在凌晨這個斷電時段沒有登錄人數,即登錄率為0。上午的學習人數和登錄率略低,是由于軟件學院在大二的課程設置中設置了較多的其他專業(yè)課,學生課表幾乎都排在上午時段,相對來說使得網絡課程的登錄率略低。學生的學習時段主要是下午和晚上,并且晚上時段的登錄率略高一些,這體現了學生登錄網絡課程平臺大多還是利用了課后的課余時間。
2) 以學生學號為分類字段的統(tǒng)計分析
下面以每個學生個體作為分類字段進行統(tǒng)計,從而發(fā)現個體學習的一些特點。對于每個學習個體來說,保證一定的學習時間才能完成必要的學習任務?!皵祿Y構”作為4學分的課程,其規(guī)定的學時是72學時,如果按照線上考核和線下考核以2∶8的比例進行分配的話,將線上學習和線下學習的學時也按照2∶8的比例進行分配,那么線上學習的學時應該是14.4學時。假設每個學生某天登錄平臺,其學習時間平均為0.5個學時的話,那么一個學生應該至少有30天登錄平臺參加學習,所以首先查詢得到每個學生有登錄記錄的天數,然后計算每類天數對應的學生人數,最后建立累計學生人數與登錄天數的函數,如公式(1)所示。
(1)
其中:S0表示學生總數,為434名;t表示登錄天數,將所有學生的登錄天數按從高到低的順序排列并從1開始編號,ti即第i個登錄天數;S(ti)表示第i個登錄天數對應的學生人數;RS(ti)則表示截至第i個登錄天數,累計學生人數占學生總數的比例。依照此函數和實際數據,繪制得到如圖1所示的曲線。
圖1 登錄天數與登錄率的關系圖
由圖1可知,登陸天數少于54天的學生數不到學生總數的20%,有約75%的學生學習天數在61天以上,只有3%的學生學習天數在43天以下。這說明大部分的學生(75%)能投入必要的學習時間開展在線學習。
3) 影響學生登錄天數的影響因素分析
按照性別分組對學生的登錄天數作差異檢驗,采用獨立樣本t檢驗方法,結果發(fā)現不同性別學生之間的登錄天數存在顯著差異。具體數據如表3所示??梢娕牡卿浱鞌得黠@高于男生。
按照專業(yè)層次(軟件工程、網絡工程、計算機科學與技術、信息管理、重修)分組對學生的登錄天數作差異分析,結果發(fā)現不同專業(yè)層次的學生之間的登錄天數存在顯著差異。具體數據如表4所示??梢姟败浖こ獭薄熬W絡工程”和“計算機科學與技術”三個專業(yè)的學生在“登錄天數”方面不存在顯著差異?!靶畔⒐芾怼睂I(yè)學生的登錄天數是最多的,而“重修”的學生的登錄天數是最少的。
表3 不同性別學生的登錄天數統(tǒng)計
表4 不同專業(yè)層次學生的登錄天數統(tǒng)計
4) 使用決策樹對影響因素進行綜合分析
綜合考察上述3種因素對登錄天數的影響。由于登錄天數為連續(xù)值,為了算法運算的需要轉換為離散值,離散結果如表5所示。
表5 登錄天數連續(xù)變量離散化情況
利用數據挖掘中的分類方法進行教育數據挖掘研究已經成為當前教育決策中的必要手段和有效方法,在前期工作中也進行過類似的研究[8-10]。本文采用數據挖掘分類決策樹算法,構建挖掘結構和挖掘模型,以專業(yè)層次、性別等變量為輸入值,以“登錄天數”為預測值,得到如圖2所示的決策樹。
圖2 用于預測登錄天數的決策樹
由圖2可知,每個方框旁邊的圓餅圖的淺色部分表示“登錄天數”“不少于61天”的學生比例,深色部分表示“登錄天數”“少于61天”的學生比例。據此可以快速了解不同登錄天數的學生特征,并在面對新樣本時,對他們的登錄天數多寡作出預測。其中,傾向于“登錄天數”“不少于61天”的學生有“專業(yè)層次=軟件工程”“專業(yè)層次=網絡工程”“專業(yè)層次=計算機科學與技術”“專業(yè)層次=信息管理”4個群體,傾向于“登錄天數”“少于61天”的學生為“專業(yè)層次=重修”一個群體。其中“專業(yè)層次”和“性別”對登錄天數的影響程度是不一樣的,從決策樹節(jié)點的展開順序來看,“專業(yè)層次”影響最強,其次是“性別”。在“軟件工程”和“網絡工程”2個專業(yè)層次范圍內,不同“性別”的學生之間的“登錄天數”差異很小;在“計算機科學與技術”和“信息管理”2個專業(yè)層次范圍內,不同“性別”的學生之間的“登錄天數”有明顯的差異,其中“計算機科學與技術”專業(yè)層次范圍內,性別為“男”的學生的登錄天數的比例明顯要低于性別為“女”的學生,而在“信息管理”專業(yè)層次范圍內,性別為“男”的學生的登錄天數比例明顯要高于性別為“女”的學生。
本文選擇“數據結構”網絡課程為分析對象,以2014—2015第1學期434名學生學習該課程時所產生的登錄數據、資源瀏覽數據和形成性測驗數據為分析對象,發(fā)現了基于SPOC平臺的在線學習行為的一些基本特點及影響因素。
從群體角度看,在線學習行為在時間上的分布主要集中在下午時段和晚上時段。從個體角度看,影響學生在線學習時間投入情況的內在因素有性別和專業(yè)層次等,其中女生比男生投入的學習時間多,信息管理的學生投入時間比其他專業(yè)投入的學習時間多,重修學生投入的時間最短。如何提升學習行為分析對考核方式的導向性和有效度是未來發(fā)展SPOC在線學習的一個重要命題,同時如何采用更有效的數據挖掘方法進行教育數據挖掘也是今后研究中非常重要的一個課題[11-15]。
[ 1 ]謝維奇. 基于“電大在線”遠程教學平臺的Web數據挖掘[J]. 教育信息化, 2004(10):56-62.
[ 2 ]宋江春,陳文林.Web使用挖掘及其在遠程教育教學支持服務中的應用研究[J]. 中國遠程教育, 2005(7):62-64.
[ 3 ]袁明,陳偉杰. 網絡教育學習者在線學習行為分析研究[J]. 浙江現代教育技術, 2006,18(4):6-9.
[ 4 ]肖愛平,蔣成鳳. 網絡學習者網上學習現狀、影響因素及對策研究[J]. 開放教育研究, 2009,15(1):75-80.
[ 5 ]邵艷麗,孫麗娜. 基于電子學檔的在線學習行為監(jiān)控[J]. 中國遠程教育, 2008(5):38-40.
[ 6 ]楊金來,張翼翔,丁榮濤. 基于網絡學習平臺的學習行為監(jiān)控研究[J]. 計算機教育, 2008(11):65-68.
[ 7 ]毛利杰,曹效英. 基于網絡教學平臺的學習監(jiān)控功能研究與設計[J]. 軟件導刊(教育技術), 2009(9):79-81.
[ 8 ]孫笑微. 貝葉斯分類技術在高校教師教學質量評價中的應用[J]. 沈陽師范大學學報(自然科學版), 2014,32(1):98-102.
[ 9 ]孫笑微. 數據分類技術在高校人才識別系統(tǒng)中的應用[J]. 沈陽師范大學學報(自然科學版), 2008,26(2):133-136.
[10]陳坤寶. 基于模糊理論的教師教學質量評價的研究[J]. 數學的實踐與認識, 2011,41(6):72-78.
[11]李曉毅,徐兆棣,孫笑微. 貝葉斯網絡的參數學習研究[J]. 沈陽農業(yè)大學學報, 2007,38(1):125-128.
[12]SUNXiaowei.AugmentedBANclassifier[C]∥InternationalConferenceonComputationalIntelligenceandSoftwareEngineering, 2009:2113-2117.
[13]孫笑微,趙大宇,李曉毅,等. 用于數據挖掘的TAN分類器的研究與應用[J]. 計算機技術與發(fā)展, 2006,16(11):140-142.
[14]孫笑微,李曉毅. 基于Boosting的BAN組合分類器[J]. 數學的實踐與認識, 2009,39(3):120-125.
[15]RAMONIM,SEBASTIAMIP.Robustbayesclassifiers[J].ArtificialIntelligence, 2001,125(1/2):209-226.
OnlinelearningbehavioranalysisbasedonSPOCplatformlogdataandinfluencingfactors
SUN Xiaowei
(SoftwareCollege,ShenyangNormalUniversity,Shenyang110034,China)
MOOCs,differentfromthetraditionalopenanddistanceeducation,isbasedoncurriculumandteachingtheoryaswellasthedevelopmentofnetworkmobilecommunicationtechnology.Manytopuniversities,suchasHarvardandUCBerkeley,aretryingoutSPOC(SmallPrivateOnlineCourse),amorerefinedcoursethatmixesMOOCswithcampusteaching.Inthispaper,advantageofSPOCforlearner’sonlinelearningbehaviorisanalyzedaswellastheresearchtothenetworkcurriculumbigdata,inordertoimprovethequalityofteachingandthenetworkcurriculumsystem,toimprovethequalityofcampus.SPOCchangestheroleofteachers,andleadstomoreeffectivelearningoutcomes.Finally,itenableslearnerstoexperienceentireanddeeperlearning,raisingthecompletionrate.Asaconclusion,theonlinelearningbehavioranalysisbasedonSPOCwillsignificantlyimprovethedevelopmentofeducationassessmentandlearninganalytics,aswellaseducationquality.Meanwhile,however,thechallengeanddifficultiescannotbeignored.
MOOCs;SPOC;bigdata;learningbehavioranalysis
2016-08-04。
遼寧省教育科學“十三五”規(guī)劃課題(JG16DB408)。
孫笑微(1980-),女,遼寧本溪人,沈陽師范大學副教授,碩士。
1673-5862(2017)01-0103-05
G
A
10.3969/j.issn.1673-5862.2017.01.020