張 曄
(南京科技職業(yè)學(xué)院 江蘇南京 210044)
隨著教育改革的不斷深入和教育信息化的持續(xù)推進(jìn),在線學(xué)習(xí)能夠幫助學(xué)習(xí)者實(shí)現(xiàn)溝通交流和資源共享,它已經(jīng)成為變革“教”與“學(xué)”模式的重要實(shí)踐形態(tài)。 然而,因在線學(xué)習(xí)資源泛濫、師生互動(dòng)缺乏和導(dǎo)航設(shè)計(jì)不良等問(wèn)題,學(xué)習(xí)者很容易陷入學(xué)習(xí)迷航。 如何診斷和干預(yù)學(xué)習(xí)迷航成為亟待解決的問(wèn)題,隨著大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用,融合數(shù)據(jù)生成的迷航狀態(tài)分析方法為解決在線學(xué)習(xí)迷航提供了新思路。
1)在線學(xué)習(xí)
在線學(xué)習(xí)(Online Learning)是由電子通信技術(shù)、網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)等核心互聯(lián)技術(shù)衍生出來(lái)的一種重要遠(yuǎn)程實(shí)踐形式[1]。 在線學(xué)習(xí)的開放性、靈活性、互動(dòng)性、均等性、協(xié)作性、個(gè)性化、自主性等特點(diǎn),使我們?cè)诔浞譂M足不同學(xué)習(xí)者個(gè)性化需求的同時(shí),不再受時(shí)空、管理、資源等方面對(duì)傳統(tǒng)課堂教學(xué)的限制,有效地提高了學(xué)習(xí)效果。
2)數(shù)據(jù)驅(qū)動(dòng)
數(shù)據(jù)驅(qū)動(dòng)的概念隨著大數(shù)據(jù)的興起受到廣泛關(guān)注和頻繁使用,被解釋為通過(guò)移動(dòng)互聯(lián)網(wǎng)或者其他平臺(tái)軟件采集海量的數(shù)據(jù),然后將數(shù)據(jù)轉(zhuǎn)化為信息,再經(jīng)過(guò)一系列過(guò)程,將相關(guān)信息進(jìn)行整合、提煉、自動(dòng)擬合為一個(gè)有效的決策模型。 有效的數(shù)據(jù)驅(qū)動(dòng)機(jī)制能夠?qū)崿F(xiàn)在線學(xué)習(xí)中隱性知識(shí)顯性化,顯性知識(shí)結(jié)構(gòu)化,可以為教育診斷與決策提供相應(yīng)指導(dǎo)。
3)學(xué)習(xí)迷航
學(xué)習(xí)者在學(xué)習(xí)過(guò)程中陷入的一種類似船舶、飛機(jī)迷失航向的負(fù)面學(xué)習(xí)狀態(tài)。 處于學(xué)習(xí)迷航的學(xué)習(xí)者無(wú)法辨識(shí)自身遇到的學(xué)習(xí)問(wèn)題,無(wú)法選取學(xué)習(xí)資源完成學(xué)習(xí)任務(wù),而是處于一種漫游、困惑、挫折狀態(tài),不能及時(shí)解決問(wèn)題,學(xué)習(xí)成績(jī)和效率都會(huì)受到影響。
在線學(xué)習(xí)過(guò)程中,由于師生間的“空間分離”和網(wǎng)絡(luò)學(xué)習(xí)環(huán)境的復(fù)雜性,容易存在教師情感激勵(lì)與學(xué)習(xí)指導(dǎo)不足[2]、同伴交流互動(dòng)匱乏和網(wǎng)絡(luò)資源泛濫且質(zhì)量不均衡等問(wèn)題[3],既提高了學(xué)習(xí)者發(fā)生學(xué)習(xí)迷航的概率也容易阻礙他們的學(xué)習(xí)進(jìn)展。
2011 年,學(xué)習(xí)分析與知識(shí)國(guó)際會(huì)議(The Inter?national Conference on Learning Analytics and Knowl?edge, LAK)定義學(xué)習(xí)分析為“對(duì)學(xué)習(xí)者及其學(xué)習(xí)情境的數(shù)據(jù)進(jìn)行測(cè)量、收集、分析和報(bào)告,進(jìn)而了解和優(yōu)化學(xué)習(xí)和學(xué)習(xí)發(fā)生的情境的一種應(yīng)用”[5]。
Brown[6]和Siemens[7]教授都是學(xué)習(xí)分析領(lǐng)域的專家,他們依據(jù)學(xué)習(xí)分析內(nèi)涵提出了線性學(xué)習(xí)過(guò)程分析模型,如圖1 所示。 基于模型明確的基本要素,重塑學(xué)習(xí)分析結(jié)構(gòu)和線性實(shí)施流程。 交互網(wǎng)狀學(xué)習(xí)分析模型、多因素學(xué)習(xí)分析模型、反饋環(huán)狀學(xué)習(xí)分析模型等幾類代表性模型在后續(xù)學(xué)習(xí)分析領(lǐng)域的研究過(guò)程中逐步形成。
反饋環(huán)狀學(xué)習(xí)分析模型的代表人物有加拿大阿塞巴斯卡大學(xué)的Elias 等,該模型提出了持續(xù)改進(jìn)環(huán)模型,如圖2 所示,其基礎(chǔ)是學(xué)習(xí)分析和數(shù)據(jù)分析五步法、知識(shí)管理框架等。 機(jī)構(gòu)、人力、計(jì)算機(jī)和理論等技術(shù)資源價(jià)值都是該模型所著重強(qiáng)調(diào)的,并通過(guò)選擇、收集、聚合、預(yù)測(cè)、優(yōu)化、使用、分享等循環(huán)實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)處理和結(jié)果應(yīng)用的過(guò)程。技術(shù)資源推動(dòng)“教”與“學(xué)”效果的不斷提高,使三個(gè)循環(huán)階段處于持續(xù)發(fā)展中,體現(xiàn)了學(xué)習(xí)分析過(guò)程的動(dòng)態(tài)循環(huán)特性。
圖2 Elias 的持續(xù)改進(jìn)環(huán)模型
在線學(xué)習(xí)的核心是學(xué)習(xí)者個(gè)人訴求,借助互聯(lián)網(wǎng)絡(luò)技術(shù)為學(xué)習(xí)過(guò)程提供方便快捷的支持服務(wù)[8]。 離開教師管控下的學(xué)習(xí)過(guò)程容易受不同多維因素的影響,比如個(gè)體、環(huán)境等都會(huì)導(dǎo)致學(xué)習(xí)者陷入在線學(xué)習(xí)迷航狀態(tài)。
在線學(xué)習(xí)迷航診斷過(guò)程是基于數(shù)據(jù)分析方法,依據(jù)迷航診斷指標(biāo),嘗試?yán)脤W(xué)習(xí)平臺(tái)充分提取在線學(xué)習(xí)者的相關(guān)行為數(shù)據(jù)和特征,對(duì)大量繁雜冗余的原始數(shù)據(jù)進(jìn)行清洗整理,并借助機(jī)器學(xué)習(xí)中的XGBoost 分類算法分析得出學(xué)習(xí)者行為特征去支撐在線學(xué)習(xí)迷航診斷,構(gòu)建迷航狀態(tài)檢測(cè)器,為幫助學(xué)習(xí)者擺脫學(xué)習(xí)迷航奠定數(shù)據(jù)基礎(chǔ),精準(zhǔn)識(shí)別迷航狀態(tài),提供個(gè)性化服務(wù)。
結(jié)合Siemens 的學(xué)習(xí)分析過(guò)程模型和Elias 的持續(xù)改進(jìn)環(huán)模型,嘗試構(gòu)建數(shù)據(jù)驅(qū)動(dòng)下的在線學(xué)習(xí)迷航診斷模型。
1)XGBoost 算法
研究借助機(jī)器學(xué)習(xí)XGBoost 算法實(shí)現(xiàn)精準(zhǔn)識(shí)別迷航狀態(tài),構(gòu)建迷航狀態(tài)檢測(cè)器,學(xué)習(xí)迷航狀態(tài)檢測(cè)器的核心功能基于XGBoost 算法的狀態(tài)分類能力[9],從而在學(xué)習(xí)狀態(tài)中將迷航狀態(tài)識(shí)別出來(lái)。
XGBoost 算法是保留了GBDT 中的一些優(yōu)點(diǎn),又在GBDT 算法基礎(chǔ)上改進(jìn)而來(lái)的,如:集成了多個(gè)弱分類器,使用了健壯的損失函數(shù),異常值具有非常強(qiáng)的魯棒性(穩(wěn)定性)等;XGBoost 算法與GB?DT 相比,由于GBDT 只涉及損失函數(shù)優(yōu)化時(shí)的一階導(dǎo)數(shù),而XGBoost 可以針對(duì)損失函數(shù)展開二階泰勒公式,因此損失函數(shù)更加精確和精確;同時(shí),在避免模型過(guò)擬合的同時(shí),對(duì)損失函數(shù)和模型復(fù)雜度進(jìn)行權(quán)衡,XGBoost 算法還增加了正則項(xiàng)控制模型的復(fù)雜度。
2)XGBoost 算法在線學(xué)習(xí)迷航診斷流程
XGBoost 算法的實(shí)質(zhì)模型是將多個(gè)弱分類器集合在一起。 對(duì)在線學(xué)習(xí)迷航狀態(tài)診斷的模型為:
診斷模型中的x是第i條的學(xué)習(xí)行為與特征,用來(lái)預(yù)測(cè)第xi處學(xué)習(xí)狀態(tài)的結(jié)果,K 表示集成弱學(xué)習(xí)器的總數(shù),意思是由K 棵樹集成的模型;fk是第k棵樹。 因此,基于XGBoost 的在線學(xué)習(xí)迷航診斷模型中的損失是:
損失也是預(yù)測(cè)模型的誤差,ζ 是真實(shí)值與度量的預(yù)測(cè)值之間的差距,其中yi是在線學(xué)習(xí)者的實(shí)際真實(shí)學(xué)習(xí)狀態(tài),則是通過(guò)診斷模型預(yù)測(cè)預(yù)估的學(xué)習(xí)狀態(tài),L(yi,)則用來(lái)記錄在xi處出現(xiàn)的錯(cuò)誤估計(jì)學(xué)習(xí)狀態(tài)的情形情況。 Ω(fk)表示樹的復(fù)雜度,它是正則項(xiàng),用來(lái)懲罰模型復(fù)雜程度。 懲罰項(xiàng)對(duì)損失函數(shù)起到了補(bǔ)充調(diào)節(jié)和約束的作用,因此將也就是K 棵樹的復(fù)雜度的和添加至目標(biāo)函數(shù)中,就可以避免模型的過(guò)度擬合。
研究收集了在線開放課程平臺(tái)中《市場(chǎng)調(diào)查與分析》課程的服務(wù)器日志記錄,其中包含了192名在線學(xué)習(xí)者的基本信息、文本學(xué)習(xí)、視頻學(xué)習(xí)以及在其他相關(guān)的學(xué)習(xí)行為數(shù)據(jù)和列表,總計(jì)3770條原始數(shù)據(jù)。 每次在線學(xué)習(xí)完成后,都要求學(xué)習(xí)者進(jìn)行在線填寫內(nèi)容、提交在線調(diào)查問(wèn)卷,在線學(xué)習(xí)者的學(xué)習(xí)行為數(shù)據(jù)如表1 所示,形成匯總為各項(xiàng)在線學(xué)習(xí)行為特征的指標(biāo)。
表1 在線學(xué)習(xí)行為數(shù)據(jù)源
基于韋伯分析量表,設(shè)計(jì)了在線學(xué)習(xí)狀態(tài)的調(diào)查問(wèn)卷以獲取學(xué)習(xí)者每次學(xué)習(xí)行為所對(duì)應(yīng)的學(xué)習(xí)狀態(tài)和學(xué)習(xí)結(jié)果,劃分了正常狀態(tài)、信息迷航和思維迷航三個(gè)維度,每個(gè)維度上分別設(shè)計(jì)了5 道題,共15 題。 基于Likert 的五點(diǎn)量表設(shè)計(jì)問(wèn)卷選項(xiàng),1至5 分別表示“完全不認(rèn)同”,“不認(rèn)同”,“不確定”,“認(rèn)同”,“完全認(rèn)同”。 為了驗(yàn)證問(wèn)卷的可靠性和有效性,利用SPSS 軟件進(jìn)行問(wèn)卷信效度分析,Cronbach’s α 系數(shù)系數(shù)為0.803, Cronbach’sα系數(shù)在各個(gè)維度分別為0.776、0.770 和0.831;調(diào)查問(wèn)卷的KMO 值為0.866,Bartlett 球形檢驗(yàn)Sig 值為0.000,數(shù)據(jù)顯示該問(wèn)卷具有較好的信度和效度。
將3770 條學(xué)習(xí)記錄進(jìn)行整理匯總,作為在線學(xué)習(xí)者的學(xué)習(xí)狀態(tài)數(shù)據(jù)集,數(shù)據(jù)集在經(jīng)過(guò)處理后作為在線學(xué)習(xí)迷航狀態(tài)檢測(cè)器的數(shù)據(jù)支撐。
實(shí)驗(yàn)抽取了市場(chǎng)營(yíng)銷專業(yè)大一學(xué)生72 名在線學(xué)習(xí)者作為研究對(duì)象。 在開展實(shí)驗(yàn)調(diào)查前,大部分學(xué)習(xí)者已經(jīng)掌握了《市場(chǎng)調(diào)查與分析》中的一部分課程知識(shí),也能夠試著回答簡(jiǎn)單問(wèn)題。 根據(jù)實(shí)驗(yàn)調(diào)查的科學(xué)性原則,根據(jù)調(diào)查對(duì)象知識(shí)水平前測(cè)結(jié)果,平均地將72 名在線學(xué)習(xí)者分為實(shí)驗(yàn)組和對(duì)照組,分別稱為A 組36 人和B 組36 人,用來(lái)保證實(shí)驗(yàn)組和對(duì)照組中的學(xué)習(xí)者他們初始知識(shí)水平和能力盡量保持大體一致。
接下來(lái),通過(guò)對(duì)兩組成員學(xué)習(xí)迷航程度的前測(cè)試結(jié)果進(jìn)行獨(dú)立樣本T 檢驗(yàn)來(lái)完成測(cè)試,實(shí)驗(yàn)組和對(duì)照組學(xué)習(xí)者的初始在線學(xué)習(xí)迷航程度是否一致也有待進(jìn)一步驗(yàn)證,結(jié)果見(jiàn)表2。
表2 實(shí)驗(yàn)組和對(duì)照組學(xué)習(xí)者迷航程度前測(cè)結(jié)果獨(dú)立樣本t 檢驗(yàn)
t 檢驗(yàn)結(jié)果顯示,萊文方差等同性檢驗(yàn)p =0.167>0.05 實(shí)驗(yàn)組和對(duì)照組的方差并無(wú)顯著差異,Sig.值(雙側(cè)) p =0.576>0.05)學(xué)習(xí)者在線學(xué)習(xí)的迷航程度也無(wú)明顯差異。
因此得出根據(jù)知識(shí)水平進(jìn)行平均分組之后,實(shí)驗(yàn)組與對(duì)照組兩組學(xué)習(xí)者在線學(xué)習(xí)的迷航程度也趨于一致,是可以繼續(xù)開展后續(xù)迷航程度的相關(guān)調(diào)查的。
緩解學(xué)習(xí)者在線學(xué)習(xí)的迷航程度和提升學(xué)習(xí)者的學(xué)習(xí)效率效果是本次應(yīng)用迷航診斷模型的實(shí)驗(yàn)主要目的。 在互聯(lián)網(wǎng)學(xué)習(xí)迷航診斷系統(tǒng)的技術(shù)支持下,開展實(shí)驗(yàn),實(shí)驗(yàn)過(guò)程如圖4 所示。
圖4 實(shí)驗(yàn)過(guò)程
實(shí)驗(yàn)共開展8 周,分為一、二兩個(gè)階段。 在階段一,實(shí)驗(yàn)組和對(duì)照組的學(xué)習(xí)者都在網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)進(jìn)行3 周學(xué)習(xí),以此來(lái)驗(yàn)證在未使用學(xué)習(xí)迷航診斷系統(tǒng)的情境下,對(duì)照組與實(shí)驗(yàn)組他們的知識(shí)水平和迷航程度是否還能保持一致;在階段二,我們將開展5 周學(xué)習(xí),實(shí)驗(yàn)組A 組學(xué)習(xí)者將使用帶有學(xué)習(xí)迷航診斷系統(tǒng)的平臺(tái),對(duì)照組B 組學(xué)習(xí)者仍然使用之前的在線學(xué)習(xí)平臺(tái),主要是用來(lái)驗(yàn)證使用了學(xué)習(xí)迷航診斷系統(tǒng)的平臺(tái)是否能夠減輕在線學(xué)習(xí)迷航程度和提升學(xué)習(xí)者學(xué)習(xí)效率與成績(jī)。 需要注意的是,8 周的實(shí)驗(yàn),要進(jìn)行三次知識(shí)水平測(cè)試來(lái)觀察學(xué)習(xí)者們知識(shí)水平的變化,其次,每周還應(yīng)測(cè)量在線學(xué)習(xí)迷航程度,分析實(shí)驗(yàn)組和對(duì)照組在線學(xué)習(xí)迷航程度的變化。
兩組學(xué)習(xí)者在線學(xué)習(xí)時(shí)的學(xué)習(xí)狀態(tài)分布情況以及學(xué)習(xí)狀態(tài)分布的變化情況都是通過(guò)XGBoost 算法進(jìn)行診斷,分析在線學(xué)習(xí)過(guò)程中產(chǎn)生的行為數(shù)據(jù)。
圖5 所示,在第一階段(1-3 周) 實(shí)驗(yàn)組中的各維度人數(shù)占比沒(méi)有明顯變化,表示一般的在線平臺(tái)學(xué)習(xí)不會(huì)影響學(xué)習(xí)者迷航狀態(tài);在第二階段(4-8 周),當(dāng)實(shí)驗(yàn)組開始利用帶有迷航系統(tǒng)的在線學(xué)習(xí)平臺(tái)后,正常狀態(tài)學(xué)習(xí)者的比例有了明顯增加,信息迷航和思維迷航的人數(shù)比例顯著減少。
圖5 實(shí)驗(yàn)組學(xué)習(xí)者學(xué)習(xí)狀態(tài)分布情況圖
通過(guò)圖6 可以看出,在實(shí)驗(yàn)的第二階段開始后,在線學(xué)習(xí)迷航診斷系統(tǒng)發(fā)揮了一定的干預(yù)作用,實(shí)驗(yàn)組學(xué)習(xí)狀態(tài)分布變化顯著。
圖6 實(shí)驗(yàn)組學(xué)習(xí)者學(xué)習(xí)狀態(tài)分布情況圖
在實(shí)驗(yàn)過(guò)程中,每周還應(yīng)測(cè)量在線學(xué)習(xí)迷航程度,測(cè)量結(jié)果生成兩組學(xué)習(xí)者迷航程度的變化折線圖,可以直接觀察迷航程度的變化情況,如圖7 所示。
圖7 迷航程度變化情況
由圖7-(a)可知,實(shí)驗(yàn)組與對(duì)比組在1-3 周的學(xué)習(xí)迷航程度總體上并無(wú)明顯差異,但實(shí)驗(yàn)組在4-8 周的實(shí)驗(yàn)開始后,學(xué)習(xí)者進(jìn)入帶有在線學(xué)習(xí)迷航診斷系統(tǒng)的平臺(tái)學(xué)習(xí),迷航程度明顯低于對(duì)照組,且效果相對(duì)顯著。 圖7-(b)和圖7-(c)的結(jié)果顯示,實(shí)驗(yàn)組的信息迷航和思維迷航的程度都有較大緩解,對(duì)照組則幾乎沒(méi)有變化。
1)實(shí)驗(yàn)組和對(duì)照組中測(cè)成績(jī)分析
成績(jī)反映對(duì)知識(shí)的掌握情況,研究分別在實(shí)驗(yàn)前、第一階段結(jié)束時(shí)、第二階段結(jié)束時(shí)進(jìn)行,對(duì)學(xué)習(xí)者進(jìn)行了前測(cè)、中測(cè)和后測(cè)。 兩組學(xué)習(xí)者的知識(shí)水平在前測(cè)時(shí)并沒(méi)有太大差異,因此僅對(duì)中測(cè)和后測(cè)成績(jī)展開分析。
對(duì)中測(cè)成績(jī)做獨(dú)立樣本t 檢驗(yàn),判斷兩組的知識(shí)水平是否在未用系統(tǒng)前保持一致,表3 結(jié)果顯示兩組的中測(cè)結(jié)果(p =0.671>0.05)無(wú)明顯差異。
表3 實(shí)驗(yàn)組和對(duì)照組的中測(cè)成績(jī)獨(dú)立樣本t 檢驗(yàn)
2)實(shí)驗(yàn)組和對(duì)照組后測(cè)成績(jī)分析
采用協(xié)方差對(duì)兩組學(xué)生后測(cè)成績(jī)進(jìn)行分析,協(xié)變量設(shè)為中測(cè)成績(jī),因變量設(shè)為后測(cè)成績(jī),組別為固定因子,經(jīng)過(guò)調(diào)整,表4 結(jié)果說(shuō)明實(shí)驗(yàn)組和對(duì)照組的成績(jī)均值相差6.66,成績(jī)存在明顯差異(p =0.016<0.05),數(shù)據(jù)表明實(shí)驗(yàn)組的學(xué)習(xí)者在使用在線學(xué)習(xí)迷航診斷系統(tǒng)后,學(xué)習(xí)成績(jī)比對(duì)照組學(xué)習(xí)者有著明顯提高。
表4 實(shí)驗(yàn)組和對(duì)照組的后測(cè)成績(jī)差異
以在線學(xué)習(xí)迷航模型的有效落地作為研究目的,設(shè)計(jì)迷航診斷系統(tǒng),通過(guò)應(yīng)用效果分析,說(shuō)明在線學(xué)習(xí)迷航診斷系統(tǒng)確實(shí)能夠有效降低學(xué)習(xí)者的迷航程度,提升學(xué)習(xí)者的學(xué)習(xí)效率、成績(jī)和效用,表明在線學(xué)習(xí)迷航模型在實(shí)際應(yīng)用中的可行性和有效性。