秦爭(zhēng)艷
(長(zhǎng)江職業(yè)學(xué)院 湖北 武漢 430074)
隨著信息化的迅猛發(fā)展,各高校的數(shù)字化網(wǎng)絡(luò)教學(xué)系統(tǒng)的應(yīng)用越來越普遍和豐富,通過數(shù)字化網(wǎng)絡(luò)教學(xué)系統(tǒng),教師可以在線收發(fā)作業(yè)、共享教學(xué)資源、測(cè)試考評(píng)、互動(dòng)答疑等,學(xué)生可以登錄系統(tǒng)進(jìn)行簽到、自主預(yù)習(xí)復(fù)習(xí)、觀看教學(xué)短片和操作視頻、下載學(xué)習(xí)資料、完成作業(yè)練習(xí)和考試、提問交流互動(dòng)等行為。這樣,數(shù)字化網(wǎng)絡(luò)教學(xué)系統(tǒng)中就積累了大量師生教育和學(xué)習(xí)的珍貴數(shù)據(jù),如何讓這些數(shù)據(jù)能“說話”,發(fā)揮數(shù)據(jù)的作用和價(jià)值,并為學(xué)生提供輔助認(rèn)知自身的知識(shí)體系,為學(xué)習(xí)方向提供指導(dǎo),同時(shí)為教師提供教學(xué)設(shè)計(jì)的學(xué)情分析基礎(chǔ),指導(dǎo)優(yōu)化教學(xué)設(shè)計(jì)與教學(xué)過程,提高教學(xué)效果。本研究基于數(shù)據(jù)可視化技術(shù),通過學(xué)生在教學(xué)系統(tǒng)中的行為數(shù)據(jù)分析學(xué)生的學(xué)習(xí)表現(xiàn)對(duì)學(xué)生建立數(shù)據(jù)標(biāo)簽,構(gòu)建學(xué)生畫像,從而選擇恰當(dāng)?shù)目梢暬瘓D表進(jìn)行形象展示,并為將來的學(xué)習(xí)提供預(yù)測(cè)和推薦。
本研究旨在通過對(duì)教學(xué)系統(tǒng)中教學(xué)數(shù)據(jù)的分析,以學(xué)生為主體,建立學(xué)生數(shù)據(jù)標(biāo)簽,構(gòu)建學(xué)生畫像,并根據(jù)不同時(shí)間段學(xué)習(xí)數(shù)據(jù)的變化,動(dòng)態(tài)增量迭加地更新、調(diào)整、修正學(xué)生畫像,同時(shí)基于生動(dòng)飽滿的可視化圖形呈現(xiàn)給學(xué)生和教師,來為學(xué)生學(xué)習(xí)和教師教學(xué)提供輔助,最終提高學(xué)習(xí)和教學(xué)質(zhì)量、提高教學(xué)系統(tǒng)功能價(jià)值。
獲取教學(xué)系統(tǒng)中學(xué)生行為數(shù)據(jù)是構(gòu)建學(xué)生畫像的基礎(chǔ),在整體研究設(shè)計(jì)中,數(shù)據(jù)的抽取與處理以ETL技術(shù)為基礎(chǔ),數(shù)據(jù)的抽取采取動(dòng)態(tài)增量迭加的方式進(jìn)行,制定抽取規(guī)劃,以周數(shù)據(jù)(經(jīng)調(diào)研一般一周可完成一個(gè)章節(jié)的教學(xué))、月數(shù)據(jù)、季度數(shù)據(jù)、學(xué)期數(shù)據(jù)(課程學(xué)期學(xué)習(xí)情況的最終情況),以這樣的迭代數(shù)據(jù)來構(gòu)建動(dòng)態(tài)發(fā)展的學(xué)生畫像,不斷更新與修正學(xué)習(xí)指導(dǎo)建議。
學(xué)生大量行為數(shù)據(jù)獲取后,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,在教學(xué)系統(tǒng)中主要需進(jìn)行處理的有缺失值、冗余值、錯(cuò)誤值等,缺失值中根據(jù)不同的字段含義與類型將采取不同的處理方式,主要表現(xiàn)舉例:(1)有些學(xué)生在某個(gè)測(cè)試中,放棄某些題目的作答留了空白,那么數(shù)據(jù)獲取后以null值顯示,這時(shí)為便于之后構(gòu)建學(xué)生畫像,故可將其置為0。(2)有些學(xué)生在教學(xué)系統(tǒng)中并未進(jìn)行某項(xiàng)模塊或內(nèi)容的學(xué)習(xí),那么數(shù)據(jù)獲取后同樣以null值顯示,但此時(shí)為精細(xì)地描述學(xué)生學(xué)習(xí)情況特征,故將保留null值;冗余值主要表現(xiàn)舉例:如某些測(cè)試項(xiàng)設(shè)置為可重復(fù)測(cè)試,那么在增量獲取數(shù)據(jù)時(shí)可能會(huì)獲取到重復(fù)字段的不同取值,在每個(gè)時(shí)刻的數(shù)據(jù)中,以最后一次的數(shù)據(jù)作為有效數(shù)據(jù)予以保留,刪除其他冗余字段數(shù)據(jù)。
學(xué)生在教學(xué)系統(tǒng)數(shù)據(jù)中的數(shù)據(jù)可分為兩大類:一是學(xué)生基本信息數(shù)據(jù),一是學(xué)生行為數(shù)據(jù)。其中學(xué)生行為數(shù)據(jù)即為我們研究的主要方面,可分為量化型數(shù)據(jù)、能力型數(shù)據(jù)、興趣型數(shù)據(jù)。不同的字段數(shù)據(jù)需要針對(duì)性地進(jìn)行處理,有時(shí)為觀察方便,需要采用歸一化將各項(xiàng)數(shù)據(jù)值轉(zhuǎn)換為同一量綱上[1],再對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步探索分析,見表1所示。
表1 學(xué)生行為數(shù)據(jù)分析表
根據(jù)學(xué)生數(shù)據(jù)類型分析,在抽取的學(xué)生數(shù)據(jù)中使用分詞、詞頻統(tǒng)計(jì)、TF-IDF[2]等方法,構(gòu)建有針對(duì)性特征的學(xué)生數(shù)據(jù)標(biāo)簽。
(1)基本屬性類標(biāo)簽:性別、專業(yè)、年級(jí)、班級(jí)等。
(2)學(xué)習(xí)參與度類標(biāo)簽:根據(jù)學(xué)生登錄次數(shù)、在線學(xué)習(xí)時(shí)長(zhǎng)、在線測(cè)試次數(shù)、作業(yè)完成次數(shù)、討論區(qū)活躍度等數(shù)據(jù),進(jìn)行歸一化與加權(quán)求和[3],并針對(duì)結(jié)果進(jìn)行聚類分析,形成數(shù)據(jù)標(biāo)簽,即“積極參與學(xué)習(xí)”“普通參與者”“不積極參與學(xué)習(xí)”。
(3)知識(shí)分布類標(biāo)簽:在作業(yè)、測(cè)試、考試等題目中需要提前做好題目所屬知識(shí)點(diǎn)的歸類劃分,從而在針對(duì)單個(gè)學(xué)生個(gè)體時(shí),根據(jù)學(xué)生在不同知識(shí)點(diǎn)的得分情況,進(jìn)行統(tǒng)計(jì)求和并歸一化使量綱保持一致性,將各個(gè)知識(shí)點(diǎn)的得分歸在[0-1]的范圍內(nèi),并分為三個(gè)層級(jí),“強(qiáng)項(xiàng)”“掌握”“弱項(xiàng)”,從而構(gòu)建學(xué)生個(gè)性化知識(shí)體系。更重要的是此部分標(biāo)簽,按照數(shù)據(jù)抽取時(shí)間,按規(guī)劃以周(章節(jié))、月、季度、學(xué)期動(dòng)態(tài)迭加進(jìn)行構(gòu)建,并及時(shí)增量更新學(xué)生知識(shí)分布標(biāo)簽,使標(biāo)簽對(duì)學(xué)生學(xué)習(xí)情況的描述更加飽滿。同時(shí),題型得分分布情況與知識(shí)分布類似且更加簡(jiǎn)單,通過統(tǒng)計(jì)題型得分,可以掌握學(xué)生在主觀題目和客觀題目上的不同表現(xiàn),以及實(shí)際操作應(yīng)用能力與應(yīng)變能力。
(4)群體性標(biāo)簽:上述的基本屬性類標(biāo)簽也可以用作群體性標(biāo)簽的分類,且較易進(jìn)行分類標(biāo)注,如專業(yè)標(biāo)簽、班級(jí)標(biāo)簽、性別標(biāo)簽等。核心的群體性標(biāo)簽主要面向的受眾是教師,向教師展示分類后的群體特征以有針對(duì)性地根據(jù)不同群體學(xué)生開展學(xué)習(xí)指導(dǎo)以及優(yōu)化教學(xué)設(shè)計(jì)等,故此部分群體標(biāo)簽側(cè)重于聚類[4]出不同知識(shí)點(diǎn)掌握較弱群體學(xué)生,以“知識(shí)點(diǎn)名稱—較弱”類型的文本作為此類群體性標(biāo)簽,如“聚類算法較弱”這樣的標(biāo)簽等。
(5)興趣類標(biāo)簽:在學(xué)生下載、觀看、收藏、點(diǎn)贊等內(nèi)容的文本數(shù)據(jù)上使用分詞統(tǒng)計(jì)和K-means聚類的方法,獲取到學(xué)生的興趣標(biāo)簽;從學(xué)生登錄教學(xué)系統(tǒng)的客戶端類型分析,按照二八規(guī)則,設(shè)置“PC端用戶”“移動(dòng)端用戶”“混合型用戶”。
所有標(biāo)簽的構(gòu)建都在動(dòng)態(tài)發(fā)展變化的基礎(chǔ)之上,不斷修正更新,以呈現(xiàn)學(xué)生的成長(zhǎng)變化。
根據(jù)上述過程構(gòu)建的學(xué)生數(shù)據(jù)標(biāo)簽,來分層次、分角度地建立學(xué)生畫像,大致分為學(xué)生個(gè)性畫像與群體畫像。
學(xué)生個(gè)性畫像主要面向?qū)W生同時(shí)也向教師展示,個(gè)性畫像分兩個(gè)層次,一層是基礎(chǔ)信息畫像,如年級(jí)、專業(yè)、班級(jí)、性別、是否為積極參與學(xué)習(xí)的學(xué)習(xí)者的描述;第二層也是關(guān)鍵的個(gè)性畫像,動(dòng)態(tài)描述學(xué)生在不同階段知識(shí)、能力分布情況,在此層次中,為每個(gè)學(xué)生建立學(xué)生個(gè)人學(xué)習(xí)檔案,生成個(gè)人知識(shí)圖譜,并描述學(xué)生擅長(zhǎng)的領(lǐng)域、感興趣的領(lǐng)域,形成知識(shí)結(jié)構(gòu)明確、較立體的學(xué)生畫像,使得學(xué)生對(duì)自我知識(shí)體系有一個(gè)清晰的認(rèn)識(shí),找到適合自己的學(xué)習(xí)方式,同時(shí)便于為學(xué)生定制個(gè)性化學(xué)習(xí)教育方案。
群體畫像主要面向教師,一方面群體畫像按照知識(shí)掌握情況的群體標(biāo)簽進(jìn)行建立,例如“聚類算法較弱”這個(gè)群體性別分布特點(diǎn)、在這個(gè)知識(shí)點(diǎn)的學(xué)習(xí)參與度上是否積極參與,在主觀實(shí)踐操作方面是弱項(xiàng),還是知識(shí)點(diǎn)沒有理解(表現(xiàn)為客觀題也大量出錯(cuò))等。使得教師通過此類群體畫像對(duì)不同群體給予相應(yīng)的學(xué)習(xí)指導(dǎo),以及知識(shí)推薦和規(guī)劃;另一方面群體畫像按照班級(jí)群體來建立,經(jīng)過對(duì)班級(jí)成員個(gè)體信息的整合歸納,將不同班級(jí)的差異知識(shí)點(diǎn)生成知識(shí)結(jié)構(gòu)圖譜[5],發(fā)現(xiàn)優(yōu)勢(shì)和劣勢(shì),快速直擊短板部分,以便于教師對(duì)不同班級(jí)進(jìn)行針對(duì)性的、有差異的教學(xué)設(shè)計(jì),提高教學(xué)質(zhì)量和效果。
可視化展示部分主要研究選取哪些可視化圖表作為有效的分析圖表(此處僅以4個(gè)可視化圖形為例進(jìn)行闡述),能夠?qū)⒔⒌膶W(xué)生畫像更加生動(dòng)形象地表達(dá)并將信息傳遞得更準(zhǔn)確。與學(xué)生畫像的建立相對(duì)應(yīng),可視化展示同樣面向兩類呈現(xiàn)主體:一是學(xué)生角色,一是教師角色。
面向?qū)W生角色:主要將學(xué)生的知識(shí)圖譜進(jìn)行展示,也就是在哪些方面的知識(shí)點(diǎn)能力強(qiáng)或掌握得好,哪些比較弱等等,故選擇可視化圖表中的雷達(dá)圖對(duì)能力值的輻射情況進(jìn)行展示(如圖1,以某學(xué)生在數(shù)據(jù)庫技術(shù)課程的學(xué)習(xí)中掌握的知識(shí)能力為例)。學(xué)生對(duì)不同學(xué)習(xí)內(nèi)容所用的學(xué)習(xí)時(shí)長(zhǎng)可以使用餅狀圖來展示時(shí)長(zhǎng)的分布比例(如圖2,比例類都可選此類圖表)。通過可視化圖形的展示,使學(xué)生對(duì)自身的認(rèn)知更加清晰立體,找到更精確的學(xué)習(xí)方向。
面向教師角色:一方面可以向教師展示學(xué)生個(gè)性畫像,即面向?qū)W生角色的可視化圖像同樣全面向教師開放,以使教師客觀掌握學(xué)生學(xué)情,發(fā)現(xiàn)學(xué)習(xí)困難學(xué)生,及時(shí)精準(zhǔn)地給予針對(duì)性的指導(dǎo)和干預(yù),做到因材施教;另一方面向教師主要展現(xiàn)群體畫像的情況,例如以班級(jí)作為群體,觀察在相同時(shí)間段對(duì)于已學(xué)知識(shí)點(diǎn)不同班級(jí)的掌握程度與差異(如圖3所示),以及在一段時(shí)間內(nèi),不同班級(jí)在各階段的測(cè)試發(fā)展趨勢(shì)折線圖(如圖4)。也可以采用詞云圖來展示學(xué)生的興趣領(lǐng)域等。通過群體畫像的可視化,教師能夠根據(jù)不同班級(jí)的情況進(jìn)行準(zhǔn)確的、有差異性的教學(xué)設(shè)計(jì),突出班級(jí)特點(diǎn)找到短板,進(jìn)行提升。
圖1 某學(xué)生數(shù)據(jù)庫技術(shù)課程知識(shí)能力展示-雷達(dá)圖
圖2 學(xué)生學(xué)習(xí)內(nèi)容分配比例
圖3 三個(gè)班在數(shù)據(jù)庫技術(shù)課程已學(xué)知識(shí)點(diǎn)上的得分情況
在前期各項(xiàng)研究環(huán)節(jié)中已涉及到根據(jù)用戶畫像與可視化圖像展示對(duì)學(xué)生學(xué)習(xí)情況的干預(yù)[5],在此部分主要研究對(duì)學(xué)生成績(jī)的預(yù)測(cè)預(yù)警和知識(shí)推薦等。
以各個(gè)時(shí)間段抽取的學(xué)生測(cè)試成績(jī)數(shù)據(jù)為基礎(chǔ),綜合考慮日常學(xué)生學(xué)習(xí)行為數(shù)據(jù),采用機(jī)器學(xué)習(xí)中的隨機(jī)森林算法建模(決策樹),預(yù)測(cè)學(xué)生在下次測(cè)試與期末測(cè)試中的成績(jī),在可視化的成績(jī)折線圖中給予預(yù)測(cè)趨勢(shì)的展示,并設(shè)置預(yù)警分?jǐn)?shù)線,自動(dòng)對(duì)預(yù)警分?jǐn)?shù)線下的學(xué)生發(fā)送消息進(jìn)行預(yù)警提示,并結(jié)合學(xué)生畫像個(gè)人知識(shí)能力圖譜給予相應(yīng)的學(xué)習(xí)指導(dǎo)。
教師在教學(xué)平臺(tái)的教學(xué)資源中提前設(shè)置好知識(shí)點(diǎn)之間的關(guān)聯(lián)性,即某個(gè)知識(shí)點(diǎn)涉及到的前導(dǎo)知識(shí)和后續(xù)知識(shí),采用關(guān)聯(lián)規(guī)則算法[6],針對(duì)性地為學(xué)生進(jìn)行個(gè)性化的學(xué)習(xí)內(nèi)容推薦,并可以進(jìn)行針對(duì)性地發(fā)布練習(xí)作業(yè)。
針對(duì)學(xué)生知識(shí)能力圖譜中表現(xiàn)出的弱項(xiàng),采用協(xié)同過濾的方法,研究學(xué)習(xí)能力與表現(xiàn)比較全面的學(xué)生的學(xué)習(xí)軌跡、學(xué)習(xí)內(nèi)容以及時(shí)間分配等,向?qū)W生進(jìn)行學(xué)習(xí)方法、內(nèi)容的指導(dǎo)和推薦。
本研究通過對(duì)教學(xué)系統(tǒng)中學(xué)生行為數(shù)據(jù)的抽取分析,構(gòu)建學(xué)生數(shù)據(jù)標(biāo)簽,建立學(xué)生畫像與知識(shí)圖譜,并使用可視化圖表進(jìn)行形象的展示來使學(xué)生在學(xué)習(xí)過程中清晰地掌握自身知識(shí)結(jié)構(gòu)、優(yōu)勢(shì)短板,根據(jù)教師針對(duì)性的學(xué)習(xí)指導(dǎo)和推薦,提高學(xué)生學(xué)習(xí)成績(jī),充實(shí)知識(shí)結(jié)構(gòu);使教師能夠全面掌握學(xué)生學(xué)情與各班級(jí)的學(xué)情差異,進(jìn)行因材施教,優(yōu)化教學(xué)設(shè)計(jì),提升教學(xué)效果和教學(xué)質(zhì)量。