王鈺杰 楊杉
摘 ?要:文章基于新冠疫情前后四川某高校在線學(xué)習(xí)平臺(tái)的學(xué)生學(xué)習(xí)數(shù)據(jù)變化,獲取疫情前后學(xué)生在在線平臺(tái)學(xué)習(xí)的學(xué)習(xí)數(shù)據(jù),針對(duì)疫情前后的變化數(shù)據(jù)進(jìn)行兩個(gè)方面的主題分析:數(shù)據(jù)分析和數(shù)據(jù)挖掘。其中數(shù)據(jù)分析采用了均值過程和單因素分析方法,數(shù)據(jù)挖掘構(gòu)建了決策樹模型和貝葉斯聚類模型。分析和挖掘結(jié)果能夠直觀得出疫情變化對(duì)該高校學(xué)生的學(xué)習(xí)造成的影響,能夠?yàn)楦咝L峁┻h(yuǎn)程學(xué)習(xí)的管理意見,提高學(xué)生的學(xué)習(xí)效率。
關(guān)鍵詞:大數(shù)據(jù)分析;數(shù)據(jù)挖掘;行為研究;SPSS
中圖分類號(hào):TP311 ? ? 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-4706(2021)14-0094-05
Abstract: Based on the change of students’ learning data in the online learning platform of a college in Sichuan before and after the COVID-19 epidemic, this paper gets the students’ learning data in online platform before and after the epidemic. According to the changed data before and after the epidemic, two aspects of subject analysis are carried out: data analysis and data mining. The data analysis adopts the mean process and single factor analysis method, and the data mining constructs the decision tree model and Bayesian clustering model. The analysis and mining results can intuitively obtain the impact of epidemic changes on the learning of college students, can provide management opinions on distance learning for colleges, and improve students’ learning efficiency.
Keywords: big data analysis; data mining; behavior research; SPSS
0 ?引 ?言
近年來互聯(lián)網(wǎng)的極速發(fā)展,線上學(xué)習(xí)平臺(tái)更被各所高校所使用。線上學(xué)習(xí)平臺(tái)功能多,更加方便老師和學(xué)生教學(xué)和學(xué)習(xí)。自疫情暴發(fā)以來,線上學(xué)習(xí)成了解決疫情期間學(xué)習(xí)問題的最佳辦法,其中線上學(xué)習(xí)平臺(tái)更是在疫情在家學(xué)習(xí)中起到了最為關(guān)鍵的作用,同時(shí)線上平臺(tái)也積累了高校學(xué)生疫情前后的學(xué)習(xí)各項(xiàng)指標(biāo)數(shù)據(jù),如學(xué)生觀看視頻時(shí)長(zhǎng)、任務(wù)點(diǎn)完成數(shù)、章節(jié)學(xué)習(xí)次數(shù)、討論數(shù)等等。因此可以通過不同的數(shù)據(jù)分析方法分析出疫情前后學(xué)生的學(xué)習(xí)狀況變化,對(duì)比發(fā)現(xiàn)疫情期間線上學(xué)習(xí)的優(yōu)勢(shì)劣勢(shì),改良線上學(xué)習(xí)的方式方法;給各學(xué)院各教師提供學(xué)生的學(xué)習(xí)指標(biāo)數(shù)據(jù),結(jié)合課程針對(duì)性改變線上的具體教學(xué)方式方法。
1 ?研究思路
以四川省某高校的線上學(xué)習(xí)平臺(tái)數(shù)據(jù)為研究對(duì)象,對(duì)該平臺(tái)的學(xué)生疫情前后在線學(xué)習(xí)數(shù)據(jù)進(jìn)行學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)分析,數(shù)據(jù)挖掘。其中數(shù)據(jù)分析采用了SPSS軟件進(jìn)行學(xué)生各項(xiàng)學(xué)習(xí)指標(biāo)的均值過程,疫情后不同入學(xué)年級(jí)關(guān)于章節(jié)學(xué)習(xí)次數(shù)單因素分析。數(shù)據(jù)挖掘采用SPSS軟件構(gòu)建了疫情前后學(xué)生觀看視頻總時(shí)長(zhǎng)貝葉斯模型,疫情前后任務(wù)點(diǎn)完成情況決策樹模型。
2 ?數(shù)據(jù)說明
2.1 ?數(shù)據(jù)來源
數(shù)據(jù)采自四川某高校疫情前后學(xué)習(xí)平臺(tái)數(shù)據(jù),通過在線學(xué)習(xí)平臺(tái)導(dǎo)出2017至2020級(jí)學(xué)生疫情前后的所有線上學(xué)習(xí)事務(wù)的匯總數(shù)據(jù)。數(shù)據(jù)維度有:學(xué)生姓名、學(xué)生賬號(hào)、專業(yè)、行政班、院系、學(xué)生狀態(tài)、入學(xué)年級(jí)、課程名稱、課程編號(hào)、任務(wù)完成點(diǎn)數(shù)、學(xué)生視頻觀看時(shí)長(zhǎng)等等學(xué)習(xí)指標(biāo)。疫情前共60 000條數(shù)據(jù),疫情后90 000條數(shù)據(jù)。
2.2 ?數(shù)據(jù)清洗
對(duì)數(shù)據(jù)進(jìn)行兩類清洗處理,對(duì)疫情前和疫情后的Excel表去除無效分析對(duì)象,將轉(zhuǎn)學(xué)院學(xué)生,留級(jí)學(xué)生和無信息學(xué)生數(shù)據(jù)等無效數(shù)據(jù)進(jìn)行刪除。再將表中多次出現(xiàn)學(xué)生的數(shù)據(jù)進(jìn)行合并,疫情后的各年級(jí)表進(jìn)行合并,得出疫情前和疫情后學(xué)生學(xué)習(xí)情況兩張總表。
3 ?數(shù)據(jù)分析
3.1 ?疫情前后學(xué)生學(xué)習(xí)情況指標(biāo)的均值過程分析
由表1和表2對(duì)比分析可知,疫情后線上學(xué)習(xí)平臺(tái)任務(wù)點(diǎn)完成數(shù)、視頻任務(wù)點(diǎn)完成數(shù)、學(xué)生觀看視頻總時(shí)長(zhǎng)(分鐘)、作業(yè)完成數(shù)這四項(xiàng)學(xué)生學(xué)習(xí)指標(biāo)在均值上比疫情前有較大提升,可以看出疫情后該高校對(duì)線上學(xué)習(xí)平臺(tái)的使用率大幅提升,各課程在線上學(xué)習(xí)平臺(tái)的任務(wù)點(diǎn)的設(shè)置也極大增加。學(xué)生完成質(zhì)量也較疫情前有所提高。任務(wù)完成數(shù)、視頻任務(wù)點(diǎn)完成數(shù)、學(xué)生觀看視頻總時(shí)長(zhǎng)、作業(yè)完成數(shù)這四項(xiàng)學(xué)習(xí)指標(biāo)中,學(xué)生觀看視頻總時(shí)長(zhǎng)提高最大,疫情前學(xué)生觀看視頻總時(shí)長(zhǎng)均值在278.61分鐘,疫情后均值提高到325.13分鐘。說明疫情后學(xué)生在線上進(jìn)行觀看視頻的學(xué)習(xí)方式極大地被采用,教師也極力推薦并采用了這種以線上視頻觀看為學(xué)習(xí)主要途徑的教學(xué)方式。其他學(xué)習(xí)指標(biāo)也都有不同程度上的提升,說明較與疫情之前的教學(xué)工作,疫情后的教學(xué)將很多疫情前教學(xué)工作中的活動(dòng)都搬到了在線學(xué)習(xí)平臺(tái)上,任務(wù)點(diǎn)完成數(shù)、作業(yè)完成數(shù)的增長(zhǎng)可以證明這一點(diǎn)。
3.2 ?疫情后不同入學(xué)年級(jí)關(guān)于章節(jié)學(xué)習(xí)次數(shù)的單因素分析
為了方便進(jìn)行單因素分析,需要對(duì)數(shù)據(jù)進(jìn)行處理。其中1、2、3、4分別代表2017級(jí)、2018級(jí)、2019級(jí)2020級(jí)。
從表3的方差齊次性檢驗(yàn)我們可以看出sig<0.05,不具有齊次性,表4是方差分析表,分析不同入學(xué)年級(jí)他們章節(jié)學(xué)習(xí)次數(shù)的均值是否具有顯著差異,而sig<0.05,是拒絕原假設(shè)說明至少有兩種不同的入學(xué)年級(jí)他們章節(jié)學(xué)習(xí)次數(shù)是有顯著差異的。在表5中,因?yàn)椴痪哂旋R次性所以直接我們看表的下半部分的表即塔姆黑尼表可以得出這四種不同入學(xué)年級(jí)的章節(jié)學(xué)習(xí)次數(shù)都是具有顯著差異的,其中均值最高的是3,說明2019級(jí)學(xué)生與其他年級(jí)差異最明顯。通過具體數(shù)值的比較,總體排名為3>2>4>1即2019級(jí)>2018級(jí)>2020級(jí)>2017級(jí)。這個(gè)排名體現(xiàn)了各年級(jí)之間學(xué)習(xí)效果存在著較大的差異,通過具體的數(shù)值可以看出,2019級(jí)的同學(xué)在疫情期間學(xué)習(xí)效果最佳超過了其他年級(jí)。而2017級(jí)的同學(xué)排在了最后,說明2017級(jí)同學(xué)在疫情期間的學(xué)習(xí)效果并不是很好。
4 ?數(shù)據(jù)挖掘
4.1 ?疫情前后學(xué)生學(xué)習(xí)情況貝葉斯分類分析
通過運(yùn)用SPSS構(gòu)建了疫情前后的關(guān)于學(xué)生視頻觀看總時(shí)長(zhǎng)的貝葉斯模型,并對(duì)模型的結(jié)果做出以下分析。由圖1可以看出疫情前視頻任務(wù)點(diǎn)學(xué)生觀看時(shí)長(zhǎng)(分鐘)對(duì)于任務(wù)完成數(shù)依賴度是最高的,而其他學(xué)習(xí)指標(biāo)如考試完成數(shù)以及章節(jié)學(xué)習(xí)次數(shù)數(shù)值上講對(duì)視頻任務(wù)點(diǎn)學(xué)生觀看時(shí)長(zhǎng)依賴度并不高,但是總體上這六類指標(biāo)對(duì)視頻任務(wù)點(diǎn)觀看時(shí)長(zhǎng)依賴度都不高,數(shù)值都在0.2左右。對(duì)比圖2疫情后學(xué)生觀看視頻總時(shí)長(zhǎng)(分鐘)對(duì)于各項(xiàng)學(xué)習(xí)指標(biāo)依賴度大幅提高,其重要性都達(dá)到了1.0,可以看出疫情后的學(xué)生學(xué)習(xí)更加注重線上平臺(tái)視頻觀看,且各項(xiàng)學(xué)習(xí)指標(biāo)都依賴于學(xué)生觀看視頻總時(shí)長(zhǎng)(分鐘),說明疫情后的學(xué)習(xí)模式是以線上平臺(tái)的視頻觀看為側(cè)重點(diǎn)展開的。
在這次質(zhì)量較高的建模下,可以看出在疫情前學(xué)生觀看視頻總時(shí)長(zhǎng)這一學(xué)習(xí)指標(biāo)并不跟其他學(xué)習(xí)指標(biāo)存在較大的相關(guān)聯(lián)性,其他學(xué)習(xí)指標(biāo)也并不影響學(xué)生觀看視頻總時(shí)長(zhǎng);而在疫情后其他學(xué)習(xí)指標(biāo)受學(xué)生觀看視頻總時(shí)長(zhǎng)影響較大,說明疫情前教學(xué)工作并不是通過線上視頻觀看展開,而在疫情后線上教學(xué)工作大都通過線上平臺(tái)視頻的觀看以及其他學(xué)習(xí)任務(wù)相結(jié)合開展,疫情后的線上視頻觀看成了該高校學(xué)習(xí)任務(wù)的側(cè)重點(diǎn)。
4.2 ?;疫情前后任務(wù)點(diǎn)完成情況決策樹分析
通過運(yùn)用SPSS軟件構(gòu)建了疫情前后的關(guān)于任務(wù)點(diǎn)完成情況的決策樹模型,并對(duì)模型的結(jié)果作出以下分析。如圖3可以看出疫情前任務(wù)點(diǎn)完成情況主要由視頻任務(wù)點(diǎn)完成數(shù)和章節(jié)測(cè)試完成數(shù)構(gòu)成,兩者對(duì)任務(wù)點(diǎn)完成數(shù)的影響度都超過了0.4,章節(jié)測(cè)試平均分對(duì)任務(wù)點(diǎn)完成數(shù)影響較小。對(duì)比圖4疫情后任務(wù)點(diǎn)完成數(shù)主要被視頻任務(wù)點(diǎn)完成數(shù)所影響,其他的作業(yè)完成數(shù)、章節(jié)測(cè)試完成數(shù)、作業(yè)完成數(shù)對(duì)任務(wù)點(diǎn)完成數(shù)影響對(duì)比視頻任務(wù)點(diǎn)完成數(shù)對(duì)其的影響很小。疫情后的視頻任務(wù)完成數(shù)對(duì)任務(wù)點(diǎn)完成數(shù)重要程度超過了0.8,其他學(xué)習(xí)指標(biāo)反而都沒超過0.2,遠(yuǎn)遠(yuǎn)大于其他指標(biāo)的影響。
在這次質(zhì)量較高的建模下,可以看出在疫情前在線學(xué)習(xí)平臺(tái)的任務(wù)點(diǎn)構(gòu)成由視頻任務(wù)點(diǎn)和章節(jié)測(cè)試任務(wù)點(diǎn)構(gòu)成,而疫情后在線學(xué)習(xí)平臺(tái)的任務(wù)點(diǎn)構(gòu)成發(fā)生了大轉(zhuǎn)變,其中視頻任務(wù)點(diǎn)完成數(shù)占到了最大的比重,還出現(xiàn)了考試完成數(shù)。說明疫情后教師加大了在線學(xué)習(xí)平臺(tái)上視頻任務(wù)點(diǎn)的布置。將之前線下的考試搬到了線上,這是教學(xué)工作側(cè)重點(diǎn)的轉(zhuǎn)移。
5 ?結(jié) ?論
學(xué)生的各項(xiàng)學(xué)習(xí)指標(biāo)數(shù)據(jù)在疫情后都有較大的提升,說明疫情后該學(xué)校大力開展結(jié)合線上學(xué)習(xí)平臺(tái)的教學(xué)模式,疫情期間的教學(xué)工作主要通過線上學(xué)習(xí)平臺(tái)實(shí)施。疫情前后不同學(xué)習(xí)指標(biāo)數(shù)據(jù)的變化反應(yīng):教學(xué)方式在疫情期間的變化,教學(xué)的側(cè)重點(diǎn)在疫情期間的變化。
在疫情期間各年級(jí)同學(xué)學(xué)習(xí)效果存在較大差異,通過對(duì)疫情后的不同入學(xué)年級(jí)學(xué)習(xí)指標(biāo)單因素分析,2019級(jí)學(xué)生學(xué)習(xí)效果最好指標(biāo)最高,2018級(jí)和2020級(jí)處于中間,2017最差。說明各年級(jí)同學(xué)對(duì)疫情期間開展的線上學(xué)習(xí)模式接受程度不同,對(duì)待態(tài)度不同,所以達(dá)到的效果也不同。各學(xué)院可以通過開展各年級(jí)線上學(xué)習(xí)情況和滿意度調(diào)查,及時(shí)了解疫情期間學(xué)習(xí)效果差的年級(jí)的思想,以及效果好的年級(jí)的方式方法。及時(shí)調(diào)整各年級(jí)線上教學(xué)工作。
疫情期間教學(xué)方法及教學(xué)任務(wù)的側(cè)重點(diǎn)發(fā)生了重大轉(zhuǎn)變,通過兩次高質(zhì)量的建模,發(fā)現(xiàn)了疫情后教學(xué)方法發(fā)生了巨大的變化,在各項(xiàng)線上學(xué)習(xí)平臺(tái)考核數(shù)據(jù)上都有體現(xiàn),最為明顯的就是疫情后教學(xué)側(cè)重點(diǎn)放在了線上學(xué)習(xí)平臺(tái)視頻的觀看上,在疫情前后任務(wù)點(diǎn)完成情況決策樹模型結(jié)果匯總我們可以明顯發(fā)現(xiàn),疫情后視頻任務(wù)點(diǎn)完成數(shù)迅速增加,對(duì)整個(gè)任務(wù)點(diǎn)的構(gòu)成造成了巨大的影響。較與疫情前的教學(xué)模式,各種線下的教學(xué)考核也都搬到了線上平臺(tái),如章節(jié)測(cè)試、考試、作業(yè)等等。這是受疫情的影響,同時(shí)也反映了線上學(xué)習(xí)平臺(tái)對(duì)遠(yuǎn)距離教學(xué)的幫助。
參考文獻(xiàn):
[1] 廖雅琪,楊杉,孫宇辰.基于SPSS的線上學(xué)習(xí)行為分析研究 [J].現(xiàn)代信息科技,2021,5(7):21-24.
[2] 薛新鵬,楊杉.基于大數(shù)據(jù)的高校學(xué)生在線學(xué)習(xí)平臺(tái)數(shù)據(jù)研究 [J].現(xiàn)代信息科技,2021,5(9):83-86+92.
[3] 楊杉.基于大數(shù)據(jù)的高校學(xué)生在線學(xué)習(xí)畫像研究 [J].電腦知識(shí)與技術(shù),2021,17(7):237-241.
[4] 鄧瑩.疫情危機(jī)下大數(shù)據(jù)分析的功能研究 [J].數(shù)字技術(shù)與應(yīng)用,2020,38(3):82-83.
[5] 賀玲.大數(shù)據(jù)背景下統(tǒng)計(jì)軟件在數(shù)據(jù)分析中的運(yùn)用 [J].經(jīng)貿(mào)實(shí)踐,2018(4):328+330.
作者簡(jiǎn)介:王鈺杰(2000—),男,漢族,四川廣元人,本科在讀,主要研究方向:數(shù)據(jù)挖掘、大數(shù)據(jù)。