王蘊(yùn)哲,陸悠,陳建平
(蘇州科技大學(xué) 電子與信息工程學(xué)院,江蘇 蘇州 215000)
大數(shù)據(jù)是當(dāng)今社會(huì)最重要的資產(chǎn)之一,具備4V特征,即規(guī)模性(Volume)、高速性(Velocity)、多樣性(Variety)和價(jià)值性(Value)。教育大數(shù)據(jù)則是伴隨著我國(guó)教育信息化戰(zhàn)略不斷推進(jìn),借助各類軟硬件平臺(tái)和工具,由常態(tài)化和數(shù)字化學(xué)習(xí)活動(dòng)數(shù)據(jù)的持續(xù)積累而形成[1]。教育大數(shù)據(jù)可涵蓋學(xué)生成績(jī)、學(xué)生特長(zhǎng)、課程信息、教學(xué)行為等多樣化信息。對(duì)這些數(shù)據(jù)進(jìn)行針對(duì)性分析能夠揭示現(xiàn)存問(wèn)題、發(fā)展趨勢(shì)和相關(guān)關(guān)系等重要價(jià)值[2],對(duì)推動(dòng)科學(xué)化教育管理、精準(zhǔn)化教學(xué)模式改革、人性化教育評(píng)價(jià)和服務(wù)都有著深遠(yuǎn)的影響[3]。
近年來(lái),大數(shù)據(jù)技術(shù)正被越來(lái)越廣泛地應(yīng)用至教學(xué)情境中,主要目的在于促進(jìn)教學(xué)質(zhì)量的不斷提升。與普通的教學(xué)范式相比,結(jié)合了大數(shù)據(jù)分析技術(shù)的情境教學(xué),能夠優(yōu)化高校體育課教學(xué)的課堂環(huán)境并準(zhǔn)確分析學(xué)生的動(dòng)態(tài)[4]。經(jīng)總結(jié)發(fā)現(xiàn),教育大數(shù)據(jù)的重要性體現(xiàn)在以下六個(gè)方面:提高教與學(xué)的效率、促進(jìn)科學(xué)決策教育、完成素質(zhì)教育監(jiān)測(cè)系統(tǒng)、便于綜合評(píng)價(jià)教育質(zhì)量、促進(jìn)普及和個(gè)性化教育、完善個(gè)性化教學(xué)。然而,全面推進(jìn)大數(shù)據(jù)技術(shù)與精準(zhǔn)化教學(xué)的融合仍面臨著數(shù)據(jù)分析、共享、數(shù)據(jù)安全等方面的挑戰(zhàn)。
精準(zhǔn)化教學(xué)是指鑒于個(gè)體對(duì)知識(shí)的掌握程度不同而展開(kāi)的差別化、針對(duì)性的教學(xué),精準(zhǔn)度則體現(xiàn)了教師的教學(xué)方式與學(xué)生接受能力之間的耦合程度。高校教育的價(jià)值不僅體現(xiàn)于知識(shí)在盡可能廣泛的空間中進(jìn)行傳播,更在于幫助學(xué)生樹(shù)立正確的自我認(rèn)知以達(dá)到日趨完善的狀態(tài)。因此,教師引導(dǎo)的精確性和對(duì)動(dòng)態(tài)教學(xué)過(guò)程中不確定因素的掌控力,是培養(yǎng)學(xué)生核心素養(yǎng)、專業(yè)能力以及獨(dú)特思維方式的關(guān)鍵。
教育部辦公廳印發(fā)的《2018年教育信息化和網(wǎng)絡(luò)安全工作要點(diǎn)》中就已經(jīng)明確指出要推動(dòng)大數(shù)據(jù)技術(shù)在教育教學(xué)中的深入應(yīng)用,提高教育大數(shù)據(jù)的收集、分析和研判能力。目前已有部分?jǐn)?shù)據(jù)驅(qū)動(dòng)精準(zhǔn)教學(xué)相關(guān)的討論和實(shí)踐,但是提高精準(zhǔn)度仍是當(dāng)務(wù)之急。而導(dǎo)致教學(xué)精準(zhǔn)度低這一結(jié)果的原因,具體來(lái)說(shuō),包括數(shù)據(jù)涉及面窄、維度低、質(zhì)量差、管理分析難度高等因素。因此,本文提出大數(shù)據(jù)分析方法驅(qū)動(dòng)的精準(zhǔn)化教學(xué)框架,結(jié)合實(shí)際的教學(xué)場(chǎng)景對(duì)當(dāng)前制約精準(zhǔn)化教學(xué)的因素進(jìn)行解釋,側(cè)重于教育數(shù)據(jù)從采集、存儲(chǔ)到分析,再到發(fā)揮效用的全過(guò)程整合。此外,本工作具備較強(qiáng)的普適性,可靈活服務(wù)于各種教學(xué)情境。無(wú)論是教師還是學(xué)生,都將顯著提高教學(xué)過(guò)程中的參與度和交互程度?;谌斯ぶ悄艿慕虒W(xué)數(shù)據(jù)分析方法,使得分析過(guò)程實(shí)現(xiàn)高效自動(dòng)化,結(jié)果也更加可靠。本框架的一個(gè)重要特點(diǎn)在于構(gòu)建數(shù)據(jù)可視化系統(tǒng),分析結(jié)果可以通過(guò)適合的方式加以呈現(xiàn),這對(duì)于教育者全面、正確、深入理解數(shù)據(jù),科學(xué)制定精準(zhǔn)化教育決策起到了關(guān)鍵作用。
我國(guó)傳統(tǒng)教學(xué)范式的特點(diǎn)可以概括為“三中心”(老師中心、教科書(shū)中心、課堂教學(xué)中心)和“五環(huán)節(jié)”(準(zhǔn)備、復(fù)習(xí)舊課、教授新課、鞏固練習(xí)、布置作業(yè))[5]。在此教學(xué)模式下,學(xué)生的注意力集中在課堂上老師所講授的課本中的理論知識(shí),忽略了自主學(xué)習(xí)、主動(dòng)探索能力的培養(yǎng)。目前,大部分高校課堂中已引入互聯(lián)網(wǎng)和多媒體等技術(shù),拓寬了學(xué)生自主獲取信息的途徑,增強(qiáng)了課堂上師生間的互動(dòng)性。然而,要實(shí)現(xiàn)精準(zhǔn)化教學(xué)這一目標(biāo),教師仍面臨著以下幾方面的挑戰(zhàn):
精準(zhǔn)化教學(xué)要以多元化的學(xué)情數(shù)據(jù)分析為基礎(chǔ),而目前可獲取的多為成績(jī)?cè)u(píng)分及考勤數(shù)據(jù),形式單一,信息量不足。往往是由采集目標(biāo)基數(shù)大、部分內(nèi)容難以量化和數(shù)據(jù)采集工具有限所致。在數(shù)據(jù)量匱乏的情況下,教師難以了解不同學(xué)習(xí)者的學(xué)習(xí)特征和學(xué)習(xí)需求,因此亟須拓寬數(shù)據(jù)采集渠道與方法。
在收集到海量學(xué)情數(shù)據(jù)的情況下,教師首先面臨著存儲(chǔ)和管理的困難。隨著數(shù)據(jù)的積累,單臺(tái)設(shè)備很難滿足實(shí)時(shí)讀寫(xiě)的需求。教師受專業(yè)背景的影響,具備不同的數(shù)據(jù)素養(yǎng),有時(shí)無(wú)法充分利用大數(shù)據(jù)技術(shù)進(jìn)行分析,而傾向于通過(guò)主觀經(jīng)驗(yàn)對(duì)學(xué)情做出評(píng)價(jià)。
教師通常使用同一套教材進(jìn)行授課,導(dǎo)致知識(shí)掌握程度不同的學(xué)生難以獲得個(gè)性化的學(xué)習(xí)資源。由于課堂規(guī)模、課時(shí)等方面的限制,學(xué)生難以發(fā)揮主觀能動(dòng)性,既無(wú)法及時(shí)反饋知識(shí)盲區(qū),也很難獲得老師全面的評(píng)價(jià)以改善學(xué)習(xí)方式,促進(jìn)自主學(xué)習(xí)。學(xué)生被動(dòng)式的學(xué)習(xí)更增加了教師進(jìn)行針對(duì)性教學(xué)和輔導(dǎo)的難度。
教師難以獲得現(xiàn)實(shí)收集到的學(xué)情數(shù)據(jù)的效益的最大化,僅可針對(duì)這類數(shù)據(jù)進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)分析,得出成績(jī)分布的大致情況。事實(shí)上,學(xué)情數(shù)據(jù)可以應(yīng)用到教學(xué)領(lǐng)域建模、學(xué)習(xí)趨勢(shì)預(yù)測(cè)、個(gè)性化學(xué)習(xí),教育決策與干預(yù)等多個(gè)方面,為提升教學(xué)質(zhì)量提供有力支撐。而教學(xué)質(zhì)量的提升依賴于教師數(shù)據(jù)思維的全面改革與提升。例如在統(tǒng)計(jì)學(xué)專業(yè)課程教學(xué)過(guò)程中,適時(shí)引入大數(shù)據(jù)方法工具,加強(qiáng)學(xué)生對(duì)各種回歸算法、決策樹(shù)等人工智能方法的理解。在課程教學(xué)過(guò)程中增加半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的處理方法、復(fù)雜數(shù)據(jù)庫(kù)的信息提取與關(guān)聯(lián)分析等內(nèi)容[6]。
針對(duì)上述實(shí)現(xiàn)精準(zhǔn)化教學(xué)所存在的各項(xiàng)問(wèn)題,本文提出通過(guò)大數(shù)據(jù)及人工智能技術(shù)來(lái)提高精準(zhǔn)度的方法。方法所對(duì)應(yīng)的框架如圖1所示:
圖1 大數(shù)據(jù)驅(qū)動(dòng)的精準(zhǔn)教學(xué)方法框架
教育大數(shù)據(jù)相比傳統(tǒng)的教學(xué)數(shù)據(jù)具有實(shí)時(shí)性、綜合性、連續(xù)性和自然性等特征,其價(jià)值的高低密切依賴于數(shù)據(jù)質(zhì)量是否真實(shí)、一致和準(zhǔn)確,采集的方式主要包括:課堂數(shù)據(jù)采集,包括考勤、提問(wèn)、偏好等行為數(shù)據(jù)。由于手動(dòng)收集數(shù)據(jù)所需的人力成本過(guò)高,學(xué)校可以在教室設(shè)置監(jiān)控視頻,通過(guò)后期的視頻分析技術(shù)提取相關(guān)數(shù)據(jù);線上教學(xué)數(shù)據(jù)采集,通過(guò)端上埋點(diǎn)技術(shù),記錄學(xué)生觀看視頻的時(shí)間,暫停、播放、退出的頻率,由此可對(duì)學(xué)生和教師特定的行為進(jìn)行跟蹤與捕捉;調(diào)研數(shù)據(jù)采集,以問(wèn)卷或訪談的形式獲取學(xué)生及教師主觀態(tài)度和意愿方面的數(shù)據(jù),此種方式可將數(shù)據(jù)的積累延伸至課外,為學(xué)情分析提供新的契機(jī);知識(shí)數(shù)據(jù)采集:以課程為單位,提取知識(shí)點(diǎn)列表、知識(shí)點(diǎn)難度、教學(xué)成果列表、成績(jī)及錯(cuò)點(diǎn)。
存儲(chǔ)是為了提高數(shù)據(jù)的可用性和多用戶協(xié)同合作的效率。教育大數(shù)據(jù)的存儲(chǔ)需要使用分布式集群、云存儲(chǔ)等技術(shù)。在存儲(chǔ)之前,需要對(duì)數(shù)據(jù)先進(jìn)行預(yù)處理,即:清洗由采集設(shè)備或傳輸和錄入過(guò)程所導(dǎo)致的數(shù)據(jù)錯(cuò)誤;對(duì)數(shù)據(jù)項(xiàng)和數(shù)據(jù)屬性的完整性進(jìn)行檢查;從不同數(shù)據(jù)源獲取的數(shù)據(jù),如監(jiān)控視頻數(shù)據(jù),問(wèn)卷文本數(shù)據(jù),可能是結(jié)構(gòu)化、半結(jié)構(gòu)化甚至非結(jié)構(gòu)化的,需要進(jìn)行量化、轉(zhuǎn)化及整合;通過(guò)聚合、降維、壓縮等方法對(duì)數(shù)據(jù)進(jìn)行歸約,剔除冗余。Hadoop 框架中的分布式文件系統(tǒng)能夠?qū)崿F(xiàn)海量數(shù)據(jù)的分塊存儲(chǔ)、復(fù)制備份,保證服務(wù)器之間的負(fù)載均衡。在HDFS 的基礎(chǔ)上部署Hive 和HBase 等數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)組件,可支持?jǐn)?shù)十億級(jí)數(shù)據(jù)的實(shí)時(shí)入庫(kù)和隨機(jī)查詢?cè)L問(wèn)。
學(xué)情數(shù)據(jù)分析是為了構(gòu)建和理解學(xué)習(xí)者特征,進(jìn)而制定個(gè)性化教學(xué)策略,優(yōu)化學(xué)習(xí)成果。傳統(tǒng)的分析方法多依賴于描述、推論、信度分析等統(tǒng)計(jì)學(xué)方法,只適用于處理少量數(shù)據(jù)且無(wú)法充分挖掘數(shù)據(jù)關(guān)聯(lián)性、發(fā)展趨勢(shì)、屬性類別等隱藏信息。因此需要借助數(shù)據(jù)挖掘和人工智能的方法深入數(shù)據(jù)內(nèi)部,在發(fā)現(xiàn)價(jià)值的同時(shí)也要保證處理大量數(shù)據(jù)的速度。
可視化技術(shù)可以將抽象數(shù)據(jù)挖掘的結(jié)果直觀地呈現(xiàn)出來(lái),通過(guò)圖形、圖表、動(dòng)畫(huà)等不同形式使用戶形成對(duì)海量數(shù)據(jù)的整體理解,感知數(shù)據(jù)間的復(fù)雜關(guān)系,結(jié)合縮放、篩選、高亮等交互工具,與數(shù)據(jù)交流,輔助分析和推理工作的深入。
對(duì)學(xué)情數(shù)據(jù)分析的結(jié)果可應(yīng)用于教學(xué)規(guī)律探索、問(wèn)題診斷、決策與干預(yù),進(jìn)而確定個(gè)性化、精準(zhǔn)化教學(xué)方針與目標(biāo),提升教學(xué)質(zhì)量。此外,線上教學(xué)平臺(tái)相關(guān)的數(shù)據(jù)還可用于后續(xù)對(duì)平臺(tái)的迭代與優(yōu)化。
在教學(xué)實(shí)踐過(guò)程中,面向精準(zhǔn)度的教育大數(shù)據(jù)分析方法取得了較好的效果。本課題以蘇州科技大學(xué)2018 級(jí)計(jì)算機(jī)專業(yè)學(xué)生為實(shí)驗(yàn)對(duì)象,涵蓋“Java 語(yǔ)言程序設(shè)計(jì)”“Web 前端開(kāi)發(fā)”等多門(mén)課程,主要采集課程信息、學(xué)生成績(jī)、課堂視頻等數(shù)據(jù)。在實(shí)驗(yàn)前期準(zhǔn)備階段,搭建了由10 臺(tái)服務(wù)器構(gòu)成并部署了OpenStack私有云平臺(tái)的集群系統(tǒng),用于存儲(chǔ)教學(xué)數(shù)據(jù)。多個(gè)用戶可同時(shí)接入虛擬化資源池,部署Hadoop 系統(tǒng),進(jìn)行數(shù)據(jù)的分布式存儲(chǔ)與管理。
在數(shù)據(jù)分析方面,采用Apriori 方法探索學(xué)生課堂行為與成績(jī)之間的關(guān)聯(lián);通過(guò)自回歸移動(dòng)平均模型算法對(duì)個(gè)體的成績(jī)數(shù)據(jù)進(jìn)行時(shí)序預(yù)測(cè);在對(duì)各個(gè)學(xué)生進(jìn)行特征提取的基礎(chǔ)上,使用kMeans 等聚類算法找出具有相似表現(xiàn)狀態(tài)的群體。還運(yùn)用人工智能技術(shù)從多源異構(gòu)課程信息中抽取知識(shí),構(gòu)建知識(shí)圖譜,幫助學(xué)生梳理課程核心概念之間的語(yǔ)義關(guān)系,提高歸納總結(jié)的能力;通過(guò)計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí)方法,對(duì)課堂監(jiān)控視頻進(jìn)行目標(biāo)檢測(cè)、行為檢測(cè)與跟蹤、自動(dòng)化考勤和教學(xué)質(zhì)量評(píng)估,降低人工記錄的時(shí)間和人力成本。各項(xiàng)數(shù)據(jù)挖掘與分析算法通過(guò)移動(dòng)計(jì)算的方式在大數(shù)據(jù)云平臺(tái)上執(zhí)行,云平臺(tái)在進(jìn)行任務(wù)調(diào)度時(shí),會(huì)盡可能地將計(jì)算任務(wù)分配到其所要處理數(shù)據(jù)塊的存儲(chǔ)位置,實(shí)現(xiàn)存儲(chǔ)與計(jì)算的分離。這樣可以提高系統(tǒng)的靈活性,使得存儲(chǔ)與計(jì)算可以按需進(jìn)行拓展。
為了直觀展示教育大數(shù)據(jù)挖掘分析的結(jié)果,我們還建立了交互式的可視教學(xué)系統(tǒng)。圖2展示的是系統(tǒng)中的數(shù)據(jù)統(tǒng)計(jì)界面。數(shù)據(jù)包含了文本和數(shù)值類型。通過(guò)排序、平均、詞頻統(tǒng)計(jì)等統(tǒng)計(jì)方法,結(jié)合折線圖、平行坐標(biāo)、柱狀體、環(huán)形圖、詞云的可視化方法呈現(xiàn)出個(gè)體原始數(shù)據(jù)以及整體分布情況。從左下角的詞云圖中,師生可以直接獲取當(dāng)前各門(mén)課程中的核心概念,盡快確定授課和學(xué)習(xí)的主要方向。在右上角的班級(jí)成績(jī)平行坐標(biāo)中,教師不僅可以查看成績(jī)的整體分布,還能夠掌握單個(gè)學(xué)生的成績(jī)波動(dòng)情況,根據(jù)考試內(nèi)容迅速定位薄弱的知識(shí)點(diǎn),及時(shí)調(diào)整授課重心與方式,以此開(kāi)展更有針對(duì)性的教學(xué),提高教學(xué)的實(shí)效性。
圖2 課程和成績(jī)數(shù)據(jù)分析結(jié)果可視化界面
精準(zhǔn)教學(xué)是教學(xué)質(zhì)量提升的終極目標(biāo),通過(guò)設(shè)計(jì)測(cè)量過(guò)程來(lái)追蹤學(xué)生的表現(xiàn),核心在于大量的教育數(shù)據(jù)和準(zhǔn)確的學(xué)情分析。大數(shù)據(jù)時(shí)代的到來(lái)為精準(zhǔn)教學(xué)中數(shù)據(jù)挖掘和分析任務(wù)提供了有力的技術(shù)支撐,使得學(xué)生可以根據(jù)全面的成績(jī)和行為記錄實(shí)現(xiàn)自適應(yīng)學(xué)習(xí),教師能夠參考分析結(jié)果診斷教學(xué)問(wèn)題、動(dòng)態(tài)調(diào)整教學(xué)方針。本文提出的框架遵循完整的大數(shù)據(jù)分析流程,從數(shù)據(jù)采集、存儲(chǔ)、處理、算法分析及交互可視化等方面,針對(duì)當(dāng)前教學(xué)精準(zhǔn)度提高存在的困難,探討潛在的解決方案和可行性。在初步實(shí)踐的過(guò)程中也發(fā)現(xiàn),精準(zhǔn)化教學(xué)也離不開(kāi)教師數(shù)據(jù)素養(yǎng)的提升和軟硬件設(shè)施的發(fā)展。為了進(jìn)一步驗(yàn)證有效性,未來(lái)還應(yīng)將本文所提出的精準(zhǔn)化教學(xué)框架推廣至更多學(xué)科的教學(xué)實(shí)踐中。此外,本文聚焦于教學(xué)框架的構(gòu)建,而細(xì)節(jié)方面仍需要更多探索,包括不同的分析方法在各類教學(xué)數(shù)據(jù)價(jià)值挖掘任務(wù)下的性能比較,以及數(shù)據(jù)安全的加強(qiáng)以及學(xué)生隱私的保護(hù)。