侯勇
摘 要:教育數(shù)據(jù)挖掘在從計算機科學(xué)本身作為一個領(lǐng)域應(yīng)運而生,利用 DM 技術(shù)能夠推進高等教育的教學(xué)、學(xué)習(xí)和研究。教育數(shù)據(jù)挖掘 的主要目標是使用大規(guī)模教育數(shù)據(jù)集來更好地了解學(xué)生學(xué)習(xí)并提供有關(guān)學(xué)習(xí)過程的信息。
關(guān)鍵詞:教育;數(shù)據(jù)挖掘;學(xué)習(xí)效果;行為
一、引言
在過去幾年中,來自各種學(xué)科(包括計算機科學(xué)、統(tǒng)計、數(shù)據(jù)挖掘和教育)的研究人員開始研究數(shù)據(jù)挖掘如何改善教育和促進教育研究。教育數(shù)據(jù)挖掘被公認為新興學(xué)科。教育數(shù)據(jù)挖掘 專注于開發(fā)方法來探索來自教育環(huán)境中的獨特數(shù)據(jù)類型。這些數(shù)據(jù)來自多個來源,包括來自傳統(tǒng)的面對面課堂環(huán)境、教育軟件、在線課件以及總結(jié)/高風(fēng)險測試的數(shù)據(jù)。這些來源越來越多地提供大量數(shù)據(jù),這些數(shù)據(jù)可以進行分析,以便輕松解決以前不可行的問題,涉及學(xué)生群體之間的差異,或涉及不常見的學(xué)生行為。教育數(shù)據(jù)挖掘以多種方式為教育和教育研究做出貢獻。教育數(shù)據(jù)挖掘的貢獻影響了對教學(xué)和學(xué)習(xí)的思考,促進了教育軟件的改進,提高了軟件個性化學(xué)生學(xué)習(xí)體驗的能力。隨著教育數(shù)據(jù)挖掘作為一個研究領(lǐng)域的成熟,出現(xiàn)了一系列教育數(shù)據(jù)挖掘國際會議,教育數(shù)據(jù)挖掘雜志,一些高度被引用的論文,這都說明教育數(shù)據(jù)挖掘越來越受到教育界的關(guān)注。
二、教育數(shù)據(jù)挖掘研究內(nèi)容
教育數(shù)據(jù)挖掘只要研究內(nèi)容包括:與課程管理員和教育工作者溝通;維護和改進課程;生成推薦;預(yù)測學(xué)生的成績和學(xué)習(xí)成果;學(xué)生建模;域結(jié)構(gòu)分析等。
①.與課程管理員和教育工作者溝通。目的是幫助課程管理員和教育工作者分析學(xué)生的活動和課程的使用信息。此類目標最常用的技術(shù)是通過統(tǒng)計分析和可視化或報告進行探索性數(shù)據(jù)分析,以及過程挖掘。
②.維護和改進課程。目的是幫助課程管理者和教育工作者確定(尤其是使用有關(guān)學(xué)生使用和學(xué)習(xí)的信息)如何改進課程(內(nèi)容,活動,鏈接等)。用于此類目標的最常用技術(shù)是關(guān)聯(lián),聚類和分類。
③.生成推薦。目的是向?qū)W生推薦當(dāng)前最適合他們的內(nèi)容(或任務(wù)或鏈接)。用于此類目標的最常用技術(shù)是關(guān)聯(lián),排序,分類和聚類。
④ .預(yù)測學(xué)生的成績和學(xué)習(xí)成果。目的是根據(jù)課程活動中的數(shù)據(jù)預(yù)測學(xué)生的最終成績或其他類型的學(xué)習(xí)成果(例如保留學(xué)位課程或?qū)淼膶W(xué)習(xí)能力)。用于此類目標的最常用技術(shù)是分類,聚類和關(guān)聯(lián)。
⑤.學(xué)生建模。教育領(lǐng)域的用戶建模具有許多應(yīng)用程序,包括學(xué)生狀態(tài)和特征(如滿意度、動機、學(xué)習(xí)進度或某些類型的問題)的檢測(通常實時),這些特征會產(chǎn)生負面影響影響他們的學(xué)習(xí)結(jié)果(制造太多錯誤、誤用或過度使用幫助、玩弄系統(tǒng)、低效地探索學(xué)習(xí)資源等)、影響、學(xué)習(xí)風(fēng)格和偏好。這里的共同目標是從使用信息創(chuàng)建學(xué)生模型。這種類型的目標經(jīng)常使用的技術(shù)不僅是聚類、分類和關(guān)聯(lián)分析,還有統(tǒng)計分析、貝葉斯網(wǎng)絡(luò)(包括貝葉斯知識追蹤)、心理測量模型和強化學(xué)習(xí)
⑥.域結(jié)構(gòu)分析。目的是使用預(yù)測學(xué)生表現(xiàn)的能力來確定領(lǐng)域結(jié)構(gòu),以衡量領(lǐng)域結(jié)構(gòu)模型的質(zhì)量。為此目的,可以利用測試或?qū)W習(xí)環(huán)境中的性能。用于此類目標的最常用技術(shù)是關(guān)聯(lián)規(guī)則,聚類方法和空間搜索算法。
三、教育數(shù)據(jù)挖掘研究途徑
第一個途徑是開發(fā)計算工具和技術(shù),確定哪些工具和技術(shù)最適合使用大型教育數(shù)據(jù)集,并查找評估指標和模型擬合的最佳做法。此類工作的示例包括嘗試不同的可視化技術(shù),以了解如何查看和理解數(shù)據(jù)。由于教育數(shù)據(jù)集通常是縱向的,包括幾個月,有時包括幾年,并且在此期間可能會與學(xué)生進行豐富的交互,因此需要一些理解數(shù)據(jù)的方法。
第二個途徑是確定我們應(yīng)該問什么問題。有幾個明顯的候選者:全班是否對材料了解得足夠好,可以繼續(xù)下去?是否有學(xué)生需要補習(xí)指導(dǎo)?哪些學(xué)生可能需要學(xué)術(shù)輔導(dǎo)才能順利完成學(xué)業(yè)?這些問題是幾千年來教師們提出和回答的。教育數(shù)據(jù)挖掘 當(dāng)然使我們能夠以數(shù)據(jù)為導(dǎo)向,更準確地回答此類問題;然而,教育數(shù)據(jù)挖掘的潛力要大得多。
教育數(shù)據(jù)挖掘的第三個途徑是發(fā)現(xiàn)誰是教育利益相關(guān)者,他們可以受益于教育數(shù)據(jù)挖掘可能帶來的更豐富的報告。顯而易見的有意者是"天地"和"教師"。然而,學(xué)生的父母呢?他們收到報告有意義嗎?除了成績單和家長-教師會議外,很少與家長溝通孩子的表現(xiàn)。大多數(shù)家長都太忙了,無法詳細報告孩子的上學(xué)情況,但有些蒸餾的信息呢?如果孩子沒有完成當(dāng)天到期的家庭作業(yè),通知家長的系統(tǒng)可能是有益的。同樣,如果學(xué)生的成績明顯下降,這種變化可以通過教育數(shù)據(jù)挖掘檢測出來,家長可以被告知。
其他利益相關(guān)者包括校長,他們可以被告知教師相對于同齡人處境艱難,以及學(xué)校表現(xiàn)不佳的領(lǐng)域。最后,還有學(xué)生自己。
四、結(jié)論
可以將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育系統(tǒng)以改善學(xué)習(xí)效果,這可以看作是一種形成性的評估技術(shù)。形成性評估是對仍在開發(fā)中的教育計劃的評估,目的是不斷改進該計劃。檢查學(xué)生如何學(xué)習(xí),用數(shù)據(jù)挖掘?qū)W(xué)生行為進行分析,是一種以形成性方式評估教學(xué)設(shè)計的方法,并且可以幫助教師改進教學(xué)材料。數(shù)據(jù)挖掘技術(shù)可用于收集信息,這些信息可用于幫助教育設(shè)計人員,在設(shè)計或修改教學(xué)方法時,將這些信息做為改進教學(xué)方法的基礎(chǔ)。
參考文獻
[1]Fernandes,Eduardo,Holanda,Maristela,Victorino,Marcio,等.Educational data mining:Predictive analysis of academic performance of public school students in the capital of Brazil[J].Journal of Business Research,2019,94.
[2]Keshav Singh Rawat,I.V.Malhan.A Hybrid Classification Method Based on Machine Learning Classifiers to Predict Performance in Educational Data Mining:ICCCN 2018,NITTTR Chandigarh,India[M]// Proceedings of 2nd International Conference on Communication,Computing and Networking.2019.
基金項目:蚌埠學(xué)院2018年度高層次人才科研啟動經(jīng)費項目(BBXY2018KYQD07)。2019年蚌埠學(xué)院質(zhì)量工程項目一般項目(2019JYXML9,2019JYXML14)。2019年安徽省教育廳教育教學(xué)研究一般項目(2019jyxm0474)