李俊
摘要:本文分析了大數(shù)據(jù)技術(shù)在教育領(lǐng)域的應(yīng)用方向,認(rèn)為大數(shù)據(jù)對(duì)改善課程教學(xué)質(zhì)量、提高遠(yuǎn)程教育效率、實(shí)施個(gè)性化教學(xué),以及提高教育資源配置和教育決策的科學(xué)性都具有重大意義。從技術(shù)實(shí)施角度探討了教育大數(shù)據(jù)應(yīng)用的關(guān)鍵技術(shù)和所面臨的挑戰(zhàn),包括數(shù)據(jù)存儲(chǔ)、索引、數(shù)據(jù)分析、可視化、使用者、隱私和道德問題等。
關(guān)鍵詞:大數(shù)據(jù);教育;關(guān)鍵技術(shù)
中圖分類號(hào):G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2018)15-0062-02
當(dāng)今社會(huì),各行業(yè)都面臨著數(shù)據(jù)爆發(fā)式地增長(zhǎng),大數(shù)據(jù)分析和決策在各行業(yè)的應(yīng)用價(jià)值凸顯。其中,教育大數(shù)據(jù)應(yīng)用被認(rèn)為是大有作為。將大數(shù)據(jù)分析應(yīng)用到教育領(lǐng)域,可以發(fā)揮大數(shù)據(jù)的巨大魔力,顯著提升教育信息化水平。
一、教育大數(shù)據(jù)應(yīng)用備受關(guān)注
美國(guó)教育部于2012年發(fā)表研究報(bào)告,介紹了大數(shù)據(jù)應(yīng)用于教育領(lǐng)域的典型案例和所面臨的挑戰(zhàn)。美國(guó)微軟公司前首席執(zhí)行官比爾·蓋茨認(rèn)為通過對(duì)教育大數(shù)據(jù)進(jìn)行分析,可以幫助提高學(xué)生的學(xué)習(xí)成績(jī),顯著提升學(xué)校的教育質(zhì)量。他曾說,教育未來發(fā)展的關(guān)鍵在于數(shù)據(jù),教育數(shù)據(jù)的應(yīng)用前景廣闊[1]。
國(guó)內(nèi)對(duì)教育大數(shù)據(jù)的研究始于2012年。利用大數(shù)據(jù)技術(shù)來促進(jìn)教育改革和創(chuàng)新發(fā)展成為研究熱點(diǎn)。目前,教育大數(shù)據(jù)的應(yīng)用研究已列入我國(guó)教育信息化的工作程序。中央電化教育館王曉蕪副館長(zhǎng)認(rèn)為,教育正在走向大數(shù)據(jù)時(shí)代,誰能夠發(fā)現(xiàn)數(shù)據(jù),誰就能夠贏得未來的生存;誰能夠挖掘數(shù)據(jù),誰就能夠贏得未來的發(fā)展;誰能夠利用數(shù)據(jù),并利用數(shù)據(jù)提供個(gè)性化的服務(wù),誰就能夠贏得未來的競(jìng)爭(zhēng)[2]。
二、大數(shù)據(jù)在教育中應(yīng)用的方向
在教育領(lǐng)域,數(shù)據(jù)成為評(píng)價(jià)教學(xué)水平的顯著指標(biāo)。這些數(shù)據(jù)既包括學(xué)校的入學(xué)率、出勤率、輟學(xué)率、學(xué)生的升學(xué)率等宏觀數(shù)據(jù),也包括課程作業(yè)的正確率,學(xué)生課堂上參與回答問題的次數(shù)、時(shí)長(zhǎng)與正確率等,還可細(xì)化到每個(gè)學(xué)生回答一個(gè)問題所用的時(shí)間是多長(zhǎng)、整體回答的正確率是多少等微觀數(shù)據(jù)[3]。據(jù)荷蘭科研人員統(tǒng)計(jì),一名學(xué)生在一節(jié)45分鐘的課堂中所產(chǎn)生的全息數(shù)據(jù)高達(dá)5—6GB,這些數(shù)據(jù)中的1%可進(jìn)行歸類和量化分析。運(yùn)用云計(jì)算等技術(shù),使用專門軟件對(duì)這些數(shù)據(jù)進(jìn)行分類、整理、統(tǒng)計(jì)、分析,可以從中發(fā)掘出大量有價(jià)值的信息。
除了利用數(shù)據(jù)改善傳統(tǒng)的課堂教學(xué),大數(shù)據(jù)在在線教育領(lǐng)域也大有作為。通過分析學(xué)習(xí)者本身的數(shù)據(jù),對(duì)其進(jìn)行實(shí)時(shí)測(cè)試和評(píng)估,可以掌握學(xué)習(xí)者某個(gè)時(shí)間點(diǎn)的能力值,據(jù)此向其推薦與其能力匹配的學(xué)習(xí)資料,這樣可實(shí)現(xiàn)重難點(diǎn)突出,提高學(xué)習(xí)效率[4]。
此外,我國(guó)教育政策長(zhǎng)期以來采取自上而下進(jìn)行制定和執(zhí)行的辦法,隨著經(jīng)濟(jì)社會(huì)的快速發(fā)展,因教育資源未能完全滿足社會(huì)的期望而產(chǎn)生了一系列矛盾。事實(shí)上,精確描述現(xiàn)狀和未來趨勢(shì)的數(shù)據(jù)可以為教育管理的各環(huán)節(jié)提供決策支持。如小學(xué)學(xué)區(qū)的規(guī)劃和調(diào)整應(yīng)該以對(duì)人口數(shù)量和結(jié)構(gòu)、師生比、交通狀況、城市規(guī)劃等數(shù)據(jù)的分析作為基礎(chǔ)。傳統(tǒng)的樣本調(diào)研等方法無法做到全面和科學(xué),靠以往的經(jīng)驗(yàn)進(jìn)行管理和決策無法適應(yīng)社會(huì)快速發(fā)展的需求。以大數(shù)據(jù)、云計(jì)算作為支撐的新技術(shù)可以對(duì)復(fù)雜情況進(jìn)行梳理和預(yù)判,從而有效預(yù)測(cè)未來事件的發(fā)展趨勢(shì)。隨著技術(shù)不斷進(jìn)步、預(yù)測(cè)模型不斷優(yōu)化以及分析系統(tǒng)的進(jìn)一步改進(jìn),小學(xué)招生生源情況、師資培訓(xùn)需求、跨區(qū)域教育資源調(diào)配等都可以實(shí)現(xiàn)提前判斷[5]。
可以肯定地說,大數(shù)據(jù)分析在教育領(lǐng)域應(yīng)用,對(duì)改善課程教學(xué)質(zhì)量、提高遠(yuǎn)程教育效率、實(shí)施個(gè)性化教學(xué),以及提高教育資源配置和教育決策的科學(xué)性都具有重大意義。
三、教育大數(shù)據(jù)應(yīng)用的關(guān)鍵技術(shù)和面臨的挑戰(zhàn)
1.大數(shù)據(jù)存儲(chǔ)問題。與傳統(tǒng)關(guān)系型數(shù)據(jù)結(jié)構(gòu)規(guī)整的特點(diǎn)不同,大數(shù)據(jù)中包含大量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),對(duì)這些數(shù)據(jù)如何進(jìn)行有效存儲(chǔ)是人們首先要面對(duì)和解決的問題。使用商用化已十分成熟的關(guān)系型數(shù)據(jù)庫(kù)無法完成實(shí)現(xiàn)對(duì)大數(shù)據(jù)的存儲(chǔ),同時(shí),關(guān)系數(shù)據(jù)庫(kù)在可擴(kuò)展性和容錯(cuò)性方面也無法滿足大數(shù)據(jù)應(yīng)用的需求。目前谷歌、亞馬遜、雅虎等公司紛紛推出針對(duì)大數(shù)據(jù)存儲(chǔ)的解決方案,它們大多采用了新型的數(shù)據(jù)庫(kù)結(jié)構(gòu),這類方案統(tǒng)稱為NoSQL。NoSQL的特點(diǎn)是可擴(kuò)展性強(qiáng),數(shù)據(jù)模型具有靈活性,系統(tǒng)可用性強(qiáng)。NoSQL在擴(kuò)展性和容錯(cuò)性方面的性能優(yōu)于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)。然而,目前關(guān)系數(shù)據(jù)庫(kù)還處于全盛時(shí)期,市場(chǎng)占有率高,NoSQL不可能在短期內(nèi)完全取代關(guān)系數(shù)據(jù)庫(kù)。目前的研究熱點(diǎn)是將關(guān)系數(shù)據(jù)庫(kù)和NoSQL方案進(jìn)行融合,形成一種新的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)。
2.大數(shù)據(jù)索引問題。索引在關(guān)系型數(shù)據(jù)庫(kù)中的應(yīng)用極大地提高了查詢效率。傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)索引的缺點(diǎn)在于,建立和更新索引要占用一定的系統(tǒng)開銷,并且特定的索引方案只適用于特定的場(chǎng)景。大數(shù)據(jù)查詢對(duì)實(shí)時(shí)性和高可用性要求比較高,如何對(duì)大數(shù)據(jù)構(gòu)建有效的索引值得研究。谷歌公司提出一種增量式的索引更新器,索引更新效率極大地得以提升。另一種可行的方案是,采用多維索引來加速查詢速度。目前相關(guān)的技術(shù)還處于研究和實(shí)踐階段,尚不成熟。
3.大數(shù)據(jù)分析問題。大數(shù)據(jù)分析技術(shù)從龐雜的數(shù)據(jù)中梳理出彼此的關(guān)聯(lián),高效的數(shù)據(jù)分析方案是大數(shù)據(jù)應(yīng)用的核心所在。面對(duì)規(guī)模巨大、更新速度飛快的數(shù)據(jù),如何提高分析效率成為關(guān)鍵。谷歌提出了MapReduce技術(shù),該技術(shù)采取對(duì)原始數(shù)據(jù)進(jìn)行分塊,并分別分配給不同的Map任務(wù)區(qū)進(jìn)行處理的方案。MapReduce解決了實(shí)時(shí)處理較大規(guī)模數(shù)據(jù)的問題,但系統(tǒng)開銷較大,影響了數(shù)據(jù)分析效率。人們已在研究如何對(duì)MapReduce模型進(jìn)行改進(jìn),實(shí)現(xiàn)流處理,以提高系統(tǒng)對(duì)實(shí)時(shí)大規(guī)模數(shù)據(jù)的處理能力。
4.大數(shù)據(jù)可視化問題。最終用戶無法對(duì)大數(shù)據(jù)的采集、處理和分析所得到的結(jié)果進(jìn)行直接識(shí)別,數(shù)據(jù)可視化的工作顯得尤為重要。數(shù)據(jù)可視化是對(duì)大數(shù)據(jù)分析結(jié)果進(jìn)行直觀地顯示,從而幫助用戶發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的模式和數(shù)據(jù)之間的關(guān)系。數(shù)據(jù)可視化可以為最終決策提供有效支持。目前,大數(shù)據(jù)可視化研究的重點(diǎn)在于優(yōu)化數(shù)據(jù)可視化流程、提高展示效果的豐富性等方面。
5.數(shù)據(jù)使用者問題。技術(shù)研發(fā)可以解決教育大數(shù)據(jù)應(yīng)用中存在的技術(shù)問題,而教育大數(shù)據(jù)分析的結(jié)果是否能夠有效應(yīng)用最終還是取決于人。由于教育管理部門和學(xué)校的組織體制不同、不同學(xué)校和教師之間對(duì)于教育大數(shù)據(jù)的理解程度不同,從而增加了研究人員和應(yīng)用程序開發(fā)人員工作的困難程度,影響了教育大數(shù)據(jù)應(yīng)用的鋪開。數(shù)據(jù)使用者的態(tài)度決定了大數(shù)據(jù)應(yīng)用的效果[6]。如果數(shù)據(jù)使用者能積極幫助應(yīng)用開發(fā)者準(zhǔn)確定位需要解決的問題,確定需要采集的數(shù)據(jù)類型,確定有效的可視化數(shù)據(jù)呈現(xiàn)方式,將使大數(shù)據(jù)的應(yīng)用事半功倍。
6.隱私和倫理道德問題。隱私和倫理道德限制問題在教育大數(shù)據(jù)應(yīng)用中也必須客觀地面對(duì)。在第三方機(jī)構(gòu)分析和處理學(xué)生的個(gè)人學(xué)習(xí)記錄等數(shù)據(jù)時(shí)應(yīng)注意隱私保護(hù)等問題,應(yīng)注意規(guī)避相應(yīng)的政策和法規(guī)。另外,根據(jù)大數(shù)據(jù)分析得出的預(yù)測(cè)結(jié)論將會(huì)增加學(xué)生活動(dòng)的透明性,從而帶來一系列倫理道德問題,這些都值得研究和重視。
四、結(jié)論
大數(shù)據(jù)給各行各業(yè)的發(fā)展模式和決策帶來巨大的變革與挑戰(zhàn),教育行業(yè)無法回避。不對(duì)數(shù)據(jù)進(jìn)行有效留存和深度挖掘,教育信息化終將浮于表面。目前,人們對(duì)大數(shù)據(jù)在教育領(lǐng)域已取得了一定的認(rèn)識(shí),但研究和實(shí)踐還不夠深入,要真正將大數(shù)據(jù)技術(shù)高效地應(yīng)用于教育實(shí)踐,仍然任重道遠(yuǎn),這需要教育工作者和信息技術(shù)工作者共同努力。
參考文獻(xiàn):
[1]徐鵬,王以寧,劉艷華,張海.大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國(guó)通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)報(bào)告解讀及啟示[J].遠(yuǎn)程教育雜志,2013,(6).
[2]王曉波.大數(shù)據(jù)促進(jìn)教育變革與創(chuàng)新——專訪中央電化教育館王曉蕪副館長(zhǎng)[J].中小學(xué)信息技術(shù)教育,2013,(10).
[3]何蘊(yùn)毅.大數(shù)據(jù)背景下教育變革的思考與實(shí)踐[J].教育信息技術(shù),2014,(12).
[4]趙姝淳,孫曙輝.大數(shù)據(jù)技術(shù)及其在教育領(lǐng)域的應(yīng)用[J].中小學(xué)信息技術(shù)教育,2014,(3).
[5]柯清超.大數(shù)據(jù)與智慧教育[J].中國(guó)教育信息化,2013,(9).
[6]張羽,李越.基于MOOCs大數(shù)據(jù)的學(xué)習(xí)分析和教育測(cè)量介紹[J].清華大學(xué)教育研究,2013,(4).