王小偉
[摘? ? 要] “互聯(lián)網(wǎng)+”給教育領(lǐng)域帶來的不僅有海量的開放性學(xué)習(xí)資源,在促進(jìn)傳統(tǒng)課堂和在線教育的深度融合過程中,還產(chǎn)生了大量的行為數(shù)據(jù)。如何全面采集教與學(xué)全過程數(shù)據(jù),并對這些數(shù)據(jù)進(jìn)行挖掘分析,實現(xiàn)教育決策的科學(xué)化是個值得深入研究的課題。本研究從功能需求出發(fā),通過分析教育大數(shù)據(jù)平臺的使用場景,設(shè)計構(gòu)建了教育大數(shù)據(jù)平臺的基本架構(gòu),并對平臺建設(shè)過程中的關(guān)鍵問題進(jìn)行了闡述,以期為后續(xù)教育大數(shù)據(jù)平臺的具體實現(xiàn)奠定基礎(chǔ)。
[關(guān)鍵詞] 互聯(lián)網(wǎng)+;教育大數(shù)據(jù);深度融合;信息化
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 21. 079
[中圖分類號] G710? ? [文獻(xiàn)標(biāo)識碼]? A? ? ? [文章編號]? 1673 - 0194(2019)21- 0198- 02
1? ? ? 引? ? 言
高校的信息化建設(shè)起步較早,通過各類信息系統(tǒng)的使用,給工作帶來了巨大的便利,在使用過程中積累了大量的數(shù)據(jù)資源[1]。隨著學(xué)校信息化應(yīng)用程度的不斷提高,數(shù)據(jù)量越來越大,數(shù)據(jù)種類也越來越多,不僅包括結(jié)構(gòu)化數(shù)據(jù),還包括大量半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)。在數(shù)字校園1.0時代,雖然完成了基本的數(shù)據(jù)同步和交換,但是大多數(shù)交換僅限于基礎(chǔ)數(shù)據(jù),大量的業(yè)務(wù)數(shù)據(jù)依然塵封在各個業(yè)務(wù)系統(tǒng),沒有發(fā)揮數(shù)據(jù)之間的關(guān)聯(lián)作用,依然存在著信息孤島[2]。
“互聯(lián)網(wǎng)+”概念的提出,給各行各業(yè)都帶來了巨大的變革。“互聯(lián)網(wǎng)+”即“互聯(lián)網(wǎng)+各個傳統(tǒng)行業(yè)”,但它不只是簡單的兩者相加,而是將信息技術(shù)與傳統(tǒng)行業(yè)進(jìn)行深度融合,創(chuàng)造新的發(fā)展生態(tài)。對于教育領(lǐng)域[3]來說,互聯(lián)網(wǎng)帶來的不只是海量的開放性學(xué)習(xí)資源,還有傳統(tǒng)課堂教學(xué)與學(xué)習(xí)方式的變革。近幾年,隨著網(wǎng)絡(luò)學(xué)習(xí)空間、MOOC、微課等的大量應(yīng)用,不僅顛覆了傳統(tǒng)的授課模式,而且促進(jìn)了傳統(tǒng)課堂和在線教育的深度融合[4],在此過程中,產(chǎn)生了大量的行為數(shù)據(jù)。面對這些海量的數(shù)據(jù),如何全面采集教與學(xué)全過程數(shù)據(jù),并對這些數(shù)據(jù)進(jìn)行挖掘分析,以此來真正促進(jìn)學(xué)生的個性化學(xué)習(xí), 實現(xiàn)教育決策的科學(xué)化[5]是個值得深入研究的課題。
本研究對教育大數(shù)據(jù)平臺的架構(gòu)及其關(guān)鍵技術(shù)進(jìn)行研究,希望能為后期建設(shè)提供參考。
2? ? ? 教育大數(shù)據(jù)平臺的構(gòu)建
2.1? ?功能需求
教育大數(shù)據(jù)平臺的核心功能是從各個相關(guān)業(yè)務(wù)系統(tǒng)進(jìn)行數(shù)據(jù)采集,通過整合、分析,深入挖掘數(shù)據(jù)之間的關(guān)系,進(jìn)而為各類決策提供數(shù)據(jù)支撐。基本功能需求:
(1)全量數(shù)據(jù)交換中心,應(yīng)具備從各個業(yè)務(wù)系統(tǒng)采集各類結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的能力,提供各種標(biāo)準(zhǔn)化數(shù)據(jù)接口,以滿足不同數(shù)據(jù)源的采集需求。
(2)中心數(shù)據(jù)庫,應(yīng)具備針對海量數(shù)據(jù)的高效計算能力,因此高可用、低成本、高容錯、可擴(kuò)展的分布式存儲是必要的。
(3)應(yīng)用中心:采集數(shù)據(jù)的最終目的是為了應(yīng)用,這是我們的終極目標(biāo),因此應(yīng)提供各類跨系統(tǒng)跨部門的查詢、統(tǒng)計功能;提供面向教育領(lǐng)域的分析挖掘模型及其相應(yīng)的算法,提供各類交叉數(shù)據(jù)挖掘功能,使得數(shù)據(jù)挖掘信息更全面,結(jié)果更可靠。
(4)用戶中心:面向各類人群,提供各類服務(wù)。
2.2? ?教育大數(shù)據(jù)平臺的使用場景
學(xué)生用戶:通過采集學(xué)生的學(xué)習(xí)、生活等行為數(shù)據(jù),進(jìn)行數(shù)據(jù)分析和挖掘,可以對學(xué)生做出學(xué)習(xí)效果評估、學(xué)習(xí)成績預(yù)警、心理健康預(yù)警、就業(yè)前景預(yù)測等,進(jìn)而為學(xué)生提供個性化學(xué)習(xí)路線建議,找到最適合學(xué)生的學(xué)習(xí)方式。
教師用戶:通過采集教育環(huán)境數(shù)據(jù),一方面可以對教師的教學(xué)行為進(jìn)行診斷,方便教師適時調(diào)整教學(xué)模式、教學(xué)計劃進(jìn)度等。另一方面可為任課老師或管理老師提供精確的學(xué)生畫像,讓教師能準(zhǔn)確掌握每個學(xué)生的學(xué)習(xí)和生活情況,進(jìn)而為學(xué)生提供個性化管理和授課,適時地進(jìn)行人工干預(yù),實現(xiàn)真正的因材施教。
教學(xué)管理者:通過大數(shù)據(jù)技術(shù)在教學(xué)過程中可以更加準(zhǔn)確地分析評價課堂教學(xué)的質(zhì)量和效果。以往對課堂、教師的評價體系是定性和模糊的,無法做定量的判斷,大數(shù)據(jù)平臺下,可以通過采集各類教學(xué)過程數(shù)據(jù),高效地獲得教學(xué)的真實情況,從而得到真實的教學(xué)評價。
行政管理者:通過將教育環(huán)境中的數(shù)據(jù)利用起來,從中挖掘出潛在的有價值信息,為各類管理決策提供有效依據(jù),從而使得高校的管理更加具有目的性和高效性。
3? ? ? 架構(gòu)設(shè)計
結(jié)合前面的功能需求,設(shè)計了教育大數(shù)據(jù)平臺的基本架構(gòu),如圖1所示:
數(shù)據(jù)源:包括現(xiàn)有正在運行的各個業(yè)務(wù)系統(tǒng)數(shù)據(jù)(含結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù))。
數(shù)據(jù)交換中心:主要負(fù)責(zé)采集各個業(yè)務(wù)系統(tǒng)數(shù)據(jù),通過數(shù)據(jù)清洗、轉(zhuǎn)換、整合,形成規(guī)范的標(biāo)準(zhǔn)化數(shù)據(jù),進(jìn)入中心數(shù)據(jù)庫;同時當(dāng)數(shù)據(jù)源數(shù)據(jù)發(fā)生變化時,負(fù)責(zé)同步數(shù)據(jù)到相應(yīng)業(yè)務(wù)系統(tǒng)。
中心數(shù)據(jù)庫:承載著非常重要的功能,數(shù)據(jù)的準(zhǔn)確性、規(guī)范性非常重要。因此各業(yè)務(wù)數(shù)據(jù)在進(jìn)入中心數(shù)據(jù)庫之前一定要進(jìn)行清洗、比對、過濾,形成比較準(zhǔn)確全面的數(shù)據(jù),才有可能提供給業(yè)務(wù)系統(tǒng)共享并支持下一步的大數(shù)據(jù)分析等應(yīng)用。
應(yīng)用層:基于中心數(shù)據(jù)庫,對各類數(shù)據(jù)進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)挖掘,并進(jìn)行可視化展示,為各類人群提供各類服務(wù)。
4? ? ? 教育大數(shù)據(jù)平臺建設(shè)過程中的關(guān)鍵問題
教育大數(shù)據(jù)平臺能夠提供海量數(shù)據(jù)的高效計算,能夠為學(xué)校管理者提供有價值的數(shù)據(jù)支撐和價值挖掘。但在實際建設(shè)過程中,往往存在著數(shù)據(jù)類型多樣、數(shù)據(jù)來源眾多、數(shù)據(jù)質(zhì)量低下等問題。因此,在構(gòu)建教育大數(shù)據(jù)平臺之前,需要進(jìn)行大量的數(shù)據(jù)準(zhǔn)備工作。
(1)建立數(shù)據(jù)標(biāo)準(zhǔn):參照國家的信息管理規(guī)范,與各業(yè)務(wù)部門共同研究制定校級數(shù)據(jù)標(biāo)準(zhǔn);在集成過程中,輔助各種業(yè)務(wù)檢驗規(guī)則進(jìn)行驗證,根據(jù)結(jié)果反饋并修改數(shù)據(jù)規(guī)則及質(zhì)量問題,逐步提升數(shù)據(jù)質(zhì)量;同時,總結(jié)和形成數(shù)據(jù)集成流程標(biāo)準(zhǔn)、轉(zhuǎn)換規(guī)則標(biāo)準(zhǔn)、流程變更標(biāo)準(zhǔn)等數(shù)據(jù)管理標(biāo)準(zhǔn),制定數(shù)據(jù)使用和管理等相關(guān)規(guī)章制度。
(2)數(shù)據(jù)采集:是教育大數(shù)據(jù)平臺建設(shè)過程中的重點和難點。只有保證數(shù)據(jù)的準(zhǔn)確性、及時性和有效性,才能最大程度地發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)來源通常有兩種方式:自動獲取、手工導(dǎo)入。通過與現(xiàn)有業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫對接可實現(xiàn)數(shù)據(jù)的自動獲取,手工導(dǎo)入由數(shù)據(jù)提供部門進(jìn)行手工導(dǎo)入,可能存在時效性問題。在實際集成過程中,應(yīng)盡可能準(zhǔn)確地確定數(shù)據(jù)的源頭,盡可能自動獲取數(shù)據(jù),以保證數(shù)據(jù)采集的時效性和準(zhǔn)確性。
(3)數(shù)據(jù)交換中心:主要是對收集到的數(shù)據(jù)進(jìn)行存儲、清洗、過濾,將數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)化數(shù)據(jù)。不同類型的數(shù)據(jù)可以通過多種方法采集到,而這些數(shù)據(jù)想要用于數(shù)據(jù)挖掘,必須要經(jīng)過數(shù)據(jù)處理,因為采集到的數(shù)據(jù)往往是不完善的,可能存在各種各樣的問題,必須通過技術(shù)手段來處理這些采集到的原始數(shù)據(jù),即通過數(shù)據(jù)清洗、數(shù)據(jù)變換、數(shù)據(jù)提取這一過程來處理原始數(shù)據(jù)。
(4)應(yīng)用中心:主要是基于中心數(shù)據(jù)庫,對數(shù)據(jù)進(jìn)行深度挖掘,并通過可視化方式進(jìn)行展示,從而為各類人群提供各類服務(wù)。因此該部分的重點是各類數(shù)據(jù)模型的建立,使得針對教育領(lǐng)域的數(shù)據(jù)挖掘更豐富、更可靠。
(5)計算能力:由于要進(jìn)行大量的運算,因此需要分布式計算框架,并且要有很好的擴(kuò)展性、容錯能力和高效可靠的輸入輸出,以滿足大數(shù)據(jù)處理的需求。
5? ? ? 結(jié)? ? 語
教育大數(shù)據(jù)平臺最核心的應(yīng)用就是對數(shù)據(jù)的分析,其目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的規(guī)律,挖掘數(shù)據(jù)中隱藏的信息,從而輔助制定決策。因此,全樣本分析是大數(shù)據(jù)分析的關(guān)鍵,我們需要盡可能多而且全面地收集學(xué)生、教師、管理機(jī)構(gòu)的相關(guān)信息,才能為我們進(jìn)一步的分析提供數(shù)據(jù)支撐。
本研究從功能需求出發(fā),通過分析教育大數(shù)據(jù)平臺的使用場景,設(shè)計構(gòu)建了教育大數(shù)據(jù)平臺的基本架構(gòu),并對平臺建設(shè)過程中的關(guān)鍵問題進(jìn)行了闡述,為后續(xù)教育大數(shù)據(jù)平臺的具體實現(xiàn)奠定基礎(chǔ)。
主要參考文獻(xiàn)
[1]李建.大數(shù)據(jù)時代高校數(shù)據(jù)中心的建設(shè)構(gòu)想[J].信息通信,2018(1):197-198.
[2]束乾倩,涂慶華,崔聰.教育信息化2.0視域下的大數(shù)據(jù)分析平臺建設(shè)思路[J].教育現(xiàn)代化,2018,5(41):314-315.
[3]李振,周東岱,劉娜,等.教育大數(shù)據(jù)的平臺構(gòu)建與關(guān)鍵實現(xiàn)技術(shù)[J].現(xiàn)代教育技術(shù),2018,28(1):100-106.
[4]李書欽.面向智慧決策的高校大數(shù)據(jù)平臺的設(shè)計與實現(xiàn)[C]//中國計算機(jī)用戶協(xié)會網(wǎng)絡(luò)應(yīng)用分會2018年第二十二屆網(wǎng)絡(luò)新技術(shù)與應(yīng)用年會論文集,2018:4.
[5]楊競堯.面向教育的大數(shù)據(jù)平臺設(shè)計[J].中國戰(zhàn)略新興產(chǎn)業(yè),2017(44):19-20.
[6]唐燕,劉仁權(quán),王蘋.基于Hadoop的高校大數(shù)據(jù)平臺的設(shè)計與實現(xiàn)[J].信息技術(shù),2017(12):105-109.
[7]龍虎,李娜.大數(shù)據(jù)分析處理與平臺架構(gòu)技術(shù)研究[J].電腦編程技巧與維護(hù),2019(3):88-90.