□李 燕 陳 偉 張淑林
[中國(guó)科學(xué)技術(shù)大學(xué) 合肥 230026]
“大數(shù)據(jù)”(Big Data)是近年來的一個(gè)熱點(diǎn)名詞,隨著互聯(lián)網(wǎng)、云計(jì)算、移動(dòng)設(shè)備和物聯(lián)網(wǎng)的迅猛發(fā)展,大數(shù)據(jù)技術(shù)已然運(yùn)用到很多行業(yè)和領(lǐng)域,其價(jià)值不言而喻,前景愈發(fā)光明。2015年我國(guó)發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,對(duì)10個(gè)大數(shù)據(jù)工程進(jìn)行了規(guī)劃,并在“公共服務(wù)大數(shù)據(jù)工程”中明確提出要建設(shè)教育文化大數(shù)據(jù)。高等教育是一個(gè)國(guó)家教育水平的集中體現(xiàn),在高等教育領(lǐng)域應(yīng)用大數(shù)據(jù)技術(shù)無疑具有重要的現(xiàn)實(shí)意義。
大數(shù)據(jù)是以容量大、類型多、存取速度快、應(yīng)用價(jià)值高為主要特征的數(shù)據(jù)集合[1]。它是數(shù)據(jù)對(duì)象、技術(shù)與應(yīng)用三者的統(tǒng)一:從對(duì)象角度看,大數(shù)據(jù)是超過傳統(tǒng)數(shù)據(jù)庫系統(tǒng)采集、存儲(chǔ)、分發(fā)、管理和分析等處理能力的數(shù)據(jù)集。從技術(shù)角度看,大數(shù)據(jù)技術(shù)是從不同格式的數(shù)據(jù)中,經(jīng)過高速傳輸、海量存儲(chǔ)、快速分析到可視化展示等的技術(shù)集成。從應(yīng)用角度看,大數(shù)據(jù)是運(yùn)用大數(shù)據(jù)技術(shù),從大量數(shù)據(jù)的集合中獲得有價(jià)值信息,為人們提供決策依據(jù)的行為[2]。因此,大數(shù)據(jù)不僅是一種資源,一種技術(shù),還是一個(gè)新領(lǐng)域,一種新思維。
教育大數(shù)據(jù)是大數(shù)據(jù)的一個(gè)子集,特指教育領(lǐng)域的大數(shù)據(jù)。楊現(xiàn)民指出教育大數(shù)據(jù)是整個(gè)教育活動(dòng)過程中產(chǎn)生的以及根據(jù)教育需要采集到的,一切用于教育發(fā)展并可創(chuàng)造巨大潛在價(jià)值的數(shù)據(jù)集合[3]。相較于一般大數(shù)據(jù)的特點(diǎn),教育大數(shù)據(jù)具有:中等體量、非實(shí)時(shí)性、周期較長(zhǎng)、非結(jié)構(gòu)化、高復(fù)雜性等特性。它存在于各種教育實(shí)踐活動(dòng),既包括校園環(huán)境下的課堂活動(dòng)、學(xué)生日常管理活動(dòng)、科學(xué)研究活動(dòng)以及校園生活,也包括宿舍、餐廳、運(yùn)動(dòng)場(chǎng)、家庭等非正式環(huán)境下的學(xué)習(xí)活動(dòng)[4]。
高等教育大數(shù)據(jù)是在高等教育領(lǐng)域產(chǎn)生的管理信息、科研信息、教與學(xué)信息、服務(wù)信息、部門信息等的集合,它存在于各類教學(xué)活動(dòng)、日常工作、管理科研中,從管理信息看,包括師資信息、實(shí)驗(yàn)設(shè)備等,從科研信息看包括論文著作、課題驗(yàn)收等,從教學(xué)信息看包括課后作業(yè)、教學(xué)進(jìn)度、成績(jī)等,從服務(wù)信息看包括講座、競(jìng)賽、物業(yè)等,從部門信息看包括就業(yè)信息、圖書借閱信息、用餐消費(fèi)信息等,還包括學(xué)校師生使用互聯(lián)網(wǎng)產(chǎn)生和接收到的信息,如QQ、微信、bbs等社交信息,訪問各類文獻(xiàn)數(shù)據(jù)庫、視頻、購物網(wǎng)站的信息等。綜上,筆者將高等教育大數(shù)據(jù)定義為:存在于高等教育領(lǐng)域,能夠影響教學(xué)活動(dòng)的一切隱性數(shù)據(jù)和顯性數(shù)據(jù)的集合。它包括各類學(xué)生生源、圖書借閱、選修課程、獎(jiǎng)學(xué)金評(píng)定、就業(yè)去向、資產(chǎn)信息等顯性信息,還包括論壇發(fā)帖、參與社團(tuán)、課堂討論、網(wǎng)絡(luò)社交、位置定位等隱性信息。
從以上高等教育大數(shù)據(jù)包含的內(nèi)容可看出,高校中的教育數(shù)據(jù)存在碎片化、連續(xù)性、多維性、復(fù)雜性等特征。
碎片化反映了學(xué)生個(gè)體學(xué)習(xí)和生活的習(xí)慣,高校生源結(jié)構(gòu)多樣化,而且教學(xué)活動(dòng)等以自主學(xué)習(xí)、研究討論為主,集體學(xué)習(xí)為輔,集體行為少,伴隨其產(chǎn)生的數(shù)據(jù)都是零散的。同時(shí)在大數(shù)據(jù)時(shí)代移動(dòng)互聯(lián)網(wǎng)的發(fā)展及新媒體和多元信息的環(huán)境下,如碎片化閱讀、碎片化學(xué)習(xí)、微課、慕課等的出現(xiàn),學(xué)生在學(xué)習(xí)過程中獲取是比較零散、不系統(tǒng)、無序、互不關(guān)聯(lián)的知識(shí)碎片。碎片化學(xué)習(xí)已經(jīng)成為學(xué)生學(xué)習(xí)的一種普遍方式,隨之產(chǎn)生的就是大量的碎片化數(shù)據(jù)。
連續(xù)性則體現(xiàn)了學(xué)生學(xué)習(xí)和生活的規(guī)律,例如學(xué)生一個(gè)學(xué)期用餐情況、校園網(wǎng)絡(luò)登錄情況、圖書借閱類型、考試成績(jī)等都反映了一個(gè)學(xué)生的生活習(xí)慣與學(xué)習(xí)成績(jī)的相關(guān)性,這些都要基于長(zhǎng)期、連續(xù)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,僅靠短期數(shù)據(jù)分析不能獲得學(xué)生的整體情況,難免以偏概全。只有將連續(xù)的數(shù)據(jù)進(jìn)行系統(tǒng)的分析,才能掌握學(xué)生學(xué)習(xí)和生活規(guī)律,更好的指導(dǎo)教學(xué)。
多維性能夠表征校園活動(dòng)參與個(gè)體的完整狀態(tài)。如,對(duì)一位學(xué)生而言,學(xué)習(xí)成績(jī)、科研論文反映學(xué)習(xí)效果;借書種類、參與社團(tuán)反映興趣愛好;一卡通消費(fèi)情況反映經(jīng)濟(jì)狀況、作息規(guī)律;上網(wǎng)軌跡、論壇評(píng)論反映思想動(dòng)態(tài)、情感走向等。只有將多維度的數(shù)據(jù)進(jìn)行綜合分析,才能清晰全面地反映學(xué)生個(gè)體特征。
復(fù)雜性體現(xiàn)了校園生活和學(xué)習(xí)方式的多樣性。如成績(jī)、就業(yè)率、出勤率、資產(chǎn)等結(jié)構(gòu)化數(shù)據(jù),教學(xué)軟件、學(xué)習(xí)游戲、多媒體教學(xué)資源等非結(jié)構(gòu)化數(shù)據(jù);用戶使用網(wǎng)絡(luò)產(chǎn)生的行為數(shù)據(jù),物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)感知到的位置數(shù)據(jù)等。伴隨著教師和學(xué)生產(chǎn)生的多樣化數(shù)據(jù),蘊(yùn)含著巨大的價(jià)值,但并不是所有數(shù)據(jù)都是有用的,需要被收集的,只有將無用的數(shù)據(jù)過濾掉,全面識(shí)別、系統(tǒng)集成、高度融合各類原始數(shù)據(jù),提高數(shù)據(jù)質(zhì)量,才能挖掘有價(jià)值的信息。
鑒于大數(shù)據(jù)在交通、醫(yī)療、商業(yè)等領(lǐng)域的成功應(yīng)用,政府、高校、研究機(jī)構(gòu)、企業(yè)等逐漸開始認(rèn)識(shí)到大數(shù)據(jù)將帶來一場(chǎng)高等教育變革,于是紛紛投入大量的人力、物力、財(cái)力進(jìn)行高等教育大數(shù)據(jù)的應(yīng)用研究。
國(guó)外開展大數(shù)據(jù)應(yīng)用研究較早,關(guān)于大數(shù)據(jù)在高等教育領(lǐng)域的應(yīng)用研究相對(duì)較多,如英國(guó)的“課程精靈”系統(tǒng)(Course Smart)、加拿大的“渴望學(xué)習(xí)”(Desire2Learn)[5]、澳大利亞的SNAPP(Social Networks Adapting Ped-agogical Practice)系統(tǒng)[6]、美國(guó)的“適應(yīng)性學(xué)習(xí)(adaptive learning)”系統(tǒng)[7]等都較具有代表性。
1. 英國(guó)利用大數(shù)據(jù)的監(jiān)測(cè)功能跟蹤和分析學(xué)生的學(xué)習(xí)進(jìn)展
英國(guó)培生集團(tuán)(Pearson)與其他出版公司共同開發(fā)的“課程精靈”(Course Smart)系統(tǒng),允許教師們根據(jù)學(xué)生利用電子教科書進(jìn)行學(xué)習(xí)情況的跟蹤和分析他們的學(xué)習(xí)進(jìn)展,并向助教們顯示學(xué)生的學(xué)習(xí)參與度和學(xué)習(xí)成績(jī)等大量的數(shù)據(jù)信息,以提高學(xué)習(xí)者的學(xué)習(xí)成就。但這一系統(tǒng)尚不具備預(yù)測(cè)的功能。
2. 加拿大利用學(xué)生過去的學(xué)習(xí)成績(jī)數(shù)據(jù)預(yù)測(cè)并改善其未來學(xué)習(xí)成績(jī)
在加拿大,名為“渴望學(xué)習(xí)”(Desire 2 Learn)的教育科技公司,已經(jīng)推出面向高等教育學(xué)生的大數(shù)據(jù)服務(wù)項(xiàng)目—“學(xué)生成功系統(tǒng)”(Student Success System)。它通過監(jiān)控學(xué)生的學(xué)習(xí)過程、閱讀過程、作業(yè)過程、考試與測(cè)驗(yàn)過程等獲得所需數(shù)據(jù),經(jīng)過程序持續(xù)的、系統(tǒng)的篩選、計(jì)算、分析,形成每個(gè)學(xué)生學(xué)習(xí)情況的詳細(xì)報(bào)告。這份報(bào)告不僅包括學(xué)生的成績(jī)及作業(yè)完成情況,還包括每個(gè)題目停留的時(shí)間、閱讀的次數(shù)及時(shí)間等更為精準(zhǔn)的信息,這些信息便于老師及時(shí)找出問題所在,有針對(duì)性的給予學(xué)生指導(dǎo)或建議。同時(shí)也可以預(yù)測(cè)學(xué)生下次的考試成績(jī)。
3. 澳大利亞利用大數(shù)據(jù)技術(shù)進(jìn)行學(xué)習(xí)過程預(yù)測(cè)
澳大利亞臥龍崗大學(xué)(University of Wol-longong)研發(fā)出社會(huì)網(wǎng)絡(luò)適應(yīng)性教學(xué)實(shí)踐—SNAPP(Social Networks Adapting Ped-agogical Practice)系統(tǒng)。SNAPP本質(zhì)上作為一個(gè)診斷工具, 它將用戶交互產(chǎn)生的網(wǎng)絡(luò)論壇帖子和回復(fù)以可視化的方式呈現(xiàn)。論壇交互的可視化形式為教師提供可快速識(shí)別的用戶行為模式。教師可以直觀看到學(xué)習(xí)者的網(wǎng)絡(luò)發(fā)帖和回復(fù)內(nèi)容,通過跟蹤論壇交流內(nèi)容,深入了解學(xué)習(xí)者的行為模式,進(jìn)而調(diào)整教學(xué)方式或內(nèi)容,最大化的為學(xué)習(xí)者提供適應(yīng)的教學(xué)指導(dǎo)。
4. 美國(guó)利用適應(yīng)性學(xué)習(xí)為學(xué)生提供個(gè)性化服務(wù)
“我的實(shí)驗(yàn)室/高手掌握(My Lab/Mastering)”是一款由培生集團(tuán)和紐頓公司共同發(fā)布的適應(yīng)性學(xué)習(xí)產(chǎn)品。該產(chǎn)品通過分析學(xué)生在學(xué)習(xí)過程中產(chǎn)生的大量有價(jià)值數(shù)據(jù),適應(yīng)性地為其提供獨(dú)特的學(xué)習(xí)服務(wù)。學(xué)生通過接受個(gè)性化的學(xué)習(xí)支持服務(wù),增長(zhǎng)了有效的學(xué)習(xí)時(shí)間,提高了學(xué)習(xí)效率,最終改善了自己的考試成績(jī)。
由上可知,國(guó)外將大數(shù)據(jù)應(yīng)用于高等教育領(lǐng)域的探索較早,也逐漸發(fā)展出一些成功的應(yīng)用,特別是在學(xué)生學(xué)習(xí)分析方面已經(jīng)比較成熟。有的應(yīng)用已經(jīng)推廣至很多學(xué)校,如“希維塔斯學(xué)習(xí)”已經(jīng)與25所高校簽訂了合作協(xié)議,為他們提供大數(shù)據(jù)分析軟件、技術(shù)和指導(dǎo)[8]。許多高校已經(jīng)可以通過大數(shù)據(jù)技術(shù)監(jiān)測(cè)學(xué)生的學(xué)習(xí)過程、預(yù)測(cè)學(xué)生的考試成績(jī)、評(píng)估學(xué)習(xí)質(zhì)量等,為每一位學(xué)生創(chuàng)設(shè)一個(gè)量身定做的學(xué)習(xí)環(huán)境和個(gè)性化的課程,以提高他們的畢業(yè)率。
由于大數(shù)據(jù)的概念在我國(guó)出現(xiàn)只是近年來的事,大數(shù)據(jù)在一些領(lǐng)域的應(yīng)用也才逐漸興起,在高教領(lǐng)域的應(yīng)用更是剛剛起步。當(dāng)前,國(guó)內(nèi)已有一些高校和科研機(jī)構(gòu)開展了教育大數(shù)據(jù)的初步應(yīng)用研究與實(shí)踐探索。
1. 中國(guó)科學(xué)技術(shù)大學(xué)對(duì)貧困學(xué)生的“隱形資助”
中國(guó)科學(xué)技術(shù)大學(xué)自2004年起,利用大數(shù)據(jù)技術(shù)監(jiān)測(cè)每個(gè)學(xué)生的校園一卡通在食堂的消費(fèi)情況,如果其消費(fèi)低于200元/月,系統(tǒng)就會(huì)自動(dòng)給學(xué)生打生活補(bǔ)助。2005年之后,學(xué)校改進(jìn)了數(shù)據(jù)統(tǒng)計(jì)方法:首先利用網(wǎng)絡(luò)對(duì)新生心理和家庭狀況進(jìn)行詳細(xì)調(diào)查,綜合各院系平時(shí)掌握的學(xué)生生活情況,建立了每學(xué)期更新的貧困生數(shù)據(jù)庫。再通過多方面的情況統(tǒng)計(jì)和優(yōu)化的大數(shù)據(jù)分析,篩除不能反映真實(shí)情況的“壞數(shù)據(jù)”(如因減肥、外出用餐而導(dǎo)致的在校食堂消費(fèi)減少等),為真正貧困的學(xué)生提供資助。這種方法不僅解決了學(xué)生的生活問題,同時(shí)也讓貧困生有尊嚴(yán)地接受資助。
2. 西安交通大學(xué)的教學(xué)質(zhì)量監(jiān)測(cè)平臺(tái)
西安交通大學(xué)的教學(xué)質(zhì)量監(jiān)測(cè)平臺(tái),主要針對(duì)普通高校的課堂教學(xué)質(zhì)量問題,從內(nèi)因(教師、學(xué)生)和外因等角度開展深入、系統(tǒng)研究,研制出一套目標(biāo)導(dǎo)向、過程可控,面向?qū)W生、督導(dǎo)、同行專家、管理人員甚至開放學(xué)習(xí)者等課堂教學(xué)質(zhì)量大數(shù)據(jù)監(jiān)測(cè)與分析平臺(tái);通過這個(gè)平臺(tái)可以檢測(cè)到教師在授課過程中全程錄制的課堂實(shí)況;以及學(xué)生在學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)。通過大數(shù)據(jù)的關(guān)聯(lián)分析,進(jìn)行教學(xué)質(zhì)量的綜合性評(píng)價(jià)[9]。
3. 東華大學(xué)的智能實(shí)驗(yàn)室
東華大學(xué)智能實(shí)驗(yàn)室利用云平臺(tái)(東華云)通過服務(wù)器虛擬化對(duì)實(shí)驗(yàn)教學(xué)資源進(jìn)行管理,簡(jiǎn)化了管理流程,節(jié)約了管理成本,提高了服務(wù)器資源申請(qǐng)的靈活性,實(shí)現(xiàn)了實(shí)驗(yàn)資源管理的信息化和透明化。該智能實(shí)驗(yàn)室還實(shí)現(xiàn)了24小時(shí)開放無人在場(chǎng)、跨學(xué)院使用等人工無法實(shí)現(xiàn)的功能。統(tǒng)計(jì)數(shù)據(jù)顯示,智能實(shí)驗(yàn)室對(duì)學(xué)生學(xué)習(xí)自主性的提高有顯著影響,學(xué)生在實(shí)驗(yàn)室的時(shí)間甚至超過了在教室的時(shí)間。
4. 同濟(jì)大學(xué)構(gòu)建大數(shù)據(jù)平臺(tái)
為了滿足爆炸式增長(zhǎng)的用戶及其多樣化的數(shù)據(jù)需求,同濟(jì)大學(xué)攜手中科曙光公司,構(gòu)建了業(yè)內(nèi)領(lǐng)先的大數(shù)據(jù)柔性處理平臺(tái)。該平臺(tái)可以根據(jù)不同用戶的需求,提供差異化服務(wù),同時(shí)針對(duì)不同組件,采用分區(qū)管理,為學(xué)校信息學(xué)科及交叉學(xué)科研究領(lǐng)域提供高效靈活的應(yīng)用流程服務(wù)。
綜上,我國(guó)已經(jīng)開始了大數(shù)據(jù)在高等教育管理、服務(wù)、教學(xué)方面的初步探索,但真正融入高等教育教學(xué)實(shí)踐,在學(xué)校、區(qū)域或更大范圍內(nèi)產(chǎn)生實(shí)質(zhì)性影響的應(yīng)用實(shí)踐少之又少。高等教育大數(shù)據(jù)在促進(jìn)高校發(fā)展方面的價(jià)值還未體現(xiàn)出來,還有待進(jìn)一步的探索。
高等教育大數(shù)據(jù)能夠促進(jìn)高等教育教學(xué)模式、管理機(jī)制、服務(wù)質(zhì)量的改革。但是從整體來看,我國(guó)目前高等教育大數(shù)據(jù)應(yīng)用仍然比較零散,缺乏成熟的應(yīng)用推廣模式。在探索新型教育模式的過程中,主要存在以下幾個(gè)方面的問題。
1. 數(shù)據(jù)采集及問題解決分析技術(shù)薄弱
大數(shù)據(jù)的教育應(yīng)用中,數(shù)據(jù)采集和問題解決分析是核心環(huán)節(jié),應(yīng)用開發(fā)者要面對(duì)的就是數(shù)據(jù)采集技術(shù)和問題解決分析技術(shù)的挑戰(zhàn)[10]。由于我國(guó)大數(shù)據(jù)技術(shù)應(yīng)用研究起步較晚,云計(jì)算、虛擬化等技術(shù)還不成熟,采集端和采用分析端的提供商數(shù)量仍比較少,缺少領(lǐng)軍型企業(yè),這成為制約教育大數(shù)據(jù)行業(yè)整體發(fā)展的短板。
2. 高校各部門各自為戰(zhàn),缺乏統(tǒng)一口徑管理
目前,許多學(xué)校使用的多個(gè)信息管理平臺(tái)和軟件應(yīng)用工具產(chǎn)生了大量不同類型的數(shù)據(jù),而當(dāng)前的高校數(shù)據(jù)管理體制沒有對(duì)所積攢出的不同類型、零散的原始數(shù)據(jù)進(jìn)行恰當(dāng)?shù)貧w口管理,普遍存在各自為戰(zhàn)的情況,造成了存儲(chǔ)系統(tǒng)的利用率不均衡和存儲(chǔ)空間的浪費(fèi),大量的教育數(shù)據(jù)被鎖在各個(gè)數(shù)據(jù)孤島上,無法進(jìn)行有效的整合和利用。
3. 大數(shù)據(jù)應(yīng)用專業(yè)人才缺乏
相比于交通、醫(yī)療、商業(yè)、環(huán)境等行業(yè),教育行業(yè)的數(shù)據(jù)挖掘起步較晚,且具有很強(qiáng)的獨(dú)特性和復(fù)雜性,它需要一批既懂教育又掌握大數(shù)據(jù)核心技術(shù)的專業(yè)人才。盡管國(guó)內(nèi)部分高校已經(jīng)開設(shè)大數(shù)據(jù)相關(guān)專業(yè),但是在配套的課程體系建設(shè)、人才培養(yǎng)模式等方面仍處于摸索階段,短期內(nèi)難以培養(yǎng)大批合格的教育大數(shù)據(jù)從業(yè)者。專業(yè)人才的缺乏是制約我國(guó)教育大數(shù)據(jù)發(fā)展的重要因素。
4. 數(shù)據(jù)安全等相關(guān)法規(guī)制度缺失
當(dāng)前,我國(guó)尚未建立明確的教育數(shù)據(jù)管理運(yùn)營(yíng)的機(jī)制與制度規(guī)定,數(shù)據(jù)的歸屬權(quán)、開放范圍、開放方式、隱私保護(hù)等還沒有清晰的界定。企業(yè)在提供教育數(shù)據(jù)產(chǎn)品與服務(wù)中,往往存在極大的知識(shí)產(chǎn)權(quán)、應(yīng)用授權(quán)等風(fēng)險(xiǎn),這在一定程度上制約了教育大數(shù)據(jù)行業(yè)力量的壯大和發(fā)展。
如何有效地應(yīng)用大數(shù)據(jù)? 從數(shù)據(jù)到可視化的教育信息需要經(jīng)過哪些環(huán)節(jié)才能真正發(fā)揮數(shù)據(jù)的價(jià)值并進(jìn)行科學(xué)的預(yù)測(cè),促進(jìn)學(xué)習(xí)者個(gè)性化學(xué)習(xí)的實(shí)現(xiàn)? 筆者在大數(shù)據(jù)分析必要環(huán)節(jié)數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析、數(shù)據(jù)解釋基礎(chǔ)上,構(gòu)建了高等教育大數(shù)據(jù)應(yīng)用模型框架如圖1。
圖1 高等教育大數(shù)據(jù)應(yīng)用模型框架
高等教育大數(shù)據(jù)包括管理數(shù)據(jù)、研究數(shù)據(jù)、部門數(shù)據(jù)、課程數(shù)據(jù)、學(xué)生數(shù)據(jù)、教與學(xué)數(shù)據(jù)等[11]。數(shù)據(jù)的采集需要綜合應(yīng)用多種技術(shù),每種技術(shù)采集的數(shù)據(jù)范圍和重點(diǎn)都有所不同。主要包括物聯(lián)感知類技術(shù)、視頻錄制類技術(shù)、圖像識(shí)別類技術(shù)、平臺(tái)采集類技術(shù)四大類[12]。
對(duì)大數(shù)據(jù)來講,高等教育大數(shù)據(jù)是凌亂的、動(dòng)態(tài)的、復(fù)雜的,為了保證大數(shù)據(jù)的可用性,首先必須在數(shù)據(jù)的源頭上把好質(zhì)量關(guān),做好從原始數(shù)據(jù)到高質(zhì)量信息的預(yù)處理。教育數(shù)據(jù)預(yù)處理環(huán)節(jié)必須規(guī)范數(shù)據(jù)格式進(jìn)行初步整合和分析,以便于后續(xù)數(shù)據(jù)的存儲(chǔ)、管理與應(yīng)用。該環(huán)節(jié)涉及的關(guān)鍵技術(shù)包括:數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約等方法。
數(shù)據(jù)存儲(chǔ)是指所有數(shù)據(jù)的集中存放。主要包括各種結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的歷史數(shù)據(jù)、預(yù)測(cè)數(shù)據(jù)、匯總數(shù)據(jù)以及需要共享的數(shù)據(jù)等。高等教育大數(shù)據(jù)以非結(jié)構(gòu)化數(shù)據(jù)為主,特別是音視頻數(shù)據(jù)占很大比重,這些數(shù)據(jù)大多來自課堂錄像、教學(xué)資源等,具有一定的分析復(fù)雜性。因此,教育存儲(chǔ)系統(tǒng)不僅需要以極低的成本存儲(chǔ)海量數(shù)據(jù),還要適應(yīng)多樣化的非結(jié)構(gòu)化數(shù)據(jù)管理需求,具備數(shù)據(jù)格式上的可擴(kuò)展性。
大數(shù)據(jù)在高等教育領(lǐng)域應(yīng)用主要依賴三種數(shù)據(jù)模型即描述性分析、預(yù)測(cè)性分析和規(guī)范性分析[13]。
1. 描述性分析
描述性分析是為了識(shí)別目標(biāo)樣本,而對(duì)數(shù)據(jù)(如生源情況、考試成績(jī)、教師職稱等)特征的描述和分析。描述性分析可以為高校提供互動(dòng)數(shù)據(jù),為更好的教學(xué)和科研提供政策指導(dǎo)。如教師可以通過學(xué)習(xí)管理系統(tǒng)監(jiān)測(cè)學(xué)生登錄次數(shù)、頁面視圖、訪問次數(shù)、瀏覽時(shí)長(zhǎng)、作業(yè)情況、測(cè)驗(yàn)成績(jī)、論壇發(fā)貼等,了解學(xué)習(xí)者的學(xué)習(xí)狀態(tài)(學(xué)習(xí)需求、學(xué)習(xí)困難、個(gè)人學(xué)習(xí)風(fēng)格等),從而調(diào)整教學(xué)內(nèi)容,實(shí)施干預(yù)式教學(xué),增強(qiáng)學(xué)習(xí)效率。大數(shù)據(jù)可完善質(zhì)量監(jiān)控體系,為實(shí)時(shí)、全面、動(dòng)態(tài)的質(zhì)量管理奠定基礎(chǔ)[14]。但是教育機(jī)構(gòu)不僅需要監(jiān)測(cè)學(xué)生們現(xiàn)在的表現(xiàn)還需要預(yù)測(cè)他們未來可能的結(jié)果。
2. 預(yù)測(cè)分析
預(yù)測(cè)分析是利用各種統(tǒng)計(jì)、建模、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)最近的研究和歷史數(shù)據(jù),尋找趨勢(shì)和確定相關(guān)問題的關(guān)聯(lián),對(duì)事物發(fā)展的未來趨勢(shì)和水平進(jìn)行判斷和推測(cè)的一種活動(dòng)。它可以揭示描述性模型中隱藏的數(shù)據(jù)關(guān)系,把復(fù)雜的數(shù)據(jù)變得直觀、簡(jiǎn)明,為高校提供更好的教育教學(xué)決策,減少?zèng)Q策的盲目性。
3. 規(guī)范性分析
規(guī)范性分析是可執(zhí)行的工具,建立在描述性分析和預(yù)測(cè)分析的基礎(chǔ)上。規(guī)范性分析使決策者了解未來關(guān)鍵任務(wù)流程,發(fā)現(xiàn)機(jī)會(huì)(問題)以及提出好的行動(dòng)路線。有助于高等教育機(jī)構(gòu)評(píng)估現(xiàn)狀,在有效和一致的預(yù)測(cè)基礎(chǔ)上做出明智的選擇。如高校評(píng)估可以通過動(dòng)態(tài)監(jiān)測(cè)、行為矯正、預(yù)警預(yù)測(cè)、群體或個(gè)人行為分析等,促進(jìn)評(píng)估的即時(shí)性和精準(zhǔn)性,進(jìn)一步了解高等教育的實(shí)然狀態(tài),制定科學(xué)的決策。
Wu認(rèn)為規(guī)定性分析是預(yù)測(cè)分析的一種類型,規(guī)范的分析需要一個(gè)預(yù)測(cè)模型與兩個(gè)額外的組件:可操作的數(shù)據(jù)和一個(gè)反饋系統(tǒng),跟蹤行動(dòng)所產(chǎn)生的結(jié)果[15]。簡(jiǎn)單說來,描述性分析是描述過去,預(yù)測(cè)性分析是預(yù)測(cè)未來可能會(huì)發(fā)生什么,規(guī)范性分析是告訴你怎么做才能得到你想要的。
數(shù)據(jù)解釋的過程包括檢驗(yàn)所有的假設(shè)和重新回顧分析過程,通過數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)可視化、描述性和推論性方法,比如相關(guān)分析、回歸分析、方差分析、多元統(tǒng)計(jì)分析、圖表分析等技術(shù)模型,將數(shù)據(jù)以圖表、視頻、報(bào)告等方式呈現(xiàn)出來。數(shù)據(jù)解釋的目的是為了輔助教師更好地調(diào)整和改進(jìn)教學(xué)策略,促進(jìn)學(xué)生個(gè)性化成長(zhǎng),幫助管理者做出科學(xué)決策。使高校實(shí)現(xiàn)管理科學(xué)化、科研深入化、教學(xué)模式智能化、學(xué)習(xí)個(gè)性化、評(píng)估綜合化。
高等教育已經(jīng)從IT進(jìn)入到DT時(shí)代,我國(guó)高等教育將迎來新一輪的變革。針對(duì)目前我國(guó)高等教育大數(shù)據(jù)應(yīng)用存在的技術(shù)薄弱、數(shù)據(jù)孤島、專業(yè)人才缺乏、法規(guī)制度不完善等問題,筆者認(rèn)為促進(jìn)高等教育大數(shù)據(jù)應(yīng)用需要從以下幾方面著手:
數(shù)據(jù)文化是指一個(gè)組織或系統(tǒng)內(nèi)部對(duì)其各個(gè)層面決策過程的重要性認(rèn)識(shí),它包括相應(yīng)的價(jià)值觀、態(tài)度和行為準(zhǔn)則。換言之,就是要將用戶、技術(shù)與開發(fā)者匯聚在一起,促成與系統(tǒng)和基礎(chǔ)設(shè)施升級(jí)同等重要的數(shù)據(jù)認(rèn)同和文化創(chuàng)新[16]。高等教育領(lǐng)域倡導(dǎo)和加強(qiáng)數(shù)據(jù)文化建設(shè),首先要正確認(rèn)識(shí)大數(shù)據(jù),擁抱大數(shù)據(jù)。大數(shù)據(jù)是一種思維方法、是一種技術(shù)、更是一種理念。第二要形成“用數(shù)據(jù)說話、用數(shù)據(jù)管理、用數(shù)據(jù)決策、用數(shù)據(jù)創(chuàng)新”的文化氛圍,助推教學(xué)管理從經(jīng)驗(yàn)型、粗放型、封閉型向精細(xì)型、智能化、可視化轉(zhuǎn)型。良好的數(shù)據(jù)文化,是奠定高等教育認(rèn)可度和支持大數(shù)據(jù)發(fā)展的基礎(chǔ)。
不少高校在信息化建設(shè)過程中產(chǎn)生了大量零散的、孤立的數(shù)據(jù),這些被遺忘或者是交叉重復(fù)的冗余數(shù)據(jù)被視為“歷史資料”,分別歸屬于不同的部門。高校需要搭建統(tǒng)一的大數(shù)據(jù)平臺(tái)(云端),并對(duì)數(shù)據(jù)進(jìn)行恰當(dāng)?shù)貧w口管理,對(duì)數(shù)據(jù)的采集、存放、使用、維護(hù)及應(yīng)用進(jìn)行統(tǒng)一的指導(dǎo)和規(guī)劃。建立大數(shù)據(jù)平臺(tái)可以更好地挖掘大量的、多類型的數(shù)據(jù),為整合、分析和共享大數(shù)據(jù)打下基礎(chǔ)。高校大數(shù)據(jù)平臺(tái),需在整合原有各自為政信息系統(tǒng)的基礎(chǔ)上,集成高校辦公自動(dòng)化、教學(xué)管理、科研管理、財(cái)務(wù)管理等重要校務(wù)管理信息應(yīng)用系統(tǒng)數(shù)據(jù),升級(jí)、建設(shè)數(shù)據(jù)釆集設(shè)備、數(shù)據(jù)傳輸網(wǎng)絡(luò)、數(shù)據(jù)儲(chǔ)存和分析系統(tǒng),將簡(jiǎn)單堆砌的數(shù)據(jù)轉(zhuǎn)化為輔助高校決策的有力支撐例證,提高數(shù)據(jù)管理質(zhì)量和效率,促進(jìn)資源共享,推動(dòng)高校資源配置的優(yōu)化。
目前,國(guó)內(nèi)部分高校(如北京大學(xué)、中國(guó)人民大學(xué)、首都師范大學(xué)等)紛紛開設(shè)了大數(shù)據(jù)相關(guān)專業(yè)及課程,有針對(duì)性地培養(yǎng)高質(zhì)量的大數(shù)據(jù)專門人才。專業(yè)人才的來源,首先,高??梢宰晕遗囵B(yǎng),通過對(duì)本校教師進(jìn)行專業(yè)培訓(xùn),提升其數(shù)據(jù)素養(yǎng)。另外,可以引進(jìn)人才。在高等教育信息化進(jìn)程中,高校應(yīng)該調(diào)整教學(xué)和管理隊(duì)伍結(jié)構(gòu),完善崗位設(shè)置,積極引進(jìn)大數(shù)據(jù)應(yīng)用人才和管理人才。通過大數(shù)據(jù)人才的引進(jìn)和培養(yǎng),為大數(shù)據(jù)研究和應(yīng)用提供智力支撐,促進(jìn)大數(shù)據(jù)和高等教育的有機(jī)結(jié)合。
2016年4月8日,我國(guó)公布了高等教育質(zhì)量系列研究報(bào)告,即1本總報(bào)告《中國(guó)高等教育質(zhì)量報(bào)告》和3本專題報(bào)告,分別是《中國(guó)工程教育質(zhì)量報(bào)告》《全國(guó)新建本科院校教學(xué)質(zhì)量監(jiān)測(cè)報(bào)告》《新型大學(xué)新成就—百所新建院校合格評(píng)估績(jī)效報(bào)告》[17]。其中總報(bào)告《中國(guó)高等教育質(zhì)量報(bào)告》是世界上首次發(fā)布的高等教育質(zhì)量“國(guó)家報(bào)告”,這也標(biāo)志著我國(guó)高等教育數(shù)據(jù)開放程度的提升。在這一背景下,全國(guó)各地都紛紛成立了教育大數(shù)據(jù)研究機(jī)構(gòu),很多企業(yè)和社會(huì)力量也都加入了高等教育大數(shù)據(jù)開放和應(yīng)用的行列。高等教育大數(shù)據(jù)也在促進(jìn)教育公平、精準(zhǔn)教學(xué)、個(gè)性化學(xué)習(xí)、輔助管理等方面,取得了一些成就。當(dāng)然,伴隨而來的還有諸多問題,如數(shù)據(jù)的所有權(quán)、數(shù)據(jù)隱私與安全等。因此,從國(guó)家層面對(duì)教育大數(shù)據(jù)的應(yīng)用進(jìn)行相應(yīng)的政策引導(dǎo)顯得尤為重要,如成立國(guó)家教育大數(shù)據(jù)研究機(jī)構(gòu)、治理機(jī)構(gòu)、頒發(fā)“教育數(shù)據(jù)運(yùn)營(yíng)商”牌照、加快建設(shè)教育大數(shù)據(jù)產(chǎn)業(yè)基地、出臺(tái)《教育大數(shù)據(jù)應(yīng)用發(fā)展指導(dǎo)意見》、制定《教育大數(shù)據(jù)安全管理辦法》等[18]。政策的引導(dǎo),將進(jìn)一步明確教育數(shù)據(jù)標(biāo)準(zhǔn)、歸屬權(quán)、使用權(quán)等問題,帶動(dòng)高校和社會(huì)各方的參與和合作,促進(jìn)高等教育大數(shù)據(jù)應(yīng)用的快速發(fā)展。
總之,高等教育大數(shù)據(jù)應(yīng)用是一個(gè)不斷漸進(jìn)的過程,數(shù)據(jù)文化可以提高管理者、教師、學(xué)生的數(shù)據(jù)素養(yǎng)、數(shù)據(jù)意識(shí),轉(zhuǎn)變傳統(tǒng)的思維模式,為大數(shù)據(jù)應(yīng)用提供一個(gè)良好的氛圍,是高等教育大數(shù)據(jù)應(yīng)用的基礎(chǔ);高校大數(shù)據(jù)應(yīng)用平臺(tái)擁有強(qiáng)大的數(shù)據(jù)收集和分析能力,可以有效地提高數(shù)據(jù)管理質(zhì)量和效率,促進(jìn)資源共享,是高等教育大數(shù)據(jù)應(yīng)用的動(dòng)力;專業(yè)人才(具有相關(guān)學(xué)科背景的大數(shù)據(jù)專業(yè)人才)是大數(shù)據(jù)和高等教育結(jié)合的關(guān)鍵;數(shù)據(jù)安全制度或者法規(guī)的建立可以為數(shù)據(jù)提供合理使用的保障??梢哉f,大數(shù)據(jù)在高等教育領(lǐng)域應(yīng)用的過程中,文化是基礎(chǔ),平臺(tái)是動(dòng)力,人才是關(guān)鍵,政策是保障,四者缺一不可。
在高等教育領(lǐng)域,大數(shù)據(jù)正在引領(lǐng)教學(xué)、科研和管理的不斷創(chuàng)新與變革。在教學(xué)方面,大數(shù)據(jù)正在引領(lǐng)教學(xué)模式變革。在科學(xué)研究方面,大數(shù)據(jù)正在開創(chuàng)新的科研范式。在管理方面,大數(shù)據(jù)助力大學(xué)管理智能化。大數(shù)據(jù)技術(shù)的運(yùn)用有助于引領(lǐng)高等教育創(chuàng)新變革,提升教學(xué)、科研、管理服務(wù)水平和質(zhì)量。
綜上所述,我國(guó)的高等教育大數(shù)據(jù)蓬勃發(fā)展的時(shí)代已經(jīng)來臨,高校已經(jīng)在智能管理、教學(xué)質(zhì)量監(jiān)測(cè)等方面已經(jīng)進(jìn)行了大數(shù)據(jù)應(yīng)用的初步探索,并取得了顯著的成效。隨著數(shù)據(jù)采集、處理、傳輸和存儲(chǔ)能力的進(jìn)步,未來的高等教育大數(shù)據(jù)應(yīng)用將會(huì)在教育質(zhì)量監(jiān)測(cè)和評(píng)估、學(xué)生適應(yīng)性學(xué)習(xí)、管理決策和預(yù)測(cè)等方面進(jìn)行更深入的探索。雖然在此過程中,仍然面臨著數(shù)據(jù)處理技術(shù)薄弱、人才缺乏、制度缺失方面的挑戰(zhàn),筆者相信在國(guó)家大數(shù)據(jù)戰(zhàn)略的背景下,隨著教育工作者數(shù)據(jù)意識(shí)的提高,大數(shù)據(jù)、云計(jì)算、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù)的不斷發(fā)展,高校、研究機(jī)構(gòu)、企業(yè)將會(huì)投入更多的精力進(jìn)行高等教育大數(shù)據(jù)應(yīng)用研究,推動(dòng)大數(shù)據(jù)與高等教育的深度融合發(fā)展。同時(shí),大數(shù)據(jù)時(shí)代數(shù)據(jù)信息的精細(xì)化程度的提升、數(shù)據(jù)價(jià)值密度的增加、教學(xué)科研效率的巨大提高和學(xué)生學(xué)習(xí)行為分析能力的增強(qiáng),將促使高校更好地讀懂千差萬別的學(xué)生,有機(jī)會(huì)了解每一個(gè)學(xué)生的真實(shí)學(xué)習(xí)情況,為每一個(gè)學(xué)生提供更加優(yōu)質(zhì)、個(gè)性化的教育資源。
[1] 國(guó)務(wù)院. 促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知[Z]. 國(guó)發(fā)〔2015〕50號(hào), 2015-08-31.
[2] 趙姍. 大數(shù)據(jù)時(shí)代來臨, 中國(guó)準(zhǔn)備好了嗎[N]. 中國(guó)經(jīng)濟(jì)時(shí)報(bào), 2013-07-01(A11).
[3] 楊現(xiàn)民, 唐斯斯, 李冀紅. 發(fā)展教育大數(shù)據(jù):內(nèi)涵、價(jià)值和挑戰(zhàn)[J]. 現(xiàn)代遠(yuǎn)程教育研究, 2016(1): 50-61.
[4] 邢蓓蓓, 楊現(xiàn)民, 李勤生. 教育大數(shù)據(jù)的來源與采集技術(shù)[J]. 現(xiàn)代教育技術(shù), 2016(8): 14-21.
[5] FAHRNI P, RUDOLPH J, SCHUTTER A D. Vendor-Assisted evaluation of a learning management system[J]. The International Review of Research in Open and Distance Learning, 2004, 5(1): 4.
[6] MACFADYEN L P, DAWSON S. Mining LMS data to develop an “Early Warning System” foreducators: A proof of concept[J]. Computers & Education, 2010, 54(2): 588-599.
[7] My Lab & Mastering10 Best Practices[EB/OL].[2014-08-09]. http://www.pearsonmylabandmasting.com/global/northamerica/results/files/MyLab_and_Mastering_1 0_Best_Practices_2013.pdf.
[8] 美國(guó)高等教育大數(shù)據(jù)時(shí)代來臨[EB/OL].[2015-10-31].http://www.360doc.om/content/15/1031/10/1968278150960723 5.shtml.
[9] 鄭慶華. 高校教育大數(shù)據(jù)的分析挖掘與利用[J]. 中國(guó)教育信息化, 2016(13): 28-31.
[10] 徐鵬, 王以寧, 劉艷華, 等. 大數(shù)據(jù)視角分析學(xué)習(xí)變革—美國(guó)《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報(bào)告解讀及啟示[J]. 遠(yuǎn)程教育雜志, 2013(6): 11-17.
[11] DANIEL B. Big data and analytics in higher education: Opportunities and challenges[J]. British Journal of Educational Technology, 2015, 46(5): 904-920.
[12] 孫洪濤, 鄭勤華. 教育大數(shù)據(jù)的核心技術(shù)、應(yīng)用現(xiàn)狀與發(fā)展趨勢(shì)[J]. 遠(yuǎn)程教育雜志, 2016, 34(5): 41-49.
[13] DANIEL B K. Big data and learning analytics in higher education: Current theory and practice[M]. Belin:Spinger, 2016.
[14] 胡弼成, 王祖霖.“大數(shù)據(jù)”對(duì)教育的作用、挑戰(zhàn)及教育變革趨勢(shì)—大數(shù)據(jù)時(shí)代教育變革的最新研究進(jìn)展綜述[J]. 現(xiàn)代大學(xué)教育, 2015(4): 98-104.
[15] MIKE W. What is Presccriptive Analyt -icsReally?[EB/OL]. [2016-08-19]. http://community.lihium.com/t5/Science-of-Social-blog/What-is-Prescriptive-Analytics-Really/bc-p/253213#M1480.
[16] 李燕, 張淑林, 陳偉. 英國(guó)政府?dāng)?shù)據(jù)開放實(shí)踐、經(jīng)驗(yàn)與啟示[J]. 情報(bào)科學(xué), 2016(8): 148-152.
[17] 教育部發(fā)布首份高等教育質(zhì)量報(bào)告[EB/OL]. [2016-04-08]. http://news.xinhuantcom/legal/2016-04/08/c_1288 74181.htm.
[18] 楊現(xiàn)民, 王榴卉, 唐斯斯. 教育大數(shù)據(jù)的應(yīng)用模式與政策建議[J]. 電化教育研究, 2015(9): 54-61.
電子科技大學(xué)學(xué)報(bào)(社科版)2018年2期