張生+駱方+趙茜+辛濤
2017年8月14日-15日,首屆京師教育大數(shù)據(jù)挖掘與應用年會召開。國內(nèi)外40余位從事大數(shù)據(jù)分析與挖掘的專家在會上做了專題報告,來自各高校、科研機構、教育行政部門、企業(yè)等機構的700余人參會,同步收看會議直播的機構、單位和個人達到2000個。會議展示了教育質(zhì)量監(jiān)測與評價領域大數(shù)據(jù)研究和實踐的豐富成果,為學校、科研機構、企業(yè)之間的深度合作搭建橋梁,為我國教育大數(shù)據(jù)領域的發(fā)展助力。
本次年會由北京師范大學中國基礎教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心發(fā)起,教育部基礎教育質(zhì)量監(jiān)測中心、英國劍橋大學心理測量中心、北京師范大學互聯(lián)網(wǎng)教育智能技術及應用國家工程實驗室、北京師范大學中國教育與社會發(fā)展研究院主辦,中國教育技術協(xié)會教育測量與評價專業(yè)委員會協(xié)辦。
國際進展
教育大數(shù)據(jù)涉及教育數(shù)據(jù)尤其是過程性數(shù)據(jù)的采集方式,數(shù)據(jù)的處理與分析方式,如機器學習、自然語言處理、語音圖像識別、視頻處理等,數(shù)據(jù)的呈現(xiàn)方式,如數(shù)據(jù)可視化、個體和群體畫像技術等多個方面。
當前國際教育大數(shù)據(jù)研究的重點之一是:利用大型社交網(wǎng)絡數(shù)據(jù)來評價與預測人的心理狀況,傳統(tǒng)心理特征的評價主要是依靠心理測驗的量表。正如劍橋大學測量中心主任John Rust 教授在會議的開幕式上所說:“十多年前,我們從因特網(wǎng)和Facebook搜集了600萬人的特征,之前沒有這么大的數(shù)據(jù)基礎。當時有很多人質(zhì)疑這些數(shù)據(jù)有什么用,我們現(xiàn)在發(fā)現(xiàn),這些數(shù)據(jù)可以做非常好的心理測量,可以用來分析一個人各方面的特征 ?!?/p>
來自美國斯坦福大學商學院的Michal Kosinski 教授,曾入選DatalQ及IBM評選的“大數(shù)據(jù)50位最具影響力人物”,他研究發(fā)現(xiàn):只需要用戶在Facebook上的227個點贊的行為,就能夠準確地判斷出用戶的性格特征。將此類方法用在教育中,可以基于學生的網(wǎng)絡痕跡對學生的人格、興趣、潛能、價值觀以及心理健康等進行預估。
另一個研究重點是:通過大數(shù)據(jù)挖掘技術從過程性、表現(xiàn)型數(shù)據(jù)中評估學生的認知能力和素養(yǎng),最常見的是對作文的自動評分。利用學生學習的過程性和表現(xiàn)性數(shù)據(jù),可大大提升評價的真實性和準確性,而人工評分效率低、成本高、誤差大。西澳大學教育學院的Andrew Kyngdon教授分享了使用新的神經(jīng)網(wǎng)絡模型提升英語作文自動化評分效果的經(jīng)驗。
還有一個研究是測量技術和大數(shù)據(jù)技術的結合。一是在命題領域。采用機器學習技術對人工命題的規(guī)律進行探索,從而能夠?qū)崿F(xiàn)自動化命題。來自劍橋大學心理測量中心的Aiden Loe博士報告了使用機器學習算法自動生成人格測驗題目的研究。二是游戲化測評方式的應用。測量學家還希望創(chuàng)設一些能夠還原真實生活的測驗情境,讓被試身臨其境地解決問題。劍橋大學David Stillwell教授分享了他們把傳統(tǒng)的智力測驗放在游戲情景中的研究,探索了如何對被試與情境的頻繁互動過程中產(chǎn)生的海量數(shù)據(jù)進行分析,實現(xiàn)對被試的準確度量,這更需要人工智能工程師和測量學家的進一步緊密合作。三是推薦和適應算法。在教育測量領域還有一個重要的嘗試,就是開發(fā)自適應學習系統(tǒng),基于考生水平給予最恰當?shù)臏y試題目,在較短的時間內(nèi)實現(xiàn)對考生的準確測量,并且給予最恰當?shù)膶W習資料來提高學習效率。自適應學習的興起,源于網(wǎng)絡上的學習課程和測試系統(tǒng)的數(shù)據(jù)積累,研究者經(jīng)過數(shù)據(jù)挖掘?qū)χR脈絡進行了梳理,構建了知識點之間的概率模型。哥倫比亞大學統(tǒng)計學系的應志良教授基于決策論設計了推薦學習模型。
應用進展
中國學者圍繞大數(shù)據(jù)的理論與實踐,分別從教育大數(shù)據(jù)的不同方面進行了研討和分享。
中國基礎教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心常務副主任辛濤教授指出:“教育質(zhì)量監(jiān)測與評價是一個復雜的系統(tǒng),需要多領域、多學科的協(xié)同,多手段和多技術的整合。從中心的建立伊始,我們就在試圖探索信息技術如何推動和促進監(jiān)測和評價的提升,推動監(jiān)測工作的發(fā)展?!?/p>
在過去10余年的探索中,大數(shù)據(jù)的應用主要形成了三個方面的成果。
第一,用于常態(tài)、大規(guī)模監(jiān)測評價的教育評價云平臺的建立。云平臺包括從數(shù)據(jù)的采集、數(shù)據(jù)的管理、數(shù)據(jù)結果的呈現(xiàn)、內(nèi)含測量評價的標準以及采集過程的管理等內(nèi)容。包括題庫系統(tǒng)、監(jiān)測實施進展管理系統(tǒng)、信息上報及抽樣系統(tǒng)、電子化測試系統(tǒng)、報告自動化系統(tǒng)和標準劃定系統(tǒng)六個系統(tǒng),將教育質(zhì)量監(jiān)測的所有環(huán)節(jié)和步驟信息化,實現(xiàn)功能和數(shù)據(jù)的整合,提高教育質(zhì)量監(jiān)測的質(zhì)量和效益。
第二,面向過程性、表現(xiàn)性的特色測試系統(tǒng)的建立。探索復雜的非結構化數(shù)據(jù)的分析是中國基礎教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心近年來重點突破的技術難點。目前已建立了包括演唱測試系統(tǒng)、文本自動標定系統(tǒng)、作文自動評分系統(tǒng)在內(nèi)的特色測試系統(tǒng),并開展了教學實時動態(tài)監(jiān)測系統(tǒng)的小范圍試點。
第三,決策可視化系統(tǒng)的建立。為了將國家監(jiān)測結果合理呈現(xiàn)以方便管理者決策,從而發(fā)揮監(jiān)測的最大價值,中國基礎教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心利用多種信息系統(tǒng)及指數(shù)平臺,采用科學、生動、可視化的形式對監(jiān)測成果進行匯報與發(fā)布?!爸袊x務教育質(zhì)量地圖系統(tǒng)”就是其中一個重要的支持系統(tǒng)。
同樣,圍繞教育大數(shù)據(jù)的不同方面,中國學者和實踐者給出了精彩的報告內(nèi)容,具體包括六個方面。
一是大數(shù)據(jù)促進了研究范式的改變。大數(shù)據(jù)不僅是一種技術,更是一種研究范式,基于大數(shù)據(jù)開展各類研究成為當前學者們關注的焦點,這種范式能夠從自然的數(shù)據(jù)狀態(tài)揭示潛在的規(guī)律。如北京師范大學黃榮懷教授的“數(shù)據(jù)密集型研究”、清華大學王剛博士的“基于數(shù)據(jù)的學科研究領域知識圖譜構建及發(fā)展研究”、北京大學郭文革教授分享的“基于《數(shù)字化閱讀》課程數(shù)據(jù)的學習者批判性思維研究”。
二是涉及新型的測驗形式的研究與實踐。如北京師范大學劉紅云“基于行為過程數(shù)據(jù)的測量:理論與實踐”、駱方教授的“測評環(huán)境空間能力的‘虛擬迷宮游戲的開發(fā)”、薛貴教授的“基于腦科學的學生測量與學習”等,從過程和游戲化、腦科學等角度展示了新型的測評方式和研究,這些研究不僅具有理論意義,在實踐領域也取得了很大的進步。endprint
三是涉及網(wǎng)上考試行為有關的過程型數(shù)據(jù)的挖掘以及自適應系統(tǒng)的理論與實踐。如中國人民大學趙鑫博士的“基于在線測試平臺用戶行為的題目知識挖掘研究”、中國科學技術大學劉淇博士分享的“面向在線教育考試評估的數(shù)據(jù)挖掘技術研究與應用”,華東師范大學文劍冰博士分享的“認知診斷性自適應測評系統(tǒng)設計及實踐思考”和長春出版社鄭曉輝社長分享的“基于數(shù)據(jù)的小學數(shù)學自適應診斷與學習系統(tǒng)”。
四是基于學生學習過程的數(shù)據(jù)挖掘與分析,從學習過程數(shù)據(jù)進行心理狀態(tài)的測量與評價。如北京師范大學張生博士的“寫作數(shù)據(jù)如何預測人的心理發(fā)展”,還涉及從不同角度來看待學生的發(fā)展和表現(xiàn);如中山大學胡延慶教授的“學生畫像:小學生語文寫作跟蹤軌跡數(shù)據(jù)分析與應用”等。
五是自然語言處理與深度學習在閱讀和寫作中的應用。通過機器對人評價的學習,機器逐步學會了對文本難度進行分級。如趙梓淳博士講的“中文分級閱讀的探究與應用”和張躍博士講的“基于大數(shù)據(jù)的英語作文智能批改”等。
六是涉及評價結果的解釋與運用方面的研究與實踐。中國基礎教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心副主任劉堅教授從“區(qū)域教育質(zhì)量健康指數(shù):探索與挑戰(zhàn) (2003-2017)”做了展示和分享,提出了三個問題:一是如何確定某一個指數(shù)的閾值范圍?二是如何通過篩選和合成等途徑進一步提煉體檢指標,用盡可能少的參數(shù)更加靈敏地反應一個區(qū)域或?qū)W校教育質(zhì)量健康狀況?三是如何對數(shù)據(jù)進行更有效的深層次挖掘和更加充分的運用,真正促進教育公平和質(zhì)量提升?
未來展望
第一,多地域、多學科研究領域人才的協(xié)同,實現(xiàn)教育質(zhì)量監(jiān)測大數(shù)據(jù)的挖掘。隨著教育質(zhì)量監(jiān)測過程性數(shù)據(jù)收集系統(tǒng)的不斷完善,未來教育質(zhì)量監(jiān)測數(shù)據(jù)將會以幾何級的規(guī)模遞增,而同時大數(shù)據(jù)不斷積累和開放過程中,不同國家之間、不同學科領域之間的協(xié)同合作,從多角度對教育數(shù)據(jù)挖掘,尋找學習、教學、管理過程中的規(guī)律,利用這些規(guī)律形成機器的教育智慧,從而進一步服務于教育過程,促進教育變革的順利進行。
第二,教育質(zhì)量監(jiān)測大數(shù)據(jù)分析結果與教育改進服務緊密結合。教育質(zhì)量監(jiān)測大數(shù)據(jù)挖掘直接導向應用,在教育各個層面上實現(xiàn)改進。首先,促進學生“更好地學”。通過對學生日常學習數(shù)據(jù)的分析,促進個性化的學習。從紙筆測驗向基于云計算的網(wǎng)絡測試發(fā)展,最終實現(xiàn)基于大數(shù)據(jù)挖掘技術的個體化實時監(jiān)測,根據(jù)監(jiān)測結果給學生提供更加個性化的學習材料。其次,促進教師“更好地教”。通過為教師提供學生學習過程和教學過程的評價數(shù)據(jù),促進教師改進教學,針對學生的不同特征因材施教。再次,促進教育管理者“更好地管”。為教育管理者提供更多、更全面的數(shù)據(jù),為其科學決策提供更有力的支持。
第三,教育質(zhì)量監(jiān)測大數(shù)據(jù)專門人才進行培養(yǎng)。隨著教育質(zhì)量監(jiān)測工作的不斷推進,各省、市教育質(zhì)量監(jiān)測機構紛紛建立,人才缺口巨大,特別是在大數(shù)據(jù)挖掘方面的人才極缺。作為一個學科交叉、復雜的研究領域,協(xié)同各高校和多學科的力量,培養(yǎng)大批專門人才是本領域未來發(fā)展的基石。教育專業(yè)院校在傳統(tǒng)的教育測量、教育統(tǒng)計專業(yè)的基礎上,增設新的專業(yè)方向,擴大招生數(shù)量,或面向教育質(zhì)量監(jiān)測實踐者開設大數(shù)據(jù)相關課程,是突破發(fā)展瓶頸的重要因素。
教育大數(shù)據(jù)的開發(fā)、應用仍面臨一些問題。例如,如何進一步實現(xiàn)測評工具的豐富性、科學性,可視化展示實時數(shù)據(jù)分析結果,對監(jiān)測采集結果深度挖掘,為教育決策提供及時反饋,擴大教育大數(shù)據(jù)對監(jiān)測的成效,同時加強對教育數(shù)據(jù)的分析、處理以及對學生綜合素養(yǎng)的測評進一步普及等。收集的數(shù)據(jù)很多是學習者學習過程中的個人數(shù)據(jù),如何避免對于個人隱私的侵犯,實現(xiàn)研究倫理和技術發(fā)展的平衡,也是未來要著力解決的問題。endprint