• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)引領(lǐng)教育未來:從成績預測談起

      2015-03-17 03:32:58呂紅胤,連德富,聶敏
      大數(shù)據(jù) 2015年4期
      關(guān)鍵詞:規(guī)律性預測算法

      大數(shù)據(jù)引領(lǐng)教育未來:從成績預測談起

      Big Data Drives a New Epoch of Education: A Case Study of Academic Performance Prediction

      呂紅胤,女,電子科技大學副研究員,主要研究方向為教育大數(shù)據(jù)理論與實踐研究、社會圈層研究。

      連德富,男,電子科技大學講師、教育大數(shù)據(jù)研究所副所長,主要研究方向為機器學習、時空數(shù)據(jù)挖掘、推薦系統(tǒng)、教育數(shù)據(jù)挖掘。在ACM Trans.、KDD、Ubicomp、ICDM、WWW等國際頂級期刊和會議上發(fā)表論文10余篇。

      聶敏,男,電子科技大學教育大數(shù)據(jù)研究所博士生,主要研究方向為大規(guī)模分布式計算、教育數(shù)據(jù)挖掘?,F(xiàn)任成都尋道科技有限公司總經(jīng)理,致力于教育大數(shù)據(jù)平臺級產(chǎn)品研發(fā),有多年大數(shù)據(jù)相關(guān)技術(shù)經(jīng)驗。

      夏虎,男,電子科技大學副研究員、教育大數(shù)據(jù)研究所所長,主要研究方向為數(shù)據(jù)挖掘、社會網(wǎng)絡、文本挖掘。

      周濤,男,電子科技大學教授,主要研究方向為統(tǒng)計物理與復雜性科學,發(fā)表SCI論文200余篇,引用12 000余次,H指數(shù)為53。

      近年來,大數(shù)據(jù)已經(jīng)在教育領(lǐng)域的管理與引導等諸多方面被廣泛運用。例如,智能教學系統(tǒng)(ITS)[1]基于與學生間交互的日志數(shù)據(jù)進行個性化知識診斷,分析學生的知識掌握情況,發(fā)現(xiàn)學生的薄弱點,從而自適應地幫扶學生更好地獲取知識和技能[2,3]。卡耐基公司(Carnegie Learning)的“認知導引”系統(tǒng)便是一個典型的ITS[4],它根據(jù)學生對先前問題的回答情況制定后續(xù)的提問內(nèi)容。這樣,就可以找出學生的問題并深入了解它們。經(jīng)過嚴格測試,發(fā)現(xiàn)使用該系統(tǒng)的學生要比接受傳統(tǒng)教學的學生節(jié)約12%的學習時間。國外的edX、Coursera、Udacity和國內(nèi)的學堂在線等多家大規(guī)模在線課堂平臺,圍繞在線教育中高輟學率的嚴峻問題,基于學生人口統(tǒng)計學數(shù)據(jù)和學生注冊課程、觀看視頻、完成課后作業(yè)、參與論壇討論等行為數(shù)據(jù),旨在發(fā)現(xiàn)影響學生輟學的重要因素,從而制定相應的干預策略引導學生,降低在線教育的輟學率[5]。保羅·艾倫實驗室致力于自動化答題的研究:從題目中抽取知識和前提條件,基于在訓練集上構(gòu)建的知識圖譜,利用多種統(tǒng)計推斷和邏輯推理的方法來選擇或者生成可能準確的答案[8,9]。針對該任務,該實驗室在2015年10月發(fā)起了一項名為“你的模型比8年級學生更聰明嗎”的大數(shù)據(jù)競賽。更重要的是,包括中、美、日在內(nèi)的國家均已設立了答題機器人的國家級重大項目,計劃讓機器人在不久的將來參加高考,在3~5年內(nèi)考上“一本”。而且,目前該項目已經(jīng)取得可喜進展。

      除此以外,傳統(tǒng)中小學教育和高等教育中積累的人口統(tǒng)計學信息、過往考試成績、缺曠課、問卷調(diào)查等數(shù)據(jù)也曾被用于分析與學生綜合績點、能否順利畢業(yè)等因變量之間的關(guān)系,并且構(gòu)建相關(guān)的預測模型[10]?;陬A測模型,教育管理者便可以優(yōu)先找出未來可能需要重點關(guān)注的學生。然而,這些數(shù)據(jù)要么可能只是來源于小部分學生的問卷調(diào)查,要么數(shù)據(jù)的字段數(shù)太少。更重要的是這些數(shù)據(jù)缺乏實時性,無法進行實時預測,從而可能無法達到預期的干預結(jié)果。為此,本文基于學生在校園內(nèi)學習、生活時產(chǎn)生的實時行為數(shù)據(jù),結(jié)合問卷調(diào)查、人口統(tǒng)計學等相關(guān)的數(shù)據(jù)來進行成績預測等相關(guān)的大數(shù)據(jù)研究。

      成績預測在教育管理中起到重要的作用。當前,掛科現(xiàn)象在大學生中非常普遍,甚至有人認為不掛科的大學生活是不完整的。然而,掛科可能會造成學生無法按時畢業(yè)或者無法找到心儀工作的后果。因而如果能提前發(fā)現(xiàn)學生的學習異常,通過引導和干預就有可能阻止這些不幸事情的發(fā)生。學習異常的發(fā)生可能源自于學習態(tài)度或者學習目標的轉(zhuǎn)變,而這種轉(zhuǎn)變是可以在學生的日常生活中表現(xiàn)出來的。大學校園本身就是一個小型的社會系統(tǒng),其內(nèi)部服務體系幾乎可以滿足學生絕大多數(shù)的需求。而校園服務的實現(xiàn),如食堂吃飯、超市購物、圖書館借書、出入宿舍、教學樓打水等,大多數(shù)是通過校園“一卡通”來完成的。因而學生在校園中的食堂、超市、教學樓、宿舍樓、圖書館之間的日常生活軌跡就通過“一卡通”以數(shù)字化的形式記錄下來。然而,大家并不知道行為和成績之間的關(guān)系,也不知道行為變化和成績變化之間的關(guān)系。

      針對這種需求,基于這些“一卡通”記錄下來的行為信息,特別設計了學生畫像系統(tǒng)。該系統(tǒng)量化了心理學中影響學生成績最重要的兩個指標:努力程度和生活規(guī)律性,作為系統(tǒng)中的畫像因子。努力程度包括去教學樓、圖書館消費的次數(shù),對應到學生上自習或者上課的次數(shù),反映了學生花在學習上的時間多少。而生活規(guī)律性包括出入宿舍的規(guī)律性、吃飯?zhí)貏e是吃早飯的時間規(guī)律性、洗澡洗衣服的時間規(guī)律性、購物的規(guī)律性等,與學生的自我控制與自我約束能力密切相關(guān)。通過分析這些畫像因子和成績之間的關(guān)系,發(fā)現(xiàn)努力程度和生活規(guī)律性與成績呈顯著正相關(guān)性。特別地,針對某個年級的4年數(shù)據(jù)使用相關(guān)性計算,發(fā)現(xiàn)去圖書館的次數(shù)和成績的序相關(guān)性達到0.3(p<0.01),而洗澡規(guī)律性和成績的序相關(guān)性稍弱,為0.17(p<0.01)。圖1展示了目前研究的所有努力程度和行為規(guī)律性的指標與成績的相關(guān)性。更進一步地,分析行為變化和成績變化之間的關(guān)系,發(fā)現(xiàn)努力程度和生活規(guī)律性的增加也會導致學習成績的提升。因而,對于學習越努力、生活越規(guī)律的學生,他們的學習成績越好。同時,基于學生在同一地點共現(xiàn)的次數(shù),構(gòu)建學生在校園內(nèi)的社交關(guān)系網(wǎng)絡,并分析每個學生的學習成績和朋友間的學習成績之間的關(guān)系。筆者發(fā)現(xiàn),每個學生的成績和朋友的平均成績呈正相關(guān)的關(guān)系。這不僅驗證了社會學中的成績上的同質(zhì)性,還能幫助構(gòu)建準確率更高的成績預測系統(tǒng)。

      針對努力程度、生活規(guī)律性和社交關(guān)系網(wǎng)絡以及過往的學習成績,設計了多任務遷移學習算法來進行未來成績的預測。該算法不僅通過多任務特性考慮了特征相關(guān)性存在學院之間的差異性,而且還通過遷移學習特點考慮了不同學期之間相關(guān)性的變化。同時,為了更好地保護學生隱私,將成績變換成排名,并進行歸一化,利用排序?qū)W習算法來進行學習。當學生的數(shù)據(jù)缺乏或者缺失時,該算法利用朋友的加權(quán)預測成績作為學生的預測結(jié)果輸出。在測試時,給定前5個學期的數(shù)據(jù)作為訓練集,預測第6個學期的成績排名,以預測排名和實際排名的序相關(guān)性作為預測算法性能評價的指標。最終預測算法的序相關(guān)性高達0.9,這讓算法在實際中被廣泛運用成為可能。而且,基于“一卡通”對于記錄行為的實時性設計的成績預測模型,可以幫助教育管理者及時發(fā)現(xiàn)學生的學習和生活異常情況,從而能對學生進行及時的干預和引導,從而實現(xiàn)從傳統(tǒng)教育中的后置性應急到前置性預警引導的轉(zhuǎn)變,實現(xiàn)從離線靜態(tài)分析到自適應性地動態(tài)分析的轉(zhuǎn)變。

      除了發(fā)現(xiàn)這些行為數(shù)據(jù)在預測成績方面起到的重要作用以外,筆者還發(fā)現(xiàn)了它們在貧困生檢測、畢業(yè)去向預測、館藏圖書推薦等方面的價值。不同家庭經(jīng)濟條件的學生在消費行為方面可能呈現(xiàn)較大差異,因而消費行為數(shù)據(jù)對于貧困生檢測存在一定的作用。學生畢業(yè)時的去向由很多原因決定,不僅取決于學生的成績,還包括實習和科研等課外活動的經(jīng)歷、生活作息的規(guī)律性、家庭的經(jīng)濟狀況等。而行為數(shù)據(jù)的存在給館藏圖書推薦帶來較大變化,不僅可以區(qū)分男女生在借書上的差異性,也可以區(qū)分成績不同的學生在圖書借閱上的偏好;反過來,通過學生借閱的圖書信息,也能輔助確定學生的成績信息。通過這些研究發(fā)現(xiàn),當前的大學校園內(nèi),已經(jīng)積存了很多對學校教育管理具有重要戰(zhàn)略價值的數(shù)據(jù)。雖然對這些數(shù)據(jù)的價值已做了初步探討,但是仍然還有待進一步的探索與發(fā)現(xiàn)。

      圖1 行為規(guī)律性和努力程度與成績的序相關(guān)性

      [1] Anderson J R, Boyle C F, Reiser B J. Intelligent tutoring systems. Science, 1985, 228(4698): 456~462

      [2] Romero C, Ventura S. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews, 2010, 40(6): 601~618

      [3] Lindsey R V, Khajah M, Mozer M C. Automatic discovery of cognitive skills to improve the prediction of student learning. Advances in Neural Information Processing Systems, 2014:1386~1394

      [4] Ritter S, Anderson J R, Koedinger K R,et al. Cognitive tutor: applied research in mathematics education. Psychonomic Bulletin & Review, 2007,14(2): 249~255

      [5] Qiu J Z, Tang J, Liu T X,et al. Modeling and predicting learning behavior in MOOCs. Proceedings of the 9th ACM International Conference on Web Search and Data Mining (WSDM'16), San Francisco, USA, 2016 Accepted

      [6] Ramesh A, Goldwasser D, Huang B,et al. Learning latent engagement patterns of students in online courses. Proceedings of the 28th AAAI Conference on Artificial Intelligence, Quebec City, Canada, 2014

      [7] Anderson A, Huttenlocher D, Kleinberg J,et al. Engaging with massive online courses. Proceedings of the 23rd International Conference on World Wide Web, Seoul, Korea, 2014: 687~698

      [8] Seo M, Hajishirzi H, Farhadi A,et al. Solving geometry problems: combining text and diagram interpretation. Proceedings of EMNLP, Lisbon, Portugal, 2015

      [9] Hosseini M J, Hajishirzi H, Etzioni O,et al. Learning to solve arithmetic word problems with verb categorization. Proceedings of EMNLP, Doha, Qatar, 2014

      [10] Tamhane A, Ikbal S, Sengupta B,et al. Predicting student risks through longitudinal analysis. Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, New York, USA, 2014: 1544~1552 □

      10.11959/j.issn.2096-0271.2015045

      猜你喜歡
      規(guī)律性預測算法
      無可預測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預測卷(A卷)
      選修2-2期中考試預測卷(B卷)
      What Is the Hidden Card?
      基于MapReduce的改進Eclat算法
      Travellng thg World Full—time for Rree
      進位加法的兩種算法
      不必預測未來,只需把握現(xiàn)在
      公證改革發(fā)展若干規(guī)律性認識
      中國司法(2016年1期)2016-08-23 11:56:34
      一種改進的整周模糊度去相關(guān)算法
      通河县| 大连市| 泊头市| 新巴尔虎左旗| 汽车| 嘉定区| 凤翔县| 西丰县| 图木舒克市| 墨江| 高雄县| 和顺县| 无为县| 望奎县| 洱源县| 临城县| 克拉玛依市| 临邑县| 西安市| 尼玛县| 油尖旺区| 秭归县| 腾冲县| 分宜县| 金川县| 枣庄市| 社旗县| 溧阳市| 南岸区| 兴安县| 武义县| 呼玛县| 连州市| 莱西市| 万宁市| 新密市| 宜春市| 澜沧| 西林县| 盈江县| 湟源县|