劉鐘情(成都體育學院 信息技術(shù)中心計算機教研室,四川 成都 610041)
數(shù)據(jù)挖掘技術(shù)在MOOC中的應用研究
劉鐘情
(成都體育學院信息技術(shù)中心計算機教研室,四川成都610041)
摘要:MOOC是旨在進行基于網(wǎng)絡的開放式大規(guī)模學生交互參與的在線課程,以其自主學習、易于使用、注冊門檻低、學習資源豐富等獨特優(yōu)點和優(yōu)勢吸引了全球大量的學習者,這些學習者來自世界各地,有著不同的教育文化背景和不同的學習特征,有著不同的學習目的,只有滿足了這些學習者的個性化需求和目的,才能獲得MOOC的可持續(xù)發(fā)展,并最大化其存在價值。借助數(shù)據(jù)挖掘技術(shù),能從大量信息中獲取隱藏在數(shù)據(jù)之中的有用信息,從而為決策提供支持。將數(shù)據(jù)挖掘技術(shù)應用在MOOC中,挖掘?qū)W習者的學習行為特征,提供更優(yōu)良的教學資源和教學策略,才能實現(xiàn)MOOC存在價值最大化。
關(guān)鍵詞:數(shù)據(jù)挖掘;MOOC;學習行為;輔助決策;監(jiān)控預警
MOOC,從2012年開始被廣為傳播,為“massive open online courses”的縮寫,意為“大規(guī)模開放在線課程”,其核心理念是開放共享知識。目前各國教育機構(gòu)紛紛投入到MOOC中,全球知名的MOOC項目有Coursera、Edx、Udacity等,國內(nèi)高校也密切關(guān)注MOOC的發(fā)展,北京大學于2013年先后在Edx和Coursera上發(fā)布了7門課程并對全球開放,清華大學于2013年推出“學堂在線”平臺,面向全球提供第一批在線課程[1]。初淺的數(shù)據(jù)挖掘方法在MOOC發(fā)展過程中得到了廣泛的應用。如杜克大學凱西·戴維森教授在發(fā)現(xiàn)常規(guī)作法的局限性后,將在Coursera平臺開設(shè)的課程與本校面對面課程進行混合教學,并與加利福尼亞大學教授的面對面課程同步進行,實現(xiàn)校際教師間的協(xié)作授課,校際學生間協(xié)作學習,從而使得MOOC教學法出現(xiàn)了新動向。又如,將MOOC的三大主流平臺Coursera、Edx、Udacity和原有的網(wǎng)絡教學平臺進行對比分析,人們發(fā)現(xiàn)MOOC平臺的功能相對簡單,并最終根據(jù)實踐需要對MOOC平臺作出調(diào)整[2]。然而,在新的歷史條件下,為了使MOOC可持續(xù)發(fā)展,并最大化其存在價值,就不能停留在初淺的數(shù)據(jù)挖掘基礎(chǔ)上,必須對MOOC涉及的各環(huán)節(jié)和對象作深入的數(shù)據(jù)挖掘,找出隱藏的有用的信息和規(guī)律。本文研究了數(shù)據(jù)挖掘技術(shù)在MOOC中的應用。
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的和隨機的數(shù)據(jù)中提取隱含在其中的人們事先不知道的但又潛在有用的信息和知識的過程[3]。其中的常用技術(shù)有關(guān)聯(lián)分析、分類、聚類等。其中分類是基于預測型模型的數(shù)據(jù)挖掘,聚類是基于描述型模型的數(shù)據(jù)挖掘。關(guān)聯(lián)規(guī)則的基本算法有Apriori算法、抽樣算法、劃分等。分類的常用算法有基于統(tǒng)計的算法、基于決策樹的算法、基于距離的算法、基于神經(jīng)網(wǎng)絡的算法和基于規(guī)則的算法。聚類的常用算法有層次算法和劃分算法[4]。數(shù)據(jù)挖掘使用各種各樣的算法對于各種數(shù)據(jù)對象進行挖掘,最終得到數(shù)據(jù)挖掘的結(jié)果,從而為決策提供支持和依據(jù)。
2.1基于MOOC的學習者學習行為特征分析
網(wǎng)絡使得基于MOOC平臺的自主探究性學習得以實現(xiàn),網(wǎng)絡也提供了記錄學習者隱性學習行為的載體。正如在電子商務模式中挖掘消費者的消費行為特征一樣,基于MOOC平臺的網(wǎng)絡學習也需要挖掘?qū)W習者的學習特征。這些看起來無意識的、零散的學習行為之間潛藏著能折射學習者真實思維和學習情況的底層規(guī)則。對于隱藏在學習平臺記錄中的學習行為,采用合適的數(shù)據(jù)挖掘方法,生成的學習行為數(shù)據(jù)是改進學習、跟蹤學習、評價學習的最佳數(shù)據(jù)來源[5]。學習分析[6]通過對數(shù)據(jù)背后的信息進行挖掘并有效利用,從而追求最大的教育效益[7]。構(gòu)建能滿足學習跟蹤、評價及改進需求的行為分析模型和數(shù)據(jù)挖掘算法是關(guān)鍵。根據(jù)學習者的認知水平、性格動機、偏好等個性化屬性,可以制定相應的學習內(nèi)容與學習策略,可以建立相應的學習質(zhì)量評價模型,可以實現(xiàn)適合學習者的資源的推薦。由此可見,學習者行為特征分析的重要性。然而,準確、自動地獲取學習者的學習特征并不容易。MOOC出現(xiàn)的時間很短,目前,國內(nèi)有一些分析學習者反饋的課程報告[8],全球范圍內(nèi)相關(guān)研究也很少[9]。麻省理工學院的研究者們研究發(fā)現(xiàn),MOOC學習者的構(gòu)成學習模式、如何評估教學質(zhì)量遠比想象中復雜[10]。MACFAYDEN等[11]通過對學習系統(tǒng)中的數(shù)據(jù)進行追蹤分析,得出學習者期末成績有關(guān)的行為變量模型。蔣卓軒等[12]首次針對中文慕課中學習行為的特點,將學習者分類,從而更加深入地考察學習行為與學習效果之間的關(guān)系,其研究表明,基于學習行為的特征分析能有效地判別一個學習者能否成功完成學習任務,并能找出潛在的認真學習者。羅梅羅等提出了在個性化學習系統(tǒng)中提高Web挖掘效率的高級架構(gòu)[13]。在國內(nèi)外為數(shù)不多的研究中,有的專門研究學習者背景數(shù)據(jù);有的對學習者提交的作業(yè)數(shù)據(jù)進行研究[14];有的對學習者行為進行建模,預測學習行為[15-18]。學習者行為特征分析數(shù)據(jù)挖掘的數(shù)據(jù)源通常為學習者的注冊時間,何種時間與何種課程資源的交互,如何交互以及交互的程度,練習次數(shù),練習的成績,練習的錯誤率,錯誤的內(nèi)容和學習成績等。
2.2輔助教學過程決策
通過對MOOC各類資源的使用情況進行數(shù)據(jù)挖掘,可以發(fā)現(xiàn)MOOC各類資源的使用效率,資源分析的結(jié)果呈現(xiàn)給課程開發(fā)者、課程設(shè)計者和課程學習者,從而為優(yōu)化資源配置提供依據(jù)。通過對MOOC學習者聚類,給不同類別的學習者提供完全不同的教學資源,從而提高學習者的學習興趣、提高學習效果。文獻[19]通過學習者在線學習的路徑、瀏覽順序和習慣,確定學習者可能的學習風格類型,從而確定為學習者推薦合適的學習資源。通過數(shù)據(jù)挖掘的關(guān)聯(lián)分析與時間序列分析,得出課程設(shè)置先后順序、學習者特征、學習者成績之間的規(guī)則和信息,從而合理設(shè)置課程[20]。通過Web挖掘,教師可以了解和分析學習者的學習興趣,打造自主個性化學習的學習環(huán)境,并有針對性地制定教學策略。通過回歸分析、關(guān)聯(lián)規(guī)則等方法對不同類別學習者作出判別,判別教學方法和教學策略是否合適,從而為教師調(diào)整教學方法和教學策略提供依據(jù)。通過關(guān)聯(lián)規(guī)則,找出不同課程線上線下時間配置與學習者成績之間的關(guān)系,合理設(shè)置不同課程翻轉(zhuǎn)課堂的總時間以及時間安排,從而激發(fā)學習者學習興趣。通過數(shù)據(jù)挖掘技術(shù),探索不同課程有效合理的課程考核方式,從而真實反映目前不同學習者的學習成績和狀況。
2.3學習者學習狀況監(jiān)控預警
學習者學習情況監(jiān)控預警是指在學習者學習的不同階段,關(guān)注學習者的學習動態(tài),對學習者適時作出合適的預警或提醒,從而使學習者及時調(diào)整自我學習態(tài)度和方法,提高學習者的學習效率,達到好的學習效果。采用數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)分析與演變分析等功能,挖掘?qū)W生的學習動機、歸因和自我效能感,尋找學習者各種行為活動之間的內(nèi)在聯(lián)系和規(guī)則。如通過數(shù)據(jù)挖掘技術(shù)挖掘出一條規(guī)則:當學習者同時出現(xiàn)A、B兩種狀況時,會導致C這種學習結(jié)果,而C結(jié)果卻是不好的。那么,在跟蹤監(jiān)控學習者的學習過程中,當發(fā)現(xiàn)學習者出現(xiàn)了A狀況時,系統(tǒng)即對學習者發(fā)出提示,及時對學習者進行教學干預,從而修正學習者的學習行為和學習計劃。文獻[21]試圖建立對學習者的即時提醒機制,從而提高學習者的學習效果。又比如通過數(shù)據(jù)挖掘技術(shù)挖掘出一條規(guī)則:當學習者訪問MOOC平臺的某一個知識點或是某幾個互相有內(nèi)在關(guān)聯(lián)的知識點越來越頻繁,且在線時長越來越長,往往意味著學習者的專注度和興趣度增高或是學習者遇到學習難點。當對學習者進行學習跟蹤的過程中,發(fā)現(xiàn)學習者訪問MOOC平臺的某個知識點越來越頻繁并且在線時長變長時,系統(tǒng)即對學習者發(fā)出鼓勵,從而讓學習者感覺自己是被關(guān)注的,仿佛和真實的老師在交互,讓學習者有更暖心的學習體驗和堅定的學習態(tài)度,從而收到好的學習效果。MOOC盡管有諸多優(yōu)勢,卻仍然存在大量打醬油式的學習者并最終無法取代傳統(tǒng)的面對面的課堂學習的一個很重要的原因是,MOOC只是一個平臺,無法做到真正意義上教師的課堂管控,從而導致學習者想來就來想走就走的局面。而當MOOC有了對學習者學習情況的良好監(jiān)控預警時,其人性化的一面將有更好的體現(xiàn),從而讓MOOC的優(yōu)勢有更好的體現(xiàn)。
2.4教學評價
教學評價是教學管理中的重要環(huán)節(jié),客觀公正的教學評價是促進教育健康發(fā)展的保障。教學評價包括教師的教學和學習者的學習。MOOC教學評價屬于網(wǎng)絡教學評價的范疇。由于MOOC教學在實現(xiàn)上對互聯(lián)網(wǎng)及教育技術(shù)的依賴以及教與學活動在時空上的分離,MOOC教學評價重點關(guān)注學習資源和學習過程的評價。對學習者成績、教學信息、評價信息、學習者的問卷調(diào)查進行數(shù)據(jù)挖掘,可以發(fā)現(xiàn)影響教學效果的各個因素之間的關(guān)系,從而保證教學評價的公平性、科學性、客觀性和可靠性,有助于發(fā)現(xiàn)學習資源的使用和配置情況,以及教學各環(huán)節(jié)和要素有待改進的方面,有利于MOOC教學的互動和提高。文獻[22]設(shè)計實現(xiàn)了一種基于Moodle平臺,將教師評價、同學間互評以及學生本人自評相結(jié)合的基于過程的網(wǎng)絡教學評價。文獻[23]鑒于在線學習系統(tǒng)中學習質(zhì)量不佳的現(xiàn)狀,提出基于Web數(shù)據(jù)挖掘技術(shù)建立學習質(zhì)量評價的模型。
MOOC借助網(wǎng)絡技術(shù)和資本力量的推動,獲得了迅猛發(fā)展。盡管對MOOC褒貶不一,但其影響力深遠。數(shù)據(jù)挖掘技術(shù)是從大量信息中獲取有用信息的有效途徑。將數(shù)據(jù)挖掘技術(shù)應用在MOOC中,實現(xiàn)MOOC存在價值最大化,具有時代性和挑戰(zhàn)性。
參考文獻(References)
[1]孫青,艾明晶,曹慶華.MOOC環(huán)境下開放共享的實驗教學研究[J].實驗技術(shù)與管理,2014,31(8):192-195.
[2]祝智庭,劉名卓.“后MOOC”時期的在線學習新樣式[J].開放教育研究,2014,20(3):36-43.
[3]鄒志文,朱金偉.數(shù)據(jù)挖掘算法研究與綜述[J].計算機工程與設(shè)計,2005,26(9):2304-2307.
[4]DUNHAM M H .數(shù)據(jù)挖掘教程[M].郭崇慧,田風占,靳曉明,等譯.北京:清華大學出版社,2005.
[5]胡藝齡,顧小清,趙春.在線學習行為分析建模及挖掘[J].開放教育研究,2014,20(2):102-110.
[6]祝智庭,賀斌.智慧教育:教育信息化的新境界[J].電化教育研究,2012(12):5-13.
[7]SIMENS G,GASEVIC D,HAYTHORNTHWAITE C,et al.Open learning analytics:an integrated & modularized platform:Proposal to design,implement and evaluate an open platform to integrate heterogeneous learning analytics techniques[R/PL].[2015-02-26].SOLAR.http://www.solaresearch.org.2011.
[8]TEAM OF PKU MOOC TEACHING RESEARCH.2013 first MOOCs of Peking University:people,crowd and network courseinvestigation and analysis report[R].Beijing:Peking University,2014.
[9]WALDROP M M.Online learning:Campus 2.0[J].Nature,2013,495(7440):160-163.
[10]BRESLW L,PRITCHARD D,DEBOER J,et al.Stuying learing in the worldwide classroom:research into edX′s first MOOC[J].Research & Practice in Assessment,2013,8(1):13-25.
[11]MACFAYDEN L P,DAWSON S.Minging LMS data to develop an″Early Waring″system for educators:a proof of concept[J].Computers & Education,2010,54(2):588-599.
[12]蔣卓軒,張巖,李曉明.基于MOOC數(shù)據(jù)的學習行為分析與預測[J].計算機研究與發(fā)展,2015,52(3):1-14.
[13]NESTERKO S,DOTSENKO S,HU Q,et,al.Evaluating geographic data in MOOCs[C/OL]//NIPS Workshop on Data Driven Education,2013[2014-06-01].http://nesterko.com /files/papers /nips2013-nesterko.pdf.
[14]HAN F,VEERAMACHNENI K,O′REILLY U.Analyzing millions of submissions to help MOOC instruciors understand problem solving[C/OL]//NIPS Workshop on Data Driven Education,2013[EB/OL].[2014-06-01].http://groups.csail.mit.edu/EVODesignOpt /groupWebSite/uploads /Site/ProblemAnalytics.pdf.
[15]YANG D,SINHA T,ADAMSON D,et al.″Turn on,tune in,drop out″:Anticipating student dropouts in massive open online courses[C/OL]//NIPS Workshop on Data Driven Education,2013[2014-06-01].http://lytics.stanford.edu/datadriveneduca?tion/papers/yangetal.pdf.
[16]RAMESH A,GOLDWASSER D,HUANG B,et al,Modeling learner engagement in MOOCs using probabilistic soft logic[C/ OL]//NIPS Workshop on Data Driven Education,2013[2014-06-01].http://lytics.stanford.edu/datadriveneducation/papers/ ramshtal.pdf.
[17]BALAKRISHNAN G.Predicting student retention in massive open online courses using hidden markov models,UCB/EECS-2013-109[R/OL].Berkeley:University of California,Berkeley,2013.
[18]KIZILCEC R,PIECH C,SCHNEIDER E.Deconstructing disengagement:analyzing learner subpopulations in massive open online courses[C]// Proc of the 3rd Int Conf on Learning Analytics and Knowledge,New York:ACM,2013:170-179.
[19]LO J J,SHU P C.Identification of learning styles online by observing learners′browsing behavior through a neural network[J].British Journal of Educational Technology,2005,36(1):43-55.
[20]李瑞林.數(shù)據(jù)挖掘技術(shù)在教學過程中的應用[J].制造業(yè)自動化,2010,32(9):153-154.
[21]WILLIAMS J J,WILLIAMS B.Using interventions to improve online learning[C/OL]//NIPS Workshop on Data Driven Education,2013[2014-06-01].http://lytics.stanford.Edu /datadriveneducation/papers/williamswilliams.pdf.
[22]常金娥.網(wǎng)絡教學中教學評價系統(tǒng)的實現(xiàn)[J].中國教育信息化,2008(12):67-68.
[23]ALKHATTABI M,NEAGU D,CULLEN A.Assessing information quality of e-learning systems:A web mining approach[J].Computers in Human Behavior,2011,27(2):862-873.
(責任編輯:范建鳳)
Application of Data Mining Technology in MOOC
LIU Zhongqing
(Information Technology Center,Chengdu Sport University,Chengdu 610041,Sichuan,China)
Abstract:MOOC is aiming to support web-based massive open interactive online course.It is self-study,easy to be used,easy registration,abundant resource of study.So it attracts a lot of learners who have different study aim,different education background and different study characteristic all over the world.Only when MOOC meets learners individual requirements and study aim,it can obtain sustainable development and maximize its existence value.A lot of useful information can be obtained and to provide decision-making support with the technology of data mining.Data mining technology is used in MOOC to find the learners study behavior characteristic to support better education resource and teaching strategy,and then the existence value of MOOC is maximized.
Keywords:data mining;MOOC;study behavior;assistant decision-making;monitor early-warning
作者簡介:劉鐘情(1982—),女,助教,碩士,研究方向:計算機應用。
收稿日期:2015-04-15
DOI:10.16389/j.cnki.cn42-1737/n.2015.03.015
中圖分類號:TP391
文獻標志碼:A
文章編號:1673-0143(2015)03-0367-04