羅麗紅++陳仲華++柯靈
摘 要 大數(shù)據(jù)技術(shù)的出現(xiàn)為在線教育帶來了新的機(jī)遇,同時(shí)也帶來了新的挑戰(zhàn)。利用好教育數(shù)據(jù)對(duì)之進(jìn)行挖掘和分析,使之更好的服務(wù)于在線教育顯得尤為重要。本文介紹了在線教育和大數(shù)據(jù)的基本概念和特點(diǎn),介紹了教育數(shù)據(jù)挖掘的步驟和常用的學(xué)習(xí)分析方法,希望能有助于大數(shù)據(jù)在在線教育領(lǐng)域的發(fā)展。
【關(guān)鍵詞】在線教育 大數(shù)據(jù) 數(shù)據(jù)挖掘 學(xué)習(xí)分析
大數(shù)據(jù)時(shí)代的到來,促進(jìn)了在線教育的興起,聚合了海量課程資源的在線教育平臺(tái)紛紛出現(xiàn)。這些在線教育平臺(tái)讓任何人隨時(shí)隨地都可以利用各種終端進(jìn)行學(xué)習(xí)。在我國教育資源分配不合理的情況下,在線教育為人們的學(xué)習(xí)提供了學(xué)習(xí)機(jī)會(huì)。同時(shí)大數(shù)據(jù)時(shí)代也對(duì)在線教育帶來了挑戰(zhàn),如何從大量的學(xué)習(xí)管理數(shù)據(jù)庫中提煉出有價(jià)值的數(shù)據(jù),發(fā)現(xiàn)學(xué)習(xí)者行為之間的關(guān)系以及其內(nèi)在邏輯關(guān)系,并以此為依據(jù)更好的制定教學(xué)計(jì)劃,從而能提供更好的在線教育。
1 基本概念
1.1 在線教育
在線教育即e-learning,是一種基于網(wǎng)絡(luò)的學(xué)習(xí)行為。在線教育采用多元化的教學(xué)形式,通過多媒體和網(wǎng)絡(luò)技術(shù)來傳遞文字、聲音、圖片、動(dòng)畫和視頻等資源信息,將線下資源放置到線上,使學(xué)習(xí)者通過互聯(lián)網(wǎng)即使相隔萬里也能進(jìn)行學(xué)習(xí)。具有代表性的在線教育平臺(tái)為MOOC,其中首個(gè)中文MOOC平臺(tái)截止2017年5月在線注冊(cè)用戶已經(jīng)超過700萬,學(xué)習(xí)者覆蓋175個(gè)國家和地區(qū)。
1.2 大數(shù)據(jù)
大數(shù)據(jù)(big data)指的是無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新的處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。大數(shù)據(jù)具有5V的特點(diǎn),即Volume(大量)、Velocity (高速)、Variety(多樣)、Value(價(jià)值)以及Veracity(精準(zhǔn)性)。
2 關(guān)鍵技術(shù)
在線教育平臺(tái)上提供的數(shù)據(jù)主要包括:用戶信息、課程信息、習(xí)題信息、視頻信息、論壇信息、用戶行為信息和知識(shí)圖譜信息。其中知識(shí)圖譜信息指的是教師總結(jié)的知識(shí)點(diǎn)的集合信息,根據(jù)不同學(xué)習(xí)者學(xué)習(xí)知識(shí)點(diǎn)的情況進(jìn)行動(dòng)態(tài)更新,得到每個(gè)學(xué)習(xí)者的學(xué)習(xí)圖譜。面對(duì)在線教育平臺(tái)上如此龐大繁雜的數(shù)據(jù),顯得對(duì)在線教育領(lǐng)域的大數(shù)據(jù)研究尤為重要。在線教育上大數(shù)據(jù)的研究主要包括教育數(shù)據(jù)挖掘和基本分析技術(shù)兩方面。
2.1 教育數(shù)據(jù)挖掘及其過程
來自數(shù)據(jù)挖掘網(wǎng)站的教育數(shù)據(jù)挖掘的定義為:教育數(shù)據(jù)挖掘指的是應(yīng)用數(shù)據(jù)挖掘方法從教育系統(tǒng)中的數(shù)據(jù)提取出有用的信息,從而更好的理解學(xué)生及其學(xué)習(xí)系統(tǒng)的新興學(xué)科。2011年出版的《教育數(shù)據(jù)挖掘手冊(cè)》上是這樣定義的:“教育數(shù)據(jù)挖掘是開發(fā)、研究和應(yīng)用計(jì)算機(jī)方法來對(duì)傳統(tǒng)教育環(huán)境中的大量數(shù)據(jù)進(jìn)行分析和監(jiān)測(cè),而數(shù)據(jù)的容量之大是其他方式很難或基本上無法進(jìn)行的”。教育數(shù)據(jù)挖掘主要要經(jīng)過以下過程。
2.1.1 數(shù)據(jù)的準(zhǔn)備
指的是從長(zhǎng)期無規(guī)律的原始數(shù)據(jù)中,經(jīng)過數(shù)據(jù)的選擇、清洗、推測(cè)、轉(zhuǎn)換等操作得到準(zhǔn)備要挖掘的數(shù)據(jù)。數(shù)據(jù)的準(zhǔn)備工作是后續(xù)工作的基礎(chǔ),直接決定著后續(xù)工作的質(zhì)量和效率。
2.1.2 數(shù)據(jù)挖掘
指的是按照挖掘的目標(biāo)要求,搭配合適的算法來挖掘數(shù)據(jù)的規(guī)律,常用的算法有決策樹、分類、神經(jīng)網(wǎng)絡(luò)、Apriori等。這步是整個(gè)挖掘程序的關(guān)鍵。
2.1.3 模式評(píng)價(jià)、分析
指的是對(duì)挖掘過的數(shù)據(jù)結(jié)果進(jìn)行解釋、分析,提出有價(jià)值的規(guī)律并將其還原為人們能夠理解的數(shù)據(jù)語言。
2.1.4 知識(shí)運(yùn)用
指的是挖掘的結(jié)果在現(xiàn)實(shí)決策中的運(yùn)用,這是數(shù)據(jù)挖掘的最終目的所在,也是其價(jià)值體現(xiàn)。
2.2 基本學(xué)習(xí)分析技術(shù)
數(shù)據(jù)挖掘的基本分析技術(shù)側(cè)重于模型的建立,著眼于整個(gè)系統(tǒng),而不是細(xì)節(jié)和算法,意在滿足各類對(duì)象的需求。常用的分析技術(shù)有聚類分析、分類和預(yù)測(cè)、關(guān)聯(lián)分析等、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法。
2.2.1 聚類分析
指的是將數(shù)據(jù)分類到不同的類或簇的這樣一個(gè)過程,但這個(gè)類是未知的,由聚類學(xué)習(xí)算法自己確定標(biāo)記。聚類分析是一種探索性分析,能從準(zhǔn)備的數(shù)據(jù)樣本出發(fā),自動(dòng)進(jìn)行分析。
2.2.2 分類和預(yù)測(cè)
分類是一種監(jiān)督的學(xué)習(xí)過程,根據(jù)訓(xùn)練數(shù)據(jù)集發(fā)現(xiàn)準(zhǔn)確描述來劃分類別。常見的分類算法有粗糙集、決策樹、貝葉斯等。預(yù)測(cè)是建立連續(xù)值函數(shù)模式,是根據(jù)分類和回歸來預(yù)測(cè)將來的規(guī)律。常見的預(yù)測(cè)方法有時(shí)間序列法、回歸分析法和局勢(shì)外推法。
2.2.3 關(guān)聯(lián)分析
指的是利用事物之間存在的聯(lián)系或關(guān)聯(lián)性,發(fā)現(xiàn)事物之間的規(guī)律,然后通過這個(gè)規(guī)律進(jìn)行預(yù)測(cè)。
2.2.4 人工神經(jīng)網(wǎng)絡(luò)
指的是試圖通過模擬大腦神經(jīng)網(wǎng)絡(luò)一處理、記憶信息的方式進(jìn)行信息處理,是由大量處理單元互聯(lián)組成的非線性、自適應(yīng)信息處理系統(tǒng)。
2.2.5 遺傳算法
指的是模擬達(dá)爾文生物進(jìn)化論的自然選擇和遺傳學(xué)機(jī)理的生物進(jìn)化過程的計(jì)算模型,是一種通過模擬自然進(jìn)化過程搜索最優(yōu)解的方法。包括初始化、個(gè)體評(píng)價(jià)、選擇運(yùn)算、交叉運(yùn)算、變異運(yùn)算的過程。
3 總結(jié)
本文簡(jiǎn)單介紹了在線教育與大數(shù)據(jù)的基本概念,對(duì)在大數(shù)據(jù)時(shí)代如何利用在線教育平臺(tái)的數(shù)據(jù)促進(jìn)在線教育的發(fā)展中所涉及的教育數(shù)據(jù)挖掘及過程和基本學(xué)習(xí)分析技術(shù)進(jìn)行了介紹。如何在繁雜、無序的數(shù)據(jù)中,利用數(shù)據(jù)挖掘及學(xué)習(xí)分析技術(shù)找到具有教育價(jià)值的數(shù)據(jù),并得出對(duì)決策有利的結(jié)論,仍然是一個(gè)艱巨的任務(wù),還需要進(jìn)一步加強(qiáng)大數(shù)據(jù)在在線教育中的研究力度。
參考文獻(xiàn)
[1]張枝實(shí).大數(shù)據(jù)時(shí)代在線教育的發(fā)展研究[J].江蘇開放大學(xué)學(xué)報(bào),2017(05):54-56.
[2]徐海波.淺析面向在線教育的大數(shù)據(jù)應(yīng)用[J].數(shù)據(jù)技術(shù)與應(yīng)用,2015(12):85-86.
[3]李平榮.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].重慶三峽學(xué)院學(xué)報(bào),2014(03):45-47.
作者簡(jiǎn)介
羅麗紅(1985-),女,江西省人,現(xiàn)為重慶電訊職業(yè)學(xué)院講師。研究方向?yàn)檐浖_發(fā),數(shù)據(jù)庫技術(shù)及應(yīng)用。
柯靈(1983-),男,重慶市人,任職于重慶郵電大學(xué)移通學(xué)院。
陳仲華(1981-),男,重慶市人,任職于重慶郵電大學(xué)移通學(xué)院。
作者單位
1.重慶電訊職業(yè)學(xué)院 重慶市 401520
2.重慶郵電大學(xué)移通學(xué)院 重慶市 401520endprint