葉文靜,黃今慧
(北京工商大學(xué)計(jì)算機(jī)與信息工程學(xué)院,北京 100048)
在線學(xué)習(xí)是指通過計(jì)算機(jī)互聯(lián)網(wǎng),或通過移動無線網(wǎng)絡(luò),進(jìn)行內(nèi)容傳播和快速學(xué)習(xí)的方式[1]。這種學(xué)習(xí)方式不僅能使自身的學(xué)習(xí)需求被滿足,同時也收集了與學(xué)習(xí)行為相關(guān)的數(shù)據(jù)。這些數(shù)據(jù)可從網(wǎng)絡(luò)學(xué)習(xí)平臺提取,然后對這些數(shù)據(jù)更加深入挖掘,再通過挖掘出的信息研究在線學(xué)習(xí)行為。但是在線學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)龐大且雜亂,其中還包含了大量非結(jié)構(gòu)信息,單是使用簡單的統(tǒng)計(jì)分析方法不容易發(fā)現(xiàn)其隱藏的知識和規(guī)律,而且這些數(shù)據(jù)實(shí)際來源于教育大數(shù)據(jù),因此我們需要采用更為精確,復(fù)雜的方式來研究。數(shù)據(jù)挖掘技術(shù)可以分析大量數(shù)據(jù)并能提取出隱藏在其中的、人們事先不了解的并對決策有用的信息和知識。數(shù)據(jù)挖掘技術(shù)就是我們所要選擇的技術(shù)。
針對學(xué)習(xí)者的平均學(xué)習(xí)時間、學(xué)習(xí)進(jìn)度、學(xué)習(xí)交流、各類資源應(yīng)用等與學(xué)習(xí)行為有關(guān)的信息數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、可視化和各類挖掘方式,并結(jié)合學(xué)習(xí)者的個體數(shù)據(jù)來分析在線學(xué)習(xí)行為的特征[2-3]。可從以下幾個方面分析在線學(xué)習(xí)行為的特征:靜態(tài)和動態(tài)特征、固有和變化特征以及一般和風(fēng)格特征。本文主要分析的是學(xué)習(xí)者的靜態(tài)和動態(tài)特征。顧名思義,靜態(tài)特征是指學(xué)習(xí)者自身所固有的不會隨時間的變化而變化或緩慢變化的方面;而動態(tài)特征則是指學(xué)習(xí)者隨著時間的變化而發(fā)生顯著變化的,并會對學(xué)習(xí)產(chǎn)生較大影響方面。若要從這兩個方面展開分析,可以運(yùn)用以下方法:
①根據(jù)通過具有相似或相同靜態(tài)特征的學(xué)習(xí)者群體進(jìn)行不同動態(tài)特征的在線學(xué)習(xí)行為分析并將這類人群進(jìn)行分類。主要是通過協(xié)作過濾推薦算法,根據(jù)學(xué)習(xí)者的性別、年齡、學(xué)歷以及學(xué)業(yè)專業(yè)等靜態(tài)特征篩選出具有相似靜態(tài)特征的學(xué)習(xí)者,并對參與總?cè)藬?shù)進(jìn)行分組,將相似的學(xué)習(xí)者分為一組,調(diào)查并記錄每組學(xué)習(xí)者彼此間的在線學(xué)習(xí)行為數(shù)據(jù),分析這些數(shù)據(jù)可獲取在線學(xué)習(xí)行為的影響因素。例如,年齡在18~22歲的女性計(jì)算機(jī)本科專業(yè)學(xué)習(xí)群體的學(xué)習(xí)行為差異主要在那幾個方面、有何不同、如何分類等問題。
②基于對某網(wǎng)絡(luò)學(xué)習(xí)平臺的分析,根據(jù)分析能獲取在線學(xué)習(xí)行為特征。首先采集該平臺的數(shù)據(jù),如學(xué)習(xí)者的登錄時間、訪問路徑、在線時間長短以及在線學(xué)習(xí)內(nèi)容等,然后再對這些數(shù)據(jù)進(jìn)行分類研究;再如同一時間訪問該平臺且學(xué)習(xí)地點(diǎn)與時間長短相同的,正在學(xué)習(xí)同一門課程的人群可能是正在學(xué)校上課的學(xué)生,這類人群的學(xué)習(xí)行為不是自發(fā)的,但他們的學(xué)習(xí)進(jìn)度卻可以反映出各自的學(xué)習(xí)能力以及學(xué)習(xí)需求。
通過以上方法,可以了解在線學(xué)習(xí)行為受許多因素影響,而這些因素又可區(qū)分為內(nèi)在因素和外在因素,如個人學(xué)習(xí)目的、學(xué)習(xí)需求以及不同的時間安排等可歸納于內(nèi)在影響因素;不同專業(yè)的學(xué)習(xí)內(nèi)容、不同的學(xué)習(xí)平臺應(yīng)用、多樣的學(xué)習(xí)工具使用等可歸納于外在影響因素。這些因素不僅對在線學(xué)習(xí)行為帶來了不同程度的影響,而且還產(chǎn)生了各種在線學(xué)習(xí)行為特征。
以某一網(wǎng)絡(luò)學(xué)習(xí)平臺為基礎(chǔ),然后基于該平臺存儲的在線學(xué)習(xí)行為的記錄來采集數(shù)據(jù),再對這些零散的數(shù)據(jù)進(jìn)行處理和研究,最終可以構(gòu)建一個基于數(shù)據(jù)挖掘的在線學(xué)習(xí)行為模型[4]。該模型主要用于對學(xué)習(xí)需求、學(xué)習(xí)資源、學(xué)習(xí)工具以及學(xué)習(xí)模式對學(xué)習(xí)者在線學(xué)習(xí)行為所造成的影響以及影響程度的研究。之后還可用它挖掘出最佳學(xué)習(xí)者,并探索影響他們在線學(xué)習(xí)行為的因素。通過對這些因素的進(jìn)一步研究,將推測如何有效提高學(xué)習(xí)者學(xué)習(xí)效果的方法,讓更多的學(xué)習(xí)者有效地提高學(xué)習(xí)效率,找到適用于自己的學(xué)習(xí)方法。除此之外,我們還能將該模型應(yīng)用于網(wǎng)絡(luò)學(xué)習(xí)平臺,進(jìn)一步優(yōu)化網(wǎng)絡(luò)學(xué)習(xí)平臺,使它能獲得更精確的數(shù)據(jù),這樣就能更全面、系統(tǒng)、深入地分析在線學(xué)習(xí)行為,構(gòu)建更廣泛、更智能、更豐富的網(wǎng)絡(luò)學(xué)習(xí)平臺。
不同的數(shù)據(jù)采集所研究的方向也不同,但總體方向卻是相同的,都是針對學(xué)習(xí)者在線學(xué)習(xí)行為進(jìn)行研究。通過記載人們訪問網(wǎng)站的次數(shù)以及在該網(wǎng)站停留的時間,可以發(fā)現(xiàn)最受人們喜愛的網(wǎng)絡(luò)學(xué)習(xí)平臺;通過記錄學(xué)生作業(yè)完成情況以及解決疑難問題的方式,可以分析出他們的學(xué)習(xí)方式;通過記載人們對學(xué)習(xí)內(nèi)容的觀看時間以及留言評論,可以找到他們的興趣愛好[5]。因此,如何采集數(shù)據(jù)是構(gòu)建在線學(xué)習(xí)模型的第一步。主要是通過對網(wǎng)絡(luò)學(xué)習(xí)平臺的選取以及數(shù)據(jù)準(zhǔn)備來實(shí)現(xiàn)數(shù)據(jù)采集。
數(shù)據(jù)采集完成后,通過對該數(shù)據(jù)處理與挖掘,以獲取研究者想要的信息,這是對在線學(xué)習(xí)行為構(gòu)建模型的第二步。
3.2.1 數(shù)據(jù)處理
完成第一步后,所采集到的原始數(shù)據(jù)不能直接用于數(shù)據(jù)挖掘,還應(yīng)對該數(shù)據(jù)進(jìn)行處理,使其能轉(zhuǎn)換成可供數(shù)據(jù)挖掘使用的數(shù)據(jù)。
3.2.2 數(shù)據(jù)挖掘
將數(shù)據(jù)處理好后,就要使用數(shù)據(jù)挖據(jù)對其進(jìn)行操作。選取與研究一致的數(shù)據(jù)挖掘技術(shù)和工具也是至關(guān)重要的。分類,聚類和關(guān)聯(lián)規(guī)則挖掘等算法均可應(yīng)用于在線學(xué)習(xí)行為的數(shù)據(jù)挖掘中[6]。
完成以上步驟后,可以開始對在線學(xué)習(xí)行為構(gòu)建模型。首先,通過數(shù)據(jù)挖掘獲得的信息可以深入分析個人的在線學(xué)習(xí)時間安排、在線學(xué)習(xí)行為特征以及影響在線學(xué)習(xí)行為的主要因素。然后開始整合數(shù)據(jù),將這些數(shù)據(jù)關(guān)聯(lián)在一起并使用統(tǒng)計(jì)分析方法建立在線學(xué)習(xí)行為的模型。最后還要對該模型進(jìn)行驗(yàn)證,把該模型應(yīng)用于某一網(wǎng)絡(luò)學(xué)習(xí)平臺,然后根據(jù)學(xué)習(xí)者的在線學(xué)習(xí)效果是否提高,在線學(xué)習(xí)效率是否提升,以及該網(wǎng)絡(luò)學(xué)習(xí)平臺是否優(yōu)化成功來驗(yàn)證該模型的準(zhǔn)確性和實(shí)用性。
本文從數(shù)據(jù)挖掘的角度探討了在大數(shù)據(jù)背景下的在線學(xué)習(xí)行為的分析與建模。經(jīng)過一系列理論分析,最終發(fā)現(xiàn)構(gòu)建在線學(xué)習(xí)行為模型是具有重大意義的。建立在線學(xué)習(xí)行為的模型,對網(wǎng)絡(luò)學(xué)習(xí)平臺進(jìn)行優(yōu)化,找到適合自己的學(xué)習(xí)方法。這不僅對提高人們的學(xué)習(xí)效率有很大的作用,還能幫助他們獲得更完美的學(xué)習(xí)成果。這對于教育領(lǐng)域也是一大進(jìn)展。因此,基于數(shù)據(jù)挖掘的在線學(xué)習(xí)行為的分析與建模是十分有必要的。