摘? 要 為解決MOOC課程利用成效低、資源重復(fù)建設(shè)等問(wèn)題,基于深度學(xué)習(xí)理論,依據(jù)各MOOC平臺(tái)課程和知識(shí)的關(guān)系設(shè)計(jì)一款MOOC課程重構(gòu)系統(tǒng),并使用Jsoup技術(shù)對(duì)大量數(shù)據(jù)進(jìn)行收集和存儲(chǔ),使用自然語(yǔ)言處理技術(shù)對(duì)數(shù)據(jù)進(jìn)行關(guān)鍵字分析,繼而生成知識(shí)圖譜,同時(shí)系統(tǒng)記錄學(xué)習(xí)者學(xué)習(xí)狀態(tài),以便用戶持續(xù)性學(xué)習(xí),以期能為優(yōu)化MOOC課程資源提供一定的指導(dǎo)。
關(guān)鍵詞 深度學(xué)習(xí);課程重構(gòu);MOOC課程;SPOC;知識(shí)地圖;Jsoup技術(shù)
中圖分類號(hào):G642.3? ? 文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1671-489X(2020)04-0053-03
Study on Reconstruction System of MOOC Courses based on Deep Learning//LU Hong
Abstract In order to solve the problems of low utilization of MOOC courses and repeated construction of resources, this paper designs a?MOOC curriculum reconstruction system based on the theory of deep?learning, and uses Jsoup technology to collect and store large amounts?of data. The use of natural language processing technology to analyze?the data keywords, and then generates knowledge map, while the sys-tem records the learners learning status, so that users continue to learn, in order to optimize the MOOC course resources can provide some guidance.
Key words deep learning; course reconstruction; MOOC courses;? SPOC; knowledge map; Jsoup technology
1 引言
MOOC課程重構(gòu)(Courses Reconstruction)是以各類MOOC課程資源、SPOC課程資源和網(wǎng)絡(luò)公開(kāi)課等為基礎(chǔ),依據(jù)課程教學(xué)目標(biāo)或?qū)W習(xí)者的學(xué)習(xí)需求,采用知識(shí)圖譜生成技術(shù)重構(gòu)相應(yīng)課程資源的非結(jié)構(gòu)化關(guān)系圖,生成滿足課程教學(xué)目標(biāo)和學(xué)習(xí)者學(xué)習(xí)需求的非線性MOOC課程,并為學(xué)習(xí)提供相應(yīng)的動(dòng)態(tài)學(xué)習(xí)路徑推薦,其本質(zhì)是以學(xué)生為主體的動(dòng)態(tài)學(xué)習(xí)任務(wù)規(guī)劃與實(shí)時(shí)優(yōu)質(zhì)課程資源推薦過(guò)程。在過(guò)去的幾年中,不同架構(gòu)的MOOC平臺(tái)不斷涌現(xiàn),上線的MOOC課程和SPOC課程、用戶數(shù)量也呈爆炸式增長(zhǎng)趨勢(shì)[1]。但隨著MOOC課程在教育教學(xué)實(shí)踐中的深入應(yīng)用,逐漸暴露出課程輟學(xué)率高、課程資源重復(fù)、跨平臺(tái)資源檢索困難、課程評(píng)價(jià)模式單一等問(wèn)題[2-3]。
王繼元等通過(guò)利用NVivo工具對(duì)10篇訪談文本的數(shù)據(jù)進(jìn)行分析,指出MOOCs的高輟學(xué)率主要是因?yàn)閷W(xué)習(xí)者的學(xué)習(xí)主動(dòng)性和自我學(xué)習(xí)管理能力不足,MOOCs的高輟學(xué)率不應(yīng)該是評(píng)價(jià)MOOCs課程的唯一指標(biāo)[4]。徐振國(guó)等通過(guò)調(diào)查研究發(fā)現(xiàn),學(xué)習(xí)者自制力差、學(xué)習(xí)動(dòng)機(jī)不強(qiáng)烈、后期跟不上學(xué)習(xí)進(jìn)度等因素是導(dǎo)致MOOC學(xué)習(xí)者輟學(xué)的首要因素,并提出采用學(xué)分認(rèn)證、MOOC課程積分、獎(jiǎng)學(xué)金、混合式教學(xué)、強(qiáng)化在線學(xué)習(xí)互動(dòng)等策略提高M(jìn)OOC課程的完成率[5]。胡航等對(duì)深度學(xué)習(xí)概念的界定、有效實(shí)施建議等進(jìn)行了闡述,提出深度學(xué)習(xí)理論的本質(zhì)內(nèi)涵是“轉(zhuǎn)向?qū)W生、關(guān)注學(xué)習(xí)、技術(shù)促進(jìn)學(xué)習(xí)”[6]。
知識(shí)圖譜具有關(guān)聯(lián)性、結(jié)構(gòu)性和導(dǎo)航性,能夠幫助學(xué)習(xí)者采用非線性方式組織課程內(nèi)容,加速學(xué)習(xí)者對(duì)知識(shí)的理解和意義建構(gòu),避免學(xué)習(xí)者因知識(shí)結(jié)構(gòu)復(fù)雜迷失學(xué)習(xí)方向甚至終止學(xué)習(xí)過(guò)程。周穎等指出,知識(shí)地圖在課程學(xué)習(xí)中的應(yīng)用,能夠幫助學(xué)生有效管理學(xué)習(xí)目標(biāo)、知識(shí)體系、知識(shí)點(diǎn)間的邏輯聯(lián)系等,促進(jìn)學(xué)生對(duì)知識(shí)的理解、意義建構(gòu)、共享和創(chuàng)新。劉紅晶等提出一種基于教師視角的SPOC課程知識(shí)地圖的構(gòu)建方法,以利用知識(shí)地圖解決SPOC課程資源線性組織、課程知識(shí)體系不清晰等問(wèn)題。姜宛彤等通過(guò)將知識(shí)地圖應(yīng)用在微課視頻、學(xué)習(xí)資源管理等方面,解決了微課資源碎片化所給學(xué)習(xí)者所帶來(lái)的困難[7]。
Nen-Fu Huang等提出一種基于知識(shí)地圖的個(gè)性化自主學(xué)習(xí)路徑規(guī)劃方法,指出學(xué)習(xí)路徑規(guī)劃為完成預(yù)期的學(xué)習(xí)目標(biāo),學(xué)習(xí)者需要完成的學(xué)習(xí)活動(dòng)序列,可根據(jù)自身的學(xué)習(xí)狀態(tài)與學(xué)習(xí)評(píng)價(jià)反饋選擇和變更學(xué)習(xí)活動(dòng)路徑及學(xué)習(xí)內(nèi)容,依據(jù)分析學(xué)習(xí)者的現(xiàn)有知識(shí)水平構(gòu)建知識(shí)地圖,并為達(dá)到最終學(xué)習(xí)目標(biāo)自動(dòng)規(guī)劃下一步學(xué)習(xí)路徑[8]。
綜上所述,現(xiàn)有的MOOC課程存在完成率持續(xù)較低、學(xué)習(xí)效率較差等問(wèn)題,而關(guān)于深度學(xué)習(xí)視角下MOOC課程資源建設(shè)、跨平臺(tái)共享與檢索的研究很少,大部分集中在MOOC課程學(xué)習(xí)過(guò)程中遇到的問(wèn)題探究和深度學(xué)習(xí)概念本身的研究。因此,研究一款基于深度學(xué)習(xí)的MOOC課程重構(gòu)系統(tǒng),將為學(xué)習(xí)者利用MOOC課程資源持續(xù)開(kāi)展深度學(xué)習(xí)提供有力的技術(shù)服務(wù),同時(shí)將為優(yōu)質(zhì)數(shù)字課程教學(xué)資源的跨平臺(tái)檢索與共享提供技術(shù)支持。
2 基于深度學(xué)習(xí)的MOOC課程重構(gòu)系統(tǒng)設(shè)計(jì)
基于深度學(xué)習(xí)的MOOC課程重構(gòu)系統(tǒng)幫助學(xué)習(xí)者采用非線性方式組織課程內(nèi)容,加速學(xué)習(xí)者對(duì)知識(shí)的理解和意義建構(gòu),避免學(xué)習(xí)者因知識(shí)結(jié)構(gòu)復(fù)雜迷失學(xué)習(xí)方向甚至終止學(xué)習(xí)過(guò)程。該系統(tǒng)主要包含四大模塊,分別是個(gè)人信息模塊、數(shù)據(jù)收集模塊、學(xué)習(xí)中心模塊、知識(shí)導(dǎo)航模塊,其功能模塊圖如圖1所示。
個(gè)人信息模塊? 基于深度學(xué)習(xí)的MOOC課程重構(gòu)系統(tǒng)是一種以學(xué)習(xí)需求和學(xué)習(xí)主動(dòng)性為驅(qū)動(dòng)力的個(gè)性化MOOC課程學(xué)習(xí)服務(wù)平臺(tái),以保持學(xué)習(xí)者M(jìn)OOC在線課程學(xué)習(xí)的持續(xù)性和注意力為目標(biāo)。個(gè)人信息模塊主要包含用戶登錄、注冊(cè)和用戶信息可視化顯示功能,該模塊用于將用戶的登錄信息和學(xué)習(xí)需求信息存儲(chǔ)到數(shù)據(jù)庫(kù),并在用戶登錄后以可視化進(jìn)度條的形式展示在前臺(tái)頁(yè)面,用戶登錄注冊(cè)的基本信息將被應(yīng)用于數(shù)據(jù)收集。
數(shù)據(jù)收集模塊? 由于大部分MOOC課程資源建設(shè)標(biāo)準(zhǔn)不統(tǒng)一,需要為訓(xùn)練MOOC課程重構(gòu)模型收集和標(biāo)注一個(gè)具有規(guī)范標(biāo)準(zhǔn)的MOOC課程資源數(shù)據(jù)集。
首先,以某一門MOOC課程為例,收集來(lái)自不同MOOC平臺(tái)、SPOC平臺(tái)、網(wǎng)絡(luò)公開(kāi)課平臺(tái)和精品課程平臺(tái)的課程資源(含教學(xué)目標(biāo)、課程內(nèi)容、視頻、課件、歷史互動(dòng)記錄等)、知識(shí)點(diǎn)相關(guān)的文本描述和圖片等資源。
其次,分析該課程的學(xué)習(xí)目標(biāo)、知識(shí)點(diǎn),各知識(shí)點(diǎn)對(duì)應(yīng)的學(xué)習(xí)內(nèi)容及其相應(yīng)的學(xué)習(xí)資料,同時(shí)標(biāo)注和記錄“課程—學(xué)習(xí)目標(biāo)—知識(shí)點(diǎn)—學(xué)習(xí)內(nèi)容—各類學(xué)習(xí)資源”之間的相互關(guān)系,以此為依據(jù),對(duì)所收集的課程資源進(jìn)行標(biāo)注,以用于構(gòu)建知識(shí)圖譜。
學(xué)習(xí)中心模塊? 對(duì)于視頻、音頻和圖像課程資源,首先,基于雙向長(zhǎng)短時(shí)記憶(Bidirectional Long Short Term Memory,BLSTM)訓(xùn)練一個(gè)MOOC課程資源的文本描述模型,并生成相應(yīng)的文本描述信息;
其次,以所生成的文本描述信息和其他文字形式的在線輔導(dǎo)記錄、交流互動(dòng)內(nèi)容等作為輸入,采用深度神經(jīng)網(wǎng)絡(luò)方法訓(xùn)練一個(gè)自動(dòng)知識(shí)點(diǎn)抽取模型;
最后,采用度量學(xué)習(xí)方法計(jì)算各知識(shí)點(diǎn)之間的關(guān)系及其相似度,以三元組“知識(shí)點(diǎn)—關(guān)系—知識(shí)點(diǎn)”為基礎(chǔ),采用非監(jiān)督學(xué)習(xí)方法生成面向MOOC課程重構(gòu)的知識(shí)圖譜,以用于知識(shí)導(dǎo)航學(xué)習(xí)資源推薦。
知識(shí)導(dǎo)航模塊? 以重構(gòu)的MOOC課程知識(shí)圖譜為基礎(chǔ),根據(jù)學(xué)習(xí)者的學(xué)習(xí)需求、學(xué)習(xí)特征、學(xué)習(xí)評(píng)價(jià)等,利用增強(qiáng)學(xué)習(xí)方法Q-Learning為學(xué)習(xí)者生成動(dòng)態(tài)學(xué)習(xí)路徑。同時(shí),采用神經(jīng)協(xié)同過(guò)濾(Neural Collaborative Filtering,NCF)算法為學(xué)習(xí)者推薦相應(yīng)的多模態(tài)優(yōu)質(zhì)課程資源或在線輔導(dǎo),變革傳統(tǒng)MOOC課程的線性學(xué)習(xí)活動(dòng)序列和資源利用方式,及時(shí)發(fā)現(xiàn)和解決學(xué)習(xí)者的學(xué)習(xí)需求和學(xué)習(xí)困難,保證深度學(xué)習(xí)過(guò)程的可持續(xù)性進(jìn)行。
3 系統(tǒng)實(shí)現(xiàn)關(guān)鍵技術(shù)
類結(jié)構(gòu)設(shè)計(jì)? 基于深度學(xué)習(xí)的MOOC課程重構(gòu)系統(tǒng)的類結(jié)構(gòu)主要分為五層。
1)用于連接數(shù)據(jù)庫(kù)的DAO層。DAO層的構(gòu)成是由一個(gè)BaseDao、多個(gè)自定義Dao接口和與其對(duì)應(yīng)的實(shí)現(xiàn)類組成的,其主要作用是從數(shù)據(jù)庫(kù)獲取數(shù)據(jù)。
2)用于業(yè)務(wù)服務(wù)的SERVICE層。SERVICE層包括自定義的Service接口和相對(duì)應(yīng)的實(shí)現(xiàn)類,這一層的主要作用是將業(yè)務(wù)與數(shù)據(jù)庫(kù)連接分開(kāi),起到分離的作用,降低了代碼的耦合。
3)用于與JSP交互的SERVLET層。SERVLET層包含多個(gè)Servlet,用于和對(duì)應(yīng)的不同JSP傳輸數(shù)據(jù),由于每一個(gè)JSP都會(huì)不止響應(yīng)一次后臺(tái),因此,Servlet的數(shù)量還是很多的。
4)用于完成邏輯處理的FUNCTION層。FUNCTION層為了減少代碼耦合,主要存放數(shù)據(jù)處理方法,以達(dá)到接口和具體實(shí)現(xiàn)相分離。
5)實(shí)體類層MODEL。MODEL層用實(shí)體類作為存儲(chǔ)媒介,可以方便與數(shù)據(jù)庫(kù)對(duì)接,同時(shí)也定義了一些類比以便于數(shù)據(jù)傳輸。
數(shù)據(jù)收集的方法? Jsoup是一種用來(lái)解析網(wǎng)頁(yè)信息的基于Java語(yǔ)言的工具包,可以直接分析Url地址指向的網(wǎng)頁(yè)和Html文件。Jsoup工具包中定義了Document類,借助title()、getElementsByClass()和getElementsByTag(),可以將Html頁(yè)面轉(zhuǎn)化為一個(gè)獨(dú)立的Document對(duì)象。所以,通過(guò)Jsoup封裝的方法即可通過(guò)網(wǎng)站的Url,獲取到整個(gè)網(wǎng)頁(yè)的信息。
數(shù)據(jù)處理技術(shù)? 漢語(yǔ)言包HanLP常用于中文分析,其功能包括中文分詞、命名實(shí)體識(shí)別、關(guān)鍵詞提取、自動(dòng)摘要、短語(yǔ)提取、拼音轉(zhuǎn)換、簡(jiǎn)繁轉(zhuǎn)換、文本推薦、依存句法分析等。系統(tǒng)中使用HanLP提取MOOC課程的微視頻標(biāo)題、字幕、測(cè)驗(yàn)作業(yè)的問(wèn)題與答案等文本信息,以形成知識(shí)節(jié)點(diǎn)。
知識(shí)圖譜的生成? Jsoup是一款Java的Html解析器,可直接解析某個(gè)Url地址、Html文本內(nèi)容。它提供了一套非常省力的Api,可通過(guò)Dom、Css以及類似于jQuery的操作方法來(lái)取出和操作數(shù)據(jù),用于展示創(chuàng)建好的知識(shí)圖譜。
知識(shí)導(dǎo)航的建立? 知識(shí)導(dǎo)航主要涉及將用戶在課程系統(tǒng)中的學(xué)習(xí)狀態(tài)返回給后臺(tái),其由異步傳輸和zTree的回調(diào)函數(shù)實(shí)現(xiàn)。zTree的回調(diào)函數(shù)寫(xiě)在setting內(nèi)的callback
代碼塊內(nèi),當(dāng)用戶點(diǎn)擊葉子節(jié)點(diǎn)以后,Js方法將會(huì)檢測(cè)到用戶點(diǎn)擊的葉子節(jié)點(diǎn)的name項(xiàng)。為提高用戶體驗(yàn)感,使用Ajax異步傳輸技術(shù)。異步傳輸獲取到用戶點(diǎn)擊的節(jié)點(diǎn)以后,就要將該節(jié)點(diǎn)的name信息傳向后臺(tái),記錄到數(shù)據(jù)庫(kù)中。向后臺(tái)傳輸兩個(gè)數(shù)據(jù):課程號(hào)id和節(jié)點(diǎn)信息name。后臺(tái)根據(jù)課程的id將傳來(lái)的name拼接到數(shù)據(jù)庫(kù)中的課程節(jié)點(diǎn)字段中,以此實(shí)現(xiàn)學(xué)習(xí)路徑規(guī)劃。
4 結(jié)語(yǔ)
本文結(jié)合當(dāng)下MOOC課程輟學(xué)率高和跨平臺(tái)資源檢索困難等問(wèn)題,基于深度學(xué)習(xí)理論設(shè)計(jì)并實(shí)現(xiàn)一款MOOC課程重構(gòu)系統(tǒng)原型,以期指導(dǎo)提高M(jìn)OOC課程評(píng)價(jià)的效用和課程資源的質(zhì)量,避免MOOC課程資源的重復(fù)建設(shè)。下一步工作將采用增強(qiáng)學(xué)習(xí)算法Q-Learning和神經(jīng)協(xié)同過(guò)濾算法NCF,實(shí)現(xiàn)基于多模態(tài)MOOC課程知識(shí)圖譜的動(dòng)態(tài)學(xué)習(xí)路徑規(guī)劃和優(yōu)質(zhì)多模態(tài)學(xué)習(xí)資源推薦,以提高M(jìn)OOC課程資源的利用率和MOOC課程的學(xué)習(xí)效率。
參考文獻(xiàn)
[1]張剛要,沈大為.理解MOOCs的完成率:歸因與挑戰(zhàn)[J].中國(guó)電化教育,2017(12):82-89.
[2]徐振國(guó),張冠文,石林,等.MOOC學(xué)習(xí)者輟學(xué)行為的影響因素研究[J].現(xiàn)代教育技術(shù),2017,27(9):100-106.
[3]王雪宇,鄒剛,李驍.基于MOOC數(shù)據(jù)的學(xué)習(xí)者輟課預(yù)測(cè)研究[J].現(xiàn)代教育技術(shù),2017,27(6):94-100.
[4]王繼元,張剛要.限制MOOC學(xué)習(xí)者自由對(duì)其持續(xù)學(xué)習(xí)意向的影響機(jī)制研究[J].電化教育研究,2019(2):54-61.
[5]徐振國(guó),張冠文,石林,等.MOOC學(xué)習(xí)者輟學(xué)行為的影響因素研究[J].現(xiàn)代教育技術(shù),2017(9):100-106.
[6]胡航,董玉琦.深度學(xué)習(xí)內(nèi)容及其資源表征的實(shí)證研究[J].中國(guó)遠(yuǎn)程教育,2017(8):57-63,80.
[7]劉紅晶,譚良.基于教師視角的SPOC課程知識(shí)地圖構(gòu)建方法研究[J].電化教育研究,2017(9):64-70.
[8]Huang N F, Lee C A, Huang Y W, et al. On the Auto-matic Construction of Knowledge-Map from Handouts forMOOC Courses[M]//International Conference on Intelli-gent Information Hiding and Multimedia Signal Pro-cessing.2017:107-114.
項(xiàng)目來(lái)源:江蘇省教育科學(xué)“十三五”規(guī)劃課題“深度學(xué)習(xí)視角下基于多模態(tài)知識(shí)圖譜的MOOC課程重構(gòu)研究”階段性成果(課題批準(zhǔn)文號(hào):C-b/2018/01/19)。
作者:路紅,南京理工大學(xué)紫金學(xué)院,講師,研究方向?yàn)橹R(shí)圖譜、深度學(xué)習(xí)(210023)。