虞思慧 楊明 潘城杰 程俊豪 李文娟
摘要:學(xué)情分析是智慧教育的重要組成部分。云計(jì)算是存儲(chǔ)和處理大規(guī)模數(shù)據(jù)的最新技術(shù)手段。本文將云計(jì)算和深度學(xué)習(xí)技術(shù)相結(jié)合,提出了一款高效、智能的學(xué)情數(shù)據(jù)分析系統(tǒng)。本文首先構(gòu)建了基于云邊混合架構(gòu)的學(xué)情分析系統(tǒng)模型,接著詳細(xì)論述了平臺(tái)的設(shè)計(jì)、部署和實(shí)施過(guò)程,最后設(shè)計(jì)了一系列相關(guān)實(shí)驗(yàn)進(jìn)行實(shí)證分析。通過(guò)對(duì)中國(guó)大學(xué)MOOC平臺(tái)真實(shí)數(shù)據(jù)的建模分析結(jié)果表明,該系統(tǒng)具備了良好的數(shù)據(jù)分析和挖掘能力,能夠?yàn)榻處熀徒虒W(xué)管理者提供有益參考,從而為在線教學(xué)效果和滿意度提升提供技術(shù)支持。
關(guān)鍵詞:云計(jì)算;深度學(xué)習(xí)建模;學(xué)情分析系統(tǒng);教學(xué)質(zhì)量評(píng)價(jià)
中圖分類號(hào):TP393? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2024)07-0018-03
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)
0 引言
隨著互聯(lián)網(wǎng)的縱深發(fā)展,教育領(lǐng)域逐漸邁入數(shù)字化、智慧化時(shí)代。線上教學(xué)成為目前主流的教學(xué)形式之一。盡管線上教學(xué)平臺(tái)的課程內(nèi)容十分豐富,然而質(zhì)量卻良莠不齊,很難為學(xué)習(xí)者提供量身定制的個(gè)性化服務(wù)。學(xué)情分析系統(tǒng)提供了對(duì)教學(xué)內(nèi)容和學(xué)評(píng)教數(shù)據(jù)的分析總結(jié),能夠輔助決策,是提高在線教學(xué)質(zhì)量、提升教學(xué)效果的重要技術(shù)手段。
學(xué)情分析系統(tǒng)的研究始于20世紀(jì)末,隨著深度學(xué)習(xí)技術(shù)的崛起而得到顯著發(fā)展。早期學(xué)情分析系統(tǒng)主要依賴于傳統(tǒng)機(jī)器學(xué)習(xí)算法,如決策樹、支持向量機(jī)等,這些方法在處理大規(guī)模數(shù)據(jù)時(shí)顯得力不從心。而深度學(xué)習(xí)算法,因其出色的特征學(xué)習(xí)和模式識(shí)別能力,在學(xué)情分析領(lǐng)域逐漸得到廣泛應(yīng)用。比如,王麗、談云兵[1]探討了深度學(xué)習(xí)模型在博客數(shù)據(jù)分析中的應(yīng)用和存在問(wèn)題。景紅娜[2]構(gòu)建了基于Moodle教學(xué)平臺(tái)的深度學(xué)習(xí)模式,并通過(guò)實(shí)驗(yàn)驗(yàn)證了該模式的教學(xué)效果。段金菊[3]結(jié)合實(shí)踐案例剖析了深度學(xué)習(xí)的學(xué)習(xí)策略和效果。Meng等人[4]提出一種基于多層卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)方法。Deng等人[5]提出了結(jié)合CNN與BiLSTM的融合模型進(jìn)行文本情感分析,有效地提高了情感識(shí)別的準(zhǔn)確性。Szu-Yin Lin等人[6]使用集成學(xué)習(xí)技術(shù)和BERT模型實(shí)施情感分析取得了不錯(cuò)的效果。
然而,目前學(xué)情分析系統(tǒng)的研究仍面臨諸多問(wèn)題和挑戰(zhàn),包括:1) 學(xué)情數(shù)據(jù)量大,且存在評(píng)價(jià)數(shù)據(jù)離散化、個(gè)性化等特點(diǎn),而目前主流的學(xué)情分析平臺(tái)普遍存在數(shù)據(jù)存儲(chǔ)和計(jì)算能力不足的問(wèn)題。2) 盡管深度學(xué)習(xí)算法的學(xué)習(xí)效果比較理想,但在處理教育大數(shù)據(jù)時(shí),由于算法自身的開(kāi)銷較大,導(dǎo)致數(shù)據(jù)分析結(jié)果的實(shí)時(shí)性不足。3) 大部分學(xué)情分析系統(tǒng)針對(duì)的并非真實(shí)的評(píng)價(jià)數(shù)據(jù),數(shù)據(jù)統(tǒng)計(jì)分析的結(jié)果缺乏可信度和說(shuō)服力。
針對(duì)上述問(wèn)題,本文結(jié)合云計(jì)算和深度學(xué)習(xí)技術(shù)提出了一款基于云邊混合架構(gòu)的學(xué)情分析模型。云計(jì)算為存儲(chǔ)和分析大規(guī)模學(xué)情數(shù)據(jù)提供了強(qiáng)大的存儲(chǔ)和計(jì)算能力,深度學(xué)習(xí)算法則提供了處理復(fù)雜數(shù)據(jù)和提取高階特征的能力,有助實(shí)現(xiàn)對(duì)學(xué)生學(xué)習(xí)行為的精準(zhǔn)預(yù)測(cè)和個(gè)性化建議。
本文的主要貢獻(xiàn)包括:
1)提出了一款基于云邊混合架構(gòu)的學(xué)情分析模型,通過(guò)云邊協(xié)同提高學(xué)情分析處理的能力,降低處理時(shí)延。
2)比較了不同深度學(xué)習(xí)模型在實(shí)施學(xué)情數(shù)據(jù)挖掘的效果,以幫助學(xué)情分析選擇最佳模型,從而提高數(shù)據(jù)分類和挖掘的準(zhǔn)確性。
3)實(shí)現(xiàn)對(duì)中國(guó)大學(xué)幕客平臺(tái)真實(shí)數(shù)據(jù)的爬取和分析,實(shí)現(xiàn)對(duì)教學(xué)效果的縱橫向比較,有助于提升線上教學(xué)質(zhì)量。
本文余下部分的結(jié)構(gòu)如下:第1章介紹系統(tǒng)總體架構(gòu)和主要實(shí)施流程,第2章是系統(tǒng)建模與實(shí)驗(yàn)設(shè)計(jì),第3章對(duì)中國(guó)大學(xué)慕課的實(shí)證數(shù)據(jù)進(jìn)行學(xué)情分析并給出對(duì)比報(bào)告。最后是總結(jié)和展望。
1 系統(tǒng)總體架構(gòu)
1.1 系統(tǒng)模型
基于云邊混合架構(gòu)的學(xué)情分析系統(tǒng)模型架構(gòu)圖如圖1所示:
學(xué)情分析系統(tǒng)搭建在云計(jì)算和邊端環(huán)境中,實(shí)施基于云邊協(xié)同的深度學(xué)習(xí)過(guò)程。云主機(jī)實(shí)現(xiàn)學(xué)情大數(shù)據(jù)的存儲(chǔ)和離線分析,邊緣和終端設(shè)備實(shí)施小規(guī)模數(shù)據(jù)的本地在線學(xué)習(xí)。云邊協(xié)作加速了數(shù)據(jù)分析過(guò)程,降低處理時(shí)延。數(shù)據(jù)層實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)和事務(wù)處理,業(yè)務(wù)層則根據(jù)應(yīng)用需求構(gòu)建相關(guān)接口。前端搭建了友好的人機(jī)交互接口,便于使用者輕松掌握學(xué)情分析的結(jié)果。
1.2 系統(tǒng)功能模塊圖
本系統(tǒng)的功能模塊圖如圖 2所示:
該系統(tǒng)分析平臺(tái)將通過(guò)可視化方式展示學(xué)情數(shù)據(jù)的分析結(jié)果,并提供實(shí)時(shí)反饋和建議,為高校學(xué)生和教師提供全方位的學(xué)情分析服務(wù),幫助學(xué)生改進(jìn)學(xué)習(xí)策略、提高學(xué)習(xí)效率,學(xué)生可以更清晰地了解自己的學(xué)情狀態(tài)和學(xué)習(xí)效果幫助教師更好地了解學(xué)生的學(xué)習(xí)情況和需求,提供有針對(duì)性的教育教學(xué)服務(wù)。
1.3 研究步驟
主要研究步驟是:1) 學(xué)情數(shù)據(jù)爬取。2) 數(shù)據(jù)預(yù)處理,包括去除重復(fù)數(shù)據(jù)、去除無(wú)用字符、使用jieba分詞、去除停用詞等,處理出本項(xiàng)目所需要的數(shù)據(jù)內(nèi)容,使用w2v生成詞向量并對(duì)數(shù)據(jù)集進(jìn)行劃分。3) 根據(jù)學(xué)情分析的任務(wù)需求選擇適合的深度學(xué)習(xí)模型,包括設(shè)計(jì)實(shí)驗(yàn)對(duì)現(xiàn)有的深度模型進(jìn)行對(duì)比,采用交叉驗(yàn)證等方法評(píng)估模型的性能,最終選出最合適的模型。4) 進(jìn)行調(diào)參和優(yōu)化以提高模型的精度、泛化性和可解釋性。5) 結(jié)果預(yù)測(cè),將預(yù)測(cè)結(jié)果轉(zhuǎn)化為相應(yīng)的學(xué)情建議,例如課程推薦、個(gè)性化教學(xué)建議等。
2 建模與實(shí)驗(yàn)設(shè)計(jì)
2.1 模型對(duì)比
本文重點(diǎn)比較了深度學(xué)習(xí)中的LSTM模型和BERT模型,如圖3所示。LSTM模型具有更低的損失分?jǐn)?shù),因而表現(xiàn)更好。然而,兩種模型的準(zhǔn)確度基本相同,所以如果只關(guān)注準(zhǔn)確度,那么二者表現(xiàn)相當(dāng)。
2.2 實(shí)驗(yàn)設(shè)計(jì)
2.2.1 環(huán)境配置
表1? 環(huán)境配置
[開(kāi)發(fā)的硬件環(huán)境 處理器:Intel Core i7-1165G7 CPU @ 2.80GHz 內(nèi)存:16 GB DDR4 運(yùn)行的硬件環(huán)境 處理器:Intel(R) Core(TM) i5-3230M CPU @ 2.60GHz 內(nèi)存:8GB 操作系統(tǒng) Windows 10/11 軟件開(kāi)發(fā)環(huán)境/開(kāi)發(fā)工具 PyCharm 2023.1.2、AutoDl 該軟件的運(yùn)行平臺(tái)/操作系統(tǒng) PyCharm 2023.1.2、Windows 10/11 軟件運(yùn)行支撐環(huán)境/支持軟件 Windows 7、Windows 10 編程語(yǔ)言 Python ]
2.2.2 實(shí)施訓(xùn)練
使用云主機(jī)Auto DL服務(wù)器,配合本地進(jìn)行數(shù)據(jù)集相關(guān)訓(xùn)練。
2.2.3 運(yùn)行結(jié)果
系統(tǒng)運(yùn)行結(jié)果如圖5所示,當(dāng)輸入隨機(jī)的評(píng)價(jià)內(nèi)容時(shí),系統(tǒng)會(huì)給出評(píng)判結(jié)果。
3 學(xué)情數(shù)據(jù)分析
筆者爬取了中國(guó)大學(xué)幕客的評(píng)價(jià)數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行了分析,以下是分析結(jié)果。
3.1 同一所學(xué)校內(nèi)部不同課程評(píng)分比較的結(jié)果
圖6展示幕客網(wǎng)中北京大學(xué)30門課程的評(píng)分?jǐn)?shù)據(jù)。從圖中可以看出,課程評(píng)分方差較大,這說(shuō)明學(xué)生對(duì)課程的評(píng)價(jià)存在較大差異??赡艿脑蚴菍W(xué)生對(duì)課程教學(xué)內(nèi)容的喜好程度不同,評(píng)價(jià)較為個(gè)體化。而對(duì)于此類評(píng)分方差較大的課程,學(xué)校可以考慮進(jìn)一步探究評(píng)價(jià)意見(jiàn)差異化的具體原因,通過(guò)調(diào)整課程內(nèi)容、改進(jìn)教學(xué)方法或者增加師生互動(dòng)的方式,提高整體課程質(zhì)量。
3.2 不同大學(xué)之間橫向比較的結(jié)果
圖7和圖8分別展示了不同大學(xué)的課程數(shù)量和評(píng)論數(shù)量的折線圖,不難看出:1) 課程數(shù)量的分布在不同大學(xué)間呈現(xiàn)較大的不均勻性,這可能受到大學(xué)規(guī)模、學(xué)科設(shè)置、在線教育發(fā)展等因素的影響。2) 評(píng)論數(shù)據(jù)呈現(xiàn)明顯的差異,這反映了學(xué)生對(duì)不同大學(xué)課程的關(guān)注和反饋程度,評(píng)論數(shù)量的分布可能受到課程內(nèi)容、教學(xué)質(zhì)量、學(xué)生參與度等因素的影響。3) 關(guān)聯(lián)性觀察:還可以觀察到課程數(shù)量和評(píng)論數(shù)量之間的關(guān)聯(lián)關(guān)系,借助這種關(guān)聯(lián)性可以幫助大學(xué)進(jìn)行在線教育課程的優(yōu)化和改進(jìn)。
4 總結(jié)與展望
本文提出了一款融合云計(jì)算和深度學(xué)習(xí)技術(shù)的學(xué)情分析系統(tǒng)。系統(tǒng)基于云邊混合計(jì)算模型,充分利用了云計(jì)算的高可用性、邊緣計(jì)算系統(tǒng)的低時(shí)延,以及深度學(xué)習(xí)的數(shù)據(jù)分析能力,能夠?qū)崿F(xiàn)對(duì)學(xué)生學(xué)習(xí)行為和課程評(píng)價(jià)數(shù)據(jù)的精準(zhǔn)分析。實(shí)驗(yàn)設(shè)計(jì)和實(shí)證分析結(jié)果表明,本文模型在數(shù)據(jù)分析精度和性能方面的有效性。然而,本文提出的系統(tǒng)暫未考慮數(shù)據(jù)的安全和隱私保護(hù)問(wèn)題,以及深度學(xué)習(xí)模型在云邊混合架構(gòu)的優(yōu)化和參數(shù)自適應(yīng)調(diào)整等,這是筆者接下去重點(diǎn)研究的方向。
參考文獻(xiàn):
[1] 王麗,談云兵.基于博客的深度學(xué)習(xí)研究:以蘇州教育博客為例[J].中國(guó)遠(yuǎn)程教育,2009(12):40-43,79.
[2] 景紅娜,陳琳,趙雪萍.基于Moodle的深層學(xué)習(xí)研究[J].遠(yuǎn)程教育雜志,2011,29(3):27-33.
[3] 段金菊.e-Learning環(huán)境下促進(jìn)深度學(xué)習(xí)的策略研究[J].中國(guó)電化教育,2012(5):38-43.
[4] MENG J N,LONG Y C,YU Y H,et al.Cross-domain text sentiment analysis based on CNN_FT method[J].Information,2019,10(5):162.
[5] DENG H J,ERGU D J,LIU F Y,et al.Text sentiment analysis of fusion model based on attention mechanism[J].Procedia Computer Science,2022,199:741-748.
[6] LIN S Y,KUNG Y C,LEU F Y.Predictive intelligence in harmful news identification by BERT-based ensemble learning model with text sentiment analysis[J].Information Processing & Management,2022,59(2):102872.
【通聯(lián)編輯:唐一東】