謝修娟 朱林 鄭英 李旭
摘要:為促進(jìn)高校信息技術(shù)與教育教學(xué)的深度融合,提出通過(guò)構(gòu)建在線學(xué)習(xí)系統(tǒng)開(kāi)展網(wǎng)絡(luò)學(xué)習(xí),將傳統(tǒng)的線下課堂學(xué)習(xí)與線上學(xué)習(xí)結(jié)合起來(lái),實(shí)現(xiàn)混合式學(xué)習(xí)。以MyEclipse作為開(kāi)發(fā)平臺(tái),Sql Server作為數(shù)據(jù)庫(kù),采用基于SSH框架(struts2+spring+hibernate)的三層架構(gòu)思想,結(jié)合協(xié)同過(guò)濾算法,實(shí)現(xiàn)了在線學(xué)習(xí)個(gè)性化推薦系統(tǒng)。實(shí)踐證明,該系統(tǒng)能提高學(xué)習(xí)者個(gè)性化自主學(xué)習(xí)的興趣,提升學(xué)習(xí)效果。
關(guān)鍵詞:在線學(xué)習(xí)系統(tǒng);協(xié)同過(guò)濾;個(gè)性化推薦;自主學(xué)習(xí)
中國(guó)分類號(hào):TP301 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1009-3044(2018)03-0173-02
Abstract: In order to promote the deep integration of information technology and education in Colleges and universities, we propose to build online learning system to carry out online learning, and combine traditional offline classroom learning with online learning to achieve blended learning. Taking MyEclipse as the development platform, Sql Server as database, and adopting the three tier architecture Based on SSH framework (struts2+spring+hibernate), the online learning personalized recommendation system is implemented combining with collaborative filtering algorithm. The practice has proved that the system can improve the learner's interest in individualized self-study and improve the learning effect.
Key words: online learning system; collaborative filtering; personalized recommendation; autonomous learning
1 背景
隨著計(jì)算機(jī)網(wǎng)絡(luò)通信技術(shù)的發(fā)展,高校的傳統(tǒng)課堂教學(xué)方式面臨著前所未有的挑戰(zhàn),在線學(xué)習(xí)作為教育信息化的一種產(chǎn)物,可以最大限度地利用網(wǎng)絡(luò)教學(xué)資源,學(xué)習(xí)者在學(xué)習(xí)過(guò)程中不受時(shí)空限制,能隨時(shí)隨地根據(jù)自身需要進(jìn)行自主學(xué)習(xí)[1]。這種新型學(xué)習(xí)形式越來(lái)越受到各大高校的青睞,將其與傳統(tǒng)課堂學(xué)習(xí)有效融合,實(shí)現(xiàn)混合式教學(xué)[2]。但與此同時(shí)存在一個(gè)問(wèn)題,在線學(xué)習(xí)平臺(tái)提供了大量的學(xué)習(xí)資源,不僅資源種類多,同一種類的相似資源數(shù)量也很多,學(xué)習(xí)者無(wú)法辨別資源的優(yōu)劣,無(wú)法準(zhǔn)確找到適合自己的資源。
目前的在線學(xué)習(xí)系統(tǒng)中,采用比較多的推薦技術(shù)有[3]:第一,TOP推薦,將點(diǎn)擊率最高的前N各資源推薦給學(xué)習(xí)者;第二,關(guān)鍵詞檢索技術(shù),將與關(guān)鍵詞匹配度最高的資源推薦給學(xué)習(xí)者;第三,最新資源推薦技術(shù),將最新的資源第一時(shí)間推薦給學(xué)習(xí)者。這三種傳統(tǒng)方法均屬于被動(dòng)式推薦,無(wú)法根據(jù)學(xué)習(xí)者偏好特征主動(dòng)推送其感興趣的學(xué)習(xí)資源,且推薦的資源質(zhì)量無(wú)法得到保證。鑒于此,本文將協(xié)同過(guò)濾技術(shù)引入在線學(xué)習(xí)系統(tǒng)的資源個(gè)性化推薦中,從學(xué)習(xí)者自主學(xué)習(xí)的角度構(gòu)建滿足學(xué)習(xí)者個(gè)性化需要的在線學(xué)習(xí)個(gè)性化推薦系統(tǒng)。
2 協(xié)同過(guò)濾推薦技術(shù)
協(xié)同過(guò)濾技術(shù),在1992年由Goldberg,Oki,Nichols提出[4],是個(gè)性化推薦系統(tǒng)中廣泛使用的一種推薦技術(shù),基本原理是:根據(jù)用戶對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù),計(jì)算目標(biāo)用戶/項(xiàng)目與全體用戶/項(xiàng)目的相似度,建立近鄰用戶/項(xiàng)目,再由近鄰集預(yù)測(cè)目標(biāo)用戶對(duì)未知項(xiàng)目的評(píng)分從而產(chǎn)生推薦集。根據(jù)聚焦點(diǎn)的不同(用戶或者項(xiàng)目),協(xié)同過(guò)濾技術(shù)分為基于用戶的協(xié)同過(guò)濾和基于項(xiàng)目的協(xié)同過(guò)濾[5],本文采用的是前者。基于用戶的協(xié)同過(guò)濾方法的算法過(guò)程如圖1所示, 首先通過(guò)計(jì)算用戶間的相似度,找到當(dāng)前用戶的近鄰集,然后根據(jù)近鄰對(duì)項(xiàng)目的評(píng)價(jià),預(yù)測(cè)當(dāng)前用戶對(duì)未知項(xiàng)目的評(píng)分,篩選出評(píng)分最高的前N項(xiàng),即產(chǎn)生Top-N 推薦集。
用戶相似度的計(jì)算多采用余弦相似度方法,將用戶u和v看作是項(xiàng)目空間上的向量,通過(guò)計(jì)算兩個(gè)向量間的夾角余弦來(lái)度量用戶間的相似性,計(jì)算公式如下:
式(1)中,u和v代表兩個(gè)用戶,sim(u,v)表示用戶間的相似性,表示用戶u和v共同評(píng)分過(guò)的項(xiàng)目集,和 分別表示用戶u和用戶v對(duì)項(xiàng)目i的評(píng)分, 和 分別表示用戶u和v對(duì)所有已評(píng)分項(xiàng)目的平均評(píng)分。
用戶u 對(duì)項(xiàng)目i的預(yù)測(cè)評(píng)分記為Pu,i,計(jì)算公式如下:
其中,Neighbor為近鄰集,分別表示用戶u和用戶v對(duì)所有已評(píng)分,用戶v對(duì)項(xiàng)目i的評(píng)分,sim(u,v)表示用戶u和v間的相似性。
3 基于協(xié)同過(guò)濾技術(shù)的在線學(xué)習(xí)個(gè)性化推薦系統(tǒng)
3.1 系統(tǒng)功能模塊設(shè)計(jì)
基于協(xié)同過(guò)濾技術(shù)的在線學(xué)習(xí)個(gè)性化推薦系統(tǒng),主要有五個(gè)功能模塊,分別為用戶管理、課程動(dòng)態(tài)管理、課程資源管理、互動(dòng)交流和個(gè)性化推薦,如圖2所示?!坝脩艄芾怼蹦K主要負(fù)責(zé)用戶的注冊(cè)、登錄、權(quán)限設(shè)置、個(gè)人賬號(hào)維護(hù)等 ;“課程動(dòng)態(tài)管理”模塊主要包括管理員動(dòng)態(tài)地新建一門(mén)課程、刪除一門(mén)課程、課程資源的上傳和修改等;“在線學(xué)習(xí)”模塊包括在線觀看視頻、資源下載、在線測(cè)試、資源評(píng)價(jià)等;“互動(dòng)交流”模塊實(shí)現(xiàn)了學(xué)習(xí)者之間,以及學(xué)習(xí)者與教師之間,通過(guò)論壇的方式互動(dòng)交流;“個(gè)性化推薦”模塊主要負(fù)責(zé)為學(xué)習(xí)者個(gè)性化地推薦學(xué)習(xí)資源。
3.1 系統(tǒng)功能實(shí)現(xiàn)
系統(tǒng)所使用的開(kāi)發(fā)工具為MyEclipse,開(kāi)發(fā)語(yǔ)言為Java,數(shù)據(jù)庫(kù)為Sql Server。系統(tǒng)采用基于SSH框架(struts2+spring+hibernate)的三層架構(gòu)思想。View(視圖層)對(duì)應(yīng)系統(tǒng)的一些交互界面,包括reg.jsp(注冊(cè)界面)、index.jsp(系統(tǒng)主界面)、resourceMa.jsp(課程資源管理頁(yè)面)、courseMa.jsp(課程管理頁(yè)面)、courseCom.jsp(課程學(xué)習(xí)評(píng)價(jià)界面)、topic.jsp(互動(dòng)交流界面)等。Dao(數(shù)據(jù)處理層)對(duì)應(yīng)HibernateSupportDao.java類,該類依賴于Hibernate的對(duì)象化映射和數(shù)據(jù)庫(kù)交互,包括保存數(shù)據(jù)、更新數(shù)據(jù)、刪除數(shù)據(jù)、根據(jù)ID查詢單條數(shù)據(jù)、查詢所有數(shù)據(jù)、查詢規(guī)定數(shù)目的數(shù)據(jù)、執(zhí)行sql查詢等操作。Service(業(yè)務(wù)邏輯層)對(duì)應(yīng)系統(tǒng)的一些業(yè)務(wù)處理類,有UserSer.java(用戶管理類)、ResourceSer.java(課程資源管理類)、CourseSer.java(課程管理類)、CourseComSer.java(課程學(xué)習(xí)評(píng)價(jià)類)、TopicSer.java(互動(dòng)交流類)等。
3.2 協(xié)同過(guò)濾算法應(yīng)用
學(xué)習(xí)者開(kāi)始課程學(xué)習(xí)后,系統(tǒng)會(huì)根據(jù)學(xué)習(xí)者的學(xué)習(xí)行為特征,采用基于用戶的協(xié)同過(guò)濾算法,根據(jù)相似學(xué)習(xí)者的興趣愛(ài)好一致性,為當(dāng)前學(xué)習(xí)者提供個(gè)性化的推薦。算法的應(yīng)用過(guò)程主要分為四步進(jìn)行。
第一步數(shù)據(jù)采集,應(yīng)用于挖掘的基礎(chǔ)數(shù)據(jù)來(lái)源于數(shù)據(jù)庫(kù),主要有4張數(shù)據(jù)表:學(xué)習(xí)者信息表、課程信息表、課程學(xué)習(xí)資源表、資源評(píng)價(jià)表和學(xué)習(xí)行為記錄表。
l 學(xué)習(xí)者信息表:存放學(xué)習(xí)者的個(gè)人信息,字段包括學(xué)習(xí)者ID、姓名、密碼、角色等。
l 課程信息表:存放課程的相關(guān)信息,字段包括課程ID、課程名稱、發(fā)布時(shí)間、課程負(fù)責(zé)人等;
l 課程學(xué)習(xí)資源表:存放課程的學(xué)習(xí)資源信息,字段包括資源ID、資源名稱、上傳者、上傳時(shí)間、資源類型、課程ID等;
l 學(xué)習(xí)行為記錄表:存放學(xué)習(xí)者在學(xué)習(xí)過(guò)程中產(chǎn)生的學(xué)習(xí)行為數(shù)據(jù),字段包括ID,資源ID,是否下載、是否收藏、評(píng)價(jià)內(nèi)容、分?jǐn)?shù)、學(xué)習(xí)者ID等;
第二步構(gòu)建學(xué)習(xí)者-學(xué)習(xí)資源評(píng)分矩陣,其是一個(gè)m行n列的矩陣,代表m個(gè)學(xué)習(xí)者,n個(gè)學(xué)習(xí)資源,矩陣的每一個(gè)行列值是學(xué)習(xí)者對(duì)學(xué)習(xí)資源的評(píng)分,考慮到學(xué)習(xí)者在線學(xué)習(xí)時(shí)較少對(duì)學(xué)習(xí)資源主動(dòng)打分,會(huì)造成矩陣數(shù)據(jù)稀疏性問(wèn)題,從而制約推薦質(zhì)量。本文采用主動(dòng)評(píng)分和被動(dòng)評(píng)分相結(jié)合的綜合評(píng)分機(jī)制,主動(dòng)評(píng)分是指學(xué)習(xí)者直接給資源的打分,被動(dòng)評(píng)分是根據(jù)學(xué)習(xí)者的學(xué)習(xí)行為數(shù)據(jù),轉(zhuǎn)換而得的隱式評(píng)分。主動(dòng)評(píng)分可以從學(xué)習(xí)行為記錄表獲得,缺省值為0,被動(dòng)評(píng)分是依據(jù)學(xué)習(xí)行為記錄表中的是否收藏、是否下載、評(píng)價(jià)三個(gè)行為,對(duì)照表1所得到的分?jǐn)?shù)。最后將主動(dòng)評(píng)分和被動(dòng)評(píng)分求平均值,得到最終評(píng)分。
第三步形成近鄰集,根據(jù)公式(1)計(jì)算每個(gè)學(xué)習(xí)者與當(dāng)前學(xué)習(xí)者的相似度,并從中選出相似度最大的前K個(gè)學(xué)習(xí)者,作為當(dāng)前學(xué)習(xí)者的近鄰集。
第四步產(chǎn)生推薦集,通過(guò)近鄰集對(duì)學(xué)習(xí)資源的評(píng)分,使用公式(2)預(yù)測(cè)當(dāng)前學(xué)習(xí)者對(duì)未知學(xué)習(xí)資源的評(píng)分,并選取評(píng)分較大的前若干項(xiàng)資源推薦給當(dāng)前學(xué)習(xí)者。
3.3 系統(tǒng)運(yùn)行效果
學(xué)習(xí)者進(jìn)入系統(tǒng)后的主頁(yè)效果如圖3所示,通過(guò)頁(yè)面上方的導(dǎo)航欄,可以檢索系統(tǒng)中的課程信息,查看并使用課程資源信息、進(jìn)入互動(dòng)交流區(qū)等,頁(yè)面的右方有一個(gè)性化學(xué)習(xí)資源推薦版面,如果當(dāng)前學(xué)習(xí)者有歷史學(xué)習(xí)記錄,該版面將會(huì)依據(jù)其學(xué)習(xí)興趣愛(ài)好,為其推薦適合的學(xué)習(xí)資源;如果當(dāng)前學(xué)習(xí)者是新用戶,還沒(méi)有歷史學(xué)習(xí)記錄,則為其推薦熱度最高(綜合收藏率、評(píng)價(jià)率和下載率)的資源。
4 結(jié)束語(yǔ)
在線學(xué)習(xí)系統(tǒng)的構(gòu)建,對(duì)于學(xué)校的課程資源建設(shè)、教育教學(xué)改革具有重要意義?;趨f(xié)同過(guò)濾技術(shù)的個(gè)性化資源推薦服務(wù)可以提高個(gè)性化學(xué)習(xí)支持服務(wù)的水平,提高系統(tǒng)資源的利用率,目前該系統(tǒng)已在東南大學(xué)成賢學(xué)院進(jìn)行小范圍試點(diǎn),從反饋結(jié)果來(lái)看,能提高學(xué)習(xí)者個(gè)性化自主學(xué)習(xí)的興趣,提升學(xué)習(xí)效果。
參考文獻(xiàn):
[1] 黃海. 高校數(shù)字化學(xué)習(xí)建設(shè)和應(yīng)用推廣研究——以中山大學(xué)數(shù)字化學(xué)習(xí)“115”模式為例[J]. 現(xiàn)代教育技術(shù), 2013, 23(4):56-63.
[2] 陳瑞增. 信息化環(huán)境下高?;旌鲜綄W(xué)習(xí)探索與實(shí)踐[D]. 武漢: 華中師范大學(xué), 2014.
[3] 王永固, 邱飛岳, 趙建龍, 等. 基于協(xié)同過(guò)濾技術(shù)的學(xué)習(xí)資源個(gè)性化推薦研究[J]. 遠(yuǎn)程教育雜志, 2011(3):66-71.
[4] Goldberg D, Nichols D,Oki.Using collaboration filtering to weave and informaiton tapestry[J]. Communicaitions of the ACM, 1992, 35(12):51-76.
[5] 馮勇, 李軍平, 徐紅艷, 等. 基于社會(huì)網(wǎng)絡(luò)分析的協(xié)同推薦方法改進(jìn)[J]. 計(jì)算機(jī)應(yīng)用, 2013, 33(3):841-844.