陳宏揚
(廣東輕工職業(yè)技術學院,廣東 廣州 510300)
當代大學生正處在一個信息技術高度發(fā)達的現(xiàn)代社會,“互聯(lián)網(wǎng)+ 智能+ 技術”的在線學習平臺不斷涌現(xiàn),帶來海量的線上學習資源,但也容易形成“信息超載”(Information Overload)[1]問題,導致學生自主學習線上課程時,如果缺乏有效的學習引導以及信息的篩選能力,容易產(chǎn)生“知識迷航”,不可能達到很好的學習效果。因此,研究智能化的個性化學習推薦模型,針對學習者在特定課程或者領域學習過程中知識點掌握情況及知識缺陷進行分析建模,并推送適合其自身學習特征的學習資源以及學習路徑,已成為當下網(wǎng)絡學習平臺和學習者學習行為數(shù)據(jù)挖掘領域的研究重點。
在個性化推薦領域,協(xié)同過濾算法已經(jīng)取得了相當多的研究成果,在電商產(chǎn)品、視頻、音樂等個性化推送獲得廣泛的應用。根據(jù)推薦方法的最終實現(xiàn)方式的不同,可將協(xié)同過濾算法分為基于內存的協(xié)同過濾方法和基于模型的協(xié)同過濾方法,而基于內存的協(xié)同過濾方法又可分為基于用戶的方法和基于項目的方法[2]。其中基于用戶的協(xié)同過濾算法(User-based Collaborative Filtering)[3],主要思想是以用戶為中心,比較適用于網(wǎng)絡個性化學習平臺的研發(fā),它假設用戶對一些項目的評分比較相似,則他們對其它項目的評分也比較相似,如果大部分用戶對一些項目的評分比較相似,則當前用戶對這些項目的評分也比較相似[4]。例如在土豆視頻網(wǎng)站中,用戶B和C 點贊并收藏了D 視頻,并對D 視頻進行了評分,如果目標用戶A 和用戶B、C 對視頻的綜合評分接近,則認為三者相似度高,系統(tǒng)會根據(jù)用戶B 和C 對其它視頻的評分,預測出用戶A的評分,將預測分最高的視頻形成推薦列表,并向用戶A 推薦。
筆者通過閱讀相關研究顯示,協(xié)同過濾算法運用在個性化學習方案推薦方面,尚處于初步研究和實踐階段,相較于商業(yè)領域的應用,協(xié)同過濾算法在教育領域中的應用具有獨特性,兩者有明顯差異,具體包括以下方面:
(1)與普通的商品推薦不同,學習是一項具有主體性、自主性、問題性、協(xié)作性、實踐性等特征的復雜活動,需要學習者在大腦里不斷地進行認知加工、同化及處理,保持專注力以及長期的堅持。個性化學習推薦并不單純是為了預測或迎合學習者的偏好而進行的一項學習推薦活動,而是輔助學習者在線上學習過程中智能識別與推送與學習者個性化參數(shù)相匹配的學習資源及學習路徑,從而提升學習者的學習積極性、有效性及科學性。
(2)電商產(chǎn)品推薦系統(tǒng)的依據(jù)是大量用戶對于商品的評價,每件商品中、差評等較為單一的評價,而個性化學習推薦系統(tǒng),對于一道練習題所包含的知識點的數(shù)量、類型各有不同,所以在進行相似度比較時,還需要分析學習者的學習特征、學習需求、知識及能力水平、學習偏好、知識漏洞等,并在此基礎上建立學習者模型,因此個性化學習推薦平臺在設定學習者個性化參數(shù)、資源推薦列表、學習資源評價等方面區(qū)別于普通的個性化推薦系統(tǒng)。
(3)電商產(chǎn)品推薦一般是推薦單一的產(chǎn)品,而個性化學習推薦模型除了推薦動畫、視頻、課件、文本等資源單體外,也可以推薦由若干有關聯(lián)的素材組合構成的積件資源(如知識點、技能點等),甚至是推薦模塊化資源(如工作任務、技能訓練項目等)。這是因為學習活動是學習者認知構建的過程,且具有持續(xù)性和連貫性,單一學習資源推薦學習可能會導致在學習過程中缺乏知識結構體系化,導致學習效果的降低。
根據(jù)以上目標,本文提出基于用戶學習特征協(xié)同過濾算法的個性化學習推薦模型的設計,包含三個核心步驟:首先,建立個性化學習者模型,對每位學習者的總體學習情況進行全面分析;其次,深度挖掘出學習者模型參數(shù)與學習推薦資源對象相互交叉、關聯(lián)影響的信息,建立個性化學習推薦對象模型。最后,利用基于用戶協(xié)同過濾算法計算學習者之間學習情況的相似性,進行個性化資源單體、知識點、技能點、工作任務以及技能訓練項目等學習路徑的推送。
本研究的研究對象主要是開展線上學習的高職學生,以廣東輕工職業(yè)技術學院- 輕工教育在線學習平臺為例,在其基礎上研發(fā)個性化學習推薦模型框架,旨在分析學習者在特定課程或領域學習過程的學習特征及狀態(tài),并智能推送適合其自身學習情況的個性化學習方案,提升線上學習者的學習效果。該模型由三部分組成,分別是個性化學習者模型、個性化學習推薦對象模型和基于協(xié)同過濾的個性化學習推薦算法,如圖1 所示,其中個性化學習者模型及個性化學習者推薦對象模型通過學習者建模以及推薦對象建模過程來構建。
個性化學習者建模過程主要包括學習者初始信息采集、學習過程記錄及診斷試題錯題采集、師生交互、學習者評價并存儲相應的學習數(shù)據(jù),通過數(shù)據(jù)采集和分析,提取學習者的顯式及潛在特征和其狀態(tài),其特征包括學習需求、學習偏好、知識背景、學習風格、知識水平、能力水平、知識漏洞等[5],并通過算法轉化為學習者模型;個性化學習推薦對象建模過程主要通過獲取學習者最近鄰、學習資源、學習路徑等推薦對象的顯式及潛在特征和狀態(tài),并通過算法轉化為學習推薦對象模型?;趨f(xié)同過濾推薦算法通過挖掘、分析及處理個性化學習者模型和個性化學習推薦對象模型數(shù)據(jù),產(chǎn)生推薦列表,并向目標學習者推薦適合自身的個性化學習資源或學習路徑(見圖1)。
圖1 個性化學習推薦模型框架示意圖
學習者建模是個性化學習推薦系統(tǒng)精準推薦優(yōu)質學習資源和學習路徑的基礎。學習者模型可以全方位采集、存儲、修改學習者個性化數(shù)據(jù)及參數(shù),通過數(shù)據(jù)分析及挖掘,能對學習者進行歸類和識別,獲得學習者的特征及狀態(tài)。本文從“五個維度”設計學習者的個性化學習參數(shù),存放在學習者數(shù)據(jù)庫中,記錄學習者的各項學習數(shù)據(jù),并用于學習者特征及狀態(tài)的統(tǒng)計分析?!拔鍌€維度”具體包括因何學、學什么、在哪學、怎么學、學咋樣,如圖2 所示。其中,通過“因何學”維度下的參數(shù),識別出學習者之間學習需求和學習動機的個體差異[6];通過“學什么”維度下的參數(shù)識別出了學習者之間知識背景、技能學習、知識學習、學習時長等的個體差異;通過“在哪學”維度下的參數(shù)識別出了學習者之間學習時段、學習地點和上網(wǎng)習慣的個體差異;通過“怎么學”維度下的參數(shù),識別出了學習者之間如學習偏好、學習風格以及針對課程教學所采用的線上教學方法的相關知識背景等的個體化學習方案差異;通過“學怎樣”維度下的參數(shù)識別出了學習者之間知識漏洞以及預計要達到的知識水平和技能水平目標的個體差異。
個性化學習推薦對象包括學習者最近鄰、學習資源以及學習路徑等。其中教學資源是指教學課件、教學微課、重點難點指導、作業(yè)、電子教材、參考資料目錄等反映教學活動的資源。學習推薦對象建模時,首先將學習資源標準化,標準化內容包括資源類型、難中易度、學習時長、前導知識點、關聯(lián)知識點、適用人群等,以及采用自動或半自動的語義化方法,為個性化學習推薦對象添加多方面特征描述。其次是個性化學習推薦對象特征的提取,按照描述特征的獲取方式,個性化學習推薦對象建模方法一般分為靜態(tài)方法、動態(tài)方法以及基于知識的方法三類,本研究采用“分類”和“交互”兩種動態(tài)方法,通過采用基于統(tǒng)計機器學習的分類方法K 近鄰進行推薦對象“分類”,采用人工設置或聚類生成建立多個推薦對象類別標簽,并把推薦對象歸類到其所屬的類別,通過推薦算法實現(xiàn)將同類別學習資源推薦給個性化學習參數(shù)相匹配的學習者,例如識別出推薦對象關聯(lián)知識點與學習者知識及技能點的掌握程度相匹配就進行推薦?!敖换ァ奔床捎脤W習者與推薦對象的交互數(shù)據(jù)進行建模。
圖2 學習者的個性化學習參數(shù)
2.3.1 基于用戶的協(xié)同過濾算法介紹
本研究采用的基于用戶學習特征的協(xié)同過濾學習推薦算法原理是根據(jù)“學習者- 學習者”相似矩陣(二維數(shù)據(jù)表格)計算最相似學習者,如圖3 所示,表格的豎列表示學習者對象,橫列表示學習者參與的學習資源或學習路徑評分項目,表格的數(shù)字是用戶對項目的評分。不同學習者的相似度計算相當于計算兩個向量的余弦夾角,例如第二行和第四行的評分分數(shù)作為學習者Stu2和Stu4 的項目偏好特征向量,通過計算其相似度來確定學習最近鄰。
圖3 基于用戶的協(xié)同過濾
相似度算法本文采用皮爾遜相關系數(shù),它是當下比較主流的,相對于余弦相似度及修正的余弦相似度算法,它將評價的項目范圍縮小為學習者的共同項目集合,提升了個性化學習推薦的精準度。假設學習者si和sj的公共評分項目集為pi,j,則用戶si和sj的相似度計算公式表示為:
2.3.2 基于學習最近鄰和預測評分產(chǎn)生學習資源推薦
學習資源或學習路徑推薦過程為首先獲取學習者模型的各項數(shù)據(jù),學習者數(shù)據(jù)來源于學習者模型,包括學習者注冊信息、學習者個性化參數(shù)以及學習者交互數(shù)據(jù)等,包括接著采用皮爾遜相關系數(shù)方法計算并比較目標學習者與其學習鄰居之間對項目評分的相似度,計算出K 個學習最近鄰,最后參照學習者鄰居對學習資源或學習路徑等項目的評分,利用評分預測公式進行計算并預測出學習者評分,以此作為推薦結果的一個重要依據(jù),將預測評分最高的n 個資源或學習路徑組成推薦序列推薦給目標學習者。評分預測公式如下所示:
代表si和sj的平均分,,sim(i,j)表示用戶的相似度結果,,j ∈x代表在學習者最近鄰X 的學習者si。
使用基于用戶的協(xié)同過濾算法進行學習推薦,要考慮學習者的線上課程學習情況,將學習者的學習總體情況轉化為題目考試成績,進而轉為知識點的評價分數(shù),并把該分數(shù)表示為學習者對該課程知識點的掌握程度,如果學習者之間相同知識點的得分越相似,那么學習者之間的相似度越高,如果學習者A 在某個知識點得分低于60 分,則將該知識點識別為學習者A 的知識漏洞,并減少將其關聯(lián)知識點推薦給學習者A。另外,針對多種不同類型的學習資源,如教學課件、測驗、教學微課等,這些資源的特征屬性不完全相同,為了反映同一學習者對不同類型資源的學習偏好,要設計“評分”作為對所有資源統(tǒng)一的特征表示方式。
2.3.3 引入基于內容的協(xié)同過濾算法解決“冷啟動”問題
使用協(xié)同過濾推薦算法,還要考慮“冷啟動”問題,即當在線學習平臺增加了新的學習資源和學習路徑,而這些學習資源和路徑還沒有學習者學習及評價過,以及學習平臺加入新的學習者,新學習者們還沒產(chǎn)生學習記錄,或只有很少的學習記錄。這些情況會使得“學習者- 學習資源”評分矩陣變得稀疏,使其失去精準性[7]。而這類問題本文建議通過引入基于內容的協(xié)同過濾算法進行補充,基于內容的過濾通過假定用戶的興趣及內容偏好不變,按照用戶以前的使用數(shù)據(jù)來推斷出用戶喜歡的項目特征,然后根據(jù)用戶興趣特征與內容特征的擬合,產(chǎn)生內容推薦列表[8]。例如在嗶哩嗶哩網(wǎng)站注冊會員時,會讓新用戶回答100 道問題,答對60 道題才能成功注冊,而在用戶回答完這些問題后,嗶哩嗶哩網(wǎng)站就構建出了新用戶特征,從而產(chǎn)生視頻或頻道推送列表。
本文構建一種基于用戶協(xié)同過濾算法的個性化學習推薦模型,是一個通用的學習系統(tǒng)推薦框架,目的不單是迎合學習者的喜好進行推薦,通過為學習者建模,獲取學習者知識點掌握情況以及存在的知識漏洞,通過推薦基于用戶協(xié)同過濾算法將同類別學習資源及學習路徑推薦給個性化參數(shù)相匹配的學習者,激發(fā)學習者的學習動機,提升線上學習的積極性,從而達到提高線上課程的結課率以及學習效果的目的。隨著智慧學習和人工智能教育的深度發(fā)展,在未來研究中,將考慮更多維度的學習者的個性化學習參數(shù),并持續(xù)對個性化學習推薦體系框架、學習者建模、學習推薦對象建模、推薦算法等關鍵技術開展研究,進一步提升預測知識點評分的準確性,達到更精準的推薦效果。