楊鑫 楊晨 李宇
摘要:在科技日新月異的時代人們需要了解技術(shù)發(fā)展趨勢并獲取精準(zhǔn)有效的學(xué)習(xí)內(nèi)容。學(xué)習(xí)資源推薦平臺基于協(xié)同過濾技術(shù)預(yù)估用戶偏好,提供個性化推薦。系統(tǒng)對于用戶沒有給予評分的資源采用隱式評分規(guī)則,降低評分矩陣的稀疏度,從而提高資源推薦的精度和效率。
關(guān)鍵詞:推薦系統(tǒng);協(xié)同過濾;隱式評分
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)12-0074-02
1概述
隨著互聯(lián)網(wǎng)的快速發(fā)展,在線學(xué)習(xí)模式也應(yīng)運而生。然而在信息爆炸的二十一世紀(jì),“信息過載”的問題日趨顯著,如何快速從紛繁眾多、參差不齊的學(xué)習(xí)資源中快速發(fā)現(xiàn)適合自身的專業(yè)水平的高質(zhì)量學(xué)習(xí)內(nèi)容已成為一個普遍的難題。因此,學(xué)習(xí)資源推薦系統(tǒng)的出現(xiàn)是大勢所趨。
本系統(tǒng)在通用的最新、最熱、好評推薦之外,還試圖通過用戶基本信息和學(xué)習(xí)行為預(yù)測該用戶的偏好,并匹配用戶學(xué)習(xí)深度進(jìn)行個性化推薦。如何將推薦技術(shù)為用戶提供精確的、具有針對性的服務(wù)是本系統(tǒng)重要的研究內(nèi)容。
2協(xié)同過濾算法
協(xié)同過濾技術(shù)的核心思想包括兩部分:利用用戶的歷史評分記錄計算用戶之間的相似性;然后,基于相似性較高的鄰居用戶對項目的評分來預(yù)估目標(biāo)用戶對特定項目的評分。系統(tǒng)選取高評分的項目進(jìn)行推薦。
對于協(xié)同推薦中的“冷啟動”問題,本系統(tǒng)采用了新用戶基于內(nèi)容推薦策略,根據(jù)注冊信息中的興趣點來推薦對應(yīng)的學(xué)習(xí)資源。而對于用戶沒有直接給予評分的項目,系統(tǒng)采用隱式評分策略,以此來解決評分矩陣稀疏問題。
與基于項目的推薦相比,協(xié)同過濾方法的可以對視頻類的非結(jié)構(gòu)化對象進(jìn)行推薦,并且突破了相似推薦的局限,可以啟發(fā)用戶的新興趣點,進(jìn)行更有價值的推薦。
3推薦策略和用戶評分計算
3.1推薦策略
本學(xué)習(xí)資源平臺支持以下四種推薦:
1)最熱推薦:基于觀看次數(shù)的推薦。
2)最新推薦:基于資源上線時間的推薦。
3)好評推薦:基于資源評分的推薦。
4)個性推薦:基于用戶興趣和學(xué)習(xí)行為的推薦。
其中,個性推薦僅針對系統(tǒng)注冊用戶。對于新用戶,根據(jù)用戶注冊信息中的興趣點,基于內(nèi)容推薦。對于老用戶,基于協(xié)同過濾技術(shù)預(yù)測用戶評分,選取高評分的項目推薦。
此外,系統(tǒng)對所有類別下的學(xué)習(xí)資源進(jìn)行深度級別的標(biāo)記。在個性推薦時,若發(fā)現(xiàn)用戶已經(jīng)在進(jìn)行高級別的學(xué)習(xí)時,不再推薦同類別下相對低級別的資源。
3.2 用戶評分計算
在協(xié)同過濾推薦算法中,對相似用戶的界定,依據(jù)用戶對資源的已有評分情況。即兩個用戶對資源的評分越相近,則喜好越相似,即相似度越高。
對資源的評分,本系統(tǒng)分為顯示評分和隱式評分兩種。顯示評分,即用戶對資源的評分。然而某些用戶沒有評分習(xí)慣,則可以啟動隱式評分機制。即根據(jù)用戶的行為來給資源評分。系統(tǒng)對資源的評分采用10分制,最高10分。具體評分規(guī)則如表1,初始得分為0分。
當(dāng)用戶的打開視頻瀏覽,即可評4分,當(dāng)瀏覽時長超過3分鐘,即評6分,如果用戶將這個視頻觀看結(jié)束(可分多次),即評8分。若用戶收藏該學(xué)習(xí)資源,無論瀏覽時長多少,直接評10分。用戶取消收藏,評分不變。隱式評分僅用于用戶沒有顯示評分的情況。
系統(tǒng)將根據(jù)用戶對視頻的評分來計算用戶相似度,從而產(chǎn)生協(xié)同推薦。
5 系統(tǒng)實現(xiàn)
整個系統(tǒng)的實現(xiàn)主要包括三個部分:基本的在線學(xué)習(xí)功能模塊、收集用戶行為模塊和推薦生成模塊。
系統(tǒng)前臺提供在線學(xué)習(xí)服務(wù),同時收集用戶行為。后臺啟動定時任務(wù),計算推薦資源列表。對于瀏覽資源少于20個的新用戶,根據(jù)注冊信息進(jìn)行推薦。而對于老用戶,根據(jù)評分矩陣計算相似用戶集合,從而預(yù)估用戶喜好。之后,過濾掉在同一類別下,難度級別低于當(dāng)前學(xué)習(xí)級別的資源。從而生成最終的推薦列表
每次用戶登錄時,在首頁顯示個性化推薦學(xué)習(xí)資源。如圖2所示。
6 下一步工作
隨著系統(tǒng)的用戶和資源數(shù)目不斷增加,計算量越來越龐大,考慮遷移到hadoop平臺,借助高性能分布式計算,做到實時推薦。此當(dāng)多個客戶同時訪問、高并發(fā)請求時系統(tǒng)能否承受高負(fù)載,應(yīng)當(dāng)從優(yōu)化數(shù)據(jù)庫的結(jié)構(gòu)、查詢語句,使用高效率的編程語言、高性能的Web容器等方面著手考慮。
推薦算法也可以在已有基礎(chǔ)上進(jìn)行優(yōu)化,例如計算用戶相似度時可以使用反差忽略部分用戶。此外,本系統(tǒng)使用的推薦算法是基于用戶的,同時也可以添加基于物品的推薦換個角度為用戶推薦學(xué)習(xí)資源。
參考文獻(xiàn):
[1] 孫光浩,劉青丹,李夢云.個性化推薦算法綜述[J].軟件,2017(7).
[2] 胡國強. 基于協(xié)同過濾算法的MOOC個性化推薦系統(tǒng)[J].信息技術(shù),2017(6).
[3] 韓亞楠,曹菡,劉亮亮.基于評分矩陣填充與用戶興趣的協(xié)同過濾推薦算法[J].計算機工程,2016(1).
[4] 于洪,李俊華.一種解決新項目冷啟動問題的推薦算法[J].軟件學(xué)報,2015(6).
[5] 李寶,張文蘭.智慧教育環(huán)境下學(xué)習(xí)資源推送服務(wù)模型的構(gòu)建[J].遠(yuǎn)程教育雜志,2015(3).
[6] 王寧.學(xué)習(xí)系統(tǒng)中基于用戶行為分析的推薦算法研究[J].Computer Era,2015(11).
[7] 葉樹鑫,何聚厚.協(xié)作學(xué)習(xí)中基于協(xié)同過濾的學(xué)習(xí)資源推薦研究[J].計算機技術(shù)與發(fā)展,2014(10).
[8] 劉建國,周濤,汪秉宏.個性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009(1).
[9] 吳顏,沈潔.協(xié)同過濾推薦系統(tǒng)中數(shù)據(jù)稀疏問題的解決[J].計算機應(yīng)用研究,2007(6).