• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于隱式問詢的兒童繪本推薦系統(tǒng)

    2021-07-24 07:15:24倩,王
    關(guān)鍵詞:繪本矩陣兒童

    張 倩,王 進

    (南通大學(xué) 信息科學(xué)技術(shù)學(xué)院,江蘇 南通 226019)

    隨著社會的發(fā)展,早教市場備受關(guān)注,2019 年發(fā)布的《中國早教藍皮書》預(yù)計到2025 年我國早教市場規(guī)模將突破4 500 億元[1]。兒童早教市場前景巨大,兒童早教類電子商務(wù)市場正蓬勃興起。繪本是早教類產(chǎn)品的重要載體,兒童早期教育的重要資源,無論是它的表現(xiàn)形式還是內(nèi)在涵義,都非常適合學(xué)齡初期兒童的身心發(fā)展。如何幫助兒童在種類繁多的繪本中快速、準確地挑選到合適的繪本是早教類電子商務(wù)公司亟需解決的問題。同時,教育學(xué)和心理學(xué)的相關(guān)研究表明,在培養(yǎng)兒童閱讀興趣的關(guān)鍵期,選擇符合兒童閱讀興趣的繪本有助于兒童良好閱讀習(xí)慣的養(yǎng)成[2]。

    如今推薦系統(tǒng)(recommender systems)[3]被廣泛應(yīng)用在電子商務(wù)領(lǐng)域中,與普通的電子商務(wù)推薦系統(tǒng)不同,兒童繪本推薦系統(tǒng)由于兒童用戶的特殊性,無法得到準確的閱讀興趣,從而產(chǎn)生特殊的冷啟動問題[4]。當前解決冷啟動問題的方式主要有:直接詢問用戶喜好或等用戶反饋信息[5-6];利用用戶社交圈信息[7-9];運用跨域推薦技術(shù)[10-12];利用熱門榜單推薦[13];采用數(shù)據(jù)填充技術(shù)[14-15]。這些技術(shù)在一定程度上可以緩解冷啟動,但是在兒童繪本推薦系統(tǒng)中卻不適用。

    著名在線影片租聘供應(yīng)商Netflix 在缺少用戶數(shù)據(jù)時通過以下方式獲取信息:先隨機推薦5 部電影給用戶,要求用戶對推薦的電影評分,再根據(jù)打分的情況獲得用戶的反饋信息。本文將此方式稱為顯式問詢,并據(jù)此提出隱式問詢方式:不直接詢問用戶的興趣偏好而是通過詢問用戶的日常行為喜好,從而間接推斷出用戶潛在的興趣偏好,進而根據(jù)用戶的潛在興趣匹配相應(yīng)商品。

    本文基于隱式問詢方式,提出一種兒童繪本推薦模型,來解決兒童用戶冷啟動問題。首先精選一些兒童用戶的日常行為建立隱式問詢題庫,回答隱式問詢題目并輸入到隱式問詢模塊計算出用戶潛在興趣;再通過跨域獲得項目信息進行聚類,以此提高推薦準確率。

    1 隱式問詢的個性化推薦模型

    1.1 隱式問詢的問題設(shè)計

    本文借鑒美國耶魯大學(xué)心理學(xué)家羅伯特·斯滕伯格博士研究的一種“多向度”測試[16],其中包含20種對照行為,通過文本提取其中的行為興趣映射關(guān)系,部分映射關(guān)系如表1 所示。

    表1 部分行為興趣映射關(guān)系Tab.1 Behavioral interest mapping

    根據(jù)行為興趣的映射關(guān)系,設(shè)置符合本文假設(shè)場景的問題。例如:對于“經(jīng)常提問關(guān)于自然現(xiàn)象的問題”“喜愛拼積木拼拼圖”這些問題回答“是”的用戶對科普、數(shù)學(xué)和邏輯方面比較感興趣;對于“喜歡看類似黑貓警長類的動畫片”“對沒做過的事情樂于嘗試”回答“是”的用戶勇敢、對冒險方面感興趣;對于“經(jīng)常獨立的畫出圖畫”回答“是”的用戶對繪畫感興趣。

    本研究邀請5 位兒童專家,分別就20 個行為提出問題。為了提高推薦的準確度,從1 個行為的5個問題中篩選出2 個有效問題,作為最終的隱式問詢題目。

    篩選的算法步驟如下:

    Step 1召集有過歷史記錄的用戶回答專家提出的所有問題,并建立用戶評分矩陣R(user-item)和項目屬性矩陣T(item-attribute)。

    其中r11表示u1對項目i1的評分,用戶對項目的評分范圍在0~10 之間。若用戶對項目沒有評價,則rnm為0。

    通常1 個項目可能含有1 個或多個屬性,1 個項目屬性可能被1 個或多個項目含有。定義項目屬性的集合為[a1,…,aλ],其中λ 表示項目屬性的個數(shù)。

    Step 2用戶對項目的喜愛程度,體現(xiàn)在評分的高低上,評分高的項目屬性通常是被用戶接受的,所以項目具有的屬性在一定程度上能映射用戶的喜好。根據(jù)

    計算得到用戶項目屬性評分矩陣(user-attribute)。其中:表示用戶對具有k 屬性項目的評分之和;sum(iak)表示具有k 屬性項目的個數(shù)。提取每個項目屬性評分較高的用戶集合,如對ak屬性感興趣的用戶集合為

    Step 3根據(jù)專家提問,獲得每個問題興趣映射關(guān)系矩陣I(question-interest)

    提取可以映射興趣的問題集合。例如:可以映射興趣k 的問題集合有

    Step 4存在一個問題可能包含多個興趣的映射關(guān)系,設(shè)置問題有效性權(quán)重為

    其中c 為該問題可以映射的興趣個數(shù)。

    Step 5在相同興趣偏好下,整合兩個集合,得到用戶問題回答情況矩陣Q(user-question)

    計算每個問題的有效度

    1.2 基于隱式問詢建立用戶興趣模型

    通過用戶對隱式問題的回答和行為映射的興趣,得到用戶回答問題矩陣A和問題興趣映射矩陣I,重構(gòu)兩個矩陣可以得到用戶興趣模型。其中,用戶回答問題矩陣A為

    矩陣A中用戶回答“是”為1,回答“否”為0,“不清楚”則空缺。

    問題興趣映射矩陣I為各種問題提出的行為對應(yīng)的興趣,如果這種行為可以映射出興趣,那么I為1,否則為0。比如,對第1 個問題回答“是”的用戶可以映射出他們對I2,I3感興趣。

    根據(jù)公式

    對兩個矩陣進行重構(gòu),得到用戶興趣矩陣P

    式(4)中:Au,q表示用戶u 是否回答q 問題;Qu,I表示用戶u 回答過問題中含有興趣I的問題集合;sum(Qu,I)表示Qu,I中的元素個數(shù)。構(gòu)建兒童用戶興趣模型的算法如下:

    Step 1獲取用戶回答問題數(shù)據(jù),建立回答問題矩陣A;

    Step 2獲取問題映射出的興趣信息,建立問題興趣映射關(guān)系矩陣I;

    Step 3利用式(4)將兩個矩陣重構(gòu),得到用戶興趣矩陣P,計算出兒童用戶的閱讀興趣。

    由于存在幾個行為會出現(xiàn)相同的興趣和用戶會更傾向于某種興趣,本文通過定義用戶興趣權(quán)重來區(qū)分用戶對興趣的喜愛程度。

    定義1用戶對k 類興趣的權(quán)重為用戶選擇k類興趣對應(yīng)的用戶行為個數(shù)與用戶選擇“是”與“否”的行為個數(shù)的比值。計算公式為

    1.3 對跨域項目聚類

    對于項目冷啟動的問題,本文結(jié)合跨域技術(shù)[17-18]與聚類技術(shù)[19],借鑒遷移學(xué)習(xí)的思想,通過跨域整合不同領(lǐng)域獲得項目特征,提高推薦的準確性,跨域推薦系統(tǒng)流程圖如圖1 所示。

    圖1 跨域推薦系統(tǒng)流程圖Fig.1 Cross-domain recommendation system flowchart

    由于在源域和目標域中存在相似的標簽[20],本文將有相似標簽的項目進行聚類,這樣聚類出的繪本,也有著相似的特征信息,當獲取用戶閱讀興趣偏好后,就可以進行個性化推薦。整個過程避免了在整個繪本集合上進行,可以提高推薦效率和反應(yīng)時間。

    本文繪本聚類思想為首先令初始的每個繪本單獨為1 個集合,然后,利用繪本標簽聚類,計算任意兩個繪本的標簽的相似度

    其中:N(b)為標簽b 的繪本集合;n(b)為給繪本打上標簽的用戶數(shù)。選取相似度最大的兩個項目集合進行合并,將合并后的集合加入下一輪合并,直到生成K 個類。

    最后,通過K 聚類,可將相同特征的繪本歸為一類。

    1.4 生成推薦列表算法

    當一個新用戶加入到個性化推薦系統(tǒng)時,系統(tǒng)對新用戶進行隱式問詢,得到新用戶的興趣,根據(jù)用戶興趣模型生成推薦列表。算法的具體流程如圖2 所示。

    圖2 生成推薦列表算法流程圖Fig.2 Algorithm flow chart for generating recommendation list

    1.5 預(yù)測評分的方法

    本文根據(jù)用戶興趣信息和注冊信息,采用余弦相似度計算用戶u 和用戶v 的相似度為

    其中uλ表示用戶的第λ 個屬性。相似度值越大說明距離越小,即用戶相似的越大??紤]到在計算用戶興趣的偏愛程度時會出現(xiàn)一定誤差,本文提出加權(quán)相似度模型,在計算兩個用戶之間相似度時,加入用戶興趣權(quán)重

    計算相似度,獲得用戶最相似的近鄰,采用k 近鄰的方法來預(yù)測,其主要思想是選擇與目標用戶最為相似的k 個用戶為近鄰集合,可根據(jù)

    對物品i 進行評分預(yù)測。其中:Nk為用戶最相似的k個近鄰;rv為用戶v 對物品i 的評分。

    2 實驗對比和分析

    2.1 數(shù)據(jù)集

    本實驗中使用國內(nèi)知名連鎖繪本館老約翰繪本館和皮克布克繪本王國的真實數(shù)據(jù)。老約翰繪本館是中國實現(xiàn)繪本館網(wǎng)上借閱并送書上門服務(wù)的兒童繪本館連鎖公司,是電商O2O 本地生活服務(wù)類別里的網(wǎng)絡(luò)繪本借閱平臺的行業(yè)領(lǐng)跑者,是兒童早期閱讀和親子活動的平臺。其中老約翰烏魯木齊繪本館分別有用戶評分數(shù)據(jù)、書本屬性數(shù)據(jù),及用戶個人興趣喜好數(shù)據(jù)。包含15 萬條用戶對書評分的數(shù)據(jù),評分范圍為1~10;1 110 個用戶,46 種書的標簽;一本書可以包含多個主題;用戶個人屬性包含姓名、年齡和喜好,一個人可以包含多個興趣。皮克布克繪本王國中有19 萬條數(shù)據(jù),50 種書的標簽。

    實驗中,我們抽取80%的數(shù)據(jù)為訓(xùn)練集,訓(xùn)練出用戶興趣偏好與書本屬性的模型;20%的數(shù)據(jù)為測試集,抹去用戶真實評分數(shù)據(jù),預(yù)測用戶評分并與真實評分比較。

    2.2 評價指標

    目前常用MAE、準確率和召回率對推薦效果進行比較,為了計算預(yù)測值與真實值之間的差距,本文使用平均絕對誤差MAE 來評價預(yù)測情況。MAE越小,表示預(yù)測性能越好。假設(shè)在測試集T 中用戶對項目的預(yù)測評分為,用戶對項目的實際評分為rui,那么可以將推薦系統(tǒng)的評價MAE 記為

    令R(u)為根據(jù)用戶在訓(xùn)練集上的行為給出的推薦列表,T(u)是用戶在測試集上的行為列表。推薦結(jié)果的準確率和召回率為

    2.3 對比實驗

    為了評價本文算法推薦的準確率,將本文隱式問詢推薦算法與其他幾種算法進行對比,其中包括傳統(tǒng)協(xié)同過濾算法、直接問詢推薦算法[21]、熱門推薦算法及融合用戶特征化聚類的協(xié)同過濾混合推薦算法。傳統(tǒng)協(xié)同過濾算法通過對已有項目的評分預(yù)測用戶未評分項目,其需要有一定的歷史數(shù)據(jù),在沒有歷史數(shù)據(jù)時,采用隨機推薦;直接問詢推薦算法是緩解冷啟動的常用算法,在新系統(tǒng)缺少歷史數(shù)據(jù)的情況下采用用戶注冊時詢問其喜好的方法,根據(jù)用戶的選擇進行個性化推薦;熱門推薦算法把熱門榜單上前top-n 的項目推薦給用戶;混合協(xié)同過濾算法是最近提出的解決用戶冷啟動問題的方法[22],該算法在計算用戶相似度時考慮了用戶屬性相似度和信任相似度。

    本文實驗取聚類個數(shù)k=10,推薦項目個數(shù)為5~25,每次增加5 本書進行觀察比較。隱式問詢推薦算法、隨機推薦算法、直接推薦算法和混合推薦算法的MAE 實驗結(jié)果如圖3 所示。

    圖3 推薦數(shù)量變化時的MAE 比較Fig.3 Comparison of MAE when recommended quantity changes

    可以看出,4 種算法隨著推薦項目數(shù)量增加而上升,隨機推薦算法的結(jié)果最高說明隨機推薦算法的準確率較低;由于直接問詢算法了解了少部分用戶真實興趣,混合推薦算法也考慮到了用戶的屬性,它們的準確率較隨機推薦算法提高很多;本文提出的隱式問詢推薦算法的MAE 最小,說明本文提出的算法更適用于兒童繪本推薦系統(tǒng),推薦效果比其他算法更好。

    由于隨機推薦算法和直接問詢推薦算法效果不佳,不加入準確率和召回率的比較。在推薦列表為10 時,比較熱門推薦算法、混合推薦算法與本文隱式問詢推薦算法的準確率與召回率。實驗結(jié)果如圖4、5 所示。

    圖4 3 種算法準確率比較Fig.4 Comparison of precision of three algorithms

    圖5 3 種算法召回率比較Fig.5 Comparison of recall of three algorithms

    從圖4、5 可以看出,當用戶數(shù)不同時,本文提出的隱式問詢推薦算法的準確率和召回率均高于熱門推薦算法與混合推薦算法,說明隱式問詢推薦算法在兒童繪本推薦系統(tǒng)中更優(yōu)。

    3 總結(jié)與展望

    本文提出的隱式問詢推薦系統(tǒng),主要通過隱式問詢兒童的日常行為喜好來計算兒童閱讀喜好并建立兒童興趣模型,用來緩解冷啟動問題。在全國知名繪本企業(yè)提供的真實數(shù)據(jù)集上進行實驗,結(jié)果表明,本文提出的隱式問詢推薦算法與隨機推薦算法、直接問詢推薦算法、熱門推薦算法、混合推薦算法相比,有著有更高的推薦精度。

    在后續(xù)研究中,可將隱式問詢方法與知識圖譜相結(jié)合,考慮基于隱式問題和問題對應(yīng)的閱讀興趣構(gòu)建用戶興趣主體。當用戶訪問時,對用戶回答隱式問詢信息進行提取,與用戶興趣本體關(guān)聯(lián)并進行用戶閱讀興趣建模,以提高推薦準確度。

    猜你喜歡
    繪本矩陣兒童
    繪本
    繪本
    繪本
    留守兒童
    雜文選刊(2016年7期)2016-08-02 08:39:56
    初等行變換與初等列變換并用求逆矩陣
    六一兒童
    矩陣
    南都周刊(2015年4期)2015-09-10 07:22:44
    矩陣
    南都周刊(2015年3期)2015-09-10 07:22:44
    矩陣
    南都周刊(2015年1期)2015-09-10 07:22:44
    繪本
    攀枝花市| 壶关县| 奉新县| 丰县| 库车县| 遂川县| 邵阳县| 神池县| 嵊州市| 丹巴县| 广东省| 宽城| 抚远县| 乐陵市| 哈密市| 桃源县| 霍林郭勒市| 景洪市| 嘉兴市| 乌拉特中旗| 当雄县| 成都市| 内黄县| 六盘水市| 龙岩市| 昔阳县| 壶关县| 义马市| 汾阳市| 昌平区| 遂平县| 新安县| 安达市| 长汀县| 江源县| 定结县| 社旗县| 娱乐| 上林县| 尤溪县| 余姚市|