• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于用戶情境的高校圖書館書目協(xié)同過濾推薦研究

    2021-01-08 06:45:32李建苗
    圖書館研究與工作 2021年1期
    關(guān)鍵詞:書目相似性概率

    汪 圳 李建苗

    (1.長安大學(xué)圖書館 陜西西安 710064)(2.西安信息職業(yè)大學(xué)數(shù)字經(jīng)濟管理學(xué)院 陜西西安 710068)

    面對海量數(shù)據(jù)的沖擊,“信息超載(Information Overload)”的現(xiàn)象愈發(fā)明顯,越來越多的用戶需要個性化和“一對一”式的信息推薦。高校圖書館在引入個性化信息推薦領(lǐng)域取得了一定的研究進展,但由于圖書館在進行書目推送時,以圖書館為主體導(dǎo)致忽略了高校用戶的閱讀心理和需求,已有的書目推薦策略為熱門書排行榜、熱門借閱量及熱門檢索詞等陳舊的方式,缺乏考慮高校用戶所處的情境(Context)。高校圖書館進行有效的書目推薦,應(yīng)充分考慮情境要素對用戶偏好的實時性的影響。情境要素包含用戶基本信息、環(huán)境及系統(tǒng)多方面的數(shù)據(jù)。

    1 相關(guān)研究綜述

    情境可用來描述實體的一切信息,甚至包括復(fù)雜的社會網(wǎng)絡(luò)關(guān)系[1]。而用戶情境是多個情境要素的集合[2]。DEY[1]認(rèn)為用戶情境要素包括4大類:用戶基本特征信息、用戶行為信息、用戶環(huán)境信息、用戶應(yīng)用環(huán)境;Ayse Goker等人[3]在研究個性化服務(wù)領(lǐng)域中構(gòu)建了通用的用戶情境模型,包括個人、環(huán)境、任務(wù)、社會關(guān)系及時間五個方面;Youngok Choi[4]在研究影響用戶搜尋策略時,將用戶所處的情境分為了六個維度:任務(wù)目標(biāo)、搜索技能、認(rèn)知程度、任務(wù)階段、任務(wù)期限及搜索次數(shù);Niederee等人[5]在個性化服務(wù)研究領(lǐng)域,通過任務(wù)、認(rèn)知模式、關(guān)系和環(huán)境四個方面描述用戶情境的要素信息;Adomavicius等人[6]最早將基于情境要素推理的技術(shù)應(yīng)用到推薦系統(tǒng),并證實了情境要素在推薦系統(tǒng)中的重要作用;Byun等人[7]基于歷史情境信息推理出用戶偏好,提供個性化的推薦;Si[8]根據(jù)用戶行為習(xí)慣,應(yīng)用隱馬爾科夫模型,提出了情境推理的推薦服務(wù)平臺。

    作為擁有海量知識儲備的高校圖書館,承擔(dān)著向用戶提供知識服務(wù)的責(zé)任,因此針對高校圖書館如何更好地提供知識推薦服務(wù)的相關(guān)研究層出不窮。汪圳等人[9]針對面向科研人員的數(shù)字圖書館知識推薦,引入了科研情境的概念,準(zhǔn)確獲取科研人員的知識需求,基于科研情境設(shè)計了分層過濾的知識推薦策略;余以勝等人[10]在協(xié)同過濾算法中同時考慮圖書與用戶自身的因素,從而提升推薦算法的可解釋性、準(zhǔn)確性及實時性;王井[11]提取用戶的訂閱記錄,分別計算用戶相似性和訂閱圖書相似性,改進了傳統(tǒng)圖書館圖書推薦的協(xié)同過濾方法;李玉[12]將社會化媒體熱點發(fā)現(xiàn)引入到高校圖書館書目推薦的研究中,進而通過推理算法從社會化媒體中發(fā)現(xiàn)當(dāng)前學(xué)科領(lǐng)域的研究熱點,基于獲取到的研究熱點提出一種結(jié)合了當(dāng)前熱點的基于內(nèi)容的高校圖書館書目資源推薦方法;王欣等人[13]探討了基于情境感知的圖書館個性化知識服務(wù)的理論模式。

    綜上所述,雖然高校圖書館在面向高校用戶群體引入了信息資源推薦的服務(wù),但在個性化推薦領(lǐng)域還處于探索階段,并沒有考慮用戶全方位多維度的信息要素??紤]情境要素對圖書館用戶群體的偏好會產(chǎn)生影響,本文引入情境感知技術(shù),基于用戶情境要素推理用戶的閱讀偏好,從而開展基于用戶情境要素推理的高校圖書館書目協(xié)同過濾推薦研究。

    2 高校圖書館書目推薦系統(tǒng)要素分析

    2.1 用戶分類

    高校圖書館系統(tǒng)主要作用于日常學(xué)習(xí)和工作科研,用戶主要包括在校學(xué)生、在校教職工兩大類。隨著用戶對圖書館系統(tǒng)使用程度的加深,用戶的信息完整度得到完善,同時使用的推薦方法也會發(fā)生變化。根據(jù)用戶信息的完整程度,對用戶進行了定義:

    U1指游客用戶,用戶信息完整度為0;

    U2指新注冊用戶,有基本注冊信息,沒有歷史行為或歷史行為極少;

    U3指情景信息齊全用戶。

    2.2 推薦內(nèi)容分析

    用戶的信息完整程度決定著個性化書目推薦的準(zhǔn)確程度,針對圖書館三類用戶,系統(tǒng)推薦內(nèi)容各有不同。

    (1)游客用戶U1

    游客用戶首次登陸圖書館系統(tǒng),后臺無用戶任何信息,可以對用戶進行當(dāng)前熱門書目或新購書目推薦,或根據(jù)其搜索信息推薦關(guān)聯(lián)性強的書目。

    (2)新注冊用戶U2

    對于新注冊用戶,系統(tǒng)缺少其歷史行為偏好信息,可根據(jù)其基本注冊信息構(gòu)建用戶偏好模型,并查找相似用戶群,識別用戶偏好,據(jù)此推薦書目。

    (3)情景信息齊全用戶U3

    對于情景信息齊全用戶,圖書館系統(tǒng)會根據(jù)其歷史行為、當(dāng)前情境、基本特征等多個維度建立偏好模型,并對比相似用戶群,給出推薦結(jié)果。

    2.3 推薦流程分析

    針對用戶的不同,圖書館書目推薦實現(xiàn)流程也不完全相同,主要推薦流程包括三個部分。

    (1)用戶偏好推理

    用戶偏好是指用戶對于某類書目產(chǎn)生的主觀偏好、實際需要、訂閱習(xí)慣等行為的總稱。要對用戶進行書目推薦,最重要的是識別用戶的偏好。識別用戶偏好是進行推薦的基礎(chǔ),也是后續(xù)進行相似性計算、目標(biāo)用戶評分預(yù)測、推薦結(jié)果篩選等步驟的前提。用戶偏好的推理在推薦系統(tǒng)的設(shè)計與實現(xiàn)中占有重要作用。

    (2)目標(biāo)用戶與信息完整度高的用戶之間的相似性計算

    系統(tǒng)目標(biāo)用戶Ua的書目偏好受其已有的習(xí)慣、思維或基礎(chǔ)特征等要素影響,這些影響因素對相似用戶的影響程度是幾乎相同的,因此可以根據(jù)相似用戶的書目偏好推理目標(biāo)用戶的書目偏好。

    相似性計算方法主要有三種:余弦相似性、皮爾森相似性和改進的余弦相似性。改進的余弦相似性克服了余弦相似性、皮爾森相似性的缺點,是最常用的相似性計算方法。因此,本文選擇改進的余弦相似性計算方法計算目標(biāo)用戶與已知用戶群之間的相似性。

    因此用戶相似性計算表達(dá)式為:

    其中,Ua為目標(biāo)用戶,Ui為系統(tǒng)中已有用戶群中的第i個用戶。

    最后選擇相似性高的N個用戶組成相似用戶集AUa,將其偏好定義為目標(biāo)用戶的偏好。

    (3)目標(biāo)用戶的偏好評分預(yù)測

    個體存在差異,僅根據(jù)用戶之間的相似性判斷目標(biāo)用戶的偏好會存在很多誤差,所以根據(jù)個體實際情況判斷其對某書目的偏好程度也是推薦流程中非常重要的過程。本文用目標(biāo)用戶對某書目的偏好評分表示對其偏好的程度,評分預(yù)測的過程如下:

    其中,Si,j指目標(biāo)用戶i對書目j的偏好評分;

    AUi指目標(biāo)用戶i的相似用戶集;

    Su,j指目標(biāo)用戶的相似用戶u對書目j的偏好評分;

    通過計算可以得出用戶對書目的偏好程度評分,并進行排序,再進一步選擇高分書目向用戶推薦。

    圖書館書目系統(tǒng)過濾推薦實現(xiàn)流程如圖1至圖3所示。

    圖1 圖書館書目系統(tǒng)過濾推薦流程圖(針對U1型用戶)

    圖2 圖書館書目系統(tǒng)過濾推薦流程圖(針對U2型用戶)

    圖3 圖書館書目系統(tǒng)過濾推薦流程圖(針對U3型用戶)

    為了實現(xiàn)基于用戶情境的協(xié)同推薦,系統(tǒng)首先對目標(biāo)用戶進行建模,U3型用戶可以進一步提取其對書目類型的偏好;其次應(yīng)用改進的余弦相似性的計算方式,篩選系統(tǒng)已有用戶群中與目標(biāo)用戶相似的用戶,組成相似用戶群,并進一步構(gòu)建相似用戶群偏好模型;最后在相似用戶群的偏好基礎(chǔ)上,計算目標(biāo)用戶對書目的評分,選擇得分高者對用戶進行推薦。

    3 特定情境要素推理下的用戶偏好模型構(gòu)建

    用戶偏好是在多種情境因素影響下形成的。即使是同一個用戶,在不同的情境下,其偏好也是不完全相同的。情境要素對用戶偏好的影響有非常重要的作用。因此,本文在進行用戶偏好推理的過程中,利用貝葉斯推理理論,構(gòu)建了基于用戶情境要素的用戶偏好模型。

    3.1 用戶情境要素分析

    本文選取的高校圖書館用戶情境要素主要有以下三類:用戶基本信息(Ubasic)、用戶歷史行為(Uhis)及用戶當(dāng)前情境(Ucontext)。

    用戶情境模型表示為:Context={Ubasic,Uhis,Ucontext}

    其中,Ubasic={Sex,Age,Job,EB};Uhis={HB,HS,HD,EV};Ucontext={Time,Place,F(xiàn)E,PA}。用戶情境要素的說明如表1所示。

    3.2 用戶偏好書目類別及特定情境下被選擇概率表示

    不同用戶的偏好書目的類型不同。依據(jù)《中國圖書館分類法》對圖書的類別進行劃分,即五大部類、22個大類。根據(jù)用戶偏好書目的分類,結(jié)合用戶情境要素,目標(biāo)用戶a對每一類書目類型的偏好概率用BPa(k.i,j)、HPa(k.i,j)、CPa(k.i,j)表示,其中BP表示在用戶基本特征數(shù)據(jù)下用戶偏好概率。k表示第k個要素,i表示第k個要素的第i個分類,j表示第j個書目分類;HP、CP分別表示在歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)條件下的用戶偏好概率;則目標(biāo)用戶對第j類書目里每個書目的偏好概率分別為BPj,p、HPj,p、CPj,p。用戶偏好概率作為貝葉斯網(wǎng)絡(luò)推理的先驗數(shù)據(jù),由系統(tǒng)后臺大數(shù)據(jù)計算得出。

    表1 用戶情境要素的含義和說明

    3.3 用戶偏好模型構(gòu)建

    選擇用戶基本特征、歷史行為、當(dāng)前情境三個情境維度,利用貝葉斯網(wǎng)絡(luò)推理,本節(jié)分別構(gòu)建了基于基本特征推理的用戶偏好子模型、基于歷史行為推理的用戶偏好子模型、基于當(dāng)前情境推理的用戶偏好子模型。在此基礎(chǔ)上,考慮并計算了三個維度構(gòu)建的偏好子模型對于用戶偏好的影響權(quán)重,構(gòu)建了包括基本特征推理、歷史行為推理、當(dāng)前情境推理的用戶多維偏好模型。偏好模型構(gòu)建的整體思路如圖4所示。

    圖4 用戶多維偏好模型構(gòu)建流程

    (1)基于用戶基本信息的用戶偏好概率

    以目標(biāo)用戶基本信息作為子節(jié)點,用戶偏好作為父節(jié)點構(gòu)建的貝葉斯網(wǎng)絡(luò)拓?fù)鋱D,其中每一子節(jié)點都有一個用戶偏好概率。這些概率的大小真實反映著用戶的實際偏好程度。用戶在基本信息B條件下偏好書目Cj的概率計算方法為:

    根據(jù)公式3可計算出用戶在基本信息條件下對每類書目的偏好概率,取其中最大值作為用戶在基本信息條件下的偏好推薦方案。

    (2)基于用戶歷史行為的用戶偏好概率

    基于用戶歷史行為的用戶偏好概率的計算方法與基于用戶基本信息的用戶偏好概率計算方法相同,用戶在歷史行為H條件下對書目Cj的偏好概率計算方法為:

    根據(jù)公式4計算用戶在歷史行為條件下對每類書目的偏好概率值,選取最大值作為最佳推薦方案。

    (3)基于用戶當(dāng)前情境的用戶偏好概率

    除了用戶基本信息和歷史行為,用戶當(dāng)前情境對用戶偏好的影響也非常大。其計算方法與以上兩種概率計算方法相同,用戶在當(dāng)前情境N下對書目Cj的偏好概率計算方法為:

    根據(jù)公式5計算用戶在當(dāng)前情境下對每類書目的偏好概率,取計算結(jié)果的最大值,作為用戶在當(dāng)前情境下的偏好推薦結(jié)果。

    (4)用戶多維偏好模型構(gòu)建

    一般情況下,用戶基本特征、歷史行為、當(dāng)前情境等單一因素條件下分析得出的推薦方案具有一定的準(zhǔn)確性,但是往往會與實際情況存在較大誤差,影響因素之間的作用是交互的,因此綜合多因素考慮用戶偏好會使結(jié)果更精準(zhǔn)。論文通過數(shù)理統(tǒng)計法在三類模型前加權(quán)重系數(shù)ω,使用戶偏好模型更符合用戶實際需求。

    基于情境要素推理的用戶多維偏好概率模型如公式6所示。

    4 應(yīng)用實例及實驗分析

    4.1 應(yīng)用實例

    本文提取長安大學(xué)圖書館的借閱記錄作為樣本群,并隨機選取一條借閱記錄作為研究樣本,樣本用戶情境信息如表2所示。

    表2 樣本用戶情境信息

    由于圖書館現(xiàn)有系統(tǒng)功能的局限性,情境信息中的Place和PA均為固定值。

    得到樣本用戶個性化推薦結(jié)果如表3所示。

    表3 不同算法下樣本用戶書目推薦結(jié)果

    通過各類算法計算目標(biāo)用戶對書目的偏好概率,取前八項推薦結(jié)果,并與該用戶日常借閱記錄作對比,結(jié)果符合其借閱規(guī)律,其中采用多維推薦算法得出的推薦結(jié)果在其借閱記錄中全部出現(xiàn),表明該算法更符合目標(biāo)用戶的借閱規(guī)律。

    4.2 實驗評價及結(jié)果分析

    一般可根據(jù)準(zhǔn)確率(Precision)和召回率(Re-call)來評價推薦結(jié)果。召回率是指符合用戶偏好的推薦書目數(shù)量在讀者偏好集中的比例;準(zhǔn)確率是指符合用戶偏好的推薦書目數(shù)量在總推薦書目集合中占的比例。

    召回率和準(zhǔn)確率的計算公式如公式7、公式8所示。

    其中Re為召回率,Pr為準(zhǔn)確率,Li為符合用戶實際偏好的書目總數(shù),Ti為用戶i偏好集中書目總數(shù),M為樣本用戶總數(shù),N表示推薦書目的總數(shù)。

    二者調(diào)和平均數(shù):

    當(dāng)F值越高時,推薦效果越好。

    以借閱記錄為基礎(chǔ),選取部分用戶作為推薦模型測試者,提取測試者反饋數(shù)據(jù),代入公式7至公式9,得不同推薦模型的評價結(jié)果如表4所示。

    表4 不同推薦模型的評價結(jié)果

    調(diào)和平均數(shù)F越高,說明推薦準(zhǔn)確度越高。從表4可知,采用多維偏好模型進行書目推薦的F值高于其他模型算法,推薦準(zhǔn)確度更高,可靠性更好,較其他方法更具有優(yōu)越性。

    5 結(jié)語

    本文針對圖書館網(wǎng)站擁有海量知識資源,“信息超載”致使用戶需要花費大量時間和精力搜尋需求的信息這一問題展開研究,設(shè)計一種基于用戶多維情境要素的高校圖書館書目推薦策略。圖書館網(wǎng)站推薦模塊可以根據(jù)用戶的偏好向用戶主動推薦書目,通過實驗表明該方法推薦的書目具有一定的準(zhǔn)確性,做到了以用戶為中心,滿足用戶的個性化信息需求。如何將該推薦策略應(yīng)用于圖書館系統(tǒng),是下一階段研究的重點。

    猜你喜歡
    書目相似性概率
    一類上三角算子矩陣的相似性與酉相似性
    第6講 “統(tǒng)計與概率”復(fù)習(xí)精講
    推薦書目《初春之城》
    都市人(2022年3期)2022-04-27 00:44:57
    第6講 “統(tǒng)計與概率”復(fù)習(xí)精講
    概率與統(tǒng)計(一)
    概率與統(tǒng)計(二)
    淺析當(dāng)代中西方繪畫的相似性
    河北畫報(2020年8期)2020-10-27 02:54:20
    低滲透黏土中氯離子彌散作用離心模擬相似性
    V4國家經(jīng)濟的相似性與差異性
    本刊郵購書目
    社旗县| 新宾| 含山县| 新兴县| 阿坝县| 策勒县| 饶阳县| 南澳县| 云浮市| 边坝县| 桦甸市| 康定县| 甘孜| 新郑市| 安陆市| 伊宁县| 滁州市| 溧水县| 镇宁| 汤原县| 定陶县| 台江县| 平罗县| 巢湖市| 南丰县| SHOW| 达拉特旗| 长宁县| 玉环县| 利川市| 云阳县| 怀柔区| 阜新市| 达拉特旗| 新乡市| 莒南县| 平阴县| 华容县| 沐川县| 井研县| 高清|