• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種核的上下文多臂賭博機(jī)推薦算法

    2022-06-19 03:24:24王鼎門昌騫王文劍
    智能系統(tǒng)學(xué)報(bào) 2022年3期
    關(guān)鍵詞:點(diǎn)擊率置信區(qū)間線性

    王鼎,門昌騫,王文劍,2

    (1.山西大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,山西 太原 030006;2.山西大學(xué) 計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室,山西 太原 030006)

    個(gè)性化推薦在各種系統(tǒng)中被廣泛應(yīng)用,通過為用戶提供定制化的網(wǎng)絡(luò)服務(wù),可以很好地滿足用戶的個(gè)性化需求,從而提升用戶滿意度。盡管傳統(tǒng)推薦算法在一些領(lǐng)域已經(jīng)非常成功,但是僅適用于用戶和內(nèi)容變化小的相對(duì)靜態(tài)的場(chǎng)景[1]。例如,傳統(tǒng)協(xié)同過濾[2-3]需要在用戶和內(nèi)容有大量重疊的消費(fèi)記錄等信息的場(chǎng)景下才能應(yīng)用,而基于內(nèi)容的推薦算法[4-5]推薦傾向于過于相似的內(nèi)容,對(duì)新用戶的推薦存在困難。

    現(xiàn)實(shí)生活中存在著快速變化的推薦環(huán)境,其內(nèi)容領(lǐng)域每時(shí)每刻都在發(fā)生著變化,內(nèi)容的流行程度隨著時(shí)間而變化,大量沒有任何歷史記錄的新用戶也不斷進(jìn)入推薦系統(tǒng)。在這種場(chǎng)景下推薦系統(tǒng)必須能夠快速獲得用戶的興趣偏好,才能更好地為用戶提供個(gè)性化服務(wù)??焖佾@得用戶興趣信息和短期內(nèi)用戶體驗(yàn)是競(jìng)爭(zhēng)關(guān)系,一方面需要關(guān)注能夠提高用戶興趣的內(nèi)容,另一方面也需要探索新內(nèi)容以全面改善用戶體驗(yàn),這就產(chǎn)生了探索-利用困境(exploration-exploitation dilemma,EE)[6]。為了實(shí)現(xiàn)用戶的長(zhǎng)期體驗(yàn),必須平衡探索和利用的矛盾。

    多臂賭博機(jī)[7-9]是平衡這一矛盾的有效模型,多臂賭博機(jī)又可以按照是否考慮狀態(tài)分為上下文無關(guān)多臂賭博機(jī)和上下文多臂賭博機(jī)[10-11]。上下文無關(guān)多臂賭博機(jī)算法主要有ε-greedy[12]、UCB1[13]、Thompson sampling[14]等。這類上下文無關(guān)的多臂賭博機(jī)算法應(yīng)用于推薦系統(tǒng)中,沒有利用用戶和內(nèi)容的上下文信息,因此導(dǎo)致推薦準(zhǔn)確性不高。

    上下文多臂賭博機(jī)算法將內(nèi)容和用戶等上下文信息融入推薦決策過程,可以提高推薦準(zhǔn)確率。LinUCB (linear upper confidence bound)是一種成功應(yīng)用于雅虎新聞推薦系統(tǒng)的上下文多臂賭博機(jī)算法,可以有效提高在快速變化環(huán)境下的推薦準(zhǔn)確率[15]。但是LinUCB 算法為了簡(jiǎn)化模型和降低計(jì)算成本,假設(shè)期望收益和上下文是線性關(guān)系的。這種線性假設(shè)在現(xiàn)實(shí)中往往是不成立的,所以導(dǎo)致LinUCB 算法的推薦準(zhǔn)確率并不高。Agrawal等[16]提出的湯普森采樣算法LinTS,同樣是基于線性收益上下文賭博機(jī)模型。

    在LinUCB 算法基礎(chǔ)上,結(jié)合傳統(tǒng)推薦算法提出了很多改進(jìn)算法。文獻(xiàn)[17]結(jié)合協(xié)同過濾的思想將用戶之間的影響融合到LinUCB 算法,提出了GOB.Lin 算法。文獻(xiàn)[18]提出了利用用戶信息在線聚類算法CLUB,對(duì)用戶聚類。文獻(xiàn)[19]提出了對(duì)用戶和內(nèi)容雙聚類的COFIBA 算法。文獻(xiàn)[20]提出結(jié)合潛在因子的fatorUCB 算法。這些傳統(tǒng)推薦算法與多臂賭博機(jī)的結(jié)合可以提升推薦效果,但都屬于結(jié)合創(chuàng)新,沒有改進(jìn)線性收益的上下文多臂賭博機(jī)模型。

    本文突破了LinUCB 算法線性假設(shè)的前提,提出了一種基于核方法[21]在非線性前提下計(jì)算預(yù)測(cè)收益置信區(qū)間上界的方法,從模型上改進(jìn)基于線性收益的上下文多臂賭博機(jī),提高了算法的推薦準(zhǔn)確率。

    1 背景模型

    1.1 上下文多臂賭博機(jī)

    推薦系統(tǒng)中EE 問題方面一個(gè)得到廣泛研究的模型就是上下文多臂賭博機(jī)模型,將該模型形式化來進(jìn)行更好的理解。上下文多臂賭博機(jī)是指面對(duì)K個(gè)臂,每輪選擇其中一個(gè)臂并獲得收益,一共進(jìn)行T輪選擇,目標(biāo)是使T輪之后總的收益更高。上下文多臂賭博機(jī)在每一輪中:

    1)觀察當(dāng)前上下文信息x。上下文總結(jié)了當(dāng)前的環(huán)境,如日期、天氣、用戶等影響做出選擇的信息。

    2)根據(jù)歷史記錄,算法選擇一個(gè)臂a并獲得真實(shí)收益r。預(yù)測(cè)收益由上下文信息x所決定。

    3)算法根據(jù)最新得到的觀測(cè)歷史(x,a,r),更新下一輪選擇策略。

    多臂賭博機(jī)最大化總收益的優(yōu)化目標(biāo)可以等價(jià)替換為更常用的累積遺憾,表示為

    式中:rt為在每一輪中實(shí)際獲得的收益;為每一輪中最佳選擇的收益。

    可以很自然地將上下文多臂賭博機(jī)建模為推薦算法。以新聞推薦為例,將新聞文章庫(kù)中的文章定義為臂,通過上下文信息為用戶推薦這些臂(文章)。觀察所推薦文章的反饋,當(dāng)推薦文章被點(diǎn)擊則收益為1,否則為0。最后根據(jù)歷史收益信息,調(diào)整選擇策略。這樣一段時(shí)間后最大化上下文多臂賭博機(jī)的收益相當(dāng)于最大化點(diǎn)擊數(shù),也就是推薦系統(tǒng)的目標(biāo)點(diǎn)擊率(click-through rate,CTR)更高。

    1.2 LinUCB 算法

    LinUCB 是一種上下文多臂賭博機(jī)算法,該算法基于期望收益r和上下文x是線性關(guān)系的假設(shè),得到了線性條件下的預(yù)測(cè)收益及其置信區(qū)間的閉式解,然后利用預(yù)測(cè)收益的置信區(qū)間上界來平衡探索與利用的矛盾。LinUCB 算法的主要過程如下:

    1)計(jì)算預(yù)測(cè)收益。xt,a∈Rd表示關(guān)于用戶t和內(nèi)容a的上下文特征向量,θa為內(nèi)容a的預(yù)測(cè)線性參數(shù),則預(yù)測(cè)收益表示為

    Xa是關(guān)于內(nèi)容a的上下文特征的構(gòu)造矩陣,每一行表示一個(gè)上下文xt,a,一共m行,定義如下:

    Xa:=[x1,ax2,a···xm,a]T∈Rm×d

    Xa中的m個(gè)上下文對(duì)應(yīng)的實(shí)際收益表示為ya。在訓(xùn)練數(shù)據(jù)(Xa,ya)上應(yīng)用嶺回歸可得到內(nèi)容a的預(yù)測(cè)線性參數(shù)為

    然后通過式(1)和式(2)計(jì)算得到預(yù)測(cè)收益。

    2)計(jì)算預(yù)測(cè)收益的置信區(qū)間。根據(jù)文獻(xiàn)[22]可知,在線性條件下有

    式(3)成立的概率至少為 1?δ,δ為任意大于0 的實(shí)數(shù),α=1+是一個(gè)常數(shù)。實(shí)際上式(3)給出的預(yù)測(cè)收益的置信區(qū)間半徑c為

    3)由式(1)和式(4)可以得到每輪的選擇策略,即對(duì)每一輪選擇置信區(qū)間上界最大的內(nèi)容at進(jìn)行推薦

    最大置信區(qū)間上界是一種利用估計(jì)中的不確定性來平衡探索和利用的方法。算法對(duì)不確定性采取樂觀的態(tài)度,將對(duì)收益估計(jì)的置信區(qū)間上界作為選擇內(nèi)容的依據(jù)。這樣選擇的好處在于:如果選擇的內(nèi)容是最佳的,則成功得到了收益;如果選擇的內(nèi)容并非最佳,則進(jìn)一步消除了置信區(qū)間上界最大內(nèi)容的不確定性。最后根據(jù)所選擇內(nèi)容at的真實(shí)收益更新內(nèi)容at的線性參數(shù) θa。

    LinUCB 本質(zhì)上是一種基于線性收益的上下文多臂賭博機(jī),但是在現(xiàn)實(shí)的網(wǎng)絡(luò)服務(wù)中獲取到的數(shù)據(jù)往往并不是線性關(guān)系,所以導(dǎo)致LinUCB算法應(yīng)用于個(gè)性化推薦預(yù)測(cè)準(zhǔn)確率不高。

    2 K-UCB 算法

    為了解決LinUCB 算法線性假設(shè)造成的推薦準(zhǔn)確率不高,本文提出了K-UCB(kernel upper confidence bound)算法,基于核方法實(shí)現(xiàn)了在高維線性空間計(jì)算預(yù)測(cè)收益及其置信區(qū)間,從而提高了推薦準(zhǔn)確率。

    2.1 算法設(shè)計(jì)

    核方法是一種解決非線性問題的有效方法,其主要思想是將非線性數(shù)據(jù)向高維空間映射,使其在高維空間中轉(zhuǎn)換為線性數(shù)據(jù),然后就可以利用成熟的線性空間知識(shí)在高維空間中解決原先的非線性問題。

    在核方法思想下,將上下文特征向量x映射到合適的高維空間,在這個(gè)高維空間中預(yù)測(cè)收益和上下文特征向量是線性關(guān)系,此時(shí)可以用基于線性收益的上下文賭博機(jī)知識(shí)來解決非線性收益的問題。在高維空間中計(jì)算預(yù)測(cè)收益及其置信區(qū)間:

    1)計(jì)算預(yù)測(cè)收益。假設(shè)原空間向量x映射到高維空間后表示為 φ(x)。高維空間中兩個(gè)向量的內(nèi)積可以表示為核函數(shù)k(x,x′)=φ(x)·φ(x′)。對(duì)應(yīng)原空間中構(gòu)造矩陣X,則映射后上下文特征的構(gòu)造矩陣Xφ表示為

    對(duì)訓(xùn)練數(shù)據(jù)(Xφ,y)使用核嶺回歸方法,則需要預(yù)測(cè)的上下文x?的預(yù)測(cè)收益為

    而K則為m個(gè)上下文特征構(gòu)成的核矩陣:

    K為半正定的核矩陣,所以(K+Im)?1一定存在。

    2)計(jì)算預(yù)測(cè)收益的置信區(qū)間。由于映射后高維空間滿足線性關(guān)系,則映射后高維空間與原空間是類似的,滿足:

    式(6)成立的概率至少為 1?δ,δ為任意大于0 的實(shí)數(shù),α=1+是一個(gè)常數(shù),此時(shí)同樣也有與原空間形式類似的置信區(qū)間半徑c:

    需要將式(7)變?yōu)楹撕瘮?shù)的形式,利用Sherman-Morrison-Woodbury 公式,Sherman-Morrison-Woodbury 公式描述如下:A∈Rn×n為 R域上非奇異矩陣,U,V∈Rn×k,若A+UVT非奇異,則有

    式(8)提供了將式(7)變?yōu)楹撕瘮?shù)形式的一種途徑,使式(8)中A=Id,U=,V=Xφ,那么有

    將式(9)代入式(7)可以得到核函數(shù)形式的置信區(qū)間半徑為

    3)計(jì)算逆矩陣。核函數(shù)形式的預(yù)測(cè)收益式(5)及其置信區(qū)間式(10)中都有(K+Im)?1這一項(xiàng),將該逆矩陣記為Vm。Vm大小為m×m,直接求逆矩陣復(fù)雜度為O(m3),當(dāng)m很大時(shí)代價(jià)很大,算法失去實(shí)際意義。為解決這個(gè)問題,本文將矩陣求逆修改為迭代計(jì)算方式。根據(jù)文獻(xiàn)[23]可知,實(shí)對(duì)稱矩陣有求逆迭代算法。實(shí)對(duì)稱矩陣Wn如式(11)所示:

    式中:Wn∈Rn×n,Wn?1∈R(n?1)×(n?1)均為實(shí)對(duì)稱矩陣;e為n?1維向量,eT是其轉(zhuǎn)置;p是常數(shù)。Wn的逆矩陣可以通過迭代計(jì)算,即

    式(12)可由塊矩陣求逆定理證明。

    K+I也是實(shí)對(duì)稱矩陣,形式為

    滿足式(11)的定義,可以得到其逆矩陣V的迭代計(jì)算方法:

    這樣就可以通過式(13)不斷迭代來計(jì)算逆矩陣,減少了該算法的計(jì)算成本。

    2.2 算法流程

    K-UCB 算法需要輸入超參數(shù) α、β的值,其中α控制探索與利用的平衡,β是核函數(shù)的參數(shù)。為需要推薦的每個(gè)用戶計(jì)算內(nèi)容池At中每個(gè)內(nèi)容預(yù)測(cè)收益的置信區(qū)間上界,選擇置信區(qū)間上界最大的內(nèi)容進(jìn)行推薦,并獲得點(diǎn)擊反饋,根據(jù)歷史收益情況,更新選擇策略。

    3 實(shí)驗(yàn)與結(jié)果

    在本節(jié)中首先介紹了各個(gè)對(duì)比算法的設(shè)置,并使用這些算法在合成數(shù)據(jù)和真實(shí)場(chǎng)景數(shù)據(jù)集(雅虎新聞數(shù)據(jù)集)上進(jìn)行實(shí)驗(yàn)。

    3.1 算法對(duì)比

    1)Random:隨機(jī)策略總是以相等的概率選擇一個(gè)內(nèi)容。這個(gè)算法不需要參數(shù),也不會(huì)隨著時(shí)間學(xué)習(xí)。在本文中隨機(jī)策略用來衡量其他算法的提升。

    2)ε-greedy[12]:該算法統(tǒng)計(jì)每個(gè)內(nèi)容的收益,以 ε概率隨機(jī)選擇候選內(nèi)容,以1?ε概率選擇收益最高的內(nèi)容。參數(shù) ε控制探索程度。

    3)UCB1[13]:該算法統(tǒng)計(jì)每個(gè)內(nèi)容的收益,并估計(jì)收益的置信區(qū)間,置信區(qū)間為c=,式中t為內(nèi)容的歷史總推薦次數(shù),t越大內(nèi)容的收益信息越明確,置信區(qū)間會(huì)越小,參數(shù) α控制探索程度。

    4)Thompson sampling[14]:該算法假設(shè)每個(gè)內(nèi)容都服從一個(gè)收益分布估計(jì),每輪從估計(jì)的分布采樣,選取采樣值最大的內(nèi)容推薦,最后根據(jù)收益情況更新內(nèi)容的收益分布。這里采用Beta 分布作為先驗(yàn)分布。

    5)LinUCB[15]:算法在UCB1 基礎(chǔ)上加入上下文,基于線性收益假設(shè)預(yù)測(cè)收益及其置信區(qū)間。參數(shù) α控制探索程度。

    3.2 合成數(shù)據(jù)集

    為了測(cè)試K-UCB 的性能,合成了3 組不同的上下文多臂賭博機(jī)數(shù)據(jù)。每組設(shè)置K=4 個(gè)臂,進(jìn)行T=15 000 輪實(shí)驗(yàn),每一輪中臂的上下文xt,k是隨機(jī)采樣產(chǎn)生的20 維單位向量。設(shè)置3 組不同收益,由以下函數(shù)產(chǎn)生:

    式中:θ是20 維單位向量;η(0,1)為噪聲項(xiàng)。圖1為L(zhǎng)inUCB 和K-UCB 算法在3 組不同收益函數(shù)r1(x)、r2(x)和r3(x)下累積遺憾隨學(xué)習(xí)輪次的變化曲線,且LinUCB 和K-UCB 算法參數(shù)都經(jīng)過調(diào)優(yōu)。如圖1(a)所示,在r1(x)線性收益條件下,K-UCB和LinUCB 算法累積遺憾隨著學(xué)習(xí)輪次增多逐漸增長(zhǎng)緩慢,但是LinUCB 收斂速度優(yōu)于K-UCB算法。在r2(x)和r3(x)非線性收益下,LinUCB 算法效果不佳,累積遺憾不會(huì)隨著學(xué)習(xí)輪次增多而降低增長(zhǎng)速度。而K-UCB 算法表現(xiàn)良好,隨著學(xué)習(xí)輪次增多,累積遺憾增長(zhǎng)放緩,該實(shí)驗(yàn)表明在非線性收益數(shù)據(jù)下K-UCB 較LinUCB 累積遺憾更低,性能更好。

    圖1 LinUCB 和K-UCB 算法在不同收益假設(shè)上的比較Fig.1 Comparison of LinUCB and K-UCB on different reward hypothesis

    3.3 Yahoo News 數(shù)據(jù)集

    真實(shí)場(chǎng)景數(shù)據(jù)采用雅虎新聞數(shù)據(jù)集R6A -Yahoo! Front Page Today Module User Click Log Dataset[24]。該數(shù)據(jù)集收集了從2009 年5 月1 日到10 日的訪問流量數(shù)據(jù)約3 600 萬條。

    如表1 所示,每一條數(shù)據(jù)記錄一個(gè)由4 個(gè)部分組成的完整的事件,分別是推薦的文章id,用戶的點(diǎn)擊反饋以及用戶和文章的6 維特征。用戶和文章的6 維特征向量都是原始特征(如用戶對(duì)應(yīng)的性別、年齡、地理和行為等特征,文章對(duì)應(yīng)的分類、主題等特征)通過降維和雙線性模型聯(lián)合分析構(gòu)建的。

    表1 雅虎新聞數(shù)據(jù)集Table 1 Yahoo! News dataset

    當(dāng)算法選擇的文章與記錄數(shù)據(jù)不同時(shí),無法觀測(cè)到所選擇文章的收益。本文采用文獻(xiàn)[25]提出的離線評(píng)估方法,這種方法被證明是無偏的估計(jì)。在這種評(píng)估方法下,給定當(dāng)前日志記錄,如果算法選擇了與日志記錄相同的內(nèi)容,則該事件被保留,即添加到歷史記錄中,同時(shí)更新總推薦次數(shù)N和總收益R。如果算法選擇了一個(gè)不同于日志記錄的內(nèi)容,那么該事件將完全被忽略,算法將繼續(xù)處理下一個(gè)事件而不改變其狀態(tài)?;谶@種拒絕采樣的評(píng)估方法,將實(shí)際點(diǎn)擊次數(shù)與推薦總次數(shù)的比值(R/N)定義為文章點(diǎn)擊率。點(diǎn)擊率是推薦算法的最常用指標(biāo),點(diǎn)擊率越高意味著累積遺憾越小。

    推薦系統(tǒng)通常在小部分流量中學(xué)習(xí),然后將學(xué)習(xí)到的知識(shí)應(yīng)用到其余的大部分流量中,所以本實(shí)驗(yàn)將數(shù)據(jù)分為學(xué)習(xí)桶和部署桶進(jìn)行,學(xué)習(xí)桶分配20%的隨機(jī)流量數(shù)據(jù),部署桶分配80%的隨機(jī)流量數(shù)據(jù)。數(shù)據(jù)更多的部署桶模擬真實(shí)的部署環(huán)境,其點(diǎn)擊率數(shù)據(jù)更為重要,但學(xué)習(xí)桶中點(diǎn)擊率高意味著學(xué)習(xí)效率更快,所以實(shí)驗(yàn)給出了兩個(gè)桶中的點(diǎn)擊率數(shù)據(jù)。

    實(shí)驗(yàn)分為3 步:①確定3 種對(duì)比算法(ε-greedy、UCB1 和LinUCB)的最佳參數(shù);②確定K-UCB 的核函數(shù)選擇和參數(shù)選擇;③將所有對(duì)比算法均在最優(yōu)條件下進(jìn)行比較。

    1)尋找ε-greedy、UCB1 和LinUCB 的最佳參數(shù)設(shè)置,圖2 為3 個(gè)算法在不同參數(shù)下的性能折線圖。

    如圖2 所示,3 個(gè)算法在學(xué)習(xí)桶和部署桶都是大致中間高兩邊低。這是因?yàn)楫?dāng)參數(shù)ε或者α過小時(shí),沒有足夠的探索,算法無法識(shí)別出好的文章,導(dǎo)致點(diǎn)擊量較少。另一方面,當(dāng)參數(shù)太大時(shí),算法會(huì)過度探索,從而浪費(fèi)了一些增加點(diǎn)擊次數(shù)的機(jī)會(huì)。從圖2 中可以看到,ε-greedy、UCB1和LinUCB 的最佳參數(shù)分別為0.2、0.1 和0.3。

    圖2 算法在不同參數(shù)下的點(diǎn)擊率提升倍數(shù)Fig.2 CTR lift of the algorithms under different parameters

    2)表2 為不同的核函數(shù)在最佳參數(shù)組合下所得到的相對(duì)點(diǎn)擊率結(jié)果。其中 α為平衡探索利用程度的參數(shù),線性核具體表示為

    k(x,x′)=xTx′

    多項(xiàng)式核具體表示為

    k(x,x)=(g·xTx+c)d

    高斯核具體表示為

    k(x,x′)=exp(?β·||x?x′||2)

    從表2 可以看出,雅虎新聞數(shù)據(jù)集在線性核函數(shù)時(shí)表現(xiàn)不佳,表明數(shù)據(jù)在原始空間是線性不可分的。在多項(xiàng)式核函數(shù)時(shí)點(diǎn)擊率較線性核有提升,較高斯核效果略差。所以K-UCB 算法選擇高斯核函數(shù)進(jìn)行雅虎新聞數(shù)據(jù)集的實(shí)驗(yàn)。

    表2 核函數(shù)選擇Table 2 Kernel function selection

    以高斯核函數(shù)為例說明具體參數(shù)選擇方法,設(shè)置30 組(α,β)參數(shù)組合進(jìn)行網(wǎng)格搜索,表3 和表4分別為在學(xué)習(xí)桶和部署桶中30 組不同參數(shù)組合下K-UCB 算法的點(diǎn)擊率提升倍數(shù)。

    表3 學(xué)習(xí)桶中網(wǎng)格搜索K-UCB 參數(shù)結(jié)果Table 3 Grid search results of K-UCB in Learning Bucket

    表4 部署桶中網(wǎng)格搜索K-UCB 參數(shù)結(jié)果Table 4 Grid search results of K-UCB in Deploying Bucket

    從表3 和表4 中可以看到,當(dāng) α過大過小時(shí)點(diǎn)擊率都不高,這與1)的原理和結(jié)果相似。β是高斯核函數(shù)控制分類能力的參數(shù),調(diào)整 β也是尋找合適高維空間的過程。當(dāng) β過小和過大時(shí),點(diǎn)擊率提升都不高,說明沒有找到合適的特征高維空間。在 β=0.1這一列點(diǎn)擊率大致較其他 β取值高,說明找到了一個(gè)合適的特征高維空間。通過網(wǎng)格化搜索,在表中找到了最佳的參數(shù)組合,即α=0.2,β=0.1,這個(gè)參數(shù)下學(xué)習(xí)桶和部署桶中點(diǎn)擊率提升都最大。

    通過2)找到了K-UCB 算法在雅虎新聞數(shù)據(jù)集上的最佳核函數(shù)和最佳參數(shù),使用這組參數(shù)與其他算法進(jìn)行比較。

    3)對(duì)比不同算法在最佳參數(shù)下的點(diǎn)擊率。如圖3 和圖4 分別為學(xué)習(xí)桶和部署桶中各個(gè)對(duì)比算法的點(diǎn)擊率隨迭代輪次的變化曲線。

    圖3 算法在學(xué)習(xí)桶中的點(diǎn)擊率Fig.3 CTRs of various algorithms in Learning Bucket

    圖4 算法在部署桶中的點(diǎn)擊率Fig.4 CTRs of various algorithms in Deploying Bucket

    從圖3 和圖4 中可以看到,Random 策略下點(diǎn)擊率最低,這個(gè)策略達(dá)到穩(wěn)定后點(diǎn)擊率基本不會(huì)變化。去除輪次較小時(shí)的隨機(jī)波動(dòng)干擾,上下文無關(guān)的多臂賭博機(jī)算法(ε-greedy、Thompson sampling 和UCB1)點(diǎn)擊率曲線明顯低于上下文多臂賭博機(jī)算法(LinUCB 和K-UCB),這說明利用上下文信息可以明顯提高點(diǎn)擊率,因此在推薦系統(tǒng)中應(yīng)該盡可能利用上下文信息提高推薦準(zhǔn)確率,從而更好地滿足用戶的個(gè)性化需求。學(xué)習(xí)桶和部署桶中K-UCB 算法的點(diǎn)擊率曲線都高于LinUCB 算法,尤其在部署桶中K-UCB 算法較LinUCB 算法點(diǎn)擊率提升了約8%,證明了本文所提出算法的有效性。

    該實(shí)驗(yàn)表明K-UCB 算法比其他基于多臂賭博機(jī)的推薦算法更適應(yīng)真實(shí)的非線性數(shù)據(jù)場(chǎng)景下的個(gè)性化推薦。

    4 結(jié)束語

    本文提出了一種LinUCB 改進(jìn)算法K-UCB,通過核方法將非線性問題轉(zhuǎn)化為線性問題。在合成數(shù)據(jù)集上驗(yàn)證了K-UCB 可以有效降低非線性環(huán)境下的累積遺憾,在雅虎新聞數(shù)據(jù)集上相比于基于線性收益的LinUCB 算法,點(diǎn)擊率最高提升了8%。將線性收益假設(shè)轉(zhuǎn)變?yōu)楦话愕氖找婕僭O(shè),可以提高上下文多臂賭博機(jī)的推薦準(zhǔn)確率。多臂賭博機(jī)適應(yīng)動(dòng)態(tài)推薦環(huán)境的特性,可以改善傳統(tǒng)推薦算法,這也是未來可以進(jìn)一步研究的方向。

    猜你喜歡
    點(diǎn)擊率置信區(qū)間線性
    漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
    定數(shù)截尾場(chǎng)合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
    p-范分布中參數(shù)的置信區(qū)間
    多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
    線性回歸方程的求解與應(yīng)用
    列車定位中置信區(qū)間的確定方法
    二階線性微分方程的解法
    基于特征工程的視頻點(diǎn)擊率預(yù)測(cè)算法
    喜報(bào)!萌寶大賽參賽者660名,投票321657人次,點(diǎn)擊率超60萬!
    海峽姐妹(2015年8期)2015-02-27 15:12:30
    徹底消失
    興趣英語(2013年8期)2013-11-13 06:54:02
    性色av一级| 国产色婷婷99| 一区福利在线观看| 欧美xxⅹ黑人| 亚洲熟女精品中文字幕| 9色porny在线观看| 水蜜桃什么品种好| 亚洲第一av免费看| 亚洲欧美日韩另类电影网站| 侵犯人妻中文字幕一二三四区| 男女午夜视频在线观看| 少妇被粗大的猛进出69影院| 亚洲精品美女久久av网站| 精品酒店卫生间| 叶爱在线成人免费视频播放| 午夜福利网站1000一区二区三区| 一区二区av电影网| 国产高清国产精品国产三级| av免费观看日本| 视频区图区小说| 日韩av免费高清视频| 午夜免费鲁丝| 中文字幕精品免费在线观看视频| 久久久久久久大尺度免费视频| 国产乱人偷精品视频| 午夜免费男女啪啪视频观看| 大话2 男鬼变身卡| 少妇人妻 视频| 国产成人精品无人区| 国产成人91sexporn| 久久久精品94久久精品| 久久精品国产综合久久久| 久久久久精品性色| 欧美 日韩 精品 国产| 韩国高清视频一区二区三区| 成年动漫av网址| a级片在线免费高清观看视频| 午夜福利,免费看| 亚洲国产日韩一区二区| 亚洲精品一区蜜桃| 免费观看a级毛片全部| 99精国产麻豆久久婷婷| 免费在线观看完整版高清| 欧美最新免费一区二区三区| av在线老鸭窝| 熟妇人妻不卡中文字幕| 天美传媒精品一区二区| 久久青草综合色| 精品久久久精品久久久| 国产精品一二三区在线看| 国产乱人偷精品视频| 宅男免费午夜| 这个男人来自地球电影免费观看 | 久久久精品国产亚洲av高清涩受| 一边亲一边摸免费视频| 国产av国产精品国产| a级毛片黄视频| 18禁观看日本| kizo精华| 日韩人妻精品一区2区三区| 国产精品国产三级专区第一集| av片东京热男人的天堂| 久久热在线av| 在线免费观看不下载黄p国产| 国产在线一区二区三区精| 国产又色又爽无遮挡免| 永久免费av网站大全| 亚洲欧洲国产日韩| 观看美女的网站| 色婷婷久久久亚洲欧美| 日本91视频免费播放| 亚洲精品美女久久久久99蜜臀 | 一二三四在线观看免费中文在| 亚洲精品一区蜜桃| 亚洲精品一二三| 亚洲在久久综合| 色网站视频免费| 如日韩欧美国产精品一区二区三区| 七月丁香在线播放| 亚洲精品av麻豆狂野| 久久久久国产精品人妻一区二区| 日韩精品免费视频一区二区三区| 在线天堂中文资源库| 老司机影院毛片| 亚洲成色77777| 人人妻人人澡人人爽人人夜夜| 在线天堂中文资源库| 久久精品国产亚洲av涩爱| 日韩精品免费视频一区二区三区| 国产日韩欧美亚洲二区| 男人舔女人的私密视频| 热re99久久精品国产66热6| 下体分泌物呈黄色| 麻豆精品久久久久久蜜桃| 9热在线视频观看99| 午夜久久久在线观看| 两性夫妻黄色片| 大话2 男鬼变身卡| 免费高清在线观看日韩| 1024香蕉在线观看| 精品视频人人做人人爽| 男人舔女人的私密视频| 亚洲婷婷狠狠爱综合网| 不卡av一区二区三区| 国产精品女同一区二区软件| 国产精品一区二区在线不卡| 精品少妇一区二区三区视频日本电影 | 中文字幕精品免费在线观看视频| 欧美国产精品一级二级三级| 久久久精品94久久精品| 啦啦啦在线免费观看视频4| 国产精品免费视频内射| av女优亚洲男人天堂| 色婷婷久久久亚洲欧美| 看非洲黑人一级黄片| 男女下面插进去视频免费观看| 亚洲中文av在线| 伊人久久国产一区二区| 日韩制服丝袜自拍偷拍| 一区二区日韩欧美中文字幕| 亚洲av欧美aⅴ国产| 视频区图区小说| 可以免费在线观看a视频的电影网站 | 国产精品二区激情视频| 人体艺术视频欧美日本| 欧美日韩一级在线毛片| 亚洲精品av麻豆狂野| av女优亚洲男人天堂| 男女午夜视频在线观看| 肉色欧美久久久久久久蜜桃| 精品一区二区三区四区五区乱码 | 中文天堂在线官网| 国产黄色免费在线视频| 国产亚洲午夜精品一区二区久久| 男人爽女人下面视频在线观看| 精品亚洲成国产av| 久久人妻熟女aⅴ| 亚洲美女视频黄频| 亚洲,一卡二卡三卡| 激情视频va一区二区三区| 久久精品aⅴ一区二区三区四区| 香蕉丝袜av| 别揉我奶头~嗯~啊~动态视频 | a 毛片基地| 97在线人人人人妻| 大香蕉久久网| 日本色播在线视频| 两个人看的免费小视频| 在线观看www视频免费| 成人午夜精彩视频在线观看| 美女大奶头黄色视频| 国产一区亚洲一区在线观看| 亚洲四区av| 精品亚洲乱码少妇综合久久| 90打野战视频偷拍视频| 国产成人91sexporn| 日日爽夜夜爽网站| 亚洲国产精品国产精品| 欧美日韩亚洲综合一区二区三区_| 中文字幕人妻熟女乱码| 亚洲婷婷狠狠爱综合网| 亚洲国产精品国产精品| 51午夜福利影视在线观看| 亚洲欧美成人综合另类久久久| 久久久久久久精品精品| 九九爱精品视频在线观看| 日韩制服丝袜自拍偷拍| 天堂中文最新版在线下载| 99热网站在线观看| 老司机深夜福利视频在线观看 | 丁香六月天网| 久久精品人人爽人人爽视色| 香蕉国产在线看| 久久久精品94久久精品| 少妇 在线观看| kizo精华| 国产精品成人在线| 国产日韩一区二区三区精品不卡| 一二三四在线观看免费中文在| 日韩精品免费视频一区二区三区| 国产福利在线免费观看视频| 亚洲国产中文字幕在线视频| 午夜精品国产一区二区电影| 久久久久久久久久久久大奶| 热re99久久国产66热| 精品一区二区三卡| bbb黄色大片| 美女国产高潮福利片在线看| 免费高清在线观看日韩| 成人漫画全彩无遮挡| 如何舔出高潮| 男的添女的下面高潮视频| 最近中文字幕高清免费大全6| 在线观看人妻少妇| 成人黄色视频免费在线看| 又黄又粗又硬又大视频| 美女中出高潮动态图| av免费观看日本| 国产免费一区二区三区四区乱码| 日日啪夜夜爽| 人妻一区二区av| 香蕉国产在线看| 高清不卡的av网站| 9热在线视频观看99| 在线观看免费午夜福利视频| 国产精品 国内视频| 日本午夜av视频| 亚洲国产精品一区三区| 亚洲精品中文字幕在线视频| 捣出白浆h1v1| 亚洲伊人久久精品综合| 丰满少妇做爰视频| 黑人巨大精品欧美一区二区蜜桃| 黄色一级大片看看| 看非洲黑人一级黄片| xxxhd国产人妻xxx| 亚洲四区av| 女人高潮潮喷娇喘18禁视频| 精品酒店卫生间| 丝袜人妻中文字幕| 一级片'在线观看视频| 亚洲精品国产av成人精品| 中文字幕人妻丝袜制服| svipshipincom国产片| 韩国高清视频一区二区三区| 一级片免费观看大全| 91精品伊人久久大香线蕉| 成人午夜精彩视频在线观看| 色吧在线观看| 嫩草影视91久久| 波野结衣二区三区在线| 一区二区av电影网| 欧美成人精品欧美一级黄| 91精品三级在线观看| 91国产中文字幕| 我要看黄色一级片免费的| 高清视频免费观看一区二区| 亚洲国产欧美在线一区| 女人高潮潮喷娇喘18禁视频| 精品国产乱码久久久久久小说| 久久久久精品性色| 国产男女超爽视频在线观看| 精品少妇久久久久久888优播| 日本欧美视频一区| 少妇人妻久久综合中文| 如何舔出高潮| 日本av免费视频播放| 久久久久网色| 叶爱在线成人免费视频播放| 国产1区2区3区精品| 精品人妻在线不人妻| 亚洲av男天堂| 久久久久久久国产电影| 波野结衣二区三区在线| 国产成人免费无遮挡视频| av视频免费观看在线观看| 成人国产麻豆网| 亚洲欧美日韩另类电影网站| 电影成人av| 欧美乱码精品一区二区三区| 大香蕉久久网| 午夜免费鲁丝| 欧美老熟妇乱子伦牲交| 2018国产大陆天天弄谢| 少妇精品久久久久久久| 亚洲欧洲国产日韩| 国产欧美日韩一区二区三区在线| 如日韩欧美国产精品一区二区三区| 亚洲欧美中文字幕日韩二区| 免费观看av网站的网址| 免费观看性生交大片5| 精品人妻在线不人妻| 操出白浆在线播放| 日本av手机在线免费观看| 婷婷色麻豆天堂久久| 国产精品 欧美亚洲| 免费日韩欧美在线观看| 国产又爽黄色视频| 国产成人精品久久二区二区91 | 午夜免费鲁丝| 老汉色∧v一级毛片| 久久精品国产亚洲av涩爱| 在线观看免费午夜福利视频| 精品少妇久久久久久888优播| 亚洲国产欧美日韩在线播放| 尾随美女入室| 国产黄频视频在线观看| 人人澡人人妻人| 老汉色∧v一级毛片| 一本一本久久a久久精品综合妖精| 欧美人与性动交α欧美精品济南到| 久久热在线av| 午夜影院在线不卡| 18禁裸乳无遮挡动漫免费视频| 三上悠亚av全集在线观看| 这个男人来自地球电影免费观看 | 久久精品亚洲av国产电影网| 亚洲精品成人av观看孕妇| 人体艺术视频欧美日本| 精品国产国语对白av| 人妻一区二区av| 丰满乱子伦码专区| avwww免费| 亚洲精品乱久久久久久| 国产精品麻豆人妻色哟哟久久| 又大又黄又爽视频免费| 999久久久国产精品视频| 大香蕉久久成人网| 天堂俺去俺来也www色官网| 在线看a的网站| 午夜福利影视在线免费观看| 免费观看人在逋| 亚洲色图综合在线观看| 欧美激情极品国产一区二区三区| 丁香六月欧美| 久久久久久久久久久免费av| 一区二区三区四区激情视频| 九草在线视频观看| 亚洲精品av麻豆狂野| 深夜精品福利| 国产日韩一区二区三区精品不卡| 国产一卡二卡三卡精品 | 丁香六月天网| 亚洲成国产人片在线观看| 中文字幕制服av| 这个男人来自地球电影免费观看 | 久久性视频一级片| 久久久精品区二区三区| 亚洲色图 男人天堂 中文字幕| 成年人午夜在线观看视频| 夫妻性生交免费视频一级片| 男男h啪啪无遮挡| 高清视频免费观看一区二区| 观看美女的网站| 亚洲,欧美精品.| 久久久久精品国产欧美久久久 | 一本久久精品| 最近中文字幕2019免费版| 啦啦啦中文免费视频观看日本| 深夜精品福利| 一区二区三区四区激情视频| 国产欧美亚洲国产| 啦啦啦在线免费观看视频4| 国产探花极品一区二区| 日本av手机在线免费观看| 欧美黑人欧美精品刺激| 啦啦啦中文免费视频观看日本| 亚洲在久久综合| 国产成人av激情在线播放| 亚洲精品一二三| 伦理电影免费视频| 国产又色又爽无遮挡免| 国产精品女同一区二区软件| 亚洲精品美女久久av网站| 丰满迷人的少妇在线观看| kizo精华| 精品第一国产精品| 91精品三级在线观看| 日本91视频免费播放| 日日撸夜夜添| 天天影视国产精品| 欧美中文综合在线视频| 久久久精品免费免费高清| 国产精品欧美亚洲77777| 如何舔出高潮| 亚洲国产欧美一区二区综合| 人人澡人人妻人| 久久国产精品男人的天堂亚洲| 国产黄频视频在线观看| 亚洲欧美清纯卡通| 99re6热这里在线精品视频| 2018国产大陆天天弄谢| 久久精品久久久久久久性| 午夜福利网站1000一区二区三区| 在线观看免费高清a一片| 国产又色又爽无遮挡免| 亚洲一级一片aⅴ在线观看| 丰满饥渴人妻一区二区三| 国产免费福利视频在线观看| 91精品伊人久久大香线蕉| 国产精品二区激情视频| 日本wwww免费看| 青春草国产在线视频| 在线天堂最新版资源| 久久热在线av| 久久婷婷青草| 啦啦啦在线观看免费高清www| 亚洲国产成人一精品久久久| 最新的欧美精品一区二区| 大片免费播放器 马上看| 亚洲,欧美,日韩| 18禁裸乳无遮挡动漫免费视频| 欧美亚洲日本最大视频资源| 51午夜福利影视在线观看| 国产成人免费无遮挡视频| 久久亚洲国产成人精品v| 国产精品亚洲av一区麻豆 | 最近最新中文字幕大全免费视频 | 水蜜桃什么品种好| 国产免费现黄频在线看| 久久人人爽av亚洲精品天堂| 少妇精品久久久久久久| 观看av在线不卡| 99久久99久久久精品蜜桃| 亚洲精品一二三| 日本猛色少妇xxxxx猛交久久| 男女午夜视频在线观看| 欧美日韩福利视频一区二区| 99热全是精品| 交换朋友夫妻互换小说| 午夜91福利影院| 国产探花极品一区二区| 国产精品 欧美亚洲| 精品亚洲成国产av| av福利片在线| 国产精品国产三级国产专区5o| 欧美xxⅹ黑人| 中文字幕高清在线视频| 男女床上黄色一级片免费看| 国产精品 欧美亚洲| 精品人妻在线不人妻| 高清av免费在线| 亚洲精品一区蜜桃| 免费在线观看黄色视频的| 国产精品 欧美亚洲| 日本欧美国产在线视频| av有码第一页| 亚洲情色 制服丝袜| 在线观看免费视频网站a站| 最新在线观看一区二区三区 | 精品午夜福利在线看| 国产欧美日韩一区二区三区在线| 国产精品偷伦视频观看了| 韩国av在线不卡| 天天躁夜夜躁狠狠久久av| 日本欧美国产在线视频| 亚洲国产精品成人久久小说| 午夜免费男女啪啪视频观看| √禁漫天堂资源中文www| 亚洲欧美色中文字幕在线| 国产一区二区在线观看av| 丝袜脚勾引网站| 侵犯人妻中文字幕一二三四区| 性高湖久久久久久久久免费观看| 国产精品 欧美亚洲| 日韩 欧美 亚洲 中文字幕| 18禁裸乳无遮挡动漫免费视频| 自线自在国产av| 日韩伦理黄色片| 婷婷色av中文字幕| 91国产中文字幕| 日韩一区二区三区影片| 成人亚洲欧美一区二区av| 久久热在线av| 18禁国产床啪视频网站| 男女边吃奶边做爰视频| 男女无遮挡免费网站观看| av片东京热男人的天堂| 国产精品久久久久久久久免| 欧美亚洲 丝袜 人妻 在线| 下体分泌物呈黄色| 亚洲七黄色美女视频| 最近手机中文字幕大全| 久久女婷五月综合色啪小说| 亚洲情色 制服丝袜| 热99久久久久精品小说推荐| 男女边吃奶边做爰视频| 天天影视国产精品| 一本色道久久久久久精品综合| av线在线观看网站| av免费观看日本| 亚洲精品中文字幕在线视频| 18在线观看网站| 97精品久久久久久久久久精品| 日本色播在线视频| 国产成人系列免费观看| 中国国产av一级| 午夜福利免费观看在线| 亚洲国产精品成人久久小说| 国产 一区精品| 亚洲国产精品国产精品| 激情五月婷婷亚洲| 久久久久久久久久久免费av| a 毛片基地| 亚洲天堂av无毛| 丁香六月天网| 中国国产av一级| 欧美最新免费一区二区三区| 欧美日韩精品网址| 精品国产乱码久久久久久小说| 亚洲欧美色中文字幕在线| 中国国产av一级| 午夜福利在线免费观看网站| 777久久人妻少妇嫩草av网站| 欧美人与性动交α欧美精品济南到| 免费黄频网站在线观看国产| 久久ye,这里只有精品| 九草在线视频观看| 五月天丁香电影| 国产精品成人在线| 涩涩av久久男人的天堂| 欧美精品av麻豆av| 久久久久久久久久久免费av| 男人爽女人下面视频在线观看| 两性夫妻黄色片| av在线app专区| 国产精品 欧美亚洲| 日韩,欧美,国产一区二区三区| 咕卡用的链子| a级毛片在线看网站| 亚洲国产成人一精品久久久| 成人三级做爰电影| 男女床上黄色一级片免费看| 夜夜骑夜夜射夜夜干| 亚洲精品视频女| 中文字幕亚洲精品专区| xxx大片免费视频| 欧美黑人欧美精品刺激| 无限看片的www在线观看| 超色免费av| 国产在线一区二区三区精| 久久这里只有精品19| 久久国产精品男人的天堂亚洲| 观看美女的网站| 黄频高清免费视频| 老汉色∧v一级毛片| 大码成人一级视频| 国产一区二区三区综合在线观看| 在现免费观看毛片| 99精品久久久久人妻精品| 青春草视频在线免费观看| 久久精品久久精品一区二区三区| 国产女主播在线喷水免费视频网站| 如何舔出高潮| 亚洲国产中文字幕在线视频| 久久久久久久久久久免费av| 少妇 在线观看| 性少妇av在线| 久久毛片免费看一区二区三区| 亚洲婷婷狠狠爱综合网| 汤姆久久久久久久影院中文字幕| av在线app专区| 9色porny在线观看| 亚洲欧美一区二区三区黑人| 久久久久久久大尺度免费视频| 亚洲精品国产一区二区精华液| 美女高潮到喷水免费观看| 国产精品99久久99久久久不卡 | 久久久精品区二区三区| 国产成人欧美在线观看 | av福利片在线| 久久精品aⅴ一区二区三区四区| 91精品伊人久久大香线蕉| 一级,二级,三级黄色视频| 久久人人97超碰香蕉20202| www.熟女人妻精品国产| 人体艺术视频欧美日本| 超碰97精品在线观看| 成人三级做爰电影| 看十八女毛片水多多多| 在线免费观看不下载黄p国产| 桃花免费在线播放| 欧美激情 高清一区二区三区| 老司机深夜福利视频在线观看 | 欧美日韩成人在线一区二区| 精品人妻一区二区三区麻豆| 国产成人av激情在线播放| 满18在线观看网站| 九九爱精品视频在线观看| 久久ye,这里只有精品| 免费观看人在逋| 国产精品久久久久久久久免| √禁漫天堂资源中文www| 黑丝袜美女国产一区| 久久久久久免费高清国产稀缺| 又粗又硬又长又爽又黄的视频| 女性生殖器流出的白浆| 国产日韩欧美视频二区| 18禁裸乳无遮挡动漫免费视频| 日韩,欧美,国产一区二区三区| 日韩 亚洲 欧美在线| 亚洲免费av在线视频| 亚洲成人国产一区在线观看 | 亚洲第一av免费看| 国产免费视频播放在线视频| 最新的欧美精品一区二区| 午夜影院在线不卡| 久久韩国三级中文字幕| 一区二区三区精品91| 美女中出高潮动态图| 99久久99久久久精品蜜桃| 香蕉国产在线看| 秋霞伦理黄片| 黄色毛片三级朝国网站| 国产黄色免费在线视频| 搡老岳熟女国产| 国产99久久九九免费精品| 久久免费观看电影| 免费黄频网站在线观看国产| 丁香六月欧美| 欧美亚洲 丝袜 人妻 在线| 巨乳人妻的诱惑在线观看| 热re99久久国产66热| 欧美精品一区二区免费开放| 欧美97在线视频| 久久精品国产综合久久久| 一区在线观看完整版| 国产成人午夜福利电影在线观看| 不卡av一区二区三区| 久久这里只有精品19| 99国产精品免费福利视频| 777久久人妻少妇嫩草av网站| 久久久久精品久久久久真实原创| 午夜福利,免费看| 下体分泌物呈黄色|