• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      Spark框架下基于對(duì)比散度的網(wǎng)絡(luò)服務(wù)TLRBM推薦算法

      2019-08-14 10:02:38
      關(guān)鍵詞:玻爾茲曼信任節(jié)點(diǎn)

      那 勇

      (吉林省遠(yuǎn)程教育技術(shù)科技創(chuàng)新中心 吉林 長(zhǎng)春 130022) (吉林廣播電視大學(xué)遠(yuǎn)程教育技術(shù)中心 吉林 長(zhǎng)春 130022)

      0 引 言

      Web服務(wù)是可通過(guò)網(wǎng)絡(luò)互通信的計(jì)算機(jī)應(yīng)用程序,由服務(wù)提供商根據(jù)用戶需求開(kāi)發(fā),隨著互聯(lián)網(wǎng)用戶需求的不斷增加,Web服務(wù)利潤(rùn)增長(zhǎng)潛力巨大。許多服務(wù)提供商傾向于結(jié)合業(yè)務(wù)和營(yíng)銷計(jì)劃進(jìn)行Web服務(wù)開(kāi)發(fā),這會(huì)導(dǎo)致多個(gè)提供商可提供功能相似的服務(wù)。同時(shí),Web服務(wù)推薦過(guò)程中,服務(wù)質(zhì)量取決于多種因素,如網(wǎng)絡(luò)傳輸帶寬、實(shí)現(xiàn)機(jī)制和硬件等[1-2]。因此,用戶希望從服務(wù)提供商獲得理想QoS的Web服務(wù),例如延遲、可用性和可靠性等。然而,目前幾乎所有的服務(wù)提供商都關(guān)注利潤(rùn),每個(gè)服務(wù)的QoS屬性都由服務(wù)提供商預(yù)先確定,但在其推廣過(guò)程中,服務(wù)提供商常常對(duì)Web服務(wù)QoS進(jìn)行夸大以吸引更多的用戶。因此,QoS合理評(píng)價(jià)是面向應(yīng)用的Web服務(wù)推薦的重要應(yīng)用之一。

      協(xié)同過(guò)濾推薦是Web服務(wù)推薦的主要方法,主要分為兩類[3]:模型協(xié)同過(guò)濾和內(nèi)存協(xié)同過(guò)濾,其中內(nèi)存協(xié)同過(guò)濾采用的是Web服務(wù)評(píng)分矩陣方式進(jìn)行項(xiàng)目的推薦和預(yù)測(cè),常用到聚類分析算法,但是在每次計(jì)算中都需要對(duì)這個(gè)評(píng)分矩陣進(jìn)行計(jì)算,算法的通用性不強(qiáng);而模型協(xié)同過(guò)濾算法則是根據(jù)Web服務(wù)評(píng)分矩陣進(jìn)行評(píng)價(jià)模型的演化,在后續(xù)的Web服務(wù)推薦過(guò)程中采用的就是模型預(yù)測(cè)方式取代原有評(píng)分矩陣方式,有助于提高算法計(jì)算普適性和精度。評(píng)分矩陣的模型構(gòu)建方式很多,例如貝葉斯方法、馬爾可夫方法、受限玻爾茲曼機(jī)RBM(Restricted Boltzmann Machine)方法等[4]。相對(duì)而言,近年來(lái)RBM方法得到了學(xué)者們更多的研究,其采用無(wú)向圖方式進(jìn)行模型構(gòu)建,因此可得到魯棒性更強(qiáng)的評(píng)價(jià)模型,其采用可見(jiàn)層和隱藏層兩層模型形式。已有很多文獻(xiàn)研究了RBM方法應(yīng)用于推薦系統(tǒng)的實(shí)現(xiàn)方式,例如文獻(xiàn)[5]提出一種基于RBM方法的推薦問(wèn)題求解策略,利用隱藏層權(quán)重共享實(shí)現(xiàn)算法性能的提升。文獻(xiàn)[6]同樣基于RBM方法設(shè)計(jì)了一種推薦問(wèn)題求解策略,其將實(shí)值推薦問(wèn)題表示為多維0-1向量表示問(wèn)題,對(duì)RBM方法進(jìn)行了模型擴(kuò)維,雖然提高了推薦算法的精度,但降低了算法的執(zhí)行效率。通過(guò)分析已有文獻(xiàn),雖然都針對(duì)某些方面進(jìn)行了改進(jìn)和實(shí)現(xiàn)提高了算法的性能,但是在互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代,傳統(tǒng)的Web推薦方法在實(shí)現(xiàn)過(guò)程中存在兩個(gè)方面的問(wèn)題:(1) 算法的自學(xué)習(xí)更新問(wèn)題?,F(xiàn)有算法模型多是固定式模型,其對(duì)于特定的Web服務(wù)推薦形式有效,但是通用效果不佳,實(shí)際應(yīng)用效果不理想。Web服務(wù)推薦某些應(yīng)該根據(jù)時(shí)間和需求等因素的變化具備自學(xué)習(xí)的能力,這樣才能提高算法的適應(yīng)性和應(yīng)用價(jià)值。(2) 具有學(xué)習(xí)能力的算法,比如神經(jīng)網(wǎng)絡(luò)算法等,雖然具備一定的學(xué)習(xí)性能,但是算法的計(jì)算過(guò)程非常復(fù)雜,算法的時(shí)效性無(wú)法得到有效滿足。對(duì)大數(shù)據(jù)的處理,如何采用并行計(jì)算方式進(jìn)行模型效率提升問(wèn)題,提高算法的執(zhí)行效率,是提升算法應(yīng)用價(jià)值的另一個(gè)重要因素。這兩個(gè)問(wèn)題是制約RBM方法在Web服務(wù)推薦過(guò)程中的應(yīng)用成功與否的關(guān)鍵。

      為了克服上述缺點(diǎn),本文提出一種基于Spark框架下的基于兩層受限玻爾茲曼機(jī)的Web服務(wù)質(zhì)量預(yù)測(cè)模型,并基于用戶之間的直接信任關(guān)系,提出了一種基于受限玻爾茲曼機(jī)的Web服務(wù)質(zhì)量預(yù)測(cè)模型。同時(shí)為提高算法處理Web服務(wù)大數(shù)據(jù)的并行化執(zhí)行能力,采用了對(duì)比散度算法來(lái)提高收斂速度,并考慮了大數(shù)據(jù)情形采用Spark框架實(shí)現(xiàn)TLRBM模型的快速執(zhí)行算法,大幅度提升了Web服務(wù)推薦算法的計(jì)算速度。

      1 理論介紹

      1.1 受限玻爾茲曼機(jī)

      受限玻爾茲曼機(jī)模型結(jié)構(gòu)的無(wú)向二部圖如圖1所示,具有m個(gè)可見(jiàn)單元V=(v1,v2,…,vm),以及n個(gè)隱藏單元H=(h1,h2,…,hn)。其中:V表示可觀測(cè)數(shù)據(jù),H是觀測(cè)變量之間的相關(guān)性。與傳統(tǒng)玻爾茲曼機(jī)相比,RBM模型結(jié)構(gòu)中同層節(jié)點(diǎn)之間沒(méi)有關(guān)聯(lián)性,其可見(jiàn)層和隱藏層的聯(lián)合構(gòu)型(V,H)具有能量函數(shù):

      式中:vi和hj分別是可見(jiàn)單位i和隱單元j的二進(jìn)制狀態(tài);bi表示第i個(gè)可見(jiàn)節(jié)點(diǎn)的偏差,cj表示第j個(gè)可見(jiàn)節(jié)點(diǎn)的偏差;wij是單元vi和hj之間的邊緣相關(guān)聯(lián)的實(shí)值權(quán)重。

      (a) 玻爾茲曼機(jī)

      (b) 受限制玻爾茲曼機(jī)圖1 受限制玻爾茲曼機(jī)與傳統(tǒng)玻爾茲曼機(jī)對(duì)比

      該模型下的聯(lián)合概率分布是通過(guò)Gibbs分布p(v,h)=1/Ze-E(v,h)求出所有可能的可見(jiàn)和隱藏向量對(duì),其中Z=∑v,he-E(v,h)。因?yàn)殡[藏單元之間沒(méi)有直接聯(lián)系,所以可簡(jiǎn)單的獲得無(wú)偏樣本數(shù)據(jù)〈vihj〉data的條件概率如下:

      類似地,可見(jiàn)單元之間沒(méi)有直接聯(lián)系,可獲得無(wú)偏樣本〈vihj〉model的條件概率如下:

      式中:sig(x)=1/(1+e-x)是Logistic函數(shù)。為了處理數(shù)據(jù),可通過(guò)調(diào)整權(quán)重和偏差來(lái)提高節(jié)點(diǎn)的概率,以降低該節(jié)點(diǎn)的能量并提高其他節(jié)點(diǎn)的能量,特別是在低能量情況下。因此,它對(duì)分割函數(shù)有很大的貢獻(xiàn)。具有權(quán)重的訓(xùn)練向量的對(duì)數(shù)概率的導(dǎo)數(shù)為:

      (4)

      式中:〈…〉是Gibbs分布的期望。

      式(3)可以反復(fù)計(jì)算直到樣本向量均位于可見(jiàn)層上,隱藏層是條件獨(dú)立的,并且來(lái)自〈…〉的無(wú)偏樣本,使用對(duì)比散度(CD)學(xué)習(xí)會(huì)使結(jié)果快速收斂。

      1.2 用戶信任度計(jì)算

      Web服務(wù)推薦過(guò)程中需要使用到用戶的評(píng)價(jià)問(wèn)題,一般采用信任網(wǎng)絡(luò)模型進(jìn)行表示,該網(wǎng)絡(luò)模型采用有向圖G=(U,E)表示,其中模型參數(shù)U表示信任網(wǎng)絡(luò)模型節(jié)點(diǎn)集,Web服務(wù)在網(wǎng)絡(luò)中以節(jié)點(diǎn)形式進(jìn)行表示;E表示信任網(wǎng)絡(luò)模型的邊集,信任值在網(wǎng)絡(luò)中以節(jié)點(diǎn)之間的邊值wi形式進(jìn)行表達(dá),具體如圖2所示(以6個(gè)Web服務(wù)信任網(wǎng)絡(luò)模型為例)。

      圖2 信任網(wǎng)絡(luò)模型(6個(gè)Web服務(wù))

      圖2所示信任網(wǎng)絡(luò)模型中節(jié)點(diǎn)之間的信任值一般采用[0,1]區(qū)間內(nèi)的實(shí)數(shù)進(jìn)行表示,其可表征節(jié)點(diǎn)之間的信任關(guān)系。其中0表示節(jié)點(diǎn)之間不存在信任關(guān)系,1表示節(jié)點(diǎn)之間具有完全信任關(guān)系。實(shí)際的Web服務(wù)推薦過(guò)程中,節(jié)點(diǎn)表示的Web服務(wù)是真實(shí)存在的,但Web服務(wù)之間的關(guān)系屬性值卻不容易獲得。

      對(duì)此這里選取Pearson系數(shù)作為信任網(wǎng)絡(luò)模型的Web服務(wù)之間的信任值,該值可對(duì)Web服務(wù)之間的關(guān)系屬性值進(jìn)行直接表達(dá):

      (5)

      2 基于并行計(jì)算的Web服務(wù)推薦

      2.1 基于兩層受限玻爾茲曼機(jī)的Web服務(wù)質(zhì)量預(yù)測(cè)模型

      基于兩層受限玻爾茲曼機(jī)的Web服務(wù)質(zhì)量預(yù)測(cè)模型TLRBM被解釋為具有對(duì)稱連接的隨機(jī)神經(jīng)網(wǎng)絡(luò),其中圖形模型中的節(jié)點(diǎn)由兩層二進(jìn)制變量組成。其中,隱藏層(h)表示對(duì)于不同服務(wù)用戶具有不同QoS值的隨機(jī)二進(jìn)制特征,可見(jiàn)層(V)表示服務(wù)用戶、Web服務(wù)項(xiàng)和QoS值,但存在問(wèn)題是如何有效地處理缺失的QoS值。可見(jiàn)層通過(guò)對(duì)稱加權(quán)連接與隱藏層連接。用Gibbs分布給出在可見(jiàn)層和隱層上的聯(lián)合概率分布。

      令V表示m個(gè)可見(jiàn)單元v1,v2,…,vm的向量,其由m服務(wù)用戶和n個(gè)Web服務(wù)項(xiàng)目組成,稱為用戶項(xiàng)目矩陣。該矩陣ri,k中的每個(gè)條目表示服務(wù)用戶i在Web服務(wù)項(xiàng)k上觀察到的QoS值的向量(例如:響應(yīng)時(shí)間、故障率等)。令F表示h個(gè)隱藏單元h=(h1,h2,…,hn)的數(shù)量,它可代表隨機(jī)二進(jìn)制特征,這些特征對(duì)于不同的用戶具有不同的值。

      每個(gè)服務(wù)用戶被認(rèn)為是TLRBM的一個(gè)單獨(dú)的訓(xùn)練案例,它有一個(gè)對(duì)稱地連接到一組二進(jìn)制隱藏層的softmax可視層。然后,每個(gè)隱藏單元可以學(xué)習(xí)建模不同值之間的顯著依賴關(guān)系。每個(gè)TLRBM都有一個(gè)單獨(dú)的訓(xùn)練案例,但是所有相應(yīng)的權(quán)重和偏差都被綁定在一起,因此如果兩個(gè)用戶具有相同的值,那么它們的兩個(gè)TLRBM必須在該Web服務(wù)項(xiàng)和隱藏層的softmax可視層之間使用相同的權(quán)重。

      根據(jù)圖3所示模型,對(duì)每個(gè)觀察可見(jiàn)層的列使用條件多項(xiàng)式分布softmax,對(duì)隱藏層用戶特征h使用條件多項(xiàng)式分布。因此,可將式(2)和式(3)推廣如下:

      (7)

      由于在一個(gè)層的變量之間具有獨(dú)立性,因此可簡(jiǎn)單使用Gibbs采樣進(jìn)行數(shù)據(jù)采集,其具有并行采樣特性。因此,Gibbs采樣可利用以下兩個(gè)步驟完成:基于p(h|v)對(duì)隱藏層的新?tīng)顟B(tài)h進(jìn)行采樣,以及基于p(v|h)對(duì)可見(jiàn)層的狀態(tài)v進(jìn)行采樣。邊際分布可以通過(guò)求和可見(jiàn)向量V的所有可能值進(jìn)行計(jì)算:

      j=1,2,…,F

      (9)

      圖3 基于兩層受限玻爾茲曼機(jī)的Web服務(wù)質(zhì)量 預(yù)測(cè)模型(TLRBM)

      2.2 模型學(xué)習(xí)過(guò)程

      首先,提出在無(wú)條件TLRBM模型中的學(xué)習(xí)方法。盡管與圖1中的模型相比,TLRBM模型中的可見(jiàn)單元的激活功能已經(jīng)改變,但是其對(duì)于式(4)的學(xué)習(xí)過(guò)程是一致的。唯一區(qū)別是Gibbs采樣僅用于在非丟失的QoS值上重構(gòu)分布。因此,可依據(jù)式(4)獲得如下形式參數(shù)更新:

      其次,學(xué)習(xí)條件TLRBM模型與基本模型相似。但是在條件TLRBM模型中,有一個(gè)額外的學(xué)習(xí)參數(shù)D:

      ΔDij=ε(〈hj〉data-〈hj〉T)ri

      (12)

      參數(shù)Δci的更新公式為:

      Δci=ε(〈vi〉data-〈vi〉recon)vi

      (13)

      再次,為了進(jìn)行推薦,通過(guò)在softmax單元上使用推理過(guò)程來(lái)預(yù)測(cè)缺失QoS值,然后對(duì)所有缺失QoS值執(zhí)行單個(gè)Gibbs采樣步驟。給定可見(jiàn)向量V的值,可預(yù)測(cè)查詢服務(wù)q的QoS值,其相對(duì)于隱藏層的數(shù)量具有時(shí)間線性關(guān)系:

      2.3 TLRBM服務(wù)推薦模型

      如上所述,CD學(xué)習(xí)算法使用了運(yùn)行吉布斯的樣本分布,迭代(T步驟)直到收斂為止。使用稱為動(dòng)量法的啟發(fā)式方法,其思想是在計(jì)算迭代t上的更新時(shí)考慮在迭代t-1處計(jì)算的更新,并且采取以下形式:

      式中:a∈[0,1]。Web服務(wù)推薦的TLRBM模型算法學(xué)習(xí)過(guò)程見(jiàn)算法1所示。

      算法1Web服務(wù)推薦的TLRBM模型學(xué)習(xí)過(guò)程

      2. 令n=0,在時(shí)間n上計(jì)算預(yù)測(cè)誤差En;

      3. Repeat

      4. for allS集內(nèi)樣本 do

      5. for all當(dāng)前樣本中的udo

      6. 基于可見(jiàn)層計(jì)算隱藏概率貢獻(xiàn)累積:

      8. 計(jì)算隱藏狀態(tài)的概率:

      pj=p(hj=1|V,r)(參見(jiàn)式(14));

      9. 吉布斯抽樣:令T=0;

      Repeat

      在開(kāi)始另一次迭代之前計(jì)算誤差;

      Until(++stepT

      10. endfor

      11. 對(duì)比貢獻(xiàn)積累差異:

      12. 更新權(quán)重及參數(shù):

      利用式(12)更新ΔDij;

      利用式(13)更新Δci;

      13. endfor

      14.n++;在時(shí)間n上計(jì)算預(yù)測(cè)誤差En;

      15. Until(En-1-En)>ε;

      2.4 基于Spark并行化實(shí)現(xiàn)

      隨著現(xiàn)代互聯(lián)網(wǎng)科技的快速發(fā)展,Web服務(wù)數(shù)量呈現(xiàn)出大幅度增長(zhǎng)趨勢(shì),以面向Web的運(yùn)行nginx系統(tǒng)的計(jì)算機(jī)數(shù)量為例,據(jù)相關(guān)統(tǒng)計(jì),2010年大約有不到5萬(wàn)臺(tái)數(shù)量,2014年的數(shù)據(jù)大約在40萬(wàn)臺(tái)左右,而到了2017年,數(shù)量則大幅度增加到140萬(wàn)臺(tái)左右,增長(zhǎng)速度呈現(xiàn)出加速增長(zhǎng)態(tài)勢(shì)。但是,目前采用單線程處理方式進(jìn)行Web服務(wù)推薦已經(jīng)無(wú)法與現(xiàn)代Web服務(wù)推薦應(yīng)用實(shí)際相適應(yīng),算法的執(zhí)行效率受到很大的制約。Spark并行化模型是一種采用內(nèi)存計(jì)算方式的系統(tǒng),其具有開(kāi)源屬性便于開(kāi)發(fā)利用,目的是實(shí)現(xiàn)大型數(shù)據(jù)并行化處理。Spark采用的是一種具有分布式結(jié)構(gòu)的彈性數(shù)據(jù)結(jié)構(gòu),可將中間計(jì)算數(shù)據(jù)在內(nèi)存中以緩存形式進(jìn)行存儲(chǔ),從而省去了中間硬盤(pán)讀取環(huán)節(jié),便于計(jì)算速度的提升。

      圖4 基于Spark并行化實(shí)現(xiàn)

      3 實(shí)驗(yàn)分析

      3.1 實(shí)驗(yàn)設(shè)置

      為驗(yàn)證所提算法的性能,選取Epinions數(shù)據(jù)集作為實(shí)驗(yàn)對(duì)象,該數(shù)據(jù)集由Massa等通過(guò)爬取技術(shù)在Epinions網(wǎng)站上獲得的Web服務(wù)數(shù)據(jù),共含有401 593個(gè)Web服務(wù)在139 528個(gè)項(xiàng)目上的測(cè)評(píng)結(jié)果,參見(jiàn)文獻(xiàn)[13]。設(shè)置數(shù)據(jù)集中前80%的Web服務(wù)數(shù)據(jù)構(gòu)建算法模型的訓(xùn)練集,剩余的20%Web服務(wù)數(shù)據(jù)構(gòu)建算法模型的測(cè)試集。對(duì)Epinions中的Web服務(wù)數(shù)據(jù)進(jìn)行優(yōu)化處理,對(duì)于不存在關(guān)聯(lián)屬性的Web服務(wù)數(shù)據(jù)進(jìn)行刪除,可得到具有31 932個(gè)Web服務(wù)在78 893個(gè)項(xiàng)目上的測(cè)評(píng)結(jié)果。

      實(shí)驗(yàn)過(guò)程中,設(shè)定RBM模型中隱藏單元的節(jié)點(diǎn)數(shù)量為160,模型訓(xùn)練過(guò)程的迭代次數(shù)上限是Epochs=100或者收斂精度設(shè)置為ζ=1e-5。實(shí)驗(yàn)硬件配置:CPU為i5-6400k 3.0 GHz,內(nèi)存是金士頓ddr3-1600K,系統(tǒng)為Windows 10旗艦版,仿真平臺(tái)選取MATLAB 2013a。

      當(dāng)前Web服務(wù)推薦系統(tǒng)中大多使用推薦精度作為算法推薦效果的評(píng)價(jià)指標(biāo),其定義為模型評(píng)價(jià)結(jié)果與用戶真實(shí)評(píng)價(jià)結(jié)果之間的誤差均值絕對(duì)值指標(biāo)(MAE指標(biāo)),或是根均方誤差指標(biāo)(RMSE指標(biāo))。其中,MAE指標(biāo)主要評(píng)價(jià)計(jì)算推薦結(jié)果與用戶真實(shí)評(píng)價(jià)結(jié)果的誤差均值:

      (16)

      另一評(píng)價(jià)指標(biāo)RMSE指標(biāo)的具體定義如下:

      3.2 結(jié)果分析

      選取集群節(jié)點(diǎn)的數(shù)量作為評(píng)估參數(shù),考察集群節(jié)點(diǎn)數(shù)量變化對(duì)于算法計(jì)算性能的影響。集群節(jié)點(diǎn)的數(shù)量的變化區(qū)間是[1,10],評(píng)價(jià)指標(biāo)選取算法計(jì)算時(shí)間和加速比兩項(xiàng)指標(biāo),實(shí)驗(yàn)結(jié)果如圖5所示。

      圖5 集群節(jié)點(diǎn)數(shù)實(shí)驗(yàn)影響

      根據(jù)圖5所示實(shí)驗(yàn)結(jié)果,橫坐標(biāo)為實(shí)驗(yàn)選取的計(jì)算集群節(jié)點(diǎn)數(shù)量,縱坐標(biāo)是算法運(yùn)行時(shí)間或計(jì)算加速比。根據(jù)實(shí)驗(yàn)結(jié)果可知,隨計(jì)算節(jié)點(diǎn)數(shù)量的增加,算法的計(jì)算時(shí)間呈現(xiàn)出單調(diào)下降趨勢(shì),而計(jì)算加速比則呈現(xiàn)出單調(diào)加速趨勢(shì)。同時(shí)也可看出,隨著集群節(jié)點(diǎn)數(shù)量的增加,算法的計(jì)算時(shí)間降低幅度和加速比增加幅度逐漸趨緩,主要原因是隨著節(jié)點(diǎn)的增加,節(jié)點(diǎn)之間的通信開(kāi)銷逐漸增加,導(dǎo)致算法的計(jì)算性能增加幅度受到制約,因此對(duì)于本文選取的實(shí)驗(yàn)對(duì)象選取計(jì)算節(jié)點(diǎn)為4是最為合適的設(shè)置方式。

      下面,對(duì)算法的推薦精度和計(jì)算效率性能進(jìn)行對(duì)比實(shí)驗(yàn),對(duì)比算法選取:文獻(xiàn)[14]、文獻(xiàn)[15]以及未采用Spark并行化實(shí)現(xiàn)的受限玻爾茲曼機(jī)算法(RBM)。表1給出選取不同收斂精度情況下算法的計(jì)算效率對(duì)比情況。

      表1 計(jì)算效率對(duì)比 ×10 s

      根據(jù)圖5實(shí)驗(yàn)結(jié)果,本文算法選取集群節(jié)點(diǎn)數(shù)為4,另外,這里選取的收斂精度指標(biāo)并不是式(16)-式(17)所定義的MAE和RMSE指標(biāo),而是式(9)所定義的能量函數(shù)指標(biāo)。

      根據(jù)表1結(jié)果可知,隨著收斂精度設(shè)定參數(shù)的增加,集中算法的計(jì)算時(shí)間均呈現(xiàn)出增加趨勢(shì),因?yàn)槭諗烤仍礁咚惴ㄊ諗窟^(guò)程所需的迭代步數(shù)越多,因此計(jì)算時(shí)間越大。同時(shí),在幾種算法對(duì)比中,本文算法的計(jì)算時(shí)間最少,這是因?yàn)椴捎昧瞬⑿杏?jì)算方式,實(shí)現(xiàn)了多個(gè)計(jì)算節(jié)點(diǎn)的并行執(zhí)行,因此本文算法更加適用于互聯(lián)網(wǎng)大量服務(wù)推薦過(guò)程,并且對(duì)于不同的數(shù)據(jù)流,可通過(guò)擴(kuò)展集群節(jié)點(diǎn)方式進(jìn)行計(jì)算性能改善,具有更高的可擴(kuò)展性和更高的實(shí)際應(yīng)用價(jià)值。

      設(shè)置迭代次數(shù)上限是Epochs=100,文獻(xiàn)[14]、文獻(xiàn)[15]、RBM算法以及本文并行算法的MAE和RMSE指標(biāo)的實(shí)驗(yàn)結(jié)果如圖6和圖7所示。

      圖6 MAE指標(biāo)對(duì)比結(jié)果

      圖7 RMSE指標(biāo)對(duì)比結(jié)果

      根據(jù)圖6-圖7實(shí)驗(yàn)結(jié)果可知,隨著迭代次數(shù)增加,幾種算法的MAE指標(biāo)和RMSE指標(biāo)均呈現(xiàn)出逐漸收斂趨勢(shì)。從收斂精度和速度上看,本文算法的Web服務(wù)推薦性能要顯著優(yōu)于文獻(xiàn)[14]、文獻(xiàn)[15]以及RBM算法的推薦性能。另外,文獻(xiàn)[15]優(yōu)于文獻(xiàn)[14]和RBM算法的推薦性能。其中RBM算法的推薦性能最差,收斂速度非常緩慢,這也從側(cè)面印證了本文采用的Spark并行化實(shí)現(xiàn)方式的有效性。

      4 結(jié) 語(yǔ)

      本文提出一種Spark框架實(shí)現(xiàn)的基于兩層受限玻爾茲曼機(jī)Web服務(wù)受限玻爾茲曼機(jī)推薦模型,主要貢獻(xiàn)如下:(1) 引入一種新的模型,通過(guò)有效的學(xué)習(xí)和推理過(guò)程從服務(wù)提供者和客戶端可實(shí)現(xiàn)Web服務(wù)QoS的實(shí)時(shí)監(jiān)控。(2) 為了有效地處理大數(shù)據(jù)集,采用了CD學(xué)習(xí)來(lái)提高收斂時(shí)間,特別是提出采用Spark并行化實(shí)現(xiàn)算法的有效拓展。下一步研究方向,主要是基于所提TLRBM模型,完成不同業(yè)務(wù)用戶QoS值信息采集以及主動(dòng)用戶QoS預(yù)測(cè)系統(tǒng)的構(gòu)建。

      猜你喜歡
      玻爾茲曼信任節(jié)點(diǎn)
      基于格子玻爾茲曼方法的流固耦合問(wèn)題模擬
      CM節(jié)點(diǎn)控制在船舶上的應(yīng)用
      Analysis of the characteristics of electronic equipment usage distance for common users
      非對(duì)稱彎道粒子慣性遷移行為的格子玻爾茲曼模擬
      基于AutoCAD的門(mén)窗節(jié)點(diǎn)圖快速構(gòu)建
      表示信任
      嚶嚶嚶,人與人的信任在哪里……
      桃之夭夭B(2017年2期)2017-02-24 17:32:43
      從生到死有多遠(yuǎn)
      抓住人才培養(yǎng)的關(guān)鍵節(jié)點(diǎn)
      淺談玻爾茲曼分布的微小偏離量所引起的微觀狀態(tài)數(shù)的變化
      北辰区| 卫辉市| 开江县| 永昌县| 兴和县| 陆丰市| 靖远县| 阿图什市| 阿拉善盟| 上犹县| 云林县| 安泽县| 班玛县| 芮城县| 浑源县| 辉南县| 土默特右旗| 社旗县| 上饶市| 林甸县| 丰城市| 牙克石市| 扎赉特旗| 临沭县| 达孜县| 枣阳市| 宿州市| 平果县| 怀宁县| 延吉市| 江口县| 巴林右旗| 巴青县| 霍山县| 东丽区| 新昌县| 汽车| 库伦旗| 东城区| 鄂州市| 田东县|