• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    三支決策視角下的云平臺負載預(yù)測研究

    2020-07-13 04:33:46姜春茂李志聰
    小型微型計算機系統(tǒng) 2020年7期
    關(guān)鍵詞:代價決策誤差

    楊 陽,姜春茂,李志聰

    (哈爾濱師范大學(xué) 計算機科與信息工程學(xué)院,哈爾濱 150025)

    1 引 言

    在云計算技術(shù)迅速發(fā)展的大背景下,云平臺已然成為各大企業(yè)和運營服務(wù)提供商的戰(zhàn)略性平臺,它提供了一個高度可擴展和按需處理的服務(wù).然而,由于大量的用戶動態(tài)的訪問云環(huán)境,云服務(wù)提供商需要及時分配資源,這使得靜態(tài)的分配物理資源存在諸多問題.根據(jù)負載需求進行云資源分配時,存在按照過多分配會導(dǎo)致資源利用率降低,過少分配會導(dǎo)致違反SLA協(xié)議的現(xiàn)象[1].因此,云計算中的負載預(yù)測是資源管理優(yōu)化的重要組成部分,能預(yù)測到未來一段時間的資源使用情況,可以有效地管理資源,實現(xiàn)資源利用最大化.預(yù)測技術(shù)由來已久,隨著云計算的快速發(fā)展,如何進行虛擬資源的有效管理成為一個關(guān)鍵問題,將預(yù)測技術(shù)融入到云資源管理中勢在必行,引起了眾多專家學(xué)者對此進行研究,也涌現(xiàn)出諸多研究成果.Calheiros Rn等人提出一個基于自回歸移動平均模型(ARIMA)的云負載預(yù)測模型[2],該模型是廣泛使用的一種時間序列預(yù)測模型,但它不能有效地捕獲時間序列數(shù)據(jù)中的非線性模式.Gupta S利用深層雙向BLSTM神經(jīng)網(wǎng)絡(luò)對云資源使用情況進行預(yù)測,它能夠?qū)W習(xí)長期依賴,記住長時間段的信息,被明確用來解決長期負載預(yù)測問題[3].Sheng D提出一種基于貝葉斯模型的預(yù)測方法來預(yù)測長期時間區(qū)間內(nèi)以及未來連續(xù)時間區(qū)間內(nèi)的平均負載,但它僅僅能預(yù)測平均負載,而無法捕獲負載波動[4].Duy等人使用反饋人工神經(jīng)網(wǎng)絡(luò)預(yù)測節(jié)點負載,其基于自回歸模型的ANN模型具有較強的非線性泛化特性,可捕獲到輸入值與輸出值間潛在的關(guān)聯(lián)關(guān)系,但卻不能很好地預(yù)測節(jié)點的固定時間間隔的長期負載[5].Yang等人基于進化算法(EA-GMDH)與相空間重構(gòu)模型(PSR),提出了一種新的預(yù)測模型,它與ANN模型一樣,不能很好地利用長期的歷史數(shù)據(jù),從而限制了其進行多步預(yù)測的能力[6].基于此,本文提出了基于三支決策的云資源負載預(yù)測模型,來有效地解決傳統(tǒng)預(yù)測模型無法兼顧平緩期和抖動期的負載預(yù)測問題.

    三支決策理論[7]是加拿大學(xué)者姚一豫教授為了對決策粗糙集中三個域提供一種合理的語義解釋,提出的一種符合人類認知的信息處理模式和有效的復(fù)雜問題求解策略.根據(jù)粗糙集中一對閾值α和β將整個論域劃分到三個不同區(qū)域:正域、負域和邊界域,三支決策給出了一種語言規(guī)則解釋,將這三個域分別表示接受、拒絕和延遲決策(不承諾).它的基本思想是以“三”作為思考,是一種蘊含一分為三,三分而治的認知模型.云計算系統(tǒng)的組成要素中存在著眾多的三支要素,如按照作業(yè)的時間可以分為長、中、短;針對虛擬機則涉及到合并、遷移、關(guān)閉的三種操作;針對主機則涉及到激活、休眠、關(guān)機三種狀態(tài).借鑒三支決策基本思想,本文將三支決策引入云資源負載需求預(yù)測研究中,提出基于三支決策的云資源負載預(yù)測模型.

    大量實際的云平臺歷史運行數(shù)據(jù)顯示,云數(shù)據(jù)中心的負載呈現(xiàn)準周期效應(yīng).根據(jù)分析負載特征變化,本文借鑒三支決策的基本思想,通過引入中間域延遲決策的方法,使得整個論域劃分成三個兩兩不相交部分.使得具有充分把握接受或者拒絕的對象集合直接判定為正域或負域,分別記為負載平緩期和負載抖動期,而信息相對不確定的對象集合則作為延遲決策區(qū)域等待進一步區(qū)分,記為負載波動期.而三個階段的劃分則根據(jù)相鄰點均方根誤差的計算.本文實驗采用真實的云平臺歷史數(shù)據(jù)Google cluster trace,實驗結(jié)果顯示,相比于ARIMA,NN算法,DMASVR-3WD模型有著更小的違約率(SLA)和更高的準確率.

    本文組織及結(jié)構(gòu)如下:第二節(jié)綜述了三支決策模型以及在兩種時期下的預(yù)測模型.第三節(jié)提出基于三支決策的云資源負載預(yù)測模型(DMASVR-3WD)和基于代價評估的閾值確定方法.第四節(jié)給出實驗分析結(jié)果.最后得出相關(guān)研究結(jié)論.

    2 相關(guān)工作

    2.1 三支決策模型

    三支決策是一種符合人類認知的三分而治模型,通過一對閾值(α,β)可以將一個全集U劃分為3個獨立的區(qū)域.傳統(tǒng)的二支決策往往只考慮接受和拒絕兩種選項,但是在實際情況中,由于信息的不確定性或者不完整性,常常無法直接作出判斷.此時,人類往往會自發(fā)的運用一種三支策略,將僅包含接受和拒絕二支決策理論拓展為,包含接受、拒絕和不承諾的三支決策理論.通過將整體區(qū)域一分為三,然后根據(jù)不同部將復(fù)雜問題分的特點有針對性的施加不同的策略,即將復(fù)雜問題利用分治策略轉(zhuǎn)化為簡單問題,在此基礎(chǔ)上,姚一豫教授提出三支決策理論的基本框架,如圖1所示.

    三分而治是一種符合人類認知的問題處理策略,是一種有效的決策和信息處理模式,其廣泛應(yīng)用吸引了大批專家學(xué)者對此展開研究,產(chǎn)生了眾多的研究成果,并成功應(yīng)用于多個學(xué)科領(lǐng)域.胡寶清教授在總結(jié)幾類具有代表性的三支決策模型的基礎(chǔ)上,提出三支決策空間問題[8];姚景濤教授提出了三支博弈論[9,10];祁建軍、魏玲等人提出三支概念分析理論[11-13];劉盾、梁德翠等人提出了三支決策的時空性以及三支決策的直覺模糊集理論[14,15];于洪教授提出了三支聚類[16,17];姜春茂教授提出了一種基于移動的三支決策模型有效度量方法[18,19].目前,三支決策理論也應(yīng)用到云計算系統(tǒng)研究中.Jiang等人采用三支聚類算法,解決了負載敏感的云任務(wù)調(diào)度問題[20].云計算系統(tǒng)中存在眾多的三支要素,在云資源預(yù)測中,也常常出現(xiàn)這種三支的情況,為實現(xiàn)精準有效的預(yù)測,對負載特征進行分析,可以將其分為負載平緩期、負載抖動期和負載波動期.從三支決策的角度來思考,即接受、拒絕和延遲決策.用戶資源需求在某些階段不能直接確定其屬于負載抖動期或是負載平緩期,這時將資源需求情況強行二劃分,在往下的預(yù)測過程中,可能會造成更大的違約代價.此時本文將這些不確定對象放入邊界域,通過進一步的信息處理再進行決策更顯得合理.

    圖1 三支決策模型

    本文基于三支決策的思想,來進行云資源負載預(yù)測的三支劃分:正域(POS)、邊界域(BND)和負域(NEG),分別表示云資源需求確定屬于負載平緩期的,不確定是否屬于負載平緩期(或負載抖動期),確定不屬于負載平緩期的(即確定是負載抖動期).

    2.2 負載平緩期預(yù)測模型

    二次移動平均模型(Double Moving Average,DMA)[21]是一種常見并且有效地時間序列分析方法.對于訓(xùn)練樣本集合:{(xi,yi)},i=1,2,…,n.其中xi表示輸入數(shù)據(jù),yi表示輸出數(shù)據(jù).假設(shè)xt,xt-1,…,xt-(w-1)為某時刻t的長度為w的資源需求歷史數(shù)據(jù)序列,如圖2所示.

    圖2 滑動窗模型

    即從時刻t-(w-1)到t的滑動窗包含的數(shù)據(jù)為[xt-(w-1),xt-(w-2),…,xt],因此定義t時刻對資源需求值的一次移動平均值為:

    (1)

    (2)

    在t+T時刻的資源需求預(yù)測值yt+T,由時刻t的資源需求值at和T時間間隔內(nèi)增量bt決定,即:

    yt+T=at+bt·T

    (3)

    因此基于二次移動平均法,對t時刻歷史資源需求序列進行分析,可以得到在t+T時刻的資源需求預(yù)測值:

    (4)

    不難發(fā)現(xiàn),DMA模型更加適用于相對平穩(wěn),線性的時間序列預(yù)測,難以應(yīng)對具有突發(fā)性變化的預(yù)測.

    2.3 負載抖動期預(yù)測模型

    支持向量回歸算法(Support Vector Regression,SVR)[22]是在支持向量機算法(SVM)[23]的基礎(chǔ)上,引入了ε不敏感損失函數(shù),通過使用支持向量機擬合曲線,實現(xiàn)回歸分析,從而將支持向量機從分類推廣到了回歸中.ε-不敏感損失函數(shù)可以保證誤差函數(shù)有一定的界限,實現(xiàn)更強的魯棒性.

    根據(jù)風(fēng)險最小化原則,對于訓(xùn)練樣本集合:{(xi,yi)},i=1,2,…,n.其中xi表示輸入數(shù)據(jù),yi表示輸出數(shù)據(jù).給出SVR模型如下形式化定義:

    f(x)=ωξ(x)+b

    (5)

    其中,f(·)表示預(yù)測值,ξ(·)表示非線性映射函數(shù)將輸入數(shù)據(jù)映射到高維特征空間,x表示輸入數(shù)據(jù)集合,ω表示權(quán)值,b表示偏置值.

    為了實現(xiàn)更好的數(shù)據(jù)擬合效果,可以引入懲罰系數(shù)C,將該問題轉(zhuǎn)化為如下優(yōu)化問題:

    (6)

    約束條件為:

    (7)

    為了保證SVR算法的輸入輸出數(shù)據(jù)集之間的整體誤差最小,權(quán)值向量ω表示為:

    (8)

    SVR通過將數(shù)據(jù)從低維空間映射到高維空間,在核空間里進行線性學(xué)習(xí),從而實現(xiàn)回歸擬合分析.引入核函數(shù),得到如下回歸函數(shù):

    (9)

    其中,K(xi·xj)表示核函數(shù).

    核函數(shù)是SVR模型的關(guān)鍵所在,常見的核函數(shù)多項式核函數(shù)、有線性核函數(shù)以及徑向基(RBF)核函數(shù)等,本文將RBF核函數(shù)引入SVR模型中,其形式化如下:

    K(xi,xj)=exp(-γ‖xi-xj‖2),γ>0

    (10)

    不難發(fā)現(xiàn),相比較一些傳統(tǒng)的線性預(yù)測方法,SVR模型更加適用于非線性、非穩(wěn)定的時間序列的預(yù)測,在對具有突發(fā)性變化的負載預(yù)測具有很好的效果.

    3 基于三支決策的云資源負載預(yù)測模型

    在本節(jié)中,基于云負載特征變化,提出一種云資源需求狀態(tài)三分的預(yù)測模型—基于三支決策的云資源負載預(yù)測模型(DMASVR-3WD),并給出了一種基于代價評估的閾值確定方法.

    3.1 云計算資源預(yù)測系統(tǒng)

    云計算資源預(yù)測系統(tǒng)架構(gòu)圖如圖3所示,圖中VM為虛擬機.該系統(tǒng)結(jié)構(gòu)圖從宏觀的角度給出了一個基于三支決策的云資源預(yù)測系統(tǒng)所需要具備的功能及大致流程.

    圖3 云計算資源預(yù)測系統(tǒng)架構(gòu)圖

    對云平臺的歷史數(shù)據(jù)中的用戶請求進行分析,包括數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)屬性和數(shù)據(jù)量等,在系統(tǒng)數(shù)據(jù)預(yù)處理模塊中,直接篩除無關(guān)數(shù)據(jù)及屬性,并將有用的原始數(shù)據(jù)進行規(guī)范化.

    為了實現(xiàn)精準有效的預(yù)測,根據(jù)數(shù)據(jù)特征進行模型的選擇和訓(xùn)練,我們引入相鄰值之間的均方根誤差(Root Mean Squared Error,RMSE),設(shè)定閾(α,β)值進行對比,對平穩(wěn)期、波動期和抖動期的三種情況進行分析,給出區(qū)分不同情況的三支方法準則.對于用戶資源需求劃分的三個區(qū)域,我們僅采用兩種預(yù)測模型來進行預(yù)測,對于負載平緩期往往采用適用于平穩(wěn)的,具有線性趨勢的時間序列預(yù)測模型,而對于負載抖動期本文采用短期預(yù)測模型來更好的擬合.而對于中間不確定域即負載波動期,本文給出一個評價標(biāo)準,采用代價評估的三支決策邊界域處理模型來進行再劃分.使用最終預(yù)測結(jié)果來規(guī)劃容量.

    3.2 基于代價評估的三支劃分

    基于三支決策的云資源負載預(yù)測模型,構(gòu)建狀態(tài)空間Ω={X,XC}分別表示在云資源環(huán)境中的負載特征,X表示負載平緩期預(yù)測模型,XC表示負載抖動期預(yù)測模型,樣本經(jīng)過訓(xùn)練后劃分到三個域,正域(POS)、邊界域(BND)和負域(NEG).給出決策方案為D={aP,aB,aN},分別表示判定負載狀態(tài)后的三種決策方案,平緩期立即處理,波動期延遲決策再處理,抖動期立即處理.鑒于此,針對不同狀態(tài)下的決策動作,設(shè)立如下決策代價表,如表1所示.

    表1中λij(i=P,B,N,j=P,N)表示對象屬于X和XC狀態(tài)下采取的不同行動aP、aB、aN的損失值,即代價.P(X|[x])表示等價類中一個對象屬于集合X的條件概率.對于一個對象,采取不同的決策動作時,會帶來不同的代價,因此,不同的決策動作帶來的期望損失如下:

    R(aP|[x])=λPPP(X|[x])+λPNP(XC|[x])R(aB|[x])=λBPP(X|[x])+λBNP(XC|[x])R(aN|[x])=λNPP(X|[x])+λNNP(XC|[x])

    (11)

    表1 負載預(yù)測代價函數(shù)

    依據(jù)貝葉斯最小風(fēng)險準則,最佳方案為期望損失最小的決策方案,有如下規(guī)則:

    (P)如果R(aP|[x])≤R(aB|[x])且R(aP|[x])≤R(aN|[x])成立,則判定x∈POS(X)(平緩期預(yù)測模型);

    (B)如果R(aB|[x])≤R(aP|[x])且R(aB|[x])≤R(aN|[x])成立,則判定x∈BND(X)(波動期延遲決策);

    (N)如果R(aN|[x])≤R(aP|[x])且R(aN|[x])≤R(aB|[x])成立,則判定x∈NEG(X)(抖動期預(yù)測模型);

    考慮到對于含有兩種狀態(tài)的決策系統(tǒng),記P(X|[x])=P,則P(XC|[x])=1-P,上述規(guī)則只與概率P(X|[x])和相關(guān)的總代價有關(guān).考慮到在[x]?X時,將x判定為平緩期的代價要小于將其判定為波動期的代價,進一步小于將其判定為抖動期的代價.在[x]?XC時,將x判定為抖動期的代價要小于將其判定為波動期的代價,進一步小于將其判定為抖動期的代價.可以得到λPP≤λBP<λNP,λNN≤λBN<λPN.

    依據(jù)三支決策模型的決策準則,規(guī)則(P)、(B)和(N)可簡化為:

    (P1)當(dāng)P(X|[x])≥α?xí)r,x∈POS(X),則采用平緩期預(yù)測模型;

    (B1)當(dāng)β

    (N1)當(dāng)β≥P(X|[x])時,x∈NEG(X),則采用抖動期預(yù)測模型;

    其中α和β分別為:

    (12)

    3.3 代價評估的三支決策邊界域處理模型

    (13)

    算法1.基于代價評估的邊界域處理模型算法

    輸入:

    Ti:中間域樣本數(shù)據(jù)BND(X)={x1,x2,…,xs}

    輸出:

    平緩期POS(X)和抖動期NEG(X)

    Step 1.

    從BND(X)中任取一樣本xb,根據(jù)公式(13)計算出樣本被劃分到平緩期和抖動期的損失Cost(aP|[xb])和Cost(aN|[xb])

    Step 2.

    xb∈NEG(X)

    else

    xb∈POS(X)

    Step 3.

    if(xb∈POS(X))then

    POS(X)=POS(X)∪xb

    BND(X)=BND(X)-xb

    if(xb∈NEG(X))then

    NEG(X)=NEG(X)∪xb

    BND(X)=BND(X)-xb.

    Step 4.

    若邊界域中所有樣本都被成功劃分到平緩期和抖動期,即邊界域為空,則結(jié)束.否則,轉(zhuǎn)Step 1,知道所有邊界域樣本被劃分成功.

    3.4 DMASVR-3WD預(yù)測模型

    借助三支決策的基本思想,分析Google trace中真實云負載數(shù)據(jù),將對象劃分為正域(POS)、邊界域(BND)和負域(NEG),提出了一種基于三支決策的云資源需求預(yù)測模型(DMASVR-3WD),其系統(tǒng)架構(gòu),如圖4所示.

    圖4 三支預(yù)測模型系統(tǒng)架構(gòu)

    對于平緩期和抖動期,直接借助2.2節(jié)和2.3節(jié)提到的兩種基本預(yù)測模型進行負載預(yù)測處理,基于平緩期的特點,本文采用二次移動平均法(DMA)進行資源負載的預(yù)測.基于抖動期的特點,本文采用支持向量回歸模型(SVR)進行資源負載的預(yù)測.如果將固定因素影響的樣本點看作是平緩期,那么受到隨機因素影響的即偏離原始樣本集的樣本點,偏離原始樣本集趨越大說明負載的變化越明顯,即表現(xiàn)為負載的抖動期.本文針對抖動期和平緩期的負載特點,使用均方根誤差(RMSE)來劃分負載平緩期,抖動期和波動期,由此本文提出了DMASVR-3WD算法.

    DMASVR-3WD預(yù)測模型提出的目的是為了實現(xiàn)更加精準的云資源負載預(yù)測,提高資源利用率以降低成本.我們引入均方根誤差RMSE標(biāo)準來計算代價.負載預(yù)測代價計算方法為:

    (14)

    當(dāng)對真實的云資源負載數(shù)據(jù)進行預(yù)測分析時,根據(jù)負載特征劃分三部分,其預(yù)測準確率也同樣包括三部分,其中R1、R2和R3分別表示負載特征平緩時平緩期預(yù)測模型,波動期延遲決策和抖動期預(yù)測模型的代價.

    (15)

    (16)

    (17)

    (18)

    基于上述討論,我們給出DMASVR-3WD模型的具體算法如下:

    算法2.DMASVR-3WD預(yù)測模型

    輸入:

    Ti:歷史cup請求量數(shù)據(jù)集時間序列

    X={xi,xi-1,…,xi-(w-1)}

    輸出:

    P:cup請求量的預(yù)測值

    //計算相鄰值之間的均方根誤差

    fori=w;i

    //m為時間序列的長度

    //w為DMA窗口的大小

    Mi+1=DoubleMA(w,xi,xi-1,…,xi-w+1)

    //DMA根據(jù)最近w個輸入值預(yù)測線性分量Mi+1

    fori=w+1;i

    Ri=Ti-Mi

    //Ri為時間序列的非線性分量

    fori=w+1;i

    (C,K,s)=SVRtrain(Ri,Ri+1)

    //Ri表示輸入數(shù)據(jù),Ri+1表示輸出數(shù)據(jù),訓(xùn)練SVR模型

    //C表示懲罰系數(shù),K表示核函數(shù),s表示損失函數(shù)參數(shù)

    Nm+1=SVRpredict(c,g,p,Nm)

    P=Mm+1;

    P=Rm+1;

    else

    P=Rm+1

    else

    P=Mm+1

    4 實驗結(jié)果與分析

    4.1 實驗環(huán)境及數(shù)據(jù)集

    本文實驗操作系統(tǒng)為64位CentOS 7,內(nèi)存為8GB,硬盤容量為50GB.在此操作系統(tǒng)上利用Java,在IDEA開發(fā)平臺上進行評估實驗.

    圖5 數(shù)據(jù)預(yù)處理示意圖

    實驗數(shù)據(jù)來自于Google cluster trace,其中的數(shù)據(jù)表task_usage記錄了近29天各個時間節(jié)點的主機CPU,內(nèi)存,磁盤等資源使用信息,本文的目的是預(yù)測CPU的使用情況,因此選取了表中某幾天的CPU使用狀態(tài)信息,以30分鐘為單位,對表中CPU使用量進行統(tǒng)計,并將其定義為一個批量數(shù)據(jù)集(Batch),基于此,再把每3個連續(xù)的Batch劃分為一個滑動窗口(Window),其移動間隔為一個Batch的長度,如圖5所示.

    4.2 評價指標(biāo)

    為了評價預(yù)測系統(tǒng)的性能,實驗采用合格率,準確率與SLA違約率三個評價指標(biāo).對于所選取的指標(biāo)含義及選取依據(jù)解釋如下:

    1)合格率(QR)

    由于在實際集群環(huán)境中進行資源分配,很難達到資源需求和資源供應(yīng)完全一致,為了提高用戶服務(wù)質(zhì)量,獲取更多的分配資源,本文引入合格率作為其中評價指標(biāo),用來表示負載預(yù)測值大于實際值的樣本比例.

    (19)

    2)準確率

    若提供商僅僅為保證較高的服務(wù)質(zhì)量,保持較高的合格率,將會導(dǎo)致預(yù)測值常常大于實際值的情況,即存在資源分配過度,使用率低和能耗較高的問題.由此為避免大量資源閑置的情況出現(xiàn),本文引入檢驗動態(tài)資源需求預(yù)測偏差的指標(biāo),預(yù)測值與實際值的均方誤差(RMSE)指標(biāo)和平均絕對百分比誤差(MAPE):

    (20)

    (21)

    3)SLA違約率(SLA)

    在實際的集群環(huán)境中,云計算平臺資源需求存在高度動態(tài)性,處于抖動期的負載,資源需求短時間內(nèi)增長幅度大,容易出現(xiàn)實際值大于預(yù)測值的情況,導(dǎo)致作業(yè)資源短缺,服務(wù)質(zhì)量下降的問題,由此本文引入了SLA違約率指標(biāo),其表示為預(yù)測值小于實際值的樣本點所占比例:

    (22)

    4.3 預(yù)測效果對比與分析

    實驗截取了Google cluster trace某幾天的數(shù)據(jù),并進行上述的預(yù)處理工作,得到多個聚合的windows數(shù)據(jù)集,再將windows中的多個batch數(shù)據(jù)作為模型輸入,得出預(yù)測值與實際值的對比結(jié)果,本節(jié)分別評估了自移動積分滑動平均(ARIMA)、神經(jīng)網(wǎng)絡(luò)(NN)和DMASVR-3WD算法三種預(yù)測模型對于實際CPU使用的預(yù)測效果,評估指標(biāo)分別為合格率,均方誤差,平均絕對百分比誤差與SLA違約率.三種預(yù)測模型的預(yù)測結(jié)果對比如圖6所示.

    4.3.1 自回歸積分滑動平均(ARIMA)

    從圖6中可以觀察到,ARIMA對平緩期的CPU使用量具有較好的預(yù)測效果,但在CPU資源使用的抖動期間,ARIMA模型的預(yù)測效果并不穩(wěn)定,有明顯的滯后性,8-22區(qū)間中滯后性明顯.且多處預(yù)測值低于實際值,特別是在9~12區(qū)間和13~15區(qū)間中,明顯觀察到預(yù)測值低于實際值.滯后性明顯使得無法準確了解CPU的資源使用情況,容易導(dǎo)致資源短缺,進而影響集群的服務(wù)質(zhì)量.

    4.3.2 神經(jīng)網(wǎng)絡(luò)(NN)

    從圖6的觀察中得到,NN對平緩期的CPU使用有著更為理想的預(yù)測效果,但算法本身容易陷入局部最優(yōu)解,因此對抖動期的CPU使用的預(yù)測略顯不足,難以適應(yīng)突增的資源使用變化,如8~20區(qū)間的預(yù)測曲線平緩,與實際值的預(yù)測差距較大,CPU資源使用的預(yù)測不足,致使其既不能保證很高的服務(wù)質(zhì)量,也存在資源短缺現(xiàn)象發(fā)生.

    圖6 三種模型預(yù)測結(jié)果對比圖

    4.3.3 DMASVR-3WD算法

    基于同樣的數(shù)據(jù)集,本文提出的DMASVR-3WD模型相較于ARIMA與NN算法,DMASVR-3WD算法在CPU使用的平緩期與抖動期的表現(xiàn)都較為穩(wěn)定,特別是對抖動期的預(yù)測,如12~17區(qū)間的預(yù)測效果,能較好地擬合實際CPU使用的曲線,且多數(shù)節(jié)點的預(yù)測僅僅稍大于實際的CPU使用量,如17-21區(qū)間的預(yù)測效果,這樣可在保證較高的服務(wù)質(zhì)量的同時,也能減少資源閑置的現(xiàn)象發(fā)生.

    基于上述實驗,計算得出的有關(guān)ARIMA,NN與DMASVR-3WD預(yù)測模型的評價指標(biāo)結(jié)果,如表2所示.

    表2 模型預(yù)測評價指標(biāo)對比

    Table 2 Model prediction evaluation index comparison

    QRMSEMAPESLAARIMA0.6000.0331.1340.400NN0.5000.0491.0970.500DMASVR-3WD0.6670.0140.3930.333

    從表2中可以看出,NN算法有較小的合格率和較大的違約率,即在時間節(jié)點上多數(shù)的預(yù)測值小于真實值,并且有著較大的均方誤差和平均絕對百分比誤差,即預(yù)測準確度低,這些將使得用戶作業(yè)無法獲取資源進而處于等待狀態(tài),延長了作業(yè)時間,進而影響了集群的使用效率.相較于NN算法,ARIMA算法有著更好的合格率和違約率,但是由于其無法適應(yīng)突增負載狀況,使得該模型有著較高的均方誤差和極大的平均絕對百分比誤差.同時,我們觀察DMASVR-3WD算法,有理想的QR和更少的違約率,同時預(yù)測結(jié)果MAPE的標(biāo)準差僅為0.393,遠低于其他預(yù)測算法,體現(xiàn)了該算法具有良好的穩(wěn)定性.也因為該算法能很好的擬合負載抖動期和平緩期的真實CPU使用量,因此,有著低的MSE,相比較于其他兩種算法,DMASVR-3WD模型明顯提高了預(yù)測精度.

    為了檢驗DMASVR-3WD的泛化能力,從Google cluster trace的task_usage即任務(wù)資源使用表中選取三張負載數(shù)據(jù)表采樣數(shù)據(jù)進行對比預(yù)測,預(yù)測結(jié)果如圖7所示,評價指標(biāo)對比結(jié)果如表3所示.

    圖7 不同數(shù)據(jù)集的預(yù)測結(jié)果

    表3 不同數(shù)據(jù)集模型預(yù)測評價指標(biāo)對比

    從表3和圖7可知,DWASVR-3WD在不同時期的云計算資源負載預(yù)測中均能取得較高的精度和較低的違約率,雖然在task_usage_494的CPU資源請求量波動較大,但是仍然取得了較高的預(yù)測精度,這充分表明了該預(yù)測方法具有較好的穩(wěn)定性和泛化能力.

    5 結(jié) 論

    為了提高云計算資源負載預(yù)測的準確度,保證服務(wù)質(zhì)量,提出了一種基于三支決策的云平臺負載預(yù)測模型(DMASVR-3WD).在分析了用戶資源需求的負載特征后,引入基本預(yù)測模型對平緩期和抖動期進行處理,分析并且計算出代價閾值,依據(jù)期望損失代價最小化的原則對波動期進行劃分處理.使用合格率,RMSE,MAPE和違約率四種評價指標(biāo),評估本文提出的負載預(yù)測模型和現(xiàn)有的負載預(yù)測模型在真實Google cluster trace數(shù)據(jù)中的預(yù)測效果.實驗表明,DMASVR-3WD算法能夠有效地降低預(yù)測誤差,同時在平緩期和抖動期都起到很好的預(yù)測效果,并且有著較低的違約率.

    猜你喜歡
    代價決策誤差
    為可持續(xù)決策提供依據(jù)
    角接觸球軸承接觸角誤差控制
    哈爾濱軸承(2020年2期)2020-11-06 09:22:26
    Beidou, le système de navigation par satellite compatible et interopérable
    決策為什么失誤了
    壓力容器制造誤差探究
    愛的代價
    海峽姐妹(2017年12期)2018-01-31 02:12:22
    代價
    九十億分之一的“生死”誤差
    山東青年(2016年2期)2016-02-28 14:25:41
    成熟的代價
    代價
    云和县| 壶关县| 沙洋县| 大渡口区| 沁阳市| 朝阳县| 昌邑市| 昭平县| 察雅县| 鄂温| 铜川市| 女性| 中西区| 桦甸市| 珲春市| 聂荣县| 车致| 山阳县| 南投县| 图木舒克市| 专栏| 晋宁县| 普安县| 祁阳县| 依安县| 海兴县| 高陵县| 砀山县| 霍林郭勒市| 五家渠市| 东兰县| 上虞市| 高邮市| 藁城市| 梁平县| 陈巴尔虎旗| 南华县| 淮北市| 宜宾市| 中超| 镶黄旗|