• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    云網(wǎng)絡(luò)中基于高服務(wù)質(zhì)量的故障檢測(cè)方案

    2014-12-20 06:59:12李艷萍林建輝
    關(guān)鍵詞:檢測(cè)器進(jìn)程服務(wù)質(zhì)量

    李艷萍,林建輝

    (1.西南交通大學(xué) 機(jī)械工程學(xué)院,四川 成都610031;2.西南交通大學(xué) 牽引動(dòng)力國(guó)家重點(diǎn)實(shí)驗(yàn)室,四川 成都610031)

    0 引 言

    在云計(jì)算網(wǎng)絡(luò)應(yīng)用環(huán)境[1,2]中,部分服務(wù)器比較活躍,可用性較高,而其它服務(wù)器非常忙碌且負(fù)載較重,還有些服務(wù)器因?yàn)楦鞣N原因而處于離線狀態(tài)甚至系統(tǒng)崩潰。因此,云服務(wù)環(huán)境具有動(dòng)態(tài)性和不可預(yù)測(cè)性[3],用戶希望能有合適的可用服務(wù)器來(lái)完成他們的應(yīng)用要求。我們必須能夠應(yīng)對(duì)這樣的多變性,并提供帶有參數(shù)指導(dǎo)的有效控制策略,以對(duì)服務(wù)條件和云資源進(jìn)行管理。因此,雖然部分組件發(fā)生故障,人們還是提出了容錯(cuò)技術(shù)來(lái)為云計(jì)算網(wǎng)絡(luò)提供可靠而又連續(xù)的服務(wù)[4,5]。作為云計(jì)算網(wǎng)絡(luò)的重要基礎(chǔ),故障檢測(cè)器 (FD)在開(kāi)發(fā)此類高可靠性網(wǎng)絡(luò)系統(tǒng)時(shí)具有重要作用[6]。要保證較高水平的服務(wù)質(zhì)量,必須進(jìn)行有效的故障檢測(cè)。設(shè)計(jì)可靠的故障檢測(cè)器非常困難,主要原因在于通信延遲的統(tǒng)計(jì)行為不可預(yù)測(cè),另一個(gè)原因是異步分布式系統(tǒng) (即進(jìn)程運(yùn)行速度或消息傳輸延遲沒(méi)有界限)無(wú)法準(zhǔn)確確定遠(yuǎn)程進(jìn)程到底是發(fā)生故障還是運(yùn)行速度較慢[7]。如果故障檢測(cè)器可靠性較低,則可能會(huì)錯(cuò)誤地懷疑正常進(jìn)程或者信任故障進(jìn)程。為了保證低可靠性故障檢測(cè)器具有滿意的服務(wù)質(zhì)量,需要適當(dāng)調(diào)整參數(shù),以提供更高層次的高質(zhì)量服務(wù),因?yàn)楣收蠙z測(cè)器的服務(wù)質(zhì)量對(duì)在更高層級(jí)提供服務(wù)質(zhì)量具有重大影響。

    1 相關(guān)工作

    故障檢測(cè)問(wèn)題是云計(jì)算網(wǎng)絡(luò)安全研究的熱點(diǎn)之一,相繼有眾多的學(xué)者提出了一系列用于故障檢測(cè)的方法,如文獻(xiàn) [6,8]等提出了多種容錯(cuò)算法,但這些算法仍然基于低可靠性故障檢測(cè)器。Chen等人在文獻(xiàn) [9]中首先提出了一組指標(biāo)來(lái)定量描述故障檢測(cè)器服務(wù)質(zhì)量。這些指標(biāo)包括:實(shí)際故障檢測(cè)速度及虛假檢測(cè)率,然后提出了多種基于網(wǎng)絡(luò)系統(tǒng)概率行為的故障檢測(cè)器實(shí)施方案。這些方案利用最新采樣得到的到達(dá)時(shí)間來(lái)估計(jì)下一心跳的到達(dá)時(shí)間。然而,基于這一估計(jì)設(shè)置的超時(shí)及恒定安全范圍,與動(dòng)態(tài)網(wǎng)絡(luò)行為并不十分匹配。為了提升故障檢測(cè)器的服務(wù)質(zhì)量,文獻(xiàn) [9-11]提出了多種自適應(yīng)故障檢測(cè)器,包括Chen FD[9],Bertier FD[10]及φFD[11]。Bertier在文獻(xiàn) [12]中提出對(duì)Chen的FD 安全范圍進(jìn)行優(yōu)化。它使用了另一種估計(jì)函數(shù),融合了Chen和Jacobson的往返時(shí)間 (RTT)估計(jì)。Bertier的故障檢測(cè)器設(shè)計(jì)的主要目的是用于消息很少丟失的有線局域網(wǎng)。

    雖然以上故障檢測(cè)器均取得了重大的技術(shù)突破,但是仍然具有一定的局限性。這主要有3個(gè)方面的原因:①故障檢測(cè)器提供一個(gè)信息列表,表明哪些進(jìn)程被懷疑崩潰。由于消息延時(shí)的高不可預(yù)測(cè)性、網(wǎng)絡(luò)系統(tǒng)拓?fù)浣Y(jié)構(gòu)的動(dòng)態(tài)變化性及網(wǎng)絡(luò)消息的丟失概率較高,該消息列表并不是最新列表,有時(shí)還會(huì)存在錯(cuò)誤 (比如,故障檢測(cè)器可能會(huì)對(duì)實(shí)際上正常的進(jìn)程產(chǎn)生懷疑)。②傳統(tǒng)的二元交互 (即信任與懷疑)難以滿足多個(gè)分布式應(yīng)用同時(shí)運(yùn)行的需求。實(shí)際上,多種分布式網(wǎng)絡(luò)應(yīng)用要求使用不同類型的故障檢測(cè)服務(wù)質(zhì)量,以觸發(fā)不同的響應(yīng)。③雖然用戶知道了算法的內(nèi)核函數(shù)和參數(shù)后,可以根據(jù)服務(wù)質(zhì)量的輸出來(lái)確定合適的參數(shù)值,進(jìn)而滿足用戶的服務(wù)質(zhì)量要求(QoS),但是絕大多數(shù)當(dāng)前算法面對(duì)動(dòng)態(tài)網(wǎng)絡(luò)條件,無(wú)法實(shí)現(xiàn)參數(shù)的自動(dòng)調(diào)整。該參數(shù)調(diào)整過(guò)程非常復(fù)雜,最好由專業(yè)工程人員完成。更重要的是,網(wǎng)絡(luò)具有動(dòng)態(tài)性和不可預(yù)測(cè)性,我們無(wú)法使用固定的故障檢測(cè)器參數(shù)來(lái)滿足用戶需求??傮w來(lái)說(shuō),當(dāng)前故障檢測(cè)器參數(shù)調(diào)整必須手工完成,非常不適合于動(dòng)態(tài)網(wǎng)絡(luò),尤其是大型分布式網(wǎng)絡(luò)和不穩(wěn)定性網(wǎng)絡(luò) (這里指網(wǎng)絡(luò)的消息時(shí)延具有很強(qiáng)的不可預(yù)測(cè)性,系統(tǒng)拓?fù)浣Y(jié)構(gòu)具有很強(qiáng)的動(dòng)態(tài)變化性,且消息丟失概率較大)。因此,我們對(duì)故障檢測(cè)器特性及其與分布式容錯(cuò)系統(tǒng)的相互關(guān)系展開(kāi)進(jìn)一步研究。

    為解決上述問(wèn)題,本文首先提出了一種通用的云計(jì)算容錯(cuò)網(wǎng)絡(luò)自適應(yīng)故障檢測(cè)算法。該算法可以廣泛用于工業(yè)和商業(yè)領(lǐng)域。相反,其他算法在提供服務(wù)質(zhì)量輸出方面缺乏針對(duì)性:一些算法只能暫時(shí)地滿足要求;其他算法可能根本不滿足要求,工程人員不得不手工更改相關(guān)參數(shù)。這些算法必須要嘗試所有可能的參數(shù)值,通過(guò)獲得性能輸出曲線圖才能確定哪些參數(shù)適合網(wǎng)絡(luò)需要 (手工選擇相關(guān)參數(shù))。如果網(wǎng)絡(luò)的變化較大,工程人員必須得再次手工調(diào)整參數(shù)。第二,我們基于上述通用算法,對(duì)當(dāng)前故障檢測(cè)器進(jìn)行優(yōu)化,提出了一種自適應(yīng)累積型故障檢測(cè)器 (累積型故障檢測(cè)器是指檢測(cè)器服務(wù)的輸出是連續(xù)的懷疑水平數(shù)值,而不是二進(jìn)制數(shù)值 (信任VS懷疑)。第三,我們對(duì)SFD 的部署展開(kāi)研究。SFD 的工作流程簡(jiǎn)述如下:與傳統(tǒng)的自適應(yīng)型故障檢測(cè)器[9,10]類似,一個(gè)滑動(dòng)窗口維持著最近到達(dá)的時(shí)間樣本。基于滑動(dòng)窗口和輸出反饋信息,對(duì)下一樣本的下一超時(shí)時(shí)延τ的近似進(jìn)行調(diào)整。獲得該動(dòng)態(tài)反饋信息后,計(jì)算相關(guān)參數(shù),以匹配最新網(wǎng)絡(luò)條件。從設(shè)計(jì)角度說(shuō),SFD 調(diào)整后可以較好地應(yīng)對(duì)不可預(yù)測(cè)的網(wǎng)絡(luò)條件及同時(shí)運(yùn)行的任意數(shù)量應(yīng)用程序要求。最后,我們基于7種典型的廣域網(wǎng)案例,通過(guò)廣泛的實(shí)驗(yàn),比較性評(píng)估了本文故障檢測(cè) 算 法 與 當(dāng) 前 其 他 算 法 的 性 能 (Chen FD[9],Bertier FD[10,12],φFD[11])。實(shí)驗(yàn) 結(jié) 果 在 表 明 不 同 故 障 器 特 點(diǎn) 的 同時(shí),證明了本文算法可以實(shí)現(xiàn)參數(shù)的自動(dòng)調(diào)整,進(jìn)而獲得相應(yīng)的服務(wù)質(zhì)量,滿足用戶需求,享受較高的系統(tǒng)性能。本文提出的SFD 可以廣泛應(yīng)用于工業(yè)和商業(yè)領(lǐng)域,并為云網(wǎng)絡(luò)帶來(lái)巨大效益。

    2 系統(tǒng)模型和基本概念

    本節(jié)首先給出實(shí)際中的云計(jì)算網(wǎng)絡(luò)模型 (如圖1所示)及理論上的云計(jì)算網(wǎng)絡(luò)分析模型 (如圖2所示),然后定義故障檢測(cè)服務(wù)質(zhì)量指標(biāo)。

    圖1 云計(jì)算動(dòng)態(tài)網(wǎng)絡(luò)模型:美國(guó)南部各州教育云聯(lián)盟

    2.1 實(shí)際中的云計(jì)算網(wǎng)絡(luò)模型

    如圖1 所示,本文對(duì)動(dòng)態(tài)云計(jì)算網(wǎng)絡(luò)模型展開(kāi)研究(請(qǐng)注意,通用模型可以包括多個(gè)云)。該模型以美國(guó)南部多個(gè)州的教育云聯(lián)盟及數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)為基礎(chǔ)[7]。當(dāng)前,5個(gè)南部州 (佐治亞州 (GA),南卡羅來(lái)納州 (SC),北卡羅萊納州 (NC),弗吉尼亞州 (VA),馬里蘭 (MD))均有教育云建設(shè)項(xiàng)目正在進(jìn)行,圖1是一種很具現(xiàn)實(shí)代表性的云計(jì)算網(wǎng)絡(luò)模型,其中,云計(jì)算網(wǎng)絡(luò)服務(wù)器的狀態(tài)可能會(huì)發(fā)生變化:有些服務(wù)器非常活躍,有些服務(wù)器非常忙碌,有些服務(wù)器非常遲鈍,有些可能已經(jīng)死亡或者崩潰。因此,當(dāng)我們從服務(wù)器希望得到的服務(wù)發(fā)生故障時(shí),必須要有云故障檢測(cè)模型才能對(duì)故障進(jìn)行處理,也只有云故障檢測(cè)模型才能觸發(fā)相應(yīng)的措施來(lái)確保適當(dāng)?shù)姆?wù)響應(yīng)。當(dāng)前的故障檢測(cè)算法[9,12],雖然可以提供一定的檢測(cè)服務(wù),但是其系統(tǒng)參數(shù)無(wú)法針對(duì)不斷變化的網(wǎng)絡(luò)條件實(shí)現(xiàn)自動(dòng)調(diào)整。所以,本文提出一種通用型自適應(yīng)算法來(lái)解決上述問(wèn)題。

    圖2 心跳故障檢測(cè)基本模型

    2.2 云計(jì)算網(wǎng)絡(luò)理論模型

    本文考慮一種部分同步的云計(jì)算網(wǎng)絡(luò)系統(tǒng)。該系統(tǒng)由進(jìn)程有限集Π = {p1,p2,p3,...,pn}構(gòu)成 (該模型基于上述圖1中的IBM 云計(jì)算網(wǎng)絡(luò):一個(gè)用戶、一個(gè)管理員、或者整個(gè)教育云被視為一個(gè)進(jìn)程)。進(jìn)程可能發(fā)生崩潰故障,本文中假設(shè)崩潰進(jìn)程不會(huì)恢復(fù)。假設(shè)每一對(duì)進(jìn)程通過(guò)一個(gè)單向低可靠性通信信道相連。低可靠性通信信道定義如下:無(wú)消息生成,無(wú)消息變更,無(wú)消息復(fù)制,但是有可能發(fā)生消息丟失。進(jìn)程完全通過(guò)單向通信信道連接。不失一般性,本文只考慮帶有2 個(gè)進(jìn)程p,q 的系統(tǒng)模型 (與文獻(xiàn) [9-12]相同),這2個(gè)進(jìn)程從大型系統(tǒng)Π 中隨機(jī)提取,且進(jìn)程q監(jiān)控進(jìn)程p(如圖2所示):p 周期性地向q 發(fā)送一條消息,進(jìn)行本地計(jì)算,也有可能發(fā)生崩潰故障 (根據(jù)圖1中的理論云模型,進(jìn)程q像一個(gè)管理員,而進(jìn)程p 像一個(gè)教育云。由監(jiān)控結(jié)果給出每個(gè)教育云計(jì)算環(huán)境)。此時(shí),發(fā)送周期稱為心跳間隔Δt。進(jìn)程q可能從p 處接收一條消息,或者執(zhí)行本地計(jì)算。如果在新點(diǎn) (fresh point,F(xiàn)P)確定的周期內(nèi)沒(méi)有從p 處接收到消息,則q將開(kāi)始懷疑p。新點(diǎn)FP由超時(shí)參數(shù)τ確定。

    如圖2所示,di為從p 到q 的心跳mi的發(fā)射時(shí)延,且發(fā)送周期稱為心跳間隔Δt。對(duì)即將到來(lái)的心跳mi,進(jìn)程q定期根據(jù)新的新點(diǎn)FPi做出響應(yīng)。該模型描述了可能出現(xiàn)的4種情形。第1種情形:進(jìn)程p 在發(fā)送時(shí)間σ1發(fā)送的心跳消息m1,在q的新FP1前到達(dá)q,然后q從m1的到達(dá)時(shí)間開(kāi)始信任p(這里我們假設(shè)p 在開(kāi)始情況下就被信任)。第2種情形:來(lái)自p 的消息m2被丟失,然后q等待心跳直到它的新點(diǎn)FP2為止,此時(shí)q 開(kāi)始懷疑p。第3 種情形:來(lái)自p 的心跳mi在q 的新點(diǎn)FPi之后到達(dá)q,然后q 從FPi至mi到達(dá)期間懷疑p。第4種情形:p 發(fā)出心跳m(i+1)后便發(fā)生崩潰。對(duì)即將到來(lái)的心跳m(i+1),q 根據(jù)不同的故障檢測(cè)方案計(jì)算新的新點(diǎn)FPi+1,然后基于心跳到達(dá)時(shí)間給出響應(yīng)。

    本文SFD 算法假設(shè)存在全局時(shí)間 (對(duì)進(jìn)程未知),且用全局穩(wěn)定時(shí)間表示,同時(shí)進(jìn)程不斷向前發(fā)展。此外,相鄰步驟間至少存在δ>0個(gè)時(shí)間單元 (后者目的是為了排除進(jìn)程在有限時(shí)間內(nèi)執(zhí)行無(wú)限次步驟這一情況)[11]。進(jìn)程間通信模型以基于用戶數(shù)據(jù)報(bào)通信協(xié)議 (UDP)的消息交換為基礎(chǔ)。我們沒(méi)有考慮進(jìn)程的相對(duì)速度。然而,我們認(rèn)為進(jìn)程可以訪問(wèn)用于測(cè)量時(shí)間的本地時(shí)鐘設(shè)備。此外,所有進(jìn)程均可訪問(wèn)故障檢測(cè)設(shè)備。

    2.3 故障檢測(cè)服務(wù)質(zhì)量指標(biāo)

    為了定量評(píng)估故障檢測(cè)器的服務(wù)質(zhì)量,我們使用相互獨(dú)立的3大服務(wù)質(zhì)量指標(biāo):檢測(cè)時(shí)間,差錯(cuò)率,查詢精度概率。第1個(gè)指標(biāo)描述故障檢測(cè)器的速度對(duì)模型的影響,另外2個(gè)指標(biāo)均與精度有關(guān)。詳細(xì)來(lái)說(shuō),考慮2個(gè)進(jìn)程p,q且q監(jiān)控p,故障檢測(cè)器對(duì)q 的服務(wù)質(zhì)量 (稱為fdq)可通過(guò)它對(duì)p的 “信任”和 “懷疑”2種狀態(tài)的轉(zhuǎn)換時(shí)間來(lái)確定 (如圖3所示,TM(錯(cuò)誤時(shí)長(zhǎng))測(cè)量了錯(cuò)誤懷疑開(kāi)始至結(jié)束的持續(xù)時(shí)間 (即直到錯(cuò)誤被糾正)。TMR(錯(cuò)誤復(fù)發(fā)時(shí)間)測(cè)量2個(gè)連續(xù)錯(cuò)誤間的時(shí)間,它是個(gè)表示某次錯(cuò)誤懷疑至下一次錯(cuò)誤懷疑間持續(xù)時(shí)間的隨機(jī)變量)。

    圖3 故障檢測(cè)器服務(wù)質(zhì)量評(píng)估基本指標(biāo)

    檢測(cè)時(shí)間 (TD):它是個(gè)隨機(jī)變量,表示進(jìn)程p 開(kāi)始崩潰到進(jìn)程q 基于fdq持續(xù)懷疑p 的開(kāi)始時(shí)間之間的間隔。

    差錯(cuò)率(MR):它是個(gè)隨機(jī)變量,表示故障檢測(cè)器在單位時(shí)間內(nèi)發(fā)生的錯(cuò)誤次數(shù),即它表示故障檢測(cè)器發(fā)生差錯(cuò)的頻率。

    查詢精度概率(QAP):該概率表示在隨機(jī)時(shí)刻被詢問(wèn)時(shí),q處的故障檢測(cè)器正確判斷進(jìn)程p 為正常進(jìn)程的概率。

    故障檢測(cè)服務(wù)質(zhì)量定義。根據(jù)文獻(xiàn) [13],故障檢測(cè)器的具體性能主要從它的完整性和準(zhǔn)確性角度進(jìn)行定義,每個(gè)故障檢測(cè)構(gòu)成模塊提供的服務(wù)質(zhì)量剛好是一個(gè)多元組

    服務(wù)質(zhì)量既可以定量描述一個(gè)檢測(cè)器的故障檢測(cè)速度,也可以定量描述避免錯(cuò)誤檢測(cè)方面的性能。

    3 通用型自適應(yīng)故障檢測(cè)器

    首先針對(duì)云計(jì)算容錯(cuò)網(wǎng)絡(luò)的工程可用性,提出一種通用型自適應(yīng)故障檢測(cè)器;然后作為一個(gè)示例,對(duì)當(dāng)前故障檢測(cè)器進(jìn)行優(yōu)化,提出SFD 檢測(cè)器;最后對(duì)SFD 的部署做詳細(xì)描述。

    3.1 通用型自適應(yīng)故障檢測(cè)器算法

    根據(jù)圖2的系統(tǒng)模型,用戶p 希望進(jìn)程q 的故障檢測(cè)器能夠以一定的服務(wù)質(zhì)量要求檢測(cè)出p。此外,進(jìn)程q 的SFD 可以自動(dòng)調(diào)整參數(shù),以滿足QoS 要求。圖4中,我們給出了SFD 的反饋架構(gòu),其中QoS 是心跳的目標(biāo)服務(wù)質(zhì)量。初始服務(wù)質(zhì)量要求 (TD,MR,QAP )及QoS 已知并發(fā)送給SFD,網(wǎng)絡(luò)行為 (例如心跳信息:到達(dá)時(shí)間,心跳發(fā)送到達(dá)間隔時(shí)間Δt)也發(fā)送給SFD。通過(guò)融合來(lái)自輸出的反饋信息,SFD 可以實(shí)現(xiàn)參數(shù)的自適應(yīng)調(diào)整,以滿足目標(biāo)要求。

    圖4 目標(biāo)輸出為MR 和TD 的自適應(yīng)故障檢測(cè)器反饋結(jié)構(gòu)

    如果SFD 的輸出服務(wù)質(zhì)量沒(méi)有達(dá)到QoS 要求 (例如,我們可以將其定義為QoS >),則將反饋信息(QoS-)返回給SFD。根據(jù)反饋信息,SFD 可以調(diào)整參數(shù) (例如基于超時(shí)算法的超時(shí)參數(shù)τ)。然后,SFD 將最終滿足要求 (如果該SFD 有一定范圍且SFD 可以滿足)。否則,如果太高,且該SFD 無(wú)法為其確定合適的參數(shù),則SFD 將發(fā)出如下響應(yīng): “本SFD 無(wú)法滿足該應(yīng)用的要求”。

    更詳細(xì)地講,如果我們重點(diǎn)討論服務(wù)質(zhì)量3 大參數(shù):TD,MR,QAP (基于一個(gè)周期的實(shí)驗(yàn)而不僅是一個(gè)時(shí)隙期間的性能參數(shù)),則SFD 的服務(wù)質(zhì)量輸出基于以前所有的時(shí)間周期。圖5中,我們給出了自適應(yīng)故障檢測(cè)的參數(shù)關(guān)系,其中目標(biāo)和值應(yīng)該小于MR 和TD的要求值,值要大于QAP 的要求值。

    實(shí)際上,我們?cè)谀骋粫r(shí)隙內(nèi),SFD 參數(shù)只根據(jù)反饋信息調(diào)整一次,以改進(jìn)SFD 的服務(wù)質(zhì)量輸出,更接近于QoS。我們經(jīng)常需要在多個(gè)時(shí)隙內(nèi)多次調(diào)整SFD 參數(shù),以逐步改進(jìn)輸出的服務(wù)質(zhì)量,并最終確定能夠滿足的合適參數(shù)。此時(shí),SFD 將使其參數(shù)及云通信網(wǎng)絡(luò)系統(tǒng)趨于穩(wěn)定。如果系統(tǒng)發(fā)生較大變化且對(duì)應(yīng)的服務(wù)質(zhì)量輸出沒(méi)有滿足要求,則SFD 將會(huì)給出反饋信息,以逐步改進(jìn)SFD的服務(wù)質(zhì)量輸出,直到其滿足要求為止。這里我們假設(shè)實(shí)驗(yàn)時(shí)間很長(zhǎng),足以SFD 的服務(wù)質(zhì)量輸出滿足應(yīng)用的要求,同時(shí)假設(shè)當(dāng)前已經(jīng)存在可用且合適的控制參數(shù)。該方法是通用型方法,可用于其他基于超時(shí)的自適應(yīng)故障檢測(cè)器。總體來(lái)說(shuō),我們應(yīng)該首先根據(jù)傳統(tǒng)的檢測(cè)算法[9]得到服務(wù)質(zhì)量輸出 (TD,MR,QAP ),然后獲得反饋信息,進(jìn)而對(duì)SFD 相關(guān)參數(shù)進(jìn)行調(diào)整。

    圖5 自適應(yīng)故障檢測(cè)器參數(shù)關(guān)系,QoS 為心跳希望實(shí)現(xiàn)的目標(biāo)服務(wù)質(zhì)量

    3.2 自適應(yīng)故障檢測(cè)器

    本節(jié)提出了一種具體的SFD 檢測(cè)器,并以對(duì)當(dāng)前故障檢測(cè)器的優(yōu)化為例展開(kāi)討論。SFD 根據(jù)反饋信息調(diào)整可預(yù)測(cè)的下一新點(diǎn)τ(k+1)。因此,我們有

    式中:EA(k+1)與Chen-FD 的參數(shù)相同,SM 為動(dòng)態(tài)安全范圍,可根據(jù)預(yù)先確定的進(jìn)行調(diào)整。我們有

    式中:α(α∈(0 ,1))與Chen-FD常值安全范圍相同,我們有

    式中:β——常數(shù)且β∈ (0 ,1) ,Satk{Qo S,QoS }根據(jù)具體的服務(wù)質(zhì)量輸出狀態(tài)可被設(shè)置為β,-β或0。β值為調(diào)整速率,也可由用戶動(dòng)態(tài)選擇。

    根據(jù)式(2)~式(4),如果α值較大,則本文SFD 的TD將會(huì)變大,MR 變小,QAP 變大(因?yàn)檩^大的α值時(shí)安全范圍也會(huì)變大)。本文算法在這一點(diǎn)上與Chen-FD 類似。為了選擇Satk{Qo S},我們重點(diǎn)關(guān)注兩方面:響應(yīng)時(shí)間(TD)和檢測(cè)準(zhǔn)確性(MR,QAP)。我們應(yīng)該在響應(yīng)時(shí)間和檢測(cè)準(zhǔn)確性間做出折衷,以滿足目標(biāo)要求。例如,如果我們努力縮短響應(yīng)時(shí)間,則會(huì)降低檢測(cè)準(zhǔn)確度,反之亦然。從理論角度說(shuō),SFD滿足實(shí)際故障檢測(cè)器的特點(diǎn)且屬于 Ρac類型(累加特點(diǎn)和上限特點(diǎn)),這足以解決一致性問(wèn)題。

    3.3 SFD檢測(cè)器的部署

    本節(jié)首先介紹SFD 的架構(gòu),然后給出具體的部署算法。

    (1)SFD 架構(gòu):SFD 的部署可以分解為3個(gè)基本部分:監(jiān)測(cè),解釋,行動(dòng)。傳統(tǒng)的基于超時(shí)的故障檢測(cè)器 (Chen FD[9]和Bertier FD[10,12])綜合了監(jiān)測(cè)和解釋環(huán)節(jié),輸出二元信息。然而,SFD 檢測(cè)器作為累加型檢測(cè)器,抽象程度較低,避免了監(jiān)測(cè)信息的解釋環(huán)節(jié)。應(yīng)用進(jìn)程根據(jù)自身服務(wù)質(zhì)量要求來(lái)設(shè)置懷疑水平閾值:閾值較低,則錯(cuò)誤懷疑的數(shù)量上升,實(shí)際崩潰故障的檢測(cè)速度更高。相反,閾值較高時(shí),錯(cuò)誤懷疑數(shù)量下降,實(shí)際崩潰故障的檢測(cè)速度變低。

    (2)SFD 部署:作為一種累加型故障檢測(cè)器,SFD 使用的方法非常簡(jiǎn)單。一段預(yù)熱期后,當(dāng)新的心跳到達(dá)時(shí),到達(dá)間隔時(shí)間加入采樣滑動(dòng)窗口,同時(shí)先前最久的時(shí)間被移除采樣窗口。然后,使用采樣窗口的到達(dá)時(shí)間計(jì)算到達(dá)間隔時(shí)間的分布,獲得該滑動(dòng)窗口的平均到達(dá)間隔時(shí)間Δt。此后,根據(jù)式 (2)~式 (4),計(jì)算當(dāng)前超時(shí)值τ,確定下一新點(diǎn) (如圖2所示)。應(yīng)用場(chǎng)合需要執(zhí)行部分操作,或者通過(guò)比較τ值及其當(dāng)前心跳到達(dá)時(shí)間來(lái)確定進(jìn)程的懷疑水平 (如圖2所示)。

    當(dāng)消息丟失時(shí),我們無(wú)法計(jì)算發(fā)送方到接收方的通信時(shí)延(如圖2第2種情況)。為了確保本文算法的有效性,并且考慮到消息丟失的影響,我們使用時(shí)間序列理論來(lái)填補(bǔ)這一空缺。填補(bǔ)的具體方法是通過(guò)計(jì)算di= (Δt ·)+di-1,且表示被觀測(cè)的相鄰空缺的平均數(shù)量。

    算法1給出了SFD 部署的詳細(xì)內(nèi)容。算法中,我們首先設(shè)置部分初始參數(shù),包括初始安全范圍SM1。此后,SFD 可以獲得反饋信息 (第2步):如果SM1為可以保證SFD滿足服務(wù)質(zhì)量輸出要求的合適參數(shù),則反饋信息為0,SFD 達(dá)到穩(wěn)態(tài)。這意味著當(dāng)前參數(shù)與網(wǎng)絡(luò)系統(tǒng)相匹配。如果SM1無(wú)法保證SFD 滿足服務(wù)質(zhì)量輸出要求且服務(wù)質(zhì)量輸出與控制規(guī)則相匹配,則根據(jù)服務(wù)質(zhì)量輸出的具體狀態(tài)確定反饋信息為±β。如果SM1無(wú)法保證SFD 滿足服務(wù)質(zhì)量輸出要求且服務(wù)質(zhì)量輸出與控制規(guī)則不匹配,SFD 對(duì)該錯(cuò)誤做出響應(yīng) (所有可能值均不適合SM1)。最終,如果SFD 沒(méi)有顯示 “做出響應(yīng)”,則SFD 調(diào)整SM 參數(shù),直到其滿足服務(wù)質(zhì)量的預(yù)期輸出為止。

    算法1:參數(shù)調(diào)整算法

    (1)開(kāi)始

    (2)初始化:

    (4)MR :設(shè)置差錯(cuò)率;

    (6)設(shè)置安全范圍初始值SM1;

    (7)設(shè)置常值參數(shù)α,β;

    (8)第1步:獲得相關(guān)數(shù)據(jù)

    (9)獲得服務(wù)質(zhì)量輸出 (TD,MR,QAP )。

    (10)第2步:獲得反饋信息

    (11)如 果TD>,MR <,QAP >:Satk{Qo S}=β;

    (12)如 果TD<,MR <,QAP >:Satk{Qo S};

    (13)如 果TD<,MR >,QAP <:Satk{Qo S};

    (14)否則 (例如,如果TD>TD,MR >MR):“做出響應(yīng)”(該SFD 無(wú)法達(dá)到要求的服務(wù)質(zhì)量),SFD 終止 (跳到第18行)。

    (15)第3步:調(diào)整參數(shù)

    (16)將Satk{Qo S}發(fā)送給SFD;

    (17)根 據(jù)Satk{Qo S}調(diào) 整SFD 相關(guān)參數(shù);

    (18)結(jié)束

    文獻(xiàn) [9]的Chen FD 為了滿足服務(wù)質(zhì)量的預(yù)期要求,必須要確定合理的初始安全范圍參數(shù)值 (因?yàn)樗鼰o(wú)法實(shí)現(xiàn)參數(shù)的自動(dòng)調(diào)整);否則,服務(wù)質(zhì)量輸出便無(wú)法滿足要求 (用戶要求)。文獻(xiàn) [11]的FD 及文獻(xiàn) [10,12]的Bertier FD 也存在同樣的問(wèn)題。這些問(wèn)題均在本文SFD 中得以解決。

    4 性能評(píng)估

    為了證明本文通用型非人工分析方法的有效性,我們基于普通的實(shí)驗(yàn)環(huán)境,對(duì)SFD、FD[11]、Chen FD[9]、Bertier FD[10,12]進(jìn)行了分析、比較和評(píng)估。實(shí)驗(yàn)環(huán)境均為通用型云計(jì)算網(wǎng)絡(luò)典型環(huán)境,包括7 種WAN 案例,所有案例均是真實(shí)數(shù)據(jù),其中一種從日本和瑞士獲得,其他來(lái)自PlanetLab (如圖1所示)。

    本文實(shí)驗(yàn)基于圖2 中的模型。一個(gè)進(jìn)程 (p)周期性地發(fā)送心跳消息給另一個(gè)進(jìn)程 (q),發(fā)送行為持續(xù)隨機(jī)時(shí)間長(zhǎng)度,另一個(gè)進(jìn)程q從進(jìn)程p 接收消息。每次實(shí)驗(yàn)中,心跳發(fā)送和到達(dá)時(shí)間記入監(jiān)控計(jì)算機(jī)q 的日志文件。使用記錄的到達(dá)時(shí)間來(lái)重現(xiàn)每個(gè)故障檢測(cè)器算法的運(yùn)行情況。這意味著,所有的故障檢測(cè)器都在相同的實(shí)驗(yàn)條件下加以比較:同樣的網(wǎng)絡(luò)模型,同樣的心跳流量,同樣的網(wǎng)絡(luò)參數(shù) (發(fā)送間隔,滑動(dòng)窗口大小,通信時(shí)延,輸入,等等)。記錄的發(fā)送時(shí)間只作為統(tǒng)計(jì)數(shù)據(jù)使用。所有的心跳消息均使用UDP/IP 協(xié)議。低頻ping進(jìn)程與實(shí)驗(yàn)同步運(yùn)行,以獲得往返時(shí)間粗略估計(jì)并保證網(wǎng)絡(luò)的連通性。

    實(shí)驗(yàn)中的每個(gè)故障檢測(cè)器均使用滑動(dòng)窗口來(lái)保存過(guò)去的樣本,以計(jì)算下步估計(jì)。4 種故障檢測(cè)器的所有實(shí)驗(yàn)均使用相同且固定大小的滑動(dòng)窗口 (WS =1,000) 。因?yàn)榫W(wǎng)絡(luò)在預(yù)熱期間不夠穩(wěn)定,所以必須在滑動(dòng)窗口裝滿后再對(duì)采樣數(shù)據(jù)進(jìn)行分析。實(shí)驗(yàn)中以100ms每個(gè)心跳的目標(biāo)速度來(lái)生成心跳。

    主要參數(shù)如下:為了獲得最佳服務(wù)質(zhì)量且與其他算法做比較,我們?cè)O(shè)置SFD 的SM1=α;對(duì)Chen FD,參數(shù)設(shè)置同文獻(xiàn) [9]:α∈ [0 ,10000] ;對(duì)FD,參數(shù)設(shè)置同文獻(xiàn)[11]:Φ ∈ [0. 5,16] ;對(duì)Bertier FD,參 數(shù) 設(shè) 置 同 文 獻(xiàn)[10,12]:β=1,=4,γ=0.1。故障檢測(cè)器在每次實(shí)驗(yàn)中的其他基本參數(shù)設(shè)置相同。

    這些實(shí)驗(yàn)中,丟棄掉部分初始周期后,我們針對(duì)整個(gè)運(yùn)行情況測(cè)量了如下3 個(gè)服務(wù)質(zhì)量主要指標(biāo):TD,MR,QAP ?;趨?shù)的故障檢測(cè)器,其參數(shù)設(shè)置不同,檢測(cè)器行為也會(huì)完全不同,所以對(duì)這些檢測(cè)器進(jìn)行比較的難度很大。經(jīng)常犯的普遍錯(cuò)誤是對(duì)參數(shù)隨機(jī)賦值,然后根據(jù)它們的檢測(cè)時(shí)間及精度測(cè)量值對(duì)2種基于參數(shù)的故障檢測(cè)器進(jìn)行比較。這往往會(huì)得出一種檢測(cè)器檢測(cè)時(shí)間更短而另一種檢測(cè)器的檢測(cè)精度更高的錯(cuò)誤結(jié)論。

    相反,我們?cè)谶M(jìn)行FD 實(shí)驗(yàn)時(shí)使用了另外一種方法。該方法的主要思路基于如下問(wèn)題:給定一組服務(wù)質(zhì)量要求,能否確定合適的故障檢測(cè)器參數(shù)使其滿足這些要求?為回答這一問(wèn)題,我們考慮以檢測(cè)時(shí)間和準(zhǔn)確度指標(biāo) (或MR,QAP )為軸的服務(wù)質(zhì)量空間。然后,我們從行為高度激進(jìn)轉(zhuǎn)變?yōu)樾袨榉浅1J?(即TD越來(lái)越大,此時(shí)圖中的每個(gè)點(diǎn)都對(duì)應(yīng)于該檢測(cè)器的一個(gè)參數(shù)。當(dāng)我們依次選擇參數(shù)時(shí),比如從小值逐步變?yōu)榇笾担憧梢缘玫皆S多點(diǎn),并可用一條連續(xù)的曲線對(duì)這些點(diǎn)進(jìn)行擬合),改變檢測(cè)器的參數(shù),進(jìn)而測(cè)量檢測(cè)器的覆蓋面積。故障檢測(cè)器覆蓋的面積便是可能與該故障檢測(cè)器相匹配的一組服務(wù)質(zhì)量要求相對(duì)應(yīng)的面積。每次實(shí)驗(yàn)中,不同的輸出值 (MR,QAP,TD)根據(jù)以下參數(shù)獲得:對(duì)SFD,給定初始安全范圍SM1列表,包括α,β在內(nèi)的其他參數(shù)未被列出,因?yàn)樗鼈冎粫?huì)影響參數(shù)自適應(yīng)調(diào)整的速率;對(duì)Chen FD,給定初始安全范圍列表;對(duì)FD,給定閾值參數(shù)Φ 列表。我們發(fā)現(xiàn),當(dāng)參數(shù)依次連續(xù)變化時(shí) (例如,從小到大),圖形也會(huì)不斷發(fā)展,我們可以獲得足夠多的點(diǎn)在該曲線圖上擬合。

    4.1 WAN 實(shí)驗(yàn)

    本實(shí)驗(yàn)包括兩臺(tái)計(jì)算機(jī):一臺(tái)在瑞士聯(lián)邦理工學(xué)院洛桑分校 (EPFL),另一臺(tái)在日本的JAIST。兩臺(tái)計(jì)算機(jī)通過(guò)正常的洲際互聯(lián)網(wǎng)連接通信。實(shí)驗(yàn)中使用的跟蹤文件與FD[11]完全相同,這也為共同評(píng)估SFD、Chen FD、Bertier FD 和FD 性能打下了基礎(chǔ)。

    (1)實(shí)驗(yàn)設(shè)置:硬件/軟件/網(wǎng)絡(luò):詳細(xì)來(lái)講,基于以下實(shí)驗(yàn)設(shè)置獲得跟蹤文件及相關(guān)數(shù)據(jù)。

    心跳采樣:一周之內(nèi)結(jié)束實(shí)驗(yàn) (從4 月3 日2:56 UTC開(kāi)始,到4月10日3:01UTC結(jié)束)。實(shí)驗(yàn)期間真實(shí)測(cè)得的發(fā)送速率為每103.501 ms 一次心跳 (標(biāo)準(zhǔn)差:0.189 ms;最小值:101.674 ms;最大值:234.341 ms)。此外,總共發(fā)送5,845,713條心跳信息,被接收5,822,521條,消息丟失率約為0.399%。詳細(xì)檢測(cè)跟蹤文件后,發(fā)現(xiàn)消息丟失主要原因是814個(gè)脈沖串。大部分脈沖串持續(xù)時(shí)間較短,最長(zhǎng)脈沖串為1093個(gè)心跳 (只有1 個(gè)),持續(xù)約2分鐘。另外,大部分心跳不是直接從亞洲發(fā)往歐洲,而是經(jīng)由美國(guó)發(fā)往。

    往返時(shí)間:往返時(shí)間平均值為283.338ms,標(biāo)準(zhǔn)差27.342 ms,最小值270.201ms,最大值717.832ms。通過(guò)分析跟蹤文件,我們確定了發(fā)送主機(jī)和接收主機(jī)的CPU 平均負(fù)載率分別為1/67和1/22,因此它們低于計(jì)算機(jī)的總?cè)萘俊?/p>

    (2)實(shí)驗(yàn)結(jié)果:TD,MR,QAP 的實(shí)驗(yàn)結(jié)果見(jiàn)圖6、圖7。圖6給出了各檢測(cè)器的MR 比較結(jié)果,其中縱坐標(biāo)為對(duì)數(shù)標(biāo)度。最優(yōu)值位于左下角,意味著該檢測(cè)器的檢測(cè)時(shí)間更短、差錯(cuò)率更低。圖7給出了檢測(cè)器的QAP 比較結(jié)果,縱坐標(biāo)為線性標(biāo)度。最優(yōu)值位于左上角,意味著該檢測(cè)器的檢測(cè)時(shí)間更短、QAP 更高。

    圖6 WAN 的差錯(cuò)率VS檢測(cè)時(shí)間

    圖7 WAN 的查詢精度概率VS檢測(cè)時(shí)間

    圖6中,當(dāng)TD<0.3s時(shí),Chen FD 和FD 的MR 和TD類似。當(dāng)0.3s<TD<0.9s時(shí),SFD 和Chen FD 的結(jié)果類似,略優(yōu)于FD。當(dāng)TD>0.9s時(shí),Chen FD 的TD相同,但MR 最低。對(duì)SFD,在過(guò)于激進(jìn) (TD<0.3s) 和過(guò)于保守的區(qū)域 (TD>0.9s) 均沒(méi)有數(shù)據(jù)存在,原因是SFD 可以自動(dòng)調(diào)整參數(shù)。

    開(kāi)始時(shí),初始安全范圍SM1的值很小,于是本SFD 的服務(wù)質(zhì) 量輸出的檢 測(cè)時(shí)間較短TD(TD<)、差 錯(cuò) 率MR (MR >)較大。這表明,服務(wù)質(zhì)量輸出沒(méi)有滿足QoS 要求,我們可以采取多種步驟來(lái)增加SM ,以降低MR。于是,本文算法對(duì)后續(xù)多個(gè)新點(diǎn)τ增加了SM 值,以降低服務(wù)質(zhì)量輸出的MR 。最終,我們滿足了該應(yīng)用場(chǎng)合要求的。

    下一SM1值略大于上次值 (本文SFD 實(shí)驗(yàn)中,SM1從可能值列表中逐漸增加)。開(kāi)始時(shí),SFD 的MR 值低于上次值 (SM1值較小),但仍大于MR 。于是,本文算法多次增加SM ,以逐漸降低輸出質(zhì)量的MR 值,并最終使服務(wù)質(zhì)量輸出滿足要求。所以,對(duì)于服務(wù)質(zhì)量整體輸出,SM1越大,則TD越大,MR 越小,QAP 越大。但這也不是絕對(duì)的,因?yàn)镾FD 可以自動(dòng)調(diào)整SM ,以滿足要求。

    有趣的是,本W(wǎng)AN 環(huán)境中存在一些脈沖串。因此對(duì)每個(gè)SM1值,SFD 的服務(wù)質(zhì)量輸出經(jīng)調(diào)整滿足要求后,由于存在脈沖串,SFD 的服務(wù)質(zhì)量輸出存在一些波動(dòng)。

    對(duì)本文SFDTD>0.9s時(shí)的SM1值,本文算法可以降低下一新點(diǎn)τ的SM 值,雖然輕微增加了MR ,但可逐漸降低TD。如果SFD 的第1個(gè)輸出TD大于0.9s(因?yàn)镾M1非常大),我們可以通過(guò)更多的步驟來(lái)降低SM 和TD,最終實(shí)現(xiàn)TD<TD。此時(shí),就整體性能而言,輸出MR 變大,TD變小??梢缘贸?,對(duì)TD>0.9s時(shí)的SM1值,當(dāng)SFD的SM1增加時(shí),TD變大,MR 變小。因?yàn)樯崛胝`差使圖形無(wú)法演變?yōu)榉浅1J氐那闆r,所以FD的圖形終止時(shí)間很早(2.43s)。Bertier FD 沒(méi)有動(dòng)態(tài)參數(shù),所以只有一個(gè)點(diǎn)。其他實(shí)驗(yàn)環(huán)境下的狀態(tài)相同。圖7結(jié)果與圖6類似。

    4.2 全面的PlanetLab WAN 實(shí)驗(yàn)

    我們已經(jīng)在大量實(shí)驗(yàn)中分析了SFD 檢測(cè)器的部署行為。這里我們重點(diǎn)討論相關(guān)性最強(qiáng)的WAN 環(huán)境,以進(jìn)行全面的實(shí)驗(yàn)分析。本文實(shí)驗(yàn)的主要目的是觀察SFD 為與QoS 實(shí)現(xiàn)匹配進(jìn)行自我調(diào)節(jié)的性能狀況。此時(shí),我們將其與Chen-FD、Bertier-FD、-FD進(jìn)行比較。我們首先描述各種WAN 環(huán)境,然后基于適當(dāng)?shù)姆椒▽?duì)SFD 與當(dāng)前其他檢測(cè)器做比較,最后對(duì)獲得的相關(guān)結(jié)果展開(kāi)討論。

    (1)實(shí)驗(yàn)設(shè)置:下面描述實(shí)驗(yàn)環(huán)境,相應(yīng)的統(tǒng)計(jì)數(shù)據(jù)見(jiàn)表1和表2。這里基于PlanetLab (http://www.planetlab.org/)做了6種典型的WAN 實(shí)驗(yàn),使用的結(jié)點(diǎn)位于美國(guó)、歐洲 (德國(guó))、日本、中國(guó) (香港)。每個(gè)地點(diǎn)與其他3個(gè)地點(diǎn)進(jìn)行通信 (如圖8和表1、表2所示)。地點(diǎn)和主機(jī)名總結(jié)于表1。設(shè)置每個(gè)WAN 實(shí)驗(yàn)持續(xù)約24小時(shí),目標(biāo)心跳間隔設(shè)為10ms。

    圖8 PlanetLab廣域網(wǎng)主機(jī)

    表1 WAN 實(shí)驗(yàn)概覽

    表2 實(shí)驗(yàn)概覽:統(tǒng)計(jì)數(shù)據(jù)

    實(shí)驗(yàn)1 (WAN-1):地點(diǎn)從美國(guó)斯坦福大學(xué)至日本奈良科技研究所,時(shí)間從2013 年3 月12 日開(kāi)始。心跳有效間隔為12.825ms,總共發(fā)送了6,737,054個(gè)心跳。心跳平均到達(dá)時(shí)間為12.83 ms (時(shí)針漂移比較輕微),標(biāo)準(zhǔn)差14.892ms,平均往返時(shí)間為193.909ms。

    實(shí)驗(yàn)2 (WAN-2):地點(diǎn)從德國(guó)至美國(guó),時(shí)間從2013年3月8日開(kāi)始。總共發(fā)送了7,477,304 個(gè)心跳,丟失率為5%。

    實(shí)驗(yàn)3 (WAN-3):地點(diǎn)從日本至德國(guó),從2013 年3月6 日開(kāi)始??偣舶l(fā)送了7,104,446 個(gè)心跳,丟失率為2%。

    實(shí)驗(yàn)4 (WAN-4):地點(diǎn)從香港 (中國(guó))至美國(guó),時(shí)間從2013年3月10 日開(kāi)始。總共發(fā)送了7,028,178 個(gè)心跳,丟失率為0%。

    實(shí)驗(yàn)5 (WAN-5):地點(diǎn)從香港 (中國(guó))至德國(guó),時(shí)間從2013年3月11 日開(kāi)始。總共發(fā)送了7,008,170 個(gè)心跳,丟失率為4%。

    實(shí)驗(yàn)6 (WAN-6):地點(diǎn)從香港科技大學(xué)至日本慶應(yīng)義塾大學(xué)湘南藤澤校區(qū)Mural實(shí)驗(yàn)室??偣舶l(fā)送了7,040,560個(gè)心跳,丟失率為0%。

    最后需要指出的是,ping進(jìn)程與實(shí)驗(yàn)同步運(yùn)行,以獲得ping命令日志文件。這些文件證明了實(shí)驗(yàn)期間,網(wǎng)絡(luò)連通性始終良好。

    (2)實(shí)驗(yàn)結(jié)果與討論。各檢測(cè)器在不同實(shí)驗(yàn)設(shè)置下的觀測(cè)結(jié)果類似。PlanetLab中WAN-2 至WAN-6 的實(shí)驗(yàn)結(jié)果與WAN-1類似。由于篇幅所限,我們?cè)趫D9和圖10中給出WAN-1的實(shí)驗(yàn)結(jié)果。

    圖9 WAN1:MR VS TD

    我們從美國(guó)至日本W(wǎng)AN-1實(shí)驗(yàn)中獲得實(shí)驗(yàn)結(jié)果 (如圖9、圖10所示)。Bertier FD 沒(méi)有動(dòng)態(tài)參數(shù),所以它為只有一個(gè)點(diǎn)的激進(jìn)型故障檢測(cè)器。Chen FD 為保守型檢測(cè)器,最終MR 值為0。對(duì)FD,舍入誤差的存在使得我們無(wú)法計(jì)算保守范圍內(nèi)的點(diǎn),F(xiàn)D 的曲線終止時(shí)TD為1.58s,MR 為0.002,QAP 為99.8%。3種方案的起始點(diǎn)類似,但沒(méi)有一個(gè)方案可以根據(jù)網(wǎng)絡(luò)動(dòng)態(tài)變化來(lái)自動(dòng)調(diào)節(jié)參數(shù)。很顯然,這一問(wèn)題在SFD 中得到解決。

    圖10 WAN1:QAP VS TD

    SFD 曲線持續(xù)時(shí)間為0.10s至0.87s。它的起始點(diǎn)為T(mén)D0.10s,MR0.31,QAP99.5%。SFD 曲線逐漸變化后的點(diǎn)為T(mén)D0.87s,MR0.00041,QAP99.8%,參數(shù)SM1有所上升。此后,當(dāng)初始安全范圍再次上升時(shí),Chen FD 服務(wù)質(zhì)量輸出的TD變長(zhǎng),而SFD 沒(méi)有。SFD 發(fā)現(xiàn)該輸出的TD大于要求水平后,自動(dòng)調(diào)整其他參數(shù) (設(shè)置Satk{Qo S}=-β以降 低SM ),降 低TD,但 這 同 時(shí)也導(dǎo)致MR 有所上升。在此調(diào)整期間,SFD 不斷地調(diào)整參數(shù)Satk{Qo S,QoS }=-β,以 逐漸降低輸出的TD值。最后,輸出TD實(shí)現(xiàn)TD<,輸出MR 和QAP 也達(dá)到預(yù)期水 平 (MR <MR ,QAP >QAP )。SM1上升后,SFD 圖逐漸演變后的點(diǎn)為T(mén)D0.10s,MR0.31,QAP99.5%,與初始點(diǎn)非常接近。

    SFD 對(duì)FD、Bertier FD、Chen FD 的優(yōu)化非常大:雖然SFD 的性能有時(shí)低于其他檢測(cè)器 (例如,當(dāng)DT低于0.2 s時(shí),F(xiàn)D 的MR 要低于SFD),但是只有SFD 可以根據(jù)自動(dòng)調(diào)整參數(shù)。具體地,當(dāng)初始安全范圍SM1上升時(shí),SFD 始 終 可 以 自 動(dòng) 調(diào) 整Satk{Qo S},確 定 合 適 的SM ,以便根據(jù)用戶需求獲得滿意的服務(wù)質(zhì)量輸出。相反,其他方案的服務(wù)質(zhì)量輸出缺乏針對(duì)性:部分檢測(cè)器只是暫時(shí)地與要求相匹配,部分檢測(cè)器與要求始終不匹配,以致工程人員必須要手工調(diào)整相關(guān)參數(shù)。這些方案必須要嘗試參數(shù)所有可能取值,獲得性能輸出曲線,才能知道哪些參數(shù)取值適合網(wǎng)絡(luò)條件 (手工方式選擇相關(guān)參數(shù))。如果網(wǎng)絡(luò)發(fā)生重大變化,工程人員必須要再次手工調(diào)整相關(guān)參數(shù)。總體來(lái)說(shuō),SFD 可以自我調(diào)整,可廣泛應(yīng)用于工商業(yè)云計(jì)算環(huán)境。

    參數(shù)設(shè)置不同,結(jié)果也會(huì)不同,所以參數(shù)設(shè)置對(duì)所有檢測(cè)器來(lái)說(shuō)都具有重要作用。對(duì)定量分析,當(dāng)參數(shù)以固定次序連續(xù)變化時(shí) (比如從較小值變?yōu)檩^大值),大部分情況下的圖形也會(huì)連續(xù)單調(diào)變化 (異常情況的可能原因是部分突發(fā)數(shù)據(jù)和陳舊數(shù)據(jù)影響了服務(wù)質(zhì)量輸出)。各個(gè)參數(shù)是獨(dú)立的,所以參數(shù)變化和結(jié)果變化間沒(méi)有定量關(guān)系。

    綜上所述,我們基于多個(gè)WAN 環(huán)境評(píng)估了SFD 性能(如圖8所示)。實(shí)驗(yàn)結(jié)果已經(jīng)表明,相比當(dāng)前其他最新故障檢測(cè)器,SFD 可以自動(dòng)調(diào)整參數(shù),在一般網(wǎng)絡(luò)環(huán)境下性能優(yōu)異。

    4.3 4種檢測(cè)器的比較性分析

    以上實(shí)驗(yàn)已經(jīng)覆蓋了當(dāng)前所能發(fā)現(xiàn)的大多數(shù)典型應(yīng)用環(huán)境?;谝陨蠈?shí)驗(yàn),我們得出以下結(jié)論:

    自適應(yīng)特性:實(shí)驗(yàn)結(jié)果表明,在自適應(yīng)能力方面,SFD 優(yōu)于其他當(dāng)前檢測(cè)器 (FD,Bertier FD,Chen FD)。具體地,對(duì)云計(jì)算網(wǎng)絡(luò),當(dāng)初始安全范圍SM1上升時(shí),SFD 總 是 可 以 自 動(dòng) 調(diào) 整Satk{Qo S},確 定 合 適 的SM ,以根據(jù)用戶需求得到滿意的服務(wù)質(zhì)量輸出。相反,其他檢測(cè)器的服務(wù)質(zhì)量輸出缺乏針對(duì)性。如果網(wǎng)絡(luò)發(fā)生重大變化,工程人員必須再次手工調(diào)整參數(shù)。

    窗口大小的影響:我們將分析窗口大小對(duì)檢測(cè)器服務(wù)質(zhì)量的影響。對(duì)FD,窗口越大,性能越優(yōu)??赡茉蚴菤v史信息對(duì)FD 獲得較高的服務(wù)質(zhì)量具有重要作用。FD 基于正態(tài)分布函數(shù),所以窗口越大,歷史數(shù)據(jù)越多,計(jì)算出來(lái)的正態(tài)分布函數(shù)對(duì)相關(guān)網(wǎng)絡(luò)案例的適應(yīng)性更強(qiáng)。對(duì)Bertier FD,窗口大小對(duì)其服務(wù)質(zhì)量的影響基本可以忽略??赡茉蚴?,Bertier FD 沒(méi)有需要調(diào)整的參數(shù)。對(duì)Bertier FD 和SFD,窗口越小,性能越優(yōu)。當(dāng)窗口變大時(shí),Chen FD 和SFD 獲得的歷史數(shù)據(jù)更多,大量突發(fā)數(shù)據(jù)和陳舊數(shù)據(jù)可能會(huì)影響服務(wù)質(zhì)量的輸出,對(duì)性能的貢獻(xiàn)有限 (甚至?xí)绊懶阅埽?。窗口變小后,Chen FD 和SFD 對(duì)網(wǎng)絡(luò)的適應(yīng)時(shí)間變短??傮w來(lái)說(shuō),SFD 是具有實(shí)用價(jià)值的自適應(yīng)故障檢測(cè)器,可有效用于工商業(yè)領(lǐng)域,自動(dòng)滿足用戶服務(wù)質(zhì)量需求。此外,SFD的拓展性非常強(qiáng),即使窗口較小也可獲得優(yōu)異性能,節(jié)約了非常珍貴的存儲(chǔ)資源。所有證據(jù)均證明了本文通用型自適應(yīng)故障檢測(cè)器SFD 的有效性。

    5 結(jié)束語(yǔ)

    本文對(duì)實(shí)際中的自動(dòng)容錯(cuò)云計(jì)算網(wǎng)絡(luò),就故障檢測(cè)器特性展開(kāi)研究,提出了一種可以滿足用戶需求的通用型相關(guān)參數(shù)非人工自適應(yīng)調(diào)整算法。以該通用型自動(dòng)算法為基礎(chǔ),我們又提出了一種具體的動(dòng)態(tài)自適應(yīng)故障檢測(cè)器SFD,可看成是當(dāng)前算法的一個(gè)重大突破。基于實(shí)際而又廣泛的仿真實(shí)驗(yàn),比較了SFD 相對(duì)其他當(dāng)前檢測(cè)器的服務(wù)性能質(zhì)量。實(shí)驗(yàn)結(jié)果表明,本文算法可以自動(dòng)調(diào)整SFD 控制參數(shù),獲得相應(yīng)的服務(wù)水平,滿足用戶需求。性能表現(xiàn)良好。該SFD 算法可以廣泛應(yīng)用于工商業(yè)領(lǐng)域,并可為云計(jì)算網(wǎng)絡(luò)帶來(lái)巨大效益。本文SFD 基于并行理論還可應(yīng)用于 “單監(jiān)視器”(one monitors multiple)和 “多監(jiān)視器”(multiple monitor multiple)領(lǐng)域。我們下一步工作的重點(diǎn)是研究?jī)?nèi)容云計(jì)算系統(tǒng)中基于最小化延遲的數(shù)據(jù)傳輸方案。

    [1]DENG Wei,LIU Fangming,JIN Hai.Leveraging renewable energy in cloud computing datacenters:state of the art and future research [J].Chinese Journal of Computers,2013,36(3):582-598 (in Chinese).[鄧維,劉方明,金海.云計(jì)算數(shù)據(jù)中心的新能源應(yīng)用:研究現(xiàn)狀與趨勢(shì) [J].計(jì)算機(jī)學(xué)報(bào),2013,36 (3):582-598.]

    [2]WANG Yijie,SUN Weidong,ZHOU Song.Key technologies of distributed storage for cloud computing [J].Journal of Software,2012,23 (4):962-986 (in Chinese). [王意潔,孫偉東,周松.云計(jì)算環(huán)境下的分布存儲(chǔ)關(guān)鍵技術(shù) [J].軟件學(xué)報(bào),2012,23 (4):962-986.]

    [3]LIN Guoyuan,HE Shan,HUANG Hao.Access control security model based on behavior in cloud computing environment[J].Journal on Communications,2012,23 (3):59-66 (in Chinese).[林果園,賀珊,黃皓.基于行為的云計(jì)算訪問(wèn)控制安全模型 [J].通信學(xué)報(bào),2012,33 (3):59-66.]

    [4]Silveira F,Diot C,Taft N,et al.ASTUTE:Detecting a different class of traffic anomalies[J].ACM SIGCOMM Computer Communication Review,2010,40 (4):267-278.

    [5]Stefanakos S.Reliable routings in networks with generalized link failure events [J].IEEE/ACM Transactions on Networking,2008,16 (6):1331-1339.

    [6]Takeuchi K,Tanaka T,Yano T.Asymptotic analysis of general multiuser detectors in MIMO DS-CDMA channels [J].IEEE Journal on Selected Areas in Communications,2008,26(3):486-496.

    [7]Park SH,Lee JY,Yu SC.Non-blocking atomic commitment algorithm in asynchronous distributed systems with unreliable failure detectors[C]//Tenth International Conference on Information Technology:New Generations.IEEE,2013:33-38.

    [8]Leonard D,Yao Z,Rai V,et al.On lifetime-based node failure and stochastic resilience of decentralized peer-to-peer networks[J].IEEE/ACM Transactions on Networking,2007,15 (3):644-656.

    [9]Chen W,Toueg S,Aguilera MK.On the quality of service of failure detectors [J].IEEE Transactions on Computers,2002,51 (5):561-580.

    [10]Bertier M,Marin O,Sens P.Implementation and performance evaluation of an adaptable failure detector[C]//Proceedings of the International Conference on Dependable Systems and Networks,2002:354-363.

    [11]Défago X,Urbán P,Hayashibara N,et al.Definition and specification of accrual failure detectors[C]//Proceedings International Conference on Dependable Systems and Networks.IEEE,2005:206-215.

    [12]Bertier M,Marin O,Sens P.Performance analysis of a hierarchical failure detector[C]//DSN,2003:635-644.

    [13]Jacobson V.Congestion avoidance and control [J].ACM SIGCOMM Computer Communication Review,1988,18(4):314-329.

    猜你喜歡
    檢測(cè)器進(jìn)程服務(wù)質(zhì)量
    債券市場(chǎng)對(duì)外開(kāi)放的進(jìn)程與展望
    論如何提升博物館人性化公共服務(wù)質(zhì)量
    收藏界(2019年2期)2019-10-12 08:26:42
    車(chē)道微波車(chē)輛檢測(cè)器的應(yīng)用
    一種霧霾檢測(cè)器的研究與設(shè)計(jì)
    傾聽(tīng)患者心聲 提高服務(wù)質(zhì)量
    堅(jiān)持履職盡責(zé) 提升服務(wù)質(zhì)量
    社會(huì)進(jìn)程中的新聞學(xué)探尋
    以創(chuàng)建青年文明號(hào)為抓手提升服務(wù)質(zhì)量
    一體化火焰檢測(cè)器常見(jiàn)故障分析
    河南科技(2014年22期)2014-02-27 14:18:12
    我國(guó)高等教育改革進(jìn)程與反思
    九江市| 漳浦县| 东乌| 邛崃市| 安多县| 隆子县| 新乡县| 凤台县| 英山县| 石棉县| 正定县| 砚山县| 莫力| 嘉义市| 扎鲁特旗| 蚌埠市| 绍兴县| 大冶市| 安陆市| 济源市| 望江县| 杭锦后旗| 广元市| 五华县| 沾化县| 龙游县| 财经| 正宁县| 思南县| 安化县| 嘉定区| 固原市| 米易县| 砀山县| 新建县| 江油市| 偏关县| 马山县| 邢台县| 成武县| 克拉玛依市|