康萬杰,潘有順
(1.茅臺學院釀酒工程自動化系,貴州 仁懷 564500;2.華中科技大學 武漢光電國家研究中心,湖北 武漢 430070)
在互聯(lián)網(wǎng)技術逐漸深入發(fā)展的背景下,擁有更高數(shù)據(jù)傳輸能力的光纖網(wǎng)絡也成為與網(wǎng)絡環(huán)境相匹配的重要資源[1]。然而,高速度的數(shù)據(jù)傳輸相應地導致光纖網(wǎng)絡中數(shù)據(jù)的爆炸式增長,海量數(shù)據(jù)以及分門別類的數(shù)據(jù)類型使計算機處理能力發(fā)生了很大的變化。為提升計算機處理能力,云計算應運而生[2]。云計算為數(shù)據(jù)處理提供了一個新的解決思路,不必將所有需要數(shù)據(jù)資源全部下載到個人計算機硬盤中,可通過網(wǎng)絡云空間將數(shù)據(jù)置于虛擬環(huán)境中[3]。但這樣的環(huán)境也使得傳統(tǒng)數(shù)據(jù)調(diào)度方式不再具備優(yōu)勢?,F(xiàn)有的研究成果中主要通過各類算法處理海量數(shù)據(jù),并提供一個能夠?qū)⒋髷?shù)據(jù)壓縮計算的方法。
文獻[4]提出設計基于改進蟻群算法的自適應云資源調(diào)度模型。該模型借助CloudSim平臺對蟻群算法進行改進,通過改進蟻群算法對云資源進行有效地調(diào)度,并將負載均衡數(shù)據(jù)進行處理。該方法可有效提升云資源調(diào)度效率,但在調(diào)度過程中并未考慮調(diào)度順序,存在一定局限。文獻[5]提出一種基于數(shù)據(jù)挖掘的光纖通信網(wǎng)絡數(shù)據(jù)調(diào)度方法。該方法首先對需要調(diào)度的資源數(shù)據(jù)進行合理屬性劃分,根據(jù)鄰域區(qū)間半徑確定相似屬性云資源,借助高階統(tǒng)計量對調(diào)度數(shù)據(jù)進行預處理,在此基礎上,完成光纖網(wǎng)絡資源的調(diào)度。該方法提升了光纖網(wǎng)絡數(shù)據(jù)調(diào)度效率,但調(diào)度中未過多考慮其差異,導致調(diào)度的效果欠佳。
為此,本文設計云計算以及LLF算法研究光纖數(shù)據(jù)差異化調(diào)度策略。通過LLF算法下松弛度隊列順序的計算得到了眾多數(shù)據(jù)的排序方式,解決數(shù)據(jù)調(diào)度模型構建中存在的問題,并將其應用在云計算模式中,完成了光纖數(shù)據(jù)差異化的調(diào)度。
計算機中運算資源相對有限,不可能同時計算所有資源的隊列。因此,需要將這些運算隊列進行排序,使其能夠以一定的順序依次進行計算[6]。在進行排序中,應滿足以下條件:
(1)
式中,Pi表示調(diào)度的能量系數(shù)。當Pi大于1時,則該系統(tǒng)無法完成調(diào)度任務,只有當Pi小于等于1時,該系統(tǒng)才能安全調(diào)度,且調(diào)度系數(shù)越小,該系統(tǒng)調(diào)度方法越好;Ni表示系統(tǒng)內(nèi)的任務量;i表示所計算到的第i個任務;Di表示處理i個任務所需要的周期時間[7]。
此時得到松弛度的計算公式為:
(2)
式中,α表示每一項任務的松弛度;T0表示必須完成某一項任務所需要的時間;T1表示執(zhí)行完該項任務時相對于T0所剩余時間;T2表示系統(tǒng)在完成以往幾項任務時所需要的總時間[8]。在此過程中,若任務Ti的調(diào)度松弛度為0,則說明為達到Ti所應具備的任務周期,可以將任務Ti放在下一輪的任務列表中;若任務Ti的松弛度在0~1之間,則說明任務Ti應該在近幾輪內(nèi)排列在松弛度隊列中。Ti的松弛度越接近1,則該任務的隊列越緊密[9]。
在實時調(diào)度任務中,經(jīng)常會出現(xiàn)系統(tǒng)等待時間T1小于松弛度的情況,此時則需要進行任務的切換,使得CPU資源被重新調(diào)動。在等待隊列中,設lf0為第一個任務的松弛度,lfi為第i個任務的松弛度,lf1為最后一個任務的松弛度,則三者關系為:
(3)
在排列LLF算法下任務的松弛度隊列需要時刻注意將lf0排列在lf1之前,以確保松弛度較大的任務能夠率先完成。
云計算是大數(shù)據(jù)系統(tǒng)運行中重要方式,由于光纖網(wǎng)絡數(shù)據(jù)量日益增長,其數(shù)據(jù)庫內(nèi)數(shù)據(jù)特征存在顯著差異。為了提高云環(huán)境下光纖網(wǎng)絡數(shù)據(jù)的利用效率,本文制定最優(yōu)化數(shù)據(jù)資源,以提高其訪問和運算速度[10]。設數(shù)據(jù)庫中光纖網(wǎng)絡數(shù)據(jù)的中心節(jié)點為Fn,n表示有n個中心節(jié)點,數(shù)據(jù)庫資源服務器數(shù)量的計算公式為:
(4)
假設每一臺服務器的應用程序中能將云計算環(huán)境下差異性配置描述為:
β(ai)=θ(ai)+?(ai)
(5)
式中,β(ai)表示利用所有節(jié)點判斷出的數(shù)據(jù)特征值;θ(ai)表示在建立最優(yōu)調(diào)度路徑的過程中,分別表示為關鍵特征點的分量坐標;?(ai)表示一個已經(jīng)給定的全局參量,其取值區(qū)間為(0,1)。
通過以上公式能夠構建一個半徑為R的圓形區(qū)域作為光纖數(shù)據(jù)差異化調(diào)度中心,得到光纖數(shù)據(jù)調(diào)度模型為:
(6)
式中,T表示區(qū)域范圍選擇依據(jù);R表示圓形半徑;N1表示數(shù)據(jù)資源的屬性;β(ai)表示利用所有節(jié)點判斷出的數(shù)據(jù)特征值;β表示聚類時對于節(jié)點n的圓心半徑環(huán)形區(qū)域分度值[11-12]。
在調(diào)度光纖數(shù)據(jù)時,需要著重觀察各數(shù)據(jù)的松弛度,設總數(shù)據(jù)庫為Ma,單個節(jié)點a,則可以得到該節(jié)點的覆蓋率為:
(7)
式中,β(a)表示a節(jié)點在總數(shù)據(jù)庫中的節(jié)點覆蓋率;pa表示在總數(shù)據(jù)庫中能夠立即接收任務請求的個數(shù);qa表示總數(shù)據(jù)庫中的節(jié)點個數(shù)[13]。如果節(jié)點a與節(jié)點b擁有相同的數(shù)據(jù)備份,則此時節(jié)點資源利用率為:
(8)
式中,α(b)表示節(jié)點b的資源利用率;γ表示節(jié)點的比例因子;Qb表示該節(jié)點進行統(tǒng)計與運算時的CPU利用率。通過計算某個節(jié)點的資源利用率能夠得到整個數(shù)據(jù)庫塊的有效處理方法[14]。
在整個調(diào)度網(wǎng)絡模型中,各節(jié)點之間相互連接,最中心節(jié)點被稱為中心節(jié)點,最外面節(jié)點被稱為邊緣節(jié)點,中間連接邊緣節(jié)點與中心節(jié)點的被稱為路徑節(jié)點[15-16]。路徑節(jié)點是數(shù)據(jù)傳輸與計算的主要路徑,如圖1所示。在將若干隊列統(tǒng)一信號處理之后,能夠從整體上協(xié)調(diào)各模塊關鍵數(shù)據(jù),但是在路徑節(jié)點中通常需要很長緩存時間,因此需要控制路徑節(jié)點中各隊列的排隊時間,如圖2所示。
圖1 路徑節(jié)點計算流程Fig.1 Path node calculation process
圖2 LLF算法下信令機制Fig.2 The signaling mechanism under the LLF algorithm
綜上所述,得到LLF算法下網(wǎng)絡閑置信令的沖突節(jié)點,并通過該算法繞過迂回時延特性,降低路徑節(jié)點中隊列排序降低的運算速率,提高光纖數(shù)據(jù)差異化調(diào)度策略的性能。
為驗證所提方法的優(yōu)勢,進行實驗分析。實驗中構建20個數(shù)據(jù)節(jié)點,其中4個為邊緣節(jié)點,4個為核心節(jié)點,設置相同數(shù)據(jù)庫,所有實驗過程中需要的數(shù)據(jù)均從數(shù)據(jù)庫中調(diào)動。在每一組實驗中設置相同大小的數(shù)據(jù)包,計算數(shù)據(jù)調(diào)動速度、數(shù)據(jù)計算速度以及總響應時間,檢驗本文算法得到的光纖數(shù)據(jù)差異化調(diào)度策略是否在響應速度上優(yōu)于現(xiàn)有調(diào)度策略。
實驗中計算機2臺,其中一臺為建立云數(shù)據(jù)庫的云端機,另一臺負責編寫LLF調(diào)度算法,并進行光纖數(shù)據(jù)的差異化調(diào)度任務,此外還需要磁盤陣列一臺以及不間斷電源一臺。計算機使用Windows7系統(tǒng),實驗的模擬環(huán)境為CloudSim平臺,通過MapReduce框架計算光纖數(shù)據(jù)的調(diào)度優(yōu)化策略,并在計算機中建立數(shù)據(jù)分割模型,保證該調(diào)度模型能夠更好地完成對數(shù)據(jù)庫中數(shù)據(jù)的調(diào)度,降低調(diào)度能耗,使算法能夠更好地完成調(diào)度任務。
比較四種不同算法在云環(huán)境下性能,分別對其進行五折交叉驗證與十折交叉驗證,即將云數(shù)據(jù)庫中的數(shù)據(jù)平均分為五份或十份,將其中四份或九份作為訓練組,另外一份作為實驗組,分別測試該算法的運行時間。測試結果分別如表1、表2所示。
表1 五折交叉驗證時四組算法運行時間/sTab.1 Running time of four algorithms in 50 % cross validation unit:s
表2 十折交叉驗證時四組算法運行時間/sTab.2 Running time of four groups of algorithms in 10 % cross validation unit:s
根據(jù)表1、表2中測試結果可知,在五折交叉驗證與十折交叉驗證下,這些數(shù)據(jù)集分別為不同運算結果,且在相同數(shù)據(jù)集中每一個實驗組運算結果不相同。但是任意一個數(shù)據(jù)集中實驗組運行時間最短,平均約小于其他三組1.914~2.47 s。由此可見,所提方法進行資源差異化調(diào)度時效率較高。
為了保證基于云計算LLF算法在光纖數(shù)據(jù)差異化調(diào)度中的應用與適應能力,實驗環(huán)境中測試其數(shù)據(jù)調(diào)動速度和數(shù)據(jù)計算速度,并結合二者計算總響應時間。將現(xiàn)有三種算法策劃的調(diào)度策略與文中的調(diào)度策略相對比,得到四組不同的響應結果,如圖3所示。
圖3 光纖數(shù)據(jù)差異化調(diào)度時間測試Fig.3 Test of optical fiber data differential scheduling time
根據(jù)圖3中測試結果可以看出,隨著運算的數(shù)據(jù)量逐漸增長,所需要數(shù)據(jù)計算時間以及數(shù)據(jù)調(diào)動時間都在相應增加。實驗組中數(shù)據(jù)平均計算時間約為26.3 s,而三個對照組中的數(shù)據(jù)平均計算時間約為32.1 s、27.4 s、32.5 s。在數(shù)據(jù)調(diào)動時間計算中,實驗組約為18.6 s,三個對照組約為31.2 s、29.8 s、28.4 s。由此可見,無論是數(shù)據(jù)計算時間還是數(shù)據(jù)調(diào)動時間,實驗組速度均大于三個對照組,驗證了所提方法的有效性。
本文提出基于云計算與LLF調(diào)度算法對光纖數(shù)據(jù)的差異化調(diào)度策略,通過計算LLF算法下松弛度隊列順序,設計網(wǎng)絡調(diào)度模型,與傳統(tǒng)方法相比本文方法具有一定優(yōu)勢。