付鈺++田野++劉立士++池云
DOI:10.16661/j.cnki.1672-3791.2017.22.004
摘 要:大量研究表明,計算機和通信系統(tǒng)都會出現(xiàn)重尾特性。Pareto分布是最具有代表性的重尾分布。許多服從Pareto分布的ON/OFF源疊加以后可以模擬以太網(wǎng)通信量,重尾分布可以用來反映以太網(wǎng)ON/OFF源的真實情況。該文在許多相關(guān)研究的基礎(chǔ)之上,進一步探討了關(guān)于Pareto分布的一些性質(zhì),根據(jù)ON/OFF源發(fā)包服從Pareto分布的特性,利用Matlab對自相似流量的產(chǎn)生進行了仿真。
關(guān)鍵詞:Pareto分布 自相似流 Matlab仿真
中圖分類號:TP391 文獻標識碼:A 文章編號:1672-3791(2017)08(a)-0004-02
互聯(lián)網(wǎng)業(yè)務(wù)流量具有長相關(guān)、突發(fā)性、自相似性、包長度和包地址分布不均勻性等主要特性。傳統(tǒng)網(wǎng)絡(luò)流量大部分使用自回歸模型、泊松過程來產(chǎn)生業(yè)務(wù)流量模型,在這些基礎(chǔ)上產(chǎn)生的網(wǎng)絡(luò)流量,通常在時間軸上只呈現(xiàn)出短相關(guān)特性,當時間尺度增大到一定的程度時,網(wǎng)絡(luò)業(yè)務(wù)流量呈現(xiàn)出穩(wěn)定趨勢,Pareto分布由于其良好的性質(zhì)受到了研究者的重視。另外,建立一種參數(shù)可調(diào)的具有自相似特性的業(yè)務(wù)模型來進行仿真研究是很有必要的,所以,該文采用了一種參數(shù)可調(diào)的模型利用Matlab對網(wǎng)絡(luò)流量的產(chǎn)生進行了仿真,對以后的研究具有一定的積極意義。
1 自相似過程
自相似過程是一種隨機過程,是指時間或空間特性的改變不影響其統(tǒng)計特性的改變。通常可以有以下幾種定義[1]:嚴格自相似過程、二階自相似過程、廣義的二階平穩(wěn)自相似過程和漸進二階自相似過程。自相似具有伸縮對稱性的特性,即線性或非線性變換下的不變性。對分形對象進行放縮或者剪切等操作時,只能改變其外部的表現(xiàn)形式,而表征自相似特性的參數(shù)即分形維度是不會發(fā)生任何改變的。自相似作為分形的基本特征,指的是復雜系統(tǒng)的整體與部分,一部分與其他部分之間在性質(zhì)上或者精細結(jié)構(gòu)上所具有的自相似性。
自相似過程主要有以下幾個特點[2]。
1.1 長相關(guān)性
對于自相似過程,其當前的時間序列與之前的時間序列值有著不可忽視的相關(guān)性,即該時間序列是具有長相關(guān)特性的。
1.2 聚集方差衰減緩慢
自相似過程的聚集過程方差衰減速度比m-1小,而對于短相關(guān)過程,其聚集過程的方差衰減速度與m-1相同。
1.3 赫斯特效應
對于長相關(guān)時間序列來說,其自相關(guān)性可以使用赫斯特指數(shù)來描述。赫斯特指數(shù)表示時間序列的平均、回歸或聚集的相關(guān)趨勢。若赫斯特指數(shù),則,表示在樣本中出現(xiàn)極端值的時間較長,也就是所謂的持續(xù)性。如果網(wǎng)絡(luò)流量的突發(fā)性可以用這種極端值的持續(xù)時間長短來表述,那么就可以用赫斯特指數(shù)來描述網(wǎng)絡(luò)流量的突發(fā)性強度。并且這種突發(fā)性不會因為聚集而被平滑掉。
1.4 冪指數(shù)特性的譜密度
將自相似過程放在頻域上考慮,因為其具有持續(xù)性,所以在低頻處的譜密度較大,在頻率為0的位置附近,其功率譜密度函數(shù)服從冪指數(shù)函數(shù)。
2 Pareto分布的定義與性質(zhì)
若隨機變量T 的密度函數(shù)為:
,(x≥y) (1)
那么將T 稱為是具有Pareto分布特性的隨機變量,記為。其中β代表形狀參數(shù)或叫做Pareto指數(shù),代表尺度性能參數(shù)或叫做門限參數(shù)。
Pareto分布的概率分布函數(shù)為[3]:
(2)
其中,α為分布的形狀參數(shù),β稱為分布的位置參數(shù)。當時α≤1,服從Pareto分布的隨機變量具有無限均值;當α≤2時,服從Pareto分布的隨機變量具有無限方差;當時,服從Pareto分布的隨機變量具有有限均值以及無窮方差。
Will linger等人的研究表明:許多服從Pareto分布的隨機變量疊加起來的結(jié)果就是自相似過程。
3 源包模型
在自相似業(yè)務(wù)流的物理模型中,使用最多的是流疊加法[4]。ON/OFF模型就是模擬大量用戶數(shù)據(jù)源的疊加來產(chǎn)生自相似業(yè)務(wù)流的過程。原理為:ON/OFF模型具有嚴格交替的ON周期和OFF周期,并且認為連續(xù)的ON周期和OFF周期獨立同分布,并且互不相關(guān)。當處于ON周期時,數(shù)據(jù)源以恒定的速率發(fā)送數(shù)據(jù)包;當處于OFF周期時,不發(fā)送任何數(shù)據(jù)包,那么鏈路實際傳輸?shù)臄?shù)據(jù)包總數(shù)就是M個獨立同分布的數(shù)據(jù)源相疊加而得到的。
4 仿真系統(tǒng)模型建立
該文利用Matlab對通過ON/OFF自相似業(yè)務(wù)流量模型產(chǎn)生的網(wǎng)絡(luò)流量進行了仿真。仿真模型框圖如圖1所示。Matlab編程思路如下:首先假設(shè)有Nn個信源,然后設(shè)置仿真實驗中涉及到的一些參數(shù),接下來是信源的發(fā)包過程,處于ON狀態(tài)發(fā)包,發(fā)包速率為R,發(fā)包持續(xù)時間服從Pareto分布,處于OFF狀態(tài)不發(fā)包,所以到達的數(shù)據(jù)包個數(shù)就為處于ON狀態(tài)的信源數(shù)與發(fā)包速率和每個信源發(fā)包持續(xù)時間之積。仿真參數(shù)設(shè)置如下:信源數(shù)Nn=500,平均包到達率λ為0.5,其指數(shù)分布參數(shù)μ=1/λ,Pareto分布函數(shù)的參數(shù)設(shè)置如下:X=0.2,K=1.5,σ=θ=1,發(fā)包速率R=10。到達的數(shù)據(jù)包個數(shù)仿真圖如圖2所示。
從圖2中可以看出,通過Pareto分布模擬出的網(wǎng)絡(luò)業(yè)務(wù)流量具有突發(fā)性,并且具有長相關(guān)特性,而傳統(tǒng)的泊松分布只呈現(xiàn)出短相關(guān)特性。其次,我們是通過設(shè)置參數(shù)來進行仿真的,所以我們可以通過改變參數(shù)來觀察網(wǎng)絡(luò)流量的變化。
5 結(jié)語
該文介紹了Pareto分布的性質(zhì)以及源包到達模型的建立過程,并采用了基于Pareto分布的ON/OFF源,通過Matlab仿真,模擬了網(wǎng)絡(luò)流量的生成過程。其次,該文是建立了一個參數(shù)可調(diào)的模型來進行仿真,可以通過改變參數(shù)來進行仿真實驗,對以后這方面的仿真研究具有一定的積極意義。
參考文獻
[1] 王曉婷,王憶文,李平.一種自相似網(wǎng)絡(luò)流量生成器的設(shè)計與實現(xiàn)[J].微電子學與計算機,2016(8):54-58.
[2] 褚立文, 陳俊亮.一個新的自相似業(yè)務(wù)流在線生成算法[J].北京郵電大學學報,1999,22(1):43-47.
[3] 程紅霞.自相似業(yè)務(wù)流的預測研究[D].電子科技大學,2006.
[4] 陳凱.自相似網(wǎng)絡(luò)流量仿真與性能分析[D].北京交通大學,2009.endprint