王大東,張 菁,代勝男,王洪君
(吉林師范大學(xué) 計(jì)算機(jī)學(xué)院,吉林 四平 136000)
流媒體是采用流式傳輸方式在網(wǎng)絡(luò)上播放的媒體格式,把音頻、視頻等多媒體文件經(jīng)過特殊的壓縮方式分成一個(gè)個(gè)壓縮包,由服務(wù)器向用戶計(jì)算機(jī)實(shí)時(shí)、連續(xù)發(fā)送.在傳輸中,用戶不必等到整個(gè)文件全部下載完畢后才能看到內(nèi)容,只需經(jīng)過幾秒鐘或幾十秒的啟動(dòng)延時(shí),即可在用戶計(jì)算機(jī)上利用相應(yīng)的播放器對(duì)壓縮視頻或音頻等流式媒體文件進(jìn)行解壓、播放,剩余的部分將在后臺(tái)繼續(xù)進(jìn)行下載、緩存,直至播放完畢.
傳統(tǒng)流媒體采用客戶/服務(wù)器(C/S)模式,用戶只能從流媒體服務(wù)器上下載資源.隨著互聯(lián)網(wǎng)的發(fā)展,流媒體業(yè)務(wù)越來越多,服務(wù)器承載的負(fù)荷變得越來越大.傳統(tǒng)的傳輸形式存在明顯不足,比如流媒體服務(wù)器帶寬占用大、流媒體用戶等待時(shí)間過長(zhǎng)等,導(dǎo)致系統(tǒng)瓶頸.為了提供足夠的帶寬資源,采用客戶/服務(wù)器模式的流媒體服務(wù)網(wǎng)站如優(yōu)酷網(wǎng)采用內(nèi)容分發(fā)網(wǎng)絡(luò)形式,在不同地理位置分布眾多的流媒體服務(wù)器,根據(jù)用戶位置不同,選擇相應(yīng)的流媒體服務(wù)器獲取資源.流媒體應(yīng)用對(duì)等網(wǎng)(P2P)技術(shù)之后,使每個(gè)流媒體用戶成為網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),用戶根據(jù)自身的網(wǎng)絡(luò)狀態(tài),直接與其他節(jié)點(diǎn)交換數(shù)據(jù),建立連接來分享對(duì)方硬盤上的文件,用戶不再是單一的從服務(wù)器上得到自己需要的資源,而是從網(wǎng)絡(luò)中具有相應(yīng)資源的對(duì)等體中下載所要的資源,降低了流媒體服務(wù)器的壓力.
本文利用Opnet和sniffer分析C/S模式和P2P模式下流媒體應(yīng)用的流量特征,選擇了三種P2P流媒體應(yīng)用:PPStream、暴風(fēng)影音和迅雷看看,兩種C/S模式應(yīng)用:土豆網(wǎng)(Web工作方式)和優(yōu)酷網(wǎng).在兩個(gè)不同時(shí)間段對(duì)同類節(jié)目進(jìn)行取樣分析,并對(duì)流媒體用戶各種參數(shù)值統(tǒng)計(jì),例如收發(fā)流量大小、收發(fā)分組數(shù)量、收發(fā)分組大小分布、收發(fā)流量比重等.
流量捕獲與數(shù)據(jù)篩選.以PPStream為例說明本文采集數(shù)據(jù)方法.在任務(wù)管理器中將PPStream之外的所有應(yīng)用程序關(guān)閉,盡可能減少其他應(yīng)用數(shù)據(jù)包的干擾.分別在時(shí)段1(13:00-14:00)和時(shí)段2(23:00-24:00)利用sniffer對(duì)PPStream應(yīng)用進(jìn)行數(shù)據(jù)捕獲并保存數(shù)據(jù).
圖1 sniffer捕獲的數(shù)據(jù)
利用sniffer提取每個(gè)數(shù)據(jù)分組時(shí)間、源IP、目的IP、協(xié)議類型、分組大小、源端口、目的端口數(shù)據(jù).在13:42:16.187-13:46:28.562時(shí)段內(nèi)共捕獲了58869個(gè)數(shù)據(jù)包,但這些并不完全是PPStream產(chǎn)生的,使用如下方法,排除網(wǎng)絡(luò)數(shù)據(jù)(見圖1).
(1)排除局域網(wǎng)內(nèi)干擾數(shù)據(jù).由于sniffer在工作過程中將網(wǎng)卡設(shè)置為雜收工作方式,除了能夠捕獲到發(fā)進(jìn)、發(fā)出本機(jī)的數(shù)據(jù)外,也會(huì)捕獲在局域網(wǎng)內(nèi)傳播的其他主機(jī)之間的數(shù)據(jù)、地址解析協(xié)議(ARP)數(shù)據(jù).利用源IP和目的IP篩選數(shù)據(jù),將源IP地址或目的IP地址非本機(jī)IP的數(shù)據(jù)刪除.
(2)利用流媒體流量特征識(shí)別流媒體數(shù)據(jù).由于流媒體數(shù)據(jù)傳輸數(shù)據(jù)量大,傳輸時(shí)間長(zhǎng),分組多,從交互流中可以識(shí)別出這些源于某一特定主機(jī),連續(xù)的流為流媒體數(shù)據(jù).
(3)利用協(xié)議識(shí)別PPStream流量.在所捕獲數(shù)據(jù)的協(xié)議字段選項(xiàng)中,有ICMP、IGMP、UDP、TCP等.ICMP是Internet控制報(bào)文協(xié)議,用在IP主機(jī)與路由器之間傳遞控制消息;IGMP是Internet組消息管理協(xié)議,用于主機(jī)向臨近路由器發(fā)送自身的廣播組成員.顯然,ICMP和IGMP數(shù)據(jù)包是在建立對(duì)等連接過程中交換的數(shù)據(jù),不是流媒體數(shù)據(jù),將這部分?jǐn)?shù)據(jù)濾除.
OPNET是一種廣泛應(yīng)用的網(wǎng)絡(luò)仿真軟件,可以在計(jì)算機(jī)上模擬真實(shí)的網(wǎng)絡(luò)環(huán)境,準(zhǔn)確分析網(wǎng)絡(luò)的性能和行為,降低網(wǎng)絡(luò)構(gòu)建的成本.OPNET中應(yīng)用程序特征分析模塊是一種網(wǎng)絡(luò)性能分析工具,能對(duì)網(wǎng)絡(luò)中節(jié)點(diǎn)捕獲流量的網(wǎng)絡(luò)參數(shù)進(jìn)行測(cè)量分析,得到應(yīng)用程序的特征,從而整體評(píng)價(jià)網(wǎng)絡(luò)性能.
圖2 優(yōu)酷網(wǎng)應(yīng)用特征
利用sniffer捕獲優(yōu)酷網(wǎng)、PPStream30秒的流媒體數(shù)據(jù)(存儲(chǔ)為enc文件),利用OPNET提取應(yīng)用程序特征,如圖2、3所示.
圖3 PPStream應(yīng)用特征
從圖示2和3中可以看出明顯的C/S模式與P2P模式流媒體應(yīng)用區(qū)別.在圖2中,利用優(yōu)酷網(wǎng)觀看視頻的本機(jī)收到221.195.5.136應(yīng)用層數(shù)據(jù)7535520字節(jié),收到其它IP地址的數(shù)據(jù)為0或極少(不足一幀以太網(wǎng)數(shù)據(jù)長(zhǎng)度),可知這些IP都未向本機(jī)提供流媒體服務(wù).在分析流媒體數(shù)據(jù)來源做數(shù)據(jù)篩選時(shí)可將這些數(shù)據(jù)去掉.在圖3所示的Tier Pair Circle中,不同方向不同顏色的箭頭標(biāo)示出了主機(jī)發(fā)出或接受的數(shù)據(jù)量.運(yùn)行PPStream應(yīng)用程序時(shí)本機(jī)從多臺(tái)主機(jī)處接收到流媒體數(shù)據(jù),接受數(shù)據(jù)量從幾十KB到1.1MB不等,由于本機(jī)緩存媒體文件較少,沒為其他主機(jī)提供對(duì)等文件服務(wù),發(fā)向其他主機(jī)的應(yīng)用數(shù)據(jù)都比較少.
圖4所示為主機(jī)從某一對(duì)等體處接受的流媒體分組序列.本機(jī)發(fā)出的控制分組應(yīng)用層數(shù)據(jù)長(zhǎng)度都為25字節(jié),按收的流媒體分組應(yīng)用層數(shù)據(jù)長(zhǎng)度為1061或1084字節(jié),控制分組與流媒體分組都使用UDP協(xié)議.
圖4 PPStream應(yīng)用接收分組序列
在兩個(gè)不同時(shí)間段內(nèi)分別對(duì)分屬于兩種不同工作模式的五種應(yīng)用采集300秒流量數(shù)據(jù),利用上述方法提取流媒體數(shù)據(jù)及控制數(shù)據(jù),統(tǒng)計(jì)結(jié)果如表1所示.
從表中可以看出三種P2P流媒體應(yīng)用都有控制數(shù)據(jù)分組,長(zhǎng)度都比較小,都利用UDP傳輸媒體數(shù)據(jù),PPStream傳送媒體數(shù)據(jù)時(shí)分組長(zhǎng)度較短,而暴風(fēng)影音和迅雷看看傳送媒體時(shí)數(shù)據(jù)較長(zhǎng),接近以太網(wǎng)攜帶數(shù)據(jù)長(zhǎng)度上限.兩種C/S模式的流媒體利用TCP傳送媒體數(shù)據(jù),土豆網(wǎng)和優(yōu)酷網(wǎng)在不同時(shí)段內(nèi)數(shù)據(jù)分組長(zhǎng)度不同,在網(wǎng)絡(luò)繁忙時(shí)采用較短的分組傳送數(shù)據(jù),這應(yīng)該是由骨干網(wǎng)在不同時(shí)段內(nèi)采用不同的數(shù)據(jù)處理方式?jīng)Q定的.C/S模式的流媒體應(yīng)用在網(wǎng)絡(luò)負(fù)載小時(shí)能為用戶提供更快的下載速度,而P2P流媒體應(yīng)用中對(duì)等用戶多時(shí)才能提供更大的下載速度.
表1 五種不同流媒體應(yīng)用特征
本文利用OPNET分析了五種不同流媒體應(yīng)用的流量特征.由于所選數(shù)據(jù)時(shí)間長(zhǎng)度有限,流媒體應(yīng)用節(jié)目選擇是隨機(jī)的,所分析數(shù)據(jù)不能完全精確地反映這五種流媒體應(yīng)用的流量特征.另外,在不同觀測(cè)點(diǎn)測(cè)量的數(shù)據(jù)會(huì)有很大不同,選擇不同的節(jié)目對(duì)結(jié)果也會(huì)有影響.雖然存在以上不足,但是,從最后所得到的結(jié)果上看,仍然較好地反映出了各種不同應(yīng)用的典型特征.
參考文獻(xiàn):
[1]龔海剛,劉明,毛鶯池.P2P流媒體關(guān)鍵技術(shù)的研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2005,42(12):2033-2041.
[2]蔡青山,李子木,胡建平.Internet上的流媒體特性及用戶訪問行為研究[J].北京航天航空大學(xué)學(xué)報(bào),2005,31(1):25-30.
[3]石萍.基于對(duì)等特征的P2P流量識(shí)別方法[J].網(wǎng)絡(luò)測(cè)量與規(guī)劃,2007(2):36-38.
[4]陳巖,董淑福,蔣磊.OPNET網(wǎng)絡(luò)仿真技術(shù)及其應(yīng)用研究[J].計(jì)算機(jī)技術(shù)與發(fā),2009,19(2):199-204.
[5]Waxman M.Routing of Multipoint Connection[J].IEEE journal on selected areas in communication,1998,6(9):1617-1622.
[6]Subhabrata S,Spatscheck O.Accurate,scalable in-network identification of P2P traffic using application signatures [C].Proceedings of the 13th International Conference on World Wide Web.New York:ACM Press,2004:512-521.