• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機(jī)器學(xué)習(xí)的P2P視頻流識(shí)別技術(shù)

      2021-08-16 10:22:35邢剛付榮宋利
      中國(guó)新通信 2021年11期
      關(guān)鍵詞:機(jī)器學(xué)習(xí)特征分析

      邢剛 付榮 宋利

      【摘要】? ? 當(dāng)前因特網(wǎng)多媒體視頻流業(yè)務(wù)增長(zhǎng)迅速,有效識(shí)別網(wǎng)絡(luò)流量P2P(Peer to Peer)視頻流服務(wù)是一項(xiàng)重要挑戰(zhàn)。本文提出一種基于機(jī)器學(xué)習(xí)的P2P視頻流識(shí)別技術(shù)。該技術(shù)中視頻流特征分析系統(tǒng)包括數(shù)據(jù)報(bào)采集、處理、分流和屬性特征計(jì)算模塊。其次,提出了基于統(tǒng)計(jì)方法的P2P視頻流數(shù)據(jù)報(bào)特征挖掘方法。仿真實(shí)驗(yàn)驗(yàn)證了所提出方法的高效性和準(zhǔn)確性,能夠較好的滿足P2P視頻流識(shí)別。

      【關(guān)鍵詞】? ? P2P視頻流? ? 流量識(shí)別? ? 特征分析? ? 機(jī)器學(xué)習(xí)

      引言:

      當(dāng)前,伴隨多媒體技術(shù)與P2P(Peer to Peer)網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,基于P2P的視頻流應(yīng)用已成為網(wǎng)絡(luò)用戶(hù)流量數(shù)據(jù)中的關(guān)鍵組成部分[1]。基于分布式的P2P技術(shù)具有傳統(tǒng)客戶(hù)端/服務(wù)器架構(gòu)技術(shù)所不具備的特點(diǎn)與優(yōu)勢(shì)。采用P2P技術(shù)實(shí)現(xiàn)多媒體流服務(wù),讓用戶(hù)從分布式環(huán)境獲取流媒體資源,這樣能夠有效地降低終端用戶(hù)對(duì)服務(wù)器性能的需求,降低網(wǎng)絡(luò)通信開(kāi)銷(xiāo)和帶寬資源,有效地提高流媒體的服務(wù)質(zhì)量。研究人員為解決P2P視頻流服務(wù)中的安全問(wèn)題,針對(duì)P2P技術(shù)的視頻流進(jìn)行有效識(shí)別,是實(shí)現(xiàn)網(wǎng)絡(luò)可管理、可控制的關(guān)鍵技術(shù)。

      目前,基于P2P的視頻流識(shí)別技術(shù)分為三類(lèi),分別是基于端口的P2P流媒體識(shí)別技術(shù)、基于流量特征的P2P流媒體識(shí)別技術(shù)和基于深層數(shù)據(jù)報(bào)檢測(cè)的P2P流媒體識(shí)別技術(shù)。

      基于端口的P2P流媒體識(shí)別技術(shù), 該技術(shù)通過(guò)識(shí)別P2P流量中數(shù)據(jù)報(bào)的端口字段,所識(shí)別出的字段能夠準(zhǔn)確檢測(cè)出流量所屬P2P協(xié)議,亦能夠排除其他端口的非P2P應(yīng)用。該字段再用于特定端口號(hào)匹配,這樣的方式能夠發(fā)現(xiàn)潛在的特定P2P流媒體。該類(lèi)技術(shù)通過(guò)基于端口的識(shí)別技術(shù)不易受數(shù)據(jù)包丟失、亂序影響,具有較好的魯棒性等特征。

      基于流量特征的P2P流媒體識(shí)別技術(shù),它能夠解析其網(wǎng)絡(luò)數(shù)據(jù)報(bào)的傳輸層所展現(xiàn)出的流量特征,實(shí)現(xiàn)基于特征匹配的流媒體識(shí)別。常見(jiàn)的流量特征包含:節(jié)點(diǎn)角色分析、流量統(tǒng)計(jì)、網(wǎng)絡(luò)直徑計(jì)算法[2-3]。

      基于深層數(shù)據(jù)報(bào)檢測(cè)的P2P流媒體識(shí)別,該方法需要訪問(wèn)數(shù)據(jù)包內(nèi)部有效載荷,挖掘終端用戶(hù)的應(yīng)用層數(shù)據(jù),基于協(xié)議與還原技術(shù)檢測(cè)數(shù)據(jù)報(bào)中是否含有特定協(xié)議字符串,以此來(lái)判斷數(shù)據(jù)報(bào)是否屬于P2P流媒體[4-5]。此類(lèi)方法具有優(yōu)越的擴(kuò)展性,對(duì)已知協(xié)議的P2P應(yīng)用具有準(zhǔn)確的識(shí)別率。

      現(xiàn)有P2P視頻流識(shí)別技術(shù),均建立在傳統(tǒng)P2P應(yīng)用流量識(shí)別技術(shù)之上,為了提升基于P2P的視頻流識(shí)別方法的有效性和準(zhǔn)確率,本文提出基于統(tǒng)計(jì)特征與機(jī)器學(xué)習(xí)的視頻流識(shí)別方法。該方法采用機(jī)器學(xué)習(xí)中分類(lèi)與聚類(lèi)對(duì)P2P視頻流的流量特征進(jìn)行統(tǒng)計(jì),從而能夠有效識(shí)別。

      一、P2P視頻流特征分析

      1.1 P2P視頻流特征分析系統(tǒng)

      P2P視頻流特征分析系統(tǒng):通過(guò)采集網(wǎng)絡(luò)數(shù)據(jù)報(bào)作為系統(tǒng)輸入項(xiàng),經(jīng)過(guò)各模塊的挖掘處理,最終獲取P2P視頻流的統(tǒng)計(jì)特征。為了實(shí)現(xiàn)特定P2P視頻流統(tǒng)計(jì)特征分析,通常在采集數(shù)據(jù)報(bào)時(shí),需要屏蔽其他P2P視頻流服務(wù)。數(shù)據(jù)報(bào)分流能夠?qū)崿F(xiàn)預(yù)處理,將數(shù)據(jù)以流形式存儲(chǔ)在流隊(duì)列中。針對(duì)流量分析統(tǒng)計(jì),采用模塊類(lèi)包,包括數(shù)據(jù)報(bào)的采集與挖掘、數(shù)據(jù)報(bào)的分流處理、特征屬性值統(tǒng)計(jì)與計(jì)算。

      1.2 P2P視頻流特征分析模塊

      本文所提出的,視頻流量特征分析系統(tǒng)包含有四個(gè)功能模塊:數(shù)據(jù)報(bào)采集模塊、數(shù)據(jù)報(bào)處理模塊、數(shù)據(jù)報(bào)分流模塊和特征屬性計(jì)算模塊。下面針對(duì)系統(tǒng)內(nèi)的四個(gè)功能模塊詳細(xì)解析:

      在前期階段,系統(tǒng)需要感知數(shù)據(jù),數(shù)據(jù)報(bào)采集模塊能夠?qū)崿F(xiàn)從互聯(lián)網(wǎng)絡(luò)抓取特定P2P視頻流數(shù)據(jù)樣本,采用開(kāi)源軟件包、爬蟲(chóng)技術(shù)實(shí)現(xiàn)采集純凈的網(wǎng)絡(luò)數(shù)據(jù)報(bào)。

      針對(duì)所采集到的數(shù)據(jù),數(shù)據(jù)報(bào)處理模塊能夠?qū)Σ杉臉颖緮?shù)據(jù)報(bào)進(jìn)行標(biāo)注和預(yù)處理,獲取數(shù)據(jù)報(bào)五元組信息,目的是便于后續(xù)的分流工作;處理過(guò)程中還需要挖掘出一些特征信息,如數(shù)據(jù)報(bào)大小、數(shù)據(jù)報(bào)到達(dá)時(shí)間、TTL(Time To Live)取值,這些提供給特征屬性計(jì)算模塊完成統(tǒng)計(jì)。

      數(shù)據(jù)報(bào)分流模塊可以實(shí)現(xiàn)流層面P2P視頻流特征的統(tǒng)計(jì)分析。首先,分流模塊將具有相同五元組信息(源IP、目的IP、源端口、目的端口、TCP/UDP協(xié)議)的數(shù)據(jù)報(bào)視作同一條流;再將擁有相同五元組信息的數(shù)據(jù)報(bào)劃分至同一條矩陣列表流,存儲(chǔ)于流隊(duì)列中。

      最終,特征屬性計(jì)算模塊實(shí)現(xiàn)對(duì)流隊(duì)列的挖掘與處理。該模塊對(duì)每一條流完成統(tǒng)計(jì),遍歷流中所有數(shù)據(jù)報(bào)信息完成集合與計(jì)算,獲取每一條流的特征屬性值,最后計(jì)算出所有流的屬性值。

      二、基于機(jī)器學(xué)習(xí)的P2P視頻流識(shí)別方案

      基于機(jī)器學(xué)習(xí)的P2P視頻流識(shí)別方案結(jié)構(gòu)如圖1所示。在視頻流學(xué)習(xí)之前,需要對(duì)每條視頻流量完成分流處理,提取相應(yīng)的流屬性特征,采用分類(lèi)學(xué)習(xí)算法挖掘此實(shí)例所屬的流量類(lèi)別。運(yùn)用Wireshark開(kāi)源軟件進(jìn)行數(shù)據(jù)報(bào)的采集,將樣本數(shù)據(jù)分為訓(xùn)練集和檢測(cè)集。將訓(xùn)練集樣本數(shù)據(jù)導(dǎo)入流量特征分析系統(tǒng),最終實(shí)現(xiàn)分類(lèi)處理。該方案中采用有監(jiān)督的機(jī)器學(xué)習(xí)方法標(biāo)注流的類(lèi)別作為數(shù)據(jù)報(bào)的預(yù)處理,分類(lèi)器與流量分類(lèi)均在Weka開(kāi)源數(shù)據(jù)挖掘軟件中實(shí)現(xiàn)。

      三、實(shí)驗(yàn)仿真與結(jié)果分析

      驗(yàn)證本文所提出的基于機(jī)器學(xué)習(xí)的P2P視頻流識(shí)別技術(shù),構(gòu)建實(shí)驗(yàn)仿真平臺(tái),通過(guò)局域網(wǎng)采集P2P視頻流數(shù)據(jù)報(bào),針對(duì)PPLive、PPS和QQLive三種P2P視頻流服務(wù)分別進(jìn)行流量特征選擇。實(shí)驗(yàn)采用Weka開(kāi)源數(shù)據(jù)挖掘平臺(tái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法,通過(guò)界面操作進(jìn)行算法參數(shù)配置,針對(duì)訓(xùn)練數(shù)據(jù)集樣本采用十字交叉法對(duì)構(gòu)建模型進(jìn)行評(píng)估。仿真實(shí)驗(yàn)選取機(jī)器學(xué)習(xí)算法中典型的分類(lèi)算法:貝葉斯網(wǎng)絡(luò)(BayesNet)、K最近鄰法(KNN)和RandomTree進(jìn)行P2P視頻流識(shí)別。算法評(píng)價(jià)指標(biāo)為測(cè)試時(shí)間與準(zhǔn)確率,用來(lái)評(píng)估所提出方法性能。

      實(shí)驗(yàn)組一:算法評(píng)估測(cè)試時(shí)間指分類(lèi)算法對(duì)測(cè)試樣本識(shí)別執(zhí)行時(shí)間,將視頻流訓(xùn)練樣本數(shù)據(jù)建模,再對(duì)樣本數(shù)據(jù)進(jìn)行流量識(shí)別。仿真實(shí)驗(yàn)所得結(jié)果表示為:選擇的機(jī)器學(xué)習(xí)分類(lèi)算法時(shí)間開(kāi)銷(xiāo)最短為RandomTree等于26.35秒,BayesNet測(cè)試時(shí)間次之為81.62秒,KNN測(cè)試時(shí)間為312.74秒不能夠滿足實(shí)際應(yīng)用。算法測(cè)試時(shí)間越長(zhǎng)則表明算法的效率越差。

      實(shí)驗(yàn)組二:在該實(shí)驗(yàn)組中,TTL值作為視頻流隊(duì)列中的基本屬性之一,作為特征變量進(jìn)行P2P視頻流的識(shí)別,選取三組不同實(shí)驗(yàn)數(shù)據(jù)集,仿真結(jié)果如圖2所示。圖2(1)中為包含TTL值的識(shí)別準(zhǔn)確率,圖2(2)表示為樣本數(shù)據(jù)中不含TTL值識(shí)別結(jié)果。由圖可知,不含TTL值的流屬性在識(shí)別過(guò)程中的正確率明顯下降,含有TTL值的流隊(duì)列識(shí)別正確率較高。

      實(shí)驗(yàn)組準(zhǔn)確率表示為特定P2P視頻流媒體(PPTV、PPS、QQlive)的識(shí)別正確率,其中基于BayesNet的識(shí)別率為92.34%、92.38% 、91.75%;基于KNN的識(shí)別率93.27%、90.47%、93.51%;基于RandomTree的識(shí)別率為92.17%、93.74%、90.41%。通過(guò)以上數(shù)據(jù)顯著看出不同分類(lèi)算法在不同類(lèi)型的P2P視頻流識(shí)別上準(zhǔn)確性差異較小。實(shí)驗(yàn)結(jié)果表明該算法和流量屬性的選擇在一定情況下,數(shù)據(jù)源中各流量類(lèi)型的組成比例對(duì)流量識(shí)別的正確率影響不大。

      四、結(jié)束語(yǔ)

      P2P視頻流的識(shí)別是實(shí)現(xiàn)網(wǎng)絡(luò)流量安全管理的關(guān)鍵機(jī)制。本文提出一種基于機(jī)器學(xué)習(xí)的P2P視頻流識(shí)別技術(shù),基于流隊(duì)列構(gòu)建出視頻流特征分析系統(tǒng),系統(tǒng)包括數(shù)據(jù)報(bào)采集模塊、數(shù)據(jù)報(bào)處理模塊、數(shù)據(jù)報(bào)分流模塊和特征屬性計(jì)算模塊;該識(shí)別技術(shù)采用統(tǒng)計(jì)方法進(jìn)行特征選擇,挖掘P2P視頻流的數(shù)據(jù)報(bào)數(shù)量特征、數(shù)據(jù)報(bào)長(zhǎng)度特征、流持續(xù)時(shí)間和TTL分布特征。仿真實(shí)驗(yàn)采用Weka開(kāi)源數(shù)據(jù)挖掘平臺(tái)對(duì)所提出方法進(jìn)行驗(yàn)證,仿真結(jié)果表明所提出的P2P視頻流識(shí)別技術(shù)是有效的,具有較高準(zhǔn)確率和較低計(jì)算時(shí)間開(kāi)銷(xiāo)。

      參? 考? 文? 獻(xiàn)

      [1]賀文華,劉浩,賀勁松.P2P網(wǎng)絡(luò)現(xiàn)狀與發(fā)展研究[J].軟件工程,2019,22(4):1-5.

      [2]龍軍,王宇樓,袁鑫攀,張華超.P2P流媒體網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn)識(shí)別算法[J].計(jì)算機(jī)工程與科學(xué),2019,41(1):56-64.

      [3]魏赟,韓少恒.基于帶寬預(yù)測(cè)的流媒體超級(jí)節(jié)點(diǎn)選擇算法[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(8):179-182.

      [4]楊戈,劉智鵬.面向流媒體基于蟻群的副本選擇算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(2):190-195.

      [5]潘向輝,陳亞軍,吳學(xué)毅. 基于節(jié)點(diǎn)能力度的P2P流媒體資源調(diào)度算法[J]. 計(jì)算機(jī)工程, 2019, 45(5): 226-231.

      猜你喜歡
      機(jī)器學(xué)習(xí)特征分析
      泡罩包裝揮發(fā)性有機(jī)物排放特征分析
      2012 年南海夏季風(fēng)特征分析
      基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
      前綴字母為特征在維吾爾語(yǔ)文本情感分類(lèi)中的研究
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
      基于PowerPC的脈內(nèi)特征分析算法的工程實(shí)現(xiàn)
      腎康注射液不良反應(yīng)特征分析
      南澳县| 钦州市| 曲阳县| 札达县| 澄迈县| 株洲市| 沙坪坝区| 休宁县| 延边| 巴塘县| 龙州县| 哈尔滨市| 庆城县| 龙海市| 虹口区| 宣恩县| 航空| 东方市| 当雄县| 汪清县| 新营市| 菏泽市| 蒙阴县| 兴文县| 多伦县| 德惠市| 花垣县| 石嘴山市| 丹寨县| 巴南区| 灌云县| 蒙自县| 灵台县| 普兰店市| 丹凤县| 屯门区| 武邑县| 内黄县| 含山县| 永德县| 长春市|