• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    移動(dòng)蜂窩網(wǎng)絡(luò)流量的時(shí)延特征識(shí)別方法研究

    2019-02-20 08:34:04魏松杰張功萱
    關(guān)鍵詞:固網(wǎng)網(wǎng)絡(luò)流量蜂窩

    魏松杰 吳 超 羅 娜 張功萱

    (南京理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 南京 210094)

    我國(guó)的移動(dòng)互聯(lián)網(wǎng)接入基礎(chǔ)設(shè)施不斷完善,智能移動(dòng)終端日趨普及,互聯(lián)網(wǎng)應(yīng)用服務(wù)持續(xù)創(chuàng)新.中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(China Internet Network Infor-mation Center, CNNIC)第38次全國(guó)互聯(lián)網(wǎng)發(fā)展統(tǒng)計(jì)報(bào)告顯示:截至2016年6月,我國(guó)手機(jī)用戶中網(wǎng)民數(shù)量達(dá)到6.56億,網(wǎng)民中使用手機(jī)客戶端上網(wǎng)的人群占比為92.5%,以3G4G接入技術(shù)為基礎(chǔ)的移動(dòng)互聯(lián)網(wǎng)各項(xiàng)指標(biāo)增長(zhǎng)速度正全面超越傳統(tǒng)寬帶網(wǎng)絡(luò)[1].移動(dòng)互聯(lián)網(wǎng)實(shí)現(xiàn)了人機(jī)合一,線上服務(wù)的隨遇接入、持續(xù)連通,為人們的信息交流提供了極大的便利,也深刻地改變著人們的學(xué)習(xí)、工作和生活方式.

    使用以手機(jī)為代表的智能移動(dòng)設(shè)備的典型用戶主要通過2種鏈路技術(shù)方式接入互聯(lián)網(wǎng)服務(wù):基于3G4G通信技術(shù)的移動(dòng)蜂窩網(wǎng)絡(luò)和基于WiFi分享技術(shù)的固定網(wǎng)絡(luò).在不同的網(wǎng)絡(luò)接入條件下,用戶會(huì)有不同的行為習(xí)慣和使用偏好.當(dāng)前,大規(guī)模用戶的3G4G流量數(shù)據(jù)只有相關(guān)的運(yùn)營(yíng)商才能獲得,廣大研究者難以公開獲取.定期發(fā)布可供研究的傳統(tǒng)骨干網(wǎng)流量數(shù)據(jù)集中,例如CAIDA(Center for Applied Internet Data Analysis)公開的流量[2],雖然包含了用戶的3G4G流量,但缺乏有效的流量特征進(jìn)行區(qū)分識(shí)別.因此,研究移動(dòng)蜂窩網(wǎng)絡(luò)數(shù)據(jù)流量特征,識(shí)別并分析3G4G互聯(lián)網(wǎng)接入用戶產(chǎn)生的移動(dòng)網(wǎng)絡(luò)數(shù)據(jù)流量,在此基礎(chǔ)上加深理解移動(dòng)網(wǎng)絡(luò)的特點(diǎn)并預(yù)測(cè)移動(dòng)互聯(lián)網(wǎng)的發(fā)展,成為當(dāng)前互聯(lián)網(wǎng)流量分析的一個(gè)新的研究方向.

    本文通過分析移動(dòng)蜂窩網(wǎng)絡(luò)中IP數(shù)據(jù)報(bào)時(shí)延相關(guān)屬性,提取了能夠有效區(qū)分移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)流量的多種特征.首先,針對(duì)移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)接入技術(shù)進(jìn)行研究,分析了它們?cè)谕ㄐ沛溌飞系膮^(qū)別,初步確定接入鏈路性能和RRC (radio resource control)機(jī)制是導(dǎo)致兩者時(shí)延差異的主要原因.然后通過網(wǎng)絡(luò)流量分析的方法,給出了在網(wǎng)絡(luò)流量中提取計(jì)算這些差異特征的過程,構(gòu)造了6個(gè)可以分析和提取的量化時(shí)延特征.最后,結(jié)合有監(jiān)督機(jī)器學(xué)習(xí)算法,設(shè)計(jì)了流量區(qū)分檢測(cè)方案,通過實(shí)驗(yàn)對(duì)公開的網(wǎng)絡(luò)流量數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試,構(gòu)建了針對(duì)蜂窩網(wǎng)絡(luò)流量和固網(wǎng)流量的自動(dòng)流量分類器.實(shí)驗(yàn)結(jié)果表明,利用文中提出的流量時(shí)延特征構(gòu)建的分類器,能夠正確區(qū)分測(cè)試集中90%的蜂窩網(wǎng)絡(luò)流量和95%的固網(wǎng)流量,運(yùn)行性能好,分類準(zhǔn)確率高,且不依賴于網(wǎng)絡(luò)流量?jī)?nèi)容和應(yīng)用協(xié)議,不觸及用戶通信數(shù)據(jù)隱私.

    本文的主要研究成果和貢獻(xiàn)有3個(gè)方面:

    1) 分析了移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)的鏈路差異,并研究其對(duì)IP數(shù)據(jù)報(bào)時(shí)延的影響,構(gòu)建新的移動(dòng)蜂窩網(wǎng)絡(luò)流量特征.

    2) 針對(duì)移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)流量的特征差異,提出了相應(yīng)特征的量化計(jì)算方法,并在此基礎(chǔ)上,采用有監(jiān)督學(xué)習(xí)算法構(gòu)造流量分類器.

    3) 使用公開數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)測(cè)試,驗(yàn)證分類特征的有效性,并對(duì)不同條件下模型的優(yōu)缺點(diǎn)進(jìn)行分析.

    1 相關(guān)工作

    互聯(lián)網(wǎng)流量特征研究是流量分類、網(wǎng)絡(luò)用戶行為分析、網(wǎng)絡(luò)異常檢測(cè)等工作的前提和基礎(chǔ)[5].近年來多個(gè)相關(guān)研究都是通過分析網(wǎng)絡(luò)流量的各類特征,構(gòu)建流量數(shù)據(jù)分類模型[6].傳統(tǒng)的流量特征包括IP地址、端口、協(xié)議、包長(zhǎng)度、IPTCP選項(xiàng)、包到達(dá)間隔、流持續(xù)時(shí)間等.這些通用特征主要用來對(duì)流量進(jìn)行協(xié)議分類,或者分析用戶的行為.

    Zhang等人[7]研究了移動(dòng)蜂窩網(wǎng)絡(luò)中終端應(yīng)用所產(chǎn)生的HTTP數(shù)據(jù),從數(shù)據(jù)報(bào)、數(shù)據(jù)流和會(huì)話3個(gè)層面分析了不同應(yīng)用的網(wǎng)絡(luò)流量的特征,并對(duì)比分析了其與有線網(wǎng)絡(luò)環(huán)境中的流量特征的不同.Zhang等人[8]針對(duì)移動(dòng)蜂窩網(wǎng)絡(luò)中HTTP流量速率進(jìn)行研究,對(duì)比其在有線網(wǎng)絡(luò)中的區(qū)別,從網(wǎng)絡(luò)擁塞、訪問鏈路和訪問終端等方面解釋了產(chǎn)生這種現(xiàn)象的原因.

    Xu等人[9]對(duì)移動(dòng)蜂窩網(wǎng)絡(luò)進(jìn)行了端到端的數(shù)據(jù)傳輸實(shí)驗(yàn),從包的到達(dá)分布、網(wǎng)絡(luò)瞬時(shí)吞吐率、網(wǎng)絡(luò)緩存、隊(duì)列機(jī)制等方面描述了移動(dòng)蜂窩網(wǎng)絡(luò)的特征.陳昕等人[10]從無線通信理論研究的角度,分析了無線信道的時(shí)變特點(diǎn),利用隨機(jī)網(wǎng)絡(luò)演算的方法建立對(duì)LTE網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸時(shí)端到端的時(shí)延模型.他們都在分析流量的過程中發(fā)現(xiàn)了一些移動(dòng)蜂窩網(wǎng)絡(luò)流量和固網(wǎng)流量的區(qū)別,但都是通過特殊流量測(cè)量網(wǎng)絡(luò)得出的結(jié)論,不適用于一般的網(wǎng)絡(luò)流量模型.

    Sandrasegaran等人[11]研究如何降低移動(dòng)蜂窩網(wǎng)絡(luò)中的時(shí)延,提出了一種時(shí)延優(yōu)先調(diào)度(delay prioritized scheduling, DPS)算法.Nikaein等人[12]對(duì)LTE通信網(wǎng)絡(luò)中主機(jī)到主機(jī)的時(shí)延進(jìn)行了研究,將時(shí)延的構(gòu)成分為4個(gè)部分,詳細(xì)分析了現(xiàn)實(shí)中影響網(wǎng)絡(luò)時(shí)延的各個(gè)因素,并給出相應(yīng)的時(shí)延估計(jì).林川等人[13]通過分析網(wǎng)絡(luò)探測(cè)數(shù)據(jù),對(duì)網(wǎng)絡(luò)時(shí)延因素進(jìn)行了多層次的分析,并提出不同通信直徑條件下,排隊(duì)時(shí)延、傳播時(shí)延對(duì)支配時(shí)延的影響關(guān)系.

    Gupta等人[14]針對(duì)新興的Facebook和Twitter等頻繁引起網(wǎng)絡(luò)請(qǐng)求的手機(jī)應(yīng)用,研究了其對(duì)移動(dòng)蜂窩網(wǎng)絡(luò)RRC機(jī)制與手機(jī)電量的影響.Barbera等人[15]和Perta等人[3]通過分析無線通信協(xié)議中的RRC狀態(tài)轉(zhuǎn)換對(duì)移動(dòng)蜂窩網(wǎng)絡(luò)中數(shù)據(jù)往返時(shí)延的影響,結(jié)合終端上的即時(shí)通信軟件,提出了一種特定條件下可探測(cè)用戶設(shè)備信息的方法.他們研究了通信協(xié)議中RRC機(jī)制對(duì)流量數(shù)據(jù)時(shí)延的影響,但沒有對(duì)鏈路協(xié)議進(jìn)行系統(tǒng)分析,也沒有據(jù)此提出區(qū)分移動(dòng)蜂窩網(wǎng)絡(luò)流量和固網(wǎng)流量的方法.

    2 移動(dòng)蜂窩網(wǎng)絡(luò)數(shù)據(jù)流量的時(shí)延特性

    當(dāng)前,可公開獲取的網(wǎng)絡(luò)流量樣本大多是經(jīng)過匿名化、內(nèi)容移除等隱私保護(hù)處理的,無法使用深度包解析(deep package inspection, DPI)的分析方法.另外,由于3G4G與固網(wǎng)客戶端可以使用相同的智能移動(dòng)設(shè)備,運(yùn)行相同的應(yīng)用程序,數(shù)據(jù)報(bào)的內(nèi)容和規(guī)??梢曰疽恢?因此,3G4G與固網(wǎng)流量的差異表現(xiàn)主要在數(shù)據(jù)報(bào)時(shí)序表現(xiàn)而非內(nèi)容表達(dá)上,典型的如數(shù)據(jù)報(bào)的往返時(shí)延(round-trip time, RTT).RTT表示從發(fā)送端生成并發(fā)送數(shù)據(jù)開始,到發(fā)送端收到來自接收端的相應(yīng)確認(rèn)(假設(shè)接收端收到數(shù)據(jù)后,立即響應(yīng)并發(fā)送確認(rèn)),總共經(jīng)歷的時(shí)間間隔.本文主要研究由于移動(dòng)蜂窩網(wǎng)絡(luò)與固網(wǎng)通信鏈路的不同而引起的流量中時(shí)延特征的差異.

    2.1 移動(dòng)蜂窩網(wǎng)絡(luò)架構(gòu)

    移動(dòng)蜂窩網(wǎng)絡(luò)比固定寬帶網(wǎng)絡(luò)架構(gòu)復(fù)雜,系統(tǒng)更加龐大,各個(gè)運(yùn)營(yíng)商所使用的鏈路通信技術(shù)和參數(shù)配置也存在差異.圖1以4G網(wǎng)絡(luò)為例,給出了一個(gè)典型的移動(dòng)蜂窩網(wǎng)絡(luò)架構(gòu)示意圖.網(wǎng)絡(luò)包含2個(gè)部分:一是直接與終端用戶進(jìn)行通信的無線接入網(wǎng)絡(luò)(radio access network, RAN),負(fù)責(zé)無線資源的控制、用戶接入管理等;二是運(yùn)營(yíng)商的核心業(yè)務(wù)網(wǎng)絡(luò)(evolved packet core, EPC),負(fù)責(zé)用戶認(rèn)證、網(wǎng)絡(luò)計(jì)費(fèi)、提供互聯(lián)網(wǎng)服務(wù)等.核心業(yè)務(wù)網(wǎng)絡(luò)通過網(wǎng)關(guān)連接其他網(wǎng)絡(luò),比如國(guó)際互聯(lián)網(wǎng).

    Fig. 1 Typical architecture of mobile cellular network圖1 移動(dòng)蜂窩網(wǎng)絡(luò)典型架構(gòu)[16]

    用戶終端設(shè)備UE(user equipment)通過移動(dòng)蜂窩網(wǎng)絡(luò)接入互聯(lián)網(wǎng)時(shí),首先需要接入RAN,建立與基站的通信,然后,其中的資源控制模塊分配用戶傳輸數(shù)據(jù)所需的無線資源(信道和時(shí)隙),用戶通過分配得到的鏈路資源將數(shù)據(jù)發(fā)送給基站節(jié)點(diǎn),再經(jīng)基站轉(zhuǎn)發(fā)至核心業(yè)務(wù)網(wǎng),最后傳至互聯(lián)網(wǎng).

    2.2 移動(dòng)蜂窩網(wǎng)絡(luò)流量時(shí)延的影響因素

    產(chǎn)生IP數(shù)據(jù)報(bào)時(shí)延的原因是多樣的,圖2列出了主要影響因素.數(shù)據(jù)從發(fā)送端發(fā)出到接收端收到,其時(shí)延的影響因素主要有2類:1)通信鏈路的限制;2)網(wǎng)絡(luò)負(fù)載變化.通信鏈路的限制主要是指信號(hào)傳輸速度、傳輸距離、網(wǎng)絡(luò)設(shè)備轉(zhuǎn)發(fā)速度、路由跳數(shù)等因素,產(chǎn)生的時(shí)延相對(duì)穩(wěn)定.網(wǎng)絡(luò)負(fù)載的影響指受網(wǎng)絡(luò)設(shè)備性能波動(dòng)、用戶流量潮汐變化、路由隊(duì)列變化等隨機(jī)因素的影響,產(chǎn)生的時(shí)延會(huì)有較大的抖動(dòng).通信鏈路限制產(chǎn)生的時(shí)延主要受鏈路特性的影響,移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)通信方式的區(qū)別會(huì)對(duì)該時(shí)延產(chǎn)生不同的影響.為此,研究中將網(wǎng)絡(luò)負(fù)載變化帶來的時(shí)延視為噪聲,通過分析通信鏈路對(duì)網(wǎng)絡(luò)流量時(shí)延的影響,進(jìn)而對(duì)網(wǎng)絡(luò)數(shù)據(jù)流量進(jìn)行來源識(shí)別并分類.

    Fig. 2 The influence factors of network delay圖2 網(wǎng)絡(luò)時(shí)延的影響因素

    2.2.1 接入鏈路

    在網(wǎng)絡(luò)負(fù)載對(duì)數(shù)據(jù)傳輸時(shí)延影響較小的情況下,網(wǎng)絡(luò)流量中的數(shù)據(jù)往返時(shí)延RTT差異主要是由通信鏈路限制引起的通信鏈路時(shí)延.圖3根據(jù)通信鏈路的不同部分,將RTT拆分為終端到ISP核心業(yè)務(wù)網(wǎng)的接入鏈路時(shí)延和核心網(wǎng)到目標(biāo)地址的互聯(lián)網(wǎng)路由傳輸時(shí)延,這里我們忽略影響較小的服務(wù)器處理時(shí)延.移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)流量在時(shí)延特征上的不同,主要來自于接入鏈路時(shí)延上,即接入鏈路時(shí)延特征的不同是蜂窩網(wǎng)絡(luò)與固網(wǎng)流量區(qū)別的主要原因.

    Fig. 3 Division of network delay圖3 網(wǎng)絡(luò)時(shí)延劃分

    2.2.2 RRC無線資源控制

    Fig. 4 RRC state transition diagram圖4 RRC狀態(tài)轉(zhuǎn)換示意圖

    終端在某個(gè)時(shí)間段內(nèi)沒有網(wǎng)絡(luò)數(shù)據(jù)傳輸時(shí),將處于IDLE狀態(tài);此時(shí)若有數(shù)據(jù)要傳輸,需先重建無線鏈接,轉(zhuǎn)換為CELL_FACH狀態(tài),進(jìn)而完成通信,這個(gè)過程會(huì)產(chǎn)生較大的時(shí)延.當(dāng)傳輸速率超過某個(gè)閾值時(shí),RRC會(huì)向上調(diào)整為CELL_DCH高速通信狀態(tài),此時(shí)的鏈路時(shí)延最??;在固定時(shí)間段內(nèi)無數(shù)據(jù)傳輸時(shí),CELL_DCH狀態(tài)會(huì)向下調(diào)整到CELL_FACH狀態(tài),進(jìn)而調(diào)整到IDLE狀態(tài).終端應(yīng)用的網(wǎng)絡(luò)流量變化會(huì)導(dǎo)致RRC在不同狀態(tài)間的轉(zhuǎn)換,RRC的不同狀態(tài)又會(huì)導(dǎo)致網(wǎng)絡(luò)時(shí)延的變化,這種時(shí)延影響是移動(dòng)蜂窩網(wǎng)絡(luò)中所獨(dú)有的.RRC狀態(tài)轉(zhuǎn)換的閾值和不同狀態(tài)下的時(shí)延標(biāo)準(zhǔn)在不同的運(yùn)營(yíng)商網(wǎng)絡(luò)中可能不同,但I(xiàn)DLE狀態(tài)下傳輸數(shù)據(jù)報(bào)的時(shí)延會(huì)明顯高于CELL_FACH和CELL_DCH狀態(tài)下的鏈路時(shí)延.

    2.3 移動(dòng)蜂窩網(wǎng)絡(luò)流量特征

    網(wǎng)絡(luò)系統(tǒng)是一個(gè)時(shí)變系統(tǒng),時(shí)延難以用精確的函數(shù)表達(dá),但移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)時(shí)延特征的不同,必然帶來流量中數(shù)據(jù)報(bào)時(shí)延統(tǒng)計(jì)特征的區(qū)別.

    2.3.1 鏈路時(shí)延極小值

    鏈路時(shí)延極小值代表一條通信鏈路在理想條件下的時(shí)延下限,該值由通信協(xié)議設(shè)計(jì)和通信設(shè)備性能水平?jīng)Q定.高速固網(wǎng)環(huán)境下,一定范圍內(nèi)鏈路時(shí)延可以接近于0 ms;但在3G4G無線通信網(wǎng)絡(luò)中,受接入鏈路和接入?yún)f(xié)議的限制,該值不會(huì)小于某個(gè)閾值.

    表1列舉了在LTE蜂窩網(wǎng)絡(luò)接入鏈路中部分因素產(chǎn)生的單向時(shí)延估計(jì).UE處理時(shí)延、eNodeBRNC處理時(shí)延是指手機(jī)與基站對(duì)無線通信信號(hào)進(jìn)行編碼解碼所需要的時(shí)間,TTI和幀調(diào)整是指無線數(shù)據(jù)幀傳輸時(shí)隙和幀間隔所需的時(shí)間.理想情況下,忽略無線數(shù)據(jù)幀的重傳和SP-GW路由轉(zhuǎn)發(fā)等因素的影響,蜂窩網(wǎng)絡(luò)時(shí)延下限為前3項(xiàng)的總和,簡(jiǎn)單計(jì)算可得單向時(shí)延大于3.5 ms,RTT中包含的通信鏈路時(shí)延為環(huán)回往返時(shí)延,大于7 ms.現(xiàn)實(shí)情況下,考慮網(wǎng)關(guān)路由及無線幀的重傳因素,實(shí)際導(dǎo)致IP數(shù)據(jù)的報(bào)往返時(shí)延RTT會(huì)更大.

    Table 1 Delay Estimation of LTE Network Accessing Link表1 LTE網(wǎng)絡(luò)接入鏈路時(shí)延估計(jì)

    固網(wǎng)寬帶的時(shí)延下限主要依賴于接入網(wǎng)絡(luò)設(shè)備的轉(zhuǎn)發(fā)時(shí)延,對(duì)于高速光纖通信設(shè)備,在一定距離內(nèi)時(shí)延接近于0 ms,因此并沒有統(tǒng)一的下限.相同地區(qū)和運(yùn)營(yíng)商提供的固網(wǎng)和3G4G網(wǎng)絡(luò),其接入鏈路時(shí)延極小值會(huì)有明顯的區(qū)別.不同地區(qū)或運(yùn)營(yíng)商的流量混雜在一起時(shí),所有的蜂窩網(wǎng)絡(luò)流量時(shí)延極小值會(huì)大于某個(gè)統(tǒng)一的閾值,而時(shí)延小于該閾值的就更可能是固網(wǎng)流量.

    2.3.2 鏈路時(shí)延波動(dòng)

    移動(dòng)蜂窩網(wǎng)絡(luò)架構(gòu)復(fù)雜,影響網(wǎng)絡(luò)時(shí)延的因素相對(duì)固網(wǎng)更多,這就導(dǎo)致移動(dòng)蜂窩網(wǎng)絡(luò)時(shí)延相對(duì)固網(wǎng)有更大的波動(dòng)性.如手機(jī)與基站間距離變化、天氣變化、信號(hào)強(qiáng)弱變化等,都會(huì)引起通信數(shù)據(jù)報(bào)時(shí)延的波動(dòng).固網(wǎng)使用可靠的有線連接排除網(wǎng)絡(luò)負(fù)載的影響外,時(shí)延變化主要受交換路由設(shè)備的轉(zhuǎn)發(fā)性能影響,相對(duì)穩(wěn)定.

    2.3.3 RRC狀態(tài)轉(zhuǎn)換影響時(shí)延

    移動(dòng)蜂窩網(wǎng)絡(luò)環(huán)境中,終端應(yīng)用在RRC處于不同狀態(tài)時(shí)傳輸數(shù)據(jù),IP數(shù)據(jù)報(bào)會(huì)表現(xiàn)出不同的時(shí)延.在能夠得到單一數(shù)據(jù)源所有流量的條件下,如果源地址在持續(xù)的某個(gè)時(shí)間段內(nèi)無數(shù)據(jù)收發(fā),則表示源地址無網(wǎng)絡(luò)訪問,RRC狀態(tài)可能處于IDLE狀態(tài),從而導(dǎo)致之后收發(fā)的第1個(gè)數(shù)據(jù)報(bào)會(huì)有較大的時(shí)延.網(wǎng)絡(luò)流量中源地址在靜默特定時(shí)間段后,第1個(gè)數(shù)據(jù)報(bào)的時(shí)延或重傳性質(zhì),也是區(qū)分移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)的重要特征.

    圖5使用ping指令,設(shè)置不同的時(shí)間間隔發(fā)送ICMP報(bào)文,分別在國(guó)內(nèi)主流移動(dòng)蜂窩數(shù)據(jù)網(wǎng)絡(luò)環(huán)境中測(cè)試,測(cè)量數(shù)據(jù)報(bào)平均往返時(shí)延.橫坐標(biāo)為ping報(bào)文發(fā)送的間隔,縱坐標(biāo)為以相應(yīng)間隔測(cè)量10次得到的平均往返時(shí)延.測(cè)量所用的目的地址為國(guó)內(nèi)高速骨干網(wǎng)上的DNS服務(wù)器114.114.114.114.

    Fig. 5 The relation between the interval of message sending and the delay of round-trip圖5 報(bào)文發(fā)送間隔與往返時(shí)延的關(guān)系

    通過圖5可以看到,雖然不同運(yùn)營(yíng)商的4G網(wǎng)絡(luò)終端與目標(biāo)服務(wù)器之間的延遲大小有差異,但發(fā)送ping包的間隔大于某個(gè)閾值后,延遲都明顯變大.該閾值對(duì)應(yīng)RRC由非空閑態(tài)轉(zhuǎn)換為空閑態(tài)的狀態(tài)轉(zhuǎn)換等待時(shí)間.不同包發(fā)送間隔產(chǎn)生的時(shí)延基本可分為2層,對(duì)應(yīng)2類不同的RRC狀態(tài)下的時(shí)延:空閑態(tài)和非空閑態(tài).從圖5還可以看出,不同運(yùn)營(yíng)商網(wǎng)絡(luò)環(huán)境中,RRC產(chǎn)生狀態(tài)轉(zhuǎn)換的時(shí)間參數(shù)并不一致,中國(guó)聯(lián)通和中國(guó)移動(dòng)在用戶持續(xù)10 s無數(shù)據(jù)傳輸時(shí),RRC即轉(zhuǎn)換為IDLE狀態(tài),而中國(guó)電信的這個(gè)參數(shù)大約是23 s.

    3 網(wǎng)絡(luò)流量時(shí)延特征定義及計(jì)算方法

    3.1 移動(dòng)蜂窩網(wǎng)絡(luò)流量模型

    1)在移動(dòng)終端使用數(shù)據(jù)嗅探工具(如tcpdump)獲取流量.Xu等人[9]使用此方法,在不同的蜂窩網(wǎng)絡(luò)環(huán)境中,實(shí)施端到端的數(shù)據(jù)傳輸實(shí)驗(yàn),構(gòu)造特定的網(wǎng)絡(luò)流量進(jìn)行研究.

    2)如圖6所示模型,搭建一個(gè)網(wǎng)絡(luò)接入代理或代理服務(wù)器(VPN),手機(jī)接入VPN或者代理服務(wù)器實(shí)現(xiàn)上網(wǎng),在VPN端獲取流量.

    Fig. 6 Data acquisition model of mobile cellular network圖6 移動(dòng)蜂窩網(wǎng)絡(luò)數(shù)據(jù)采集模型

    本文實(shí)驗(yàn)部分用到的公開數(shù)據(jù)集就是用圖6中所示的代理服務(wù)器的方法獲取的.流量數(shù)據(jù)在源地址和目的地址之間的代理服務(wù)器上截取,本文討論的特征均以基于此模型截取的流量特征為例,稍加修改即可適用于從互聯(lián)網(wǎng)骨干節(jié)點(diǎn)獲取的蜂窩網(wǎng)絡(luò)流量.

    3.2 移動(dòng)蜂窩網(wǎng)絡(luò)流量特征

    3.2.1 鏈路時(shí)延特征

    fr(pktdata)=fr(pktack)=0,

    (1)

    fi(pktack)-fi(pktdata)≤N,

    (2)

    則定義這次傳輸?shù)逆溌窌r(shí)延為

    Delaypkt=ft(pktack)-ft(pktdata),

    (3)

    其中fi為獲取指定數(shù)據(jù)報(bào)在流量文件中的序號(hào)的函數(shù),這里的流量文件是指該特定源地址發(fā)送和接收的流量,如果獲取的流量中包含多個(gè)源地址,需先將獲得流量依源地址切分成不同的流量文件.fr獲取指定數(shù)據(jù)報(bào)的重傳次數(shù),ft獲取指定數(shù)據(jù)報(bào)的捕獲時(shí)間,N是一個(gè)大于0的常量.

    Fig. 7 Link delay圖7 鏈路時(shí)延

    Fig. 8 The relationship between N and the mean, standard deviation and total ratio of link delay圖8 N值與鏈路時(shí)延的均值、標(biāo)準(zhǔn)差、總占比的關(guān)系

    圖8展示了在同一份網(wǎng)絡(luò)流量中,使用不同的N值得到鏈路時(shí)延的標(biāo)準(zhǔn)差和均值,以及滿足式(2)約束的時(shí)延數(shù)量占總時(shí)延的比例.可以看出,如果N較小,計(jì)算得到的鏈路時(shí)延波動(dòng)較小,說明擁塞帶來的時(shí)延噪聲小,但符合條件的數(shù)據(jù)報(bào)相對(duì)少;如果N越大,符合條件的數(shù)據(jù)報(bào)相對(duì)多,但得到的鏈路時(shí)延波動(dòng)較大,時(shí)延噪聲可能較大.

    Table 2 Datagram of DataAck表2 DataAck數(shù)據(jù)報(bào)

    Table 2 Datagram of DataAck表2 DataAck數(shù)據(jù)報(bào)

    pktdatapktackTCP Syn_AckTCP AckTCP Data(payload>0) TCP Ack

    源地址在收到SYN標(biāo)識(shí)位為1或數(shù)據(jù)有效載荷長(zhǎng)度大于0的TCP數(shù)據(jù)報(bào)時(shí),一般會(huì)立即發(fā)送確認(rèn)報(bào)文,計(jì)算符合條件確認(rèn)報(bào)和數(shù)據(jù)報(bào)的時(shí)間差可得到鏈路時(shí)延,進(jìn)而計(jì)算如下2個(gè)時(shí)延分布特征.

    1) 鏈路時(shí)延標(biāo)準(zhǔn)差

    2) 鏈路時(shí)延最小值

    通過計(jì)算得到的鏈路時(shí)延,用其最小值表示通信鏈路的時(shí)延下限.移動(dòng)蜂窩網(wǎng)絡(luò)流量中的鏈路時(shí)延最小值特征與固網(wǎng)之間會(huì)存在一個(gè)閾值,特征小于此閾值的,較大可能是固網(wǎng);大于此閾值的,可能是蜂窩網(wǎng)絡(luò).

    3.2.2 RRC時(shí)延特征

    移動(dòng)蜂窩網(wǎng)絡(luò)環(huán)境中,某個(gè)時(shí)間段內(nèi),如果源地址無數(shù)據(jù)傳輸,則RRC狀態(tài)就會(huì)發(fā)生變化.據(jù)此通過定位網(wǎng)絡(luò)流量中源地址在時(shí)間段(trrrc0,trrrc1)內(nèi)無流量時(shí),之后第1個(gè)收到的數(shù)據(jù)報(bào)的鏈路時(shí)延,得到RRC可能處于特定狀態(tài)下的時(shí)延.對(duì)于特定源地址相關(guān)網(wǎng)絡(luò)流量中的數(shù)據(jù)報(bào)pktdata及對(duì)其響應(yīng)數(shù)據(jù)報(bào)pktack,如果它們可以計(jì)算鏈路時(shí)延,且滿足條件:

    trrrc0

    (4)

    則定義RRC鏈路時(shí)延為

    Delaypkt_rrc=ft(pktack)-ft(pktdata),

    (5)

    其中,pktdata-1是在傳輸pktack數(shù)據(jù)報(bào)前該地址上一個(gè)發(fā)送或接收的網(wǎng)絡(luò)數(shù)據(jù)報(bào),trrrc0和trrrc1是2個(gè)對(duì)應(yīng)不同RRC狀態(tài)轉(zhuǎn)換時(shí)間的臨界值.式(4)表示數(shù)據(jù)報(bào)pktdata與前一個(gè)數(shù)據(jù)報(bào)pktdata-1的間隔時(shí)間落在區(qū)間(trrrc0,trrrc1)中,式(5)表示該次傳輸?shù)臅r(shí)延.為兼容不同的網(wǎng)絡(luò)情況,這里僅考慮RRC的空閑和非空閑狀態(tài),使用2個(gè)典型的間隔區(qū)間段,如表3所示:

    Table 3 RRC Status and Packet Interval表3 RRC狀態(tài)與包間隔區(qū)間 s

    根據(jù)RRC不同狀態(tài)下的數(shù)據(jù)時(shí)延及重傳率,進(jìn)而計(jì)算其描述特征如下:

    1) RRC空閑態(tài)時(shí)延標(biāo)準(zhǔn)差

    RRC處于空閑態(tài)時(shí),網(wǎng)絡(luò)時(shí)延主要依賴RRC狀態(tài)轉(zhuǎn)換的時(shí)間,這個(gè)時(shí)延稱為移動(dòng)蜂窩網(wǎng)絡(luò)的控制面時(shí)延,受通信協(xié)議中多種因素的影響,不僅時(shí)延比較大,波動(dòng)也很大.若源地址屬于固網(wǎng),則不存在RRC的狀態(tài)轉(zhuǎn)換,時(shí)延標(biāo)準(zhǔn)差較小,相反若受移動(dòng)蜂窩網(wǎng)絡(luò)通信控制面時(shí)延的影響,時(shí)延標(biāo)準(zhǔn)差會(huì)較大.

    2) RRC不同狀態(tài)時(shí)延均值與標(biāo)準(zhǔn)差的距離

    據(jù)此,可分別計(jì)算出源地址在2個(gè)間隔區(qū)間中的鏈路時(shí)延均值和標(biāo)準(zhǔn)差,若源地址屬于固網(wǎng),那么不存在RRC的狀態(tài)轉(zhuǎn)換,時(shí)延應(yīng)該有相同的分布,不同狀態(tài)的時(shí)延均值、標(biāo)準(zhǔn)差距離較?。环駝t會(huì)較大.

    3) 數(shù)據(jù)重傳率

    在RRC處于空閑態(tài)時(shí),應(yīng)用層傳輸數(shù)據(jù)會(huì)有較大的時(shí)延,而TCP協(xié)議中,時(shí)延過大可能觸發(fā)超時(shí)重傳機(jī)制,此時(shí)包重傳率會(huì)大于平時(shí).由于上述特征在計(jì)算時(shí)延時(shí)都要求數(shù)據(jù)報(bào)無重傳,所以數(shù)據(jù)報(bào)重傳率是RRC導(dǎo)致大時(shí)延的補(bǔ)充描述特征.

    4 實(shí)驗(yàn)驗(yàn)證

    4.1 實(shí)驗(yàn)數(shù)據(jù)

    4.1.1 數(shù)據(jù)源描述

    本文使用的流量來自Coninck等人[18]公開的實(shí)驗(yàn)采集數(shù)據(jù),采集的是手機(jī)終端產(chǎn)生的多路徑TCP網(wǎng)絡(luò)流量.手機(jī)終端安裝特殊SOCK代理軟件,通過代理服務(wù)器訪問互聯(lián)網(wǎng),另外,代理軟件可使手機(jī)同時(shí)通過WiFi和3G4G網(wǎng)絡(luò)連接代理服務(wù)器,SOCK代理服務(wù)器轉(zhuǎn)發(fā)并截獲手機(jī)終端的網(wǎng)絡(luò)流量.多路徑TCP實(shí)現(xiàn)了用戶在WiFi和3G4G都可用時(shí),同時(shí)在2個(gè)網(wǎng)卡上分別建立TCP子流,協(xié)同完成數(shù)據(jù)傳輸任務(wù)的功能,2個(gè)子流同屬于一個(gè)多路徑TCP流,以TCP選項(xiàng)中的某些字段標(biāo)識(shí).該份數(shù)據(jù)涉及幾十個(gè)手機(jī)終端,持續(xù)7周,有近千個(gè)源IP地址.

    4.1.2 數(shù)據(jù)預(yù)處理

    為便于流量特征提取,同時(shí)消除一些噪聲和畸形數(shù)據(jù),需先對(duì)流量進(jìn)行一些預(yù)處理操作.數(shù)據(jù)預(yù)處理的主要有以下5個(gè)步驟.

    第1步.篩選出流量中所有的客戶端地址,獲取源IP地址集.由于3G4G網(wǎng)絡(luò)移動(dòng)性的特點(diǎn),其分配的IP地址一般只會(huì)給移動(dòng)終端,而服務(wù)器則使用固網(wǎng)提供的IP地址.我們分析數(shù)據(jù)中涉及到的所有IP地址,依據(jù)該IP是否僅發(fā)起TCP鏈接而不接收TCP鏈接篩選出一個(gè)IP地址集合,該集合中包含了全部的3G4G用戶的源IP地址和部分固網(wǎng)客戶端的IP地址.

    第2步.依據(jù)IP地址切分流量數(shù)據(jù).依據(jù)第1步得到IP地址集合,將數(shù)據(jù)流量切分成小的流量文件,每一個(gè)流量文件都是IP地址集合中某個(gè)特定的IP地址所發(fā)送或接收的流量,切分后的流量保持原流量文件中的包時(shí)間、相對(duì)順序.

    第3步.依據(jù)TOKEN定位同一時(shí)刻的子流.依據(jù)協(xié)議提取所有Multipath-TCP子流的TOKEN,并依據(jù)同一時(shí)間的子流分屬不同網(wǎng)絡(luò)環(huán)境的邏輯,得到相應(yīng)IP地址的對(duì)立關(guān)系;

    第4步.根據(jù)交叉邏輯,將IP地址分類.在數(shù)據(jù)作者的幫助下,確定了對(duì)立的IP地址必定分屬3G4G或WiFi,然后結(jié)合設(shè)備不同時(shí)間段在不同網(wǎng)絡(luò)間的相互交叉的邏輯關(guān)系,通過篩選,得到3G4G和WiFi的IP地址集合.

    第5步.依時(shí)段切分IP流量,獲得實(shí)驗(yàn)數(shù)據(jù)集.為獲得更多的流量樣本測(cè)試,將已確定為3G4G或WiFi地址的流量文件,采用分時(shí)劃分的方法,以60 min為單元,將特定IP的流量文件分割成多個(gè)子流量文件,在此基礎(chǔ)上清洗掉一些無效的流量,最終得到了954個(gè)流量文件,其中WiFi連接流量文件674個(gè),3G4G連接流量文件280個(gè).

    4.2 實(shí)驗(yàn)平臺(tái)及流程

    本文所使用的數(shù)據(jù)分析工具是Weka-3.5.6.該工具是由新西蘭懷卡托大學(xué)Witten教授等人開發(fā)的開源工作平臺(tái).該平臺(tái)利用Java語言實(shí)現(xiàn)了決策樹、樸素貝葉斯等多種機(jī)器學(xué)習(xí)方法.本文實(shí)驗(yàn)計(jì)算平臺(tái)為1臺(tái)PC機(jī),CPU配置為4核Intel CoreTMi5-2520M@2.66 GHz,內(nèi)存為4 GB;運(yùn)行kali操作系統(tǒng).

    實(shí)驗(yàn)中分類效果的好壞主要取決于提取的流量特征對(duì)通信鏈路差異的描述能力,本文提取的特征從不同側(cè)面描述了這些差異.綜合考慮算法的適用性、分類效果和執(zhí)行效率等因素,實(shí)驗(yàn)使用機(jī)器學(xué)習(xí)的方法如表4所示,主要采用SVM,RandomForest,BayesNet,C4.5,Logistic,AdaBoost這6種常用的分類算法. 這些算法能夠針對(duì)網(wǎng)絡(luò)流量連續(xù)時(shí)延特征的數(shù)值分布和相關(guān)性進(jìn)行學(xué)習(xí)和建模,同時(shí)也是在其他相關(guān)研究工作中,基于網(wǎng)絡(luò)流量分析的用戶分類研究中的主流的有監(jiān)督機(jī)器學(xué)習(xí)算法.采用這些學(xué)習(xí)方法有助于本文中提出的基于網(wǎng)絡(luò)時(shí)延特征的流量識(shí)別模型向其他應(yīng)用場(chǎng)景和樣本數(shù)據(jù)上的移植應(yīng)用,進(jìn)而比較應(yīng)用結(jié)果.表4中給出了在實(shí)驗(yàn)過程中相應(yīng)的模型參數(shù)設(shè)置.這些參數(shù)的選取是在借鑒了過往經(jīng)驗(yàn)得到的經(jīng)典參數(shù)設(shè)置的范圍基礎(chǔ)上,在實(shí)驗(yàn)過程中通過上下浮動(dòng)模擬退火算法進(jìn)行隨機(jī)微調(diào)擇優(yōu),并進(jìn)行多次實(shí)驗(yàn)取平均分類結(jié)果,從中再選定最佳分類結(jié)果的參數(shù)設(shè)置.為了避免過學(xué)習(xí)及欠學(xué)習(xí)狀態(tài)的情況發(fā)生,采用10折交叉驗(yàn)證的方法進(jìn)行樣本的訓(xùn)練測(cè)試.具體方法如下:實(shí)驗(yàn)過程中,隨機(jī)抽取10%的樣本作為測(cè)試集,其余為訓(xùn)練集,該過程重復(fù)10次.實(shí)驗(yàn)中每次訓(xùn)練樣本和測(cè)試樣本都隨機(jī)抽取,從而保證實(shí)驗(yàn)的有效性.

    Table 4 Parameter Setting of the Classifier Models表4 分類器模型的參數(shù)設(shè)置

    4.3 實(shí)驗(yàn)結(jié)果

    針對(duì)不同條件下獲取的網(wǎng)絡(luò)流量,編寫程序?qū)崿F(xiàn)相關(guān)特征的自動(dòng)提取工具,計(jì)算并提取了如表5中列出的6個(gè)特征.移動(dòng)蜂窩網(wǎng)絡(luò)與固網(wǎng)的不同主要體現(xiàn)在數(shù)據(jù)鏈路屬性方面,而這些屬性會(huì)給該網(wǎng)絡(luò)中傳輸?shù)臄?shù)據(jù)流量帶來時(shí)延層面的印記.鏈路時(shí)延最小值體現(xiàn)了2種網(wǎng)絡(luò)技術(shù)在傳輸時(shí)延瓶頸方面的差異;鏈路時(shí)延標(biāo)準(zhǔn)差描述了2種網(wǎng)絡(luò)技術(shù)在時(shí)延方面的波動(dòng)性的差異;RRC相關(guān)的4個(gè)特征從不同的側(cè)面量化通信協(xié)議中RRC機(jī)制給網(wǎng)絡(luò)時(shí)延帶來的影響.6種特征從不同層面刻畫傳輸鏈路、協(xié)議給流量帶來的影響,作為一個(gè)特征集合,可對(duì)流量的識(shí)別產(chǎn)生最好的效果.

    Table 5 Extracted Traffic Features表5 提取的流量特征

    首先對(duì)于不同特征的取值分布情況進(jìn)行分析.圖9中橫軸為各個(gè)特征的取值,縱軸為其累積分布.圖9(a)顯示,3G4G的鏈路時(shí)延最小值大于20 ms的流量占95%以上,而在固網(wǎng)流量中的比例約為20%.圖9(b)顯示3G4G流量標(biāo)準(zhǔn)差小于50 ms的比例為50%,而固網(wǎng)中該比例約為80%.圖9(c)顯示3G4G在RRC處于IDLE狀態(tài)時(shí),時(shí)延的標(biāo)準(zhǔn)差小于400 ms的不到40%,而固網(wǎng)基本100%小于400 ms.圖9(d)和圖9(e)顯示3G4G在RRC不同狀態(tài),時(shí)延的平均值距離和標(biāo)準(zhǔn)差距離小于400 ms的不到40%,而固網(wǎng)基本100%小于400 ms.圖9(f)顯示,在包間隔大于15 s時(shí),3G4G流量中有超過60%的流量重傳率大于0.4,固網(wǎng)中該比例約為20%.

    傳統(tǒng)網(wǎng)絡(luò)流量的分類方法中,開源項(xiàng)目WURFL(wireless universal resource file)[19]提出了一種利用HTTP報(bào)文首部中的UA (user-agent)特征字段,識(shí)別移動(dòng)終端操作系統(tǒng)的方法.在流量分析時(shí),使用深度包解析(DPI)的方法提取HTTP協(xié)議中的UA字段,但由于僅依賴于字符串匹配的方式,分類的準(zhǔn)確度穩(wěn)定在12%左右,分類效果遠(yuǎn)遠(yuǎn)低于本文的提出方法.Liu等人[20]通過匹配UA和終端操作系統(tǒng)的對(duì)應(yīng)關(guān)系,獲得UA對(duì)應(yīng)的操作系統(tǒng),進(jìn)而篩選出手機(jī)終端對(duì)應(yīng)的移動(dòng)互聯(lián)網(wǎng)流量.該方法對(duì)識(shí)別移動(dòng)互聯(lián)網(wǎng)流量具有較高的正確率91.5%,但對(duì)于那些不能使用DPI分析方法的流量,例如經(jīng)過隱私處理的公開數(shù)據(jù)集(如本文中使用的數(shù)據(jù)集),則無法使用.以上2種方法均通過終端操作系統(tǒng)識(shí)別流量,并無法區(qū)分終端的網(wǎng)絡(luò)接入類型,而本文方法能夠準(zhǔn)確區(qū)分固網(wǎng)與3G4G網(wǎng)絡(luò).

    李平紅等人[21]中提出了一種基于多分類器集成的網(wǎng)絡(luò)流量分類算法MCSE,將每個(gè)分類器的分類結(jié)果與多個(gè)分類器的分類結(jié)果進(jìn)行綜合考慮,從而有機(jī)地選擇基集成器進(jìn)行集成最終的分類結(jié)果.基于不同個(gè)數(shù)的基分類器,分類準(zhǔn)確率在91%~96%之間.若希望達(dá)到96%左右的準(zhǔn)確率,則需要140個(gè)基分類器,時(shí)間與空間開銷較大.周文剛等人[22]中提出一種基于改進(jìn)的k-means的半監(jiān)督學(xué)習(xí)的流量分類識(shí)別算法,獲得更好的聚類劃分結(jié)果并利用已知標(biāo)記信息完成聚類匹配過程,分類準(zhǔn)確率在80%~90%之間,分類結(jié)果也不及本文分類方法的準(zhǔn)確率高.

    因此,本文提出的移動(dòng)蜂窩網(wǎng)絡(luò)流量的時(shí)延特征分析與識(shí)別方法能夠較好地識(shí)別網(wǎng)絡(luò)的接入類型.相較傳統(tǒng)的網(wǎng)絡(luò)流量識(shí)別方法,不再是針對(duì)網(wǎng)絡(luò)協(xié)議類型進(jìn)行分流,而是延伸至網(wǎng)絡(luò)的接入類型,更具有全局性與前景應(yīng)用價(jià)值.同時(shí),該方法的網(wǎng)絡(luò)流量分類準(zhǔn)確率也高于傳統(tǒng)的其他分流方法,無需冗雜的計(jì)算過程與大量的時(shí)間空間開銷.

    此外,為了進(jìn)一步評(píng)估并度量各個(gè)特征在分類過程中的顯著程度和決策權(quán)重,同時(shí)針對(duì)樣本流量和實(shí)驗(yàn)數(shù)據(jù),針對(duì)流量識(shí)別分類目標(biāo),計(jì)算了6種時(shí)延特征的信息增益如圖10所示.

    Fig. 10 Information gain of delay features to the classification圖10 不同時(shí)延特征對(duì)分類的信息增益

    從圖10可以看出,特征C1的信息增益最大,即鏈路時(shí)延最小值對(duì)流量識(shí)別有最大的區(qū)分度,這表明移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)的鏈路時(shí)延下限有較為明顯的差異;特征C3,C4,C5的信息增益也較大,即RRC不同狀態(tài)下時(shí)延分布的統(tǒng)計(jì)特征對(duì)流量的識(shí)別也有較大貢獻(xiàn);C6的信息增益較小,這是因?yàn)橛捎赗RC空閑態(tài)導(dǎo)致數(shù)據(jù)重傳的包較少,捕獲概率較小,僅能作為RRC空閑態(tài)高時(shí)延的補(bǔ)充描述;C2的信息增益最小,主要是因?yàn)殡S著移動(dòng)蜂窩網(wǎng)絡(luò)技術(shù)的提升,其網(wǎng)絡(luò)質(zhì)量與固網(wǎng)之間的距離在縮小,用戶對(duì)移動(dòng)蜂窩網(wǎng)絡(luò)和固網(wǎng)的上網(wǎng)體驗(yàn)比較接近.

    在實(shí)驗(yàn)過程中發(fā)現(xiàn),對(duì)于IP地址存活時(shí)間較長(zhǎng),數(shù)據(jù)發(fā)送比較稀疏,例如手機(jī)處于屏保狀態(tài)的情況,即時(shí)通信軟件發(fā)送的流量,能較好地計(jì)算RRC處于IDLE狀態(tài)下的時(shí)延和重傳率等特性;而對(duì)于IP地址存活時(shí)間較短或一直高速收發(fā)狀態(tài)的流量,RRC處于IDLE狀態(tài)的機(jī)會(huì)較少,導(dǎo)致RRC特征信息量較小,甚至特征缺失.

    5 結(jié) 語

    本文研究了網(wǎng)絡(luò)用戶通過寬帶固定網(wǎng)絡(luò)或移動(dòng)蜂窩網(wǎng)絡(luò)接入互聯(lián)網(wǎng)所產(chǎn)生流量的時(shí)延特征差異,并從理論上分析了2種接入方式的數(shù)據(jù)鏈路管理和鏈路協(xié)議實(shí)現(xiàn)機(jī)制上的差異,相應(yīng)地設(shè)計(jì)了6種流量時(shí)延特征,并經(jīng)過實(shí)驗(yàn)確認(rèn)了特征差異的存在性和顯著性.基于這些特征,使用多種有監(jiān)督機(jī)器學(xué)習(xí)算法構(gòu)建分類器,用于互聯(lián)網(wǎng)骨干網(wǎng)混合流量中區(qū)分移動(dòng)蜂窩網(wǎng)絡(luò)數(shù)據(jù)流量和固定接入網(wǎng)絡(luò)數(shù)據(jù)流量.實(shí)驗(yàn)采用公開的智能終端產(chǎn)生的互聯(lián)網(wǎng)流量數(shù)據(jù),進(jìn)行固網(wǎng)與3G4G流量分類和客戶端網(wǎng)絡(luò)鏈路識(shí)別,最高可同時(shí)獲得92%以上的準(zhǔn)確率和召回率,體現(xiàn)了良好的流量時(shí)延特征描述能力.5G通信技術(shù)是4G之后的延伸,正處于研究階段,將成為未來一段時(shí)間內(nèi)移動(dòng)通信的中堅(jiān)力量.相較3G4G網(wǎng)絡(luò),5G將帶來更快的網(wǎng)速、更好的信號(hào)、更小的延時(shí),但本文的研究方法立足于網(wǎng)絡(luò)通信中的時(shí)延特征差異,5G網(wǎng)絡(luò)仍然具有RRC相關(guān)的4個(gè)特征,鏈路時(shí)延最小值特征相較3G4G會(huì)更接近固網(wǎng),但依舊會(huì)存在一定的差異性.同樣鏈路時(shí)延標(biāo)準(zhǔn)差也是移動(dòng)網(wǎng)絡(luò)的主要特性,難以實(shí)現(xiàn)固網(wǎng)一樣保證網(wǎng)絡(luò)通信的穩(wěn)定性,因此本文提出的識(shí)別方法依然適用于未來的5G移動(dòng)通信.

    未來針對(duì)該流量分類模型的進(jìn)一步優(yōu)化和完善工作包括:1)研究如何更加有效地降低網(wǎng)絡(luò)負(fù)載帶來的時(shí)延噪聲;2)克服不同運(yùn)營(yíng)商的RRC狀態(tài)轉(zhuǎn)換時(shí)間差異,提高模型在不同移動(dòng)運(yùn)營(yíng)商網(wǎng)絡(luò)中的通用性;3)考慮更加精準(zhǔn)地判斷RRC的狀態(tài)變化,嘗試將3G與4G區(qū)流量分開,或者將不同運(yùn)營(yíng)商的流量區(qū)分開.

    猜你喜歡
    固網(wǎng)網(wǎng)絡(luò)流量蜂窩
    基于多元高斯分布的網(wǎng)絡(luò)流量異常識(shí)別方法
    基于神經(jīng)網(wǎng)絡(luò)的P2P流量識(shí)別方法
    蜂窩住宅
    蓄熱式爐用蜂窩體有了先進(jìn)適用的標(biāo)準(zhǔn)
    四川冶金(2019年5期)2019-12-23 09:04:50
    “蜂窩”住進(jìn)輪胎里
    AVB網(wǎng)絡(luò)流量整形幀模型端到端延遲計(jì)算
    聯(lián)通固網(wǎng)增值業(yè)務(wù)營(yíng)銷戰(zhàn)略探究
    88.8萬
    網(wǎng)絡(luò)流量監(jiān)控對(duì)網(wǎng)絡(luò)安全治理的重要性
    河南科技(2014年23期)2014-02-27 14:18:43
    固網(wǎng)手機(jī)尋址下移引發(fā)的話單問題及解決辦法
    科技傳播(2011年18期)2011-06-13 06:36:18
    迭部县| 旺苍县| 卓资县| 宁安市| 高邑县| 东光县| 景谷| 吴堡县| 堆龙德庆县| 山西省| 肥乡县| 大丰市| 沙雅县| 柏乡县| 黔江区| 辽中县| 康乐县| 石棉县| 广东省| 泸州市| 湟源县| 湘乡市| 北票市| 永胜县| 西乌珠穆沁旗| 库尔勒市| 米脂县| 广丰县| 绩溪县| 辽宁省| 东台市| 天台县| 东源县| 阳泉市| 内乡县| 定陶县| 慈溪市| 昌宁县| 南汇区| 永昌县| 江阴市|