董雪
摘要:目前,高校無線網(wǎng)絡主要通過路測獲取數(shù)據(jù)后進行人工分析得到優(yōu)化策略,但由于路測數(shù)據(jù)不僅數(shù)量龐大而且格式多樣,僅依靠人工不能全面有效地找出影響網(wǎng)絡性能的關鍵因素,因此數(shù)據(jù)挖掘技術的應用十分必要。本文介紹用數(shù)據(jù)挖掘技術分析影響無線網(wǎng)絡性能的關鍵因素,以便指導我們高效、有針對性的提升無線網(wǎng)絡性能。
關鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)分析;無線網(wǎng)絡優(yōu)化技術;影響因素
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1009-3044(2018)11-0038-02
1 前言
高校信息化建設是我國信息化建設的重要組成部分,網(wǎng)絡是高校信息化建設的基礎保障。近年來,隨著無線網(wǎng)絡技術迅猛發(fā)展,無線網(wǎng)絡信號的覆蓋范圍越來越廣以及個人手持終端性能的不斷提高,師生們對數(shù)據(jù)傳輸業(yè)務依賴也越來越高[1]。而高校作為無線網(wǎng)使用密集區(qū),已經(jīng)無法滿足過去低速率的數(shù)據(jù)傳輸,更多關注的是不受時間和空間限制的高速率大流量數(shù)據(jù)業(yè)務,這一需求的出現(xiàn)就要求無線網(wǎng)絡能夠高質(zhì)量、快速穩(wěn)定運行[2]。
我國大多數(shù)高校無線網(wǎng)絡在初期建設時,不可避免的會出現(xiàn)整體規(guī)劃不科學、不合理等問題,造成無線網(wǎng)絡性能不理想,因此需要對無線網(wǎng)絡進行合理優(yōu)化[3],無線網(wǎng)絡在運行過程中會產(chǎn)生大量數(shù)據(jù),通過數(shù)據(jù)挖掘技術的應用,找到影響無線網(wǎng)絡性能的關鍵因素,分析與網(wǎng)絡性能提升密切相關的數(shù)據(jù),為無線網(wǎng)絡優(yōu)化提供決策性意見,有針對性并且高效的提升無線網(wǎng)絡性能,使得其在資源設備有限的情況下,資源利用率更高、網(wǎng)絡整體性能更優(yōu)、用戶滿意度更高,盡可能消除初期建設時的規(guī)劃不合理。
2無線網(wǎng)絡性能指標
無線網(wǎng)絡優(yōu)化是指經(jīng)過對現(xiàn)在已有并已經(jīng)投入運行的網(wǎng)絡進行話務數(shù)據(jù)分析、現(xiàn)場測試數(shù)據(jù)采集、站點參數(shù)分析等手段,找到影響無線網(wǎng)絡質(zhì)量的問題所在,并且通過站點參數(shù)的修改、網(wǎng)絡結構的調(diào)整以及重新調(diào)整設備配置和采取某些技術手段,確保系統(tǒng)高質(zhì)量、穩(wěn)定的運行,使現(xiàn)有網(wǎng)絡資源得到最充分利用[4]。
反映無線網(wǎng)絡運行狀況以及性能的指標主要包括以下內(nèi)容:接入點的信號強度、認證的成功率、吞吐量、丟包率、信噪比、用戶的掉線率、網(wǎng)絡時延以及誤碼率等 [5]。這些指標是通過路測獲得的真實數(shù)據(jù),與無線網(wǎng)絡性能息息相關,利用數(shù)據(jù)挖掘技術對這些主要影響因素進行分析,有助于準確、快速定位故障點,并找到影響因素間的相互關系,直擊故障發(fā)生的源頭。
(1)接入點的信號強度。在通常情況下我們認為-70dbm以上為理想的信號強度,-70dbm~80dbm為中等信號強度,小于-80dbm為弱信號強度。
(2)認證的成功率主要體現(xiàn)了用戶與AP連接成功與否。
(3)吞吐量是指在沒有幀丟失的情況下,設備能夠接受并轉(zhuǎn)發(fā)的最大數(shù)據(jù)速率。
(4)丟包率是指數(shù)據(jù)以數(shù)據(jù)包的形式傳輸,傳輸過程中出現(xiàn)的數(shù)據(jù)丟失現(xiàn)象, 丟包數(shù)據(jù)占總傳輸數(shù)據(jù)的百分比,一般情況下丟包率為0是正常。
(5)信噪比是指信號與噪聲的比值,一般情況下,信噪比越大,則信號質(zhì)量越好,混在信號里的噪聲越小,否則相反。
(6)無線用戶的掉線率是指(eNodeB發(fā)起S1RESET導致的UEContext釋放次數(shù)+UE Context異常釋放次數(shù))/(UE Context建立成功總次數(shù)+*小區(qū)遺留UE上下文個數(shù))*100%,一定程度上反映了無線網(wǎng)絡的質(zhì)量優(yōu)劣,如若掉線率過高則會使無線網(wǎng)絡性能下降,用戶感知下降。
(7)網(wǎng)絡時延是由過大的網(wǎng)絡流量造成的設備反應緩慢,網(wǎng)絡時延在1~30ms之間時,用戶幾乎感受不到延遲,大流量的數(shù)據(jù)傳輸業(yè)務都非常順暢,在31~50ms之間時,用戶沒有明顯感覺到延遲的情況,大流量數(shù)據(jù)傳輸業(yè)務都可正常進行,在51~100ms之間時,用戶能明顯感覺到延遲,大流量數(shù)據(jù)傳輸業(yè)務稍有停頓,當大于100ms時,大流量數(shù)據(jù)傳輸業(yè)務無法正常進行,有明顯的卡頓、丟包并掉線現(xiàn)象出現(xiàn)。
(8)誤碼率是評價數(shù)據(jù)在一定時間內(nèi)進行傳輸時的精確性指標,一定程度上反映了信號質(zhì)量的好壞。
3 數(shù)據(jù)挖掘技術的應用
無線網(wǎng)絡質(zhì)量的優(yōu)劣和各個性能指標的變化以及指標間的相互聯(lián)系密切相關,它們客觀反映了無線網(wǎng)路的運行狀況。無線網(wǎng)絡運行過程中會產(chǎn)生大量且格式不一的性能指標數(shù)據(jù),人工分析這些數(shù)據(jù)費時又費力,而數(shù)據(jù)挖掘技術可以準確并高效的幫助我們完成大量性能指標數(shù)據(jù)的分析,從而達到對整個無線網(wǎng)絡從整體到局部的細致檢查,精準找到問題的關鍵點,進而有針對性地進行網(wǎng)絡優(yōu)化。
數(shù)據(jù)挖掘技術是從大量的、無規(guī)則的數(shù)據(jù)中提取出有價值的決策性信息的一種數(shù)據(jù)分析技術。無線網(wǎng)絡運行過程中每一分每一秒都在產(chǎn)生數(shù)據(jù),這些數(shù)據(jù)日積月累越來越龐大,在這些海量的數(shù)據(jù)中,存在著有用數(shù)據(jù),如與無線網(wǎng)絡性能分析緊密的性能指標數(shù)據(jù),也存在著大量的無用,甚至因為人為或者設備本身造成的錯誤數(shù)據(jù),僅僅依靠個人經(jīng)驗對這些數(shù)據(jù)進行分析時,由于分析人員本身的專業(yè)知識與能力的差異會給分析結果加入不可控的個人主觀色彩,導致分析結果不夠客觀和全面,數(shù)據(jù)挖掘技術可以有效克服這些客觀原因帶來的缺陷。
數(shù)據(jù)挖掘在20世紀中期,隨著機器學習、統(tǒng)計分析等關聯(lián)學科的發(fā)展而發(fā)展起來,它被定義為從數(shù)據(jù)中找到未知且有價值知識的不平凡過程,它可以對數(shù)據(jù)自動地進行分析處理并進行歸納推理,從中找出數(shù)據(jù)所含有的深層次模式,它的模型如下圖所示,數(shù)據(jù)挖掘流程共有6個階段:
(1)問題定義。第一步是分析無線網(wǎng)絡優(yōu)化問題要干什么以及怎么辦,也就是說在對高校無線網(wǎng)絡進行優(yōu)化時,具體需要優(yōu)化哪些方面,例如網(wǎng)絡安全方面、網(wǎng)絡資源分配方面還是網(wǎng)絡故障方面,為問題設計一個總體并且詳細的計劃。
(2)數(shù)據(jù)理解。首先確保路測數(shù)據(jù)真實有效,然后對數(shù)據(jù)質(zhì)量進行一個初步評估,例如掌握數(shù)據(jù)集數(shù)量的大小、分析數(shù)據(jù)特征并進行統(tǒng)計、分析數(shù)據(jù)是否存在噪聲以及是否完整等方面。
(3)數(shù)據(jù)準備。對各個路測設備收集來的數(shù)據(jù)進行數(shù)據(jù)清洗、統(tǒng)一存儲,融合成為一個更全面、更準確的綜合性無線網(wǎng)絡優(yōu)化相關數(shù)據(jù)集。
(4)模型建立。經(jīng)過上述數(shù)據(jù)處理過程后,就要利用數(shù)據(jù)挖掘算法來對數(shù)據(jù)集進行分析,數(shù)據(jù)挖掘算法是數(shù)據(jù)挖掘過程中的核心部分,算法的選擇決定了無線網(wǎng)絡優(yōu)化模型的功效。挖掘算法從功能角度劃分主要有分類算法、序列模式發(fā)現(xiàn)算法、數(shù)據(jù)預測算法、關聯(lián)規(guī)則、聚類算法等,其中,分類算法分析已有數(shù)據(jù)集的差異實現(xiàn)對未知數(shù)據(jù)的分類預測;序列模式發(fā)現(xiàn)算法與關聯(lián)規(guī)則分析數(shù)據(jù)記錄彼此之間的聯(lián)系;預測算法分析數(shù)據(jù)本身特性并找到數(shù)據(jù)之間潛在規(guī)則并對其某方面進行預測。由于關心的問題不一樣所選擇的的數(shù)據(jù)挖掘算法也會有所不同,建模是一個需要反復多次進行的過程,需要不斷調(diào)整算法參數(shù),已得到更可靠的無線網(wǎng)絡優(yōu)化模型。
(5)評估。對所建立的無線網(wǎng)絡優(yōu)化模型的評估是整個數(shù)據(jù)挖掘過程中的重要環(huán)節(jié),但是經(jīng)常被忽略。這一步是驗證所建立的模型以及建模過程中的每個步驟是否有效,確保模型能能夠提供給我們無線網(wǎng)絡優(yōu)化方面的決策性指導意見。
(6)部署。無線網(wǎng)絡優(yōu)化模型所給出的決策性意見由于專業(yè)性強,需要在該階段經(jīng)過專業(yè)人員的解釋,再呈現(xiàn)給無線網(wǎng)絡優(yōu)化師。
4 結語
隨著大數(shù)據(jù)時代的到來,高校作為網(wǎng)絡用戶密集區(qū)域?qū)o線網(wǎng)絡各方面的要求都不斷增多,無線網(wǎng)絡的抵御攻擊的能力、上網(wǎng)速度以及穩(wěn)定運行等方面都是高校師生所關注的重點,利用數(shù)據(jù)挖掘技術能夠幫助無線網(wǎng)絡優(yōu)化師有效提升網(wǎng)絡性能。由于高校學生宿舍區(qū)、教學區(qū)、辦公區(qū)等區(qū)域的劃分,數(shù)據(jù)挖掘還能夠分析不同用戶行為,實現(xiàn)無線網(wǎng)絡資源的合理分配,使無線網(wǎng)絡資源達到利用率最大化,全面提升高校師生無線網(wǎng)體驗,更好地為高校信息化建設服務。
參考文獻:
[1] 馬煜. 基于數(shù)據(jù)挖掘?qū)π@網(wǎng)用戶網(wǎng)絡行為的分析[J]. 科技創(chuàng)新與應用, 2016,21(34).25-26
[2] 楊莉君. 基于數(shù)據(jù)挖掘技術的校園通信用戶模型建立[J]. 黑龍江科技信息, 2013,13(20):165-165.
[3] 李慧芳, 白珊, 馬強,等. 基于Spark的智慧校園數(shù)據(jù)挖掘研究[J]. 智能計算機與應用, 2016, 6(6): 106-107.
[4] 楊國靜. 基于數(shù)據(jù)挖掘的高校教學數(shù)據(jù)分析研究[D]. 河北師范大學, 2015.