王飛 中國(guó)移動(dòng)通信集團(tuán)陜西有限公司
鑒于互聯(lián)網(wǎng)服務(wù)差異及資源端到端質(zhì)量不穩(wěn)定,上網(wǎng)體驗(yàn)問(wèn)題已成為制約全業(yè)務(wù)快速發(fā)展的瓶頸。由于不能常態(tài)化實(shí)時(shí)測(cè)量全量用戶(hù)的感知變化,“連而不通、通而不暢、暢而不穩(wěn)”的狀況仍不斷上演。如何重現(xiàn)用戶(hù)的上網(wǎng)過(guò)程,依托用戶(hù)真實(shí)訪(fǎng)問(wèn)數(shù)據(jù)提前發(fā)現(xiàn)感知短板,并提供事前優(yōu)化,已成為決定寬帶運(yùn)營(yíng)商公司全業(yè)務(wù)競(jìng)爭(zhēng)力的關(guān)鍵因素。
千兆無(wú)源光網(wǎng)絡(luò),簡(jiǎn)稱(chēng)GPON網(wǎng)絡(luò)。該網(wǎng)絡(luò)故障自動(dòng)排查技術(shù)依賴(lài)用戶(hù)真實(shí)的上網(wǎng)數(shù)據(jù)采集分析,并解決用戶(hù)上網(wǎng)路徑的自動(dòng)識(shí)別,通過(guò)建立“用戶(hù)上網(wǎng)設(shè)備級(jí)聯(lián)模型”,對(duì)寬帶服務(wù)過(guò)程中涉及的用戶(hù)異常掉線(xiàn)、寬帶認(rèn)證性能、互聯(lián)網(wǎng)傳輸質(zhì)量、DNS解析、用戶(hù)流量、用戶(hù)真實(shí)訪(fǎng)問(wèn)延時(shí)、下載速率等端到端多環(huán)節(jié)指標(biāo)標(biāo)的采集、關(guān)聯(lián)分析,可建立起多維的寬帶端到端質(zhì)量評(píng)估體系及預(yù)警機(jī)制。
依托于自身實(shí)踐經(jīng)驗(yàn)及市場(chǎng)上的分析需求,本次設(shè)計(jì)的GPON網(wǎng)絡(luò)故障的自動(dòng)排查方案的目標(biāo)體現(xiàn)在四個(gè)層面:
(1)自動(dòng)核查用戶(hù)上網(wǎng)級(jí)聯(lián)關(guān)系,根本解決用戶(hù)端口資源信息不準(zhǔn)確問(wèn)題。
(2)通過(guò)基于用戶(hù)真實(shí)上網(wǎng)行為,形成全網(wǎng)覆蓋的端到端質(zhì)量指標(biāo)分析能力。
(3)提供基于大數(shù)據(jù)的多維度分析能力,實(shí)現(xiàn)網(wǎng)絡(luò)指標(biāo)與感知指標(biāo)質(zhì)量差關(guān)聯(lián)分析。
(4)依賴(lài)“用戶(hù)上網(wǎng)設(shè)備級(jí)聯(lián)模型”整合排障信息,力爭(zhēng)一鍵式排障處理。
對(duì)于GPON網(wǎng)絡(luò)而言,寬帶運(yùn)行質(zhì)量差主要體現(xiàn)在網(wǎng)絡(luò)側(cè)接入差、用戶(hù)側(cè)體驗(yàn)差、業(yè)務(wù)內(nèi)容設(shè)置差等三個(gè)維度,下面展開(kāi)一一闡述。
(1)用戶(hù)側(cè)質(zhì)量差原因
用戶(hù)側(cè)質(zhì)量差原因主要體現(xiàn)在用戶(hù)家用無(wú)線(xiàn)路由質(zhì)量差、用戶(hù)主動(dòng)設(shè)置或被篡改成異網(wǎng)DNS、電腦環(huán)境問(wèn)題、家庭組網(wǎng)環(huán)境等層面。
(2)網(wǎng)絡(luò)側(cè)質(zhì)量差原因
網(wǎng)絡(luò)側(cè)質(zhì)量差原因依據(jù)網(wǎng)絡(luò)類(lèi)型的不同,也存在一定的差異。
PON接入網(wǎng):光貓收光強(qiáng)度超過(guò)閥值、PON收光異常、PON下聯(lián)用戶(hù)過(guò)載、PON流量過(guò)載等;
城域網(wǎng):BAS下聯(lián)口流量過(guò)載、光模塊異常、BAS地址池過(guò)載等;
集中支撐類(lèi):NAT地址過(guò)載問(wèn)題、認(rèn)證掉線(xiàn)問(wèn)題、DNS解析不佳等。
(3)業(yè)務(wù)內(nèi)容側(cè)質(zhì)量差原因
用戶(hù)側(cè)質(zhì)量差原因主要體現(xiàn)在GPON網(wǎng)絡(luò)用戶(hù)對(duì)已經(jīng)引入內(nèi)容仍異網(wǎng)訪(fǎng)問(wèn);忙時(shí)Cache壓力大,造成感知差;用戶(hù)個(gè)性訪(fǎng)問(wèn),內(nèi)容未疏導(dǎo);內(nèi)容源或鏈路質(zhì)量差等層面。
從用戶(hù)帳號(hào)視角“端到端”整合的“用戶(hù)側(cè)、網(wǎng)絡(luò)側(cè)、內(nèi)容側(cè)”全景信息,形成用戶(hù)帳號(hào)維度貫穿的運(yùn)維數(shù)據(jù)中心。在此基礎(chǔ)上提供質(zhì)量差發(fā)現(xiàn)、排障定界、故障影響分析等定位設(shè)計(jì)思路。
筆者結(jié)合自身實(shí)踐調(diào)研,發(fā)現(xiàn)GPON網(wǎng)絡(luò)定位不精確的難點(diǎn)主要體現(xiàn)在三個(gè)層面:
(1)用戶(hù)側(cè)問(wèn)題突出,可監(jiān)測(cè)指標(biāo)少
用戶(hù)側(cè)終端類(lèi)型和組網(wǎng)環(huán)境差異大,問(wèn)題最為突出,上門(mén)排查成本高。
(2)需要全網(wǎng)、全時(shí)監(jiān)測(cè)上網(wǎng)過(guò)程,確保每個(gè)用戶(hù)訪(fǎng)問(wèn)過(guò)程可復(fù)現(xiàn)
針對(duì)用戶(hù)側(cè)故障排查,每一個(gè)用戶(hù)都是一個(gè)監(jiān)控點(diǎn),傳統(tǒng)的撥測(cè)手段受到監(jiān)控點(diǎn)數(shù)量和撥測(cè)樣本的限制,無(wú)法重現(xiàn)用戶(hù)真實(shí)訪(fǎng)問(wèn)感知。排障處理需要全網(wǎng)、全時(shí)、全過(guò)程監(jiān)測(cè)上網(wǎng)過(guò)程,確保每個(gè)用戶(hù)訪(fǎng)問(wèn)過(guò)程可復(fù)現(xiàn)。
(3)帳號(hào)級(jí)聯(lián)設(shè)備及端口準(zhǔn)確性是關(guān)鍵
網(wǎng)絡(luò)指標(biāo)與業(yè)務(wù)感知指標(biāo)的協(xié)同分析的根本是,網(wǎng)絡(luò)指標(biāo)與告警源于設(shè)備、端口,如何通過(guò)用戶(hù)上網(wǎng)路徑核查,將網(wǎng)絡(luò)指標(biāo)貫穿到用戶(hù)帳號(hào)緯度,是指導(dǎo)用戶(hù)質(zhì)量?jī)?yōu)化和故障定界的關(guān)鍵。
以GPON網(wǎng)絡(luò)定位難點(diǎn)作為解決問(wèn)題的切入點(diǎn),有的放矢從三個(gè)層面展開(kāi)問(wèn)題突破思路的制定。
(1)帳號(hào)上網(wǎng)路徑自動(dòng)核查,解決級(jí)聯(lián)設(shè)備及端口準(zhǔn)確性問(wèn)題
采用“MAC/VLAN端口信息”識(shí)別手段,與PPPOE+技術(shù)互為補(bǔ)充,自動(dòng)構(gòu)建基于現(xiàn)網(wǎng)數(shù)據(jù)的“賬號(hào)-〉ONU及端口 -〉PON 口 -〉 OLT-〉 BAS”上網(wǎng)路徑視圖。實(shí)現(xiàn)用戶(hù)賬號(hào)所在ONU端口精準(zhǔn)核查,保證有源設(shè)備級(jí)聯(lián)信息的百分百準(zhǔn)確。
(2)用戶(hù)感知多法測(cè)量,確保全網(wǎng)、全時(shí)監(jiān)測(cè)用戶(hù)上網(wǎng)過(guò)程
大數(shù)據(jù)也要效益比,選擇共性、可測(cè)量的感知指標(biāo)(上網(wǎng)延時(shí)、速率、流量等),實(shí)現(xiàn)全網(wǎng)用戶(hù)帳號(hào)溯源的關(guān)聯(lián)分析。在成本可控前提下,實(shí)現(xiàn)全網(wǎng)用戶(hù)全時(shí)全量監(jiān)控。
(3)通過(guò)大數(shù)據(jù)分析,拓展用戶(hù)側(cè)指標(biāo)監(jiān)控能力
通過(guò)上網(wǎng)數(shù)據(jù)特征分析,實(shí)現(xiàn)用戶(hù)家用路由器廠(chǎng)商分析、下掛用戶(hù)數(shù)分析、長(zhǎng)時(shí)間未重啟家用路由器分析;通過(guò)感知數(shù)據(jù)聚類(lèi)對(duì)比,實(shí)現(xiàn)用戶(hù)個(gè)體感知與同ONU、同PON口、同OLT感知對(duì)比分析,以排除線(xiàn)路共性因素,定位用戶(hù)側(cè)質(zhì)量差原因。
依托用戶(hù)上網(wǎng)資源模型,從“寬帶帳號(hào)”視角整合設(shè)備告警、流量擁塞、認(rèn)證失敗、異常掉線(xiàn)、網(wǎng)絡(luò)性能、用戶(hù)感知的全景指標(biāo),方便運(yùn)維人員快速定位故障,簡(jiǎn)化后續(xù)流程。
(1)圖形化端到端呈現(xiàn),整合用戶(hù)側(cè)質(zhì)量差要素
提供用戶(hù)上網(wǎng)級(jí)聯(lián)設(shè)備圖像顯示,可直觀(guān)展現(xiàn)用戶(hù)上網(wǎng)所經(jīng)過(guò)主要設(shè)備及端口狀態(tài)(包括:帳號(hào)、家用路由器、ONU/端口、OLT/PON口、BAS/端口、內(nèi)容源分布)。同時(shí)通過(guò)設(shè)備及鏈路圖標(biāo)顏色變化,顯示各質(zhì)量差故障設(shè)備點(diǎn)。
(2)分段分項(xiàng)定界,實(shí)現(xiàn)質(zhì)差問(wèn)題原因判定
按照用戶(hù)側(cè)、網(wǎng)絡(luò)側(cè)及內(nèi)容側(cè)三個(gè)方面,展開(kāi)基于問(wèn)題的成因分析。
首先,需要對(duì)用戶(hù)家庭側(cè)環(huán)境數(shù)據(jù)整合與定界。它主要的方案設(shè)計(jì)如下:
① 用戶(hù)本人信息:用戶(hù)上網(wǎng)級(jí)聯(lián)關(guān)系核查、接入帶寬核查、當(dāng)前訪(fǎng)問(wèn)速率、當(dāng)前下載速率。
② 家用路由器信息:是否為路由器接入、路由器廠(chǎng)商、家庭下聯(lián)用戶(hù)數(shù)。
③ 接入 ONU 質(zhì)量信息:ONU 基本信息、ONU 光功率、ONU 下掛用戶(hù)整體訪(fǎng)問(wèn)延時(shí)、下掛質(zhì)差用戶(hù)占比。
④ 異常掉線(xiàn)信息:采用可視化分析方式,整理異常掉線(xiàn)所出現(xiàn)的原因,來(lái)進(jìn)行整合分析。
其次,網(wǎng)絡(luò)側(cè)質(zhì)量數(shù)據(jù)整合與定界。
① 接入PON質(zhì)量信息:PON口信息、PON口光功率、PON下掛用戶(hù)數(shù)、PON下掛用戶(hù)數(shù)、PON口下掛用戶(hù)整體訪(fǎng)問(wèn)延時(shí)、下掛質(zhì)差用戶(hù)占比、PON口流量與峰值占比。
② 接入OLT質(zhì)量信息:OLT基本信息、OLT下掛用戶(hù)數(shù)、OLT下掛用戶(hù)整體訪(fǎng)問(wèn)延時(shí)、下掛質(zhì)差用戶(hù)占比、OLT上行流量與峰值占比。
③ 訪(fǎng)問(wèn)行為及業(yè)務(wù)體驗(yàn)數(shù)據(jù)整合與定界:用戶(hù)訪(fǎng)問(wèn)量統(tǒng)計(jì)、訪(fǎng)問(wèn)資源分布分析、移動(dòng)網(wǎng)內(nèi)訪(fǎng)問(wèn)延時(shí)分析、外網(wǎng)訪(fǎng)問(wèn)延時(shí)分析、下載帶寬分析等。
最后,從業(yè)務(wù)內(nèi)容側(cè)展開(kāi)質(zhì)量差的根源分析。通過(guò)對(duì)用戶(hù)業(yè)務(wù)質(zhì)量相關(guān)的全景數(shù)據(jù)的深度分析,實(shí)現(xiàn)質(zhì)差問(wèn)題原因的初步判斷。如“PON用戶(hù)數(shù)過(guò)載、ONU光衰過(guò)大、家用無(wú)線(xiàn)路由器質(zhì)差、PON口流量擁塞、異網(wǎng)訪(fǎng)問(wèn)占比高、內(nèi)容源問(wèn)題”等為切入點(diǎn)展開(kāi)分析。
GPON網(wǎng)絡(luò)故障在很大程度上影響了網(wǎng)絡(luò)接入的穩(wěn)定性、用戶(hù)體驗(yàn)的順暢性及業(yè)務(wù)內(nèi)容的優(yōu)化。因此在進(jìn)行研究故障自動(dòng)排查技術(shù)時(shí),需要做到:首先,在構(gòu)建數(shù)據(jù)中心時(shí),依托級(jí)聯(lián)模型,從用戶(hù)維度貫穿“用戶(hù)側(cè)、網(wǎng)絡(luò)側(cè)、內(nèi)容側(cè)”全景信息,構(gòu)建運(yùn)維數(shù)據(jù)中心,發(fā)揮其自身實(shí)質(zhì)作用;其次,兩端兩載一服務(wù):建立“兩端、兩載、一服務(wù)”的貫穿客戶(hù)感知和網(wǎng)絡(luò)指標(biāo)全局評(píng)估體系,保障運(yùn)行的完整性;然后,要防患于未然,對(duì)寬帶質(zhì)量差的根源進(jìn)行預(yù)判,常態(tài)下采集用戶(hù)真實(shí)體驗(yàn)數(shù)據(jù),提供質(zhì)差用戶(hù)及質(zhì)差設(shè)備提前發(fā)現(xiàn);最后展開(kāi)基于Wifi網(wǎng)絡(luò)分析優(yōu)化:測(cè)速工具內(nèi)嵌Wifi網(wǎng)絡(luò)分析功能,可指導(dǎo)裝維人員對(duì)家庭Wifi網(wǎng)絡(luò)信號(hào)情況進(jìn)行分析和問(wèn)題定位。唯有多重并舉,才可以很好的解決GPON網(wǎng)絡(luò)故障,實(shí)現(xiàn)自動(dòng)排查技術(shù)的精確定位。