任昱光 夏冰
【摘要】隨著無線城市業(yè)務(wù)的快速發(fā)展,業(yè)務(wù)質(zhì)量監(jiān)控變得愈發(fā)重要?;谶\營商的網(wǎng)絡(luò)層次,設(shè)計了一套無線城市業(yè)務(wù)自動撥測及告警系統(tǒng),用于監(jiān)控無線城市業(yè)務(wù)質(zhì)量,并對該系統(tǒng)的探測流程及應(yīng)用實例進行了詳細分析。
【關(guān)鍵詞】無線城市 探針 撥測 業(yè)務(wù)預(yù)警
中圖分類號:TN92 文獻標識碼:A 文章編號:1006-1010(2014)-16-
[Abstract]With the rapid development of wireless city service, the supervision of the service of quality (QoS) becomes more important than ever before. A set of wireless city service automatic dial test and alarm system based on operator network level is designed to monitor the QoS of wireless city service. In addition, the detection process and the application instance of the system are analyzed in detail.
[Key words]wireless city probe dial test business early-warning
1 引言
無線城市業(yè)務(wù)是中國移動通過無線網(wǎng)絡(luò)為政府、企業(yè)、家庭和個人用戶提供無線信息化服務(wù),涵蓋了無線政務(wù)、生活服務(wù)、醫(yī)療保健、交通查詢、旅游指南、教育培訓(xùn)、求職就業(yè)及購物優(yōu)惠等各類服務(wù)信息。
目前,無線城市業(yè)務(wù)主要通過人工撥測的方式監(jiān)控業(yè)務(wù)質(zhì)量。隨著無線城市業(yè)務(wù)逐步開展,各種應(yīng)用越來越豐富,與業(yè)務(wù)相關(guān)的接口數(shù)量、應(yīng)用數(shù)量、設(shè)備數(shù)量逐漸增多,通過人工撥測的方式監(jiān)控業(yè)務(wù)質(zhì)量消耗人力成本大且時效性差。為了保障無線城市業(yè)務(wù)穩(wěn)定、健康運行,及時發(fā)現(xiàn)并解決業(yè)務(wù)、接口服務(wù)和設(shè)備的質(zhì)量問題,本文提出了一種適用于異構(gòu)多系統(tǒng)的業(yè)務(wù)自動撥測及告警實現(xiàn)方案,即業(yè)務(wù)探針系統(tǒng)方案。
2 無線城市業(yè)務(wù)探針系統(tǒng)
如圖1所示,業(yè)務(wù)探針系統(tǒng)主要包括:前端配置、展示部分(紅色虛線包含部分)、后臺服務(wù)部分(藍色虛線包含部分)、告警能力部分(黃色虛線包含部分)。業(yè)務(wù)探針系統(tǒng)能夠從功能、性能角度,多維度對無線城市接入的應(yīng)用、相關(guān)接口、部署機器進行實時監(jiān)控和探測,實時了解無線城市業(yè)務(wù)運行的健康狀況,統(tǒng)一進行管理和分析,以提升無線城市業(yè)務(wù)運行的穩(wěn)定性,提高用戶體驗滿意度[1]。
業(yè)務(wù)探針系統(tǒng)各部分的功能詳細闡述如下:
(1)前端配置、展示部分:主要包括系統(tǒng)配置管理、賬號管理、業(yè)務(wù)管理、視圖管理、統(tǒng)計分析管理、日志管理,用于對整個系統(tǒng)的全局參數(shù)進行配置、對系統(tǒng)訪問進行控制和鑒權(quán)、對權(quán)重節(jié)點/業(yè)務(wù)節(jié)點/業(yè)務(wù)探針進行管理、對系統(tǒng)操作日志與業(yè)務(wù)告警日志進行管理等日常管理功能。
(2)后臺服務(wù)部分:包括功能探測服務(wù)、性能探測服務(wù)、告警服務(wù)等系統(tǒng)核心功能服務(wù)。
◆功能探測服務(wù):以多線程的方式對業(yè)務(wù)的功能狀況進行周期性探測;
◆性能探測服務(wù):以多線程的方式對業(yè)務(wù)的性能狀況進行周期性探測;
◆告警服務(wù):用于實時掃描當前出現(xiàn)的業(yè)務(wù)告警,并以短信、郵件方式進行通知。
(3)告警能力部分:提供多樣式的告警通知,如支持短信告警、郵件告警、電話告警等告警功能。
3 業(yè)務(wù)探針系統(tǒng)探測流程
業(yè)務(wù)探針后臺服務(wù)子系統(tǒng)根據(jù)系統(tǒng)配置的業(yè)務(wù)節(jié)點,對業(yè)務(wù)節(jié)點的健康度(性能、功能)進行探測分析,將探測結(jié)果數(shù)據(jù)寫入數(shù)據(jù)庫中,提供給展現(xiàn)層處理展示。業(yè)務(wù)子系統(tǒng)的掃描探測為周期任務(wù),可由系統(tǒng)自動執(zhí)行探測,也可由管理員手工執(zhí)行探測[2]。
單個周期探測流程如圖2所示:
步驟1:業(yè)務(wù)探測開始時,加載全局配置信息以及業(yè)務(wù)節(jié)點配置信息,分別以多線程的方式進行功能探測、性能探測。該步驟的規(guī)則如下:
(1)每次探測開始,首先加載全局配置信息(如功能線程數(shù)、性能線程數(shù)、短信通知開關(guān)等)和業(yè)務(wù)節(jié)點相關(guān)信息(如功能告警閥值、性能告警閥值、綁定的探針以及探針的基本參數(shù)等),保存于全局對象中;全局對象里面保存了系統(tǒng)的一些全局配置信息(如功能線程數(shù)、性能線程數(shù)等)以及本次探測的所有業(yè)務(wù)節(jié)點的相關(guān)信息(包括每個業(yè)務(wù)節(jié)點綁定的探針的基本信息),以便在整個探測周期內(nèi)共享公用信息。
(2)全局對象信息在各個性能、功能線程中共享。
(3)每個功能、性能探測線程中,業(yè)務(wù)節(jié)點探測的優(yōu)先順序由每個業(yè)務(wù)節(jié)點的等級決定,等級越高越優(yōu)先探測。在新增業(yè)務(wù)節(jié)點時,每個業(yè)務(wù)節(jié)點必須制定1個業(yè)務(wù)節(jié)點等級。系統(tǒng)默認包括3個等級:一般、重要、非常重要,這3個等級的優(yōu)先順序為:一般<重要<非常重要。
(4)每個業(yè)務(wù)節(jié)點綁定支持多語言開發(fā)的探針,如Python、Java。
(5)探測過程中,以動態(tài)加載探針插件方式對業(yè)務(wù)節(jié)點進行探測。本技術(shù)動態(tài)加載關(guān)鍵點如下:
◆所有的探針實現(xiàn)統(tǒng)一繼承1個基礎(chǔ)類Probe,并覆蓋實現(xiàn)該類的funcProbe和perfProbe方法,這兩個方法分別對應(yīng)具體的功能探測與性能探測;
◆加載探針插件類前,將探針所在的包路徑(該信息已保存于對應(yīng)的業(yè)務(wù)節(jié)點信息中,在(1)中被加載)添加到Path路徑中;
◆通過Python的_import_加載探針插件類;
◆通過反射實例化探針類,分別執(zhí)行funcProbe和perfProbe方法,以完成功能與性能的探測;endprint
◆將探針所在的包路徑從Path移除。
(6)功能、性能探測采用采樣的方式進行探測,采樣數(shù)保存于業(yè)務(wù)節(jié)點配置信息中,可以根據(jù)某個業(yè)務(wù)節(jié)點的實際情況進行配置,每次采樣的所有相關(guān)信息(如請求數(shù)據(jù)信息、響應(yīng)數(shù)據(jù)、探測成功狀態(tài)、響應(yīng)時間、業(yè)務(wù)出現(xiàn)問題時的可能原因等[3])統(tǒng)一寫入到MySQL數(shù)據(jù)庫,保證整個探測流程的數(shù)據(jù)都被保存,以便在業(yè)務(wù)出現(xiàn)問題時,根據(jù)這些信息快速定位問題。
采樣示例:以鄭州公積金查詢應(yīng)用的性能探測為例,假如性能采樣數(shù)為10,則表示依次請求10次鄭州公積金查詢應(yīng)用,分別記錄每次請求的響應(yīng)時間,然后取10次的平均響應(yīng)時間(算法詳見步驟2)作為本次性能探測的結(jié)果得分。
(7)單個業(yè)務(wù)節(jié)點(探測對象)探測流程如圖3所示:
步驟2:當功能探測、性能探測完成后,啟動告警掃描服務(wù),對當次的功能、性能探測結(jié)果數(shù)據(jù)進行分析掃描[4]。該步驟的規(guī)則如下:
(1)告警的判斷方式:功能告警是通過功能告警閥值判斷,性能告警是通過性能告警閥值判斷。
功能告警閥值:用最低采樣結(jié)果成功數(shù)表示。如:某個業(yè)務(wù)節(jié)點的功能總采樣數(shù)為10,功能告警閥值設(shè)置為8,這里的8表示8次采樣結(jié)果成功。如果該業(yè)務(wù)節(jié)點的10次采樣中只有7次的采樣滿足成功條件,則該業(yè)務(wù)節(jié)點就出現(xiàn)功能告警,否則未出現(xiàn)功能告警。
采樣結(jié)果成功的判斷標準:1表示本次采樣成功,業(yè)務(wù)正常;0表示本次采樣不成功,業(yè)務(wù)不正常。具體在什么情況返回1或0,由具體的探針根據(jù)不同業(yè)務(wù)場景的需要進行定制化實現(xiàn)判斷。
性能告警閥值:用最長的平均響應(yīng)時間表示。如:某個業(yè)務(wù)節(jié)點的性能總采樣數(shù)為10,性能告警閥值設(shè)置為15(單位:秒),當10次采樣的平均響應(yīng)時間大于15(養(yǎng)老查詢等7個頁面:該業(yè)務(wù)節(jié)點的性能告警閥值)×1000,則該業(yè)務(wù)節(jié)點出現(xiàn)性能告警,否則未出現(xiàn)性能告警。
(2)平均響應(yīng)時間算法為:
ART=(T1+T2+T3+…+Tn)*1000/n (1)
其中,ART表示平均響應(yīng)時間,單位為毫秒;T1…Tn表示n次采樣中每次采樣的響應(yīng)時間,單位為秒。
步驟3:告警掃描完成后,若發(fā)現(xiàn)業(yè)務(wù)告警則根據(jù)系統(tǒng)的全局配置信息,調(diào)用短信能力或郵件能力發(fā)送告警通知信息,及時告知當前業(yè)務(wù)運行中出現(xiàn)的問題。短信或郵件信息中包含了出現(xiàn)告警的業(yè)務(wù)節(jié)點的詳細信息(如業(yè)務(wù)訪問URL、業(yè)務(wù)出現(xiàn)告警的原因、探測請求數(shù)據(jù)、探測響應(yīng)數(shù)據(jù)等),這些信息可以幫助維護人員快速定位問題,以便在業(yè)務(wù)出現(xiàn)問題時快速解決問題[5]。
單個業(yè)務(wù)節(jié)點(探測對象)告警判斷過程如圖4所示:
4 業(yè)務(wù)探針系統(tǒng)應(yīng)用實例
實際應(yīng)用以鄭州公積金查詢的普通頁面功能探測為例進行說明,具體如表1所示:
5 業(yè)務(wù)探針系統(tǒng)實踐效果
根據(jù)以上結(jié)構(gòu)框架及探測流程的業(yè)務(wù)探針系統(tǒng),已在河南移動部署并安全運行了一年,較以往撥測系統(tǒng)具有如下優(yōu)點:
(1)定制化(探針多樣化):業(yè)務(wù)探針技術(shù)使用的探針可以根據(jù)不同的業(yè)務(wù)場景、不同的應(yīng)用及接口,進行探針定制化,以滿足個性化的探測需求,現(xiàn)共有撥測189項應(yīng)用。
(2)業(yè)務(wù)探測周期時間短:由于業(yè)務(wù)探針技術(shù)采用程序控制探測業(yè)務(wù)的復(fù)雜度,以多線程、自動化方式去完成探測,有效地減少了單次業(yè)務(wù)探測的時間,單次業(yè)務(wù)探測耗時下降95%。
(3)具備統(tǒng)計分析功能:采用業(yè)務(wù)探針技術(shù),可以從多角度、多維度對業(yè)務(wù)的健康狀況進行分析和統(tǒng)計,業(yè)務(wù)統(tǒng)計指標由原來的3項豐富為10項。
(4)實時性、可控性好:業(yè)務(wù)探針技術(shù)采用多線程探測方式,在控制業(yè)務(wù)探測周期的同時還保證了業(yè)務(wù)探測的實時性,且具備探測周期可控制的優(yōu)點。
6 結(jié)束語
本文提出的業(yè)務(wù)探針系統(tǒng)能夠?qū)?fù)雜、低效的撥測規(guī)范為自動化操作,通過在河南移動的實際使用,證明了該系統(tǒng)的可實施性和可部署性,能夠滿足無線城市各接入平臺的管理和監(jiān)測。此外,該系統(tǒng)同樣也適用于其他異構(gòu)多系統(tǒng)的管理和監(jiān)控。
參考文獻:
[1] 高峰,高澤華,文柳,等. 無線城市:電信級Wi-Fi網(wǎng)絡(luò)建設(shè)與運營[M]. 北京: 人民郵電出版社, 2012.
[2] Erich Gamma, Richard Helm, Ralph Johnson, et al. 設(shè)計模式:可復(fù)用面向?qū)ο筌浖幕A(chǔ)[M]. 李英軍,馬曉星,蔡敏,等譯. 北京: 機械工業(yè)出版社, 2005.
[3] 王興亮,張亮. 基于“無線城市”的無線寬帶接入技術(shù)應(yīng)用[J]. 現(xiàn)代電子技術(shù), 2008(21): 16-18.
[4] 張威,湯炳富. GSM交換網(wǎng)絡(luò)維護與優(yōu)化[M]. 北京: 人民郵電出版社, 2005.
[5] 賴衛(wèi)國,許俊禹,胡嚴,等. 移動無線數(shù)據(jù)新業(yè)務(wù)[M]. 北京: 人民郵電出版社, 2007.
作者簡介
任昱光:工程師,碩士畢業(yè)于北京郵電大學(xué),現(xiàn)任中國移動通信集團河南有限公司計劃建設(shè)部主管,目前從事移動業(yè)務(wù)網(wǎng)絡(luò)規(guī)劃與管理工作,主要研究方向為移動多媒體,曾組織完成河南無線城市、短信中心、彩鈴平臺等多項系統(tǒng)建設(shè)。
夏冰:講師,碩士畢業(yè)于北京林業(yè)大學(xué),現(xiàn)任職于河南職業(yè)技術(shù)學(xué)院,目前從事城市規(guī)劃與設(shè)計工作,主要研究方向為城市規(guī)劃,曾獨立完成北京地區(qū)花境數(shù)據(jù)庫建立,參與北京市朝陽區(qū)數(shù)字化社區(qū)建設(shè)等項目。endprint
◆將探針所在的包路徑從Path移除。
(6)功能、性能探測采用采樣的方式進行探測,采樣數(shù)保存于業(yè)務(wù)節(jié)點配置信息中,可以根據(jù)某個業(yè)務(wù)節(jié)點的實際情況進行配置,每次采樣的所有相關(guān)信息(如請求數(shù)據(jù)信息、響應(yīng)數(shù)據(jù)、探測成功狀態(tài)、響應(yīng)時間、業(yè)務(wù)出現(xiàn)問題時的可能原因等[3])統(tǒng)一寫入到MySQL數(shù)據(jù)庫,保證整個探測流程的數(shù)據(jù)都被保存,以便在業(yè)務(wù)出現(xiàn)問題時,根據(jù)這些信息快速定位問題。
采樣示例:以鄭州公積金查詢應(yīng)用的性能探測為例,假如性能采樣數(shù)為10,則表示依次請求10次鄭州公積金查詢應(yīng)用,分別記錄每次請求的響應(yīng)時間,然后取10次的平均響應(yīng)時間(算法詳見步驟2)作為本次性能探測的結(jié)果得分。
(7)單個業(yè)務(wù)節(jié)點(探測對象)探測流程如圖3所示:
步驟2:當功能探測、性能探測完成后,啟動告警掃描服務(wù),對當次的功能、性能探測結(jié)果數(shù)據(jù)進行分析掃描[4]。該步驟的規(guī)則如下:
(1)告警的判斷方式:功能告警是通過功能告警閥值判斷,性能告警是通過性能告警閥值判斷。
功能告警閥值:用最低采樣結(jié)果成功數(shù)表示。如:某個業(yè)務(wù)節(jié)點的功能總采樣數(shù)為10,功能告警閥值設(shè)置為8,這里的8表示8次采樣結(jié)果成功。如果該業(yè)務(wù)節(jié)點的10次采樣中只有7次的采樣滿足成功條件,則該業(yè)務(wù)節(jié)點就出現(xiàn)功能告警,否則未出現(xiàn)功能告警。
采樣結(jié)果成功的判斷標準:1表示本次采樣成功,業(yè)務(wù)正常;0表示本次采樣不成功,業(yè)務(wù)不正常。具體在什么情況返回1或0,由具體的探針根據(jù)不同業(yè)務(wù)場景的需要進行定制化實現(xiàn)判斷。
性能告警閥值:用最長的平均響應(yīng)時間表示。如:某個業(yè)務(wù)節(jié)點的性能總采樣數(shù)為10,性能告警閥值設(shè)置為15(單位:秒),當10次采樣的平均響應(yīng)時間大于15(養(yǎng)老查詢等7個頁面:該業(yè)務(wù)節(jié)點的性能告警閥值)×1000,則該業(yè)務(wù)節(jié)點出現(xiàn)性能告警,否則未出現(xiàn)性能告警。
(2)平均響應(yīng)時間算法為:
ART=(T1+T2+T3+…+Tn)*1000/n (1)
其中,ART表示平均響應(yīng)時間,單位為毫秒;T1…Tn表示n次采樣中每次采樣的響應(yīng)時間,單位為秒。
步驟3:告警掃描完成后,若發(fā)現(xiàn)業(yè)務(wù)告警則根據(jù)系統(tǒng)的全局配置信息,調(diào)用短信能力或郵件能力發(fā)送告警通知信息,及時告知當前業(yè)務(wù)運行中出現(xiàn)的問題。短信或郵件信息中包含了出現(xiàn)告警的業(yè)務(wù)節(jié)點的詳細信息(如業(yè)務(wù)訪問URL、業(yè)務(wù)出現(xiàn)告警的原因、探測請求數(shù)據(jù)、探測響應(yīng)數(shù)據(jù)等),這些信息可以幫助維護人員快速定位問題,以便在業(yè)務(wù)出現(xiàn)問題時快速解決問題[5]。
單個業(yè)務(wù)節(jié)點(探測對象)告警判斷過程如圖4所示:
4 業(yè)務(wù)探針系統(tǒng)應(yīng)用實例
實際應(yīng)用以鄭州公積金查詢的普通頁面功能探測為例進行說明,具體如表1所示:
5 業(yè)務(wù)探針系統(tǒng)實踐效果
根據(jù)以上結(jié)構(gòu)框架及探測流程的業(yè)務(wù)探針系統(tǒng),已在河南移動部署并安全運行了一年,較以往撥測系統(tǒng)具有如下優(yōu)點:
(1)定制化(探針多樣化):業(yè)務(wù)探針技術(shù)使用的探針可以根據(jù)不同的業(yè)務(wù)場景、不同的應(yīng)用及接口,進行探針定制化,以滿足個性化的探測需求,現(xiàn)共有撥測189項應(yīng)用。
(2)業(yè)務(wù)探測周期時間短:由于業(yè)務(wù)探針技術(shù)采用程序控制探測業(yè)務(wù)的復(fù)雜度,以多線程、自動化方式去完成探測,有效地減少了單次業(yè)務(wù)探測的時間,單次業(yè)務(wù)探測耗時下降95%。
(3)具備統(tǒng)計分析功能:采用業(yè)務(wù)探針技術(shù),可以從多角度、多維度對業(yè)務(wù)的健康狀況進行分析和統(tǒng)計,業(yè)務(wù)統(tǒng)計指標由原來的3項豐富為10項。
(4)實時性、可控性好:業(yè)務(wù)探針技術(shù)采用多線程探測方式,在控制業(yè)務(wù)探測周期的同時還保證了業(yè)務(wù)探測的實時性,且具備探測周期可控制的優(yōu)點。
6 結(jié)束語
本文提出的業(yè)務(wù)探針系統(tǒng)能夠?qū)?fù)雜、低效的撥測規(guī)范為自動化操作,通過在河南移動的實際使用,證明了該系統(tǒng)的可實施性和可部署性,能夠滿足無線城市各接入平臺的管理和監(jiān)測。此外,該系統(tǒng)同樣也適用于其他異構(gòu)多系統(tǒng)的管理和監(jiān)控。
參考文獻:
[1] 高峰,高澤華,文柳,等. 無線城市:電信級Wi-Fi網(wǎng)絡(luò)建設(shè)與運營[M]. 北京: 人民郵電出版社, 2012.
[2] Erich Gamma, Richard Helm, Ralph Johnson, et al. 設(shè)計模式:可復(fù)用面向?qū)ο筌浖幕A(chǔ)[M]. 李英軍,馬曉星,蔡敏,等譯. 北京: 機械工業(yè)出版社, 2005.
[3] 王興亮,張亮. 基于“無線城市”的無線寬帶接入技術(shù)應(yīng)用[J]. 現(xiàn)代電子技術(shù), 2008(21): 16-18.
[4] 張威,湯炳富. GSM交換網(wǎng)絡(luò)維護與優(yōu)化[M]. 北京: 人民郵電出版社, 2005.
[5] 賴衛(wèi)國,許俊禹,胡嚴,等. 移動無線數(shù)據(jù)新業(yè)務(wù)[M]. 北京: 人民郵電出版社, 2007.
作者簡介
任昱光:工程師,碩士畢業(yè)于北京郵電大學(xué),現(xiàn)任中國移動通信集團河南有限公司計劃建設(shè)部主管,目前從事移動業(yè)務(wù)網(wǎng)絡(luò)規(guī)劃與管理工作,主要研究方向為移動多媒體,曾組織完成河南無線城市、短信中心、彩鈴平臺等多項系統(tǒng)建設(shè)。
夏冰:講師,碩士畢業(yè)于北京林業(yè)大學(xué),現(xiàn)任職于河南職業(yè)技術(shù)學(xué)院,目前從事城市規(guī)劃與設(shè)計工作,主要研究方向為城市規(guī)劃,曾獨立完成北京地區(qū)花境數(shù)據(jù)庫建立,參與北京市朝陽區(qū)數(shù)字化社區(qū)建設(shè)等項目。endprint
◆將探針所在的包路徑從Path移除。
(6)功能、性能探測采用采樣的方式進行探測,采樣數(shù)保存于業(yè)務(wù)節(jié)點配置信息中,可以根據(jù)某個業(yè)務(wù)節(jié)點的實際情況進行配置,每次采樣的所有相關(guān)信息(如請求數(shù)據(jù)信息、響應(yīng)數(shù)據(jù)、探測成功狀態(tài)、響應(yīng)時間、業(yè)務(wù)出現(xiàn)問題時的可能原因等[3])統(tǒng)一寫入到MySQL數(shù)據(jù)庫,保證整個探測流程的數(shù)據(jù)都被保存,以便在業(yè)務(wù)出現(xiàn)問題時,根據(jù)這些信息快速定位問題。
采樣示例:以鄭州公積金查詢應(yīng)用的性能探測為例,假如性能采樣數(shù)為10,則表示依次請求10次鄭州公積金查詢應(yīng)用,分別記錄每次請求的響應(yīng)時間,然后取10次的平均響應(yīng)時間(算法詳見步驟2)作為本次性能探測的結(jié)果得分。
(7)單個業(yè)務(wù)節(jié)點(探測對象)探測流程如圖3所示:
步驟2:當功能探測、性能探測完成后,啟動告警掃描服務(wù),對當次的功能、性能探測結(jié)果數(shù)據(jù)進行分析掃描[4]。該步驟的規(guī)則如下:
(1)告警的判斷方式:功能告警是通過功能告警閥值判斷,性能告警是通過性能告警閥值判斷。
功能告警閥值:用最低采樣結(jié)果成功數(shù)表示。如:某個業(yè)務(wù)節(jié)點的功能總采樣數(shù)為10,功能告警閥值設(shè)置為8,這里的8表示8次采樣結(jié)果成功。如果該業(yè)務(wù)節(jié)點的10次采樣中只有7次的采樣滿足成功條件,則該業(yè)務(wù)節(jié)點就出現(xiàn)功能告警,否則未出現(xiàn)功能告警。
采樣結(jié)果成功的判斷標準:1表示本次采樣成功,業(yè)務(wù)正常;0表示本次采樣不成功,業(yè)務(wù)不正常。具體在什么情況返回1或0,由具體的探針根據(jù)不同業(yè)務(wù)場景的需要進行定制化實現(xiàn)判斷。
性能告警閥值:用最長的平均響應(yīng)時間表示。如:某個業(yè)務(wù)節(jié)點的性能總采樣數(shù)為10,性能告警閥值設(shè)置為15(單位:秒),當10次采樣的平均響應(yīng)時間大于15(養(yǎng)老查詢等7個頁面:該業(yè)務(wù)節(jié)點的性能告警閥值)×1000,則該業(yè)務(wù)節(jié)點出現(xiàn)性能告警,否則未出現(xiàn)性能告警。
(2)平均響應(yīng)時間算法為:
ART=(T1+T2+T3+…+Tn)*1000/n (1)
其中,ART表示平均響應(yīng)時間,單位為毫秒;T1…Tn表示n次采樣中每次采樣的響應(yīng)時間,單位為秒。
步驟3:告警掃描完成后,若發(fā)現(xiàn)業(yè)務(wù)告警則根據(jù)系統(tǒng)的全局配置信息,調(diào)用短信能力或郵件能力發(fā)送告警通知信息,及時告知當前業(yè)務(wù)運行中出現(xiàn)的問題。短信或郵件信息中包含了出現(xiàn)告警的業(yè)務(wù)節(jié)點的詳細信息(如業(yè)務(wù)訪問URL、業(yè)務(wù)出現(xiàn)告警的原因、探測請求數(shù)據(jù)、探測響應(yīng)數(shù)據(jù)等),這些信息可以幫助維護人員快速定位問題,以便在業(yè)務(wù)出現(xiàn)問題時快速解決問題[5]。
單個業(yè)務(wù)節(jié)點(探測對象)告警判斷過程如圖4所示:
4 業(yè)務(wù)探針系統(tǒng)應(yīng)用實例
實際應(yīng)用以鄭州公積金查詢的普通頁面功能探測為例進行說明,具體如表1所示:
5 業(yè)務(wù)探針系統(tǒng)實踐效果
根據(jù)以上結(jié)構(gòu)框架及探測流程的業(yè)務(wù)探針系統(tǒng),已在河南移動部署并安全運行了一年,較以往撥測系統(tǒng)具有如下優(yōu)點:
(1)定制化(探針多樣化):業(yè)務(wù)探針技術(shù)使用的探針可以根據(jù)不同的業(yè)務(wù)場景、不同的應(yīng)用及接口,進行探針定制化,以滿足個性化的探測需求,現(xiàn)共有撥測189項應(yīng)用。
(2)業(yè)務(wù)探測周期時間短:由于業(yè)務(wù)探針技術(shù)采用程序控制探測業(yè)務(wù)的復(fù)雜度,以多線程、自動化方式去完成探測,有效地減少了單次業(yè)務(wù)探測的時間,單次業(yè)務(wù)探測耗時下降95%。
(3)具備統(tǒng)計分析功能:采用業(yè)務(wù)探針技術(shù),可以從多角度、多維度對業(yè)務(wù)的健康狀況進行分析和統(tǒng)計,業(yè)務(wù)統(tǒng)計指標由原來的3項豐富為10項。
(4)實時性、可控性好:業(yè)務(wù)探針技術(shù)采用多線程探測方式,在控制業(yè)務(wù)探測周期的同時還保證了業(yè)務(wù)探測的實時性,且具備探測周期可控制的優(yōu)點。
6 結(jié)束語
本文提出的業(yè)務(wù)探針系統(tǒng)能夠?qū)?fù)雜、低效的撥測規(guī)范為自動化操作,通過在河南移動的實際使用,證明了該系統(tǒng)的可實施性和可部署性,能夠滿足無線城市各接入平臺的管理和監(jiān)測。此外,該系統(tǒng)同樣也適用于其他異構(gòu)多系統(tǒng)的管理和監(jiān)控。
參考文獻:
[1] 高峰,高澤華,文柳,等. 無線城市:電信級Wi-Fi網(wǎng)絡(luò)建設(shè)與運營[M]. 北京: 人民郵電出版社, 2012.
[2] Erich Gamma, Richard Helm, Ralph Johnson, et al. 設(shè)計模式:可復(fù)用面向?qū)ο筌浖幕A(chǔ)[M]. 李英軍,馬曉星,蔡敏,等譯. 北京: 機械工業(yè)出版社, 2005.
[3] 王興亮,張亮. 基于“無線城市”的無線寬帶接入技術(shù)應(yīng)用[J]. 現(xiàn)代電子技術(shù), 2008(21): 16-18.
[4] 張威,湯炳富. GSM交換網(wǎng)絡(luò)維護與優(yōu)化[M]. 北京: 人民郵電出版社, 2005.
[5] 賴衛(wèi)國,許俊禹,胡嚴,等. 移動無線數(shù)據(jù)新業(yè)務(wù)[M]. 北京: 人民郵電出版社, 2007.
作者簡介
任昱光:工程師,碩士畢業(yè)于北京郵電大學(xué),現(xiàn)任中國移動通信集團河南有限公司計劃建設(shè)部主管,目前從事移動業(yè)務(wù)網(wǎng)絡(luò)規(guī)劃與管理工作,主要研究方向為移動多媒體,曾組織完成河南無線城市、短信中心、彩鈴平臺等多項系統(tǒng)建設(shè)。
夏冰:講師,碩士畢業(yè)于北京林業(yè)大學(xué),現(xiàn)任職于河南職業(yè)技術(shù)學(xué)院,目前從事城市規(guī)劃與設(shè)計工作,主要研究方向為城市規(guī)劃,曾獨立完成北京地區(qū)花境數(shù)據(jù)庫建立,參與北京市朝陽區(qū)數(shù)字化社區(qū)建設(shè)等項目。endprint