關(guān)鍵詞:業(yè)務(wù)交易;監(jiān)控系統(tǒng);應(yīng)用系統(tǒng);關(guān)聯(lián)關(guān)系
中圖分類號(hào):TP277 ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)06-0134-03
Keywords:business transaction;monitoring system;application system;relationship
0 ?引 ?言
在當(dāng)前財(cái)務(wù)公司業(yè)務(wù)規(guī)??焖贁U(kuò)張、新業(yè)務(wù)需求高速增長(zhǎng),新興技術(shù)不斷涌現(xiàn)和深化的新形勢(shì)下,保障信息系統(tǒng)安全生產(chǎn)運(yùn)行已然成為當(dāng)務(wù)之急,通過搭建業(yè)務(wù)運(yùn)行實(shí)時(shí)監(jiān)控系統(tǒng),對(duì)各類復(fù)雜電子交易進(jìn)行實(shí)時(shí)檢測(cè)與分析,及時(shí)發(fā)現(xiàn)各類交易異常情況、分析交易動(dòng)態(tài)數(shù)據(jù)。
1 ?監(jiān)控系統(tǒng)建設(shè)的背景
1.1 ?外部監(jiān)管審計(jì)要求
銀監(jiān)會(huì)、人民銀行等監(jiān)管部門對(duì)于財(cái)務(wù)公司關(guān)鍵業(yè)務(wù)系統(tǒng)的應(yīng)用整體監(jiān)控運(yùn)行能力,均提出了明確的要求,需要能夠及時(shí)發(fā)現(xiàn)業(yè)務(wù)系統(tǒng)交易故障,并明確定位和處置故障,盡快恢復(fù)營業(yè),降低業(yè)務(wù)風(fēng)險(xiǎn)。
1.2 ?關(guān)鍵業(yè)務(wù)高可用性的要求
財(cái)務(wù)公司關(guān)鍵業(yè)務(wù)系統(tǒng)承載著絕大多數(shù)業(yè)務(wù)的運(yùn)行,只有對(duì)于應(yīng)用系統(tǒng)業(yè)務(wù)運(yùn)行故障的有效監(jiān)測(cè)與處置,才能確保生產(chǎn)系統(tǒng)穩(wěn)定地對(duì)外提供服務(wù),確保財(cái)務(wù)公司業(yè)務(wù)服務(wù)的連續(xù)性,為業(yè)務(wù)擴(kuò)展保駕護(hù)航。
1.3 ?關(guān)鍵業(yè)務(wù)隱患排查的需求
通過對(duì)應(yīng)用系統(tǒng)全面的實(shí)施監(jiān)控,才能采集到各層面的細(xì)粒度運(yùn)行數(shù)據(jù),并通過對(duì)這些數(shù)據(jù)的有效分析,排查各類隱患,并及時(shí)處置,提高應(yīng)用系統(tǒng)整體運(yùn)行的可靠性。
1.4 ?業(yè)務(wù)系統(tǒng)架構(gòu)優(yōu)化的需求
通過應(yīng)用整體監(jiān)控?cái)?shù)據(jù)的采集與分析,在發(fā)現(xiàn)運(yùn)行隱患的同時(shí),總結(jié)應(yīng)用系統(tǒng)開發(fā)的架構(gòu)設(shè)計(jì)技術(shù)規(guī)范,從根源上加固應(yīng)用系統(tǒng)的抗風(fēng)險(xiǎn)能力。
2 ?監(jiān)控系統(tǒng)建設(shè)的目標(biāo)
2.1 ?應(yīng)用整體結(jié)構(gòu)梳理
在應(yīng)用管理員對(duì)于關(guān)鍵應(yīng)用系統(tǒng)的深入分析,掌握應(yīng)用整體結(jié)構(gòu)信息基礎(chǔ)之上,通過技術(shù)手段實(shí)時(shí)監(jiān)測(cè)這些動(dòng)態(tài)信息,全面掌握應(yīng)用系統(tǒng)結(jié)構(gòu)的動(dòng)態(tài)信息,為運(yùn)行資產(chǎn)管理、運(yùn)行故障管理等提供準(zhǔn)確的實(shí)時(shí)數(shù)據(jù)。
2.2 ?應(yīng)用運(yùn)行性能監(jiān)控
通過對(duì)于應(yīng)用系統(tǒng)的整體監(jiān)控,實(shí)現(xiàn)對(duì)各類應(yīng)用性能指標(biāo)的實(shí)時(shí)采集,動(dòng)態(tài)評(píng)估系統(tǒng)的健康運(yùn)行狀態(tài),為運(yùn)行決策提供有效支持。
2.3 ?應(yīng)用運(yùn)行故障定位
實(shí)時(shí)監(jiān)測(cè)并分析應(yīng)用運(yùn)行關(guān)鍵指標(biāo),并結(jié)合邏輯運(yùn)算,做動(dòng)態(tài)關(guān)聯(lián)分析,在應(yīng)用系統(tǒng)出現(xiàn)運(yùn)行異常的情況下,及時(shí)預(yù)警,快速定位異常環(huán)節(jié)并提高故障恢復(fù)效率,減少故障造成的影響,提高業(yè)務(wù)運(yùn)行的可用性。
2.4 ?應(yīng)用運(yùn)行異常指標(biāo)報(bào)警
通過對(duì)于應(yīng)用系統(tǒng)各類性能指標(biāo)的實(shí)時(shí)監(jiān)測(cè)與分析,在關(guān)鍵應(yīng)用系統(tǒng)發(fā)生指標(biāo)異常的情況下及時(shí)報(bào)警,縮短技術(shù)人員的故障響應(yīng)及恢復(fù)時(shí)間。
2.5 ?面向服務(wù)的性能指標(biāo)分析
能夠通過業(yè)務(wù)類型、業(yè)務(wù)渠道、外連機(jī)構(gòu)等不同維度,以及不同的時(shí)間段、顆粒度對(duì)業(yè)務(wù)系統(tǒng)關(guān)鍵性能指標(biāo)進(jìn)行分析統(tǒng)計(jì),提供詳細(xì)的業(yè)務(wù)性能指標(biāo)數(shù)據(jù)以幫助技術(shù)人員持續(xù)優(yōu)化業(yè)務(wù)系統(tǒng)性能。
3 ?監(jiān)控系統(tǒng)建設(shè)的思路
3.1 ?技術(shù)原理分析
通過旁路監(jiān)聽的方式,解碼業(yè)務(wù)交易流量,并獲得應(yīng)用性能指標(biāo),一是在業(yè)務(wù)主機(jī)上安裝代理程序,會(huì)大量消耗業(yè)務(wù)主機(jī)運(yùn)算資源,給業(yè)務(wù)主機(jī)正常運(yùn)行帶來風(fēng)險(xiǎn);而旁路監(jiān)聽的方式給業(yè)務(wù)系統(tǒng)帶來的運(yùn)行風(fēng)險(xiǎn)則幾乎為零。二是大量異構(gòu)的業(yè)務(wù)系統(tǒng)使得程序代理難以適用于所有類型的業(yè)務(wù)主機(jī),旁路監(jiān)聽的方式由于采用統(tǒng)一的流量采集解碼,面對(duì)異構(gòu)的業(yè)務(wù)系統(tǒng)環(huán)境時(shí),僅需要配置使用相應(yīng)的解碼程序即可。三是基于代理的方案可能無法獲得實(shí)時(shí)的指標(biāo)數(shù)據(jù),由于代理程序的運(yùn)行本身占用主機(jī)資源,導(dǎo)致指標(biāo)采樣頻率不能設(shè)置過于頻繁(容易過量占用主機(jī)資源),因此難以獲得實(shí)時(shí)的應(yīng)用性能指標(biāo)數(shù)據(jù)。旁路監(jiān)聽的方式由于無序占用業(yè)務(wù)主機(jī)資源,而可以實(shí)時(shí)采集、解析業(yè)務(wù)交易流量,獲得更為實(shí)時(shí)的應(yīng)用性能指標(biāo)數(shù)據(jù)。四是基于代理的方案無法獲得端到端交易關(guān)聯(lián)能力,不同的業(yè)務(wù)組件上運(yùn)行的代理程序截然不同,而業(yè)務(wù)路徑上的防火墻、負(fù)載均衡等設(shè)備上更是無法安裝代理程序。另一方面,各業(yè)務(wù)主機(jī)上的時(shí)鐘也無法確保絕對(duì)同步。因此,采用代理的方案并不能做到真正意義的、準(zhǔn)確的端到端交易關(guān)聯(lián)結(jié)果。
3.2 ?技術(shù)方式分析
利用基于網(wǎng)絡(luò)數(shù)據(jù)包解碼技術(shù)的旁路監(jiān)聽方案,充分利用可靠的網(wǎng)絡(luò)數(shù)據(jù)資源,建立應(yīng)用性能管理及告警平臺(tái)。以服務(wù)為中心,提供交易量、成功率、響應(yīng)時(shí)間等應(yīng)用性能關(guān)鍵指標(biāo),并區(qū)分交易類型、交易渠道等統(tǒng)計(jì)維度,展現(xiàn)服務(wù)組件的實(shí)時(shí)運(yùn)行狀態(tài)。采用旁路監(jiān)聽方式的技術(shù)方案一方面不會(huì)對(duì)被管理的應(yīng)用產(chǎn)生任何影響,完全避免了傳統(tǒng)監(jiān)控方式所帶來的性能風(fēng)險(xiǎn);另一方面也具備快速部署的特點(diǎn)及指標(biāo)實(shí)時(shí)統(tǒng)計(jì)能力,提高系統(tǒng)上線速度以及應(yīng)用性能指標(biāo)實(shí)時(shí)監(jiān)控能力。
4 ?監(jiān)控系統(tǒng)建設(shè)的設(shè)計(jì)方案
4.1 ?方案設(shè)計(jì)原則
一是最小風(fēng)險(xiǎn)接入原則,監(jiān)控系統(tǒng)的接入應(yīng)遵循零風(fēng)險(xiǎn)接入原則,在不影響網(wǎng)絡(luò)的正常運(yùn)行和系統(tǒng)穩(wěn)定的前提下,采用旁路(非串接)方式進(jìn)行部署接入。二是有效性原則,監(jiān)控系統(tǒng)的部署要結(jié)合實(shí)際運(yùn)維需求,明確監(jiān)控范圍,充分評(píng)估產(chǎn)品的功能、性能,確保監(jiān)控系統(tǒng)對(duì)數(shù)據(jù)分析的準(zhǔn)確性、有效性。三是安全性原則,監(jiān)控設(shè)備具有記錄應(yīng)用交易詳細(xì)數(shù)據(jù)的功能,對(duì)于敏感的業(yè)務(wù)數(shù)據(jù)應(yīng)遵循數(shù)據(jù)安全性的原則,從管理上和技術(shù)上嚴(yán)格控制敏感數(shù)據(jù)的外泄。四是可擴(kuò)展性原則,系統(tǒng)部署應(yīng)具有較好的可擴(kuò)展性,網(wǎng)絡(luò)流量和應(yīng)用交易量擴(kuò)大后的應(yīng)用業(yè)務(wù)性能監(jiān)控系統(tǒng)的平滑擴(kuò)展能力。五是可管理性原則,遵循建設(shè)規(guī)范,監(jiān)控系統(tǒng)接入網(wǎng)建設(shè)要考慮可管理性,分配網(wǎng)管安管地址,實(shí)現(xiàn)用戶的分權(quán)限分級(jí)管理。
4.2 ?系統(tǒng)邏輯部署架構(gòu)
由業(yè)務(wù)性能監(jiān)控系統(tǒng)服務(wù)器網(wǎng)卡直接抓包,實(shí)時(shí)輸出數(shù)據(jù);解碼引擎對(duì)業(yè)務(wù)數(shù)據(jù)包進(jìn)行實(shí)時(shí)解碼,并且解碼引擎可靈活配置;可以自動(dòng)發(fā)現(xiàn)節(jié)點(diǎn)之間的連接關(guān)系,為業(yè)務(wù)路徑配置提供信息;最后由上層的業(yè)務(wù)性能監(jiān)控系統(tǒng)服務(wù)和呈現(xiàn)層進(jìn)行業(yè)務(wù)性能指標(biāo)監(jiān)控、統(tǒng)計(jì)輸出、追蹤和告警。
4.3 ?性能與容量設(shè)計(jì)
業(yè)務(wù)性能監(jiān)控系統(tǒng)具有較強(qiáng)的擴(kuò)展性,能夠在包括監(jiān)控范圍、管理功能、管理對(duì)象數(shù)量等方面提供靈活、多樣的擴(kuò)展能力;可以適應(yīng)生產(chǎn)系統(tǒng)新業(yè)務(wù)、新技術(shù)的要求,適應(yīng)于系統(tǒng)未來發(fā)展的需要,并能與其他基于業(yè)界標(biāo)準(zhǔn)的軟件進(jìn)行集成。業(yè)務(wù)性能監(jiān)控系統(tǒng)采用“分布部署、集中監(jiān)控”模式,在業(yè)務(wù)擴(kuò)展時(shí),可根據(jù)系統(tǒng)性能和容量的要求,增加相應(yīng)的服務(wù)器就可以實(shí)現(xiàn)系統(tǒng)處理能力的擴(kuò)展。
5 ?監(jiān)控系統(tǒng)建設(shè)的技術(shù)方案
5.1 ?整體技術(shù)方案
按照“分布部署、集中監(jiān)控”原則,對(duì)監(jiān)控系統(tǒng)進(jìn)行設(shè)備部署和統(tǒng)一分析與告警。技術(shù)方案包含完整的應(yīng)用性能監(jiān)控的功能,包括實(shí)時(shí)監(jiān)控、指標(biāo)趨勢(shì)分析、指標(biāo)統(tǒng)計(jì)分析、業(yè)務(wù)查詢、端到端業(yè)務(wù)追蹤、實(shí)時(shí)告警、故障自動(dòng)定位、API數(shù)據(jù)輸出接口等,能夠支持云環(huán)境下的監(jiān)控分析,同時(shí)具備可用性及易用性高的特點(diǎn)。
5.2 ?數(shù)據(jù)采集方案
應(yīng)用服務(wù)層級(jí)劃分非常清晰,層級(jí)間的交易全部通過網(wǎng)絡(luò)傳輸完成,基礎(chǔ)設(shè)施和交付設(shè)施本身都以服務(wù)為中心向應(yīng)用提供界限明確的服務(wù)功能,無論是雙中心同時(shí)運(yùn)行、多層網(wǎng)絡(luò)區(qū)域控制或雙機(jī)雙網(wǎng)的環(huán)境下,采集設(shè)備可以輕松獲得關(guān)鍵交易環(huán)節(jié)的網(wǎng)絡(luò)數(shù)據(jù),這給網(wǎng)絡(luò)數(shù)據(jù)源的獲取帶來極大便利和靈活性。
5.3 ?業(yè)務(wù)梳理方案
業(yè)務(wù)交易路徑信息可由服務(wù)路徑自動(dòng)發(fā)現(xiàn)進(jìn)行應(yīng)用訪問關(guān)系梳理,包括IP地址/端口號(hào)、服務(wù)訪問路徑、協(xié)議類型等。最終通過業(yè)務(wù)性能監(jiān)控系統(tǒng)對(duì)業(yè)務(wù)系統(tǒng)進(jìn)行交易性能可視化呈現(xiàn)、應(yīng)用異??焖俣ㄎ缓透婢?,并進(jìn)行多維度統(tǒng)計(jì)和單筆交易追蹤。業(yè)務(wù)性能監(jiān)控系統(tǒng)的拓?fù)浒l(fā)現(xiàn)功能,能自動(dòng)呈現(xiàn)被監(jiān)控網(wǎng)絡(luò)數(shù)據(jù)的IP連接性,快速梳理應(yīng)用組件之間的邏輯訪問關(guān)系,為業(yè)務(wù)性能監(jiān)控系統(tǒng)提供SPV定義的準(zhǔn)確數(shù)據(jù),以及應(yīng)用層協(xié)議信息。
5.4 ?業(yè)務(wù)實(shí)時(shí)監(jiān)控方案
5.4.1 ?業(yè)務(wù)性能監(jiān)控系統(tǒng)基于協(xié)議解碼技術(shù)
充分利用網(wǎng)絡(luò)數(shù)據(jù)資源,幫助用戶快速建立應(yīng)用性能管理平臺(tái)。業(yè)務(wù)性能監(jiān)控系統(tǒng)提供交易量、成功率、響應(yīng)時(shí)間、響應(yīng)率、返回碼五大關(guān)鍵指標(biāo),并區(qū)分交易類型、交易渠道兩個(gè)統(tǒng)計(jì)維度,展現(xiàn)服務(wù)組件的運(yùn)行狀態(tài)。
5.4.2 ?業(yè)務(wù)性能監(jiān)控系統(tǒng)的技術(shù)關(guān)鍵點(diǎn)和創(chuàng)新點(diǎn)
協(xié)議解碼、故障定位、交易追蹤和可靠落地。一是業(yè)務(wù)性能監(jiān)控系統(tǒng)目前已經(jīng)支持解碼銀行業(yè)常用協(xié)議,而且對(duì)SOA中廣泛使用的協(xié)議,也都支持快速解碼,另外對(duì)于用戶的私有協(xié)議,也能根據(jù)項(xiàng)目情況快速進(jìn)行解碼。二是業(yè)務(wù)性能監(jiān)控系統(tǒng)基于內(nèi)置的故障判定邏輯,在出現(xiàn)問題時(shí)能自動(dòng)進(jìn)行故障定位。
5.4.3 ?業(yè)務(wù)性能監(jiān)控系統(tǒng)的交易性能追蹤
根據(jù)交易的基本信息,以及特定應(yīng)用的專屬字段作為復(fù)合查詢條件進(jìn)行交易查詢追蹤,并支持自定義交易關(guān)鍵字,可以選擇任意解碼字段作為交易關(guān)鍵字,以用作單筆交易追蹤的關(guān)聯(lián)字段。另外,交易查詢結(jié)果還能展開為交易的原始記錄,原始記錄信息中包含應(yīng)用協(xié)議中所有的被解碼字段,以輔助用戶做更加深入的故障排查。
6 ?監(jiān)控系統(tǒng)的展示
6.1 ?業(yè)務(wù)監(jiān)控大屏展示
針對(duì)業(yè)務(wù)系統(tǒng),將抽象出重要的渠道系統(tǒng)、前置系統(tǒng)、核心系統(tǒng)、外聯(lián)系統(tǒng)四個(gè)層級(jí)進(jìn)行大屏展現(xiàn),反映出業(yè)務(wù)系統(tǒng)的邏輯關(guān)系同時(shí)并實(shí)時(shí)展現(xiàn)該業(yè)務(wù)系統(tǒng)交易量、響應(yīng)時(shí)間等交易性能指標(biāo)。
6.2 ?業(yè)務(wù)板塊大屏展示
選擇業(yè)務(wù)系統(tǒng)的服務(wù)路徑、監(jiān)控指標(biāo)等信息進(jìn)行任意組合顯示。包括全部被監(jiān)控系統(tǒng)展示、分業(yè)務(wù)條線的被監(jiān)控系統(tǒng)展示、單獨(dú)系統(tǒng)信息展示、同一系統(tǒng)不同主機(jī)的展示、不同系統(tǒng)在同一主機(jī)的展示、儀表盤等。
6.3 ?一線運(yùn)維大屏展示
為運(yùn)維人員提供一個(gè)監(jiān)控儀表盤,可以包括多個(gè)關(guān)鍵應(yīng)用,每條琴鍵告警代表的含義為對(duì)應(yīng)的應(yīng)用在30分鐘內(nèi)的服務(wù)質(zhì)量,如果發(fā)生故障,實(shí)時(shí)告警自動(dòng)定位故障,并可以下鉆到對(duì)應(yīng)的視圖,系統(tǒng)自動(dòng)判斷故障節(jié)點(diǎn)。
6.4 ?二線專家大屏展示
業(yè)務(wù)系統(tǒng)快速故障定位到某個(gè)節(jié)點(diǎn)組件,二線專家可以通過該視圖進(jìn)行快速定位和對(duì)單筆失敗交易進(jìn)行交易追蹤。
7 ?結(jié) ?論
財(cái)務(wù)公司業(yè)務(wù)性能監(jiān)控系統(tǒng)基于協(xié)議解碼技術(shù),充分利用可靠的網(wǎng)絡(luò)數(shù)據(jù)資源,建立應(yīng)用性能管理平臺(tái),以服務(wù)為中心,提供交易量、成功率、響應(yīng)時(shí)間、響應(yīng)率、返回碼五大關(guān)鍵指標(biāo),并區(qū)分交易類型、交易渠道兩個(gè)統(tǒng)計(jì)維度,展現(xiàn)服務(wù)組件的運(yùn)行狀態(tài)。實(shí)現(xiàn)應(yīng)用可用性、性能、負(fù)載量的全面可視化,通過多維度復(fù)合告警、基線告警等,提取發(fā)現(xiàn)系統(tǒng)性能問題,及時(shí)告警潛在的性能風(fēng)險(xiǎn)。
參考文獻(xiàn):
[1] 張曉丹.面向業(yè)務(wù)應(yīng)用交易的IT運(yùn)維監(jiān)控系統(tǒng)建設(shè)思路 [J].中國金融電腦,2015(1):38-41.
[2] 劉廣鋒.高校財(cái)務(wù)信息化建設(shè)存在的問題及對(duì)策 [J/OL].現(xiàn)代信息科技[2019-03-05].http://kns.cnki.net/kcms/detail/44.1736.TN.20180212.1020.016.html.
作者簡(jiǎn)介:葛斌(1986-),男,漢族,山東棗莊人,工程師,學(xué)士學(xué)位,研究方向:業(yè)務(wù)監(jiān)控系統(tǒng)的應(yīng)用。