如今,電子渠道的業(yè)務(wù)量已經(jīng)占到銀行業(yè)務(wù)量的80%以上,電子渠道用戶的體驗變得比以往任何時候都更加重要。作為業(yè)務(wù)系統(tǒng)的建設(shè)者與維護者,運維部門同樣需要從客戶的體驗出發(fā),實時感知用戶辦理業(yè)務(wù)的真實體驗,及時定位和解決影響用戶體驗的隱患和故障,以持續(xù)提升用戶滿意度,滿足行內(nèi)業(yè)務(wù)發(fā)展的要求。
浙江省作為全國民營經(jīng)濟最發(fā)達(dá)的地區(qū),金融業(yè)務(wù)的需求非常旺盛。作為浙江省內(nèi)最大的金融機構(gòu),浙江省農(nóng)村信用社聯(lián)合社(以下簡稱省聯(lián)社)負(fù)責(zé)對浙江省農(nóng)信系統(tǒng)(包括農(nóng)信聯(lián)社、農(nóng)村合作銀行、農(nóng)村商業(yè)銀行)進(jìn)行管理、指導(dǎo)、協(xié)調(diào)和服務(wù)。本行下轄81 家行社,擁有4100 多個營業(yè)網(wǎng)點及5 萬多名員工,規(guī)模大、網(wǎng)點多,業(yè)務(wù)穩(wěn)定性要求高,因此對運維品質(zhì)和質(zhì)量的要求極高。
隨著省聯(lián)社業(yè)務(wù)發(fā)展及IT 管理的需要,服務(wù)器、網(wǎng)絡(luò)、中間件、業(yè)務(wù)應(yīng)用等面臨的監(jiān)控壓力也越來越大,運維監(jiān)控開始出現(xiàn)短板:
1.業(yè)務(wù)系統(tǒng)多,缺乏統(tǒng)一的應(yīng)用性能監(jiān)控平臺,無法實時把控業(yè)務(wù)系統(tǒng)的運行質(zhì)量;
2.故障可能的種類和原因愈發(fā)復(fù)雜,完成告警、定位、排障流程的耗時越來越長;
3.對應(yīng)用監(jiān)控的指標(biāo)和維度不夠豐富,缺乏能夠反映用戶真實體驗的監(jiān)控數(shù)據(jù)。
針對以上問題,運維部門開始著手建設(shè)應(yīng)用性能監(jiān)控平臺,幫助快速提升運維能力。
1.方案選型
經(jīng)過對行業(yè)內(nèi)相關(guān)技術(shù)的廣泛調(diào)研和考察,目前主流的三種監(jiān)控技術(shù)手段為:網(wǎng)絡(luò)旁路、埋點和日志。經(jīng)過詳盡的對比和評估,省聯(lián)社認(rèn)為旁路式監(jiān)控對生產(chǎn)系統(tǒng)無影響,實施周期短,可快速提高科技部門的業(yè)務(wù)運維能力,成本低,見效快。由此決定進(jìn)行網(wǎng)絡(luò)旁路式監(jiān)控的部署。
2.覆蓋范圍
采用網(wǎng)絡(luò)旁路式應(yīng)用性能監(jiān)控技術(shù)的適應(yīng)性強、時間短、成本低,適合多套業(yè)務(wù)系統(tǒng)的端到端全鏈路部署。所以在一期項目中,省聯(lián)社選取了行內(nèi)16 套重要業(yè)務(wù)系統(tǒng)進(jìn)行了全鏈路監(jiān)控,包括:核心系統(tǒng)、網(wǎng)上銀行、手機銀行、大小額支付(超級網(wǎng)銀、農(nóng)信銀)、綜合前置(渠道接入)、信用卡、電話銀行、第三方中間業(yè)務(wù)、銀行卡前置、綜合前端、國際業(yè)務(wù)、資金業(yè)務(wù)、短信平臺、信貸管理以及互聯(lián)網(wǎng)金融等系統(tǒng)。
3.系統(tǒng)主要功能
應(yīng)用性能監(jiān)控平臺作為省聯(lián)社在運維方面的主要監(jiān)控系統(tǒng),提供了絕大部分應(yīng)用監(jiān)控的功能實現(xiàn):
(1)業(yè)務(wù)架構(gòu)梳理
通過分析網(wǎng)絡(luò)數(shù)據(jù)包來自動繪制應(yīng)用訪問關(guān)系,使省聯(lián)社實現(xiàn)了業(yè)務(wù)流程流轉(zhuǎn)關(guān)系的動態(tài)刷新,并可在業(yè)務(wù)系統(tǒng)變更后快速梳理業(yè)務(wù)架構(gòu)。
(2)統(tǒng)計指標(biāo)計算
通過網(wǎng)絡(luò)數(shù)據(jù)包的自動解碼、關(guān)聯(lián),實時計算交易量、響應(yīng)率、成功率、響應(yīng)時間等應(yīng)用性能指標(biāo),實現(xiàn)了高實時性的業(yè)務(wù)運行狀態(tài)把控。
(3)性能展示
實現(xiàn)了對16 套重要業(yè)務(wù)系統(tǒng)的實時監(jiān)控覆蓋,并可根據(jù)需要自定義展示的指標(biāo)數(shù)據(jù),通過數(shù)據(jù)掌握用戶的真實體驗情況;并且可根據(jù)運維和管理需要靈活采集不同維度的數(shù)據(jù),將監(jiān)控平臺所展示的指標(biāo)與信息集中于當(dāng)下運維關(guān)注點。
(4)實時告警
通過與行內(nèi)事件平臺的集成,通過動態(tài)基線和固定閾值組合的模式實現(xiàn)實時預(yù)警與快速定位,第一時間發(fā)現(xiàn)業(yè)務(wù)運行的隱患和故障,提高故障排除與系統(tǒng)恢復(fù)的處理效率。
(5)交易查詢
通過精確到逐筆交易的明細(xì)數(shù)據(jù)字段,實現(xiàn)對單筆交易的查詢、追蹤、分析、定位等操作,滿足快速查障排障的工作需要。
(6)數(shù)據(jù)輸出
通過API 接口應(yīng)用將監(jiān)控平臺的實時監(jiān)控數(shù)據(jù)與監(jiān)管報送平臺對接,滿足浙江省銀監(jiān)局信息科技風(fēng)險動態(tài)監(jiān)測數(shù)據(jù)的報送要求。
(7)大屏展示
通過接入監(jiān)控平臺實時數(shù)據(jù),模塊化自定義大屏可提供針對業(yè)務(wù)運行、用戶體驗、系統(tǒng)性能、交易分布等多種維度的信息展示,在重大保障、系統(tǒng)變更、壓力測試等場合可實時、快速掌握各系統(tǒng)的全局運行態(tài)勢。
通過此次項目建設(shè),省聯(lián)社大大改善了業(yè)務(wù)系統(tǒng)的監(jiān)控粒度和實時性,促進(jìn)了運維水平和服務(wù)質(zhì)量的極大提升,保障了業(yè)務(wù)系統(tǒng)可用性及連續(xù)性的進(jìn)一步提高。
省聯(lián)社在較短的時間完成了行內(nèi)主要業(yè)務(wù)系統(tǒng)的端到端的全鏈路監(jiān)控覆蓋,建成了一體化應(yīng)用監(jiān)控平臺,實現(xiàn)了運維部門應(yīng)用監(jiān)控能力的極大增強,改善了運維工作的效率和品質(zhì)。
新系統(tǒng)建成后,省聯(lián)社擁有了對業(yè)務(wù)系統(tǒng)中各項數(shù)據(jù)的采集、處理、分析能力,為后期金融科技項目建設(shè)提供了技術(shù)支持和數(shù)據(jù)來源;高度靈活性的運維管理平臺能夠很好地應(yīng)對和滿足業(yè)務(wù)系統(tǒng)不斷擴張升級帶來的運維需求和壓力,支撐未來多年的業(yè)務(wù)系統(tǒng)發(fā)展。
近幾年,浙江省農(nóng)村信用社聯(lián)合社逐步建成了管控平臺、部署平臺、日志平臺、應(yīng)用性能管理四大運維平臺。應(yīng)用性能管理平臺自上線運營以來,在新業(yè)務(wù)上線、業(yè)務(wù)變更、重大活動保障、災(zāi)備演練等各方面成效顯著,已多次幫助運維部門及時預(yù)警、及時處理業(yè)務(wù)故障;幫助業(yè)務(wù)運維部門掌握業(yè)務(wù)系統(tǒng)的實時運行狀況,實時監(jiān)測用戶的業(yè)務(wù)體驗;同時,保質(zhì)保量地完成數(shù)據(jù)監(jiān)管報送要求。后期,省聯(lián)社將持續(xù)提高監(jiān)控覆蓋率,力求實現(xiàn)對行內(nèi)重要業(yè)務(wù)系統(tǒng)的端到端監(jiān)控全覆蓋,實現(xiàn)用戶業(yè)務(wù)體驗的全流程監(jiān)測。
點評
隨著金融電子化的深入推進(jìn),電子渠道的業(yè)務(wù)量大大增加,業(yè)務(wù)系統(tǒng)對客戶體驗和滿意度的影響作用也大大提升,浙江省農(nóng)村信用社聯(lián)合社通過建設(shè)新一代應(yīng)用性能監(jiān)控平臺,實現(xiàn)用戶業(yè)務(wù)體驗的全流程監(jiān)測,在改善運維工作效率和品質(zhì)的同時,也增加了客戶滿意度。