陳棟
一、以面向服務(wù)為原則,構(gòu)建信息資源的邏輯云圖
近幾年,河北地稅系統(tǒng)各類數(shù)據(jù)和業(yè)務(wù)逐步由市級集中過渡到省級集中,在數(shù)據(jù)中心部署的各類信息系統(tǒng)間的關(guān)聯(lián)關(guān)系日益復(fù)雜、支持運(yùn)行的硬件數(shù)量不斷增加,對安全性、可用性與連續(xù)性依賴程度越來越高,給運(yùn)維管理工作帶來巨大壓力。因傳統(tǒng)的運(yùn)維模式“重點(diǎn)輕面”,偏重于對單一設(shè)備資源的監(jiān)控和事件處理,缺少對全局性影響的分析和預(yù)估,被動(dòng)運(yùn)維事件多,主動(dòng)預(yù)防工作少,易產(chǎn)生擴(kuò)散性影響,造成嚴(yán)重?fù)p失,已不適應(yīng)新形勢的需要。
為此,河北地稅在深入總結(jié)分析運(yùn)維現(xiàn)狀的基礎(chǔ)上,大膽創(chuàng)新、勇于嘗試,以數(shù)據(jù)中心內(nèi)部信息資源間的關(guān)聯(lián)關(guān)系和數(shù)據(jù)流向?yàn)橹骶€,以面向服務(wù)為原則,按照信息資源在服務(wù)過程中的定位來劃分服務(wù)層次,建立起覆蓋數(shù)據(jù)中心全部信息資源的“四層一樹”邏輯云圖。在實(shí)施過程中,按照自下而上原則將信息資源橫向劃分為基礎(chǔ)設(shè)施、設(shè)備資源、數(shù)據(jù)存儲(chǔ)、系統(tǒng)軟件四個(gè)服務(wù)層面,其中又細(xì)分了動(dòng)力配電、空調(diào)新風(fēng)、消防安全、網(wǎng)絡(luò)系統(tǒng)、信息安全、計(jì)算主機(jī)、數(shù)據(jù)存儲(chǔ)、應(yīng)用軟件等11個(gè)服務(wù)單元。同時(shí),以全部24個(gè)業(yè)務(wù)系統(tǒng)和17項(xiàng)對外數(shù)據(jù)及應(yīng)用服務(wù)為主線,自頂而下構(gòu)建支撐每個(gè)業(yè)務(wù)系統(tǒng)的軟硬件資源樹型拓?fù)?,呈現(xiàn)邏輯清晰的業(yè)務(wù)系統(tǒng)服務(wù)支撐架構(gòu)。
通過構(gòu)建以服務(wù)為對象的信息資源邏輯云圖,將業(yè)務(wù)系統(tǒng)之間、設(shè)備資源之間的服務(wù)關(guān)系緊密銜接起來,使邏輯拓?fù)湟荒苛巳?,為運(yùn)維監(jiān)控管理工具的整合確定了方向,方便了流量分析、服務(wù)評價(jià)、影響度評估等運(yùn)維管理工作開展,徹底消除了“只見樹木、不見森林”的弊端。
二、以先進(jìn)技術(shù)為依托,集中管控信息資源
實(shí)現(xiàn)信息資源的集中管控,是面向服務(wù)開展運(yùn)維工作的前提條件。通過借助先進(jìn)技術(shù)手段,實(shí)現(xiàn)了信息資產(chǎn)管理的標(biāo)準(zhǔn)化、物聯(lián)化和監(jiān)控展示的集中化。
(一)構(gòu)建配置管理數(shù)據(jù)庫,實(shí)現(xiàn)信息資產(chǎn)全生命周期管理
將機(jī)房各類信息資產(chǎn)(服務(wù)器、中間件、數(shù)據(jù)庫、網(wǎng)絡(luò)、業(yè)務(wù)系統(tǒng))進(jìn)行整合,采用全生命周期管理方式,詳細(xì)記錄信息資產(chǎn)從需求、規(guī)劃、采購、上架、運(yùn)行、維保、下架、報(bào)廢的全過程。通過應(yīng)用配置管理數(shù)據(jù)庫,對各類設(shè)備資源提供服務(wù)關(guān)聯(lián)配置,使之成為一條完整的關(guān)聯(lián)鏈,涵蓋了設(shè)備及軟件資源的各項(xiàng)配置信息,當(dāng)其中一項(xiàng)服務(wù)或者設(shè)備告警時(shí),可第一時(shí)間對其相關(guān)聯(lián)的服務(wù)進(jìn)行排查。通過采取全生命周期管理和使用配置管理數(shù)據(jù)庫,徹底解決了因應(yīng)用不斷拓展、機(jī)房設(shè)備不斷添加和升級,而導(dǎo)致機(jī)房管理難度增加、管理混亂的情況,實(shí)現(xiàn)了機(jī)房設(shè)備管理的標(biāo)準(zhǔn)化,為各項(xiàng)監(jiān)控工具的信息整合提供了基礎(chǔ)平臺。
(二)利用二維碼技術(shù),實(shí)現(xiàn)信息資產(chǎn)的物聯(lián)
由于二維碼具有儲(chǔ)存量大、可追蹤性高、抗損性強(qiáng)、備援性大、成本便宜等特性,成就了其作為信息標(biāo)識載體的核心地位。河北地稅汲取物聯(lián)網(wǎng)思路,以信息資產(chǎn)管理和配置管理數(shù)據(jù)庫為依托,以二維碼標(biāo)簽為載體,為每個(gè)設(shè)備貼上了獨(dú)有的二維碼“身份證”。運(yùn)維人員通過手機(jī)專用軟件對二維碼進(jìn)行掃描,即可查看設(shè)備的相關(guān)信息,實(shí)現(xiàn)快速、準(zhǔn)確的設(shè)備信息獲取,提升了工作效率,減少了故障設(shè)備排查時(shí)間,最大程度保障運(yùn)行安全。例如,通過手機(jī)掃描一臺服務(wù)器的二維碼可獲取到該設(shè)備的編碼、設(shè)備型號、硬件配置、主要用途等基本信息。經(jīng)手機(jī)專用軟件的認(rèn)證授權(quán)后,可進(jìn)一步查看該設(shè)備在信息資產(chǎn)管理和配置管理數(shù)據(jù)庫中的詳細(xì)信息,不僅包括該設(shè)備自有的軟硬件配置信息,還可按照“四層一樹”原則查看與其關(guān)聯(lián)的其他服務(wù)單元信息,實(shí)現(xiàn)了設(shè)備管理的高效性、透明度和智能化。下一步,河北地稅將在現(xiàn)有功能基礎(chǔ)上拓展機(jī)房巡檢功能,進(jìn)一步完善運(yùn)維掌上工具。
(三)通過三維展現(xiàn)平臺,集中監(jiān)控信息資源和應(yīng)用服務(wù)
根據(jù)業(yè)務(wù)系統(tǒng)部署邏輯,按照“四層一樹”原則,利用三維展示平臺,虛擬構(gòu)建機(jī)房各類實(shí)體,將各類管理工具、監(jiān)控系統(tǒng)整合到可視化管理系統(tǒng)中,并由各個(gè)自動(dòng)化、智能化系統(tǒng)提供實(shí)時(shí)監(jiān)控?cái)?shù)據(jù),使其具有高度的可視化、可操作性,生動(dòng)且具體的展現(xiàn)了數(shù)據(jù)中心每個(gè)資源的監(jiān)控指標(biāo),使運(yùn)維人員通過運(yùn)維屏幕監(jiān)控機(jī)房各項(xiàng)系統(tǒng)的運(yùn)行情況,實(shí)現(xiàn)了資產(chǎn)可視化、容量可視化、管線可視化、監(jiān)控可視化等功能。同時(shí),通過各種終端(手機(jī)等)展現(xiàn),進(jìn)一步滿足一體化全息監(jiān)控和管理需要,實(shí)現(xiàn)了“全天候無人值守”機(jī)房。通過三維展現(xiàn)平臺,不僅可以按照業(yè)務(wù)系統(tǒng)維度逐層展現(xiàn)關(guān)聯(lián)資源運(yùn)行狀態(tài),也可根據(jù)某個(gè)資源查看其關(guān)聯(lián)的其他資源及所服務(wù)的頂層業(yè)務(wù)狀況,為快速定位資源故障和影響度分析提供了幫助。
三、以科學(xué)管理為手段,構(gòu)建運(yùn)維新模式
“三分技術(shù),七分管理”,以“流程標(biāo)準(zhǔn)化、反應(yīng)快速化、資源彈性化、管理自動(dòng)化”為抓手,積極構(gòu)建數(shù)據(jù)中心運(yùn)維管理新模式。
(一)制定標(biāo)準(zhǔn)化、自動(dòng)化的數(shù)據(jù)中心運(yùn)維管理流程
嚴(yán)格遵守總局制定的《稅務(wù)信息化系統(tǒng)運(yùn)行運(yùn)維管理公用規(guī)范》,并參照工信部發(fā)布的ITSS服務(wù)標(biāo)準(zhǔn)和國際通用的ISO20000等運(yùn)維管理方式,結(jié)合實(shí)際情況,建立了相關(guān)的運(yùn)維管理標(biāo)準(zhǔn)化工作體系。通過監(jiān)控與運(yùn)維管理技術(shù)平臺的融合,將監(jiān)控告警信息自動(dòng)接入運(yùn)維管理平臺,運(yùn)維事件在運(yùn)維管理平臺處理后才可關(guān)閉告警,有效地將人員、技術(shù)和資源要素連接起來,快速發(fā)現(xiàn)事件問題并指導(dǎo)運(yùn)維人員按標(biāo)準(zhǔn)流程處理,切實(shí)做到“有事記錄、有事可查、有事到人”,對運(yùn)維工作起到了有效的支撐作用。
(二)保障業(yè)務(wù)系統(tǒng)服務(wù)穩(wěn)定,開展全流域監(jiān)控分析
機(jī)打發(fā)票管理系統(tǒng)于2012年部署上線,與核心征管系統(tǒng)、稅庫銀等系統(tǒng)均有數(shù)據(jù)交互,且做過多次升級完善,但仍有基層反映系統(tǒng)響應(yīng)慢、偶爾中斷情況。我們在排除軟硬件故障的情況下,還需投入大量的人力去還原分析,無法追蹤且不易判斷,給運(yùn)維工作帶來不小壓力。按照面向服務(wù)的運(yùn)維原則,以支撐發(fā)票管理系統(tǒng)的樹型拓?fù)涞男畔①Y源為監(jiān)控目標(biāo),采用全流域監(jiān)控分析的方法,通過專業(yè)監(jiān)控工具實(shí)時(shí)抓取數(shù)據(jù)包從終端發(fā)出到返回所經(jīng)過的信息資源耗時(shí)和資源占用情況,進(jìn)行自動(dòng)化比對分析,以此發(fā)現(xiàn)潛在問題,涉及終端系統(tǒng)、網(wǎng)絡(luò)傳輸、安全設(shè)備、負(fù)載均衡、中間件、數(shù)據(jù)庫等多個(gè)環(huán)節(jié)。經(jīng)過數(shù)據(jù)采集和比對分析,發(fā)現(xiàn)了因兩項(xiàng)不常用查詢業(yè)務(wù)的數(shù)據(jù)庫腳本編寫不規(guī)范,造成腳本長時(shí)間過多占用數(shù)據(jù)庫資源導(dǎo)致其他服務(wù)響應(yīng)緩慢的問題,以及個(gè)別基層單位網(wǎng)路丟包及終端落后等其他資源問題。
以業(yè)務(wù)系統(tǒng)服務(wù)為主線的全流域監(jiān)控分析方法,不僅能及早發(fā)現(xiàn)潛在的軟件設(shè)計(jì)與編碼問題,還有利于對各類信息資源的承載情況進(jìn)行綜合分析,為后續(xù)資源配置工作提供參考。
(三)利用統(tǒng)計(jì)分析方法,提升數(shù)據(jù)中心服務(wù)單元能力
數(shù)據(jù)中心運(yùn)行是動(dòng)態(tài)的,通過各類監(jiān)控工具可以記錄每時(shí)每刻的變化,當(dāng)發(fā)現(xiàn)異常時(shí),及時(shí)將告警通知運(yùn)維人員,或者軟件自動(dòng)啟用備用系統(tǒng),確保數(shù)據(jù)中心繼續(xù)穩(wěn)定運(yùn)行。大多數(shù)情況下,海量的監(jiān)控?cái)?shù)據(jù)要么被遺棄要么沉睡下去。從優(yōu)化資源配置、提升服務(wù)能力的管理角度出發(fā),探索性的將各類監(jiān)控?cái)?shù)據(jù)進(jìn)行了數(shù)據(jù)整合,利用統(tǒng)計(jì)分析方法對各類服務(wù)單元進(jìn)行使用頻率、資源占用和影響度進(jìn)行趨勢分析,為日常運(yùn)維管理決策依據(jù)。例如,在去年的季度數(shù)據(jù)分析中,我們發(fā)現(xiàn)一列機(jī)柜的溫度值長期高于其他機(jī)柜,為其提供冷風(fēng)服務(wù)的機(jī)房空調(diào)也是滿負(fù)荷運(yùn)轉(zhuǎn),照此以往將不利于柜內(nèi)設(shè)備散熱并導(dǎo)致服務(wù)效能下降,為此維護(hù)人員及時(shí)調(diào)整了該列機(jī)柜柜內(nèi)設(shè)備的數(shù)量和間距,確保散熱均勻。
四、找準(zhǔn)面向服務(wù)的切入點(diǎn),運(yùn)維管理水平顯著提升
探索面相服務(wù)的數(shù)據(jù)中心運(yùn)維管理的初衷是構(gòu)建致力于降低 IT 成本、提高業(yè)務(wù)影響力、改進(jìn)服務(wù)質(zhì)量、管理風(fēng)險(xiǎn)和提供透明度的統(tǒng)一運(yùn)維管理新模式,使數(shù)據(jù)中心可根據(jù)業(yè)務(wù)服務(wù)需求高效地執(zhí)行和管理技術(shù)與流程,從而快速提供創(chuàng)造更大業(yè)務(wù)價(jià)值的新服務(wù),兼而能以更低的成本支持現(xiàn)有的服務(wù)。通過近幾年的探索和實(shí)踐,河北地稅面向服務(wù)的運(yùn)維管理已初具成效:一是實(shí)現(xiàn)了全部信息資源的標(biāo)準(zhǔn)化、動(dòng)態(tài)化管理,共梳理軟硬件資源信息千余條,杜絕了“設(shè)備無人認(rèn)領(lǐng),資源找不到歸屬”的弊??;二是通過集中監(jiān)控運(yùn)維,整合了7個(gè)監(jiān)控工具,總結(jié)梳理監(jiān)控盲區(qū)21個(gè),新增關(guān)聯(lián)告警事件36類,大幅提升了專業(yè)監(jiān)控工具自身的監(jiān)控能力;三是構(gòu)建了27個(gè)業(yè)務(wù)系統(tǒng)樹型拓?fù)?,?dāng)監(jiān)控捕捉到各個(gè)服務(wù)層次的監(jiān)控事件時(shí),通過拓?fù)涞挠绊懧窂酵扑?,快速分析影響范圍,區(qū)分出根源事件和表象事件,有效的解決了在日常運(yùn)營、應(yīng)急處理和優(yōu)化分析方面的管理效率問題,日常事件處理效率提升50%以上;四是充分利用整合的監(jiān)控?cái)?shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,通過可視化手段展現(xiàn)數(shù)據(jù)中心能耗、空間、承重、流量等統(tǒng)計(jì)信息,不僅可以快速直觀地為新增設(shè)備尋找合適的上架空間,還為資源配置提供了數(shù)據(jù)參考,提高了部署、更新和容量擴(kuò)展效率,使數(shù)據(jù)中心具備足夠的敏捷度。
結(jié)束語
雖然河北地稅在數(shù)據(jù)中心運(yùn)維管理方面的探索取得了一點(diǎn)進(jìn)步和成績,但與總局和信息技術(shù)行業(yè)的要求相比,與其他單位的成功經(jīng)驗(yàn)相比,還存在一定差距。在數(shù)據(jù)中心運(yùn)維管理上,河北地稅將加快完善云計(jì)算和物聯(lián)網(wǎng)時(shí)代數(shù)據(jù)中心運(yùn)維管理的一體化、網(wǎng)絡(luò)化和智能化進(jìn)程,為進(jìn)一步提升信息化對稅收事業(yè)的支撐能力不懈努力。