鄧惠賢,彭 建,尚聞博
(1.國網(wǎng)信通億力科技有限責任公司,福建 福州 350001;2.國網(wǎng)甘肅省電力公司信息通信公司,甘肅 蘭州 730050)
云計算是現(xiàn)階段比較流行的一種商業(yè)計算模型,計算機系統(tǒng)中分布著大量的計算任務,各個系統(tǒng)可以結合自身的需求進行計算力分析、存儲空間優(yōu)化,并提供多樣性軟件服務。隨著云計算的不斷發(fā)展,信息系統(tǒng)的基礎設施變得更加完善,特別是在交付模式、使用模式方面,根據(jù)網(wǎng)絡模式可以實現(xiàn)按需分配,具有很強的擴展性。云計算中主要包括三層的基本服務模式,分別為軟件、平臺及基礎設施。軟件作為云計算中相對成熟與完善的服務,在互聯(lián)網(wǎng)技術的指導下,可以為用戶提供一些特殊應用程序及軟件服務方式。
為提升信息通信運維服務質量,“十三五”信息化規(guī)劃中提出全面開展信息通信系統(tǒng)自動化運維建設,于2016年啟動運維自動化頂層設計,并在此基礎上鼓勵電力行業(yè)各單位根據(jù)自身運維需求開展自動化巡檢、合規(guī)性檢查、自動化部署、資源自動化分配及一鍵重啟等自動化運維支撐工具建設工作。電力行業(yè)對各單位未來三年面向作業(yè)層面的運維工具建設提出了更高要求。目前,通過管理平臺和SG-ITOM3.0的建設,已經(jīng)建立了較為全面的運維管控體系,實現(xiàn)了對基礎設施和業(yè)務系統(tǒng)的監(jiān)控管理,但面向作業(yè)的運維自動化水平還有待提升,傳統(tǒng)依托腳本或者針對某個具體運維場景進行成熟軟件采購的運維自動化建設模式已經(jīng)無法滿足當前不斷提升的運維精益化要求、新技術應用日益廣泛的新需求。因此,開展敏捷化交付運維管理工具系統(tǒng)建設,以“強化安全、注重實用”為原則,逐步實現(xiàn)網(wǎng)絡層、平臺層、應用層及終端層等多層面運維對象自動化操作,促進運維工作從傳統(tǒng)模式向自動化模式有序平滑過渡已經(jīng)成為電力行業(yè)進一步提升信息通信運行保障能力的迫切需要。
目前,運維工作中存在8個問題。(1)傳統(tǒng)人工運維方式無法滿足信息化快速發(fā)展要求。目前的信息系統(tǒng)運維人機比率不均衡,運行人員壓力沉重,傳統(tǒng)的手工安裝部署系統(tǒng)和人工對設備監(jiān)控、操作的工作模式已經(jīng)無法滿足現(xiàn)在信息系統(tǒng)快速部署和高效運行的需要。(2)基礎硬件老舊,故障頻發(fā),為信息系統(tǒng)穩(wěn)定運行帶來極大風險。(3)運維管理效率有待提高。日常運維管理工作模式基本采用人工加Excel的方式進行處理。資源管理、人員管理、廠商評價、2+1及端口治理等常規(guī)和專項工作耗費大量人力,因人員疏漏造成的工作返工問題頻發(fā)。(4)基礎資源監(jiān)控分散。電力行業(yè)已完成各層級監(jiān)控系統(tǒng)建設,并且普遍得到了應用。但目前信息的采集各自獨立,信息管理分散,缺少全鏈條監(jiān)控和運行日志大數(shù)據(jù)分析,無法全面了解系統(tǒng)健康水平。(5)基礎平臺標準化率不高。按照基礎軟硬件版本升級和標準化工藝專項工作安排,電力行業(yè)已逐步開展基礎平臺標準化治理,操作系統(tǒng)、中間件及數(shù)據(jù)庫版本基本達到標準化。但僅完成版本標準化,無法支撐自動化工具的大范圍應用,需進一步推動全平臺的標準化,包括軟件版本、安裝路徑及軟件配置等。(6)自動化工具實施難度大。目前,已建和在建的主要自動化工具有自動化巡檢、自動化部署、合規(guī)性檢查及一鍵啟停的功能,但由于基礎平臺標準化率不高、系統(tǒng)臺賬不共享及操作風險不可控等因素,工具實施難度大,進度緩慢。(7)微工具未有效整合。隨著運維水平的不斷提高,各重要信息系統(tǒng)運維效率也依托自主研發(fā)的小工具、小應用逐步提高。此類微工具具有專用性強、兼容性弱的特點,未形成通用自動化工具集。(8)電力行業(yè)統(tǒng)一建設大數(shù)據(jù)平臺、全業(yè)務數(shù)據(jù)中心,大數(shù)據(jù)部分關鍵技術取得突破,但整體效果還有待提高,如全業(yè)務數(shù)據(jù)中心的運行效率、適用性、數(shù)據(jù)質量及數(shù)據(jù)管理等方面仍需進一步完善提升。
為盡快提升全網(wǎng)范圍內(nèi)IT運營的服務保障能力,電力行業(yè)有必要借鑒業(yè)界先進的IT運維服務管理理念,建立以客戶為導向的IT運維管理體系,實現(xiàn)對相關IT系統(tǒng)的綜合集中管理。自動化運維管理是一種以客戶和業(yè)務為中心的管理方法,以業(yè)界公認的ITIL最佳實踐作為指導規(guī)范。自動化運維管理既面向資源和應用,又面向各種人員,是集合人員、流程和工具的三位一體的系統(tǒng)。其中,人員是管理的主體,流程是運行規(guī)范,工具是流程運行的載體。本著三位一體的思想,IT運維服務管理體系將作為IT的重要項目進行長期建設,為規(guī)范IT日常管理工作、提高IT人員工作效率及切實提高IT服務質量打下良好的基礎。
PaaS平臺的特征為分布式、服務化、自動化部署、高可用、敏捷以及分層開放,并可與IaaS實現(xiàn)良好地聯(lián)動。
PaaS的本質是服務化。軟件模塊重用、服務治理及對外提供能力是PaaS的本質。
PaaS的根本特性是分布式。多租戶隔離、高可用及服務編排是PaaS的基本特性。
PaaS的靈魂是自動化。自動化部署安裝運維、自動化伸縮調度是PaaS的關鍵。
調度層(iPaaS)是管理和運維能力層。
能力層(aPaaS)可提供實際能力的業(yè)務價值。
流量調度的接入模塊(在兩個相關的PaaS層之上)包括流控、路由、降級、灰度、聚合及串聯(lián)等,還包括最新的AWS Lambda Service的小函數(shù)。該模塊的部署應該與CDN相同[1]。
完整的PaaS平臺會包括如下5個部分。
(1)PaaS調度層。PaaS的自動化和分布式對于高可用、高性能的管理。
(2)PaaS能力服務層。PaaS真正提供給用戶的服務和能力。
(3)PaaS的流量調度。與流量調度相關,包括對高并發(fā)的管理。
(4)PaaS的運營管理。軟件資源庫、軟件接入、認證和開放平臺門戶。
(5)PaaS的運維管理。與DevOps相關。
第一,先進性。根據(jù)全球IT管理業(yè)界提出來的指導性框架ITIL(Information Technical Infrastructure Library)V3.0基本管理體系,規(guī)范電力行業(yè)信息化系統(tǒng)運維管理工作,要求電力企業(yè)各個部門積極應用科學、規(guī)范的IT管理技術,并形成一流的安全管理模式及服務模式[2]。
第二,實用性。根據(jù)電力行業(yè)的實際發(fā)展情況,優(yōu)化運營體系,以滿足管理需求。通過實時的動態(tài)監(jiān)控、檢測業(yè)務基本能力、實施巡檢自動化操作、完成操作調度及安全管理等,充分實現(xiàn)系統(tǒng)的功能。在此基本工作中滲透服務管理模式,可以在系統(tǒng)的一切信息化操作中形成統(tǒng)一的管理、監(jiān)控及維護,對促進電力行業(yè)的信息化發(fā)展具有重要意義,并對提高平臺的運營管理效率產(chǎn)生積極的效果。
第三,高效性。各個層面中,運維部門相關用戶通過對自動化的運維管理平臺的應用,可以更好地進行故障預警,并對故障進行迅速定位,便于及時了解故障系統(tǒng)的運行情況。此外,通過系統(tǒng)應用可以進行快速的工單處理、幫助尋求及運營情況分析等。通過多種功能的發(fā)揮和利用,提高解決故障的效率,并盡可能減少系統(tǒng)故障導致的損失,便于優(yōu)化運維系統(tǒng)的基本流程,對充分提升工作效率與管理水平具有重要的價值。
第四,擴展性。在管理及業(yè)務的不斷發(fā)展下,自動化的運維管理系統(tǒng)因具備靈活、迅速的配置方式,拓展了其管理范圍,在整個電力行業(yè)信息化系統(tǒng)中得以廣泛應用,實現(xiàn)了對全網(wǎng)的統(tǒng)一監(jiān)控、統(tǒng)一維護及統(tǒng)一管理。根據(jù)相關報道,該系統(tǒng)已經(jīng)滲透到電力行業(yè)信息化管理的各個環(huán)節(jié),并發(fā)揮著重要的作用,對重新優(yōu)化系統(tǒng)功能、實現(xiàn)系統(tǒng)科學配置有著重要的意義[3]。
第五,規(guī)范性。推廣自動化的運維管理平臺的過程中,需要嚴格采取關鍵指標,并在關鍵流程的指導下統(tǒng)一關鍵功能,要盡可能滿足全國統(tǒng)一的基本要求;結合各地的基本情況,積極完善相關指標體系;在服務管理模式中進行科學地細化,不斷規(guī)范運營管理體系,提高系統(tǒng)運行的科學性與規(guī)范性。
第六,安全性。在自動化的運維管理平臺構建中,要不影響基本系統(tǒng)的功能,并確保業(yè)務系統(tǒng)得以順利運行。這是進行系統(tǒng)管理與建設的重要原則,也是最基本的前提條件。
第七,合規(guī)性。在自動化的運維管理平臺建設方面,要充分考慮到我國電力行業(yè)的發(fā)展要求與相關標準,了解各級管理條例,結合電力行業(yè)發(fā)展的實際要求,加強對相關信息系統(tǒng)的控制,通過實施科學的審計工作來滿足該原則。對于任何一個系統(tǒng)的建設與應用,都需要充分考慮到行業(yè)基本發(fā)展要求,必須要在合規(guī)基礎上進行工作。
隨著運維規(guī)模的擴大,運維工具數(shù)量、種類也大幅增加,運維工具本身的管理成為必須面對的問題,需要統(tǒng)一集中的運維平臺支撐。PaaS平臺具備廣泛的兼容性,可納管全面的IT設備和系統(tǒng);具備與現(xiàn)有運維工具集成的能力,對過往投資保護;可靈活擴展到更多運維場景,而不增加平臺維護成本;具備向數(shù)據(jù)化、智能化演進的可能性,滿足長期建設要求;場景可由實際使用者根據(jù)自身使用需求提出并建設;發(fā)揮多方積極性,各取所長[4]。
本文分析了目前運維管理系統(tǒng)的現(xiàn)狀及存在的問題,提出了基于PaaS的自動化運維平臺的解決方案,重點分析了電力行業(yè)實施PaaS的背景及意義,探索建立PaaS的自動化運維平臺的設計原則。