張海全 林峰 楊東 陳涓
為了解決南瑞集團阿里云、華為云、自研云及虛擬化軟件、堡壘機等多種軟硬件產品集成對接,通過建設南瑞云管平臺提供異構云環(huán)境下的監(jiān)控、管理和運維能力,實現對異構云的統(tǒng)一監(jiān)控、統(tǒng)一管理及統(tǒng)一運維,用云管平臺代替人手工操作,提升自動化程度,提高管理和運維的效率,提高資源使用效率,降低成本,降低安全風險。
一、引言
隨著云計算技術的普及,“三分建設、七分運營”同樣體現在云計算行業(yè),南瑞集團IT建設經過多年的發(fā)展,從傳統(tǒng) IT 到虛擬化,正在進行從虛擬化到私有云以及多云共存的這一關鍵性轉型與變革,隨著虛機、容器以及云建設規(guī)模的快速增長,導致不同的云平臺由于其管理的粒度、監(jiān)控指標、運維管理規(guī)范均不相同,給混合云管理人員帶來較大的挑戰(zhàn);內部私有云、虛擬化資源和外部云平臺資源,從企業(yè)層面難以實現統(tǒng)一管控;隨著業(yè)務的發(fā)展,傳統(tǒng)的手工操作工作量變大、資源交付服務效率低將會嚴重阻礙業(yè)務的敏捷性。因此,集團有必要從統(tǒng)一監(jiān)控、統(tǒng)一管理以及統(tǒng)一運維三個方面建設完善的云管理平臺。
二、云管平臺需求分析
南瑞集團信息化建設經過多年的發(fā)展,已演進到從虛擬化到私有云以及多云共存的關鍵階段。隨著云建設規(guī)模的快速增長,異構云平臺之間對資源的管理粒度、監(jiān)控指標、運維規(guī)范均不相同,難以實現統(tǒng)一管控,為運維管理工作帶來較大的挑戰(zhàn)。隨著集團全球業(yè)務的發(fā)展,難以滿足各類創(chuàng)新業(yè)務復雜多變的需求,傳統(tǒng)的運維方式工作量大、服務效率低下。通過構建統(tǒng)一的云管理平臺,整合集團內部多種私有云及虛擬化資源池,充分發(fā)揮計算、存儲、網絡、安全等基礎設施云服務能力。
三、云管平臺系統(tǒng)架構設計
本次云管的總體計框架可以用”一體兩線五層”來總結,見圖1。
一體:指本次方案是一個結合成熟商業(yè)軟件,根據南瑞的需求進行定制開發(fā),綜合考慮云技術、資源全生命周期管理的一體化解決方案,方案本身采用自上而下的整體設計理念,各個功能模塊基于整體框架的分解逐層展開設計,同時在實現過程各子系統(tǒng)也是緊密銜接,協(xié)同工作的解決方案。
兩線:本次方案的實現涉及多個系統(tǒng)及功能組件,在縱向上必須打通兩條主要通道,一條是自上而下的服務線,即從用戶提交請求開始,經過全局資源的調度分配,直至在本地資源落地的完整過程;一條是自下而上管理線,包含本地資源的注冊納管,運行狀態(tài)等信息收集匯聚,直到面向管理的呈現。
五層:本次方案架構分為五個層次:基礎架構層,資源接入適配層,服務支撐層,功能模塊層,統(tǒng)一門戶層。
第一層:基礎架構層
由VMware虛擬化平臺、私有云以及容器云、桌面云組成,將服務器、存儲、網絡虛擬成異構的資源池,提供資源層面的交付服務。
第二層:資源接入適配層
負責與各個云平臺的對接,計算、存儲、網絡的納管。
混合IT接口層由云平臺接入模塊、和獨立設備接入模塊組成。
云平臺接入模塊由適配層和各個云平臺插件組成,實現了同資源池的完全解耦。
第三層:服務支撐層
包含核心模塊和管理模塊。核心模塊,為上層提供編排服務、任務執(zhí)行服務、應用部署服務,支持上層門戶為各類角色用戶提供多云、混合云自動化的資源部署自動化、資源管理自動化、應用部署自動化、以及應用自動化運維服務。管理模塊包含用戶和多級租戶管理,以及不同角色用戶的訪問權限控制。
編排引擎:橫向支持跨主機、跨網絡、跨云平臺的編排,縱向支持涵蓋資源和應用的編排,是自動化運維的基礎。運營門戶中的服務目錄集群服務交付、自服務門戶中的代碼自動化部署、一鍵擴容、自動化伸縮均依賴于這個的編排引擎。
任務執(zhí)行引擎:主要支持在多個被管操作系統(tǒng)批量執(zhí)行腳本任務,并在執(zhí)行過程和完畢后上報執(zhí)行狀態(tài)、日志和結果。在執(zhí)行編排任務場景中,支持編排引擎的任務執(zhí)行請求。
代碼部署引擎:主要支持應用部署,支持以不同的策略,在多臺虛擬機執(zhí)行應用代碼部署任務。在執(zhí)行編排任務場景中,支持編排引擎的應用部署執(zhí)行請求。
第四層:功能模塊層
從整體上分為資源交付及運營模塊、應用交付及運維模塊和資源運維模塊;
資源交付及運營模塊:云管平臺需要提供自服務門戶及服務運營門戶,實現IT資源的全生命周期管理,即從服務目錄產品定義、申請、審批、資源自動化創(chuàng)建、網絡設置、應用安裝、資源續(xù)租、實例變更到最后釋放。同時,云管平臺需要提統(tǒng)一的計量,計費、成本分析、資源池容量分析,物理虛擬資源的資源使用分析、并能提供資源使用優(yōu)化建議。并為IT管理員及用戶提供各種維度的資源報表分析。
應用交付及運維 :云管平臺需要幫助企業(yè)實現應用維度的環(huán)境管理,實現應用的持續(xù)集成和發(fā)布,同時提供應用自動化運維和監(jiān)控告警能力。
服務對接:以模塊的方式同企業(yè)現有的安全組件、辦公及運維系統(tǒng)對接,包括備份、堡壘機、漏洞掃描等。
第五層:統(tǒng)一門戶層
為各類角色用戶和應用提供整合的用戶接口,各類角色用戶均可以通過這個整合門戶登陸,選擇進入要進入的門戶;面向企業(yè)內部的用戶以及云平臺的管理員,為其提供IT資源分析門戶,面向IT管理員提供服務運營門戶,面向內部用戶提供自服務門戶和應用運維門戶。同時可以為客戶定制資源使用實時情況的大屏展示。
四、結語
通過云管平臺,統(tǒng)一納管異構的基礎設施,提供統(tǒng)一的資源統(tǒng)計分析,成本分攤分析。同時,通過云管平臺服務運營及自服務模塊,標準化、服務化、自助化交付 IT資源,集成南瑞內部已有 OA 系統(tǒng)、App入口,保證 IT 資源服務化能力的落地。云管平臺建設中,除了 IT 基礎架構資源的快速敏捷使用和交付,業(yè)務部門可以對 IT 資源的全生命周期進行自助式服務之外,業(yè)務部門還可以通過云管平臺不斷提升應用交付的效率,提升應用 CI/CD 水平。