張景川,席永杰
(山東廣電網(wǎng)絡(luò)有限公司臨沂分公司,臨沂 276000)
隨著廣電網(wǎng)絡(luò)集團(tuán)客戶業(yè)務(wù)的快速發(fā)展、用戶的增長(zhǎng),廣電網(wǎng)絡(luò)公司機(jī)房需要投入大量的服務(wù)器用于業(yè)務(wù)部署和支撐,如何在有限資金投資的前提下實(shí)現(xiàn)業(yè)務(wù)快速部署、集中管理,達(dá)到系統(tǒng)高可靠性和高可用性的目標(biāo)?同時(shí)又滿足降低網(wǎng)絡(luò)維護(hù)成本、提高維護(hù)效率、節(jié)能減排的要求,是我們?cè)诰W(wǎng)絡(luò)管理工作中一個(gè)重點(diǎn)關(guān)注和努力的方向。在這里搭建先進(jìn)的高性能虛擬化平臺(tái)進(jìn)行服務(wù)虛擬化成為首選方案。山東廣電網(wǎng)絡(luò)有限公司臨沂分公司(以下簡(jiǎn)稱“臨沂分公司”)中心機(jī)房數(shù)據(jù)業(yè)務(wù)系統(tǒng)建設(shè)較早,現(xiàn)有設(shè)備運(yùn)維管理的缺陷及弊端日益凸顯,主要表現(xiàn)在如下:
(1)服務(wù)器數(shù)量多,維護(hù)成本居高不下。大部分應(yīng)用分布在不同的物理服務(wù)器上,數(shù)十臺(tái)服務(wù)器占據(jù)大量的機(jī)柜資源。且由于服務(wù)器建設(shè)周期不等,部分老舊服務(wù)器性能不足、硬件故障率較高。大量的部件維護(hù)和購(gòu)置更換等在增加人員工作量的同時(shí)更增加了維護(hù)成本。
(2)耗電量及運(yùn)營(yíng)成本的增加。從維護(hù)成本支出上計(jì)算,每臺(tái)服務(wù)器按中等負(fù)載約300W,在不考慮制冷設(shè)備耗電量的情況下,僅十臺(tái)服務(wù)器每年就需要消耗接近3萬(wàn)度電。
(3)無備份運(yùn)行安全性差。多數(shù)服務(wù)器目前基本上屬于單主機(jī)環(huán)境運(yùn)行,且沒有集中的數(shù)據(jù)備份和管理,一旦業(yè)務(wù)系統(tǒng)出現(xiàn)故障無法實(shí)現(xiàn)快速的系統(tǒng)恢復(fù)和數(shù)據(jù)恢復(fù),會(huì)造成業(yè)務(wù)長(zhǎng)時(shí)間中斷。同時(shí)集客業(yè)務(wù)的客戶多是政府部門,現(xiàn)有硬件設(shè)施更是無法滿足政府對(duì)業(yè)務(wù)實(shí)時(shí)性的要求和業(yè)務(wù)系統(tǒng)數(shù)據(jù)安全性的要求。
(4)新增業(yè)務(wù)成本高。集客業(yè)務(wù)需求逐漸豐富,新增業(yè)務(wù)系統(tǒng)時(shí)需購(gòu)置服務(wù)器及機(jī)柜,設(shè)備購(gòu)置調(diào)試周期較長(zhǎng),無法實(shí)現(xiàn)新業(yè)務(wù)系統(tǒng)的快速上線。
(5)監(jiān)控管理技術(shù)落后、效率低下。既有內(nèi)網(wǎng)設(shè)備管理方式仍多數(shù)采取將放置在機(jī)柜中的服務(wù)器逐個(gè)接入KVM,通過KVM接入顯示器,通過顯示器進(jìn)行切換分別進(jìn)入不同的服務(wù)器進(jìn)行維護(hù)操作。業(yè)務(wù)系統(tǒng)逐漸增多,維護(hù)人員需要管理的系統(tǒng)也越來越多,這種輪詢檢查的方式越來越成為制約維護(hù)效率提升的瓶頸。
結(jié)合業(yè)務(wù)應(yīng)用現(xiàn)狀需求,臨沂分公司運(yùn)行維護(hù)部新搭建了一套高性能Vsphere虛擬化云平臺(tái),硬件方面使用多臺(tái)高性能服務(wù)器組成計(jì)算集群并通過NAS掛載多個(gè)高性能和大容量存儲(chǔ)。通過虛擬化技術(shù),將分布在物理服務(wù)器上的硬件資源形成一體的CPU、內(nèi)存和存儲(chǔ)資源池,并按需分配給每一臺(tái)正在運(yùn)行的虛擬機(jī)。由此多個(gè)問題迎刃而解:
(1)實(shí)現(xiàn)資源整合。僅用5臺(tái)服務(wù)器、兩臺(tái)集群交換機(jī)、兩臺(tái)存儲(chǔ)僅一個(gè)機(jī)柜的空間即可虛擬化出一整套高性能平臺(tái),其中計(jì)算資源池達(dá)到275.4Ghz,內(nèi)存資源池達(dá)到638GB,整合利舊現(xiàn)有的存儲(chǔ)資源,使存儲(chǔ)資源池達(dá)到了近50TB,由此完全了滿足現(xiàn)網(wǎng)以及未來一段時(shí)間內(nèi)各項(xiàng)目對(duì)服務(wù)器硬件資源的需求。
(2)實(shí)現(xiàn)節(jié)能降耗。利用P2V技術(shù),將原本運(yùn)行在物理服務(wù)器上的系統(tǒng)整體遷移到虛擬化平臺(tái)中,不僅可提高原系統(tǒng)的性能,老舊的物理服務(wù)器在完成業(yè)務(wù)割接后,即可下電下架以節(jié)省能耗和機(jī)柜空間資源。由此不再需要購(gòu)置各種型號(hào)備件,而配置較新的服務(wù)器則進(jìn)行虛擬化后將其計(jì)算資源和內(nèi)存資源利舊整合到資源池中。目前,我們已將智慧黨建、蜂巢網(wǎng)管、大唐運(yùn)維、PON網(wǎng)管、OTN網(wǎng)管、AAA計(jì)費(fèi)認(rèn)證、MSCP-DHCP服務(wù)器、DNS、辦公OA、Unio統(tǒng)一網(wǎng)管、FTP服務(wù)器等十余種服務(wù)進(jìn)行虛擬化,并下電了多臺(tái)老舊的物理服務(wù)器。
(3)新業(yè)務(wù)可進(jìn)行快速部署。當(dāng)新業(yè)務(wù)需要上線調(diào)試時(shí),可以根據(jù)業(yè)務(wù)應(yīng)用需求分配資源大小,通過模板虛擬機(jī)的快速部署,進(jìn)行測(cè)試和生產(chǎn)環(huán)境的快速搭建,不再需要購(gòu)置新的物理服務(wù)器,縮短調(diào)試周期。例如最新的智慧黨建項(xiàng)目,僅用1個(gè)小時(shí)即快速部署6臺(tái)高性能虛擬機(jī)并將網(wǎng)絡(luò)調(diào)試測(cè)通。
(4)平臺(tái)高可靠性提高。整個(gè)虛擬化平臺(tái)支持動(dòng)態(tài)遷移(vMotion)以及動(dòng)態(tài)資源調(diào)度(DRS),可以在不關(guān)機(jī)的狀態(tài)下對(duì)硬件進(jìn)行維護(hù)和升級(jí),更可以實(shí)現(xiàn)集群內(nèi)虛擬機(jī)在各個(gè)物理機(jī)的資源分配及負(fù)載均衡,從而保持了業(yè)務(wù)的高效性、可用性和持續(xù)性,多個(gè)高性能存儲(chǔ)可對(duì)虛擬機(jī)的整機(jī)進(jìn)行定時(shí)備份,使各個(gè)系統(tǒng)的RTO和RPO滿足需求。
(5)整個(gè)平臺(tái)使用一套監(jiān)控系統(tǒng),即可實(shí)時(shí)對(duì)運(yùn)行在資源池中的所有虛擬機(jī)和物理機(jī)進(jìn)行資源監(jiān)控和調(diào)配,可以便捷地對(duì)故障虛擬機(jī)進(jìn)行遠(yuǎn)程重啟、擴(kuò)容資源、查詢告警等。
虛擬化云平臺(tái),在山東廣電網(wǎng)絡(luò)有限公司臨沂分公司的集團(tuán)客戶業(yè)務(wù)和應(yīng)用服務(wù)上逐漸實(shí)現(xiàn)了業(yè)務(wù)快速部署、集中管理、降本增效、提高系統(tǒng)可靠性的目標(biāo),極大地提高了運(yùn)維效率與對(duì)外服務(wù)能力。