張亮 喻鑫 高攀宇
摘要:為使信息化技術(shù)更好服務(wù)于水文事業(yè),建立了“水文信息化7層功能模型”。介紹了通過融合多臺物理服務(wù)器,運用虛擬機監(jiān)視軟件,建立服務(wù)器虛擬化集群的技術(shù)原理,研究了服務(wù)器虛擬化技術(shù)提高資源利用率、提升穩(wěn)定性、簡化部署和管理的技術(shù)特點。結(jié)合實例,闡述了服務(wù)器虛擬化技術(shù)在業(yè)務(wù)辦公、水情報汛、軟件研發(fā)中的多項應(yīng)用。該項技術(shù)的應(yīng)用有利于進一步促進“智慧水文”建設(shè),并可為水文行業(yè)的科學(xué)發(fā)展提供支撐。
關(guān)鍵詞:服務(wù)器虛擬化集群;7層功能模型;水文虛擬化應(yīng)用;水文信息化;智慧水文
中圖法分類號:P33-39 文獻標(biāo)志碼:A DOI:10.15974/j.cnki.sIsdkb.2020.07.013
1概述
水文信息化是水文行業(yè)走向現(xiàn)代化的工具,也是水文現(xiàn)代化的基礎(chǔ)和重要標(biāo)志,對新形勢下水文行業(yè)的發(fā)展有著重要意義。水文信息化從業(yè)者結(jié)合多年工作經(jīng)驗,通過多年的研究和實踐,建立了“水文信息化7層功能模型”,分別為硬件下3層的物理層、網(wǎng)絡(luò)層、虛擬層,軟件中間層的數(shù)據(jù)層、軟件層,以及頂部的應(yīng)用層和管理層(見圖1)。模型的最大優(yōu)點是運用模塊化理念,明確區(qū)分硬件、軟件、服務(wù)和管理,并融入精細化管理理念,使模型中的不同功能模塊分擔(dān)不同職責(zé)"。
在該模型中,虛擬層是承上啟下的關(guān)鍵層,即采用服務(wù)器虛擬化集群技術(shù),實現(xiàn)水文行業(yè)現(xiàn)有服務(wù)器資源整合與利用,從而構(gòu)建一個功能相對強大、性能相對穩(wěn)定的數(shù)據(jù)存儲與處理中心,可為水文業(yè)務(wù)提供應(yīng)用支撐平臺。以長江水利委員會水文局長江上游水文水資源勘測局(以下簡稱“上游局”)為例,上游局從2012年開始嘗試使用該項技術(shù),從最開始的幾臺PC機組建測試環(huán)境,到現(xiàn)在十幾臺服務(wù)器、交換機、存儲的聯(lián)合運行。目前,虛擬化集群承載了上游局95%以上的應(yīng)用,涉及面從單一的水情報汛工作擴展到各部門的綜合應(yīng)用服務(wù),甚至還延伸到了合作單位與下屬水文機構(gòu)的各項服務(wù)應(yīng)用。
2虛擬化技術(shù)原理
在計算機中,CPU以非連續(xù)的線性方式工作,各個計算元件通過排隊占用CPU的計算資源,而這種微觀下的線性工作在宏觀現(xiàn)實中表現(xiàn)出并行的工作狀態(tài),通過計算元件并行到軟件應(yīng)用并行,再到系統(tǒng)并行,產(chǎn)生虛擬化(Virtualization)技術(shù)。虛擬化是一種資源管理技術(shù),是將計算機的各種實體資源,如服務(wù)器、網(wǎng)絡(luò)及存儲等予以抽象、轉(zhuǎn)換后呈現(xiàn)出來,打破實體結(jié)構(gòu)間不可切割的障礙,使用戶可以采用比原本組態(tài)更好的方式來應(yīng)用這些資源。一般所指的虛擬化資源包括計算能力、數(shù)據(jù)存儲以及網(wǎng)絡(luò)路由,而虛擬化技術(shù)則是用來創(chuàng)建這些虛擬硬件的技術(shù)[2]。
2.1服務(wù)器虛擬化集群
服務(wù)器虛擬化是將服務(wù)器物理資源抽象成邏輯資源,可將IT環(huán)境改造成為更加強大、更具彈性、更富有活力的架構(gòu)。通過把多個操作系統(tǒng)整合到一臺高性能服務(wù)器,上,最大化利用硬件平臺的所有資源,用更少投入實現(xiàn)更多應(yīng)用,還可簡化IT架構(gòu),降低資源管理難度,避免IT架構(gòu)的非必要擴張。
服務(wù)器虛擬化集群是指通過服務(wù)器虛擬化技術(shù),將服務(wù)器物理資源抽象成邏輯資源,使多個邏輯資源相互關(guān)聯(lián),不再受限于物理。上的界限,讓CPU、內(nèi)存、磁盤、/0等硬件變成可動態(tài)管理的“資源池”,從而提高資源的綜合利用率,簡化系統(tǒng)管理,實現(xiàn)服務(wù)器整合,讓IT對業(yè)務(wù)的變化更具適應(yīng)性。目前,現(xiàn)代水文行業(yè)的發(fā)展呈現(xiàn)多樣化,水文信,息化應(yīng)滿足各方面的需求,因此服務(wù)器虛擬化集群可選擇“多虛多”的方式,即采用虛擬化軟件,將多臺物理服務(wù)器虛擬成一個邏輯服務(wù)器集群,再按需將其劃分為多個虛擬環(huán)境,即多個業(yè)務(wù)在多臺虛擬服務(wù)器上運行,見圖2。虛擬化架構(gòu)通過存儲區(qū)域(SAN)網(wǎng)絡(luò)讓前端的服務(wù)器與后端的存儲建立穩(wěn)定的高速連接,存儲提供虛擬系統(tǒng)的硬盤,SAN網(wǎng)絡(luò)承擔(dān)數(shù)據(jù)傳輸通道,服務(wù)器提供CPU、內(nèi)存和各種接口,共同虛擬出多套邏輯意義的服務(wù)器操作系統(tǒng),使用者僅需通過專用軟件正常操作即可。
2.2優(yōu)勢
較傳統(tǒng)服務(wù)器技術(shù)而言,服務(wù)器虛擬化集群技術(shù)已相對成熟,優(yōu)勢明顯。
(1)充分挖掘資源,降低成本。虛擬化技術(shù)通過建立資源池,從而高效利用每一種資源,并針對每種不同的使用環(huán)境來合理劃分所需資源,充分提高資源利用率。整個集群的全部硬件設(shè)備共同承載對外的軟件服務(wù),使用者只需關(guān)注整體的供給能力,性能不足時有針對性地購買相應(yīng)資源即可。例如上游局運用服務(wù)器虛擬化集群技術(shù),使其內(nèi)存、CPU與硬盤的資源利用率達70%以上,充分利用了硬件資源,整體節(jié)約90%的經(jīng)費支出。
(2)實現(xiàn)了虛擬機的在線遷移(onlinemigration)技術(shù),又稱為實時遷移(livemigration)技術(shù)。在保證虛擬機上服務(wù)正常運行的同時,虛擬機在不同物理主機之間進行遷移,為保證遷移過程中虛擬機服務(wù)可用,遷移過程停機時間非常短。遷移初期,服務(wù)在源主機運行,當(dāng)遷移進行到一定階段,目的主機已具備了運行系統(tǒng)的必須資源,經(jīng)過短暫切換,源主機將控制權(quán)轉(zhuǎn)移到目的主機,繼續(xù)在目的主機上運行。對服務(wù)本身而言,由于切換時間短,用戶感覺不到服務(wù)中斷,因而遷移過程對用戶是透明的。在線遷移適用于對服務(wù)可用性要求很高的場景,有效避免了因單臺物理服務(wù)器故障導(dǎo)致業(yè)務(wù)中斷運行的情況發(fā)生。
(3)簡化服務(wù)器的部署、管理和維護工作,降低管理難度。虛擬化集群減少了必須進行管理的物理資源數(shù)量,隱藏物理資源的部分復(fù)雜性,通過實現(xiàn)自動化、獲得更好的信息和實現(xiàn)中央管理來簡化公共管理任務(wù),實現(xiàn)負載管理自動化。在日常管理方面,虛擬化中心管理平臺還可以將硬件故障進行集中顯示和定向推送,是更高效和精準(zhǔn)的硬件管理式。虛擬機操作系統(tǒng)支持多人同時登錄平臺對其進行維護,便于在該平臺被多人同時登錄維護,以前在現(xiàn)場才能完成的軟硬件巡視任務(wù),現(xiàn)在在一套虛擬化中心管理平臺中便可輕松完成。最大限度優(yōu)化了執(zhí)行任務(wù)過程,提升了信息化管理制度的質(zhì)量。
3劣勢
虛擬化仍存在一些實施和管理上的缺點:①前期建立集群、后期管理主機、配置共享存儲的技術(shù)難度較大,使用單位需要組織團隊協(xié)同操作,在不斷運用中總結(jié)經(jīng)驗才能發(fā)揮其功效,并伴隨一定試錯成本;②虛擬化集群的更新升級存在不利因素,當(dāng)需要升級到更新版本的產(chǎn)品和硬件組件時可能存在困難,在集群環(huán)境中,需要同時協(xié)調(diào)多個虛擬主機服務(wù)器升級,這是具有技術(shù)挑戰(zhàn)性的任務(wù)之一;③虛擬化不能解決所有問題,那些數(shù)據(jù)中心里不可或缺的資源必須部署在物理服務(wù)器上,進而合理的規(guī)避風(fēng)險,為對外提供更穩(wěn)定、高效的數(shù)據(jù)資源服務(wù)。例如,上游局核心數(shù)據(jù)資源則采用物理雙機實時熱備模式進行架構(gòu)并對外提供服務(wù)。
2.4信息安全提升
在網(wǎng)絡(luò)安全方面,在一臺物理設(shè)備上運行多個虛擬操作系統(tǒng)是虛擬化技術(shù)的主要應(yīng)用之一,這些虛擬操作系統(tǒng)之間、與主機操作系統(tǒng)之間相互隔離,盡管在同一臺物理設(shè)備。上運行共享外設(shè)和網(wǎng)絡(luò),但是它們之間不能直接通信。虛擬化技術(shù)的隔離效果可以有效應(yīng)對黑客攻擊和應(yīng)用程序的不穩(wěn)定性,降低主機系統(tǒng)崩潰以及重要信息泄露的風(fēng)險。利用虛擬系統(tǒng)掩護主機操作系統(tǒng),為主機資源提供保護。
在數(shù)據(jù)安全方面,利用虛擬化模板技術(shù)、快照技術(shù)進行系統(tǒng)備份和系統(tǒng)恢復(fù),可有效減小恢復(fù)代價,縮短恢復(fù)周期。建立虛擬機映像文件對整個虛擬環(huán)境進行備份,實質(zhì)是備份幾個映像文件,只需要恢復(fù)文件時加載映像文件,幾分鐘之內(nèi)即可完成。而且,在不同物理設(shè)備和操作系統(tǒng)下進行數(shù)據(jù)恢復(fù),可大大降低傳統(tǒng)備份方式對軟硬件的要求和恢復(fù)周期。傳統(tǒng)的人工備份技術(shù)需要兩個以上的物理設(shè)備同時運行才能保障業(yè)務(wù)的連續(xù)性,虛擬化技術(shù)的應(yīng)用只需在同一臺物理設(shè)備上建立虛擬節(jié)點或虛擬拷貝,便可提供熱備份服務(wù),在主節(jié)點沒有業(yè)務(wù)需要處理時可以建立多個虛擬備份節(jié)點,動態(tài)提供備份服務(wù)。
3水文虛擬化應(yīng)用
隨著近幾年水文行業(yè)各項業(yè)務(wù)對信息化依賴程度的逐步提高,信息化設(shè)備的需求也快速增加。如應(yīng)用原始單機服務(wù)器,將產(chǎn)生大量的設(shè)備采購費用,水文經(jīng)濟支出也將帶來沉重負擔(dān);單機的離散型管理給水文信息化從業(yè)者帶來巨大的維護工作量;當(dāng)單機出現(xiàn)故障時會造成業(yè)務(wù)暫停和重要水文數(shù)據(jù)丟失的風(fēng)險。按照“水文信息化7層功能模型”的定義,虛擬層是硬件層的最上層,直接銜接軟件層中的數(shù)據(jù)層,為數(shù)據(jù)資源提供運行平臺。在傳統(tǒng)的服務(wù)器單機模式下,不僅要考慮數(shù)據(jù)層軟件安全,還要考慮硬件設(shè)備故障帶來數(shù)據(jù)丟失的風(fēng)險,虛擬層可為數(shù)據(jù)層提供完備的硬件支撐,免去了硬件設(shè)備故障的擔(dān)憂,數(shù)據(jù)層則只需關(guān)注軟件層面的數(shù)據(jù)安全即可。
以上游局為例,2014年上游局便開始籌劃構(gòu)建一套完整的服務(wù)器虛擬化集群來應(yīng)對今后的需求。經(jīng)過幾年的摸索與實踐,上游局的服務(wù)器虛擬化集群已初具規(guī)模,由12臺物理服務(wù)器、1臺專業(yè)存儲設(shè)備和多臺千兆口交換機(包括SAN交換機)共同組建。該集群包含接近1TB內(nèi)存空間,18TB硬盤空間,共運行包括實驗環(huán)境在內(nèi)的180套虛擬化操作系統(tǒng),為上游局機關(guān)全體部門提供工作業(yè)務(wù)應(yīng)用服務(wù)、測試研發(fā)的系統(tǒng)支撐,保證了上游局全部信息化相關(guān)業(yè)務(wù)的正常開展。在虛擬化集群中心端的控制下,當(dāng)單臺設(shè)備出現(xiàn)故障或性能下降時,應(yīng)用系統(tǒng)可自動遷移至性能優(yōu)良的環(huán)境中運行,不影響業(yè)務(wù)的正常開展。網(wǎng)絡(luò)管理員可在統(tǒng)一管理平臺中對多臺虛擬操作系統(tǒng)進行集中管理,隨時調(diào)整系統(tǒng)資源。當(dāng)網(wǎng)絡(luò)管理員需要檢修硬件時,也可通過遷移清空該設(shè)備的對外服務(wù),做到安全維護。如果集群中內(nèi)存、硬盤或者CPU用量不足時可合理添加相應(yīng)耗材。整體滿足安全性、可維護性及經(jīng)濟性需求,避免了資源浪費。
3.1部門服務(wù)應(yīng)用
水文行業(yè)建立的服務(wù)器虛擬化集群不僅可用于水文相關(guān)應(yīng)用服務(wù),還可為其他部門提供一體化的系統(tǒng)級應(yīng)用。各部門不必單建機房采購物理服務(wù)器和維護操作系統(tǒng),減少了各業(yè)務(wù)部門工作量,降低了技術(shù)難度,僅需核算應(yīng)用需求,提出CPU、內(nèi)存和硬盤的預(yù)估使用量,經(jīng)行政部門審批后,將需求形成報告提交給網(wǎng)絡(luò)管理員。管理員根據(jù)需求在虛擬化集群資源池中分配相應(yīng)資源給業(yè)務(wù)部門。網(wǎng)絡(luò)管理員統(tǒng)籌運維整體網(wǎng)絡(luò)安全、數(shù)據(jù)安全訪問控制和接口服務(wù)等工作,因此可更好地對外提供一體化信息服務(wù),將全面兼顧應(yīng)用的安全性、可靠性和穩(wěn)定性,如外網(wǎng)映射需求、串口設(shè)備連接需求、網(wǎng)絡(luò)安全防護隔離需求和數(shù)據(jù)庫備份需求等。業(yè)務(wù)部門可將工作重點放在業(yè)務(wù)應(yīng)用研究與實踐上。這樣明確的精細化分工與管理可有效加強水文行業(yè)各部門的合作,從而提高整體工作效率。
經(jīng)過近年來的發(fā)展,上游局服務(wù)器虛擬化集群已完全替代了各部門單獨的物理服務(wù)器,網(wǎng)絡(luò)管理人員每天對虛擬化集群環(huán)境運維管理,確保軟硬件正常運行和業(yè)務(wù)正常開展。目前,虛擬化集群已對外提供服務(wù)項目,除水情報汛與水文預(yù)報服務(wù)之外,還包括財務(wù)軟件的服務(wù)支持、河道地形資料及數(shù)據(jù)庫管理、檔案系統(tǒng)與門戶網(wǎng)站的運維管理、水環(huán)境監(jiān)測數(shù)據(jù)管理、新設(shè)備新儀器應(yīng)用技術(shù)支持以及部分特殊的如虛擬化桌面和虛擬化軟件等應(yīng)用。因此,水文信息化從業(yè)者可采用虛擬化技術(shù)結(jié)合精細化管理,制定規(guī)范流程,加強前期溝通、中期檢查和后期總結(jié),形成統(tǒng)一的信息化戰(zhàn)略部署。
3.2水情分中心報汛應(yīng)用
水情分中心在水文行業(yè)中承擔(dān)重要的水情報汛任務(wù),水情報汛流程包含原始數(shù)據(jù)接收、中間過程處理和成果數(shù)據(jù)發(fā)送。為保證水情報汛時效,各水情分中心工作人員應(yīng)采用多種防護措施,包括數(shù)據(jù)處理流程中各項軟、硬件的主備功能、多信道冗余等,使水情報汛過程涉及多套專用軟件。如果全部采用傳統(tǒng)軟、硬件主備方案將會耗費大量的服務(wù)器資源,增加水情報汛人員的維護工作量。此外,當(dāng)出現(xiàn)故障需要主備切換時,操作流程繁瑣,不利于快速恢復(fù)報汛工作,報汛時效更不能得到保證。理論。上采用服務(wù)器虛擬化集群技術(shù)可解決上述問題,但多數(shù)水情分中心報汛人員為非計算機專業(yè)人員,如采用技術(shù)含量較高的方案應(yīng)對水情報汛工作將難以推廣。因此,推薦采用單機服務(wù)器虛擬化技術(shù),即“一虛多”方案進行部署。
每個水情分中心最多只需2臺高性能服務(wù)器即可完成全部軟硬件的主備工作。在一臺物理服務(wù)器上安裝虛擬化平臺,虛擬多套操作系統(tǒng),分別承載不同的水情報汛軟件,包括原始數(shù)據(jù)接收軟件、中間數(shù)據(jù)處理軟件、成果數(shù)據(jù)發(fā)送軟件、水情值班軟件、數(shù)據(jù)庫軟件、網(wǎng)絡(luò)管理軟件及臨時測試軟件等,在另一臺物理服務(wù)器上建立一套完全相同的虛擬化應(yīng)用,并作為備機使用,兩臺物理服務(wù)器采用心跳線連接通信,主服務(wù)器上所有虛擬化系統(tǒng)的操作全部利用心跳信道鏡像同步,使備用服務(wù)器上的虛擬化環(huán)境與主服務(wù)器實時同步,包括數(shù)據(jù)庫文件資料和配置信息等,全部備用系統(tǒng)始終為熱機狀態(tài)。一旦主服務(wù)器出現(xiàn)故障,操作人員只需通過現(xiàn)場網(wǎng)線拔插操作和簡單的IP地址配置,即可完成主備切換。以圖3中的核心數(shù)據(jù)庫為例,當(dāng)主服務(wù)器上的核心數(shù)據(jù)庫所在虛擬化系統(tǒng)出現(xiàn)故障時,只需拔掉主服務(wù)器上對應(yīng)的網(wǎng)線,插上備服務(wù)器對應(yīng)的網(wǎng)線,再在備用核心數(shù)據(jù)庫虛擬化系統(tǒng)中進行數(shù)據(jù)庫鏡像同步,停用操作就可正常使用,過程簡單方便。虛擬化還可根據(jù)需求定制操作系統(tǒng),以便水情分中心網(wǎng)絡(luò)管理員切換實驗和新舊操作系統(tǒng),并釋放舊系統(tǒng)資源。