魯學(xué)亮 陳平
摘要:高校數(shù)據(jù)中心IT基礎(chǔ)設(shè)施是學(xué)校信息化建設(shè)的基礎(chǔ),隨著云計算等技術(shù)的發(fā)展和普及,為高校IT基礎(chǔ)設(shè)施的建設(shè)提供了新的建設(shè)思路。傳統(tǒng)的IT基礎(chǔ)設(shè)施建設(shè)模式已經(jīng)不能滿足高校教學(xué)科研的需求,通過建設(shè)高效、穩(wěn)定、安全的IT基礎(chǔ)設(shè)施以更好地滿足高校信息化的發(fā)展需求。該文以北京師范大學(xué)IT基礎(chǔ)設(shè)施建設(shè)為例,探討高校IT基礎(chǔ)設(shè)施存在的問題,總結(jié)經(jīng)驗教訓(xùn)。
關(guān)鍵詞:云計算;云服務(wù);虛擬化;備份
中圖分類號:TP311 文獻標(biāo)識碼:A 文章編號:1009-3044(2017)22-0018-03
1現(xiàn)狀分析
隨著校園信息化的不斷深入,信息化業(yè)務(wù)的需求逐漸增多,信息化的用戶規(guī)模逐漸壯大,對于傳統(tǒng)的信息化業(yè)務(wù)建設(shè)模式提出了嚴峻的挑戰(zhàn)。一臺物理機一套操作系統(tǒng)部署一個業(yè)務(wù)的模式極大地制約了應(yīng)用上線時間,在業(yè)務(wù)連續(xù)性上也無法保障,資源調(diào)度不靈活,同時對資源也造成了極大的浪費。
傳統(tǒng)建設(shè)模式下的IT基礎(chǔ)架構(gòu)是典型的分散式架構(gòu),這種以應(yīng)用為單位建設(shè)的系統(tǒng)平臺存在諸多問題:系統(tǒng)擴展上無法統(tǒng)一規(guī)劃,系統(tǒng)資源無法共享;需要增加應(yīng)用時,每次都必須重新規(guī)劃整個系統(tǒng),勢必造成重復(fù)采購,總體擁有成本升高;各應(yīng)用之間相互獨立,造成眾多數(shù)據(jù)孤島,難以實現(xiàn)數(shù)據(jù)共享和合理利用;每個應(yīng)用采用一臺獨立的物理服務(wù)器進行部署,實際情況下這些服務(wù)器CPU平均利用率一般不超10%,隨著服務(wù)器變得越來越強大,最大化的利用這些超強資源也變得愈加困難,幾乎在所有情況下,部署這些功能強大的服務(wù)器將會使服務(wù)器過剩50-500%,造成極大的資源浪費;無法實現(xiàn)對應(yīng)用系統(tǒng)的統(tǒng)一備份、容災(zāi)操作。
2虛擬化平臺建設(shè)
通過對以虛擬化為技術(shù)支撐云計算平臺建設(shè)的探討,可以有效解決資源浪費、業(yè)務(wù)連續(xù)性差以及部署靈活性等問題,更為運維管理和IT服務(wù)提供了新的手段。我校云服務(wù)平臺綜合使用虛擬化、存儲雙活、前端云管理平臺、容災(zāi)備份等技術(shù),實現(xiàn)多種的接人、彈性的擴展、服務(wù)可測量、按需付費、資源池化。
1)服務(wù)器計算資源池采用6臺性能強勁的小型機十核服務(wù)器(共計960邏輯核心)為整個云計算平臺提供強大的性能支撐,高效承載更多地虛擬化應(yīng)用。運算能力是衡量計算機計算性能的重要指標(biāo),6臺高性能服務(wù)器,具備480個計算核心和960個邏輯核心,配置6TB內(nèi)存,可為整個云計算平臺提供強大的性能支撐,高效承載更多地虛擬化應(yīng)用。在虛擬化應(yīng)用當(dāng)中,實際測試顯示,在進行資源分配時按照每個core提供4個虛擬VCPU的情況下性能最好,一臺高性能服務(wù)器即可虛擬出320個VCPU,可以劃分更多的虛擬機,資源整合效率更高。據(jù)業(yè)務(wù)的重要性將6個節(jié)點分成2個集群,每個集群配置HA功能用于檢測故障,實現(xiàn)對集群中運行的虛擬機快速恢復(fù)功能。配置DRS將主機作為資源的聚合池進行管理,實現(xiàn)自動管理虛擬機到主機的分配,平衡負載和強制執(zhí)行資源分配策略對運行的虛擬機進行動態(tài)遷移。
2)通過虛擬化網(wǎng)關(guān),實現(xiàn)計算資源池和存儲資源池雙活異地部署,將計算資源池和存儲分別放置在同校區(qū)兩個機房或異地兩個機房,兩臺虛擬化網(wǎng)關(guān)通過光纖直連,實現(xiàn)數(shù)據(jù)實時同步讀寫,任何一臺設(shè)置故障不影響業(yè)務(wù)正常使用。
3)云管理平臺,進一步深化數(shù)據(jù)中心虛擬化程度,融合現(xiàn)有的軟硬件,并通過虛擬化套件中的自服務(wù)門戶實現(xiàn)對用戶實現(xiàn)自助服務(wù)。通過購置虛擬主機控制面板實現(xiàn)提供網(wǎng)站建設(shè)類PaaS服務(wù),以此擴大云管理服務(wù)層級,加強IaaS、PaaS以及SaaS層面的服務(wù)能力。
4)平臺可靠性測試。本次測試以平臺中的一套集群進行性能測試,模擬應(yīng)用中的各種故障以檢驗平臺的可靠性。測試設(shè)備包括3臺高性能服務(wù)器、2臺虛擬化剛關(guān)、2臺光纖交換機、2臺存儲,如下圖所示:
1)關(guān)閉存儲虛擬化網(wǎng)關(guān)集群中的一個節(jié)點,系統(tǒng)切換時間16s,前臺應(yīng)用表現(xiàn)為延時16s,不中斷。
21關(guān)閉一臺光纖交換機會造成鏈路切換,影響一個10的讀寫。
3)關(guān)閉存儲ASl000G6_S1,前臺應(yīng)用會延時18s后保持正常運行,前端業(yè)務(wù)不中斷。
4)斷開一臺物理服務(wù)器,該服務(wù)器上的應(yīng)用直接自動遷移到另外兩臺主機上,對前端業(yè)務(wù)沒有任何影響,在節(jié)點故障瞬間,中間三個包延遲稍大,但沒有中斷。
3容災(zāi)備份
數(shù)據(jù)備份作為業(yè)務(wù)系統(tǒng)的最后一道保障,對于業(yè)務(wù)系統(tǒng)至關(guān)重要,因此必須根據(jù)業(yè)務(wù)系統(tǒng)的重要程度、業(yè)務(wù)特點、數(shù)據(jù)類型規(guī)劃不同的容災(zāi)備份方案。業(yè)務(wù)重要程度通過RTO (Recov-ery Time Objective和RPO(Recovery Point Objective)兩個指標(biāo)定義了業(yè)務(wù)可容許中斷的時間長度以及當(dāng)業(yè)務(wù)恢復(fù)后,恢復(fù)得來的數(shù)據(jù)所對應(yīng)的時間點。定義好每個業(yè)務(wù)的RTO和RPO后即可選擇不同的策略和備份介質(zhì)。高校數(shù)據(jù)中心需要備份的數(shù)據(jù)類型一般包括虛擬機、數(shù)據(jù)庫、業(yè)務(wù)系統(tǒng)數(shù)據(jù)。我校備份系統(tǒng)拓撲如下圖所示,配備兩臺備份一體機,兩臺備份一體機實現(xiàn)數(shù)據(jù)互備,配置一臺虛擬磁帶庫,一臺物理帶庫,普通存儲等。
1)備份一體機通過備份代理與虛擬化控制中心對接實現(xiàn)對所有虛擬機的備份,首先根據(jù)業(yè)務(wù)的重要程度進行分類分組,并在備份一體機中設(shè)置不現(xiàn)的策略組,策略組包括對數(shù)據(jù)集、備份時間、備份周期、數(shù)據(jù)保留周期等關(guān)鍵詞段的定義,將虛擬機與策略組進行對應(yīng)。同時應(yīng)定期查看備份一體備份日志及時處理備份出現(xiàn)的問題靈活調(diào)整備份策略,對部分虛擬機進行恢復(fù)測試以檢測備份效果。
2)虛擬磁帶庫與物理磁帶庫配合使用,虛擬磁帶庫是帶有較高壓縮比的存儲設(shè)備,他比物理磁帶庫讀寫速度更快,數(shù)據(jù)恢復(fù)的速度也更快,而物理帶庫更適合備份存檔數(shù)據(jù),該數(shù)據(jù)很少會用來恢復(fù)使用。通過備份管理軟件將以上兩類介質(zhì)進行統(tǒng)一管理,將業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫、業(yè)務(wù)數(shù)據(jù)先備份至虛擬帶庫保留一段時間后定期遷移至物理帶庫做長期保留。
3)存儲陣列的復(fù)制功能,目錄主流的存儲設(shè)備都可通過軟件實現(xiàn)兩臺存儲設(shè)備間的實時數(shù)據(jù)復(fù)制,對于一些數(shù)據(jù)量大,業(yè)務(wù)重要的數(shù)據(jù)如教學(xué)平臺的視頻數(shù)據(jù),如果備份到帶庫中恢復(fù)時間將很長,該類業(yè)務(wù)對中斷時間又有較高要求,因此配備一臺存儲陳列,實現(xiàn)對該類業(yè)務(wù)數(shù)據(jù)的實時復(fù)制,生產(chǎn)數(shù)據(jù)存儲設(shè)備出現(xiàn)故障可隨時切換到備份設(shè)備。
4結(jié)束語
通過搭建一套高性能、穩(wěn)定可靠的云計算平臺并配合數(shù)據(jù)備份系統(tǒng),用以支撐學(xué)校大部分業(yè)務(wù)系統(tǒng),降低服務(wù)器的數(shù)量和整體能耗、降低建設(shè)成本和日常運行維護成本。實現(xiàn)學(xué)校rr資源的有效整合和動態(tài)擴展,實現(xiàn)業(yè)務(wù)系統(tǒng)的快速部署,提升IT資源的利用率,為我校信息化建設(shè)提供安全、快捷的IT基礎(chǔ)設(shè)施。endprint