王政軍 單承偉 俞小怡 董曉梅
(大連理工大學圖書館,遼寧大連116023)
高性價比圖書館虛擬化平臺的建設(shè)與實踐
王政軍 單承偉 俞小怡 董曉梅
(大連理工大學圖書館,遼寧大連116023)
[目的/意義]利用虛擬化技術(shù)提高IT基礎(chǔ)架構(gòu)管理水平和資源利用率是圖書館數(shù)據(jù)中心發(fā)展的趨勢,圖書館如何構(gòu)建一套高性價比的虛擬化整合方案是迫切需要解決的問題。[方法/過程]文章介紹了虛擬化的相關(guān)技術(shù),分析比較了虛擬化平臺的技術(shù)指標。以大連理工大學城市學院圖書館的虛擬化實施方案為例,闡述了高性價比虛擬化方案的技術(shù)支撐原理、設(shè)計思路及具體實施方法。[結(jié)果/結(jié)論]通過具體實踐證明,高性價比虛擬化平臺的解決方案體現(xiàn)出高效穩(wěn)定、便于管理等技術(shù)特點,有效解決了中小型圖書館因資金緊張而不能進行虛擬化改造的問題,對指導實踐具有重要意義。
圖書館;虛擬化平臺;虛擬化技術(shù);性價比;vSphere
虛擬化能使信息技術(shù)易于整合到面向服務(wù)的體系結(jié)構(gòu)中,可實現(xiàn)數(shù)據(jù)中心的本地管理自動化,為管理者提供高效、可靠、可預(yù)見的服務(wù)[1]。利用虛擬化技術(shù),能夠加速智能動態(tài)數(shù)據(jù)中心的發(fā)展,促進敏捷度,縮短停機時間,增強災(zāi)難恢復(fù)等。目前,虛擬化整合技術(shù)已經(jīng)成為高校圖書館數(shù)據(jù)中心關(guān)注的熱點。
較大的虛擬化平臺采用了大量企業(yè)級高端硬件,以滿足大量虛擬機對硬件資源的需求[3]。如大連理工大學網(wǎng)絡(luò)中心虛擬化平臺,運行500多個虛擬機,配置高檔服務(wù)器構(gòu)建虛擬集群組。使用企業(yè)級SAN光纖集中后臺存儲,采用企業(yè)級萬兆核心網(wǎng)絡(luò)交換機,采用VMware vSphere的最高級版本Enterprise Plus作為虛擬化管理平臺。整體資金投入在800萬以上。如果圖書館按照此種模式構(gòu)建自己的虛擬化平臺,資金問題會讓很多圖書館望而卻步,一些中小型圖書館更無法承受如此大的資金投入。因此,設(shè)計一套性能穩(wěn)定且投入合適的小型虛擬化平臺搭建方案,對于資金緊張的圖書館實現(xiàn)虛擬化整合具有十分重要的現(xiàn)實意義。
搭建虛擬化平臺基礎(chǔ)架構(gòu)包括服務(wù)器、存儲、網(wǎng)絡(luò)交換機以及虛擬化管理軟件[2]。在技術(shù)指標滿足實際需要的情況下,降低整個虛擬化方案的成本,需要考慮以下幾個方面。
1.1 服務(wù)器
服務(wù)器為虛擬化平臺提供最基本的底層硬件資源,虛擬化平臺之上的虛擬機所使用資源來自于服務(wù)器的處理器、內(nèi)存、硬盤、網(wǎng)絡(luò)等。虛擬主機的架構(gòu)圖如圖1所示。
圖1 虛擬主機的架構(gòu)
采購大內(nèi)存的服務(wù)器。虛擬化使不同操作系統(tǒng)的多個虛擬機在同一物理機上獨立并行運行,所有虛擬機使用的硬件資源都被虛擬化服務(wù)層映射到實際的物理機資源上。獨立的操作系統(tǒng)對內(nèi)存的占用是絕對的,在相當長一段時間不會釋放,而CPU的占用隨操作系統(tǒng)中的應(yīng)用運行情況實時地占用和釋放。所以虛擬化平臺資源消耗較多的是內(nèi)存資源,對處理器的消耗并不大。減少處理器的數(shù)量,也降低了虛擬化管理軟件的成本。
服務(wù)器本地存儲應(yīng)注重安全可靠。所有應(yīng)用的數(shù)據(jù)均存儲于后臺的集中存儲上,虛擬化主機本地硬盤只是存儲虛擬化平臺操作系統(tǒng),不需要較大的存儲空間。為保證虛擬化操作系統(tǒng)的數(shù)據(jù)安全性,物理主機只配置兩塊硬盤做RAID1進行鏡像備份。
服務(wù)器采用基于雙網(wǎng)卡的萬兆網(wǎng)絡(luò)。由于多臺虛擬機對外提供服務(wù),網(wǎng)絡(luò)流量集中于物理主機的物理網(wǎng)卡上,虛擬化主機對網(wǎng)卡的性能要求比較高[5]。存儲數(shù)據(jù)的傳輸也使用以太網(wǎng)絡(luò),服務(wù)器采用雙萬兆網(wǎng)卡,保證網(wǎng)絡(luò)和存儲性能,而且能夠達到鏈路冗余備份的效果。
具體的虛擬化物理服務(wù)器技術(shù)指標如表1所示:
表1 小型虛擬化物理服務(wù)器技術(shù)指標
虛擬化集群組中所需服務(wù)器(物理主機)的數(shù)量,主要取決于實際要運行的虛擬服務(wù)器的數(shù)量。對于中小型圖書館,70~100個虛擬服務(wù)器便可滿足其作為數(shù)據(jù)中心的需要。每臺搭載64G內(nèi)存的物理服務(wù)器通??梢蕴摂M出30~40臺虛擬服務(wù)器[6],按照為每臺虛擬服務(wù)器劃分2G內(nèi)存來計算,中小型圖書館使用2~3臺物理服務(wù)器便可構(gòu)建虛擬化的集群組。
隨著業(yè)務(wù)的增長,可通過增加物理服務(wù)器數(shù)量來擴展虛擬化平臺的容量。初期設(shè)計部署的物理服務(wù)器主機必須大于兩臺,這樣才能達到互為冗余備份的效果,保證所有虛擬服務(wù)器通過主機遷移(VMotion)游離于多臺物理服務(wù)器,提高整個虛擬化平臺的持續(xù)性。
1.2 集中存儲
目前流行的存儲技術(shù)主要有SAN光纖存儲、ISCSI網(wǎng)絡(luò)存儲、NAS存儲。3種主流存儲技術(shù)的具體情況比較如表2所示:
表2 主流存儲比較
SAN光纖存儲的存儲性能好,高端的數(shù)據(jù)存儲一般都采用SAN光纖的存儲架構(gòu),但資金投入大,日后擴展比較復(fù)雜。NAS存儲比較廉價,主要用于靜態(tài)文件存儲服務(wù)器,適應(yīng)對IO性能要求不是很高的場合,不能滿足虛擬化平臺的需要[7]。ISCSI網(wǎng)絡(luò)存儲近幾年得到很大的關(guān)注,得益于萬兆網(wǎng)絡(luò)的發(fā)展與普及,其管理形勢與SAN存儲比較接近。ISCSI存儲性能越來越接近于SAN,由于其利用廉價網(wǎng)絡(luò)作為傳輸介質(zhì),非常適合中小型數(shù)據(jù)中心使用。
1.3 萬兆網(wǎng)絡(luò)
高性價比的虛擬化架構(gòu)必須使用萬兆以太網(wǎng)絡(luò)。萬兆網(wǎng)絡(luò)已經(jīng)非常成熟,根據(jù)傳輸介質(zhì)的不同,有光纖、銅軸電纜、雙絞線3種形式。由權(quán)威組織測試報告得知,不考慮干擾因素,3種傳輸形式效率是一樣的,但雙絞線抗干擾性能稍微差些。在比較規(guī)范的機房環(huán)境中,采用質(zhì)量較好的7類雙絞線,可以排除干擾的影響。使用雙絞線介質(zhì)的萬兆網(wǎng)卡、網(wǎng)線以及交換機等一系列設(shè)施都要比光纖和銅軸電纜便宜得多,建議中小型虛擬化的網(wǎng)絡(luò)架構(gòu)采用雙絞線傳輸?shù)娜f兆網(wǎng)絡(luò)。
1.4 虛擬化管理軟件
虛擬化管理軟件主要有Citrix XenServer、微軟Windows Server 2008 Hyper-V、VMware vSphere。VMware vSphere提供最領(lǐng)先的技術(shù),占有大部分的市場份額。vSphere主要有Standard、Enterprise和Enterprise Plus 3個版本,雖然所有的vSphere的軟件介質(zhì)是一樣的,但是根據(jù)版本的license不一樣,可使用的功能不同,價格也有較大的區(qū)別。vShpere的Standard版本含有vMotion和HA的功能,vMotion可保證虛擬服務(wù)器不間斷的遷移于物理服務(wù)器之上,HA可監(jiān)控虛擬服務(wù)器操作系統(tǒng)狀態(tài),并根據(jù)錯誤狀態(tài)自動更換物理主機運行??紤]性價比的因素,中小型圖書館的虛擬化方案采購Standard版本的License授權(quán)即可,既能保證虛擬化的實施,又可減少資金的投入,保證業(yè)務(wù)的持續(xù)性和高可用性的需求。
大連理工大學城市學院是大連理工大學下屬的三本獨立學院,屬于中小型高校圖書館。該圖書館數(shù)據(jù)中心原有物理服務(wù)器50多臺,主要用于關(guān)鍵業(yè)務(wù)、數(shù)字資源以及網(wǎng)絡(luò)管理等方面。數(shù)據(jù)中心的核心網(wǎng)絡(luò)為千兆以太網(wǎng)絡(luò),分散式存儲方式(應(yīng)用數(shù)據(jù)存儲于物理服務(wù)器本地硬盤)。該館已經(jīng)多年調(diào)研,希望通過虛擬化整合方式實現(xiàn)本地管理的自動化和智能化,提高系統(tǒng)性能和穩(wěn)定性,縮短停機時間、增強災(zāi)難恢復(fù)等。為能順利進行該項工作,該館先后邀請大連理工大學的網(wǎng)絡(luò)中心、電信學院以及圖書館等專家進行論證,以大連理工大學網(wǎng)絡(luò)中心和圖書館的虛擬化方案的實際經(jīng)驗為基礎(chǔ),提出了高性價比的小型虛擬化服務(wù)器整合方案。
2.1 方案設(shè)計
首先,建立一套集中共享的虛擬化后臺存儲,將圖書館業(yè)務(wù)數(shù)據(jù)集中存儲于可靠的虛擬化存儲系統(tǒng)中,在保證數(shù)據(jù)的完整性和可靠性的前提下降低存儲成本。其次,利用虛擬化軟件建立虛擬服務(wù)器集群環(huán)境,將安裝有圖書館關(guān)鍵應(yīng)用的服務(wù)器實現(xiàn)HA(高可用性)的連接,構(gòu)建一個以共享存儲為基礎(chǔ)、以虛擬化為核心的服務(wù)器架構(gòu)。
本方案采用IPSAN(基于ISCSI存儲區(qū)域網(wǎng)絡(luò))的共享存儲系統(tǒng)部署方式。將基于ISCSI存儲陣列產(chǎn)品通過高性能的萬兆網(wǎng)絡(luò)交換機相連,并采用萬兆以太網(wǎng)絡(luò)協(xié)議通信,這些鏈接基于固有的網(wǎng)絡(luò)通道和SCSI(通過SCSI到網(wǎng)絡(luò)通道轉(zhuǎn)換器和網(wǎng)關(guān)),多路的網(wǎng)絡(luò)通道交換機在主服務(wù)器與存儲設(shè)備之間提供相互連接,實現(xiàn)鏈路的負載均衡和冗余備份,確保連接的可靠和高效。
保證系統(tǒng)資源的負載均衡。充分利用虛擬環(huán)境中虛擬機可動態(tài)遷移的特性,將由虛擬管理軟件生成的虛擬主機文件存放在IPSAN共享存儲系統(tǒng)上。通過共享的IPSAN存儲系統(tǒng),最大化地發(fā)揮虛擬架構(gòu)的優(yōu)勢,當某個關(guān)鍵應(yīng)用的服務(wù)器出現(xiàn)問題時可將虛擬機動態(tài)遷移到別的服務(wù)器,保證關(guān)鍵業(yè)務(wù)的連續(xù)性。VMWare虛擬化軟件采用VMotion技術(shù)將虛擬機動態(tài)遷移到另一個可用資源充足的主機,VMware的HA在監(jiān)測到虛擬機的運行狀態(tài)出現(xiàn)問題時,可將虛擬機重新注冊到資源可用的物理主機并啟動運行。
2.2 系統(tǒng)架構(gòu)
通過以上技術(shù)細節(jié)的分析可知,低成本虛擬化方案是在保證虛擬化能為圖書館提供IT基礎(chǔ)架構(gòu)的穩(wěn)定可靠、性能優(yōu)越、便于管理的前提下,通過新的技術(shù)和方式來降低成本。本方案的系統(tǒng)架構(gòu)考慮到虛擬化實施所必須考慮的技術(shù)環(huán)節(jié),包括服務(wù)器、存儲、網(wǎng)絡(luò)、管理軟件等方面的因素。系統(tǒng)架構(gòu)圖如圖2所示:
圖2 小型虛擬化架構(gòu)圖
采用兩臺DELL R620服務(wù)器。服務(wù)器的配置考慮CPU的單路多核、內(nèi)存擴展性大、網(wǎng)絡(luò)萬兆傳輸?shù)纫蛩?,服?wù)器低端高配,既節(jié)省了費用,又不失服務(wù)器的性能。配置如表3所示:
表3 服務(wù)器配置信息
表3 (續(xù))
萬兆交換機為Extreme公司的Summit X650型號,該交換機能為虛擬化主機ESX提供高速的網(wǎng)絡(luò)傳輸性能。物理服務(wù)器與交換機之間都使用雙路萬兆連接,利用虛擬化vSphere的多鏈路整合功能,實現(xiàn)服務(wù)器與存儲之間的負載均衡和冗余備份,提高網(wǎng)絡(luò)鏈路的性能和穩(wěn)定性。由于擔心旁雜的網(wǎng)絡(luò)數(shù)據(jù)包干擾虛擬化網(wǎng)絡(luò)存儲的數(shù)據(jù)傳輸,該萬兆交換機只是提供虛擬化架構(gòu)的網(wǎng)絡(luò)存儲數(shù)據(jù)交換,不開啟三層路由功能,只作為兩層交換的高效交換設(shè)備。數(shù)據(jù)中心原有的網(wǎng)絡(luò)核心交換機繼續(xù)作為局域網(wǎng)內(nèi)部路由交換的核心交換機,為虛擬化平臺上的應(yīng)用提供以太網(wǎng)網(wǎng)絡(luò)的數(shù)據(jù)交換功能。
集中存儲使用DELL MD3600i存儲,該設(shè)備提供萬兆ISCSI數(shù)據(jù)接口,保證虛擬化ESX主機與存儲之間的高速數(shù)據(jù)傳輸。存儲空間采用兩種硬盤,分別為SAS盤4.5T和SATA盤15T,其中SAS盤用來存儲對IO要求比較高的數(shù)據(jù),如操作系統(tǒng)文件系統(tǒng)和數(shù)據(jù)庫應(yīng)用等,而SATA盤用來存放靜態(tài)文件等數(shù)據(jù)。
虛擬化軟件vSphere采用Standard版本,購買vCenter標準版license以及2個CPU的ESX授權(quán)即可。Standard版本提供了vMotion和HA的功能,以保持業(yè)務(wù)應(yīng)用的持續(xù)有效性。
2.3 方案優(yōu)勢
實現(xiàn)了圖書館數(shù)據(jù)中心的虛擬化整合功能。通過VMware技術(shù)和ISCSI網(wǎng)絡(luò)存儲技術(shù)實現(xiàn)數(shù)據(jù)中心的完全虛擬化,提供完善的虛擬機管理功能,包括虛擬機的創(chuàng)建、刪除、遠程管理以及在線遷移(vMotion)、高可用性群集(HA)等。得益于虛擬化平臺的可管理性、高效性和持續(xù)性,圖書館的實際服務(wù)取得了更好的效果。
提高了圖書館IT基礎(chǔ)架構(gòu)的可用性和可靠性。在本方案的具體實驗中,高可用性群集(HA)能夠?qū)崿F(xiàn)計劃內(nèi)外的停機故障恢復(fù),保證在可接受的停機時間范圍內(nèi)的故障恢復(fù)。通過vMotion技術(shù)實現(xiàn)不停機的虛擬機在線遷移,實現(xiàn)虛擬機系統(tǒng)的高可用性。
減少了虛擬化整合的資金投入。該虛擬化平臺花費15萬元人民幣,實際運行50多臺虛擬服務(wù)器。相比于傳統(tǒng)的虛擬化方案百萬乃至千萬的投入,該方案大大降低了投入。在虛擬機數(shù)量不大的情況下,總體性能完全達到虛擬化整合的技術(shù)指標。該方案實施后,減少機房內(nèi)的電力消耗,符合國家的節(jié)能減排和綠色數(shù)據(jù)中心的要求。
節(jié)約了人力成本。虛擬化整合后,依賴于成熟的虛擬化管理工具,大量減少系統(tǒng)維護員的工作量。
高性價比虛擬化方案是為解決中小型圖書館經(jīng)費投入有限而設(shè)計的,通過技術(shù)理論和實踐效果來看,該方案能夠滿足中小型圖書館對虛擬化整合的需求。雖然低成本是通過壓縮硬件和軟件成本來實現(xiàn)的,但整個方案基于切實可行的技術(shù)指標實現(xiàn),所采購的軟硬件必須滿足本文所提出的技術(shù)指標才能達到高性價比的穩(wěn)定可靠的虛擬化整合效果。如果盲目的追求成本壓縮而采購不符合技術(shù)指標的軟硬件產(chǎn)品,可能導致系統(tǒng)瓶頸而發(fā)揮不了虛擬化整體功效的不良效果。總之可以采購低端的軟硬件產(chǎn)品,但必須是技術(shù)指標符合要求的品牌信的過產(chǎn)品。
雖然虛擬化整合技術(shù)已經(jīng)很成熟,但是針對不同的應(yīng)用需求構(gòu)建不同的方案值得深入研究。本文構(gòu)建的中小型圖書館高性價比虛擬化方案就是一種探索。在構(gòu)建合理完整的高性價比虛擬化整合方案中,不僅要追求虛擬化的管理性、健壯性和可持續(xù)性,還注重系統(tǒng)的升級和擴展性,對實際應(yīng)用具有很好借鑒意義。
[1]陳忠安.SWsoft虛擬化技術(shù)[J].軟件世界,2007,(13):14-15.
[2]趙華茗.基于虛擬機的高可用信息服務(wù)平臺[J].現(xiàn)代圖書情報技術(shù),2009,(12):18-24.
[3]Abramson D,J ackson J,et al.Intel Virtualization Technology for Directed I/O[J].IntelTechnologyJournal,2006,10(3):1792191.
[4]Nanda S,Chiueh T.A Ssurvey of Virtualization Technologies[R].Technical Report TR2179,Stony Brook University,2005.
[5]何曉龍,成凱.透視虛擬化技術(shù)[J],軟件世界,2007,(11):17.
[6]周俐軍,林澤東,劉偉科.基于VMware的高校數(shù)據(jù)中心虛擬化管理探究[J].中國管理信息化,2009,(8):65-66.
[7]魯松.計算機虛擬化技術(shù)及應(yīng)用[M].北京:機械工業(yè)出版社,2008.
(本文責任編輯:郭沫含)
The Research and Practice of High Cost-effective of Library Virtulization
Wang Zhengjun Shan Chengwei Yu Xiaoyi Dong Xiaomei
(Library,Dalian University of Technology,Dalian 116023,China)
At present,virtualization technology is getting mature,using virtualization technology to improve management level and resource utilization has become the main trend in data center.But traditional virtualization integration solution need for a costly investment.For library,which is short of funds,how to build a high cost preformance plan of virtualization integration,is the decision makers and technical staffs needed to solve.Through the related research,the paper compared and analyzed the technical indicators of virtulization technology platforms,then designed and deployed a highly cost-effective solution of virtulization integration.It is very valuable for the units who are short of money but urgent need virtulization reform.
library;virtualization platform;virtualization;cost-effective;vSphere
10.3969/j.issn.1008-0821.2016.02.018
TP393
A
1008-0821(2016)02-0096-04
2015-10-14
國家自然科學基金面上項目“支持社會化創(chuàng)新的在線社區(qū)知識活動動力學研究”(項目編號:71371040)和青年科學基金青年項目“時變在線社會網(wǎng)絡(luò)中輿情傳播與演化動力學研究”(項目編號:7140010353)的研究成果。
王政軍(1980-),男,館員,工程碩士,研究方向:數(shù)字圖書館。