郭 濤
生物信息學(xué)網(wǎng)格建立以前,一所大學(xué)的研究人員如果想比對一段基因,就必須逐一向擁有基因庫的所有高校申請比對,既費(fèi)時又費(fèi)力。生物信息學(xué)網(wǎng)格建立之后,研究人員只要將基因比對的申請?zhí)峤唤o生物信息學(xué)網(wǎng)格即可,由生物信息學(xué)網(wǎng)格完成所有的計(jì)算、比對工作,然后將結(jié)果直接反饋給申請者。生物信息學(xué)網(wǎng)格作為中國教育科研網(wǎng)格(ChinaGrid)的一種典型應(yīng)用,在教育科研領(lǐng)域正發(fā)揮著越來越重要的作用。如今,全國每天有3萬~5萬人在使用生物信息學(xué)網(wǎng)格。
在8月21日舉行的ChinaGrid第四屆學(xué)術(shù)年會上,ChinaGrid專家組副組長、清華大學(xué)教授鄭緯民介紹說:“ChinaGrid一期建設(shè)完成了網(wǎng)格技術(shù)平臺架構(gòu)的搭建和驗(yàn)證,實(shí)現(xiàn)了資源的共享,對高校的教育科研特別是數(shù)據(jù)庫查找等應(yīng)用起到了非常好的促進(jìn)作用。ChinaGrid一期建立了圖像處理網(wǎng)格、生物信息學(xué)網(wǎng)格、大學(xué)課程在線網(wǎng)格、計(jì)算流體力學(xué)網(wǎng)格、海量信息處理網(wǎng)格等五大網(wǎng)格應(yīng)用,對高性能計(jì)算的應(yīng)用具有非常大的推動作用。”
網(wǎng)格與云計(jì)算異曲同工
ChinaGrid從2002年8月開始籌備,2003年1月正式進(jìn)入建設(shè)階段,連通了國內(nèi)13個省市的20多所著名學(xué)校,其中12所高校作為最初參建者,都建立基于高性能計(jì)算系統(tǒng)的ChinaGrid主節(jié)點(diǎn),并協(xié)辦開發(fā)了核心的ChinaGrid公共支撐平臺軟件(CGSP)。不過,由于各節(jié)點(diǎn)的建設(shè)全部由參與建設(shè)的高校自籌資金,資金相對缺乏,而且各節(jié)點(diǎn)的計(jì)算資源主要是各高校自用,從某種程度上說,使得ChinaGrid資源的全面共享和應(yīng)用的深入發(fā)展受到了一定限制。
2009年,ChinaGrid將啟動二期建設(shè),目標(biāo)是建立6個大型的數(shù)據(jù)中心,同時建立涉及材料、能源、氣候環(huán)境、媒體計(jì)算、網(wǎng)絡(luò)行為等領(lǐng)域的8個重點(diǎn)學(xué)科網(wǎng)格,并且要開發(fā)一些用于網(wǎng)格的公共軟件,更有效地實(shí)現(xiàn)集群的調(diào)度。
“由于資金有限,ChinaGrid二期只能先建立8個學(xué)科網(wǎng)格。在ChinaGrid二期建設(shè)過程中,我們將把與各學(xué)科相關(guān)的資料、開源工具等都放到網(wǎng)格中去,為老師、學(xué)生提供一個資源庫。另外,我們要充分利用ChinaGrid網(wǎng)格計(jì)算平臺的優(yōu)勢,為那些計(jì)算資源缺乏的學(xué)校提供網(wǎng)格計(jì)算資源?!编嵕暶窠榻B說,“目前,ChinaGrid主要是為教育系統(tǒng)內(nèi)部的用戶提供教育和科研方面的服務(wù)?!?/p>
在學(xué)術(shù)年會上,來自墨爾本大學(xué)的拉庫馬爾?巴亞博士介紹了云計(jì)算技術(shù)的最新發(fā)展情況,并闡述了建立以市場為導(dǎo)向的云計(jì)算架構(gòu)的理論。今天,關(guān)于云計(jì)算的定義眾說紛紜。拉庫馬爾認(rèn)為云計(jì)算具有以下特征:云是一種并行、分布式系統(tǒng),云是通過內(nèi)部連接和虛擬化組成的計(jì)算系統(tǒng),云可以實(shí)現(xiàn)自動配置,云表現(xiàn)為一個或更多統(tǒng)一的計(jì)算資源,云的最終落腳點(diǎn)是服務(wù)。雖然云計(jì)算還要解決很多問題,如安全、可用性、風(fēng)險(xiǎn)管理、可靠性、可擴(kuò)展性等,但是拉庫馬爾認(rèn)為,建立以滿足客戶需求和市場為導(dǎo)向的云計(jì)算架構(gòu)已經(jīng)變成了現(xiàn)實(shí)。
“未來,人們還可以建立一個云的網(wǎng)格,跨越云及其他IT資源,對時間和成本進(jìn)行優(yōu)化,找到資源與價格的平衡點(diǎn)?!崩瓗祚R爾表示?!皬募夹g(shù)實(shí)現(xiàn)上看,云與網(wǎng)格的差別不大,都是并行的、分布式的系統(tǒng)。”談到網(wǎng)格與云計(jì)算的關(guān)系,鄭緯民表示,“網(wǎng)格是將所有的計(jì)算中心連接起來做事,強(qiáng)調(diào)的是資源共享,而云計(jì)算強(qiáng)調(diào)的是服務(wù);網(wǎng)格的特點(diǎn)是利用多個地方的資源,強(qiáng)調(diào)通用性,而云計(jì)算大多表現(xiàn)為專用服務(wù),以一個地方或一種服務(wù)為主,比如谷歌就是一朵搜索云,ChinaGrid二期要建設(shè)的8個學(xué)科網(wǎng)格也可以看作是8朵云?!?/p>
高性能計(jì)算超越摩爾定律
ChinaGrid的建設(shè)目標(biāo)是將網(wǎng)格計(jì)算與高性能計(jì)算技術(shù)融合起來,為國內(nèi)高校的教學(xué)和科研工作提供先進(jìn)的技術(shù)服務(wù)平臺。從以前只有少數(shù)科研機(jī)構(gòu)采用高性能計(jì)算機(jī)到現(xiàn)在高性能計(jì)算機(jī)已經(jīng)成為許多院校必備的基礎(chǔ)設(shè)施,高性能計(jì)算機(jī)大規(guī)模進(jìn)入中國高校正是高性能計(jì)算走向商業(yè)化、普及化的必然結(jié)果,也為英特爾在高性能計(jì)算領(lǐng)域的快速發(fā)展提供了契機(jī)。在2008年中國高性能計(jì)算機(jī)性能TOP100排行榜中,上榜的國內(nèi)高校的高性能計(jì)算機(jī)多數(shù)采用了英特爾架構(gòu)。
“目前,全球1/5的CPU都是用于高性能計(jì)算。”英特爾公司服務(wù)器平臺事業(yè)部高性能計(jì)算業(yè)務(wù)總經(jīng)理理查德?戴考特表示,“高性能計(jì)算領(lǐng)域是IT新技術(shù)的試驗(yàn)田,比如Linux、集群、InfiniBand等新技術(shù)的應(yīng)用都是從高性能計(jì)算開始的。人們對于性能的追求是永無止境的。高性能計(jì)算的發(fā)展已經(jīng)超越了摩爾定律,它將引領(lǐng)著未來IT技術(shù)的發(fā)展?!?/p>
ChinaGrid一期部署的5種應(yīng)用網(wǎng)格對計(jì)算性能的要求十分苛刻,比如海量信息處理網(wǎng)格、計(jì)算流體力學(xué)網(wǎng)格上運(yùn)行的應(yīng)用本身就是傳統(tǒng)的高性能計(jì)算應(yīng)用。隨著二期8個學(xué)科網(wǎng)格的加入,用戶必然對ChinaGrid各節(jié)點(diǎn)的高性能計(jì)算系統(tǒng)提出更高的性能要求,以獲得更佳的服務(wù)響應(yīng)速度。以高性能計(jì)算機(jī)的核心CPU為例,英特爾在產(chǎn)品上不斷推陳出新,剛發(fā)布不久的至強(qiáng)5500的計(jì)算性能是上一代至強(qiáng)5400的兩倍,而且通過引入英特爾快速通道互聯(lián)技術(shù)及集成DDR3內(nèi)存控制器,使其服務(wù)器平臺上內(nèi)存及芯片組之間的帶寬比至強(qiáng)5400提高了數(shù)倍。這些新特性使得至強(qiáng)5500無論在面對運(yùn)算敏感型還是帶寬敏感型的計(jì)算時都能游刃有余。在今年6月公布的TOP500排行榜上,33臺基于英特爾Nehalem的高性能計(jì)算機(jī)上榜,其中有兩臺還進(jìn)入了TOP20,而這一成績是在Nehalem發(fā)布僅三個月后取得的。據(jù)了解,南京大學(xué)已經(jīng)準(zhǔn)備采用至強(qiáng)5500構(gòu)建計(jì)算能力為35萬億次的高性能計(jì)算系統(tǒng)。
據(jù)理查得透露,2010年,英特爾將推出Nehalem EX,其性能、內(nèi)存比上一代至強(qiáng)7400都有大幅度提高,不僅可以應(yīng)用于高性能計(jì)算,也可以用于普通的商業(yè)應(yīng)用。理查得表示:“Nehalem EX的推出將開創(chuàng)高性能計(jì)算領(lǐng)域的新格局。以前,胖節(jié)點(diǎn)系統(tǒng)的應(yīng)用于并不多,而Nehalem EX最突出的特點(diǎn)在于,不需要節(jié)點(diǎn)連接器即可輕松構(gòu)建8路系統(tǒng),這必將促進(jìn)胖節(jié)點(diǎn)的部署。在高性能計(jì)算系統(tǒng)中,單節(jié)點(diǎn)一定要保證最高的性能。胖節(jié)點(diǎn)的好處很多,比如減少節(jié)點(diǎn)總數(shù),從而減少連接和進(jìn)程,系統(tǒng)更穩(wěn)定,而且可以有效節(jié)省能耗。”
高性能計(jì)算機(jī)是一種工具
在中國,教育科研領(lǐng)域一直是高性能計(jì)算發(fā)展的源動力。但是近兩年,在全球范圍內(nèi),高性能計(jì)算的應(yīng)用發(fā)生了很大變化,高性能計(jì)算與金融、制造、動漫等商業(yè)應(yīng)用的結(jié)合越來越緊密,其增長速度也超過了教育科研領(lǐng)域。在中國,這種趨勢也越來越明顯。理查德認(rèn)為,由于傳統(tǒng)制造業(yè)融入了更多設(shè)計(jì)的部分,未來制造業(yè)將成為中國高性能計(jì)算領(lǐng)域一個新的增長點(diǎn)。
ChinaGrid的長遠(yuǎn)目標(biāo)是建成全國乃至全球最大、最先進(jìn)和最實(shí)用的網(wǎng)格系統(tǒng)之一,不僅覆蓋高等院校,還將包括全國中、小學(xué)校和其他教育科研機(jī)構(gòu)。ChinaGrid建設(shè)和應(yīng)用規(guī)模的擴(kuò)大,必將引發(fā)更復(fù)雜和多樣化的需求,用戶也將面臨更多挑戰(zhàn),比如更高的計(jì)算性能,在性能提升與節(jié)能減排之間尋找平衡點(diǎn),應(yīng)對處理器多核架構(gòu)普及可能帶來的軟件開發(fā)及優(yōu)化方面的壓力等。
在構(gòu)建高性能計(jì)算系統(tǒng)時,用戶可以參考以下幾項(xiàng)標(biāo)準(zhǔn):系統(tǒng)是否具有出眾的浮點(diǎn)計(jì)算和并行處理能力;系統(tǒng)是否擁有易管理性、節(jié)能性;系統(tǒng)是否易于部署、應(yīng)用和擴(kuò)展;系統(tǒng)能否在多核架構(gòu)下并行化軟件的開發(fā)。
理查德表示:“在高性能計(jì)算領(lǐng)域,英特爾不僅能提供CPU,更重要的是提供一個平臺,在I/O、浮點(diǎn)計(jì)算能力、內(nèi)存帶寬等多個維度實(shí)現(xiàn)技術(shù)創(chuàng)新。在數(shù)據(jù)中心的節(jié)能降耗方面,英特爾提出了每年提升50%能效的目標(biāo)。通過高性能處理器、I/O技術(shù)創(chuàng)新、半寬板、能耗管理和數(shù)據(jù)中心技術(shù)創(chuàng)新,英特爾可以在改善數(shù)據(jù)中心能耗方面做出更大貢獻(xiàn)。此外,英特爾在全球擁有一個幾百人的團(tuán)隊(duì),專門負(fù)責(zé)與高性能計(jì)算有關(guān)的技術(shù)開發(fā)和服務(wù)?!?/p>
高性能計(jì)算機(jī)就是一種工具,它是為應(yīng)用服務(wù)的。在澳大利亞,職業(yè)教育發(fā)展十分迅速,許多職業(yè)學(xué)校已經(jīng)拋棄自建實(shí)踐基地的做法,更多地采用遠(yuǎn)程電子課件教學(xué)。應(yīng)用的創(chuàng)新對于高性能計(jì)算的發(fā)展來說也是一種促進(jìn)。對于ChinaGrid來說,已經(jīng)擁有了較好的基礎(chǔ)設(shè)施資源,關(guān)鍵是如何長期、高效地運(yùn)營,實(shí)現(xiàn)更好的投資回報(bào)。除了為教育科研領(lǐng)域的專家、用戶服務(wù)以外,ChinaGrid能否對外開放自己的資源,與商業(yè)應(yīng)用相結(jié)合,是一個值得深入探討的問題。