文/本刊記者 王左利
HPC遭遇三重門
文/本刊記者 王左利
云計算、異構(gòu)平臺、學科應用是現(xiàn)在高校建高性能計算中心無法逃避的三大難題。前兩者,是時代變革的新趨勢,后者,則是歷史難題的新挑戰(zhàn)。
今年個人電腦迎來了30周歲的生日,個人電腦的強大兄弟——超級計算機,則已走過70年的風風雨雨。比起現(xiàn)在的電腦來,初期的超級計算機運算非常緩慢;僅在過去25年,計算機的速度和運算能力就提升了一百萬倍。
超級計算機已經(jīng)被使用到各個領(lǐng)域,能源探索、氣象服務(wù)、物理實驗、圖像渲染……幾乎你能想到的領(lǐng)域,都可以有高性能計算的參與。而每年兩度的全球高性能計算TOP500強榜單,也讓各國計算機精英為之折腰。
2011年6月,最新TOP500高性能計算機榜單上,前三甲分別是:K電腦,8.2千萬億次/每秒,日本;天河-1A,2.57千萬億次/每秒,中國;Jaguar,1.76千萬億次/每秒,美國。K的運算速度甚至比排名第二至第六的計算機運算速度總和還要快。各國角遂超級計算機排名的背后,折射出超級計算機之熱。
在中國,從2009年以后,高性能計算迎來了一個新的歷史發(fā)展時期。這與不停建設(shè)中的城市高性能計算中心分不開,也與一度奪得全球TOP500榜首的天河一號分不開。但最實質(zhì)的原因是,隨著中國經(jīng)濟的飛速發(fā)展,對科研的投入越來越大,高性能計算作為推動學科發(fā)展的有力杠桿的地位得到共識。
高校作為科研創(chuàng)新前沿陣地,顯然擁有極大需求。而且,從國外的經(jīng)驗來看,許多高校的高性能計算在世界上擁有很高的聲譽。比如,美國伊利諾伊大學,德國斯圖加特大學,日本的東京工業(yè)大學等。我國的天河一號也產(chǎn)自國防科技大學。高性能計算在高校發(fā)展很快,主要原因在于高校有更多的用戶,許多學科,無論是化學、物理、生物、地球、航空、海洋等,都給高性能計算提供了用武之地。從這個趨勢來看,未來高校對高性能計算中心的重視只會加強,不會減弱。
從這個角度上,也就不難理解何以從2009年開始,高校的高性能計算中心風生水起,進入一個新的發(fā)展時期了。
處理器芯片將不再由架構(gòu)相同的內(nèi)核組成,而是會由多種架構(gòu)的內(nèi)核組成,分別負責加密、視頻渲染和網(wǎng)絡(luò)等任務(wù)。
2010年起,隨著云概念的深入,一些高校開始構(gòu)建基于云的平臺。與此同時,高性能計算中心的規(guī)劃也正在進行——主要命題是:高性能計算中心作為一個公共的服務(wù)平臺,在新的形勢下,是否要融入到學校的整體信息化結(jié)構(gòu)中來?還是讓其孤獨地獨立成篇?
以上海交通大學為例,其正在做一個面向全校師生進行網(wǎng)絡(luò)服務(wù)的云平臺,將Web服務(wù)、郵件服務(wù)、論壇等通通納入云服務(wù)平臺中。那么,高性能計算平臺呢?是否也納入到總體的云平臺上?
對于此,是有爭議的。一方面,云計算采用的關(guān)鍵技術(shù)是虛擬化,這樣可以使資源按需調(diào)度,但也勢必導致犧牲一部分速度。而高性能計算則追求“高速”,兩者看似矛盾。另外一方面,人們又期望以云計算的靈活的彈性應用模式來解決公共高性能計算平臺的系統(tǒng)管理問題。中國工程院院士李國杰認為,“云計算的易用性會影響傳統(tǒng)的HPC計算模式,按需的云計算給HPC提供了更易交互的計算模式。如同幾年前用大眾化的PC服務(wù)器搭建集群以及最近用GPU加速科學計算一樣,云計算對于HPC也是一次模式轉(zhuǎn)變?!蹦敲?,HPC到底可不可以采用云計算的架構(gòu)?
針對此,上海交通大學做了初步的嘗試,他們提出了一種融合高性能計算、網(wǎng)格計算和云計算的新型計算框架——高性能彈性計算(HPEC),可以跨域管理和調(diào)度多個云計算資源,支持GPU和眾核異構(gòu)計算環(huán)境,用戶可以自主靈活地申請和管理計算、存儲和網(wǎng)絡(luò)資源,這些資源可以是虛擬化的或者是直接的物理資源,支持High Performance Computing Platform as a Serv(iceHPC PaaS)多節(jié)點集群及上層軟件的快速部署,同時支持計算密集(MPI)和數(shù)據(jù)密集(Map/Reduce)應用等。
而北京工業(yè)大學的高性能計算平臺采用的也是云的架構(gòu)——“我們覺得可以采用云架構(gòu),原因在于我們是一個公共的平臺,并非針對一個領(lǐng)域,所以資源的調(diào)度也很重要。”北京工業(yè)大學邸瑞華教授表示。
在當前看來,用云計算的思路去實施高性能計算,可能更多的是一種取舍,當你需要的是不惜一切追求高速時,顯然,采用了云計算就與你最初的理想相背離了。反之亦然。
今天,當高校進行超級計算機采購的時候,會發(fā)現(xiàn),整個市場上開始在提供一個異構(gòu)的平臺。這就是GPU加CPU的融合平臺。
一位曾在Intel工作,現(xiàn)在又在A M D工作的資深技術(shù)人員表示,未來的處理器將會結(jié)束內(nèi)核之戰(zhàn),轉(zhuǎn)向異構(gòu)平臺之戰(zhàn)。他預測,處理器新的競爭熱點是異構(gòu)計算,處理器芯片將不再由架構(gòu)相同的內(nèi)核組成,而是會由多種架構(gòu)的內(nèi)核組成,分別負責加密、視頻渲染和網(wǎng)絡(luò)等任務(wù)。
這句話是有跡可循的。使用GPU的異構(gòu)架構(gòu)在高性能計算中已是一種主流技術(shù)。比如最近的TOP500前五名中有三臺機器都是GPU異構(gòu)集群。美國橡樹嶺國家實驗室剛宣布了他們計劃在2012年用nVIDIA的GPU來搭建一臺峰值20 Pflop/s的集群。在我國,天津超算中心2010年使用了7168個nVIDIA的GPU搭建了峰值4.7 Pflop/s,Linpack實測性能2.57 Pflop/s的天河1A系統(tǒng)。這套系統(tǒng)在2010年的Supercomputing大會上排在了TOP500的第一名。
由此可見,未來整個市場將向異構(gòu)平臺遷移,高校的HPC采購也不可能跨越這一門檻,而在異構(gòu)平臺下的編程,將會變成一個新問題。
上海交通大學網(wǎng)格中心副主任林新華表示, 異構(gòu)與異構(gòu)眾核的硬件更新?lián)Q代頻率驚人,甚至超越了CPU的摩爾定律,因此軟件研發(fā)將不可避免地會在編程策略、目的和工具上遇到各自的挑戰(zhàn)。
很多人都看好GPU,但是其昂貴的編程和代碼維護正在成為越來越明顯的絆腳石。所以有越來越多的精力被放到異構(gòu)平臺的建立上。
nVIDIA在2007年推出了在GPU上的并行編程模型CUDA。除了CUDA外,開發(fā)人員也還有很多其它選擇。如OpenCL是一個類似CUDA的GPU編程標準。微軟也推出了針對GPU的編程語言DirectCompute以及即將推出的C++ AMP語言。PGI Fortran允許開發(fā)人員直接用Fortran的語法寫GPU kernel。PGI accelerator類似OpenMP, 開發(fā)人員只需要在耗時的循環(huán)外插入一些pragma,就能將其移植到GPU上。HMPP是類似PGI accelerator的另一種解決方案。PyCUDA是Python的CUDA接口。此外,PGI最近還發(fā)布了CUDA-x86。這個產(chǎn)品可以把CUDA代碼編譯在x86 CPU上執(zhí)行。這樣一個代碼版本就可以既在GPU又在CPU上運行。
事實上,目前的編程工具都不是太好,體現(xiàn)在技術(shù)人員需要很大的努力才能達到自己的目標?!罢嬲齾柡Φ墓ぞ呤俏覀兒苋菀拙湍苓_到一個目標,而不是費盡千辛萬苦才能達到一個目標,這樣的話,我們只能說這個人很厲害,而不是這個工具厲害?,F(xiàn)在的異構(gòu)平臺編程工具就是這樣?!绷中氯A說。
“異構(gòu)平臺的優(yōu)勢在于計算能力的能耗低、性價比高;挑戰(zhàn)在于大量并行軟件需要為異構(gòu)平臺重新開發(fā),而異構(gòu)多核環(huán)境下并行程序的開發(fā)是非常難的。”中山大學廣東省計算科學重點實驗室高性能計算應用研發(fā)中心主任張永東介紹說,“中山大學自主研發(fā)的PCF并行編程環(huán)境,簡化了OpenCL的調(diào)用過程,較好地解決了異構(gòu)多核編程的困難。”
高性能計算的生命力體現(xiàn)在應用。缺少了應用,再高的峰值,再快的計算速度,都是奢華擺設(shè)。
“高性能計算機越來越像一臺復雜而精密的虛擬實驗儀器,人們不僅可以在上面聰明的做實驗,還可以進行充滿想象力的科學探索。無論是理論家還是實驗家,不能掌握這個工具的人就像少了一只手。 ”一位資深人士形象地說。
那么,高性能計算到底可以給我們解決什么樣的具有挑戰(zhàn)的問題?美國國家橡樹嶺實驗室的美洲豹的任務(wù)可能給我們一點啟發(fā):美洲豹有6大公開應用。其中有幾項非常有意思。比如,極端氣候模擬。在地球45億年的歷史中,氣候總在冷熱間徘徊。而通過美洲豹超級計算機可以完整、連續(xù)地模擬這個過程,利用全球氣候模型,提供有關(guān)全球氣候變化根源和影響的珍貴數(shù)據(jù)。
再比如,模仿火山爆發(fā)應激氣候?;鹕絿姲l(fā),重力氣溶膠粒子通常會在2至3年之內(nèi)回落。相反,人為排放的有害物質(zhì)長期持續(xù),并可能改變未來的氣候。如果通過超級計算機可以模擬運行該大氣環(huán)境模型對于火山噴發(fā)的灰塵反應,便可以預測出該大氣環(huán)境對于人為長期排放的反應。
應用的根本是人才。在前不久由教育部科技發(fā)展中心主辦,《中國教育網(wǎng)絡(luò)》雜志承辦,AMD公司獨家贊助的“2011年高等院校高性能計算綜合技能及學科應用培訓班”上,來自南京農(nóng)業(yè)大學農(nóng)學統(tǒng)計遺傳創(chuàng)新團隊章元明提出:“目前國家對基礎(chǔ)科研的重視力度空前,我們學院下半年就有2億元的費用下?lián)?,目前的難題在于懂生物遺傳相關(guān)知識的人、熟悉高性能計算特別是異構(gòu)環(huán)境下并行計算編程的人員非常少?!?/p>
這個難題怎么去解決?惟有建立有效的人才培養(yǎng)機制以及合作交流機制。“目前,計算機學科與其他學科的結(jié)合甚少,這是必須改變的現(xiàn)狀。”
南京大學周會群教授表示,他曾經(jīng)在日本名古屋大學做過訪問研究員,那時候,他們整個實驗室在做關(guān)于醫(yī)學圖像的研究,比如將CT掃描的結(jié)果建成可以編輯的計算模型,這需要很專業(yè)的醫(yī)學知識?!白鲞@個項目的人,幾乎都是計算機專業(yè)的,但是他們會經(jīng)常請醫(yī)生做講座,從而具備了很專業(yè)的知識并應用到計算中?!?/p>
此外,也需要產(chǎn)業(yè)界的推動。“2011年高等院校高性能計算綜合技能及學科應用培訓班”就是由AMD公司發(fā)起,他們希望讓高校的教師更好地掌握OPEN CL,這是一個很好的開始。但這遠遠不夠。事實上,整個人才機制的建立,最根本之處在于大學教育,只有讓計算機學科與其他學科充分結(jié)合,建立交叉學科機制,才能培養(yǎng)出一大批“多面手人才”。在教育界、學術(shù)界、產(chǎn)業(yè)界的共同聯(lián)手下,才有高性能計算人才蓬勃涌現(xiàn)的明天。
目前中國在硬件方面已經(jīng)領(lǐng)先,那么,如何在人才方面不落后?這是一個比硬件設(shè)計艱巨得多的任務(wù),更需要社會的關(guān)注。