劉洪宇
以5萬元價(jià)格出售萬億次桌面HPC,浪潮發(fā)動(dòng)了HPC普及化的攻勢(shì)。而在混合架構(gòu)的技術(shù)嘗試背后,浪潮也為沖擊未來高端高性能計(jì)算埋下了伏筆。
對(duì)于HPC來說,5萬元的價(jià)格并不高,萬億次的性能又著實(shí)不低,而二者就結(jié)合在一臺(tái)臺(tái)式機(jī)大小的桌面設(shè)備當(dāng)中,它能否一石激起千層浪?3月2日,這臺(tái)名為“倚天”的桌面HPC在京發(fā)布,拉開了浪潮推動(dòng)HPC普及的大幕。
走協(xié)同加速路線
高性能計(jì)算市場(chǎng)呈金字塔型分布,有調(diào)查數(shù)據(jù)顯示,塔基部分為64節(jié)點(diǎn)以下、計(jì)算能力小于4萬億次的集群,這占據(jù)了中國(guó)當(dāng)前高性能市場(chǎng)75%左右的市場(chǎng)份額,用戶主要集中在教育、科研等領(lǐng)域。如果涵蓋被價(jià)格門檻阻隔在外的潛在客戶,市場(chǎng)規(guī)模還將進(jìn)一步擴(kuò)大。
曙光和SGI也曾推出個(gè)人超級(jí)計(jì)算機(jī)(PHPC),目標(biāo)定位與浪潮“倚天”相近,聚焦于高性能市場(chǎng)規(guī)模最大的塔基部分,但技術(shù)路線卻有所不同。曙光和SGI都選擇了傳統(tǒng)的集群技術(shù)路線,尤其是曙光PHPC,本身就是由曙光5000A的單計(jì)算節(jié)點(diǎn)衍生而來的。
浪潮“倚天”則選擇了走“CPU+GPU”的技術(shù)路線,由英特爾最新一代CPU專職負(fù)責(zé)邏輯選擇、判斷跳轉(zhuǎn)和I/O通信計(jì)算,NVIDIA Tesla GPU則專職負(fù)責(zé)計(jì)算密集型、高度并行的計(jì)算任務(wù)。通過協(xié)同加速架構(gòu),CPU和GPU計(jì)算資源合理分配,同時(shí)基于高速I/O交換技術(shù)和英特爾QPI技術(shù),使得CPU和GPU之間更加有效協(xié)同計(jì)算,實(shí)現(xiàn)了單機(jī)性能突破,峰值計(jì)算能力最大可達(dá)4萬億次/秒。
從技術(shù)角度來看,在某些更大規(guī)模的HPC當(dāng)中,采用FPGA、GPU甚至CELL、龍芯等處理器進(jìn)行某些特定的應(yīng)用加速并不鮮見,比如日本東京大學(xué)改進(jìn)了計(jì)算架構(gòu),加入Tesla GPU加速,使其HPC的性能快速躍升至全球TOP500第29名。但將GPU加速理念和架構(gòu)用于“倚天”這類單機(jī)高性能計(jì)算,尚屬首次。
浪潮集團(tuán)技術(shù)總監(jiān)胡雷鈞認(rèn)為,協(xié)同計(jì)算加速架構(gòu)并非否定傳統(tǒng)技術(shù)路線,而是補(bǔ)充和輔助。通過不同計(jì)算單元的分工合作與優(yōu)勢(shì)互補(bǔ),基于混合架構(gòu)的浪潮“倚天”更專注于計(jì)算密集型應(yīng)用。在這類應(yīng)用中,它相比基于通用處理器的集群系統(tǒng)的效果更好,但并非要在各個(gè)領(lǐng)域都進(jìn)行取代。而從長(zhǎng)遠(yuǎn)的技術(shù)規(guī)劃角度來看,協(xié)同加速也將是未來HPC發(fā)展中非常值得關(guān)注的趨勢(shì)。
“倚天”適合誰使用
在傳統(tǒng)集群架構(gòu)下,系統(tǒng)計(jì)算性能的提升主要通過疊加計(jì)算節(jié)點(diǎn)實(shí)現(xiàn),這就給空間、采購(gòu)成本、管理性以及能耗開支等方面都帶來了挑戰(zhàn)?!耙刑臁钡某霈F(xiàn),為高校、中小型科研所、企業(yè)研發(fā)中心使用“萬億次HPC”降低了門檻。
“倚天”是“浪潮高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室”的重要研發(fā)成果。據(jù)浪潮集團(tuán)高性能服務(wù)器產(chǎn)品部總經(jīng)理劉軍介紹,“倚天”的設(shè)計(jì)本身就是從用戶需求調(diào)研出發(fā)的,表現(xiàn)出“兩快三省”的特點(diǎn):“快”體現(xiàn)在運(yùn)行速度和部署兩方面,“倚天”可以通過日常電源接入,無須專門機(jī)房和維護(hù)人員;“省”體現(xiàn)在成本、空間和電費(fèi)上,這臺(tái)體積與噪音都與臺(tái)式機(jī)相當(dāng)?shù)淖烂鍴PC可直接放置在辦公桌上,5萬元的售價(jià)明顯低于同樣性能的集群產(chǎn)品,功率僅為1000W。
浪潮“倚天”以低成本解決了成本與計(jì)算峰值的矛盾,但是否因?yàn)榧軜?gòu)不同,適用領(lǐng)域會(huì)較為狹窄呢?胡雷鈞表示,基于通用處理器做的集群產(chǎn)品應(yīng)用面可能會(huì)廣一些,但是也不是說它就覆蓋了絕大多數(shù)應(yīng)用,而GPU只覆蓋少量應(yīng)用。從實(shí)際應(yīng)用來看,GPU能覆蓋的應(yīng)用可以達(dá)到50%左右,尤其是在科研領(lǐng)域、研發(fā)領(lǐng)域。“只能說這類產(chǎn)品有它的特定優(yōu)勢(shì)面,它并不是窄眾產(chǎn)品?!?/p>
據(jù)劉軍介紹,從應(yīng)用領(lǐng)域來看,浪潮“倚天”適用于經(jīng)過圖形加速后提升效果明顯的生命科學(xué)、天體物理、量子化學(xué)研究、資源勘探、機(jī)械制造、汽車設(shè)計(jì)、金融模擬、醫(yī)學(xué)成像、視頻和音頻解碼、圖形渲染等應(yīng)用領(lǐng)域。例如渲染4D電影《圓明園》的10分鐘動(dòng)漫視頻,將圓明園西洋樓的每一個(gè)建筑物的點(diǎn)、線、面都完整展現(xiàn)出來,渲染任務(wù)達(dá)15000幀,同時(shí)質(zhì)量要求很高,如果使用浪潮“倚天”,只需十幾個(gè)小時(shí)就能完成,且渲染質(zhì)量上乘。
它與集群配合使用,還可以有效提高工作效率。中科院北京基因組研究所就是“倚天”的試用單位,在實(shí)際應(yīng)用中取得了很好的效果。于軍副所長(zhǎng)認(rèn)為,“倚天”能有效緩解基因研究所計(jì)算資源緊張、平臺(tái)使用擁擠的現(xiàn)狀,從共享資源的“公共汽車模式”,到每個(gè)科學(xué)家都可以單獨(dú)使用的“小汽車模式”,研發(fā)效率自然會(huì)提升。
此外,由于“倚天”體積小,還可以滿足對(duì)移動(dòng)性、現(xiàn)場(chǎng)時(shí)效性要求較高的應(yīng)用需求,如在診斷現(xiàn)場(chǎng)得出醫(yī)學(xué)成像結(jié)果等,而這類優(yōu)勢(shì)是傳統(tǒng)集群難以比擬的。
編程并非大問題
作為一種高端產(chǎn)品,高性能計(jì)算技術(shù)有著相對(duì)獨(dú)立的應(yīng)用環(huán)境,包括重新編程、語言編譯、應(yīng)用開發(fā)移植等。硬件僅僅是平臺(tái),應(yīng)用才是平臺(tái)上的舞者,協(xié)同加速架構(gòu)意味著一種新的編程體系和應(yīng)用開發(fā)環(huán)境,勢(shì)必引發(fā)編程難題。
出席發(fā)布會(huì)的NVIDIA中國(guó)區(qū)總經(jīng)理張建中表示,為了幫助開發(fā)人員充分利用“CPU+GPU”架構(gòu),NVIDIA發(fā)布了CUDA架構(gòu),它可以支持所有多核系統(tǒng)、多種常用編程語言,基于CUDA架構(gòu)發(fā)布的程序可以控制GPU和CPU計(jì)算,這就為廣大應(yīng)用開發(fā)人員和科研科技工作者提供了易用性較好的平臺(tái)。CUDA架構(gòu)上目前已經(jīng)有幾百種應(yīng)用,很多行業(yè)都開始采用GPU加速。
目前從國(guó)內(nèi)現(xiàn)狀來看,CUDA編程普及一定是長(zhǎng)期的發(fā)展過程。胡雷鈞說,七八年前,基于MPI寫集群程序的程序員也很少,但集群是先進(jìn)模式,應(yīng)用就逐漸豐富起來了,現(xiàn)在的情形與當(dāng)年是類似的?!巴屏妥枇σ欢ㄊ嵌加械?我覺得現(xiàn)在往前的推力比阻力要大。對(duì)于沒有并行編程經(jīng)驗(yàn)的用戶來講,學(xué)MPI和學(xué)CUDA沒有太大區(qū)別,用戶一定是選最有效率的?!?胡雷鈞認(rèn)為,現(xiàn)在大部分用戶并不是已經(jīng)充分利用好了集群系統(tǒng),很多程序并沒有真正的實(shí)現(xiàn)。對(duì)他們來說,主要問題是怎樣把原有串行程序改造成并行,而不是從集群遷移到混合架構(gòu)上來。這個(gè)改造過程無論應(yīng)用哪種HPC都需要進(jìn)行。
硬件應(yīng)用雙驅(qū)動(dòng)
推動(dòng)HPC發(fā)展,一方面要培育用戶的使用習(xí)慣,另一方面要提升HPC應(yīng)用的易用性和親和度。擁有用戶需求的理解和應(yīng)用服務(wù)能力、具有豐富廠商合作資源的高性能計(jì)算設(shè)備廠商,是這一環(huán)節(jié)的關(guān)鍵。
以“倚天”為開端,浪潮醞釀的HPC應(yīng)用推廣戰(zhàn)役已經(jīng)打響,這將包括用戶培訓(xùn)、編程工具開發(fā)、與商業(yè)應(yīng)用軟件商合作進(jìn)行軟件移植優(yōu)化等一系列具體舉措。浪潮集團(tuán)高級(jí)副總裁王恩東表示,浪潮將不遺余力加大高性能應(yīng)用軟件的移植和開發(fā),真正讓中國(guó)用戶“用得好、用得上”高性能平臺(tái),才是浪潮HPC發(fā)展的硬道理。
據(jù)了解,浪潮將按客戶應(yīng)用進(jìn)行行業(yè)細(xì)分,組建專門的HPC開發(fā)團(tuán)隊(duì),基于CPU+GPU的應(yīng)用,幫助用戶開展性能優(yōu)化,包括從算法改進(jìn)到多核優(yōu)化等。同時(shí),浪潮還在北京和濟(jì)南建設(shè)了性能達(dá)100萬億次的協(xié)同計(jì)算平臺(tái),免費(fèi)向客戶開放作為GPU開發(fā)測(cè)試平臺(tái),加速應(yīng)用遷移,從硬件平臺(tái)、應(yīng)用合作、技術(shù)服務(wù)、軟件平臺(tái)四個(gè)方面推進(jìn)HPC產(chǎn)業(yè)進(jìn)步。