鄧培智
如果說之前大家還對CPU+GPU架構(gòu)在高性能計算領(lǐng)域的能力有所質(zhì)疑,那么現(xiàn)在毫無疑問的是,未來的超級計算機(jī)和高性能計算將由CPU+GPU的架構(gòu)構(gòu)成。什么是超級計算機(jī)和高性能計算?一提到這兩個概念,大部分人在第一時間都會想到“曙光”、“銀河”,“深藍(lán)”之類的超大型計算機(jī)。但是隨著CPU性能的提升,隨之而來的是發(fā)熱量和功耗等方面的問題,現(xiàn)在的超大型集群出現(xiàn)了兩個困境:一個是空間的限制,另外一個就是預(yù)算投入的無止境。例如,最新一期全球500最強(qiáng)超計算機(jī)的第一位走鵑(Roadrunner)擁有130536個計算核心,要想擁有這只“小鳥”,企業(yè)無論在投入還是供電方面,都得留下巨額的預(yù)算。
什么是CPU+GPU的計算架構(gòu)?就是在采用CPU進(jìn)行控制的基礎(chǔ)上,充分發(fā)揮GPU的多核心優(yōu)勢,將運(yùn)算分門別類地進(jìn)行分工,讓CPu和GPU各自處理優(yōu)勢運(yùn)算。比如,我開一個賣Pizza的小店,用CPU計算的方式就是買一輛面包車,今天有20家需要送Pizza,我就讓面包車帶著所有的Pizza挨家送貨,到了最后一家的時候可能Pizza涼了。如果是GPU的工作方式,就是用買一輛面包車的錢買20輛自行車,每輛自行車都載著Pizza,然后同時出發(fā)。兩個方式相比,在同樣的成本下,后者可以在第一時間問時完成大規(guī)模的并行任務(wù)??梢姴捎貌⑿杏嬎愕母拍羁梢栽诔杀?,性能和功耗等多個方面都超越只使用串行方式進(jìn)行處理的計算模式。現(xiàn)在的科研院所,在配備超級計算機(jī)時,通常是一個研究機(jī)構(gòu)配備一臺以CPU集群為基礎(chǔ)的大型超級計算機(jī),所有的研究人員根據(jù)自己的研究項目進(jìn)展提前進(jìn)行預(yù)約,這樣在進(jìn)行研究時的靈活性會受到很大限制。而采用GPU的超級計算機(jī)就可以更好地滿足這類需求,通過配備NVIDIA Tesla GPU的個人超級計算機(jī),科研院所可以達(dá)到在投入基本不變的情況下,人手一臺超級計算機(jī),相對于普通計算機(jī)在綜合效率上達(dá)到10~100倍的提升!
去年,東京工業(yè)大學(xué)采用170顆Tesla GPU組成了Tsubame超級計算機(jī),當(dāng)年取得了全球500強(qiáng)超級計算機(jī)排名第29名的好成績!在國內(nèi),吉星吉達(dá)也與NVIDIA一起推出了一款基于Tesla GPU的、面向石油天然氣勘探領(lǐng)域的全新硬件與軟件解決方案。與傳統(tǒng)CPU集群相比,這個解決方案可以用更低的成本實(shí)現(xiàn)100-400倍速度提升,同時將功耗降低95%。與此同時,國內(nèi)已經(jīng)有十多所高校開設(shè)了應(yīng)用GPU進(jìn)行編程CUDA課程,為進(jìn)~步普及GPU并行計算打下了的基礎(chǔ)??梢灶A(yù)見,未來的大型計算機(jī)和高性能運(yùn)算領(lǐng)域必將因?yàn)镚PU這個擁有并行計算能力的“神奇小子”而更加精彩。