焦旭
“集群采用了英特爾至強金牌處理器、815個雙路刀片服務器節(jié)點、3.26萬個計算核心、5.5PB的存儲裸容量,還配備有GPU節(jié)點4個、KNM節(jié)點4個、FPGA節(jié)點2個,系統(tǒng)計算網(wǎng)絡為英特爾最新的1152端口OPA。系統(tǒng)理論峰值性能為每秒2500萬億次,實測計算性能為每秒1687萬億次?!?/p>
這樣一組數(shù)據(jù),在HPC業(yè)內(nèi)人士看來似乎并沒有什么驚艷之處。如果說,這套超算系統(tǒng)是一所2011年才創(chuàng)辦的高校,從開始籌建到最終交付用時不到一年打造的話,就會讓人留下深刻的印象了。
南方科技大學正是這樣一所讓人印象深刻的高校。作為國家高等教育綜合改革試驗校、廣東省高水平大學重點建設高校,它是由廣東省領導和管理的全日制公辦普通高等學校,深圳市創(chuàng)辦的一所創(chuàng)新型大學。南科大僅用短短數(shù)年時間就已經(jīng)成為國內(nèi)知名、國際上有一定影響力的高校,其實力在國內(nèi)科技大學里面排名前五位,在泰晤士報世界大學排名上已經(jīng)排到了中國內(nèi)地第八的位置。全校近300余名教學科研系列教師中,有28名院士、35名國際會士、24名“國家杰青”、8名“國家優(yōu)青”。這樣高的頂尖人才比例,足以擠進985頂級行列,秒殺大多數(shù)211高校了。
在HPC領域,南科大的二期高性能集群——“太乙”在SC2018全球超算大會最新一期的全球Top 500超算集群排名中名列第127位,在國內(nèi)高校中除國防軍事類院校外位居第一。南科大的學生超算團隊在剛剛結束的ASC19世界大學生超級計算機競賽總決賽上獲得了大賽一等獎、應用創(chuàng)新獎及最佳人氣獎三個獎項。
是什么讓南科大在短短幾年間取得了如此成績?又是什么促使南科大在HPC計算上如此發(fā)力?可以說,科研與創(chuàng)新是其源動力。正如南科大副校長兼總務長魯春所言:“我們的教授大概有80%都是從國外回來的,他們回國最看重的不光是待遇,而是科研實驗的平臺,目前越來越多的科研項目都是計算機模擬而來,因此HPC計算平臺的重要性不言而喻。如果沒有很好的計算資源和存儲資源,如果沒有平臺,這些高級教授人才回來做不了科研也就沒有了意義?!?/p>
據(jù)了解,南科大作為一所創(chuàng)新型大學,其目標是迅速建成國際化高水平研究型大學,建成中國重大科學技術研究與拔尖創(chuàng)新人才培養(yǎng)的重要基地。其在新型物理、材料領域的創(chuàng)新成果,包括凝聚態(tài)物理等前沿理論,位居國內(nèi)科研領域的前沿。當前學校各大學科中計算需求量較大且迫切的學科主要集中在物理、化學、生物、環(huán)境、材料、金融、數(shù)學等領域。
魯春在采訪中向記者列舉了兩個例子,南科大在做無人機空氣動力研究時,如果完全用實體飛機來實驗,很多時候對實驗實體具有破壞性,成本非常高,倒不如利用算法模型,模擬全天候和各種惡劣氣候條件下的機翼性能優(yōu)化,這時候就需要進行空氣動力學的大量計算;而在生物信息學領域,人體腦電波在不同的場景下,會產(chǎn)生什么樣的變化,都會產(chǎn)生出大量數(shù)據(jù),腦電波與行為之間的關系,都需要進行大量計算。
正因如此,南科大在2015年搭建的一期高性能集群——“啟明”的計算和存儲資源很快就無法滿足校內(nèi)科研項目的需求。而為了讓“太乙”在使用中效率更高,南科大通過郵件調研所有教授的需求,進行綜合考量:材料系要做原子量級、電子量級的計算,對計算量的要求會非常巨大;計算機系更多的是關注人工智能,對算法的運算力是不是足夠高十分關注;生物系要求的計算性能不是特別快,但對存儲的性能要求很高。
魯春指出,得益于精細化管理和不斷改進的作業(yè)隊列系統(tǒng),目前“太乙”的資源利用得當。南科大還將會進一步幫助用戶提高他們代碼的計算效率。不過按照南科大目前的發(fā)展速度,可能很快就要對超算中心進行升級了。
從“啟明”到“太乙”,得益于南科大在超算領域的前瞻性布局,在2018年Nature Index的70多個刊物里,南科大教授們所發(fā)表的文章數(shù)排在所有中國大學第26位,但在所有大學發(fā)表的文章中被引用量已排名全國第一。