譚婧
七月流火,八月未央。
2019年8月22日,第十五屆全國高性能計算學術年會在內(nèi)蒙古呼和浩特舉辦?!队H愛的數(shù)據(jù)》觀察到,高性能計算與人工智能正在融合之路上前進。
高性能計算跟人工智能的深度融合已經(jīng)可以看到趨勢了。早在2018年6月,中國高性能計算機性能榜單中的幾臺新的計算機都聲稱具有支撐人工智能的能力,從這點就可以看出,人工智能的能力已經(jīng)是現(xiàn)在高性能計算界比較關注的一點了。
國家并行計算機工程技術研究中心總工程師、中國工程院院士陳左寧曾在上屆學術年會上專門探討“云端AI高性能計算計算能力及計算環(huán)境研究”。在會上她提出,現(xiàn)階段HPC與AI融合問題的關鍵在于兩個方面:
第一、在HPC體系結(jié)構(gòu)發(fā)生改變的過渡階段,如何在AI的演進階段支撐其計算能力需求,“這是目前HPC應該考慮的問題”。
第二、說得簡單點,現(xiàn)在的問題,有點像是人工智能所需要的能力,高性能計算沒給它提升上去。而已經(jīng)能夠提供的能力,卻是人工智能不需要的這種計算能力。
困難依然存在,但融合不會止步。
高性能計算未來趨勢與AI高度相關。清華大學計算機系教授、本屆年會共同主席鄭緯民也這樣認為。他在大會上用一句話總結(jié)高性能計算未來趨勢——AI+科學計算。他提出的兩個趨勢分別是:
一、異構(gòu)架構(gòu)在超算系統(tǒng)構(gòu)建層面被廣泛接受。他解釋道,“TOP 10系統(tǒng)中異構(gòu)超算占據(jù)7成,異構(gòu)架構(gòu)已經(jīng)成為構(gòu)建頂級超算系統(tǒng)的大勢所趨,加速器異構(gòu)還是異構(gòu)眾核之爭還將繼續(xù)。”
二、人工智能應用有望成為超算主流應用之一。隨著深度神經(jīng)網(wǎng)絡規(guī)模的擴大,最新的網(wǎng)絡生成和訓練往往需要數(shù)萬GPU小時(如BERT, NASNet等)甚至更多,具有頂級計算能力的超算系統(tǒng)理應為大規(guī)模人工智能應用提供支持。
這次,鄭緯民教授的報告主題是《從2019年TOP500和2018年戈登貝爾獎看E級超級計算機與應用發(fā)展趨勢報告》。據(jù)報告介紹,高性能計算是一個國家綜合國力的體現(xiàn),最近十幾年來取得了非常大的進展。國家的高性能計算機已在世界Top500強排行榜里位列第一, 2016年和2017年連續(xù)兩次奪得了高性能計算應用專項獎-戈登貝爾獎。
高性能計算實力增強已是事實,如何與人工智能融合值得期待。
香港中文大學教授黃鎧分享了融合超算云與5G邊緣計算升級大數(shù)據(jù)智能物聯(lián)網(wǎng)應用,他認為,今天人工智能更應該強調(diào)群體智能,比如幾千個無人飛機,不光是計算問題,協(xié)調(diào)問題??刂茊栴}更大。同時他認為嚴格講,超算和云不分家。今天基于計算機視覺在云、終端設備和AI芯片集成上已經(jīng)服務生活各個方面。
黃鎧教授談到,華為2019年在5G網(wǎng)絡領域取得進展,并預計到2025年在全球?qū)崿F(xiàn)增長。2019年,華為5G實現(xiàn)了15 Gbps的數(shù)據(jù)速率,比競爭對手快15-24倍。在全球范圍內(nèi),華為5G系統(tǒng)目前有50個國際訂單,擁有30-35%的5G基站。華為預計,到2025年,58%的人口將使用5G,14%的家庭將使用機器人管家,97%的企業(yè)將采用人工智能。
英特爾公司數(shù)據(jù)中心集團副總裁兼E級計算業(yè)務總經(jīng)理Trish A.Damkroger,認為當今世界正在以數(shù)據(jù)中心進行創(chuàng)新,HPC也從小眾的應用走向大眾。今天傳統(tǒng)的HPC正在向融合平臺進化。因此高性能基礎設施成為基礎,需要更先進的互聯(lián)、更快的計算,更強的存儲和內(nèi)存。高性能在計算流、人工智能仿真加速以及AI替換方面發(fā)揮重大的作用。
英特爾在三個層面為數(shù)據(jù)中心加速創(chuàng)新。在技術基礎架構(gòu)上通過嵌入式CPU 和AI處理器實現(xiàn)創(chuàng)新,在內(nèi)存和存儲層面通過擴張內(nèi)存和存儲層次結(jié)構(gòu)來提升性能和容量。在軟件方面抽象可讀、可維護、可移植的軟件架構(gòu)創(chuàng)新。
期間,Trish A.Damkroger女士邀請第四范式上臺分享了采用了最新的英特爾CPU和傲騰內(nèi)存和存儲技術的SageOne高性能AI軟硬一體集成系統(tǒng),大幅度提升AI訓練、推理和特征存儲的性能表現(xiàn)
從2018開始,內(nèi)蒙古自治區(qū)科技廳與和林格爾新區(qū)共同啟動超算中心即內(nèi)蒙古高性能計算公共服務平臺建設工作,旨在推動內(nèi)蒙古的數(shù)據(jù)存儲能力與計算能力同步發(fā)展,把內(nèi)蒙古打造成新一代信息技術創(chuàng)新發(fā)展的良好生態(tài)區(qū)。
內(nèi)蒙古高性能計算公共服務平臺項目,總投資是3億元人民幣,項目建設包括通用計算系統(tǒng)、人工智能加速計算系統(tǒng)、大數(shù)據(jù)存儲支撐系統(tǒng)、節(jié)點互聯(lián)網(wǎng)絡、配套基礎設施五部分內(nèi)容,平臺建設要求浮點運營能力不低于10Pflops、存儲容量不少于80PB、理論存儲聚合帶寬不低于800GB/s。
其理論峰值計算能力可在2018年發(fā)布的國內(nèi)高性能計算TOP100排名中名列前3位,CPU+GPU混合算力的理論峰值計算能力也可排到第3位。項目建成后,將支持科學計算、人工智能、大數(shù)據(jù)處理等方面的計算需求,助力內(nèi)蒙古自治區(qū)高科技產(chǎn)業(yè)發(fā)展和智慧內(nèi)蒙古建設,成為國際先進、國內(nèi)領先的高性能計算公共服務平臺。