□ 楊廣文
作為大國重器,超級計算是解決國家經(jīng)濟建設(shè)、社會發(fā)展、科技創(chuàng)新和國家安全等重大戰(zhàn)略問題的重要手段,是國家創(chuàng)新能力的重要體現(xiàn)。經(jīng)過數(shù)十年的不懈努力,我國的超級計算機研制已經(jīng)在世界上有了一席之地,自主研制的超級計算機天河一號、天河二號、神威·太湖之光先后十一次在全球超級計算機排行榜排名第一,充分體現(xiàn)了我國超算研制方面的實力,對科學(xué)研究、工程模擬、重大裝備、社會發(fā)展等起到了明顯的支持和推動作用。在超級計算的研究中,如何更好地發(fā)揮超級計算機的性能,高效求解各類應(yīng)用中的重大科學(xué)問題一直是研究的核心問題之一。新世紀以來,超級計算機和高速互聯(lián)網(wǎng)的不斷發(fā)展,對面向應(yīng)用領(lǐng)域的高性能計算環(huán)境提出了新的機遇和挑戰(zhàn)。
為了提升我國超級計算機的應(yīng)用水平,推動超算中心從提供機時服務(wù)向提供多領(lǐng)域應(yīng)用服務(wù)的轉(zhuǎn)變,基于超級計算機和高性能通信網(wǎng)絡(luò)構(gòu)建超算互聯(lián)網(wǎng)勢在必行。
超算互聯(lián)網(wǎng)的研究與構(gòu)建,將能夠有效應(yīng)對超算發(fā)展新形勢下我國超算中心運行面臨的挑戰(zhàn),支持超算中心之間通過高速網(wǎng)絡(luò)實現(xiàn)資源共享和協(xié)同工作,實現(xiàn)超算中心從機時提供者向應(yīng)用服務(wù)提供者的轉(zhuǎn)變,提升我國超級計算機的應(yīng)用水平,為國家經(jīng)濟建設(shè)、社會發(fā)展、科技創(chuàng)新和國家安全等提供更加強大和易用的超算服務(wù)。通過構(gòu)建超算互聯(lián)網(wǎng),我們可以建立連接各國家級超算中心的核心資源網(wǎng),實現(xiàn)計算資源的高效共享和管理;面向國家重大需求,針對重點應(yīng)用領(lǐng)域研制支撐領(lǐng)域應(yīng)用的專業(yè)平臺并開展應(yīng)用;構(gòu)建自主可控的高性能計算應(yīng)用平臺服務(wù)體系,提供跨超算中心的統(tǒng)一服務(wù)能力。
超算互聯(lián)網(wǎng)是一種以超級計算機和高速互聯(lián)網(wǎng)為基礎(chǔ)的國家級超算算力基礎(chǔ)設(shè)施,以高速網(wǎng)絡(luò)互聯(lián)地理上分布的超算中心,聚合多個超算中心的軟硬件資源,并通過建設(shè)超算資源共享與交易平臺,支持算力、數(shù)據(jù)、軟件、應(yīng)用等資源的共享與交易,同時向用戶提供多樣化算力服務(wù)。在此基礎(chǔ)上,面向各領(lǐng)域與產(chǎn)業(yè)用戶構(gòu)建專業(yè)的領(lǐng)域應(yīng)用平臺,為科技創(chuàng)新、產(chǎn)業(yè)升級、社會發(fā)展、國家安全等提供基于超級算力的專業(yè)服務(wù)。作為一種超算算力基礎(chǔ)設(shè)施,超算互聯(lián)網(wǎng)將超級計算機所提供的強大計算能力抽象為更加本質(zhì)的計算服務(wù),并以一種標準化的形式提供給計算服務(wù)的使用者。
簡單地講,我們可以將超算互聯(lián)網(wǎng)與電力網(wǎng)相類比。電力網(wǎng)制定標準的發(fā)電、傳輸、用電規(guī)范,構(gòu)建基本的電力傳輸和交易平臺,將來自于火電、水電、風(fēng)電、核電、光伏等不同來源的電力整合到一起,為工業(yè)、農(nóng)業(yè)、居民、科研等各種電力用戶提供即用即得的電力服務(wù)。與電力網(wǎng)類似,超算互聯(lián)網(wǎng)通過制定資源接入、共享、交易等規(guī)范,構(gòu)建具備資源共享與交易能力的公益性資源平臺,將來自各級超算中心、云計算企業(yè)、科研機構(gòu)等不同來源的算力、數(shù)據(jù)、軟件、應(yīng)用等抽象為統(tǒng)一的超算資源并整合到一起,為科研、生產(chǎn)、生活和國家安全等提供高效專業(yè)的超級計算服務(wù)。
為了推動超算互聯(lián)網(wǎng)的實現(xiàn),打造算力和服務(wù)水平世界領(lǐng)先的戰(zhàn)略性關(guān)鍵信息基礎(chǔ)設(shè)施,充分發(fā)揮現(xiàn)有和在建超級計算機的資源潛力,國家超級計算無錫中心聯(lián)合國家超級計算廣州中心、中科院計算機網(wǎng)絡(luò)信息中心等多家國家級超級計算中心,以及清華大學(xué)、青島海洋國家實驗室、之江實驗室等多家核心應(yīng)用單位,依托國家重點研發(fā)計劃項目“國家高性能計算環(huán)境領(lǐng)域應(yīng)用平臺及服務(wù)體系研究與構(gòu)建”,開展超算互聯(lián)網(wǎng)技術(shù)體系和應(yīng)用模式研究,著力構(gòu)建超算互聯(lián)網(wǎng)原型,推動超算中心從提供算力到提供服務(wù)的重大轉(zhuǎn)變,提升超算對科技創(chuàng)新、經(jīng)濟建設(shè)、社會發(fā)展的推動能力,為創(chuàng)新型國家的建設(shè)提供基礎(chǔ)性的計算支撐。
首先,基于來自紫金山實驗室、賽爾網(wǎng)絡(luò)等多家不同網(wǎng)絡(luò)運營單位提供的高速網(wǎng)絡(luò)互聯(lián)解決方案,超算互聯(lián)網(wǎng)項目組實現(xiàn)了國家超算無錫中心、國家超算青島中心、國家超算廣州中心、中科院計算機網(wǎng)絡(luò)信息中心等多個國家級超級計算中心資源的互聯(lián)互通與資源共享,集成了每秒鐘完成超百億億次浮點運算的異構(gòu)超算算力。這些遍布全國的超算算力被有機地整合為一個整體,形成國家高性能計算核心資源網(wǎng),為超算互聯(lián)網(wǎng)提供強大的算力基礎(chǔ)。
其次,集成和研發(fā)資源管理與任務(wù)調(diào)度軟件,形成基于五層九個功能面組成的應(yīng)用平臺體系結(jié)構(gòu)的領(lǐng)域應(yīng)用平臺搭建技術(shù)體系。該體系結(jié)構(gòu)由資源層、互聯(lián)層、平臺層、應(yīng)用支持層(聚合層)和應(yīng)用層五層組成,包括用戶認證授權(quán)與管理、資源信息服務(wù)、計算任務(wù)管理、數(shù)據(jù)管理、應(yīng)用商店、計費與審計、日志服務(wù)、應(yīng)用開發(fā)與運行時環(huán)境、系統(tǒng)管理九個功能面。該技術(shù)體系能夠在超算的最終用戶和超算的并行程序開發(fā)者之間搭建一座橋梁,將超算所提供的強大計算能力抽象為更加本質(zhì)的計算服務(wù),并以標準化的形式提供給計算服務(wù)的使用者,實現(xiàn)各級超算中心、云計算企業(yè)、科研機構(gòu)等不同來源的算力、數(shù)據(jù)、軟件、應(yīng)用等資源的有機整合。
再次,項目在分子模擬與藥物設(shè)計、環(huán)境治理與災(zāi)害防治等多個重點領(lǐng)域進行應(yīng)用資源集成與服務(wù)集成,建設(shè)領(lǐng)域應(yīng)用平臺并開展應(yīng)用示范。在分子模擬與藥物設(shè)計領(lǐng)域,設(shè)計和初步構(gòu)建分子模擬與藥物設(shè)計領(lǐng)域應(yīng)用平臺,實現(xiàn)和部署高通量藥物篩選、分子動力學(xué)模擬以及化合物庫和數(shù)據(jù)管理系統(tǒng)。在環(huán)境治理與災(zāi)害防治領(lǐng)域,設(shè)計和初步構(gòu)建全國精細化短期氣候預(yù)測業(yè)務(wù)系統(tǒng)、全球渦分辨率海洋—海冰預(yù)報、浪潮流耦合的精細化海洋預(yù)報、典型流域精細化水文預(yù)報、長三角/環(huán)太湖氣象預(yù)報等領(lǐng)域應(yīng)用平臺。這些領(lǐng)域應(yīng)用平臺能夠更加有效地為國家實驗室等大型研究機構(gòu)提供以數(shù)值模擬為主、兼顧數(shù)據(jù)分析和智能計算的科研基礎(chǔ)設(shè)施服務(wù),讓超算算力更好地服務(wù)于科學(xué)研究和社會進步。
最后,超算互聯(lián)網(wǎng)將在前期探索的基礎(chǔ)上建立資源接入與交易規(guī)范和應(yīng)用服務(wù)平臺建設(shè)規(guī)范,支持資源的快捷接入、安全共享和高效交易,以及面向領(lǐng)域的應(yīng)用服務(wù)平臺的快速構(gòu)建。構(gòu)建超級計算資源管理及應(yīng)用服務(wù)體系,提供跨超算中心的統(tǒng)一服務(wù)策略和評價指標,探索超級計算中心、超級計算軟件開發(fā)者和超級計算用戶三方共贏的新型超算商業(yè)模式,實現(xiàn)超算中心從提供算力到提供服務(wù)的重大轉(zhuǎn)變。通過產(chǎn)業(yè)扶持與技術(shù)支持,集中優(yōu)勢力量,針對重點行業(yè)和產(chǎn)業(yè),形成面向行業(yè)或產(chǎn)業(yè)的具有技術(shù)和市場優(yōu)勢的企業(yè)聯(lián)盟或集群,最終為用戶提供基于超算的專業(yè)化業(yè)務(wù)服務(wù),擴大超級計算的應(yīng)用群體。
超算互聯(lián)網(wǎng)變提供超算算力為提供超算應(yīng)用服務(wù)的最大特點,帶來了在應(yīng)用模式上的巨大變化,對超算及其應(yīng)用的發(fā)展具有相當大的推動作用。建設(shè)和發(fā)展超算互聯(lián)網(wǎng),打造算力和服務(wù)水平世界領(lǐng)先的戰(zhàn)略性關(guān)鍵信息基礎(chǔ)設(shè)施,充分發(fā)揮現(xiàn)有和在建超級計算機的資源潛力,對于國產(chǎn)并行軟件的研發(fā)和商業(yè)化、典型應(yīng)用服務(wù)平臺的研發(fā)及商業(yè)化和相關(guān)產(chǎn)業(yè)生態(tài)發(fā)展都有著非常明顯的支持和帶動作用,將為開啟算力經(jīng)濟時代提供堅實的基礎(chǔ)。策