文 | 本刊記者 孫杰賢
以“智算力就是創(chuàng)新力”為主題的2023人工智能計(jì)算大會(huì)(AICC 2023)日前在北京召開,大會(huì)重點(diǎn)圍繞智算基礎(chǔ)設(shè)施、大模型創(chuàng)新、AI Infra 技術(shù)創(chuàng)新、自動(dòng)駕駛創(chuàng)新與應(yīng)用、AI for Science、智算開放標(biāo)準(zhǔn)等熱點(diǎn)話題開設(shè)一場主題論壇,六場專題分論壇,近百位政產(chǎn)學(xué)研專家現(xiàn)場分享智算產(chǎn)業(yè)前沿趨勢和創(chuàng)新成果。
浪潮信息高級(jí)副總裁劉軍在演講時(shí)表示,面向生成式人工智能(AIGC)帶來的機(jī)遇與挑戰(zhàn),通過智算力系統(tǒng)來更好地支撐AI創(chuàng)新與應(yīng)用,已經(jīng)成為智算產(chǎn)業(yè)的關(guān)鍵,應(yīng)該從算力系統(tǒng)、AI Infra(AI軟件基礎(chǔ)設(shè)施)、算法模型和產(chǎn)業(yè)生態(tài)4個(gè)方面來進(jìn)行綜合考量,從而加速智能產(chǎn)業(yè)的落地。他特別指出,AIGC大模型開發(fā)是一項(xiàng)極其復(fù)雜的系統(tǒng)工程,即便解決了底層算力供給的問題,仍面臨建不了和用不好的問題?!敖ú缓谩笔侵笜?gòu)建算力平臺(tái)不僅需要服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)等硬件集成,還需要考慮不同硬件和軟件之間的兼容性和版本選擇,確保驅(qū)動(dòng)和工具的適配性和穩(wěn)定性;“用不好”則體現(xiàn)在算力平臺(tái)效率低、穩(wěn)定性不足、模型開發(fā)環(huán)節(jié)冗長等現(xiàn)實(shí)困擾。因此,在算力系統(tǒng)外,AI Infra也亟需創(chuàng)新。
據(jù)悉,針對AI Infra層面的優(yōu)化,浪潮信息開發(fā)了大模型智算軟件棧OGAI。在算力集群部署方面,開源了業(yè)界首個(gè)AI算力集群系統(tǒng)環(huán)境部署方案PODsys;在大規(guī)模訓(xùn)練的長時(shí)保障方面,從算力調(diào)度平臺(tái)層實(shí)現(xiàn)了自動(dòng)化斷點(diǎn)續(xù)訓(xùn);在多元算力接入方面以標(biāo)準(zhǔn)化、模塊化接入方式穩(wěn)定接入超過40+芯片;在數(shù)據(jù)治理方面構(gòu)建了流程化、可自定義的數(shù)據(jù)清洗流水線,有效縮短數(shù)據(jù)清洗時(shí)間、提升文本審核過濾準(zhǔn)確率;在計(jì)算效率優(yōu)化方面,通過對分布式并行算法的極致優(yōu)化,將千億參數(shù)模型訓(xùn)練的計(jì)算效率提升到54%;在多模型管理方面已經(jīng)支持了超過10個(gè)業(yè)界主流的開源大模型和元腦生態(tài)大模型,用實(shí)踐證明AI Infra全?;A(chǔ)軟件和工作流的創(chuàng)新是多元算力高效釋放、提升大模型算力效率的關(guān)鍵。
除了劉軍,在上午的主題論壇上,還有眾多重量級(jí)嘉賓就AIGC、大模型以及智算基礎(chǔ)設(shè)施等相關(guān)話題從技術(shù)、理念、產(chǎn)業(yè)、生態(tài)等方面展開了深入、全面、客觀地交流與分享。
中國工程院院士王恩東——大模型帶動(dòng)AIGC產(chǎn)業(yè)迅速發(fā)展,在科學(xué)探索、技術(shù)研發(fā)、藝術(shù)創(chuàng)作、企業(yè)經(jīng)營等諸多領(lǐng)域都帶來了巨大的創(chuàng)新機(jī)會(huì),提升大模型智能水平需要提升模型訓(xùn)練的參數(shù)量和數(shù)據(jù)量,這必須要通過更大更好的智算力才能夠支撐,從這個(gè)意義上可以說智算力就是創(chuàng)新力,當(dāng)前人工智能產(chǎn)業(yè)發(fā)展的基礎(chǔ)是智算能力。
北京智源人工智能研究院副院長兼總工程師林詠華——大模型時(shí)代,面對異構(gòu)算力不能合池訓(xùn)練、生態(tài)割裂和芯片各異評測難的三大算力束縛,我們需要攻關(guān)兼容異構(gòu)芯片的混合訓(xùn)練技術(shù),提升訓(xùn)練效率,并推動(dòng)面向異構(gòu)芯片的開源算子軟件棧,以及建立評測體系。
騰訊云產(chǎn)業(yè)智能首席專家王巍——大模型深刻觸動(dòng)了產(chǎn)業(yè)變化和底層邏輯,引發(fā)動(dòng)力變革、交互變革和效率變革。企業(yè)大模型落地需要從底座、功能和應(yīng)用等方面來進(jìn)行能力加持,在跨模態(tài)大模型落地過程中克服數(shù)據(jù)、連接、安全、統(tǒng)一等四個(gè)方面的挑戰(zhàn)。
此外,大會(huì)還發(fā)布了兩份重要的研究成果——《北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書(2023年)》(以下簡稱《白皮書》)和《2023-2024年中國人工智能計(jì)算力發(fā)展評估報(bào)告》(以下簡稱《評估報(bào)告》)。
《白皮書》從大模型全球發(fā)展態(tài)勢、國內(nèi)外行業(yè)應(yīng)用概述、北京應(yīng)用情況和發(fā)展建議等方面進(jìn)行了系統(tǒng)分析和闡述,旨在展示北京市大模型應(yīng)用成果,促進(jìn)大模型價(jià)值傳播和供需對接?!栋灼分赋?,目前北京是當(dāng)前國內(nèi)人工智能領(lǐng)域創(chuàng)新基礎(chǔ)最好、人才資源最集中、研發(fā)創(chuàng)新能力最強(qiáng)、產(chǎn)品迭代最活躍的地區(qū),現(xiàn)已擁有大模型創(chuàng)新團(tuán)隊(duì)122家,數(shù)量居全國首位,約占全國的一半。在大模型技術(shù)落地方面,北京市場空間廣闊,已率先開展了多樣化的應(yīng)用實(shí)踐,從模型演進(jìn)看,呈現(xiàn)出從技術(shù)到產(chǎn)品、再到商業(yè)化的發(fā)展路線;從應(yīng)用領(lǐng)域看,呈現(xiàn)出百花齊放發(fā)展格局,其中傳統(tǒng)產(chǎn)業(yè)賦能和金融領(lǐng)域發(fā)展較快;從應(yīng)用類型看,多類應(yīng)用全面開花,其中內(nèi)容生成和智能問答最為成熟;從商業(yè)模式看,大模型已形成“基礎(chǔ)+行業(yè)+應(yīng)用”的三層架構(gòu)。
而《評估報(bào)告》則從算力規(guī)模、區(qū)域分布和行業(yè)滲透度等多維度,對我國人工智能計(jì)算力發(fā)展進(jìn)行綜合評估,給出大模型和AIGC的發(fā)展將引發(fā)AI算力產(chǎn)業(yè)之變的核心洞察,并提出針對性的行動(dòng)建議?!对u估報(bào)告》指出,當(dāng)前在AIGC的帶動(dòng)下,人工智能計(jì)算力技術(shù)及應(yīng)用趨勢發(fā)生了較大的變化。
一是計(jì)算范式之變。大模型和AIGC的發(fā)展加速了更高計(jì)算性能、更快互聯(lián)性能的算力基礎(chǔ)設(shè)施建設(shè),推進(jìn)人工智能在云-邊-端的覆蓋。此外,伴隨應(yīng)用場景多樣性,底層基礎(chǔ)設(shè)施呈現(xiàn)多元化發(fā)展。
二是產(chǎn)業(yè)動(dòng)量之變。AIGC可重構(gòu)現(xiàn)有的工作方式,在內(nèi)容創(chuàng)作、自動(dòng)駕駛、零售、醫(yī)療等諸多領(lǐng)域改變著人們的生活和生產(chǎn)方式,同時(shí)也帶來更大的市場機(jī)會(huì)。算力、算法、應(yīng)用、服務(wù)等諸多產(chǎn)業(yè)變量將成為創(chuàng)新的加速器,在算力生態(tài)鏈上的各個(gè)環(huán)節(jié)催生出新的玩家。
三是算力服務(wù)格局之變。由于基礎(chǔ)大模型的本地訓(xùn)練成本不菲,企業(yè)將更多地使用已有的人工智能數(shù)據(jù)中心設(shè)施和AIGC服務(wù)器集群,這將為算力服務(wù)市場帶來新機(jī)會(huì)。算力服務(wù)供應(yīng)商要能夠提供定制化的基礎(chǔ)設(shè)施服務(wù)能力,滿足單個(gè)用戶對訓(xùn)練和推理資源的獨(dú)占式、大規(guī)模、長時(shí)間使用的訴求,同時(shí)幫助用戶實(shí)現(xiàn)成本控制。
《評估報(bào)告》認(rèn)為,中國市場有其獨(dú)特性和一些新的變化。面對單芯片性能受限等局面,中國市場對于算力供給能力的評估指標(biāo)將從硬件性能向應(yīng)用效果轉(zhuǎn)變,企業(yè)在獲得算力服務(wù)的過程中,會(huì)更加以應(yīng)用為導(dǎo)向進(jìn)行綜合考量,增加對于諸如單位時(shí)間可處理Token數(shù)量、可靠性、時(shí)延、訓(xùn)練時(shí)間和資金成本、數(shù)據(jù)集質(zhì)量等指標(biāo)的關(guān)注。
針對這一轉(zhuǎn)變,《評估報(bào)告》指出,算力供應(yīng)商需要“以應(yīng)用為導(dǎo)向、系統(tǒng)為核心”,構(gòu)建算力基礎(chǔ)設(shè)施平臺(tái),提高算力利用率,提升諸如卡間互聯(lián)、多節(jié)點(diǎn)間互聯(lián)等水平,支持靈活穩(wěn)定擴(kuò)展和彈性容錯(cuò),積極打造通用的人工智能軟件和硬件平臺(tái),以先進(jìn)的系統(tǒng)性能力滿足市場的應(yīng)用需求。