李赟
AI 浪潮來襲,通用大模型的訓(xùn)練、行業(yè)大模型的訓(xùn)練、基于通用大模型的行業(yè)應(yīng)用、以及推理皆需要大量智能算力提供支持。
算力是數(shù)字經(jīng)濟(jì)發(fā)展的重要底座。隨著AI與數(shù)字經(jīng)濟(jì)的發(fā)展,算力規(guī)模不斷擴(kuò)大,需求持續(xù)攀升。
4月5日,OpenAI停止了ChatGPT Plus的銷售,官網(wǎng)中給出的理由為“由于需求量過大,我們暫停升級服務(wù)”。ChatGPT Plus是OpenAI提供的一項(xiàng)訂閱服務(wù),使用價(jià)格為20美元/月。訂閱ChatGPT Plus服務(wù)的會員可享受三個(gè)福利:在高峰時(shí)代可以訪問ChatGPT、更快速的響應(yīng)以及優(yōu)先訪問新功能。
AI進(jìn)入“大模型”時(shí)代。OpenAI自發(fā)布GPT1.0模型之后,一直在持續(xù)迭代,陸續(xù)發(fā)布GPT2.0、GPT3.0和GPT3.5,近期發(fā)布GPT4.0是其持續(xù)投入AI大模型的必然階段。相比前幾個(gè)模型,GPT-4的參數(shù)量更大,模型迭代時(shí)間更長,也能夠給出更準(zhǔn)確的結(jié)果。新版本的發(fā)布是大模型循序漸進(jìn)發(fā)展的必然成果,未來大模型將成為AI開發(fā)范式。
東方證券認(rèn)為,此次ChatGPT Plus停售事件是因?yàn)樾枨罅窟^大,計(jì)算資源供不應(yīng)求。AI浪潮來襲,智能算力需求將快速提升,AI芯片、AI服務(wù)器以及云計(jì)算算力需求將持續(xù)提升。ChatGPT的訓(xùn)練需要上萬片英偉達(dá)的GPU。同時(shí),在推理端,微軟已經(jīng)在Azure的六十多個(gè)數(shù)據(jù)中心中部署了幾十萬張GPU,為ChatGPT的超高訪問量提供支持。然而,還是似乎因?yàn)橛?jì)算資源供不應(yīng)求導(dǎo)致此次ChatGPT Plus停售。
AI浪潮來襲,通用大模型的訓(xùn)練、行業(yè)大模型的訓(xùn)練、基于通用大模型的行業(yè)應(yīng)用以及推理皆需要大量智能算力提供支持。AI芯片、AI服務(wù)器以及云計(jì)算算力需求將持續(xù)提升。
事實(shí)上,算力作為數(shù)字經(jīng)濟(jì)的核心生產(chǎn)力,已成為國民經(jīng)濟(jì)發(fā)展的重要基礎(chǔ)設(shè)施,中國智能算力規(guī)模正在高速增長。
IDC預(yù)測,2022年中國智能算力規(guī)模將達(dá)到268.0 EFLOPS(每秒百億億次浮點(diǎn)運(yùn)算),超過通用算力規(guī)模,預(yù)計(jì)到2026年智能算力規(guī)模將達(dá)到1271.4 EFLOPS。2021-2026年,預(yù)計(jì)中國智能算力規(guī)模年復(fù)合增長率達(dá)52.3%,同期通用算力規(guī)模年復(fù)合增長率為18.5%。華為更是預(yù)測,未來10年人工智能算力需求將會增長500倍以上!
未來算力網(wǎng)絡(luò)一定會成為國家經(jīng)濟(jì)發(fā)展的一個(gè)新的基礎(chǔ)設(shè)施,根據(jù)國家信息中心聯(lián)合浪潮信息發(fā)布的《智能計(jì)算中心創(chuàng)新發(fā)展指南》顯示,目前全國已有超過30個(gè)城市在建或籌建智算中心。近日,科技部也表態(tài)推動算力網(wǎng)建設(shè),打造超算、智算的算力底座。日前,貴州省大數(shù)據(jù)發(fā)展管理局發(fā)布《關(guān)于印發(fā)面向全國的算力保障基地建設(shè)規(guī)劃的通知》。從能力指標(biāo)、質(zhì)量指標(biāo)、結(jié)構(gòu)指標(biāo)、通道指標(biāo)、產(chǎn)業(yè)指標(biāo)共5個(gè)維度提出未來三年的建設(shè)目標(biāo)。5大指標(biāo)均為爆發(fā)式擴(kuò)張,其中機(jī)架規(guī)模從10.8萬架提高到80萬架,三年時(shí)間擴(kuò)張達(dá)7倍;算力總規(guī)模從0.81 EFLOPS提高至10 EFLOPS,擴(kuò)張超11倍。
同時(shí),AI計(jì)算需要多元異構(gòu)算力提供支持,將極大拉動GPGPU、AISC等AI芯片的需求。中國AI芯片市場規(guī)模有望快速增長,據(jù)艾瑞咨詢預(yù)測2027年將達(dá)到2164億元,國內(nèi)相關(guān)企業(yè)堅(jiān)持迭代升級,其產(chǎn)品性能日益提升,有望獲得更多市場份額,實(shí)現(xiàn)國產(chǎn)替代。另外,隨著大模型的成熟部署,對性能要求稍低的推理芯片的占比將日益提升,也有益于國產(chǎn)AI芯片占比提升。
回顧歷史,人類社會目前經(jīng)歷了三次重大的產(chǎn)業(yè)變革:蒸汽時(shí)代、電氣時(shí)代、信息時(shí)代,其分別對應(yīng)了18世紀(jì)60年代末期英國人詹姆斯·瓦特制造的第一代具有實(shí)用價(jià)值的蒸汽機(jī)、美國在19世紀(jì)60年代實(shí)現(xiàn)了電力的廣泛應(yīng)用以及電燈被發(fā)明、1946年美國制造出人類第一臺二進(jìn)制計(jì)算機(jī)。每一次的產(chǎn)業(yè)革命都具有幾個(gè)共通點(diǎn),首先均有標(biāo)志性的產(chǎn)品面世,其次持續(xù)時(shí)間較長以及對于世界發(fā)展影響深遠(yuǎn)。
如今,人類社會或已處在人工智能時(shí)代的臨門一腳。2022年11月,ChatGPT的發(fā)布讓世界看到了無限的可能性,這僅僅只是“智能革命”的起點(diǎn),未來或?qū)⒊尸F(xiàn)出各行業(yè)各接納人工智能,人工智能助推世界發(fā)展的景象。
自2022年11月底以來,美國初創(chuàng)公司OpenAI發(fā)布的人工智能對話聊天機(jī)器人軟件(模型)ChatGPT迅速在社交媒體上走紅,短短5天,注冊用戶數(shù)就超過100萬,并在2個(gè)月內(nèi)突破1億,成為史上增長最快的消費(fèi)類應(yīng)用。
以ChatGPT為代表的AI大模型開啟了新一輪生產(chǎn)力革新的科技浪潮,大模型展現(xiàn)出了理解人類語言的潛力,顛覆過去互聯(lián)網(wǎng)發(fā)展中的許多業(yè)態(tài),并對實(shí)體經(jīng)濟(jì)和產(chǎn)業(yè)發(fā)展產(chǎn)生深遠(yuǎn)的影響。也因此,GPT被微軟創(chuàng)始人比爾·蓋茨評價(jià)為自圖形界面以來最重要的技術(shù)進(jìn)步,被英偉達(dá)創(chuàng)始人黃仁勛稱作是人工智能領(lǐng)域的iPhone時(shí)刻。
ChatGPT使得人與機(jī)器可以直接對話,機(jī)器能夠理解人復(fù)雜的意圖并能夠做出恰當(dāng)?shù)姆磻?yīng),人與機(jī)器不再局限于簡單的指令式交互,可以流利地與機(jī)器對話,進(jìn)行復(fù)雜的交互。機(jī)器可以理解人復(fù)雜的意圖,輔助人類干更多的工作,人類生產(chǎn)力將會大幅提高,個(gè)人AI時(shí)代即將到來。從歷史經(jīng)驗(yàn)來看,新一輪交互革命引發(fā)的浪潮高度與速度都會遠(yuǎn)超上一代,目前個(gè)人AI時(shí)代仍處于萌芽狀態(tài),未來給人類社會帶來的改變不可估量。
同時(shí),ChatGPT也引發(fā)了國內(nèi)外大廠爭相布局,海外方面微軟、谷歌、亞馬遜等大廠均采取投資或商用的方式與OpenAI保持緊密合作,國內(nèi)方面騰訊、科大訊飛、京東等公司先后宣布與ChatGPT結(jié)合上線的業(yè)務(wù)線,百度、阿里巴巴、昆侖萬維已發(fā)或籌備類ChatGPT產(chǎn)品。
國外方面,Meta于近日發(fā)布圖像分割基礎(chǔ)模型SAM(Segment Anything Model)。SAM模型能夠在未經(jīng)過同類數(shù)據(jù)訓(xùn)練的情況下,自動分割圖像中的所有內(nèi)容,自動根據(jù)提示詞進(jìn)行圖像分割。
SAM的發(fā)布堪稱圖像識別行業(yè)的“GPT-3”時(shí)刻。國盛證券表示,圖像識別與分割是當(dāng)前許多智能化場景的基礎(chǔ)。例如智能駕駛中就需要對攝像頭呈現(xiàn)出的圖像進(jìn)行分割與識別,從而讓車輛做出反應(yīng)。醫(yī)學(xué)影像診斷中需要對病變位置進(jìn)行分割來進(jìn)行判斷。過去,圖像分割往往只能通過對預(yù)先打包的數(shù)據(jù)進(jìn)行訓(xùn)練,并針對海量的特定場景進(jìn)行調(diào)優(yōu),效率和成本均不占優(yōu)。此次Meta發(fā)布的SAM模型,能使得AI通過已有數(shù)據(jù)的訓(xùn)練,獲得面對未知內(nèi)容的自動識別能力。
國盛證券認(rèn)為,可以把這個(gè)過程比作人類的視覺,人類所擁有看見新事物時(shí)自動處理并理解的能力。這將改變傳統(tǒng)的圖像識別訓(xùn)練模式,加快圖像識別行業(yè)的發(fā)展。
資料來源:IDC,民生證券研究院
資料來源:IDC,民生證券研究院
視覺大模型,算力要先行。相較于傳統(tǒng)的圖像識別解決方案,SAM更加偏向于LLM模型(大型語言模型)的模式,即通過海量的預(yù)先訓(xùn)練與擴(kuò)大模型參數(shù),來使得模型獲得自主識別和學(xué)習(xí)能力,最終實(shí)現(xiàn)圖像“AGI”。這類模式對于算力基礎(chǔ)設(shè)施的需求程度遠(yuǎn)大于傳統(tǒng)的小模型或者垂直模型,同時(shí)圖像模型包含的數(shù)據(jù)量更大,訓(xùn)練過程中需要的計(jì)算能力,通信能力和存儲能力相較于文字模型更多。因此,視覺大模型的前提是海量的算力基建,算力的重要性在LLM模式邁入圖像領(lǐng)域時(shí)被再度提升。
國內(nèi)方面,以百度為代表的科技公司主導(dǎo)國內(nèi)AI基礎(chǔ)生態(tài)是大勢所趨。在這一生態(tài)下,一批基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司將在文字、圖像、音視頻生成、數(shù)字人、3D生成等領(lǐng)域大顯身手,“AI+”應(yīng)用端有望呈現(xiàn)百花齊放。
4月10日,商湯科技發(fā)布“日日新”大模型體系,含自然語言生成、照片生成服務(wù)、感知模型預(yù)標(biāo)注、模型研發(fā)。1800億參數(shù)中文語言大模型應(yīng)用平臺“商量”支持超長文本知識理解,支持問答、理解與生成等中文語言能力。
而商湯科技下一代軟件開發(fā)范式是AI for AI,代碼=80% AI生成+20%人工。超10億參數(shù)自研文生圖生成模型“秒畫”,支持二次元等多種生成風(fēng)格。單卡A100支持,2秒生成1張512K分辨率的圖片。用戶可基于單卡A100自訓(xùn)練。基于平臺發(fā)布的模型,可設(shè)置to B服務(wù)API(應(yīng)用程序編程接口),結(jié)合商湯大算力對外提供服務(wù)。
數(shù)據(jù)、算力與算法是人工智能時(shí)代的三大基石,三者相互促進(jìn)帶動AI+應(yīng)用快速落地,大語言模型在豐富的場景中帶動AIGC類應(yīng)用全面發(fā)展,開啟了新一輪人工智能創(chuàng)新周期,將帶動算力、服務(wù)器、通信等多領(lǐng)域的發(fā)展。
AI奇點(diǎn)的到來也將會成就算力領(lǐng)域的黃金時(shí)代。
算力是指計(jì)算機(jī)系統(tǒng)能夠完成的計(jì)算任務(wù)量,通常用來描述計(jì)算機(jī)的處理能力。算力的單位通常采用FLOPS(Floating Point Operations Per Second)表示每秒鐘能夠完成的浮點(diǎn)運(yùn)算或指令數(shù)。以英偉達(dá)在2020年發(fā)布的A100產(chǎn)品為例,根據(jù)英偉達(dá)官方介紹,A100的理論浮點(diǎn)運(yùn)算性能可以達(dá)到19.5 TFLOPS,即每秒195萬億次浮點(diǎn)運(yùn)算。
算力可分為通用算力、智能算力以及超算算力,對應(yīng)著三種計(jì)算模式:基礎(chǔ)計(jì)算、智能計(jì)算以及超級計(jì)算。不同的場景所需的算力種類不同,其對應(yīng)的計(jì)算精度也不盡相同。
AI大模型是“大數(shù)據(jù)+大算力+強(qiáng)算法”結(jié)合的產(chǎn)物,凝聚了大數(shù)據(jù)內(nèi)在精華的“隱式知識庫”,希望邏輯結(jié)構(gòu)能夠自發(fā)地從模型的訓(xùn)練過程中涌現(xiàn)。AI大模型包含了“預(yù)訓(xùn)練”和“大模型”兩層含義,即模型在大規(guī)模數(shù)據(jù)集上完成了預(yù)訓(xùn)練后形成特征和規(guī)則,無需或僅需要少量數(shù)據(jù)的微調(diào),就能直接支撐各類應(yīng)用。
人工智能實(shí)現(xiàn)方法之一為機(jī)器學(xué)習(xí),而深度學(xué)習(xí)是用來實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù),通常可分為“訓(xùn)練”和“推理”兩個(gè)階段。訓(xùn)練階段:需要基于大量的數(shù)據(jù)來調(diào)整和優(yōu)化人工智能模型的參數(shù),使模型的準(zhǔn)確度達(dá)到預(yù)期,核心在于算力;推理階段:訓(xùn)練結(jié)束后,建立的人工智能模型相可用于推理或預(yù)測待處理輸入數(shù)據(jù)對應(yīng)的輸出(例如給定一張圖片,識別該圖片中的物體),這個(gè)過程為推理階段,對單個(gè)任務(wù)的計(jì)算能力不及訓(xùn)練,但總計(jì)算量也相當(dāng)可觀。
比于傳統(tǒng)AI算法,大模型在參數(shù)規(guī)模上得到大幅提升,參數(shù)一般達(dá)到千億甚至萬億規(guī)模。例如OpenAI的GPT系列,最開始的GPT-1擁有1.17億個(gè)參數(shù),到GPT-3的參數(shù)已經(jīng)到達(dá)1750億個(gè),而相應(yīng)的能力也得到大幅提升。
GPT-3開啟了大模型時(shí)代。GPT-3使用了大量的語料庫進(jìn)行預(yù)訓(xùn)練,使其能夠理解語言的規(guī)則和模式,并生成與輸入文本相關(guān)的自然語言文本,GPT-3的主要特點(diǎn)是它具有大規(guī)模的預(yù)訓(xùn)練模型,而同時(shí)大規(guī)模的訓(xùn)練模型與之對應(yīng)的便是龐大的算力需求。
根據(jù)OpenAI團(tuán)隊(duì)成員2020年發(fā)表的論文《Language Models are Few-Shot Learners》,GPT-3模型擁有約1750億個(gè)參數(shù),這使得GPT-3擁有其他較少參考量模型來說更高的準(zhǔn)確性。同時(shí)基于1750億個(gè)參數(shù)的模型僅需少量的樣本訓(xùn)練,就能夠接近于BETR模型使用大量樣本訓(xùn)練后的效果。
大模型無論在性能還是在學(xué)習(xí)能力上,相較于其他模型都具備明顯優(yōu)勢,未來或?qū)⒊蔀樾袠I(yè)趨勢。伴隨大模型的明顯優(yōu)勢,與之而來的則是對于算力要求的顯著提升。以GPT-3為例,如果以英偉達(dá)旗艦級GPU產(chǎn)品A100對其進(jìn)行訓(xùn)練,1024塊A100卡需要耗費(fèi)超過1個(gè)月(大于30天),按比例可以計(jì)算出,如果需要單日完成訓(xùn)練,需要的A100數(shù)量則將超過30000塊。
OpenAl的數(shù)據(jù)也顯示,從2012年到2020年,其算力消耗平均每3.4個(gè)月就翻倍一次,8年間算力增長了30萬倍。OpenAI首席執(zhí)行官Sam Altman接受公開采訪表示,GTP-4參數(shù)量為GTP-3的20倍,需要的計(jì)算量為GTP-3的10倍;GTP-5在2024年底至2025年發(fā)布,它的參數(shù)量為GTP-3的100倍,需要的計(jì)算量為GTP-3的200-400倍。
此外,AI時(shí)代算力的增長也遠(yuǎn)遠(yuǎn)超過了摩爾定律每18個(gè)月翻番的速率,根據(jù)中國信息通信研究院的估算,2021年全球超算算力規(guī)模大約為14EFLOPS,預(yù)測到2030年全球超算算力將達(dá)到0.2ZFLOPS,平均年增速超過34%。
而ChatGPT僅僅是AI大規(guī)模應(yīng)用的開始,更多的AI應(yīng)用尚在路上,海量的數(shù)據(jù)將會產(chǎn)生且非結(jié)構(gòu)化數(shù)據(jù)居多,這些數(shù)據(jù)需要更大帶寬的網(wǎng)絡(luò)設(shè)備進(jìn)行傳輸,更多的AI算力進(jìn)行處理。
AI滲透千行百業(yè),拉動智能算力規(guī)模高速增長。2022年,各行各業(yè)的AI應(yīng)用滲透度都呈不斷加深的態(tài)勢,尤其是在金融、電信、制造以及醫(yī)療領(lǐng)域,為實(shí)現(xiàn)業(yè)務(wù)增長、保持強(qiáng)大競爭力、從而占據(jù)更大的市場份額,企業(yè)紛紛入局AI領(lǐng)域,通過新技術(shù)提升傳統(tǒng)業(yè)務(wù)用戶體驗(yàn),人工智能應(yīng)用增長迅速。
據(jù)IDC和浪潮信息聯(lián)合發(fā)布的《2022-2023中國人工智能計(jì)算力發(fā)展評估報(bào)告》,預(yù)計(jì)到2023年年底,中國將有50%的制造業(yè)供應(yīng)鏈環(huán)節(jié)采用人工智能技術(shù)實(shí)現(xiàn)業(yè)務(wù)體驗(yàn)提升。在未來,隨著AI技術(shù)對傳統(tǒng)行業(yè)賦能作用日益凸顯,催生出更大智算需求成為必然。
顯然,算力已成為數(shù)字化時(shí)代的關(guān)鍵生產(chǎn)要素。越來越多的國家會認(rèn)識到算力對宏觀經(jīng)濟(jì)的重要性,算力資本與物質(zhì)資本形成互補(bǔ)效應(yīng),共同促進(jìn)GDP增長,算力勢必會成為各國未來主要的角逐點(diǎn)。
隨著全球數(shù)字化進(jìn)程的全面開啟,算力作為重要支持,賦能作用已經(jīng)有所顯現(xiàn)?!?021-2022全球計(jì)算力指數(shù)評估報(bào)告》的評估結(jié)果顯示,15個(gè)重點(diǎn)國家的計(jì)算力指數(shù)平均每提高1點(diǎn),國家的數(shù)字經(jīng)濟(jì)和GDP將分別增長3.5‰和1.8‰,并預(yù)計(jì)該趨勢在2021-2025年將繼續(xù)保持。
隨著全球數(shù)字化進(jìn)程的推進(jìn),云計(jì)算、人工智能、無人駕駛、AR/VR等新興數(shù)字科技產(chǎn)業(yè)蓬勃發(fā)展,全球數(shù)據(jù)總量呈現(xiàn)爆發(fā)式增長。據(jù)IDC預(yù)測,2021-2025年,全球新增和復(fù)制的數(shù)據(jù)量復(fù)合增長率達(dá)到23%,與此同時(shí),全球算力規(guī)模也在同步高增長。根據(jù)華為的預(yù)測,到2030年全球通用計(jì)算算力將達(dá)3.3 ZFLOPS(FP32,每秒十萬億億次浮點(diǎn)計(jì)算),AI計(jì)算算力將達(dá)到105 ZFLOPS(FP16),增長500倍。
在2022世界人工智能大會上,華為輪值董事長胡厚崑做出了上述預(yù)測,他提議“AI先行”,讓國家的算力網(wǎng)絡(luò)的建設(shè)從這個(gè)最大的增量開始,通過新建人工智能計(jì)算中心,形成人工智能算力的網(wǎng)絡(luò),也為國家推行東數(shù)西算的戰(zhàn)略的落地先行先試。他大膽預(yù)測,未來,算力網(wǎng)絡(luò)將像電網(wǎng)、通訊網(wǎng)、高鐵一樣,會成為國家新的基礎(chǔ)設(shè)施,為國家整體經(jīng)濟(jì)的發(fā)展提供強(qiáng)大的動力。
隨著數(shù)字化進(jìn)程推進(jìn),算力需求持續(xù)增長,數(shù)據(jù)中心的市場規(guī)模不斷擴(kuò)大。國內(nèi)外云計(jì)算龍頭企業(yè)亞馬遜、微軟、谷歌等紛紛加大資本開支,主要用于數(shù)據(jù)中心基礎(chǔ)設(shè)施的建設(shè)。服務(wù)器作為數(shù)據(jù)中心建設(shè)成本的最大部分,市場規(guī)??焖贁U(kuò)張。
東吳證券表示,ChatGPT引爆的AI浪潮將拉動云服務(wù)器數(shù)量的增長,其國內(nèi)相關(guān)供應(yīng)廠商將有望受益于下游AI+級應(yīng)用所帶來的算力需求增長,國內(nèi)云服務(wù)器與算力相關(guān)廠商有望直接受益。
數(shù)據(jù)海量增加,算法模型愈加復(fù)雜,應(yīng)用場景的深入和發(fā)展,帶來了對算力需求的快速提升。
根據(jù)IDC測算,國內(nèi)智能算力規(guī)模正在高速增長,2021年中國智能算力規(guī)模達(dá)155.2 EFLOPS,2022年智能算力規(guī)模將達(dá)到268.0 EFLOPS,預(yù)計(jì)到2026年智能算力規(guī)模將進(jìn)入ZFLOPS級別,達(dá)到1271.4 EFLOPS。2021-2026年期間,預(yù)計(jì)中國智能算力規(guī)模年復(fù)合增長率達(dá)52.3%。通用算力規(guī)模也正在高速增長,根據(jù)IDC測算,2021年中國通用算力規(guī)模達(dá)47.7 EFLOPS,預(yù)計(jì)到2026年通用算力規(guī)模將達(dá)到111.3 EFLOPS。2021-2026年期間,預(yù)計(jì)中國通用算力規(guī)模年復(fù)合增長率為18.5%。
目前,AI服務(wù)器通常選用CPU和加速芯片組來滿足其龐大算力需求,其中加速芯片包括GPU、FPGA、ASIC等邏輯芯片,其中GPU由于其具有最強(qiáng)的計(jì)算能力同時(shí)具備深度學(xué)習(xí)等能力,成為服務(wù)器中加速芯片的首選。
根據(jù)中商產(chǎn)業(yè)研究院數(shù)據(jù),2021年全球服務(wù)器出貨量達(dá)1315萬臺,同比增長7.8%,對應(yīng)全球市場規(guī)模達(dá)995億美元。根據(jù)Counterpoint預(yù)計(jì),2022年全球服務(wù)器市場規(guī)模有望達(dá)到1117億美元,同比增長17.0%。預(yù)計(jì)云服務(wù)提供商數(shù)據(jù)中心擴(kuò)張?jiān)鲩L驅(qū)動力主要來自于汽車、5G、云游戲和高性能計(jì)算。
根據(jù)TrendForce數(shù)據(jù),截至2022年全球搭載GPGPU的AI服務(wù)器(推理)出貨量占整體服務(wù)器比重約1%,同時(shí)TrendForce預(yù)測2023年伴隨AI相關(guān)應(yīng)用加持,年出貨量增速達(dá)到8%,2022-2026年CAGR為10.8%。
根據(jù)IDC發(fā)布的《全球人工智能市場半年度追蹤報(bào)告》顯示,2021年全球人工智能服務(wù)器市場規(guī)模達(dá)156.3億美元,約合人民幣1045億元,全球年度人工智能服務(wù)器市場首次突破千億元人民幣,同比2020年增速達(dá)39%。其中,浪潮信息、戴爾、HPE分別以20.9%、13.0%、9.2%的市占率位列前三,三家廠商總市場份額占比達(dá)43.1%。人工智能服務(wù)器市場預(yù)計(jì)將繼續(xù)高速增長,預(yù)計(jì)2026年全球人工智能服務(wù)器市場規(guī)模將達(dá)到347.1億美元,5年復(fù)合增長率為17.3%。
資料來源:Tractica、寒武紀(jì)招股書,民生證券研究院
資料來源:寒武紀(jì)招股書,民生證券研究院
國內(nèi)市場方面,根據(jù)IDC數(shù)據(jù),2021年中國人工智能服務(wù)器市場規(guī)模達(dá)到59.2億美元,與2020年相比增長68.2%,其中,浪潮信息、新華三、寧暢、安擎、華為等諸多中國廠商正加速推動人工智能基礎(chǔ)設(shè)施產(chǎn)品的優(yōu)化更新。預(yù)計(jì)到2026年,中國人工智能服務(wù)器市場規(guī)模將達(dá)到123.4億美元。
安信證券表示,隨著ChatGPT模型的不斷升級,其參數(shù)量和模型規(guī)模也不斷增大,因此對計(jì)算資源的需求也越來越高。尤其是在推理過程中,需要將模型加載到計(jì)算節(jié)點(diǎn)上進(jìn)行運(yùn)算,因此需要高性能的計(jì)算設(shè)備來支持模型的推理。同時(shí),由于ChatGPT模型需要進(jìn)行海量的預(yù)訓(xùn)練和微調(diào),因此需要大量的算力資源來支持這些任務(wù)。ChatGPT的發(fā)展將帶來算力需求的大幅提升。
經(jīng)安信證券測算,到2024年底,若ChatGPT每日用戶數(shù)量達(dá)5億人,則需要23萬臺服務(wù)器;若用戶數(shù)量達(dá)10億人,則需要46萬臺服務(wù)器。2022-2024年CAGR分別達(dá)51.7%、114.5%。
隨著GPT模型在各個(gè)領(lǐng)域的應(yīng)用越來越廣泛,對算力的需求也在不斷增加。一方面,由于GPT模型的參數(shù)量越來越大,每次訓(xùn)練需要的算力也越來越大;另一方面,GPT模型的應(yīng)用場景也在不斷拓展,例如自然語言處理、計(jì)算機(jī)視覺、語音識別等領(lǐng)域,這些領(lǐng)域?qū)λ懔Φ男枨笠苍絹碓礁?。預(yù)計(jì)未來每日訪客數(shù)量將有巨大提升空間,算力需求短期內(nèi)有較大提升空間,AI服務(wù)器數(shù)量有較大增長空間。
AI芯片是提供算力的基礎(chǔ),包括人工智能芯片、服務(wù)器、計(jì)算架構(gòu)、算法及應(yīng)用等方面。
全球人工智能技術(shù)發(fā)展逐漸成熟,數(shù)字化基礎(chǔ)設(shè)施不斷建設(shè)完善,推動全球人工智能芯片市場高速增長。IDC全球范圍調(diào)研顯示,人工智能芯片搭載率(attach rate)將持續(xù)增高。根據(jù)Tractica、寒武紀(jì)招股書相關(guān)數(shù)據(jù),全球人工智能芯片2022年市場規(guī)模預(yù)計(jì)約395億美元,預(yù)計(jì)到2025年將達(dá)到726億美元,年復(fù)合增長率達(dá)到22%。
國內(nèi)市場方面,隨著大數(shù)據(jù)的發(fā)展和計(jì)算能力的提升,根據(jù)寒武紀(jì)招股書,2022年中國人工智能芯片市場規(guī)模預(yù)計(jì)達(dá)368億元,預(yù)計(jì)2024年市場規(guī)模將達(dá)到785億元,復(fù)合增速有望達(dá)到46%。
根據(jù)IDC數(shù)據(jù),2021年中國AI芯片市場中,GPU的市場占有率近90%。因此,GPU也成為算力的核心硬件。
GPU是圖形處理器的簡稱,它是一種專門用于處理圖形、視頻、游戲等高性能計(jì)算的硬件設(shè)備。GPU相對于傳統(tǒng)的中央處理器(CPU)而言,其擁有更多的計(jì)算核心和更快的內(nèi)存帶寬,能夠大幅度提高計(jì)算效率和圖形渲染速度。
現(xiàn)階段,隨著例如英偉達(dá)A100、H100等型號產(chǎn)品的發(fā)布,GPU在算力方面的優(yōu)勢相較于其他硬件具有較大優(yōu)勢,GPU的工作也從一開始的圖形處理逐步轉(zhuǎn)化為計(jì)算,成為最適合支撐人工智能訓(xùn)練和學(xué)習(xí)的硬件。
國盛證券認(rèn)為,其原因主要在于一是擁有更多處理單元:GPU相比于CPU等其他硬件有更多的處理單元(核心數(shù)更多),因此可以并行處理更多的數(shù)據(jù)。主要系GPU最初是為了圖形渲染而設(shè)計(jì)的,而圖形渲染涉及的計(jì)算是高度并行化的。這種并行化的特性使GPU非常適合進(jìn)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)這樣的大規(guī)模數(shù)據(jù)并行計(jì)算。
二是具有更高的內(nèi)存帶寬和更大的內(nèi)存容量:在進(jìn)行深度學(xué)習(xí)等計(jì)算時(shí),需要大量的內(nèi)存和高速的內(nèi)存帶寬來存儲和處理海量數(shù)據(jù)。GPU相比于其他硬件(如CPU),具有更高的內(nèi)存帶寬和更大的內(nèi)存容量,可以更有效地存儲和處理數(shù)據(jù),從而提高計(jì)算速度。
三是具有專門的計(jì)算單元:相較于其他硬件,GPU具有例如張量核心和矩陣乘法等計(jì)算單元,可以更快地執(zhí)行常見的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)操作:如卷積和矩陣乘法。這些計(jì)算單元與通用計(jì)算單元相比,具有更高的效率和更快的速度。
基于上述優(yōu)勢,通用圖形處理單元(GPGPU)也因運(yùn)而生,其主要利用GPU的功能來執(zhí)行CPU的任務(wù),雖然在設(shè)計(jì)初期是為了更好地圖形處理,但是多內(nèi)核多通道的設(shè)計(jì)使其非常適合科學(xué)計(jì)算,發(fā)展至今GPGPU也成為了專為計(jì)算而設(shè)計(jì)的硬件。
GPU市場規(guī)模的大小取決于多種因素,其中游戲和娛樂市場一直是GPU市場的主要驅(qū)動力,因?yàn)檫@些領(lǐng)域需要高性能的GPU來支持更高質(zhì)量的游戲畫面和娛樂內(nèi)容。同時(shí)人工智能和機(jī)器學(xué)習(xí)的發(fā)展對GPU市場也有著巨大的影響,因?yàn)檫@些技術(shù)需要大量的計(jì)算能力,而GPU可以提供比CPU更高的效率。此外,科學(xué)和研究領(lǐng)域的需求以及新興市場(如游戲機(jī)和數(shù)據(jù)中心)也對GPU市場的規(guī)模產(chǎn)生了影響。根據(jù)Verified Market Research的數(shù)據(jù),2021年全球GPU市場規(guī)模為334.7億美元,預(yù)計(jì)到2030年將達(dá)到4473.7億美元,期間CAGR達(dá)到33.3%。
目前,GPU在AI服務(wù)器中價(jià)值量占比接近50%。據(jù)國盛證券測算,以英偉達(dá)的DGX A100為例,其搭載了8張A100 Tensor GPU,根據(jù)新浪科技數(shù)據(jù),DGX A100售價(jià)約為19.9萬美元; A100 Tensor價(jià)格為1.00萬-1.20萬美元。按照1.20萬美元售價(jià)計(jì)算可得出GPU在DGX A100價(jià)值量占比約為48.24%。
根據(jù)TrendForce的預(yù)計(jì),2023年全球AI服務(wù)器(推理)出貨大約在14.4萬臺,到2026年預(yù)計(jì)實(shí)現(xiàn)出貨量20.0萬臺。假設(shè)訓(xùn)練AI服務(wù)器和推理AI服務(wù)器的比例為1:4,則可以得到2023年、2026年訓(xùn)練服務(wù)器的數(shù)量大約為3.60萬、5.00萬臺。由于兩種AI 服務(wù)器對應(yīng)的模型訓(xùn)練階段不同,假設(shè)推理AI服務(wù)器和訓(xùn)練AI服務(wù)器使用的GPU數(shù)量分別為4張和8張,則可以計(jì)算出2023年、2026年全球AI服務(wù)器領(lǐng)域所需GPU數(shù)量約為86.4萬張和120萬張,以A100 Tensor約1.20萬美元的價(jià)格作為參考計(jì)算出2023年、2026年AI服務(wù)器所需GPU的價(jià)值分別為103.7億美元和144.0 億美元。
此外,汽車智能化也將帶動GPU的算力需求。輔助駕駛成為汽車研發(fā)的重點(diǎn)方向,L1至L5級別越高自動化水平越高,對于算力的需求也隨之大幅提升。為了實(shí)現(xiàn)L2或者更高等級的自動駕駛,往往需要部署如攝像頭、激光雷達(dá)在內(nèi)的多種傳感器,例如Tesla Model 3車型中包括了8個(gè)攝像頭和12個(gè)超聲波雷達(dá)。多傳感器帶來的是龐大的數(shù)據(jù)處理需求,伴隨攜帶自動駕駛功能的汽車銷量持續(xù)提升,相關(guān)算力硬件需求也逐步擴(kuò)大。
目前,英偉達(dá)自動駕駛平臺NVIDIA DRIVE Thor能夠提供2000 TFLOPS算力,為自動駕駛、車載AI、停車輔助等多功能提供所需算力需求。
目前,全球GPU市場基本被海外企業(yè)壟斷。全球范圍內(nèi),人工智能、云端計(jì)算和獨(dú)立GPU主要為英偉達(dá)主導(dǎo),旗下深度學(xué)習(xí)旗艦GPU產(chǎn)品A100和H100最高浮點(diǎn)算力分別實(shí)現(xiàn)19.5 TFLOPS和67 TFLOPS;PC GPU由于涵蓋集成GPU,英特爾由于為全球CPU龍頭,使其在PC GPU中份額最高。
根據(jù)Jon Peddie Research數(shù)據(jù),2022年四季度PC GPU中,英特爾、英偉達(dá)、AMD份額分別為71%、17%、12%;2022年四季度獨(dú)立GPU中,英特爾、英偉達(dá)、AMD 份額分別為6%、85%、9%。
2022年10月,美國對中國半導(dǎo)體進(jìn)行三方面限制,在AI領(lǐng)域限制中國獲取等效8 Int 600 TOPS 算力的芯片。英偉達(dá)針對中國市場推出了符合新規(guī)的A800芯片,相比A100芯片,A800互聯(lián)標(biāo)準(zhǔn)由600GB/s降為400GB/s,國產(chǎn)大模型算力需求和國內(nèi)AI產(chǎn)業(yè)發(fā)展面臨阻礙。
高端型號產(chǎn)品的出口限制將在很大程度上影響國內(nèi)相關(guān)領(lǐng)域的發(fā)展,根據(jù)國盛證券的計(jì)算,GPT-3當(dāng)日完成訓(xùn)練需要的A100數(shù)量將超過3萬塊,國內(nèi)公司百度旗下大模型ERNIE3.0 Titan,參數(shù)量達(dá)到2600億,高于GPT-3的1750億,其所需的同規(guī)格GPU數(shù)量也將遠(yuǎn)大于GPT-3。同時(shí),未來AI倘若進(jìn)入大模型時(shí)代,相關(guān)算力需求將快速增加,屆時(shí)對于國產(chǎn)高算力GPU需求將進(jìn)一步提升, GPU國產(chǎn)化進(jìn)程迫在眉睫。
東吳證券表示,以GPU細(xì)分賽道來看,目前國內(nèi)自研GPU的領(lǐng)軍企業(yè)主要是寒武紀(jì)、景嘉微、華為昇騰等,其中成立最早的是景嘉微,主打產(chǎn)品有JH920獨(dú)立顯卡。行業(yè)內(nèi)專家稱,從產(chǎn)品參數(shù)來看,景嘉微的JH920的性能與英偉達(dá)在2016年發(fā)布的GTX 1050相仿,雖然僅相差6年,但考慮到模型與算力發(fā)展之迅速,整體而言國產(chǎn)GPU的現(xiàn)狀并不算樂觀,雖然在特殊領(lǐng)域可滿足部分的需求,但是在中高端領(lǐng)域及硬核的算力需求仍存在較長的追趕道路。
東方證券表示,人工智能一直是中美兩國科技競爭的重要領(lǐng)域,而中美在AI的三大技術(shù)數(shù)據(jù)、算法、算力中各有優(yōu)勢。中國的數(shù)據(jù)優(yōu)勢較為明顯,然而算法和智能算力卻明顯落后于美國。智能算力對于中國發(fā)展AI、數(shù)據(jù)要素以及社會全方位的發(fā)展都有著重大的戰(zhàn)略意義。
從智能算力總額來看,美、中處于領(lǐng)先地位。從人均智能算力的角度,中國仍處于全球中等水平。據(jù)《中國算力指數(shù)發(fā)展白皮書(2022)》,美、中的智能算力處于全球領(lǐng)先地位,分別占全球比重的45%和28%。然而從人均算力的高低來衡量,中國僅處于中等水平。據(jù)IMB研究發(fā)現(xiàn),人均算力的水平與一國的智能化水平高度相關(guān),中國積極發(fā)展智能算力、打造智算中心是打造國際競爭力、發(fā)展綜合國力的關(guān)鍵。
近年來,國家制定一系列政策,在全國范圍內(nèi)推動信息基礎(chǔ)設(shè)施建設(shè),智算中心的建設(shè)是其中的關(guān)鍵環(huán)節(jié)。2020年4月20日,國家發(fā)改委首次明確新型基礎(chǔ)設(shè)施范圍,將智能計(jì)算中心作為算力基礎(chǔ)設(shè)施的重要代表納入信息基礎(chǔ)設(shè)施范疇。2021年5月,國家發(fā)改委等四部門聯(lián)合發(fā)布了《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實(shí)施方案》,提出布局全國算力網(wǎng)絡(luò)樞紐節(jié)點(diǎn)。2022年2月17日,國家發(fā)改委、中央網(wǎng)信辦、工業(yè)和信息化部、國家能源局聯(lián)合印發(fā)通知,同意在京津冀、長三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏8地啟動建設(shè)國家算力樞紐節(jié)點(diǎn),并規(guī)劃了10個(gè)國家數(shù)據(jù)中心集群?!皷|數(shù)西算”工程正式全面啟動。而智算中心承載的以模型訓(xùn)練為代表的非實(shí)時(shí)性計(jì)算尤為適合“東數(shù)西算”。
隨著全國一體化算力網(wǎng)絡(luò)和“東數(shù)西算”工程的部署,中國智能計(jì)算中心也加快布局。根據(jù)國家信息中心與相關(guān)部門聯(lián)合發(fā)布的《智能計(jì)算中心創(chuàng)新發(fā)展指南》,當(dāng)前超過30個(gè)城市正在建設(shè)或提出建設(shè)智算中心,整體布局以東部地區(qū)為主,并逐漸向中西部地區(qū)拓展。根據(jù)ICPA智算聯(lián)盟統(tǒng)計(jì),截至2022年3月,全國已投運(yùn)的人工智能計(jì)算中心有近20個(gè),在建設(shè)的人工智能計(jì)算中心超20個(gè)。
另外,科技部出臺政策推動人工智能公共算力平臺建設(shè),要求在混合部署的公共算力平臺中,自主研發(fā)芯片所提供的算力標(biāo)稱值占比不低于60%,并優(yōu)先使用國產(chǎn)開發(fā)框架,使用率不低于60%,此舉將推動中國AI芯片等國產(chǎn)化進(jìn)程。
隨著智能計(jì)算資源需求的大幅增加,東方證券認(rèn)為 AI芯片、AI服務(wù)器以及云計(jì)算算力需求將持續(xù)提升,國產(chǎn)化替代有望加速。
AI計(jì)算需要多元異構(gòu)算力提供支持,將極大拉動GPGPU、AISC等AI芯片的需求。中國AI芯片市場規(guī)模有望快速增長,據(jù)艾瑞咨詢發(fā)布的《2022年中國人工智能產(chǎn)業(yè)研究報(bào)告(Ⅴ)》,預(yù)計(jì)2027年達(dá)到2164億元。目前,英偉達(dá)憑借其AI芯片的超高性能,占中國加速卡市場的80%以上。根據(jù)東方證券研報(bào),海光信息、寒武紀(jì)等巨頭堅(jiān)持迭代升級,其產(chǎn)品性能日益提升,有望獲得更多市場份額,實(shí)現(xiàn)國產(chǎn)替代。另外,隨著大模型的成熟部署,對性能要求稍低的推理芯片的占比將日益提升,也有益于國產(chǎn)AI芯片占比提升。
AI計(jì)算需求提升有望持續(xù)拉動AI服務(wù)器需求,國產(chǎn)AI服務(wù)器龍頭有望持續(xù)受益。相比于AI芯片,AI服務(wù)器的技術(shù)壁壘較低,浪潮信息、中科曙光等中國服務(wù)器廠商占領(lǐng)了AI服務(wù)器絕大部分市場,有望持續(xù)受益于智能算力需求提升。根據(jù)東方證券研報(bào),浪潮信息的AI服務(wù)器在世界市場和中國市場均蟬聯(lián)第一位,是AI服務(wù)器行業(yè)的頂尖巨頭。而中科曙光是高性能計(jì)算的龍頭,響應(yīng)國家號召建設(shè)曙光5A級智算中心,覆蓋全算力精度,賦能人工智能應(yīng)用場景落地。拓維信息和四川長虹則是華為的親密合作伙伴,依托“昇騰+鯤鵬”打造AI服務(wù)器。
隨著AI算法的計(jì)算需求不斷增加,將有越來越多的企業(yè)使用云計(jì)算平臺來滿足其計(jì)算需求,中立云計(jì)算廠商有望持續(xù)受益。云計(jì)算廠商可以為企業(yè)提供靈活的計(jì)算資源,幫助企業(yè)更好地管理其計(jì)算需求,提高其計(jì)算效率和靈活性,減少部署和管理本地計(jì)算基礎(chǔ)設(shè)施的復(fù)雜性。根據(jù)東方證券研報(bào),除了華為云等國內(nèi)外云計(jì)算巨頭,優(yōu)刻得、深桑達(dá)旗下中國電子云等第三方中立廠商也在積極參與AI云服務(wù),有望持續(xù)受益于AI算力需求的提升。一方面,這些廠商可以作為客戶除云大廠外的第二選擇。另外,這些廠商具有中立方的身份優(yōu)勢,不會和下游客戶產(chǎn)生競爭,更容易獲得客戶信任。