回顧我國傳統(tǒng)計算發(fā)展歷程,可以分兩個階段。一是在電子管、晶體管中小規(guī)模集成電路時代。我國元器件與國際相比有差距,但是還不太大,是量上的差別。當(dāng)時完全是基于國產(chǎn)的器件研制計算機(jī)的硬件系統(tǒng),同時自行研制軟件系統(tǒng)。當(dāng)時我國發(fā)展計算機(jī)的原則是:借助外援而不依靠外援,堅持獨立自主引進(jìn)技術(shù),不單純購買機(jī)器,有步驟地發(fā)展我國計算機(jī)事業(yè)。
當(dāng)集成電路進(jìn)入超大規(guī)模時代,我國在微處理器技術(shù)方面出現(xiàn)了質(zhì)的差距。為滿足發(fā)展需求,1981 年以后國家允許進(jìn)口配套的器材來組裝系統(tǒng)或者直接引進(jìn)計算機(jī)系統(tǒng)來解決應(yīng)用需求,這樣基于引進(jìn)的微處理器設(shè)計系統(tǒng)或者集成引進(jìn)系統(tǒng)來做開發(fā)應(yīng)用,就成為主要路徑。由于系統(tǒng)硬件退出了核心技術(shù),系統(tǒng)軟件也就失去了發(fā)展動力,大部分學(xué)校也把人才培養(yǎng)轉(zhuǎn)向了計算機(jī)應(yīng)用專業(yè)。特別是出現(xiàn)了軟硬聯(lián)盟、抱團(tuán)競爭的計算生態(tài)壟斷以后,我國幾次努力都未能改變傳統(tǒng)基礎(chǔ)計算平臺發(fā)展的被動局面。
回顧這段歷史,我想有幾點啟示。第一,使能技術(shù)、基礎(chǔ)平臺,決定了自主發(fā)展的基礎(chǔ)能力。第二,模型和算法創(chuàng)新,能夠牽引體系結(jié)構(gòu)的變革。第三,規(guī)模應(yīng)用是整個生態(tài)發(fā)展進(jìn)步的動力,技術(shù)的轉(zhuǎn)軌可以來創(chuàng)新發(fā)展的機(jī)遇。
智能計算帶來創(chuàng)新發(fā)展的機(jī)遇
大家都把這一次人工智能的興起歸結(jié)為深度學(xué)習(xí)+大規(guī)模計算+大數(shù)據(jù)(算法、算力、數(shù)據(jù))。2006 年被視為深度學(xué)習(xí)元年,雖然神經(jīng)網(wǎng)絡(luò)概念較早就提出來了。深度學(xué)習(xí)之所以成功的重要背景是,計算能力達(dá)到了可實用要求,互聯(lián)網(wǎng)的發(fā)展又帶來了大量可用的數(shù)據(jù)。這一次人工智能的興起有一個重要特點。前兩次更多是由學(xué)術(shù)主導(dǎo),學(xué)術(shù)界呼吁政府和投資人投資。而本次主要是商業(yè)主導(dǎo),政府和投資人主動向熱點領(lǐng)域投入??梢哉f,這一次的興起是人工智能技術(shù)真正與產(chǎn)業(yè)結(jié)合,飛入尋常百姓家。
人工智能或說智能計算也存在生態(tài)問題。智能計算分為兩個相對獨立的階段,一是訓(xùn)練學(xué)習(xí)階段,二是推理應(yīng)用階段。智能計算平臺可以分為兩大類,一個是云側(cè)平臺,解決模型的訓(xùn)練(學(xué)習(xí))及海量智能信息服務(wù)(推理)問題,一個端側(cè)平臺,百花齊放,主要解決推理應(yīng)用。
智能計算模式相對比較少,精度要求相對低。深度學(xué)習(xí)算法集中在一些相對固定的操作模式,如向量、矩陣運算,在訓(xùn)練階段,單精度(32 位)或者半精度(16 位)就可以了,在推理階段,甚至可以到低值、二值。此外,智能計算可并行度高,目前神經(jīng)網(wǎng)絡(luò)同一層的計算可以完全并行,而且很多是規(guī)則的大數(shù)據(jù)流并行。
智能計算對體系結(jié)構(gòu)的要求
智能計算也對體系結(jié)構(gòu)提出了新的要求。比如,在云側(cè)的模型訓(xùn)練需要高效能大規(guī)模并行計算能力的支撐。特別是學(xué)習(xí)模型參數(shù)多、數(shù)據(jù)規(guī)模大、計算量大的時候。
在云側(cè),如果用推理應(yīng)用就需要高吞吐率、低延遲的服務(wù)計算模式支撐,滿足海量并發(fā)推理任務(wù)的服務(wù)質(zhì)量要求,對海量在線用戶的快速實時響應(yīng)。
端側(cè)的推理應(yīng)用需要小型化、高能效、低時延、傳感-計算-通信融合的體系架構(gòu)支撐。無人機(jī)/無人車/機(jī)器人等諸多設(shè)備,對時延要求非??量?。
當(dāng)前智能計算技術(shù)發(fā)展態(tài)勢主要有如下特征。
一、大家都在積極探索高效智能處理芯片體系結(jié)構(gòu)及實現(xiàn)技術(shù)。
總體上來講,專用的 ASIC 芯片具有一定優(yōu)勢。測試表明,專用 ASIC 的能效比(性能/瓦)明顯優(yōu)于 CPU 和 GPU。同時,ASIC 芯片發(fā)展前景也比較好,預(yù)計 2025 年市場規(guī)模將超過 CPU 和 GPU 的總和。
二、努力探索新型體系結(jié)構(gòu)。此外,還有探索高效好用的智能計算的軟件生態(tài),比如智能計算軟件框架,包括高效語言編譯、基礎(chǔ)算法庫等,努力打造軟硬一體的智能生態(tài)計算。
在云側(cè),計算機(jī)產(chǎn)業(yè)幾大優(yōu)勢企業(yè)正在競爭主導(dǎo)地位,比如谷歌的定制專用智能芯片 TPU,英特爾和微軟試圖采用 CPU+FPGA 爭奪市場,華為發(fā)布專用智能芯片昇騰 910。
在端側(cè),各大公司紛紛推出 ASIC 芯片架構(gòu),ARM、英特爾、蘋果、高通等企業(yè)在芯片上做出了很大的努力,中國企業(yè)的典型代表有華為、寒武紀(jì)。
同時,各公司紛紛開源智能計算軟件框架,當(dāng)前的態(tài)勢是群雄競爭,谷歌領(lǐng)跑。我前面講過,傳統(tǒng)計算已經(jīng)形成了軟硬件抱團(tuán)競爭的壟斷態(tài)勢,但是智能計算當(dāng)前的態(tài)勢是,軟硬件還相對獨立,尚未形成軟硬一體抱團(tuán)競爭的壟斷局面。
我國人工智能發(fā)展面臨大好機(jī)遇
我國應(yīng)用需求旺盛,應(yīng)用成果多。2018 年,中國人工智能企業(yè)數(shù)量在全球排名第二,是全球人工智能投融資規(guī)模最大的國家之一。同時,我們也擁有一支實力強的科技隊伍。AI Index 2018 顯示,我國在人工智能領(lǐng)域發(fā)表論文的數(shù)量已經(jīng)超過美國。人工智能領(lǐng)域的專利申請排名前十的國家,中國也是排在第一。
在基礎(chǔ)領(lǐng)域,我們也取得了可喜的成果。現(xiàn)在圍繞智能芯片的研發(fā),2018 年,中國有 7 家企業(yè)進(jìn)入全球排名的前 24 名。智能計算軟件框架,中國企業(yè)也有領(lǐng)頭,比如百度的 PaddlePaddle、騰訊的 Angel、阿里的 X-DeepLearning 等。我們有很好的起點。但是我們也面臨著嚴(yán)峻的挑戰(zhàn)。一是原始創(chuàng)新能力不足。我們的研究跟蹤多、創(chuàng)新少,量有優(yōu)勢、質(zhì)上明顯不夠。二是短板明顯。智能芯片產(chǎn)品主要面向推理,云側(cè)訓(xùn)練芯片競爭能力弱,高性能 GPU、FPGA 仍依靠引進(jìn)。三是從事技術(shù)平臺和處理器芯片的企業(yè)數(shù)量比較少。無論是在計算基礎(chǔ)平臺還是處理器芯片研制上,我們的企業(yè)占的比例都較少。四是應(yīng)用開發(fā)主要基于國外智能計算軟件框架之上。五是我國自主智能計算軟件框架的影響力與國際相比存在較大差距。聚集在上面的第三方應(yīng)用少,以自用為主。從 Github 活躍度上可以看到,百度 PaddlePaddle、騰訊 Angel、阿里 X-DeepLearning 與谷歌 TensorFlow 等差距較大。
除了以上幾點,最大的挑戰(zhàn)是,雖然我國軟硬件研發(fā)能力已有質(zhì)的提升,但研發(fā)產(chǎn)品的競爭力仍然不強。如果我們不抓住機(jī)遇,夯實基礎(chǔ),下大力氣去打造有競爭力的抱團(tuán)競爭的智能計算生態(tài),仍然只是注重近期效益,發(fā)展應(yīng)用,我們就有可能重蹈傳統(tǒng)計算產(chǎn)業(yè)的覆轍。一旦在人工智能領(lǐng)域、智能計算領(lǐng)域也形成若干個這樣的壟斷生態(tài),那我們又要變得被動。
如何應(yīng)對目前的艱難局面
對于如何應(yīng)對,我覺得有如下幾點思考。
一、學(xué)術(shù)界要面向智能計算挑戰(zhàn)問題,加大國內(nèi)外合作,持之以恒,以基礎(chǔ)理論、計算模型和算法上的創(chuàng)新突破,牽引體系結(jié)構(gòu)的創(chuàng)新。
二、產(chǎn)業(yè)界要推進(jìn)產(chǎn)業(yè)聯(lián)盟,發(fā)揮既有骨干企業(yè)優(yōu)勢,構(gòu)建上下游協(xié)同的產(chǎn)業(yè)鏈,集中力量打造我國有競爭力的智能計算生態(tài)。關(guān)鍵是集聚應(yīng)用、滾動發(fā)展、形成規(guī)模,規(guī)模越大,生態(tài)會越穩(wěn)定。
三、管理部門要綜合施策。一是激勵骨干企業(yè)加大對基礎(chǔ)平臺的投入;二是引導(dǎo)學(xué)術(shù)界、企業(yè)、應(yīng)用部門基于自主計算生態(tài)做研究和開發(fā);三是成立智能產(chǎn)業(yè)發(fā)展大基金,市場和政府協(xié)同,以目標(biāo)為導(dǎo)向,推動產(chǎn)學(xué)研聯(lián)合,特別是要關(guān)注當(dāng)前的一些小微創(chuàng)新。
四、教育部門要合理部署多層次人工智能領(lǐng)域人才培養(yǎng),在人工智能領(lǐng)域,從當(dāng)前來看,雖然大家都很重視,但無論是人才總數(shù)還是基礎(chǔ)人才數(shù)量,我國和國際都存在很大差距。
(本文根據(jù)盧錫城院士在第三屆世界智能大會上的演講整理而成,未經(jīng)本人確認(rèn)。)