孟醒
寒武紀(jì)作為地質(zhì)學(xué)上的概念,指的是生命大爆發(fā)的時(shí)代。而在2016年,這個(gè)古老的地質(zhì)科學(xué)概念,延展出一個(gè)新的科技內(nèi)涵——全球智能芯片的先行者。
在國(guó)際上,目前領(lǐng)先的科技公司中,有很多都是“管理+科技”的“雙駕馬車”創(chuàng)始人結(jié)構(gòu),比如蘋(píng)果、微軟、惠普、谷歌等。在中國(guó),有一家新興獨(dú)角獸高科技公司,他的兩位創(chuàng)始人,也是這種工作結(jié)構(gòu),而且這兩人還是親兄弟。這對(duì)于中國(guó)計(jì)劃生育時(shí)代出生的人來(lái)說(shuō),也許是獨(dú)一無(wú)二的,恐怕在世界范圍內(nèi)也屬鳳毛麟角。
他們是陳云霽與陳天石兄弟。
成長(zhǎng)為初
陳云霽與陳天石兄弟出生在在江西南昌的一個(gè)普通知識(shí)分子家庭。父親是電力工程師,母親是歷史老師。從知識(shí)背景來(lái)說(shuō),這是一個(gè)文理兼通的家庭。
這樣家庭的孩子,大多秉承父母的基因,在讀書(shū)學(xué)習(xí)上不存障礙,是“被鄰居羨慕的好學(xué)生”。1983年出生的哥哥陳云霽,9歲時(shí)就是南昌市第十中學(xué)的學(xué)生了。僅從年代來(lái)看,無(wú)疑是多次跳級(jí)了。他14歲入讀中國(guó)科學(xué)技術(shù)大學(xué)少年班,19歲轉(zhuǎn)入中科院計(jì)算所碩博連讀,成為當(dāng)時(shí)國(guó)產(chǎn)芯片“龍芯”研發(fā)團(tuán)隊(duì)中最年輕的成員,24歲順順當(dāng)當(dāng)取得計(jì)算機(jī)博士學(xué)位。25歲,陳云霽就已經(jīng)成為8核龍芯3號(hào)的主架構(gòu)師。筆者記得有一段時(shí)間,輿論曾對(duì)中科大少年班以“拔苗助長(zhǎng)”之類的批評(píng),而陳云霽卻是“小時(shí)了了,大未必佳”的反例。
在一個(gè)家庭里,如果有兄弟的話,哥哥的成長(zhǎng)往往對(duì)弟弟形成良性刺激,甚至讓后者亦步亦趨。相差兩歲的陳云霽、陳天石兄弟,所走過(guò)的道路更為典型,弟弟陳天石幾乎復(fù)制了哥哥的成長(zhǎng)道路,大學(xué)所讀的也是中科大少年班,畢業(yè)后也到了中科院計(jì)算所。
讀博士期間,陳云霽的研究方向是芯片,陳天石的主攻方向是人工智能,兄弟倆的共同興趣都是深度學(xué)習(xí)處理器,兄弟合璧劍指人工智能芯片。這樣,兄弟倆就成為了創(chuàng)業(yè)合伙人。2016年3月,陳云霽、陳天石合伙創(chuàng)立了寒武紀(jì)公司。此后,哥哥陳云霽仍在中科院計(jì)算所繼續(xù)進(jìn)行科研,但重點(diǎn)由學(xué)術(shù)研究轉(zhuǎn)向市場(chǎng)技術(shù)。而弟弟陳天石則出任寒武紀(jì)科技的CEO。
這樣的選擇與安排,緣于兄弟倆的迥異性格。陳云霽性格大膽,勇于嘗試,更利于科研創(chuàng)新。而陳天石性格穩(wěn)重,思慮縝密,更利于把握市場(chǎng)。性格上的互補(bǔ)形成創(chuàng)新沖鋒與踏實(shí)推進(jìn)的優(yōu)勢(shì)。用陳云霽的話說(shuō),性格的沖突往往導(dǎo)致?tīng)?zhēng)吵,但兄弟親情則融合掉爭(zhēng)吵帶來(lái)的沖突,最后妥協(xié)做出的決定,往往就是既能規(guī)避風(fēng)險(xiǎn),又有一定創(chuàng)新性的最佳選擇?!叭绻覀儎?chuàng)業(yè)能夠成功,這是一個(gè)很重要的決定性因素?!标愒旗V說(shuō)。陳天石則半開(kāi)玩笑地說(shuō):“如果我們不是兄弟,恐怕很難合作下去。”
兩人將自己創(chuàng)業(yè)公司的名字,選定為“寒武紀(jì)”。“寒武紀(jì)”,一個(gè)距今約5億年的地質(zhì)年代。正是在這個(gè)年代,地球生命開(kāi)始大爆發(fā)。而生命大爆發(fā)用達(dá)爾文的進(jìn)化論卻無(wú)法解釋,被稱為地質(zhì)懸案。不管怎么說(shuō),“寒武紀(jì)科技”都期望他們的主打產(chǎn)品人工智能處理器,能推動(dòng)人工智能快速發(fā)展,助力人類科技大爆發(fā)。
寒武紀(jì)科技成立不久,即推出了全球首款深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)處理器芯片1A,并在當(dāng)年就拿到了上億元訂單。
創(chuàng)新為基
通常,人們只看到了成果,而往往忽略了過(guò)程,就像深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)處理器芯片的問(wèn)世,同樣不可能是從天而降的。
寒武紀(jì)科技最早可以追溯到中國(guó)科學(xué)院計(jì)算技術(shù)研究所下的神經(jīng)網(wǎng)絡(luò)算法和芯片課題組。課題組的領(lǐng)導(dǎo)者就是陳云霽與陳天石。該課題組從2008年開(kāi)始研究,直到2012年才陸續(xù)發(fā)表研究成果。期間的這段時(shí)間,就是坐冷板凳。這再一次說(shuō)明沒(méi)有坐冷板凳的功夫,所謂成功都只能是“鏡花水月”。寒武紀(jì)的第一代芯片名為為DianNao,就是“電腦”的漢語(yǔ)拼音??梢韵胂筮@么一個(gè)場(chǎng)景,國(guó)外同行問(wèn)芯片的名字時(shí),陳氏兄弟的微笑回答。這個(gè)場(chǎng)景并不好笑,也并不是他們教人家漢語(yǔ),但無(wú)疑暗含著他們要讓人家認(rèn)識(shí)中國(guó)的企望。對(duì)于這一點(diǎn)筆者無(wú)法表達(dá)自己的感受。這款芯片主頻為0.98GHz,峰值性能達(dá)每秒4520億次神經(jīng)網(wǎng)絡(luò)基本運(yùn)算。它的平均性能超過(guò)當(dāng)時(shí)主流CPU的100倍,但功耗僅有十分之一。最新的第三代PuDianNao芯片的性能與主流GPGPU相當(dāng),但功耗僅有百分之一。第二代的名字是DaDianNao。2016年課題組提出的深度學(xué)習(xí)處理器指令集(指計(jì)算機(jī)芯片能讀懂的語(yǔ)言)DianNaoYu被計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域頂級(jí)國(guó)際會(huì)議ISCA2016所接受。模擬實(shí)驗(yàn)表明,相對(duì)于傳統(tǒng)的執(zhí)行x86指令集的芯片,“寒武紀(jì)”芯片在神經(jīng)網(wǎng)絡(luò)計(jì)算方面有兩個(gè)數(shù)量級(jí)的性能提升。
2014年3月,《Dian-Nao:一種小尺度的高吞吐率機(jī)器學(xué)習(xí)加速器》,在國(guó)際頂級(jí)學(xué)術(shù)會(huì)議ASPLOS上獲得了最佳論文獎(jiǎng)。這是中國(guó)也是亞洲科研機(jī)構(gòu)首次在計(jì)算機(jī)系統(tǒng)和高性能計(jì)算領(lǐng)域頂級(jí)國(guó)際會(huì)議上獲得最佳論文獎(jiǎng)。2014年12月,DaDianNao(又稱寒武紀(jì)2號(hào)神經(jīng)網(wǎng)絡(luò)處理器,面向大規(guī)模神經(jīng)網(wǎng)絡(luò)的應(yīng)用),榮獲2014年度Micro最佳論文。這是Micro自1963年創(chuàng)辦以來(lái),美國(guó)以外研究者第一次摘得這個(gè)獎(jiǎng)項(xiàng)。早在2007年,陳云霽博士畢業(yè)后,就進(jìn)入了龍芯研究團(tuán)隊(duì),并在中科院計(jì)算所胡偉武研究員指導(dǎo)下,開(kāi)始龍芯3號(hào)的總體設(shè)計(jì)。緣于龍芯3號(hào)的體系結(jié)構(gòu),由龍芯1號(hào)、2號(hào)的單核,升級(jí)為多核,陳云霽提出了一個(gè)新的體系結(jié)構(gòu),并據(jù)此在2008年創(chuàng)作了一篇論文。這篇論文最終被體系結(jié)構(gòu)領(lǐng)域三大旗艦會(huì)議HPCA錄用,這也是HPCA歷史上第一篇第一作者來(lái)自中國(guó)大陸的論文。2010年,陳天石到計(jì)算所工作后,兄弟兩人開(kāi)始合作研究神經(jīng)網(wǎng)絡(luò)處理器。最初,他們提出的一系列基于人工智能方法的處理器研發(fā)技術(shù),多次被體系結(jié)構(gòu)頂級(jí)會(huì)議拒絕。但這些挫折并沒(méi)有讓他們放棄已經(jīng)選定的科研方向,而是更加激發(fā)了他們的雄心,將研究工作朝著更深更透的目標(biāo)推進(jìn)。在基于半監(jiān)督學(xué)習(xí)的處理器結(jié)構(gòu)優(yōu)化方法的論文發(fā)表之后,相關(guān)研究論文相繼推出。作為一個(gè)轉(zhuǎn)折點(diǎn),這項(xiàng)研究成果被命名為“寒武紀(jì)1號(hào)”(面向神經(jīng)網(wǎng)絡(luò)的原型處理器),也就是“DianNao”。
截至目前,寒武紀(jì)在計(jì)算機(jī)體系結(jié)構(gòu)方面的系列技術(shù)成果已經(jīng)獲得國(guó)際四大頂級(jí)會(huì)議的認(rèn)可:ASPLOS上有兩篇,ISCA上有兩篇, MICRO與HPCA各有一篇。
對(duì)此,二陳在2014年5月刊發(fā)的《中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊》(第10卷第5期)上曾寫(xiě)道:
“從2008年到現(xiàn)在,我們已經(jīng)在體系結(jié)構(gòu)和人工智能的交叉研究方向上工作了6年。作為國(guó)際上為數(shù)不多的幾個(gè)長(zhǎng)期開(kāi)展此方向研究的團(tuán)隊(duì)之一,我們?cè)诓槐徽J(rèn)可中堅(jiān)持了下來(lái),并嘗試通過(guò)自己的努力來(lái)改善這個(gè)領(lǐng)域的環(huán)境(當(dāng)然近年來(lái)環(huán)境的改善也得益于深度學(xué)習(xí)的興起),最終得到了學(xué)術(shù)界一定程度的肯定?!?/p>
“經(jīng)過(guò)長(zhǎng)期的等待和努力,也許有一天,自己的研究方向就會(huì)成為熱點(diǎn)。到那時(shí),過(guò)去的一切坎坷都會(huì)被證明是值得的。”2014年的希望如今變成了現(xiàn)實(shí),寒武紀(jì)芯片的開(kāi)創(chuàng)性在智能芯片上引領(lǐng)了世界。
有院士認(rèn)為,“寒武紀(jì)”在深度學(xué)習(xí)處理器指令集上的開(kāi)創(chuàng)性進(jìn)展,為我國(guó)占據(jù)智能產(chǎn)業(yè)生態(tài)的領(lǐng)導(dǎo)性地位提供了技術(shù)支撐。
市場(chǎng)為道
在上世紀(jì)80年代,人工智能因?yàn)槭袌?chǎng)化發(fā)展,相當(dāng)長(zhǎng)一個(gè)時(shí)期跌入低谷。
近年來(lái),隨著科技的整體進(jìn)步,尤其是算法、應(yīng)用和工藝方面的飛速進(jìn)展,人工智能已成起飛之勢(shì),與之相應(yīng)神經(jīng)網(wǎng)絡(luò)處理器也得以涅槃重生。
2006年, Hinton、LeCun和Bengio等人提出了深度學(xué)習(xí)方法,被計(jì)算機(jī)網(wǎng)絡(luò)建設(shè)所重視,在深層人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練上取得新的巨大突破。通過(guò)深度學(xué)習(xí),人工神經(jīng)網(wǎng)絡(luò)的效能一舉趕上甚至超過(guò)了機(jī)器學(xué)習(xí)方法,IBM、谷歌、微軟、科大訊飛、百度等在人工智能的多個(gè)方向上都取得了實(shí)際應(yīng)用,進(jìn)步速度加快。
人工神經(jīng)網(wǎng)絡(luò)成為最有效的認(rèn)知任務(wù)處理算法之一,伴隨人工智能的飛速發(fā)展,專門的神經(jīng)網(wǎng)絡(luò)處理芯片在市場(chǎng)上的發(fā)展道路,前景也變得光明起來(lái)。自然而然,計(jì)算機(jī)體系結(jié)構(gòu)研究方向就由傳統(tǒng)的機(jī)器計(jì)算轉(zhuǎn)到認(rèn)知計(jì)算上。在認(rèn)知計(jì)算成為創(chuàng)新性方向的情景下,市場(chǎng)對(duì)人工神經(jīng)網(wǎng)絡(luò)處理器的需求會(huì)呈爆發(fā)式增長(zhǎng)。因此說(shuō),寒武紀(jì)的市場(chǎng)前景被普遍看好。目前,寒武紀(jì)的產(chǎn)業(yè)化成果正接受市場(chǎng)檢驗(yàn)。
2017年8月,寒武紀(jì)科技獲得了國(guó)投、阿里巴巴、聯(lián)想等共計(jì)1億美元融資,成為估值近10億美元的智能芯片領(lǐng)域獨(dú)角獸公司。
近期,寒武紀(jì)終端處理器IP產(chǎn)品已衍生出1A、1H等多個(gè)型號(hào),在未來(lái)數(shù)年,全世界有數(shù)億終端設(shè)備可望通過(guò)集成寒武紀(jì)處理器獲得強(qiáng)大的本地智能處理能力。
在2017年8月底中科院舉辦的“探索者”創(chuàng)新大會(huì)上,陳云霽作題為“制造機(jī)器大腦”的演講時(shí)提出:“要讓人工智能芯片計(jì)算效率提高一萬(wàn)倍,功耗降低到萬(wàn)分之一。這意味著我們可以把AlphaGo這樣的東西放到手機(jī)里,讓手機(jī)幫助我們做各種各樣的事情,甚至通過(guò)長(zhǎng)期的觀察和學(xué)習(xí),真正實(shí)現(xiàn)強(qiáng)大的智能?!币獙?shí)現(xiàn)這一目標(biāo),必須解決阻礙人工智能芯片發(fā)展的通用處理器功耗高、效率低的問(wèn)題。陳云霽解釋道:“如果要用通用處理器搭建一個(gè)人腦規(guī)模突觸的神經(jīng)網(wǎng)絡(luò),可能需要建一個(gè)電站來(lái)給它供電。AlphaGo下一盤棋動(dòng)用了1000個(gè)CPU和200個(gè)GPU,每分鐘的電費(fèi)就高達(dá)300美元,而網(wǎng)絡(luò)規(guī)模只有人腦的千分之一?!?/p>
寒武紀(jì)人工智能(AI)芯片所要解決的就是這樣的問(wèn)題——通過(guò)模擬神經(jīng)元和突觸的計(jì)算模式,對(duì)信息進(jìn)行智能處理,專門設(shè)計(jì)的存儲(chǔ)結(jié)構(gòu)和指令集,每秒可以處理160億個(gè)神經(jīng)元和超過(guò)2萬(wàn)億個(gè)突觸,功耗卻只有原來(lái)的十分之一。
在陳天石看來(lái),未來(lái)的AI芯片應(yīng)當(dāng)是一種新型的處理器,能具有廣闊的應(yīng)用面(包括語(yǔ)音、語(yǔ)義、圖像、視頻、自然語(yǔ)言多模態(tài)處理能力),同時(shí)具備遠(yuǎn)超CPU和GPU的效率?!澳壳埃馎lpha Go這樣的軟件算法是在GPU上執(zhí)行的,將來(lái)如果使用了帶有‘電腦語(yǔ)指令集的‘寒武紀(jì)處理器,深度學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))的運(yùn)算速度會(huì)得到明顯提升。”陳天石說(shuō)。對(duì)此,他以“瑞士軍刀和菜刀”來(lái)比喻通用處理器和深度學(xué)習(xí)處理器的關(guān)系:作為通用處理器的瑞士軍刀,雖然功能多,但是做菜的時(shí)候,還是深度學(xué)習(xí)處理器這把菜刀更合適于做智能處理。
對(duì)寒武紀(jì)的未來(lái),陳天石多有憧憬:“上個(gè)世紀(jì)以來(lái),美國(guó)信息技術(shù)快速發(fā)展,涌現(xiàn)出以Intel為代表的一系列偉大的芯片公司,驅(qū)動(dòng)人類社會(huì)從工業(yè)時(shí)代過(guò)渡到信息時(shí)代。近年來(lái),隨著人工智能技術(shù)和腦科學(xué)的加速發(fā)展,以智能手機(jī)、智能駕駛、智能制造和機(jī)器人為代表的智能技術(shù)開(kāi)始逐漸成熟。人類社會(huì)正處于從信息時(shí)代到智能時(shí)代的拐點(diǎn),芯片的使命將從信息時(shí)代的計(jì)算轉(zhuǎn)變?yōu)橹螜C(jī)器智能。而寒武紀(jì)正是能夠擔(dān)當(dāng)起這一光榮使命的公司?!?/p>
2017年9月2日,華為在德國(guó)IFA展上發(fā)布的全球首款麒麟 970移動(dòng)計(jì)算平臺(tái),就搭載了寒武紀(jì)的嵌入式 IP。這款2016年發(fā)布的全球首款商用深度學(xué)習(xí)專用處理器IP,入選了第三屆世界互聯(lián)網(wǎng)大會(huì)評(píng)選的十五項(xiàng)“世界互聯(lián)網(wǎng)領(lǐng)先科技成果”。但也有人說(shuō),華為使用的是寒武紀(jì)科技的指令集。而華為的旗艦手機(jī)Mate10則采用了寒武紀(jì)人工智能產(chǎn)業(yè)化的第一款產(chǎn)品1A處理器。對(duì)于這款處理器,陳天石有一個(gè)說(shuō)法:“我們的產(chǎn)品寒武紀(jì)1A處理器,可以跟蘋(píng)果產(chǎn)品一較高下,結(jié)果我們很輕松打贏了這場(chǎng)戰(zhàn)斗。我們并不是靠著蠻力去堆運(yùn)算器,而是依靠最先進(jìn)的、稀疏化的技術(shù),四兩撥千斤,讓華為Mate10的智能處理速度打敗了強(qiáng)大的蘋(píng)果iPhoneX?!庇萌A為Mate10手機(jī)掃一頁(yè)英文論文,微軟翻譯軟件可實(shí)時(shí)將其轉(zhuǎn)化為中文。而嵌入該處理器的手機(jī)、電腦等智能終端,對(duì)圖片、音頻等的理解速度會(huì)提升近百倍。
很快,寒武紀(jì)在2017年11月6日的首場(chǎng)發(fā)布會(huì)上,一口氣推出了四款新產(chǎn)品:面向視覺(jué)領(lǐng)域的寒武紀(jì) 1H8、性能更強(qiáng)的寒武紀(jì) 1H16,以及面向智能駕駛領(lǐng)域的寒武紀(jì) 1M,同時(shí)推出了面向開(kāi)發(fā)者的人工智能系統(tǒng)軟件 Cambricon NeuWare。寒武紀(jì)科技還宣布,計(jì)劃在2018年推出機(jī)器學(xué)習(xí)處理器MLU(機(jī)器學(xué)習(xí)處理器)系列。目前,曙光已推出基于Cambricon MLU100智能處理卡服務(wù)器產(chǎn)品系列“PHANERON”,可以支持2~10塊寒武紀(jì)MLU處理卡,靈活應(yīng)對(duì)不同的智能應(yīng)用負(fù)載。
前三款硬件產(chǎn)品,與寒武紀(jì)1A相比,在功耗、能效比、成本控制等方面均實(shí)現(xiàn)了大幅優(yōu)化,適用范圍覆蓋了圖像識(shí)別、安防監(jiān)控、智能駕駛、無(wú)人機(jī)、語(yǔ)音識(shí)別、自然語(yǔ)言處理等多個(gè)應(yīng)用領(lǐng)域。
對(duì)于寒武紀(jì)芯片的市場(chǎng)化方向,陳天石透露:“主要是兩方面:一是終端,二是云端。終端產(chǎn)品就是手機(jī)、智能眼鏡、手環(huán)等,需要芯片去識(shí)別圖像、影音和文字。而在云端,像科大訊飛、曙光這樣知名的云端客戶,都已經(jīng)是寒武紀(jì)的客戶?!?/p>
目前看,市場(chǎng)化的道路并不能限制寒武紀(jì)的想象力:“我們的夢(mèng)想不是準(zhǔn)確模擬人類的大腦,而是制造出強(qiáng)人工智能”,“一旦實(shí)現(xiàn)人類級(jí)別的強(qiáng)人工智能,憑借機(jī)器智能和腦機(jī)接口,人類將擁有近乎無(wú)限的記憶和計(jì)算能力,甚至無(wú)限的創(chuàng)造力,最終使得生物的進(jìn)化邁上一個(gè)新的臺(tái)階,成為更高級(jí)的形態(tài)?!?/p>