王杰夫
左一為Covariant CEO Peter、左二為首席科學(xué)家PieterAbbeel,左三為聯(lián)合創(chuàng)始人Rocky Duan。
無論以ChatGPT為代表的各種聊天機(jī)器人在2023年有多么火熱,這一切都還局限在比特世界里,哪怕ChatGPT的分析推理再嚴(yán)謹(jǐn),代碼寫得再精妙,它依然無法拿起一個(gè)蘋果。想要讓AI從比特世界進(jìn)入原子世界,就必須給它一副身體,并且教會(huì)它如何去控制,這就是具身智能(EmbodiedArtificialIntelligence)的概念。
在2023年涌現(xiàn)的AI獨(dú)角獸名單里,Covariant是其中少有的專注具身智能的公司,它采取了與波士頓動(dòng)力等傳統(tǒng)機(jī)器人公司迥異的技術(shù)路線。相較于后者在精密硬件平臺(tái)上細(xì)致打磨運(yùn)動(dòng)控制算法以實(shí)現(xiàn)機(jī)器人運(yùn)動(dòng),Covariant力圖開發(fā)一個(gè)能夠適應(yīng)多種場景的通用機(jī)器人大腦,避免為特定場景定制特定機(jī)器人,而是讓不同機(jī)器人共享同一智能核心。
這與OpenAI的思路相同。其實(shí)在GPT-3.5(ChatGPT背后的模型)這樣的大語言模型出現(xiàn)之前,AI是個(gè)大門類,下面有自然語言處理、計(jì)算機(jī)視覺、語音識(shí)別等細(xì)分領(lǐng)域。最初的GPT只是一個(gè)探索性的技術(shù)路線,但科學(xué)家們發(fā)現(xiàn),隨著投喂的數(shù)據(jù)增多,參數(shù)的規(guī)模增大,模型出現(xiàn)了一些智能的跡象,它可以理解語言、生成文本,甚至把圖像數(shù)據(jù)投喂進(jìn)去,這個(gè)模型也開始理解圖像的內(nèi)容。
當(dāng)然,現(xiàn)實(shí)中科學(xué)家遇到的困難遠(yuǎn)比上述流程復(fù)雜得多,但這并不能否認(rèn)“大力出奇跡”就是推動(dòng)這一輪AI浪潮到來的重要原因。那么何不去訓(xùn)練一個(gè)用于機(jī)器人的模型呢?
Covariant和OpenAI淵源頗深,4位創(chuàng)始人里有3位都在OpenAI工作過。那時(shí)OpenAI尚處于早期階段,整個(gè)團(tuán)隊(duì)只有10名成員,他們伴隨這家初創(chuàng)公司一路成長,直到團(tuán)隊(duì)規(guī)模擴(kuò)大到一百多人。
最年長的皮特·阿貝爾(PieterAbbeel)現(xiàn)在是Covariant的首席科學(xué)家,他曾是加州大學(xué)伯克利分校電氣工程與計(jì)算機(jī)科學(xué)系教授,是將深度強(qiáng)化學(xué)習(xí)應(yīng)用在機(jī)器人方面的先驅(qū)。他率先教會(huì)機(jī)器人從人類演示中學(xué)習(xí),為下一代機(jī)器人技術(shù)奠定了基礎(chǔ)。早在2016年,也就是OpenAI成立的第二年,阿貝爾就加入了這個(gè)后來發(fā)布ChatGPT的公司,成為其機(jī)器人團(tuán)隊(duì)的一員。當(dāng)時(shí)與阿貝爾一起在OpenAI工作的還有他的兩個(gè)學(xué)生,即如今Covariant的CEO陳曦(Peter)和CTO段巖(Rocky)。
有一天,陳曦和段巖兩人在唐人街的中餐館里聊合作發(fā)表的新論文—用強(qiáng)化學(xué)習(xí)教會(huì)機(jī)器人像人類一樣在短時(shí)間里掌握新技巧??蒲腥〉眠M(jìn)展固然可喜,如果想要進(jìn)一步研究,OpenAI實(shí)驗(yàn)室所能提供的資源和數(shù)據(jù)都遠(yuǎn)遠(yuǎn)不夠了?!叭绻覀兿胗脭?shù)據(jù)和計(jì)算驅(qū)動(dòng)的AI解決機(jī)器人方面的問題,在實(shí)驗(yàn)室永遠(yuǎn)得不到足夠數(shù)據(jù),我們必須進(jìn)入實(shí)際環(huán)境里求解問題,別無他法?!?022年,陳曦曾在播客節(jié)目里回憶創(chuàng)業(yè)初期的討論。
意識(shí)到學(xué)術(shù)研究與解決實(shí)際問題間的差距,正是Covariant創(chuàng)立的關(guān)鍵時(shí)刻。2017年,Covariant在硅谷成立,它最初的名稱是EmbodiedIntelligence。阿貝爾興趣廣泛,擔(dān)任了風(fēng)投公司AIXVentures的投資合伙人,還在YouTube經(jīng)營著自己的同名播客節(jié)目,于是Covariant的CEO由陳曦?fù)?dān)任。得益于阿貝爾的背書,Covariant在種子輪就獲得700萬美元的融資,投資人列表里有著一眾AI領(lǐng)域的知名學(xué)者:深度學(xué)習(xí)之父杰弗里·辛頓(GeoffreyHinton)、卷積神經(jīng)網(wǎng)絡(luò)之父楊立昆(YannLeCun)、GoogleBrain創(chuàng)建人杰夫·迪恩(JeffDean)、ImageNet創(chuàng)建者李飛飛等。
另一邊,OpenAI由于機(jī)器人團(tuán)隊(duì)的核心成員跳槽創(chuàng)業(yè),加上想要把重心放在基礎(chǔ)模型GPT的研發(fā)上,最終在2021年7月解散了整個(gè)機(jī)器人團(tuán)隊(duì)。Covariant則延續(xù)了AI機(jī)器人的研究路線,一路發(fā)展至今。
Covariant的核心產(chǎn)品并不是人形機(jī)器人。創(chuàng)立之初,創(chuàng)始人就沒有把應(yīng)用場景錨定在C端,而是試圖把AI技術(shù)應(yīng)用在工業(yè)化領(lǐng)域,為B端客戶提供AI分揀機(jī)器人。陳曦的理由是倉庫和配送中心是機(jī)器人行業(yè)最先發(fā)生質(zhì)變的地方。這并不難理解,只有傳統(tǒng)機(jī)器人已經(jīng)廣泛落地的B端場景能提供足夠的訓(xùn)練數(shù)據(jù)。
對(duì)比來看,傳統(tǒng)的機(jī)器人系統(tǒng)是剛性的,人類不管取得多少操作數(shù)據(jù),都不會(huì)改變機(jī)器人對(duì)三維空間的理解和感知能力。這類機(jī)器人不需要AI的支持,它們只是用標(biāo)準(zhǔn)化算法移動(dòng)的集裝箱,一旦涉及到識(shí)別并分揀不同種類的物品,就需要人類手動(dòng)完成。而Covariant關(guān)注的重點(diǎn)是“搬運(yùn)”,通過AI讓機(jī)器人在不同環(huán)境下識(shí)別不同種類的物品。在陳曦看來,Covariant努力的方向就是使用一個(gè)AI系統(tǒng)解決所有應(yīng)用場景的問題。
Covariant給機(jī)器人裝載了一個(gè)AI大腦“CovariantBrain”,段巖領(lǐng)導(dǎo)了公司核心平臺(tái)的開發(fā)。簡言之,CovariantBrain就是在所有物品類型的基礎(chǔ)上訓(xùn)練一個(gè)通用AI,實(shí)現(xiàn)人類級(jí)別的自主性,讓機(jī)器人能挑選最廣泛的SKU,而不局限于特定的行業(yè)和產(chǎn)品。
商業(yè)化應(yīng)用無法一蹴而就,現(xiàn)實(shí)世界的場景變化多樣,比實(shí)驗(yàn)室復(fù)雜得多,Covariant團(tuán)隊(duì)做的第一件事,是對(duì)機(jī)器人展開預(yù)訓(xùn)練。他們收集客戶倉庫里海量的SKU數(shù)據(jù)訓(xùn)練CovariantBrain,使其能以通用方式理解所有對(duì)象。
Covariant團(tuán)隊(duì)采取了集群學(xué)習(xí)的方法來訓(xùn)練模型。集群學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的一種,通常用于分布式系統(tǒng),由多個(gè)機(jī)器學(xué)習(xí)模型,或由智能體共同學(xué)習(xí)和協(xié)作,以提高整體性能。它的亮點(diǎn)在于,多個(gè)智能體可以分布在不同的物理位置甚至不同的數(shù)據(jù)中心,各個(gè)智能體之間能共享知識(shí),加速學(xué)習(xí)進(jìn)程。這意味著天南海北的客戶數(shù)據(jù)都能用于CovariantBrain的訓(xùn)練。反過來,客戶可以從CovariantBrain驅(qū)動(dòng)的每個(gè)機(jī)器人的學(xué)習(xí)中受益,機(jī)器人在一個(gè)地方學(xué)習(xí),熟悉拾取物品的新情境,分布全球各地的整個(gè)機(jī)器人集群都會(huì)受益。
如今,CovariantBrain每天都同時(shí)接受來自全球各地倉庫數(shù)百萬個(gè)物品的訓(xùn)練,從小型化妝品到服裝塑料袋再到生鮮雜貨。在一家德國倉庫內(nèi),CovariantBrain控制的機(jī)器人可以對(duì)1萬多種不同的物品完成揀選和分類,準(zhǔn)確率超過99%。
阿貝爾對(duì)機(jī)器人與人類的工作效率做過對(duì)比:人工分揀站的效率大約在每小時(shí)300次到2000次之間。假如以每小時(shí)300次的人工最低值作為基準(zhǔn),AI機(jī)器人分揀準(zhǔn)確率達(dá)到90%意味著每小時(shí)會(huì)出現(xiàn)30次失敗,額外花費(fèi)的修復(fù)時(shí)間就超過一個(gè)小時(shí);假如分揀準(zhǔn)確率達(dá)到99%,意味著每小時(shí)只出現(xiàn)3次失敗,這樣修復(fù)時(shí)間就只需要幾分鐘。
終于,當(dāng)CovariantBrain的準(zhǔn)確性超過99%時(shí),一個(gè)工程師便能輕松管理10個(gè)機(jī)器人揀選站,這標(biāo)志著AI機(jī)器人在成本效益上與人類勞動(dòng)力達(dá)到了同等水平。
有了前期的科研積累后,Covariant還需要一個(gè)在業(yè)界嶄露頭角的機(jī)會(huì)。
2019年,瑞士的工業(yè)自動(dòng)化公司ABB發(fā)起了一項(xiàng)全球范圍內(nèi)的機(jī)器人揀選競賽。作為全球三大工業(yè)機(jī)器人制造商之一,ABB希望通過揀選比賽評(píng)估AI技術(shù)是否成熟,能否應(yīng)用到機(jī)器人自動(dòng)化領(lǐng)域,進(jìn)而選出潛在的合作伙伴。參賽者是20家全球領(lǐng)先的AI初創(chuàng)公司,10家來自美國,10家來自歐洲,其中就包括成立時(shí)間僅兩年的Covariant。
這場競賽涵蓋了26種不同場景,能全面測試參賽機(jī)器人的自主水平。主辦方保密了一半的挑戰(zhàn)項(xiàng)目,參賽者事先不知道具體的物品和場景,無法提前準(zhǔn)備,需要當(dāng)場測試系統(tǒng),一天之后再測,觀察系統(tǒng)通過訓(xùn)練后有哪些改進(jìn)。
大多數(shù)公司都未能通過測試。少部分公司可以解決大多數(shù)任務(wù),但無法處理更棘手的情況。測試的物品有水彩筆、袋裝軟糖、塑料瓶裝藥、方塊紙盒、膠水、洗面奶、按壓式洗手液、蘋果、袋裝膨化食品、玩具小黃鴨等等……它們的包裝、重量、形狀都不一樣。在零散放置、品類混合、整齊排列的多種狀態(tài)下,Covariant的AI機(jī)器人搭載著機(jī)械臂和吸盤,沒有遲疑,準(zhǔn)確完成分揀,成功率達(dá)成100%。它完全不需要人工干預(yù),卻像人類一樣快速高效地處理每項(xiàng)任務(wù)。ABB的機(jī)器人業(yè)務(wù)總經(jīng)理馬克·塞古拉(MarcSegura)表示,“在這些測試中達(dá)到一定水平很容易,但不表現(xiàn)出任何弱點(diǎn)是非常困難的?!?/p>
出色的表現(xiàn)讓Covariant成了ABB的合作伙伴。雙方的首個(gè)合作方案部署在比利時(shí)郵政(Bpost)旗下的電商履約公司ActiveAnts。
成功拿下ABB這個(gè)大客戶后,Covariant迎來了更多商業(yè)機(jī)會(huì)。2022年3月,奧地利的自動(dòng)化技術(shù)與物流解決提供商KNAPP與Covariant展開合作。KNAPP的揀選機(jī)器人Pick-it-EasyRobot由CovariantBrain系統(tǒng)提供支持,機(jī)器人實(shí)現(xiàn)了全天候工作,能全自動(dòng)處理訂單?!拔以谖锪餍袠I(yè)工作了16年,從未見過這樣的事?!盞NAPP副總裁彼得·普切溫(PeterPuchwein)說。美國的藥品批發(fā)商McKesson、德國電氣公司Obeta都應(yīng)用了KNAPP與Covariant合作開發(fā)的機(jī)器人。
同一個(gè)系統(tǒng)解決所有場景問題。
大型公司應(yīng)用AI機(jī)器人的好處顯而易見,首先是效率的提升。在Obeta,一臺(tái)AI機(jī)器人能完成3個(gè)工人分揀零件的工作。在這之前,Obeta經(jīng)常招不到分揀員,即使招來也經(jīng)常干不滿半年。因?yàn)榉謷ぷ魈珶o聊,每天8小時(shí),每小時(shí)工人需要處理170個(gè)訂單,夏天倉庫的溫度還經(jīng)常超過37℃,悶熱、勞累、重復(fù)的工作讓工人難以忍受。其次,工業(yè)自動(dòng)化能幫助公司降低成本。KNAPP面向客戶收取的費(fèi)用始終低于雇用人工的費(fèi)用,KNAPP副總裁普切溫舉了一個(gè)例子:如果一家公司每年雇用一名工人的費(fèi)用是4萬美元,那么KNAPP收取的AI機(jī)器人費(fèi)用就是每年3萬美元。這樣的性價(jià)比讓客戶無法拒絕。
目前看來,Covariant最主要的商業(yè)模式,就是面向企業(yè)客戶,與全球先進(jìn)的工業(yè)機(jī)器人制造商合作,用AI技術(shù)為傳統(tǒng)機(jī)器人升級(jí)換代。
商業(yè)模式得到驗(yàn)證的Covariant吸引了眾多投資機(jī)構(gòu)加碼投資。2019年,Covariant完成2000萬美元的A輪融資;2020年,完成4000萬美元的B輪融資;2021年,完成8000萬美元的C輪融資;2023年4月它又獲得了7500萬美元的補(bǔ)充C輪融資。截至目前,公司的融資總額達(dá)到2.22億美元。每隔兩年,Covariant就會(huì)設(shè)立一個(gè)新的全球辦公室,2019年深圳辦公室成立,2021年倫敦辦公室成立?;蛟S因?yàn)閯?chuàng)始人團(tuán)隊(duì)中有3位具有華裔背景,Covariant也成了為數(shù)不多在中國設(shè)立分公司的硅谷AI獨(dú)角獸。
目前,全球約有300萬臺(tái)工業(yè)機(jī)器人,每年約有40萬臺(tái)新機(jī)器人進(jìn)入市場。預(yù)計(jì)到2023年,全球市場收入將達(dá)到近438億美元,僅北美地區(qū)的復(fù)合年增長率到2029年就將增長10%。
隨著Covariant邁入規(guī)?;l(fā)展階段,此前與ABB等傳統(tǒng)機(jī)器人制造商的合作模式暴露出了一些問題。首先,上游的機(jī)械臂廠商已經(jīng)意識(shí)到AI浪潮勢不可擋,BershireGrey、RightHandRobotics、AmbiRobotics等機(jī)械臂廠商正在加速AI研發(fā)。
其次,下游的機(jī)器人集成商例如ABB、Dematic、AutoStore、FANUC、KUKA也在擔(dān)心來自Covariant的競爭。由于長期的合作關(guān)系,客戶更信任這些傳統(tǒng)的集成商,更樂意和它們談采購方案,Covariant只是扮演二級(jí)供應(yīng)商的角色,議價(jià)權(quán)和品牌影響力都會(huì)受到影響。
機(jī)器人技術(shù)屬于資本密集型領(lǐng)域,需要大量資本投入來建造設(shè)施、購買設(shè)備、維持運(yùn)營,因此Covariant最開始選擇與自動(dòng)化機(jī)器人公司合作,其實(shí)是很取巧的做法。以ABB為例,ABB有成熟的工業(yè)機(jī)器人系統(tǒng),Covariant無需自研硬件;ABB的業(yè)務(wù)遍及全球一百多個(gè)國家和地區(qū),在中國的線上和線下渠道就覆蓋了約700座城市,Covariant依托ABB的渠道,無需自己開拓B端客戶資源,就能迎來廣闊市場。
可是將其放在整個(gè)產(chǎn)業(yè)鏈中看,Covariant僅有AI技術(shù)還不夠,也不能只依賴工業(yè)機(jī)器人巨頭去獲得硬件和渠道支持,不同維度的競爭對(duì)手正迫使Covariant同時(shí)向上下游去拓展自己的業(yè)務(wù)范圍。
OpenAI當(dāng)年放棄AI機(jī)器人業(yè)務(wù)的決定就暗示了,對(duì)于創(chuàng)業(yè)公司來說這條路并不好走。在2021年7月解散機(jī)器人團(tuán)隊(duì)時(shí),OpenAI聯(lián)合創(chuàng)始人沃伊切赫·扎倫巴(WojciechZaremba)在回復(fù)媒體時(shí)表示,“可悲的是,如果我們是一家機(jī)器人公司,公司使命就會(huì)不同,我們會(huì)繼續(xù)研究。我們非常相信機(jī)器人團(tuán)隊(duì)的研發(fā)方向與方法,但從想要實(shí)現(xiàn)目標(biāo)(即構(gòu)建通用人工智能)的角度來看,我們還缺少一些組件?!痹鷤惏筒]有明確提到究竟缺少了哪些組件,可能是資金、人力、數(shù)據(jù),等等,這些也都是Covariant不斷在面對(duì)的問題。