沈玉姍
AlphaGo擊敗柯潔,令人工智能的商業(yè)化命題再度引發(fā)熱議。計算機視覺作為國內(nèi)人工智能最先成熟的工業(yè)級賽道,更被外界長期視為坐擁“四個獨角獸”的巨型角斗場。其中,商湯科技并非最早成立的一家,卻后發(fā)制人,先后獲得來自IDG資本、Star VC、鼎暉投資、萬達投資、賽領資本在內(nèi)的多輪投資,估值超過10億美元。商湯科技聯(lián)合創(chuàng)始人、CEO徐立博士告訴《21CBR》記者,公司已經(jīng)在多個行業(yè)實現(xiàn)規(guī)模變現(xiàn)。
徐立有著典型的人工智能科學家背景,在香港中文大學就讀博士期間,其與導師賈佳亞教授研發(fā)的圖像去模糊技術將圖像清晰度提升了100倍,被視為是全球圖像處理的一大突破。以研發(fā)實力聞名的商湯也一度被“學術氣息”所標簽化。徐立認為,人工智能還遠未走向技術同質(zhì)化的時代,若技術上不構成領先性和差異化,將難以跟上行業(yè)變化。對于人工智能的商業(yè)落地,商湯則自有一套驅動行業(yè)的經(jīng)營哲學。
21CBR:智能視頻目前是“人工智能+安防”的行業(yè)熱點,你在去年也提過類似觀點,這塊的市場存量有多大?
徐立:安防一直是國家大力發(fā)展的領域,也是十三五規(guī)劃的重點行業(yè)。從政府投入來看,今年也要投入2000-3000億。傳統(tǒng)安防領域的最大廠商,去年營業(yè)額在300多億。所以,這塊目前有足夠的市場空間。
今年的視頻業(yè)務和去年的人臉識別有些類似。去年,業(yè)內(nèi)都在嘗試和落地人臉識別的具體應用,到今年進入相對成熟期,業(yè)務增長很快。今年,智能視頻業(yè)務也在各地展開試點,整體發(fā)展正處在一個大的行業(yè)機會點上。
視頻業(yè)務何時落地,核心問題在于明確產(chǎn)品的商用標準。工業(yè)界的一個標準紅線是評估產(chǎn)品是否超過所謂人眼的準確率,這也是人臉識別逐漸商用化的原因。但是視頻內(nèi)容的分析和人相比效果上還有差距。目前全球每天有2.5億只安防攝像頭在記錄,視頻數(shù)據(jù)輸入達到一定規(guī)模,但在智能處理上還很欠缺,而核心算法的突破將成為最關鍵的落地因素之一。
21CBR:商湯切入安防領域有哪些布局,如何構建自己的智能視頻生態(tài)鏈?
徐立:商湯在安防領域的產(chǎn)品體系分為兩類:一類是成熟的業(yè)務系統(tǒng),需要基于客戶方的具體業(yè)務邏輯進行設計,比如怎樣做多視頻協(xié)調(diào),如何做人像處理等,代表產(chǎn)品是SenseFace人臉布控系統(tǒng)和SenseVideo視頻結構化系統(tǒng),另一類是業(yè)務系統(tǒng)中的核心算法模塊,包括動靜態(tài)比對服務器、人群分析服務器和結構化服務器等,屬于相對標準化的產(chǎn)品。
舉例來說,我們在視頻結構化系統(tǒng)上做了很大突破。以往的視頻結構化系統(tǒng)只能通過身高、性別等屬性來查詢視頻信息,SenseVideo實現(xiàn)了自然語言的信息查詢。我們做了1.3萬人的案例測試,總共生成了9000多個自然語言構成的關鍵詞。對于辦案人員來說,通過自然語言來描述罪犯、完成案件信息的視頻檢索是更常見的業(yè)務邏輯,也比根據(jù)屬性搜索來得更加精準,未來將是一個新的業(yè)務形態(tài)。
目前商湯在安防市場相較領先,前十大安防廠商一半以上是我們客戶,商湯為其提供標準化模塊和業(yè)務子系統(tǒng)。同時,我們也在國內(nèi)重點城市建立本地化業(yè)務。去年,商湯的智能視頻業(yè)務(Intelligent Video Analytics)已占公司整體業(yè)務的40%,今年這一勢頭依舊良好。
21CBR:比起發(fā)展客戶,商湯似乎更擅長行業(yè)聯(lián)盟,商湯的市場開拓邏輯怎樣的?
徐立:首先,無論賣什么產(chǎn)品,最后都要接觸到甲方。但是,我一直認為,B2B企業(yè)如果要起量、要規(guī)?;?,產(chǎn)品一定是相對標準化的。如果每次銷售的方案都是定制化服務,企業(yè)的ROI(投資回報率)就會比較低。相反,集成商則可以將商湯與電信方、施工方等等連接起來,在各地做出標桿性的項目,再用標準化的形式去鋪開。
這里的標準化不是一蹴而就的,而是來自產(chǎn)品和項目的逐次迭代。比如前面提到的比對服務器,再往上可能是一套帶著攝像頭的子系統(tǒng),最后則是一整套的訓練部署平臺。通過深入行業(yè)、做細項目,商湯不斷把標準化的范圍擴大,并聚合客戶的需求從而形成共有需求,最終完成標準化產(chǎn)品的打磨過程。
因此,商湯一直把自己定位成一個技術公司,而不是集成商公司。商湯能做的是集中力量攻破核心算法和技術。這個技術不是單點的、閉門造車的技術,而是以打通上下游的客戶需求、構建產(chǎn)業(yè)鏈條來實現(xiàn)的。就像英特爾不直接向終端用戶銷售芯片,而是通過上下游的合作伙伴,比如主板廠商、主機廠商等實現(xiàn)筆記本電腦的銷售,但用戶仍然了解產(chǎn)品背后有英特爾領先的芯片技術,這也是商湯所追求的:做行業(yè)的賦能者。
21CBR:業(yè)界普遍在談AI同行業(yè)的深度結合,各家公司從技術表現(xiàn)來看也大致相當。對此你怎么看?
徐立:很多人覺得,深度學習已經(jīng)形成開源生態(tài),技術沒那么重要了,打通行業(yè)才是關鍵。這里面有一個重要前提:深度學習是否已經(jīng)成熟、不會再變化了。然而,學術界目前有關深度學習的文章大部分都是工程實踐型的,新的實驗結果不斷推翻前人做出的理論解釋,指導下一代工業(yè)級應用的技術原理有待被歸納總結,人工智能距離成熟的“黑盒”還差得很遠。
例如,從近年來物體識別競賽的結果看,識別準確率在2013-2017年之間提升了300%,基本與摩爾定律吻合。也就是說,在某些垂直領域,算法的演進已經(jīng)進入摩爾定律時代,不是既有算法的變化,本質(zhì)上是重新設計出一套新的引擎算法,從而形成巨大的提升空間。未來三五年間,深度學習還將迎來革命性的變化,現(xiàn)有的算法如果不趕上,就會被淘汰。
至于人臉識別技術的同質(zhì)化,也是有待商榷的。以抓逃為例,1:1的人像比對準確率已經(jīng)遠遠超出人眼,但如果要在全國14億人像庫中進行1:N的實時動態(tài)比對,目前沒有一家公司能夠做到,更多只能在細分場景中使用,比如在某個小區(qū)里識別出外來可疑人員。而這不能算做是最優(yōu)化的應用。
因此,怎樣拓展技術邊界、把精度推向下一個極限,是人工智能算法迭代的核心關鍵。我覺得技術創(chuàng)業(yè)有兩種可能性:第一類是通過技術上大的領先性和差異化,帶來時間窗口和強壁壘。第二類則是對技術的應用看得非常準,知道在什么地方能夠快速落地變現(xiàn),從而走在行業(yè)前面。這兩方面商湯都在努力,也有信心,最終能夠在市場上形成比較大的差異化。