隨著DeepSeek持續(xù)霸榜熱搜,其創(chuàng)始人梁文鋒的許多觀點也熱傳于網絡?!斑^去三十多年IT浪潮里,我們基本沒有參與到真正的技術創(chuàng)新里”“經驗包袱太重的人,創(chuàng)新動力不足”……他的話語樸實且坦誠,道理講得很直白,卻給人耳目一新之感。
在國內輿論場中,梁文鋒本人與DeepSeek是深度捆綁的,有人稱他是人工智能上甘嶺的“黃繼光”,有人說他是中國的“馬斯克”,但在筆者看來,更重要的或許在于做好DeepSeek與梁文鋒思維的解碼,換言之,大家應當更加清楚地知道,當我們在談論DeepSeek時,到底在談論什么,或者說應該談論什么。
ChatGPT問世以來,全球AI競賽正式進入“大力出奇跡”時代。當美國科技大廠已投入巨資,構建起了一套由他們制訂的行業(yè)標準、生存法則時,當很多人潛意識中已默許,AI領域未來發(fā)展的話語權、主導權和控制權正牢牢掌握在西方手中時,來自中國的DeepSeek卻突然闖了進來,走出一條震驚世界的差異化技術路徑,實現國產大模型的突圍。
DeepSeek的成功,挑戰(zhàn)了AI領域“規(guī)模至上”的傳統(tǒng)思維。那么從技術角度看,DeepSeek主要創(chuàng)造了哪些核心創(chuàng)新?
首先是模型架構,DeepSeek突破了傳統(tǒng)方法的瓶頸,更加穩(wěn)定高效。其次是算法突破,DeepSeek顯著降低了模型推理成本。第三是訓練方式,DeepSeek首次證明了基于大規(guī)模強化學習與高質量合成數據結合的技術路徑,可在不依賴標注數據、監(jiān)督微調的情況下,獲得高水平推理能力。第四是數據策略,DeepSeek的“數據質量優(yōu)先”的核心原則逐漸成為領域共識。最后是工程技術,DeepSeek實現了芯片算力的效用最大化,這也為未來留下了巨大的想象空間。
曾幾何時,硅谷將AI技術塑造為一個珍貴且神奇的成就,將埃隆·馬斯克、薩姆·奧爾特曼等領軍人物描繪成“引領人類進入新世界的先知”。而DeepSeek撕掉了此前籠罩在AI之上的神秘面紗。它專注創(chuàng)新,在人工智能全球競爭白熱化的關鍵時期形成突破,為中國的智能生態(tài)構建奠定關鍵基礎;它擁抱開源,為全世界技術社區(qū)作出堅實貢獻。
當我們贊嘆DeepSeek產品的巨大成功,也應當關注其團隊的系統(tǒng)性創(chuàng)新能力,這既包含多方面的技術突破,也包括如何聚合“高密度技術人才”,如何為年輕團隊提供高效的創(chuàng)新土壤。
(摘自《北京青年報》王鑫)