李慧君
科技是第一生產力。隨著科技和生產力的飛速革新,國產AI大模型邁入規(guī)模應用的新階段,人工智能將成為助推科技高質量發(fā)展、賦能千行百業(yè)的重要推手。
3月18日,由北京月之暗面科技有限公司(以下簡稱月之暗面)推出的首個支持輸入20萬漢字的智能助手產品Kimi?Chat引起了不少科技迷的關注。3月22日,阿里通義千問緊跟其后宣布向所有人免費開放1000萬字的長文檔處理功能。隨著Kimi等一系列國產大模型應用逐漸普及,國產AI大模型將迎來新一輪快速發(fā)展的黃金時期。
AI大模型大有可為
隨著數(shù)字經濟快速發(fā)展,AI大模型成為一個新一代人工智能的熱點話題。
AI大模型通常用于處理大規(guī)模數(shù)據(jù)并生成復雜的輸出。這些模型通過預訓練海量語料庫數(shù)據(jù),學習到了自然語言中的規(guī)律和模式,并在生成式任務中有出色的表現(xiàn)。大模型通常用于自然語言處理、圖像識別、語音識別等領域,以實現(xiàn)更準確的預測和決策,是具有巨大參數(shù)數(shù)量和計算能力的深度學習模型。
2023年10月9日,月之暗面向公眾推出世界首個支持輸入20萬漢字的智能助手產品,這是月之暗面第一次在公眾面前亮相,也是Kimi?Chat的名字首次公之于眾。在此之后,月之暗面就漸漸淡出人們視野,只是在今年2月完成新一輪超10億美元融資時才再度淺淺露個面。估計誰也未曾想到,一個月后這家AI新秀將再度曝出大驚喜,把AI長文領域賽道競爭的激烈程度“自我內卷”到難以企及的新高度。
相較于此前的20萬字長文本上限,全新的Kimi智能助手支持文本上限的長度直接提升到原先10倍,而更大容量的長上下文處理能力無疑將幫助Kimi用戶解鎖更多新的使用場景,包括長篇文本的翻譯和理解、輔助分析法律問題、一次性整理幾十張發(fā)票、快速理解API開發(fā)文檔等。
而除了長文本處理能力大幅提升之外,最新的Kimi強化了自身的上下文窗口和無損記憶功能以及多語言支持優(yōu)勢,這使得Kimi在聯(lián)網搜索與信息搜集、數(shù)據(jù)處理、編寫代碼和模擬對話等多種使用場景中同樣可以表現(xiàn)出色,為大模型應用“長文本時代”打開新局面。
事實上,不只Kimi,百度、阿里巴巴、科大訊飛等國內相關企業(yè)近年來也紛紛推出AI大模型的升級版本。阿里云發(fā)布千億級參數(shù)大模型通義千問2.0,在復雜指令理解、文學創(chuàng)作、通用數(shù)學、知識記憶等能力上均有顯著提升??拼笥嶏w升級了訊飛星火認知大模型V3.0,并啟動更大參數(shù)規(guī)模的星火大模型訓練。2023年11月10日,中國電信對外推出了升級的千億參數(shù)大模型星辰語義,這款語義大模型重點解決百億參數(shù)的語義模型在商業(yè)化落地過程中面臨的幻覺、多輪邏輯推理等問題,主要聚焦提升圖文生成、圖文理解能力,中文意象理解生成能力提升30%。
行業(yè)大模型也吸引了不少企業(yè)加大布局。中國移動聯(lián)合中國信科、中國航信、中國航油等央企發(fā)布了“九天·眾擎基座大模型”,該基座模型融合通信、能源、鋼鐵、建筑、交通等八大行業(yè)專業(yè)知識,將為企業(yè)“量體裁衣”構建行業(yè)大模型和打造智能化應用。中國電信推出了十余個行業(yè)大模型,覆蓋教育、政府服務、交通、金融、旅游導覽等領域,其中教育大模型可將教師評閱工作量減少70%,基層治理大模型可將公文寫作提升6倍。
去年11月,2023年世界互聯(lián)網大會烏鎮(zhèn)峰會在浙江烏鎮(zhèn)舉行,展示了15個獲得“領先科技獎”的具有國際代表性項目,其中包括百度知識增強大語言模型關鍵技術、IBM生成式人工智能watsonx等大模型、AIGC的新成果。
華為盤古氣象大模型是全球首款精度超過傳統(tǒng)數(shù)字預報方法的AI模型,僅需1.4秒就能完成未來24小時的全球氣象預報,相比傳統(tǒng)預報提速1萬倍以上。此外,基于文心大模型開發(fā)出的智艙大模型與智艙開發(fā)工具鏈,可使汽車具有更高階的智能駕駛能力、更強大的自我學習和記憶功能,改變人車交互方式、提升用戶用車體驗。
在國內,當前我國人工智能核心產業(yè)規(guī)模不斷增長,企業(yè)數(shù)量超過4400家,智能芯片、開發(fā)框架、通用大模型等創(chuàng)新成果不斷涌現(xiàn)。從加快新藥研發(fā)、精準預報天氣,到縮短工廠產品交付周期、提高辦公效率,越來越多的行業(yè)大模型正加快落地。截至目前,中國開發(fā)的人工智能大模型已經在智慧礦山、藥物研發(fā)、氣象、政務、金融、智能制造、鐵路管理等領域展現(xiàn)出巨大的應用潛力。根據(jù)賽迪顧問發(fā)布的《2023年中國生成式AI企業(yè)應用研究》預計,2035年中國企業(yè)生成式人工智能采用率將達到85%。
據(jù)悉,目前我國大模型的發(fā)展更加貼近產業(yè)端,目前大模型已應用于制造、能源、電力、化工、交通等多行業(yè)多領域,生成式AI賦能千行百業(yè),將為企業(yè)創(chuàng)造前所未有的商業(yè)價值。
數(shù)字治理新未來
科技是推動人類前行的永久動力。AI大模型這一股新生的革新力量將人們對于通用人工智能的幻想快速推向現(xiàn)實。然而,隨著生成式AI展現(xiàn)出日益強大的創(chuàng)造力和影響力,如何規(guī)范引導和科學治理也成為了時代的重要課題。
中國電子技術標準化研究院信息技術研究中心副主任、高級工程師董建表示,大模型優(yōu)秀的信息吞吐、知識儲備和人機交互能力,拉近了人類與機器的距離,也使其在醫(yī)療健康、創(chuàng)意產業(yè)與文化教育的賦能表現(xiàn)突出,吸引了投資界和研發(fā)界的大量關注。
董建認為,大模型作為通用賦能技術,能夠與大部分行業(yè)結合,推動智能化升級換代,催生新模式、新業(yè)態(tài)、新產業(yè)。參照2017年以來由深度學習驅動的人工智能發(fā)展周期,大模型產業(yè)化發(fā)展預計會經歷技術爆發(fā)期、應用探索期和產業(yè)成熟期三個階段。在應用探索期,經歷技術爆發(fā)后,其技術及產品產業(yè)化進程加速演進,賦能應用的廣泛性和縱深程度加強,并與社會和文化進一步融合,在醫(yī)療、教育、互聯(lián)網等領域的應用或呈現(xiàn)爆發(fā)態(tài)勢。這一時期,大模型實踐將大幅度放大人工智能潛在的倫理問題。到了產業(yè)成熟期,大模型技術或將進入瓶頸期,其賦能各行業(yè)的應用場景和商業(yè)模式將趨于穩(wěn)定。隨著公眾接受度提高,市場探索重心有望轉向腦機接口、人形機器人等高端智能產品,或者與新技術和產業(yè)碰撞融合,相應的,大模型相關倫理風險極有可能轉移焦點或暴露新要素,特別是在臨床、養(yǎng)老、教育、金融等高風險領域。
馬上消費人工智能研究院院長陸全表示,目前國內大模型正加速商業(yè)化落地,通用基礎類大模型與行業(yè)領域類大模型參與者在各自賽道中尋找最優(yōu)解。他認為,通用大模型需從一開始就做好五大方向的技術治理,即安全體系、標準體系、合規(guī)檢查、幻覺檢測、動態(tài)評價機制。行業(yè)領域大模型可限定在金融等具體場景,明確金融行業(yè)和具體場景的限制條件,相比通用場景,細分場景的規(guī)則更明確、數(shù)據(jù)質量更高、標準較易統(tǒng)一。同時,行業(yè)領域大模型為了確保安全合規(guī),甚至不惜損失部分性能表現(xiàn),如限制大模型只在給定的文檔內容的范圍內生成知識內容。
面向未來,隨著AI技術的不斷發(fā)展,AI將變得越來越強大,對于通用AI發(fā)展及其潛在的安全、倫理等問題,全球需未雨綢繆,通力合作,確保AI技術更普惠、安全可靠、可控地發(fā)展,造福全人類。