黃靖芳
風起云涌的AI浪潮里,新技術就像隨時改變市場格局的那個X因素,一旦能順利利用到自己身上,落后者也能先發(fā)制人;但如果切入的時機不合適,巨頭也會翻車。
如今,蘋果就是那個略為焦灼的巨頭,當他們從造車的項目里猛然回頭,發(fā)現(xiàn)競爭對手們已經(jīng)紛紛上岸,世界不一樣了。
布局生成式AI,蘋果罕見地成為了追趕者。
同樣是智能手機里的老大哥,三星似乎比蘋果先下一城。
2024年1月18日,三星推出了最新的高端旗艦機型Galaxy S24 Ultra、Galaxy S24+和Galaxy S24。作為首款搭載端側AI的機型,S24系列能完成很多輔助功能,給消費者帶來新的體驗。
AI能給智能手機帶來什么加成?在三星的發(fā)布會上,通話實時翻譯功能是外界最關注的功能之一,能幫助用戶在通話的同時標記實時的文字內容,還能在多種場合里進行翻譯和記錄。
另外,還有一個“即圈即搜”的功能,相當于如今淘寶識圖功能的升級版,無論在什么平臺里,AI都能直接識別文字、圖片、視頻里的信息。
目前,Galaxy AI功能還是免費使用的。對這款手機,三星上下抱有不小的期待。三星電子移動通信部門總裁自豪地宣稱:“三星Galaxy S24系列為未來十年移動設備的創(chuàng)新指明了方向。”
不過,業(yè)內人士不難發(fā)現(xiàn),這款新的旗艦機型缺席了三星自家的自研大模型,反而是選擇和谷歌合作,將Gemini AI模型預裝到Galaxy S24系列手機之中。
2023年11月,三星在首爾研發(fā)中心公布了其自行研發(fā)的生成式AI模型高斯(Gauss,以數(shù)學家高斯的名字命名),這個模型包括“Samsung Gauss Language”(語言)、“Samsung Gauss Code”(代碼)和“Samsung Gauss Image”(圖像)等子模型。當時,外界預計,基于這些生成式AI模型的產(chǎn)品有望很快推出。
實際上,高斯模型僅僅處于剛發(fā)布的階段,勉強能在PC端跑起來,距離在手機端側跑通有很長距離。自研大模型,并不是一件易事。
同為巨頭,蘋果也撞上了這堵墻。
13年前,當蘋果首次發(fā)布語音助手Siri時,通過NLP(自然語言理解)技術,實現(xiàn)了人工智能的漂亮開場??墒?,Siri伴隨著蘋果的封閉生態(tài),這限制了其可以訪問的數(shù)據(jù)量。
在這股AI浪潮里,機器學習的算法需要龐大的數(shù)據(jù)量才能有效運行和檢驗,封閉的生態(tài)導致了Siri無法在大樣本量的基礎上進行能力的提高。無法擁抱開源的技術,也就很難實現(xiàn)后續(xù)高效的開發(fā),也就導致了蘋果在生成式AI的潮流里留下“慢人一拍”的印象。
和三星的選擇類似,蘋果也找到了合作伙伴,試圖通過“強強聯(lián)手”,脫離目前的困境。
據(jù)彭博社報道,內部消息源透露蘋果正在與谷歌溝通,計劃將Gemini模型整合到其旗艦產(chǎn)品iPhone內。這個合作瞬間點燃了人工智能界,雙方用戶數(shù)量的規(guī)模和兩者合作的形式,有可能會重新定義AI行業(yè)的規(guī)則。
Gemini是谷歌開發(fā)的生成式AI模型套件,其特點和優(yōu)勢是能同時識別文本、圖像、音頻、視頻、代碼這五種不同的數(shù)據(jù)。有評測稱,在性能方面,Gemini對上述幾種數(shù)據(jù)的理解和對數(shù)學問題的推理,幾乎都超過了GPT-4。
所以,和谷歌聯(lián)手是時下蘋果“超車”的最佳選擇。另外,由于谷歌在中國受限制,蘋果也需要在合作領域找到國內靠譜的AI產(chǎn)品。3月25日,有消息稱蘋果將和百度合作,為在中國發(fā)布的iPhone 16等產(chǎn)品搭載AI功能。
不過,后來知情人士否認了這一說法。實際上,不管這個合作最后是否落地,蘋果的生成式AI發(fā)展需要幫手,并且需要在中國實現(xiàn)技術本地化的戰(zhàn)略,是顯而易見的。
蘋果的生成式AI發(fā)展需要幫手,并且需要在中國實現(xiàn)技術本地化的戰(zhàn)略,是顯而易見的。
不久前,蘋果CEO庫克現(xiàn)身上海,與演員鄭愷在黃浦江邊合照。在被媒體問到與中國在AI領域的合作時,他給出的回答是:“我們計劃在多個領域進行合作?!?h3>自研的路上
當然,蘋果也在同步自研AI大模型的開發(fā),他們的野心一點都不小。
2024年初,蘋果發(fā)布了一篇論文《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》,里面介紹了怎樣在一個有限存儲的基礎上運行大模型(LLM)。
因為大模型很大,需要占據(jù)很多的內存和算力,所以,蘋果團隊試圖通過大幅度提高內存使用的效率,支持設備的運行,并且保證推理的速度。
在這個領域,蘋果的研究成果還不少。最近發(fā)布的論文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》,提出了他們的MM1多模態(tài)大語言模型,最高30B參數(shù),并在多個方面取得了“最先進”的結果。
M1是蘋果的自制芯片,也許由于這個原因,他們把自己的大模型命名為MM1。在這篇論文里,蘋果分享了關于MM1多模態(tài)大語言模型的預訓練方法、分析和啟示。所謂多模態(tài),是指在各種格式(如圖像文件、視頻文件和音頻文件以及純文本數(shù)據(jù))上訓練的模型。通過這樣的大規(guī)模訓練,能夠在多項基準測試中實現(xiàn)最先進的少量樣本學習結果。
如今,蘋果顯而易見地展現(xiàn)著自己在戰(zhàn)略重心上往人工智能方向調整的決心。
過去,蘋果在發(fā)展AI戰(zhàn)略上搖擺過,他們希望在造車上先走一大步。在蘋果曾經(jīng)的設想里,Apple Car是一款顛覆時代的座駕,擁有全自動駕駛,沒有傳統(tǒng)的車鑰匙和方向盤,座椅有四個朝向。
但是,蘋果造車之路走得并不順暢,經(jīng)歷了人事上的變動以及項目研發(fā)上的受挫,量產(chǎn)越來越難。直到今年2月底,蘋果取消了長達十年、投入數(shù)十億美元的電動汽車項目。這一決定最初令參與的員工頗感意外,后來,從事汽車研發(fā)的員工相繼被調整至人工智能部門。
與此同時,蘋果的收購步伐也在加速。
據(jù)媒體報道,蘋果公司在今年早些時候收購了加拿大人工智能初創(chuàng)公司DarwinAI,后者的數(shù)十名員工已加入蘋果的人工智能部門。作為交易的一部分,DarwinAI聯(lián)合創(chuàng)始人、加拿大滑鐵盧大學人工智能研究員Alexander Wong目前已加入蘋果,擔任人工智能團隊的總監(jiān)。
DarwinAI的核心技術之一是讓AI系統(tǒng)變得更小、更快。這項技術可能對蘋果有幫助,因為蘋果正專注于在設備上運行AI,而不是完全在云端運行。
實際上,蘋果收購的動作比同行還要多。從2010年收購Siri開始,蘋果在十年時間里收購多達30余家AI初創(chuàng)公司,通過把初創(chuàng)企業(yè)納入自己的生態(tài),蘋果產(chǎn)品的功能得以愈加完善。
但是,就像高盛選擇把蘋果股票從其“確信買入”名單中剔除的原因一樣,蘋果一直給人缺乏清晰的人工智能戰(zhàn)略的印象。
而且別忘了,在中國,蘋果也是強敵環(huán)伺。
國內的市場里,“AI手機”似乎已經(jīng)不是什么大新聞。隨著本土品牌的創(chuàng)新和研發(fā)實力不斷增強,AI元素很快加入各家品牌的旗艦機型。
比如華為,是國內幾家頭部廠商中布局AI大模型最早的一家。2023年,華為率先將大模型接入手機,使得手機可以執(zhí)行文本生成、知識查找、資料總結、智能編排、模糊/復雜意圖理解等復雜任務。
蘋果收購的動作比同行還要多。從2010年收購Siri開始,蘋果在十年時間里收購多達30余家AI初創(chuàng)公司,通過把初創(chuàng)企業(yè)納入自己的生態(tài),蘋果產(chǎn)品的功能得以愈加完善。
而且,華為還開啟了內置大模型的語音助手小藝的眾測。這是在華為盤古L0基座大模型的基礎上,融入大量場景數(shù)據(jù),對模型進行精調,最后煉成的一個L1層對話模型,體現(xiàn)了華為大模型端云協(xié)同的能力。
“盤古大模型不作詩,只做事。”2023年華為開發(fā)者大會上,這一頗具古韻的話術將華為在大模型領域的定位講得很明確。華為云CEO表示,華為自研的盤古大模型3.0是一個完全面向行業(yè)提供服務,以行業(yè)需求為基礎設計的大模型體系。
除了華為,vivo、OPPO等廠商也發(fā)布了其自研大模型的進展。
vivo在2023年11月發(fā)布了搭載自研藍心大模型的X100系列手機,號稱是“國內首個運用AI預訓練大模型的手機產(chǎn)品”。 2024年1月8日,OPPO發(fā)布首個端側應用70億參數(shù)大語言模型手機Find X7。幾天后,榮耀發(fā)布了首款搭載自研70億參數(shù)端側平臺級“魔法大模型”。至此,中國手機市場上排名前五的國產(chǎn)手機廠商,都發(fā)布了其端側大模型的產(chǎn)品。
自研AI大模型為什么對手機廠商來說這么重要?核心的原因是,目前智能手機市場遇到了瓶頸,不管是國內還是國外的手機品牌,都發(fā)展到了難以直接刺激消費者產(chǎn)生換機欲望的程度。在這個背景下,人工智能浪潮恰如其時。語音識別、智能交互、更快響應等等的全新體驗,也許是激發(fā)智能市場消費升級的契機,也能為品牌進一步建立差異化優(yōu)勢。
這是蘋果所面臨的激烈競爭局面,也是其著急的原因所在。
值得一提的是,目前,在手機端運行AI大模型有兩種方法:一種是端側計算,一種是云端和端側同時運行;前者的難度在于如何提升內存容量,以及壓縮和優(yōu)化模型。相比起云端運行模型,蘋果更希望開發(fā)端側大模型,這樣會提升用戶的使用體驗,并且保障數(shù)據(jù)的安全。如果蘋果最終能成功研發(fā)并使之落地,那在體驗感和隱私性上將會超越對手,扳回一城。
自成一派的蘋果,最后是會走出自己的道路,還是兜兜轉轉回到原地,科技界都等著答案。