勒川
2023年被稱作ChatGPT元年。全世界驚嘆之余,也給AIGC帶來新動(dòng)能和新思考。時(shí)代級(jí)機(jī)遇,中國(guó)企業(yè)應(yīng)該如何把握?ChatGPT所引領(lǐng)的AI新紀(jì)元,又將如何改變我們生活的方方面面?且聽業(yè)界專家如何給出答案。
這是全人類的機(jī)遇!全球性“AI再造”已經(jīng)拉開序幕,跟不上的企業(yè)將徹底失去未來的競(jìng)爭(zhēng)力。模型即服務(wù)將催生萬億級(jí)別的市場(chǎng)。與其說這是“iPhone時(shí)刻”,這波浪潮更像是PC互聯(lián)網(wǎng)初期。
我們正處于一個(gè)關(guān)鍵節(jié)點(diǎn)。ChatGPT所引領(lǐng)的AIGC新紀(jì)元,正在重新定義我們的生產(chǎn)生活。這場(chǎng)全球風(fēng)暴,每個(gè)人應(yīng)該如何把握?中國(guó)企業(yè)又有什么樣的新機(jī)遇和挑戰(zhàn)?3月29日,首屆中國(guó)AIGC產(chǎn)業(yè)峰會(huì)現(xiàn)場(chǎng),業(yè)界大咖和專家群起激辯,深度探討AIGC新世界,ChatGPT商業(yè)化的路徑與思考,以及AI產(chǎn)業(yè)新價(jià)值。
AIGC新世界
周明(瀾舟科技創(chuàng)始人兼CEO)
進(jìn)入AI?2.0不代表一定要拋棄1.0的技術(shù)
ChatGPT和之前的大模型有什么區(qū)別?首先,ChatGPT對(duì)用戶的意圖理解非常清晰,也更加準(zhǔn)確;其次,多輪對(duì)話的建模非常好,還有若干解析能力。但是,站在工業(yè)界角度,很多需要解析能力的任務(wù)用單獨(dú)的引擎能比ChatGPT效果更好。所以,找到ChatGPT的應(yīng)用場(chǎng)景非常關(guān)鍵。To?C時(shí),AGI能力越多越好,用戶在簡(jiǎn)單界面完成所有調(diào)用;To?B環(huán)境下,問題理解、多輪對(duì)話的能力,接上企業(yè)自己的核心引擎,會(huì)有更好結(jié)合。
ChatGPT出現(xiàn)后,涌現(xiàn)了單模型、單任務(wù)永遠(yuǎn)出不來的能力,于是邁入AI?2.0時(shí)代,它的特點(diǎn)是一個(gè)模型N個(gè)任務(wù),未來甚至一個(gè)模型可以解決無窮個(gè)任務(wù)。
但是,企業(yè)內(nèi)部使用時(shí),會(huì)發(fā)現(xiàn)AGI很多功能用不上,一些能力反而還會(huì)出現(xiàn)搗亂的可能。
以此為背景,企業(yè)進(jìn)行數(shù)智化轉(zhuǎn)型時(shí),不要追求必須用AI?2.0、一定要拋棄AI?1.0。企業(yè)應(yīng)該試圖把AI?1.0功能引擎和AI?2.0部分能力(如問題理解和多輪對(duì)話的能力)無縫對(duì)接起來,形成一縱一橫的合力,練模型的團(tuán)隊(duì)和用模型的團(tuán)隊(duì)持續(xù)產(chǎn)生交互,共同提升效率。
瀾舟在做大模型時(shí),尤其考慮了企業(yè)落地的問題。不用非得做ChatGPT,在AIGC領(lǐng)域重點(diǎn)突出關(guān)鍵詞生成、自定義模板、文圖工作等能力,把模型做得又輕又好,再結(jié)合用戶需求,企業(yè)數(shù)據(jù)就能巧妙利用起來。
徐元春
(小冰公司COO)
任何一項(xiàng)技術(shù)的誕生都為產(chǎn)生產(chǎn)業(yè)價(jià)值
AI內(nèi)容生成的價(jià)值,不僅在于降本增效,更重要的維度在于解決問題、提高效率、創(chuàng)造場(chǎng)景。其中,提高效率是最顯著,也最容易被理解的一點(diǎn)。比如視頻領(lǐng)域,2022年卡塔爾世界杯期間,解說員劉建宏的節(jié)目,超過半數(shù)都是在他本人錄制的基礎(chǔ)上,由AI復(fù)刻形象、合成聲音生成的。
提升效率關(guān)鍵在于高并發(fā)和穩(wěn)定性,強(qiáng)調(diào)穩(wěn)定性的原因,在于很多技術(shù)在實(shí)驗(yàn)室實(shí)現(xiàn)了算法價(jià)值,但最后一公里的落地非常艱難,所以技術(shù)的工業(yè)化應(yīng)用標(biāo)準(zhǔn)要達(dá)到穩(wěn)定性的要求。
在解決問題方面,所有的AI公司或科技公司都應(yīng)該認(rèn)識(shí)到,需要解決的問題應(yīng)當(dāng)是產(chǎn)業(yè)尤其是傳統(tǒng)產(chǎn)業(yè)迫切需要關(guān)注和改變的真實(shí)痛點(diǎn)。
舉例來說,利用AIGC能力創(chuàng)造和生成虛擬數(shù)字員工,就是在企業(yè)現(xiàn)有IP不改變和不稀釋的情況下,能夠在多時(shí)空、多場(chǎng)合創(chuàng)造更多內(nèi)容——這是一個(gè)IP最主要的資產(chǎn)和核心生產(chǎn)力。
另外還有拓展新場(chǎng)景。除了利用數(shù)字孿生技術(shù),用虛擬人生產(chǎn)、傳播內(nèi)容,獲得更廣泛的流量,讓運(yùn)營(yíng)團(tuán)隊(duì)和IP解耦、內(nèi)容和形象解耦,滿足大量的內(nèi)容輸出需求。
比如,數(shù)字員工可以直播更多場(chǎng)次。這里提到直播不再局限于視頻錄播,還有實(shí)時(shí)直播,包括在海外利用當(dāng)?shù)卣Z言、當(dāng)?shù)匚淖只貜?fù)直播間問題,和用戶產(chǎn)生實(shí)時(shí)互動(dòng)和實(shí)際交流,最終觸發(fā)購買行為。
在這個(gè)場(chǎng)景里,虛擬人和AIGC的融合達(dá)成交易、促成銷售,從這個(gè)角度來講,AIGC不僅產(chǎn)生內(nèi)容,也產(chǎn)生了實(shí)實(shí)在在的銷售收入?;诖耍绾巫屇P透舆m合推薦,是大模型里更加傳統(tǒng)化的應(yīng)用。
方漢
(昆侖萬維CEO)
AIGC最大社會(huì)意義是提供低成本終極解決方案
首先AIGC商業(yè)模式落地這一方面,我觀察到兩大定律:第一,用戶創(chuàng)作門檻降低,內(nèi)容創(chuàng)作數(shù)量增加十倍;第二,C端工具商業(yè)邏輯是社區(qū),B端實(shí)質(zhì)則是功能的完備性。
其次是AIGC對(duì)生產(chǎn)者的影響。對(duì)于存量知識(shí)的理解和表達(dá),AIGC將以低廉的成本做到80分的水準(zhǔn)。如果我們?nèi)祟愐仓荒茏龅?0分,那工作一定會(huì)被替代;只有80分以上的人,才能去管理“AIGC操作員”,完成曾經(jīng)需要腰部工作者去完成的工作,并極大地提升產(chǎn)量,而腰部工作者將大概率被淘汰。
第一,開源大模型是商業(yè)閉源大模型的有力補(bǔ)充和替代。就像ChatGPT可以想象成早期的Windows。Windows的存在是整個(gè)電腦商業(yè)軟件領(lǐng)域的一個(gè)基石,也是絕大多數(shù)人的生產(chǎn)工具,而Linux通過30年的努力把自己變成Windows替代。因此像“Linux”一樣的開源大模型也一定會(huì)出現(xiàn)。
第二,只有開源模式才可以滿足用戶的長(zhǎng)尾需求。比如Stable?Diffusion,其質(zhì)量、性能都低于DALL·E2、Midjourney,但用戶增長(zhǎng)很快,而且還催生了許多二次開發(fā)工具,解決剛性問題??煽厣勺鳛?AI?創(chuàng)作最后一道高墻,極有可能在可預(yù)見的時(shí)間內(nèi)有進(jìn)一步突破。
第三,各種AIGC工具能力仍受到預(yù)訓(xùn)練大模型限制,這點(diǎn)在GPT-4出現(xiàn)之后更加突出。
未來AIGC對(duì)整個(gè)社會(huì)最大意義,是提供了低成本終極解決方案;其次是將徹底改變藝術(shù)創(chuàng)作生產(chǎn)方式,最后具體到內(nèi)容生成,大量創(chuàng)作內(nèi)容的涌現(xiàn),讓VR和元宇宙變得更加可行。
類ChatGPT商業(yè)化
關(guān)瑋雅
(微軟大中華區(qū)首席戰(zhàn)略官)
每個(gè)應(yīng)用程序都可以由?AI?來驅(qū)動(dòng)
越來越多的組織和機(jī)構(gòu)正向云原生、AI技術(shù)轉(zhuǎn)型??梢詴诚朐谌斯ぶ悄軙r(shí)代,每個(gè)應(yīng)用程序都能通過AI驅(qū)動(dòng),實(shí)現(xiàn)更高的效率、更好的用戶體驗(yàn)。
OpenAI的成功可以歸結(jié)為四個(gè)方面:強(qiáng)大的人才梯隊(duì),先進(jìn)的技術(shù)底座,秉承長(zhǎng)期主義的研究和投入,開放合作的文化。
除此之外,微軟對(duì)于OpenAI的發(fā)展也做出了積極的貢獻(xiàn):10億美金的戰(zhàn)略投資以及打造了世界前五的超級(jí)計(jì)算機(jī),同時(shí)提供多元化、商業(yè)化的路徑。
通過企業(yè)聯(lián)合,不僅訓(xùn)練出了震驚世界的多個(gè)大型AI模型,更將AI技術(shù)與微軟的全線產(chǎn)品深度結(jié)合,讓企業(yè)、個(gè)人都能享受AIGC帶來的潛力與可能。
AIGC的創(chuàng)業(yè)路徑,可以分成三個(gè)功能維度:
第一類是幫助企業(yè)降低運(yùn)營(yíng)成本,比如最近推出的Microsoft?365?Copilot。
第二類是提高客戶滿意度和產(chǎn)品體驗(yàn),比如,通過語音交互技術(shù),幫助不同類型企業(yè)為消費(fèi)者提供個(gè)性化產(chǎn)品,這一點(diǎn)在數(shù)字人技術(shù)體現(xiàn)尤為明顯。
第三類,AGI(通用人工智能)作為一種革命性的技術(shù),也承擔(dān)著非常重要的社會(huì)責(zé)任。比如為殘障人士提供更加便捷的生活服務(wù)。
同樣,AIGC在不同行業(yè)的商用想象,也是實(shí)實(shí)在在而具體的,比如制造業(yè)、智能車、金融、醫(yī)療、游戲、娛樂、教育等領(lǐng)域。
對(duì)于企業(yè)而言,如何將AI戰(zhàn)略提升到CEO的級(jí)別?哪些場(chǎng)景應(yīng)該作為首選開展試點(diǎn)落地?又如何定位在AI時(shí)代下企業(yè)的核心能力,以及人才素質(zhì)模型?如何重塑企業(yè)的流程、組織、文化,來更好地迎接新一代生產(chǎn)力革命?這些是所有企業(yè)家需要深度思考的問題。
袁佛玉
(百度集團(tuán)副總裁)
文心一言將改變?cè)朴?jì)算游戲規(guī)則
文心一言將根本性地改變?cè)朴?jì)算市場(chǎng)游戲規(guī)則。源于大模型和生成式AI的兩大突破,全球性“AI再造”已經(jīng)拉開序幕,跟不上的企業(yè)將徹底失去未來的競(jìng)爭(zhēng)力。
首先,這是百度多年技術(shù)積累和敏銳洞察。一方面,如果沒有長(zhǎng)達(dá)13年、高達(dá)千億元的技術(shù)研發(fā)投入,根本就不可能出現(xiàn)文心一言這個(gè)大模型。另一方面,去年就曾精準(zhǔn)預(yù)測(cè)過技術(shù)層面的方向性改變,也就是生成式AI。今年文心一言將與百度搜索、小度、Apollo自動(dòng)駕駛等業(yè)務(wù)融合,但更大的故事在云計(jì)算。百度智能云有信心成為引領(lǐng)者。
其次,生成式AI的興起,將給生產(chǎn)經(jīng)營(yíng)效率與用戶體驗(yàn)效果帶來“雙效”提升,將徹底改變所有行業(yè),加速實(shí)現(xiàn)社會(huì)“智能化躍遷”。這一點(diǎn)從文心一言所釋放出的能力就可以看出,可以幫助千行百業(yè)實(shí)現(xiàn)AI再造。
再者,今天IT技術(shù)棧已適配AI技術(shù)發(fā)展的四層架構(gòu)(芯片、框架、模型、應(yīng)用)。云計(jì)算的主流商業(yè)模式將從IaaS(基礎(chǔ)設(shè)施即服務(wù))變?yōu)镸aaS(模型即服務(wù))。
中國(guó)擁有全世界最先進(jìn)、最完整的產(chǎn)業(yè)鏈,它能產(chǎn)生大量真實(shí)的行業(yè)需求、用戶反饋,這會(huì)極大推動(dòng)生成式AI快速發(fā)展,并且隨著生成式AI在數(shù)字和實(shí)體經(jīng)濟(jì)落地,模型即服務(wù)(MaaS)將催生萬億級(jí)別的新市場(chǎng)。
高建清
(科大訊飛AI研究院常務(wù)副院長(zhǎng))
認(rèn)知智能大模型將帶來重大產(chǎn)業(yè)顛覆和機(jī)遇
整體而言,科大訊飛在AIGC三大模塊,即音頻創(chuàng)造、視覺創(chuàng)造和文本創(chuàng)造方面,都有積累和進(jìn)展。以音頻創(chuàng)造這一關(guān)鍵技術(shù)為例,我認(rèn)為未來有兩大關(guān)鍵趨勢(shì):一是交互領(lǐng)域?qū)崿F(xiàn)更好的擬人化、情感化甚至口語化;二是內(nèi)容生產(chǎn)領(lǐng)域,對(duì)音色、音律、口音等語義信息進(jìn)行更好的控制。
目前,語音合成已經(jīng)應(yīng)用在新聞播報(bào)、紀(jì)錄片旁白、游戲解說、廣告直播等十多個(gè)領(lǐng)域。
在AIGC浪潮下,語音創(chuàng)造方面也有一些關(guān)鍵發(fā)展趨勢(shì):既可以利用大語言模型,如Audio?LLM方案,對(duì)語音合成中的關(guān)鍵因素進(jìn)行控制;也可以更好地利用AIGC追求聲音藝術(shù),通過插入音效、環(huán)境音,對(duì)語音合成感受進(jìn)行改善。
視覺方面,科大訊飛積累了以虛擬人為核心的完整視頻創(chuàng)造能力,包括虛擬人生成和復(fù)刻等。利用AIGC,虛擬人的發(fā)展趨勢(shì)是以虛擬人為中心形成從文本到聲音到圖像的全棧視覺生成能力。
文本生成方面,2023年起,科大訊飛也開始將文本生成能力接入行業(yè)應(yīng)用,尤其在醫(yī)療、教育領(lǐng)域。
高建清表示,認(rèn)知智能大模型將帶來重大產(chǎn)業(yè)顛覆和機(jī)遇:它將改變信息分發(fā)和獲取的模式、內(nèi)容生產(chǎn)的模式和人機(jī)交互的模式??拼笥嶏w將結(jié)合在場(chǎng)景、數(shù)據(jù)方面的理解,在教育、醫(yī)療、人機(jī)交互、辦公等方向進(jìn)行布局。預(yù)計(jì)今年5月,訊飛將發(fā)布在多個(gè)行業(yè)的大模型進(jìn)展情況。
張鵬
(智譜華章創(chuàng)始人兼CEO)
預(yù)訓(xùn)練大模型成為AIGC時(shí)代的基座
代碼生成插件CodeGeeX,它背后是130億參數(shù)、20多種編程語言代碼生成預(yù)訓(xùn)練模型,具有代碼生成、翻譯、注釋等功能,每天幫程序員編寫400萬行代碼。
還有前段時(shí)間啟動(dòng)第一階段內(nèi)測(cè)的類ChatGPT產(chǎn)品ChatGLM,有近2000人內(nèi)測(cè)規(guī)模,生成Token量超過730萬。它可以Cosplay聊天,在物理/數(shù)學(xué)類題目上求解。
除此之外,智譜還開源了其中的一個(gè)62億規(guī)模的大模型ChatGLM—6B,支持在單張GPU運(yùn)行,在第三方評(píng)測(cè)上,相當(dāng)于70%ChatGPT能力水平。
基于這一模型,智譜探索了MaaS(Model?as?service)的商業(yè)模式,既可以從模型訓(xùn)練、到最后應(yīng)用開發(fā)集成的端到端服務(wù),也可以像OpenAI提供API調(diào)用,還可以直接以商用方式供用戶使用。
具體實(shí)操即為大模型應(yīng)用群BigModel.ai,包括解決方案、產(chǎn)品、Demo等,比如編程輔助工具CodeGeeX、大模型輔助寫作應(yīng)用寫作蛙、個(gè)性化機(jī)器人小呆等。
AIGC產(chǎn)業(yè)基座是預(yù)訓(xùn)練大模型,原因在于兩個(gè)方面:第一,通用泛化能力,為AI研發(fā)降本增效,這是非常關(guān)鍵的特性;第二,融入更多知識(shí),讓大模型能更好模擬人的智能。但與此同時(shí)也面臨著一些挑戰(zhàn),比如成本高昂、訓(xùn)練數(shù)據(jù)巨大,周期長(zhǎng)等。
時(shí)代新機(jī)遇
林詠華
(智源研究院副院長(zhǎng)、總工程師)
大模型已經(jīng)從語言模型上升成為認(rèn)知模型
過去幾年大模型頻繁現(xiàn)身,有兩個(gè)趨勢(shì)可以總結(jié),一個(gè)是模型尺寸越來越大,開始是1億參數(shù),現(xiàn)在已經(jīng)超過了萬億參數(shù);另一個(gè)是單語言模態(tài)變成多模態(tài)。由此,關(guān)注大模型新趨勢(shì)時(shí),不僅要在研究領(lǐng)域證明它的創(chuàng)新性,還要直視產(chǎn)業(yè)落地時(shí)帶來的新挑戰(zhàn)。
從ChatGPT、GPT-4身上爆發(fā)出的泛化能力出發(fā),大模型已經(jīng)從語言模型上升成了認(rèn)知模型。
未來10年里,大模型面臨最重要的大挑戰(zhàn):
超大參數(shù)量。到底多大參數(shù)可以支持應(yīng)用需求?是盲目追求千億模型,還是百億模型就足夠?
訓(xùn)練數(shù)據(jù)。具體多少訓(xùn)練數(shù)據(jù)能喂飽一個(gè)百億或千億模型?多少的信息和數(shù)據(jù)可以傳遞到下游任務(wù)?
評(píng)測(cè)任務(wù)。從單模態(tài)走向多模態(tài),怎么評(píng)測(cè)已經(jīng)走向認(rèn)知的模型?
持續(xù)學(xué)習(xí)和定點(diǎn)糾錯(cuò)。如何進(jìn)行低成本的知識(shí)和信息吸納?發(fā)現(xiàn)錯(cuò)誤時(shí)怎么做到定點(diǎn)糾錯(cuò)?
可以看到,水面之上的冰山,顯露出文生對(duì)話式任務(wù)生成模型等AIGC應(yīng)用,但水面之下還有厚厚的冰山技術(shù)棧,用以支撐水面上的冰山一角。因此,大模型評(píng)測(cè)方法擺到了更為重要的位置。
目前,智源研究院正在聯(lián)合多個(gè)研究隊(duì)伍、機(jī)構(gòu)、廠商,一起打造AI基礎(chǔ)大模型評(píng)測(cè)系統(tǒng)。另外,智源還在自建AI大模型智算平臺(tái),針對(duì)大模型訓(xùn)練進(jìn)行多任務(wù)優(yōu)化,并且還在研究跨芯片架構(gòu)的下一代AI編譯器技術(shù)。
過去10年,AI的快速發(fā)展離不開開源開放的推動(dòng)。智源現(xiàn)在就圍繞大模型從底向上的技術(shù)體系,打造了FlagOpen這樣一個(gè)技術(shù)開源體系,把算法、數(shù)據(jù)、模型、評(píng)測(cè)系統(tǒng)等開源出來,讓更多開發(fā)者企業(yè)加入,共同打造大模型的全棧技術(shù)。
楊帆
(商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁)
技術(shù)突破和產(chǎn)業(yè)化之間的窗口期大大縮短
當(dāng)全社會(huì)在關(guān)注ChatGPT和大語言模型時(shí),不能忽視整個(gè)AI在最近幾年的核心突破其實(shí)是全方位的。
ChatGPT的技術(shù)進(jìn)展顯露出一個(gè)特征,即技術(shù)突破和形成產(chǎn)業(yè)化應(yīng)用之間的窗口期大大縮短,取而代之的是在這個(gè)環(huán)節(jié)更強(qiáng)的加速效應(yīng)。不難看到現(xiàn)在的市場(chǎng)上,全世界都有非常多的具體應(yīng)用在探索成熟。
這一切背后,不僅能看到暴力數(shù)據(jù)美學(xué),譬如大算力、超大規(guī)模計(jì)算資源的聚集、超大規(guī)模模型結(jié)構(gòu)的設(shè)計(jì)、海量數(shù)據(jù)匯聚,還能看到所有環(huán)節(jié)的強(qiáng)經(jīng)驗(yàn)積累。也就是說,現(xiàn)在的大模型研究,離不開大量的軟件工程系統(tǒng)問題,核心功耗需要持續(xù)地沉淀和積累。
這樣的技術(shù)到底會(huì)給AI產(chǎn)業(yè)帶來什么變化?
一是生產(chǎn)范式重大改變,再是因?yàn)楹诵哪芰τ写罅緾端因素,天然能打造更符合AI技術(shù)迭代的數(shù)據(jù)閉環(huán),形成很強(qiáng)的飛輪效應(yīng)。這意味著產(chǎn)品具備長(zhǎng)期持續(xù)性,商業(yè)壁壘門檻也更容易建立。
應(yīng)對(duì)這樣變化下的AI?2.0,AI?1.0的公司其實(shí)不會(huì)徹底被顛覆。商湯在2018年起就在做預(yù)訓(xùn)練大模型,它支撐著商湯整體業(yè)務(wù)的持續(xù)發(fā)展。
商湯平臺(tái)內(nèi)容“一平臺(tái)四支柱”中的“一平臺(tái)”,指的就是人工智能基礎(chǔ)設(shè)施“大裝置”。多年的持續(xù)投入,源于商湯堅(jiān)持認(rèn)為AI基礎(chǔ)設(shè)施未來會(huì)支撐更加百花齊放的產(chǎn)業(yè)生態(tài)。而從基礎(chǔ)設(shè)施層面講開去,大量模型設(shè)計(jì)和系統(tǒng)調(diào)優(yōu)經(jīng)驗(yàn)?zāi)軌蛑未竽P头?wù),幫助更多人迭代自有模型。
總體而言,這件事的核心價(jià)值在于,整個(gè)AI基礎(chǔ)設(shè)施會(huì)具備彈性和拓展性。通過提供全方位能力,商湯希望為整個(gè)人工智能基礎(chǔ)設(shè)施、市場(chǎng)及產(chǎn)業(yè),提供更加基礎(chǔ)化的支撐能力。
袁泉
(啟元世界創(chuàng)始人兼CEO)
AGI的中國(guó)式探索
啟元視角下,AGI從游戲開始,向互聯(lián)網(wǎng)、元宇宙破圈。首先是游戲世界中探索這個(gè)AGI,包括從零開始玩星際爭(zhēng)霸。第二階段則是往互聯(lián)網(wǎng)世界破圈。尤其Transformer出來之后,AGI在互聯(lián)網(wǎng)里面的商業(yè)價(jià)值比游戲大100倍。第三塊就是元宇宙,這是未來5—10年很重要的事情之一。
元宇宙本質(zhì)是互聯(lián)網(wǎng)豐富的語料、豐富的交互,加上3D開放世界游戲的合體。AIGC如何催生元宇宙、在元宇宙中如何訓(xùn)練AGI,是未來非常有價(jià)值的命題。
最后一步可能是AGI虛實(shí)遷移,服務(wù)或者應(yīng)用于現(xiàn)實(shí)世界中,這是啟元對(duì)趨勢(shì)的判斷。
這一過程中啟元的探索主要分為兩個(gè)階段,第一階段主要以在各類游戲中訓(xùn)練決策大模型為主,參數(shù)級(jí)別在幾千萬或者一億以內(nèi),能夠讓AI用小樣本,甚至從零開始,探索這一類任務(wù)的邊界。
第二階段是我們從2021年開始做的10億到100億參數(shù)的語言模型?;跊Q策大模型技術(shù)平臺(tái),目前啟元目標(biāo)圍繞能夠啟發(fā)人和陪伴人的AGI來展開,去年開始重點(diǎn)做陪聊NPC。這不僅是游戲領(lǐng)域,而是面向更廣泛地虛擬世界,比如一些歷史人物和二次元人物,用戶也想跟他們深度互動(dòng)。
比如我們基于劉備做了一個(gè)陪聊NPC,你問劉備為什么喜歡哭?怎么看待阿斗?他都能給出基于人設(shè)、基于事實(shí)的交互和對(duì)話。
啟元世界認(rèn)為,AGI服務(wù)任何場(chǎng)景,都離不開Understanding。啟元的初心和愿景,就是更多啟發(fā)人和陪伴人。