王雄
目前在AI行業(yè),大模型火到“破圈”。華為云盤古大模型的機(jī)場廣告在首都機(jī)場和深圳寶安機(jī)場亮相,主打“行業(yè)AI開發(fā)應(yīng)用優(yōu)選”的定位,引發(fā)了廣泛關(guān)注。
以往,AI大模型這類基礎(chǔ)設(shè)施層面的前沿技術(shù)極少在大眾廣告渠道被看到。如今,大模型不僅成為眾多AI行業(yè)峰會(huì)中被高頻討論的熱詞,在AI行業(yè)之外的影響力也日漸擴(kuò)大。這些都表明,AI大模型正在加速走出實(shí)驗(yàn)室,成為賦能各行各業(yè)的通用AI基礎(chǔ)設(shè)施。
自2020年OpenAI推出NLP大模型GPT3至今,全球范圍內(nèi)AI大模型迎來爆發(fā)式增長,參與企業(yè)越來越多,參數(shù)級別越來越大,成為新一輪AI競賽的賽場。目前,大模型吸引了谷歌、微軟、英偉達(dá)、華為、智源研究院、百度、阿里、商湯、浪潮及中科院自動(dòng)化所等科技巨頭和頂尖科研機(jī)構(gòu)參與其中,各家大模型的參數(shù)量級也從千億、萬億,迅速躍遷到了10萬億級別。
同時(shí)我們也看到,大模型火爆的背后卻面臨廣泛應(yīng)用的困局。技術(shù)很牛,落地很難,不夠接地氣成為業(yè)界對大模型發(fā)展的普遍認(rèn)知。大模型百家爭鳴的格局背后,AI行業(yè)更需要冷思考。
AI大模型應(yīng)該為應(yīng)用而生
為什么眾多科技巨頭扎堆推出大模型?
這要回歸到AI落地的核心挑戰(zhàn)。國際歐亞科學(xué)院院士、華為云人工智能領(lǐng)域首席科學(xué)家、IEEE Fellow田奇認(rèn)為,AI進(jìn)入千行百業(yè)面臨很多挑戰(zhàn),其中最重要有3點(diǎn):第一,AI場景碎片化使得AI技術(shù)難以大規(guī)模復(fù)制。傳統(tǒng)的定制化、作坊式的模型開發(fā)方式是“一個(gè)場景一個(gè)模型”,無法復(fù)用和積累,導(dǎo)致AI開發(fā)的高門檻、高成本;第二,如何將行業(yè)知識(shí)與AI技術(shù)相結(jié)合,跨越行業(yè)專業(yè)技術(shù)知識(shí)與AI技術(shù)之間的鴻溝;第三,AI技術(shù)一直面臨攻擊、隱私、安全以及可解釋性方面的難題。
AI大模型擁有超大規(guī)模參數(shù)、巨量訓(xùn)練數(shù)據(jù),通過模型的巨量化可以提高人工智能的通用屬性,降低人工智能的應(yīng)用門檻。正因?yàn)橹睋鬉I落地的挑戰(zhàn),大模型成為很多AI企業(yè)的共識(shí)。
那么,AI大模型能帶來科學(xué)計(jì)算的范式革命嗎?目前還存在哪些局限?2021年10月,華為云AI院長峰會(huì)匯聚了AI產(chǎn)學(xué)研各界的最強(qiáng)大腦,來自華為的AI科學(xué)家與來自中國科學(xué)院、中國工程院以及國內(nèi)30余所頂尖高校的數(shù)十名院長、教授關(guān)于AI大模型的現(xiàn)狀和前景進(jìn)行了專業(yè)的探討。各界大咖普遍認(rèn)為,目前AI大模型最大挑戰(zhàn)在應(yīng)用落地,如何讓更多行業(yè)和場景真正用起來。
首先,不是所有場景都需要大模型。大模型在醫(yī)藥研發(fā)、衛(wèi)星遙感、災(zāi)害評估、自然生態(tài)監(jiān)測等場景有巨大價(jià)值,但一些數(shù)據(jù)量小、任務(wù)并不復(fù)雜的場景,并不適合使用大模型,相當(dāng)于“大炮打蚊子”。
其次,大模型不是參數(shù)數(shù)量越大越好,如何廣泛應(yīng)用才是最大價(jià)值和難點(diǎn)。大模型應(yīng)用價(jià)值取決于其泛化能力,能否快速適配不同場景。
一位AI領(lǐng)域教授認(rèn)為:“大模型不在于大,而在于能不能解決應(yīng)用的問題,是不是來自于真正的需求,怎么樣能夠在更廣泛的應(yīng)用場景中用起來,這是目前大模型最大的挑戰(zhàn)。”
“大模型應(yīng)該是AI走向下一個(gè)時(shí)代的跳板,大模型的大一定是體現(xiàn)它能夠去掌握、組織更大量的數(shù)據(jù),而不是模型的參數(shù)量大?!币晃蝗A為云高級研究員也持同樣的觀點(diǎn)。
第三,大模型不是萬能的,不應(yīng)該希望一個(gè)大模型能解決所有問題。
“如果大模型想要實(shí)際用得比較好,一定要有配套的工作流,如果把下游的工作流程給搭建起來,大模型在很多場景上能夠得到比較好的應(yīng)用?!痹摳呒壯芯繂T表示。
深入AI落地的無人區(qū)
如果說參數(shù)的直觀對比類似外行看熱鬧,那么,落地能力才是大模型實(shí)力的真正較量。
目前,大模型在落地層面還處在探索的初期,各大科技巨頭都在摸索嘗試。其中華為云盤古大模型在行業(yè)應(yīng)用方面走得更遠(yuǎn),已經(jīng)在能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境和物流等行業(yè)的100多個(gè)場景實(shí)際應(yīng)用,讓企業(yè)的AI應(yīng)用開發(fā)效率平均提升了90 %。
2021年4月華為云發(fā)布的盤古系列預(yù)訓(xùn)練大模型具有超大規(guī)模參數(shù)、超高精度的特質(zhì),還提供模型預(yù)訓(xùn)練、微調(diào)、部署和迭代的功能,以減少行業(yè)側(cè)的數(shù)據(jù)標(biāo)注依賴,從而降低人工智能開發(fā)的門檻和成本。
華為云盤古系列大模型包括NLP中文語言大模型、CV視覺大模型、多模態(tài)大模型和科學(xué)計(jì)算大模型。盤古大模型家族還在不斷壯大,2021年9月華為云新推出盤古藥物分子大模型,其研究了17億個(gè)小分子的化學(xué)結(jié)構(gòu),可以高效生成藥物新分子,計(jì)算蛋白質(zhì)靶點(diǎn)匹配,預(yù)測新分子生化屬性,并對篩選后的先導(dǎo)藥進(jìn)行定向優(yōu)化,實(shí)現(xiàn)全流程的AI輔助藥物設(shè)計(jì)。
在眾多行業(yè)場景中,還存在著大量AI尚未落地的無人區(qū)。其中很多場景都有這樣的特征:樣本復(fù)雜多樣且不均衡,如果使用傳統(tǒng)AI模型標(biāo)注成本高、效率低、準(zhǔn)確率也有待提升。這些場景正是盤古AI大模型的典型應(yīng)用場景之一。盤古大模型把自己化作AI世界的開路先鋒,深入傳統(tǒng)AI模型難以觸及的領(lǐng)域,不斷探索AI落地的前沿。
在電力行業(yè),國網(wǎng)重慶永川公司在智能電力巡檢場景用無人機(jī)代替人工進(jìn)行缺陷檢測,但面臨海量數(shù)據(jù)標(biāo)注工作量大和缺陷種類繁多等問題。盤古CV大模型利用海量無標(biāo)注電力數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并結(jié)合少量標(biāo)注樣本微調(diào)的高效開發(fā)模式,提出了針對電力行業(yè)的預(yù)訓(xùn)練模型。應(yīng)用之后,樣本篩選效率提升約30倍,篩選質(zhì)量提升約5倍,以永川每天采集5萬張高清圖片為例,相對人工標(biāo)注一天可節(jié)省170人。
同時(shí),結(jié)合華為云盤古大模型搭載的自動(dòng)數(shù)據(jù)增廣以及類別自適應(yīng)損失函數(shù)優(yōu)化策略,可以做到一個(gè)模型適配上百種缺陷,一個(gè)模型就可以替代永川原先的20多個(gè)小模型,極大地減少了模型維護(hù)成本,平均精度提升18.4 %,模型開發(fā)成本降低90 %。
在金融行業(yè),金融機(jī)構(gòu)擔(dān)保貸款通常要求企業(yè)提供不動(dòng)產(chǎn)擔(dān)保。原因在于動(dòng)產(chǎn)移動(dòng)性較強(qiáng),很難控制動(dòng)產(chǎn)的去向和價(jià)值,監(jiān)管難度大,銀行提供貸款風(fēng)險(xiǎn)較高。因此動(dòng)產(chǎn)很難作為抵押物進(jìn)行融資貸款,造成中小企業(yè)融資難的困境。
浦發(fā)銀行的浦惠云倉項(xiàng)目利用人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈、金融科技等相關(guān)技術(shù),能夠智能地監(jiān)測收貨、入庫、在庫、出庫等環(huán)節(jié),識(shí)別異常行為,確保貨物“不調(diào)包”和貨物數(shù)量準(zhǔn)確。該項(xiàng)目采用華為云盤古大模型,用一個(gè)模型覆蓋全部9種物流場景,通過對人員異常行為、入庫/出庫異常檢測、叉車軌跡異常識(shí)別等全部流程檢測,實(shí)現(xiàn)了對動(dòng)產(chǎn)的實(shí)時(shí)監(jiān)管,增強(qiáng)了銀行風(fēng)控能力。另外數(shù)字化也提高了動(dòng)產(chǎn)解質(zhì)押、出庫、進(jìn)入市場等環(huán)節(jié)的流通時(shí)間,將原來的120天資金占用回款周期縮短到20~30天,大幅降低了企業(yè)的融資成本。
在生態(tài)監(jiān)測方面,華為云盤古科學(xué)計(jì)算大模型實(shí)現(xiàn)了對全球海浪浪高的實(shí)時(shí)預(yù)測,在精度和覆蓋范圍與傳統(tǒng)科學(xué)計(jì)算相當(dāng)?shù)幕A(chǔ)上,將預(yù)測速度提升到了原來的10 000倍。
在時(shí)尚產(chǎn)業(yè),華為云盤古多模態(tài)大模型強(qiáng)大的跨模態(tài)檢索、跨模態(tài)生成能力,不斷延伸AI的創(chuàng)造力。通過以文搜圖和以圖搜文能力,可以實(shí)現(xiàn)趨勢預(yù)測。通過以文生圖和以圖生圖能力,盤古多模態(tài)大模型可以通過文本控制來快速生成服裝圖片,供人類設(shè)計(jì)師參考。
優(yōu)秀的泛化能力是如何煉成的
當(dāng)大模型普遍受困于落地難題,為什么盤古大模型率先做到了廣泛應(yīng)用?這離不開其開發(fā)過程中首次采用的眾多領(lǐng)先技術(shù)。
比如,盤古大模型首次在對比度自監(jiān)督學(xué)習(xí)中引入了樣本相似性,使得小樣本學(xué)習(xí)的能力獲得了顯著提升。盤古CV大模型是首個(gè)判別與生成聯(lián)合預(yù)訓(xùn)練的模型,其小樣本學(xué)習(xí)在10 %的標(biāo)簽分類上精度達(dá)到了業(yè)界第一。盤古大模型首創(chuàng)采用“階段式訓(xùn)練”和“動(dòng)態(tài)冰化”策略,顯著提升大模型訓(xùn)練的穩(wěn)定性和效率;在下游應(yīng)用中,僅需少量樣本和學(xué)習(xí)參數(shù)即可完成千億規(guī)模大模型的快速微調(diào)和下游適配等。
作為盤古大模型的設(shè)計(jì)師,田奇此前曾表示,盤古大模型設(shè)計(jì)之初秉持了三個(gè)核心原則:“第一,網(wǎng)絡(luò)規(guī)模要大;第二,模型大但不能臃腫,有強(qiáng)壯的網(wǎng)絡(luò)架構(gòu),希望它是百米冠軍,系統(tǒng)的性能要做到極致,綜合性能提升10 %以上;第三,希望它有優(yōu)秀的泛化能力,也就是場景覆蓋率要高,不僅是單項(xiàng)的百米冠軍,也希望是10項(xiàng)全能冠軍。”
之所以堅(jiān)持這樣的技術(shù)路線,源自盤古大模型的初衷:讓AI開發(fā)由作坊式向工業(yè)式轉(zhuǎn)變,降低行業(yè)AI開發(fā)應(yīng)用門檻,讓大模型真正走進(jìn)千行百業(yè),不再只是大資本和大實(shí)驗(yàn)室的專屬。在AI走向千行百業(yè)過程中,華為云盤古大模型在行業(yè)落地方面快人一步,能夠幫助行業(yè)專家快速掌握AI技能。
放眼全球AI產(chǎn)業(yè),大模型已經(jīng)成為國際間AI技術(shù)競爭的一個(gè)熱點(diǎn),通過大模型構(gòu)筑中國AI技術(shù)競爭壁壘,是這一代中國科技企業(yè)的機(jī)遇和挑戰(zhàn)。中國工程院院士、鵬城實(shí)驗(yàn)室主任、北京大學(xué)信息科學(xué)技術(shù)學(xué)院院長、教授高文院士曾指出,中國的人工智能產(chǎn)業(yè)有政策支持、數(shù)據(jù)資源、應(yīng)用場景、青年人才4個(gè)長板。其中,豐富的數(shù)據(jù)資源和應(yīng)用場景是我國AI產(chǎn)業(yè)非常突出的優(yōu)勢。
將散落在各行各業(yè)的數(shù)據(jù)生產(chǎn)要素價(jià)值發(fā)揮到極致,AI大模型大有可為,尤其是當(dāng)AI大模型與行業(yè)專家的知識(shí)相結(jié)合,必將開啟新一輪的AI應(yīng)用浪潮,爆發(fā)出巨大的價(jià)值。