李振華 宮海韻 唐偉城
摘要:2022年末,以ChatGPT為代表的大語言模型技術(shù)橫空出世,顯著提升了人工智能認知力、推理力以及語言力。與此同時,金融行業(yè)也在逐步探索生成式AI在金融資訊、投顧、投研等領(lǐng)域的應用。目前,生成式AI應用于金融行業(yè),在技術(shù)層面可控性、專業(yè)性以及安全性方面仍有待提升,行業(yè)層面也面臨著算力、訓練語料不足等制約。為了使生成式AI更有效地服務于金融行業(yè),海內(nèi)外市場機構(gòu)積極探索知識增強、工具增強、數(shù)據(jù)增強等方式,不斷改進生成式AI在金融行業(yè)應用的安全可靠性;監(jiān)管機構(gòu)亦開展治理規(guī)范和行業(yè)指引探索,為新技術(shù)應用保駕護航。人工智能作為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的技術(shù),如何促進其在金融行業(yè)釋放價值將成為國內(nèi)外監(jiān)管機構(gòu)和市場主體關(guān)注的重點。建議通過建設(shè)規(guī)模化算力基礎(chǔ)、行業(yè)數(shù)據(jù)集、開放多元的模型生態(tài)等舉措支持生成式AI不斷完善,從而推動金融業(yè)高質(zhì)量數(shù)智化升級。
關(guān)鍵詞:生成式AI;金融行業(yè);數(shù)智化轉(zhuǎn)型;人工智能治理
中圖分類號:F830? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ?文章編號:1007-0753(2024)03-0003-09
金融行業(yè)一直是先進技術(shù)應用的先行者。過去幾十年,計算機、移動互聯(lián)網(wǎng)、云計算、AI等技術(shù)推動了金融業(yè)從信息化走向數(shù)字化。在數(shù)字化階段,移動互聯(lián)網(wǎng)技術(shù)推動了金融服務的線上化、場景化,讓更多的用戶能夠享受到更便捷、多樣化的金融服務。2022年末,以ChatGPT為代表的大語言模型技術(shù)顯著提升了人工智能的認知力、推理力、語言力,人工智能將引領(lǐng)新一輪的科技革命和產(chǎn)業(yè)變革。展望未來,數(shù)字金融作為中央金融工作會議提出的“五篇大文章”之一,人工智能有望推動數(shù)字金融跨越式發(fā)展,引領(lǐng)金融行業(yè)變革,助力實現(xiàn)金融強國戰(zhàn)略。
一、生成式AI在金融行業(yè)應用的現(xiàn)狀和特點
(一)生成式AI在金融領(lǐng)域應用日趨活躍
一是全球金融機構(gòu)積極探索生成式AI在業(yè)務場景落地。大模型涌現(xiàn)的語言力和推理力,推動人機交互體驗升級與AI泛化能力躍遷,讓金融機構(gòu)看到提高工作效率和優(yōu)化客戶體驗的應用前景,密切跟進技術(shù)探索和落地。根據(jù)英偉達針對全球近400家金融機構(gòu)的調(diào)研①,有43%的金融機構(gòu)已經(jīng)在使用生成式AI,主要將其用于報告生成(37%)、客戶體驗優(yōu)化(34%)、合成數(shù)據(jù)生成(33%)和營銷(32%);另有55%的金融機構(gòu)正在研究并考慮應用生成式AI。同時,由于金融行業(yè)是知識密集型及交互場景豐富的行業(yè),與其他行業(yè)相比,其對大模型的需求更高,應用場景更廣。根據(jù)麥肯錫調(diào)研②,金融行業(yè)從業(yè)者反饋“在工作中常規(guī)使用大模型”和“在工作和生活中均常規(guī)使用大模型”的數(shù)量占比為24%,僅低于技術(shù)傳媒行業(yè)(33%),高于法律會計等專業(yè)服務(23%)、消費(18%)、醫(yī)療(16%)、先進制造業(yè)(16%)和能源材料行業(yè)(14%)。
二是從金融業(yè)務細分場景來看,生成式AI已覆蓋了金融資訊、財富管理、保險、信貸、支付等金融細分領(lǐng)域(見圖1)。例如,富國銀行使用谷歌云的對話式人工智能平臺Dialogflow構(gòu)建了基于聊天機器人的客戶助理;蘇黎世保險公司正在測試將ChatGPT技術(shù)應用于理賠建模,分析公司最近六年的理賠數(shù)據(jù),應用生成式AI找出理賠的具體損失原因,進而改善承保,降低理財成本。
三是AI領(lǐng)域投融資活躍,出現(xiàn)深耕金融的AI技術(shù)服務“獨角獸”。根據(jù)CB Insight統(tǒng)計,2023年前三季度AI融資規(guī)模達329億美元,新出現(xiàn)了16家AI“獨角獸”。在金融領(lǐng)域,Quantexa獲得
1.29億美元E輪融資后躍升“獨角獸”,估值達到18億美元。Quantexa打造的生成式AI助手Q Assist,賦能智能數(shù)據(jù)分析,可用于反欺詐、反洗錢和客戶識別,幫助金融公司規(guī)避風險和精準運營。目前,匯豐銀行、渣打銀行、紐約銀行、荷蘭銀行和安聯(lián)保險等大型金融機構(gòu)都是其客戶。
(二)生成式AI在金融領(lǐng)域應用的特點
生成式AI在業(yè)務流程中扮演的角色以非決策類為主。在業(yè)務簡單且非決策場景,生成式AI可直接服務客戶;在業(yè)務復雜或決策場景,生成式AI還是作為助手,賦能內(nèi)部人員(見圖2)。
第一,生成式AI主要服務于歸集、分析、生成等非決策環(huán)節(jié)。從生成式AI服務金融機構(gòu)的角色定位來看,可以分為提取、歸納、分析和決策,對技術(shù)的要求由低到高。以投資場景為例,當下生成式AI可以作為市場數(shù)據(jù)、行研報告信息抓取的“實習生”,或作為歸納生成行業(yè)和投資標的價值分析的“研究助理”,但未能成為做出投資決策的“投資經(jīng)理”。這是因為決策需要綜合事實性信息和經(jīng)驗式復雜形勢做出判斷,對大模型的技術(shù)要求更高,需要長期的迭代演進。例如,在投研領(lǐng)域,Broadridge 子公司LTX打造了Bond GPT。LTX 運用自身整合的Liquidity Cloud中海量的匿名實時交易數(shù)據(jù)及金融數(shù)據(jù),基于GPT-4訓練得到債券垂類大模型Bond GPT。用戶可以通過自然語言與Bond GPT交流,獲得符合需求的公司概況、利率、價格、發(fā)布日期、到期日期、債券評級等信息以及可視化圖表,為債券投資提供數(shù)據(jù)及交易信息支持。
第二,直接對客應用較為審慎。目前生成式AI主要用于不涉及強金融建議的智能對話、信息收集分析,對內(nèi)部員工賦能(Copilot)的應用更加多樣、更有深度。得益于生成式AI強大的理解和語言能力,對于金融資訊、業(yè)務辦理等泛金融知識對話,生成式AI已經(jīng)可以直接面向客戶進行智能對話,大幅彌補過去智能客服并不“智能”的短板。例如,智能客服支小寶,在螞蟻大模型的賦能下,升級為“支小寶2.0”,將智能對話服務鏈路解構(gòu)為意圖理解、知識加工、專業(yè)工具調(diào)用、歸納推理、可控生成、自省等環(huán)節(jié)。大模型作為交互與認知中樞,其多輪對話的能力大幅提升,并能夠基于用戶需求適時調(diào)用專業(yè)金融知識和策略工具(如條件選基、保險評測),直接為客戶提供財富管理、保險產(chǎn)品咨詢等服務。生成式AI作為財富管理顧問的助手,如“支小助”賦能螞蟻理財師,能夠提升專業(yè)度,實現(xiàn)定制化服務。又如,農(nóng)業(yè)銀行推出大模型應用(ChatABC),該模型擁有百億級參數(shù),在知識問答、智能客服、輔助編程、智能辦公等領(lǐng)域同步進行試點,其中智能問答場景已提供數(shù)百萬次問答服務,而輔助編碼場景支持代碼生成、單測生成、代碼翻譯等功能,已超過10萬行代碼投入生產(chǎn)應用。但是,對于更復雜、個性化的對客金融服務,目前仍需要人工參與判斷。
第三,大小模型協(xié)作成為AI應用技術(shù)范式。生成式AI的優(yōu)勢在于理解、推理和生成,而傳統(tǒng)判別式AI的優(yōu)勢在于場景適配性強、可控性強,適用于風險管理等復雜決策場景。目前大模型不能直接用于風險決策,但結(jié)合傳統(tǒng)的有監(jiān)督機器學習的風控決策引擎,通過不斷完善兩者數(shù)據(jù)及應用交互的技術(shù)范式,使得智能風控更加實時和主動。例如,為了解決傳統(tǒng)的風控決策引擎處理非結(jié)構(gòu)化信息能力的不足,以及無法提供差異化額度和利率等問題,度小滿開發(fā)了“小滿靈犀”風控決策引擎,充分發(fā)揮大模型技術(shù)的理解、生成、邏輯能力,通過自然語言的方式與客戶深度交互,并基于對客戶歷史信息的理解和客戶需求的洞察,提升效率,實現(xiàn)精準授信。
第四,海外金融機構(gòu)云化部署為快速應用大模型奠定了基礎(chǔ)。例如,Morgan Stanley 和Open AI合作推出了基于GPT-4 技術(shù)的對話機器人,并利用該機器人管理及調(diào)用其龐大的知識庫賦能財務顧問。Morgan Stanley知識庫部署在Azure云端,數(shù)十萬頁報告內(nèi)容涵蓋投資策略、市場研究和評論以及分析師見解,Open AI通過微調(diào)和提示詞工程,實現(xiàn)API智能調(diào)用知識庫內(nèi)容,并生成財務顧問所需的專業(yè)、定制化的投顧信息。云端部署可以滿足模型快速部署和高并發(fā)調(diào)用需求。
二、生成式AI在金融行業(yè)的應用趨勢和價值
(一)推動金融業(yè)的生產(chǎn)力變革
生成式AI全面賦能金融業(yè)務各環(huán)節(jié)及組織前中后臺,極大提升了客戶營銷、運營服務、技術(shù)開發(fā)以及內(nèi)部管理效率。人人有助手,生成式AI顯著提升了信息處理及內(nèi)容生成的效率和多樣性,可以為營銷人員提供豐富的創(chuàng)意文案,為投顧人員提供實時資訊解讀和投資策略分析,為技術(shù)人員提供代碼工具;人人是專家,生成式AI降低了知識獲取以及數(shù)字化工具應用門檻,秒級完成知識庫檢索生成,自動調(diào)用工具,讓每個人快速成為行業(yè)專家。據(jù)麥肯錫預測③,生成式AI帶來的生產(chǎn)力提升將推動銀行業(yè)收入增長3%—5%,合2 000—3 400億美元。據(jù)UBS預測④,在樂觀情景下,預計2025年,生成式AI在對內(nèi)賦能的場景率先實現(xiàn)大規(guī)模落地,預計證券行業(yè)、保險行業(yè)人工成本減少20%,分別提升證券行業(yè)、保險行業(yè)利潤15%與27%。
(二)重新定義金融服務的用戶體驗
生成式AI帶來客戶交互智能化跨越式提升。更有溫度,生成式AI帶來全新的人機交互體驗,意圖識別更精準,表達更有“人味”,并隨時隨地提供專屬陪伴;更有深度,生成式AI幫助客戶更容易觸達金融機構(gòu)“最強大腦”,如首席投資策略師或首席分析師的洞見,充分調(diào)動積累的知識和策略,更好地為客戶提供高質(zhì)量、定制化服務;更多樣且易得,以O(shè)pen AI 推出的GPTs為例,其為開發(fā)人員提供了開發(fā)工具及市場營銷平臺,打造了生成式AI領(lǐng)域的“iPhone App Store”,將極大豐富應用生態(tài),促進更多樣的智能化金融服務的涌現(xiàn)。
(三)助力金融業(yè)務模式跨越式升級
生成式AI將成為“智能引擎”,從信息處理進化到復雜決策,從Copilot跨越到Autopilot,重塑交易決策、產(chǎn)品創(chuàng)設(shè)及營銷規(guī)劃等業(yè)務環(huán)節(jié)。此外,生成式AI還將推動業(yè)務范式升級。如投顧領(lǐng)域,顧問可依托生成式AI提供千人千面資產(chǎn)配置服務,亦可通過對話機器人進行擬人化、實時交互,加深客戶信任,優(yōu)化投資收益,推動賣方投顧向買方投顧轉(zhuǎn)變,引導投資者理性投資,助力營造良性資本市場環(huán)境。
(四)成為數(shù)智化風控技術(shù)新起點
風險決策方面,生成式AI的泛化能力使其理解加工海量非結(jié)構(gòu)化數(shù)據(jù)的能力大幅提升,與傳統(tǒng)判別式AI模型能力形成互補,支持復雜場景下零人工干預、高精度風控決策。風險監(jiān)測方面,金融領(lǐng)域風險越來越呈現(xiàn)出隱蔽性、交叉性、跨市場特點,如跨國洗錢,風險識別和控制的難度持續(xù)增大,而生成式AI特有的認知推理能力,有望助力更廣泛、更敏捷地監(jiān)測到異常交易,識別數(shù)據(jù)安全、網(wǎng)絡安全漏洞,并自動調(diào)度風險管理工具,在第一時間控制風險發(fā)酵及傳導。
三、技術(shù)層面生成式AI在金融行業(yè)應用的挑戰(zhàn)及應對
生成式AI在金融領(lǐng)域的應用面臨多重挑戰(zhàn),除技術(shù)本身有待進一步完善之外,還需要滿足金融領(lǐng)域的專業(yè)性、合規(guī)性等要求,主要表現(xiàn)在專業(yè)性、可控性、適當性尚有不足,以及存在算法內(nèi)生性風險。
(一)生成式AI技術(shù)在金融行業(yè)應用面臨的挑戰(zhàn)
一是專業(yè)知識存在短板。大模型通過海量知識的壓縮,積累了廣泛的通用知識,具備較強的泛化能力。金融行業(yè)具有知識密度高、時效性強、嚴謹性高等特點,而通用大模型訓練中金融語料占比低、數(shù)據(jù)滯后、金融專業(yè)水平不高,導致通用大模型無法在金融領(lǐng)域直接應用。如保險理賠涉及大量保險條款、疾病和醫(yī)藥的關(guān)聯(lián)性知識,而通用大模型在相關(guān)領(lǐng)域存在一定的知識欠缺,難以處理具體某種保險“能不能?!薄澳懿荒苜r”等專業(yè)問題。
二是可控性不足。生成式AI實現(xiàn)了語言力、理解力和創(chuàng)造力的躍遷,但伴隨的“幻覺”問題導致生成結(jié)果不可控,影響在嚴謹場景中的應用。大模型是基于條件概率逐字生成內(nèi)容的,但是訓練數(shù)據(jù)質(zhì)量不足、模型過擬合以及知識理解不足等因素,會導致大模型“一本正經(jīng)地胡說八道”。以訓練數(shù)據(jù)為例,不準確、不完整的數(shù)據(jù)或惡意投毒數(shù)據(jù),會導致模型在訓練過程中學習到這些錯誤、虛假的數(shù)據(jù),并在未來的預測、生成中重現(xiàn)。
三是適當性缺乏保障。金融行業(yè)對監(jiān)管合規(guī)性要求高,生成式AI在金融行業(yè)的應用也離不開規(guī)則的約束和運用,需要其與金融業(yè)務相關(guān)規(guī)范進行價值對齊(Value Alignment),但大模型價值對齊如何充分符合金融安全、投資者適當性、消費者權(quán)益保護等金融價值觀仍面臨技術(shù)挑戰(zhàn)。
四是算法內(nèi)生性風險。算法可解釋性方面,大模型在參數(shù)規(guī)模與復雜度上遠高于傳統(tǒng)AI模型。從參數(shù)規(guī)模上看,目前主流大模型通常包含百億到千億級別以上的參數(shù),而傳統(tǒng)AI模型的參數(shù)規(guī)模一般在百萬到千萬級別。因此,大模型輸出結(jié)果的邏輯和決策過程更難以解釋。金融領(lǐng)域?qū)Q策透明度和可解釋性的要求更高,這對大模型應用于金融業(yè)務將構(gòu)成較大挑戰(zhàn)。算法歧視方面,大模型基于海量數(shù)據(jù)開展訓練,因此訓練數(shù)據(jù)中本身存在的偏見可能被算法模型固化,導致生成的決策存在歧視。比如在金融服務可得性方面,算法歧視可能會導致歧視性準入門檻與服務定價等問題。算法一致性方面,如果大量金融機構(gòu)部署應用相似或者同一大模型,可能會導致基于模型建議的業(yè)務決策的一致性,從而形成“羊群效應”。美國證監(jiān)會主席Gary Gensler在2023年10月提出AI會引發(fā)金融行業(yè)系統(tǒng)性風險的擔憂。他解釋道,華爾街很多金融機構(gòu)依賴于少數(shù)基礎(chǔ)AI模型,從智能投顧業(yè)務到股票開戶業(yè)務等,各方基于相同數(shù)據(jù)模型做出的決策可能導致“羊群效應”,不利于金融穩(wěn)定。
(二)市場主體推動生成式AI在金融行業(yè)應用的積極對策
生成式AI技術(shù)在金融領(lǐng)域的應用還處于探索階段。為了使生成式AI更有效地服務于金融行業(yè),克服前述大模型自身存在的技術(shù)問題以及在金融業(yè)務應用中面臨的專業(yè)性問題,各國的科技公司與金融機構(gòu)都在積極探索對策。
1.提升金融專業(yè)性及可控生成
一個可行的大模型應用范式是解構(gòu)內(nèi)容生成鏈條,將大模型作為交互與認知中樞,主要負責意圖識別、信息檢索與歸納總結(jié)以及內(nèi)容拼接組合,按需在金融專業(yè)領(lǐng)域調(diào)用知識引擎以獲取高時效性、高精度的金融知識,以及調(diào)用自動化策略工具,如投顧推品、保險配置等。為此,可通過知識增強和專業(yè)工具組合增強,確保大模型生成內(nèi)容的專業(yè)性。
一是知識增強。形成專業(yè)知識庫+檢索技術(shù)組合,將特定金融與相關(guān)專業(yè)知識庫嵌入生成鏈條,使大模型基于給定的專業(yè)知識庫生成答案。知識圖譜的知識專業(yè)性和事實可靠性強,鑒于金融領(lǐng)域有大量高頻問題,應用大模型時可深度融合知識圖譜,覆蓋高嚴謹性和高復雜性場景,比如保險產(chǎn)品條款解析、核保核賠問題回復。此外,最新、準確的外部數(shù)據(jù)可以彌補大模型信息時效性的不足。
二是專業(yè)工具組合增強。生成式AI在認知和交互方面具有顯著優(yōu)勢,而傳統(tǒng)判別式AI模型對特定任務決策的可靠性更強,在運籌、量化、圖算法方面的表現(xiàn)更為優(yōu)異。因此,在具體業(yè)務場景中,大模型可按需調(diào)用專業(yè)小模型,如投顧推品、保險配置等,共同完成理解、推理和決策任務,使金融服務更專業(yè)、更有深度。
2.強化訓練數(shù)據(jù)質(zhì)量保障
訓練數(shù)據(jù)質(zhì)量是影響大模型性能的關(guān)鍵因素之一。目前可用的中文金融語料約有2 000億token,然而通過模型和人工的清洗和篩選,最終能夠達到高質(zhì)量高標準的語料大約只有10%。在金融領(lǐng)域,數(shù)據(jù)質(zhì)量尤為重要,需要從源頭開始保障大模型的訓練質(zhì)量和價值取向。為此,一方面要持續(xù)加強數(shù)據(jù)清洗與質(zhì)量管控,通過數(shù)據(jù)引入初篩、訓練數(shù)據(jù)去毒、精細化標注,確保模型訓練源頭數(shù)據(jù)安全、可控、可追溯;另一方面,共同構(gòu)建金融行業(yè)數(shù)據(jù)集,如Bloomberg GPT的優(yōu)秀性能很大程度上源于其在通用語料庫之外,構(gòu)建了一個包含3 635 億token 的高質(zhì)量金融領(lǐng)域數(shù)據(jù)集FinPile,其中的7%是彭博專有的金融數(shù)據(jù)。
3.持續(xù)推動模型迭代優(yōu)化
為了讓大模型的能力與行為和人類的價值、真實意圖及倫理原則一致,確保人類在與AI協(xié)作中的安全與信任,核心就是價值對齊。價值對齊可以在一定程度上解決大模型錯誤信息、算法歧視和生成不可控問題。目前在價值對齊的工具開發(fā)和工程化建設(shè)方面已有許多積極嘗試:一是人類反饋強化學習(RLHF),人類訓練員對模型輸出內(nèi)容的適當性進行評估,并基于收集到的人類反饋為強化學習構(gòu)建獎勵信號,以實現(xiàn)對模型性能的改進優(yōu)化。如Open AI、Anthropic等公司通過加入RLHF方式,緩解大模型的“幻覺”問題,從而提高模型的適應性,減少模型的偏見,增強模型的安全性。二是對抗測試(Adversarial Testing),邀請內(nèi)部或外部的專業(yè)人員(紅隊測試員)對模型發(fā)起各種對抗攻擊,以發(fā)現(xiàn)潛在問題并予以解決。例如,在GPT-4發(fā)布之前,Open AI聘請了50多位各領(lǐng)域?qū)W者和專家對其模型進行測試。這些紅隊測試員的任務是向模型提出試探性的或者危險性的問題以測試其反應。通過紅隊測試員的測試,可以幫助發(fā)現(xiàn)模型在不準確信息、有害內(nèi)容、虛假信息、歧視、語言偏見、社會安全等方面的問題。
4.布局全鏈條安全檢測與防御
建立一體化的大模型安全防控體系,從數(shù)據(jù)輸入、訓練和生成各個環(huán)節(jié),對有害、敏感信息進行攔截和糾偏,持續(xù)開展安全檢測。例如Open AI專門訓練了一個對有害內(nèi)容進行過濾的AI模型,用于識別有害的用戶輸入和模型輸出,從而實現(xiàn)對模型的輸入數(shù)據(jù)和輸出數(shù)據(jù)的管控。又如,螞蟻基于豐富的安全和合規(guī)技術(shù)推出“蟻鑒2.0”安全檢測平臺,其由數(shù)百個識別模型和數(shù)十萬個判別規(guī)則組成,提供生成式AI安全性評測、可解釋性評測以及魯棒性檢測,可支持多模態(tài)檢測,覆蓋文本、語音、圖像等多種任務類型,檢測標準覆蓋內(nèi)容安全、數(shù)據(jù)安全、倫理安全三大類,可對大模型生成的內(nèi)容完成包含個人隱私、意識形態(tài)、違法犯罪、偏見與歧視等數(shù)百個維度的風險檢測,并生成檢測報告,通過全方位安全檢測、內(nèi)容過濾、規(guī)則召回等安全策略,持續(xù)提升大模型生成的準確率。
5.豐富模型和應用的多樣性,降低算法一致性風險
2022年末以來,眾多科技企業(yè)、金融機構(gòu)積極投入垂直大模型預訓練和應用層微調(diào),豐富的模型生態(tài)和開發(fā)框架有利于降低算法一致性風險。一是通過不斷豐富模型生態(tài)、場景應用解決方案,金融機構(gòu)能夠選擇出算法邏輯多樣化的模型以及匹配業(yè)務需求的豐富的生成式AI應用產(chǎn)品,緩解市場共振風險。二是大模型現(xiàn)在并未直接用于金融決策,豐富的人機交互將逐步塑造個性化的Copilot和AI Agent,這些根據(jù)客戶差異化的風險偏好和收益預期等做出的決策建議,有助于避免模型輸出一致性的問題,進而避免出現(xiàn)“羊群效應”。三是大模型基于海量實時信息處理能力,將助力完善監(jiān)管科技,不斷提高風險檢測靈敏度以及風險應對措施智能化,維護金融穩(wěn)定。
四、行業(yè)層面生成式AI規(guī)?;⒏哔|(zhì)量應用的制約因素和優(yōu)化展望
中央金融工作會議提出做好科技金融、綠色金融、養(yǎng)老金融、普惠金融、數(shù)字金融“五篇大文章”,其中發(fā)展數(shù)字金融,提升金融機構(gòu)數(shù)字化水平,有助于更好地支持金融強國戰(zhàn)略。人工智能作為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的技術(shù),對發(fā)展數(shù)字金融具有戰(zhàn)略意義。目前,生成式AI在金融領(lǐng)域的應用還處于初級階段,面臨算力、訓練語料不足、技術(shù)規(guī)范等短板,在推進大模型應用的過程中,不僅需要市場主體的探索和實踐,也需要政府的鼓勵支持與規(guī)范引導。
海外監(jiān)管主體認識到人工智能的重要戰(zhàn)略意義,相繼出臺了AI戰(zhàn)略規(guī)劃和監(jiān)管舉措,致力于平衡促進技術(shù)發(fā)展及產(chǎn)業(yè)應用與防范潛在風險。為了更好地發(fā)揮人工智能對我國數(shù)字金融的助推力,需創(chuàng)造包容的監(jiān)管環(huán)境,夯實算力、數(shù)據(jù)、算法和技術(shù)規(guī)范基礎(chǔ)設(shè)施,以促進人工智能可信發(fā)展,釋放產(chǎn)業(yè)變革價值。
(一)生成式AI在金融行業(yè)規(guī)?;?、高質(zhì)量落地的制約因素
一是在缺乏行業(yè)應用指引和技術(shù)標準的情況下,多數(shù)金融機構(gòu)存在“不敢用”“不會用”的情況。目前,生成式AI在金融行業(yè)的應用進展緩慢,一項針對300多家金融機構(gòu)的大模型應用現(xiàn)狀的調(diào)研發(fā)現(xiàn)⑤,僅有2%的金融機構(gòu)處于大模型落地應用階段。一方面,當前金融監(jiān)管部門尚未對大模型在金融行業(yè)的應用出臺相應的指導意見以及業(yè)務規(guī)范,一定程度上影響了金融機構(gòu)研發(fā)應用大模型的意愿,這將進一步降低金融大模型的市場需求,抑制金融機構(gòu)與科技公司技術(shù)投入的動力和金融大模型技術(shù)發(fā)展的潛力。另一方面,受限于金融大模型缺乏行業(yè)統(tǒng)一、公允的評測標準及技術(shù)應用規(guī)范,金融機構(gòu)面臨大模型選型難、調(diào)試難等“不會用”的問題。
二是多數(shù)金融機構(gòu)存在算力資源約束問題,會限制金融行業(yè)大模型的普及應用,加劇行業(yè)“馬太效應”。根據(jù)相關(guān)機構(gòu)估算,訓練一個千億參數(shù)級別的大模型大致需要上千張英偉達的A100高性能顯卡運行3個月以上的時間,需要上千萬美金的投入,對資金與技術(shù)的要求很高。從銀行業(yè)角度看,國內(nèi)有4 000多家銀行,如果每家銀行都從0到1自己訓練構(gòu)建一個大模型是不現(xiàn)實的。這是因為一方面多數(shù)銀行本身規(guī)模比較小,存在資金、技術(shù)短板;另一方面隨著美國對中國芯片出口限制的升級,進一步加劇了國內(nèi)大模型算力資源緊張。但如果大模型最終只應用于少數(shù)具有資金技術(shù)實力的大型銀行,可能會進一步加大中小銀行與大型銀行的經(jīng)營能力差距,強化金融行業(yè)的“馬太效應”,不利于整個金融行業(yè)的健康發(fā)展。
三是金融領(lǐng)域高質(zhì)量語料缺乏,不利于模型迭代升級,也不利于生成內(nèi)容的專業(yè)性及可控性的提升。金融數(shù)據(jù)的敏感性、隱私性、商業(yè)機密性更高,在數(shù)據(jù)流轉(zhuǎn)方面的監(jiān)管合規(guī)要求更嚴,從而導致金融機構(gòu)缺乏數(shù)據(jù)共享動力,數(shù)據(jù)割裂現(xiàn)象嚴重,專業(yè)語料的歸集難度大。因此訓練金融垂直領(lǐng)域的大模型存在明顯的金融數(shù)據(jù)資源約束,有待建立健全跨金融細分領(lǐng)域、時效性強、滿足價值對齊要求的專業(yè)數(shù)據(jù)集。
(二)海外AI產(chǎn)業(yè)發(fā)展舉措及監(jiān)管思路
隨著生成式AI的蓬勃發(fā)展,AI技術(shù)所帶來的戰(zhàn)略價值和潛在風險也越來越受到關(guān)注,世界各國監(jiān)管主體都在密切跟進AI的演化進展。現(xiàn)階段主要發(fā)達國家在圍繞促進生成式AI行業(yè)發(fā)展的同時,持續(xù)關(guān)注和防范潛在風險,推動建立監(jiān)管規(guī)則體系,主要監(jiān)管思路和舉措包括“軟法”指引和持續(xù)迭代、分類分級監(jiān)管、政府與企業(yè)共治、建立跨國治理生態(tài)等。
第一,注重促進人工智能長期發(fā)展,統(tǒng)籌安全與發(fā)展。美國政府認為人工智能是現(xiàn)階段最具戰(zhàn)略意義的技術(shù)之一,為了確保美國在發(fā)展可信AI的全球領(lǐng)航員地位,其制定了國家層面AI發(fā)展框架。2016年美國的總統(tǒng)行政辦公室(Executive Office of the President)發(fā)布了《國家人工智能研究發(fā)展戰(zhàn)略規(guī)劃》,并于2019年和2023年發(fā)布更新版,覆蓋鼓勵AI基礎(chǔ)技術(shù)長期投資、發(fā)展共享公共數(shù)據(jù)集、保障AI系統(tǒng)安全性等九項舉措。以數(shù)據(jù)為例,明確發(fā)展用于人工智能訓練和測試的共享公共數(shù)據(jù)集和環(huán)境。具體舉措包括:一是開放并提供滿足多樣化人工智能應用需求的數(shù)據(jù)集。許多政府數(shù)據(jù)集已經(jīng)通過各種網(wǎng)站和平臺向研究人員和學生開放。例如,美國國家航空航天局(NASA)地球科學數(shù)據(jù)集通過NASA的分布式活躍檔案中心(DAAC)向公眾開放;國家衛(wèi)生研究院(NIH)的“科技研究基礎(chǔ)設(shè)施發(fā)現(xiàn)、實驗和可持續(xù)性倡議(STRIDES)”使人們能夠訪問豐富的數(shù)據(jù)集和先進的計算基礎(chǔ)設(shè)施,使用相應工具。二是開發(fā)共享的大規(guī)模和專業(yè)化的高級計算和硬件資源。美國國家人工智能計劃(NAIRR)工作組提出建設(shè)兼具CPU和GPU的混合算力資源基礎(chǔ)設(shè)施(即本地和云端計算資源、專用和共享資源),該設(shè)施具備多節(jié)點加速器,可提供高速網(wǎng)絡和充足的內(nèi)存容量。根據(jù)CB Insights統(tǒng)計,截至2023年三季度末,美國擁有全球65%的AI“獨角獸”。
第二,政府部門以提示風險和制定標準的“軟法”引導技術(shù)發(fā)展,不設(shè)置準入限制,并基于技術(shù)發(fā)展敏捷治理。例如,2023年1月,美國國家標準與技術(shù)研究院(NIST)制定《人工智能風險管理框架》(RMF),通過建立標準的方式引導AI產(chǎn)業(yè)實踐,對市場僅有建議采納的軟性約束作用,產(chǎn)業(yè)實踐經(jīng)驗也通過與監(jiān)管的多輪互動,實現(xiàn)對“軟法”的迭代完善。2023年10月,美國白宮發(fā)布拜登簽署的《關(guān)于安全、可靠和可信的AI行政命令》(以下簡稱《行政命令》),提出安全可靠、保障權(quán)利、隱私保護等倫理要求,以確保美國在把握AI前景和管理其風險方面處于領(lǐng)先地位。
第三,明確人工智能分類分級監(jiān)管思路。歐盟《人工智能法案》的修改草案中,重點引入了以風險為導向的AI系統(tǒng)的分類分級監(jiān)管制度。該法案提出了四種風險類型的AI系統(tǒng)——不可接受的風險、高風險、有限風險和極低風險,并對不可接受的風險以及高風險等級的AI系統(tǒng)提出了嚴格的規(guī)制措施,同時為人工智能設(shè)計了全生命周期的規(guī)制措施,要求人工智能產(chǎn)品入市前評估和入市后監(jiān)測,以便從事前、事中和事后共同治理。對于通用型人工智能(General Purpose AI,GPAI),強調(diào)透明度要求。要求GPAI系統(tǒng)和模型必須保持透明度,包括創(chuàng)建技術(shù)文檔、報告有關(guān)訓練內(nèi)容的詳細摘要、遵守歐盟版權(quán)法以及報告用于訓練其模型的數(shù)據(jù)信息。確保自然人在與AI系統(tǒng)互動時,能及時、清晰、可理解地知道自己正在與AI系統(tǒng)互動。此外,對于具有高風險的GPAI,需滿足風險評估、對抗性測試等標準。
第四,政府與企業(yè)多元共治成為AI 治理范式。一是美國政府與企業(yè)多元共治《行政命令》,促使包括Open AI、谷歌、微軟、英偉達等15家企業(yè)就開發(fā)避免偏見歧視、保護隱私的人工智能做出承諾,包含建立AI安全的新標準、保護美國民眾的隱私、促進公平和保障公民權(quán)利、提升美國在海外的領(lǐng)導力等八個目標。政府與企業(yè)多元共治推動了“軟法”主張與產(chǎn)業(yè)實踐之間的互相促進,如科技公司在AI產(chǎn)品發(fā)布前采用的紅隊測試慣例,成為自愿承諾內(nèi)容之一。二是歐盟明確政府監(jiān)管與企業(yè)自律相結(jié)合的基礎(chǔ)模型⑥監(jiān)管模式。一方面,每個歐盟成員國都將設(shè)立監(jiān)督機構(gòu),由人工智能企業(yè)所在國的監(jiān)管機構(gòu)確保法案的有效實施。另一方面,人工智能企業(yè)需承擔自律責任,對其算法進行人為控制,提供技術(shù)文件,并為“高風險”應用建立風險管理系統(tǒng)。三是新加坡金管局(MAS)與企業(yè)及行業(yè)協(xié)會聯(lián)盟⑦為金融領(lǐng)域使用生成式AI制定風險框架,確定了包括問責制和治理、監(jiān)控和穩(wěn)定性、透明度和可解釋性等七個風險維度。
第五,建立人工智能跨國監(jiān)管互通生態(tài)。大模型開發(fā)、訓練及應用需要越來越多的跨國合作,需要相應的跨國共識和監(jiān)管協(xié)同。2023年11月在英國召開AI安全峰會的28個國家發(fā)布了《布萊切利宣言》,旨在推動全球在人工智能安全方面的合作,共同識別風險以及制定跨國政策緩解風險。
(三)促進生成式AI推動金融數(shù)智化升級的建議
為了更好地統(tǒng)籌發(fā)展和安全,做好“五篇大文章”之一的數(shù)字金融,支持金融強國戰(zhàn)略落地,建議在監(jiān)管環(huán)境、算力、數(shù)據(jù)、技術(shù)生態(tài)等方面,支持金融行業(yè)規(guī)模化、可持續(xù)應用生成式AI。
第一,為生成式AI落地金融行業(yè)營造適當包容的監(jiān)管環(huán)境,推動金融機構(gòu)數(shù)智化轉(zhuǎn)型和技術(shù)創(chuàng)新的良性互動,監(jiān)管機構(gòu)與市場機構(gòu)合作構(gòu)建金融大模型技術(shù)規(guī)范。一是建議監(jiān)管部門加大對金融機構(gòu)技術(shù)創(chuàng)新的重視程度與支持力度。充分發(fā)揮“科技創(chuàng)新試點”等機制的作用,平衡創(chuàng)新和風險管理,明確監(jiān)管規(guī)則,鼓勵金融場景應用探索。如果缺乏有效的監(jiān)管預期引導與政策支持,技術(shù)創(chuàng)新將面臨巨大的不確定性,不利于引導金融機構(gòu)技術(shù)投入和持續(xù)迭代。二是推動政府與企業(yè)共同參與AI治理,在監(jiān)管模式的探索中形成“雙輪驅(qū)動”。建立暢通互信的溝通機制,基于人工智能監(jiān)管理念、技術(shù)前沿進展和產(chǎn)業(yè)實踐,共同制定技術(shù)規(guī)范、風險管理框架和產(chǎn)業(yè)應用指引;同時,可以建設(shè)監(jiān)管規(guī)制、行業(yè)自律、科技倫理指引相結(jié)合的多層次治理體系。三是構(gòu)建金融行業(yè)權(quán)威的金融大模型評測標準。大模型技術(shù)風險管理需要監(jiān)管機構(gòu)和市場主體共同建立技術(shù)標準及評測體系,引導大模型在金融業(yè)務中規(guī)范應用。組織獨立機構(gòu)進行技術(shù)評測、安全審查、風險監(jiān)測,多主體參與可為金融大模型的安全應用保駕護航。當前實踐表明,大模型評測集是綜合評估大模型技術(shù)能力與安全性的有效工具,可以由監(jiān)管機構(gòu)牽頭,組織技術(shù)領(lǐng)先的金融大模型金融機構(gòu)與科技公司,合作構(gòu)建行業(yè)統(tǒng)一的綜合金融大模型評測集,并將其逐步轉(zhuǎn)化為監(jiān)管認可的金融大模型技術(shù)標準與評測體系。
第二,探索建立人工智能在金融行業(yè)應用的分類分級監(jiān)管機制。由于人工智能技術(shù)的應用場景、風險程度和技術(shù)成熟度存在差異,需要制定配套的分層監(jiān)管舉措,進行精細化管理。我國出臺的《生成式人工智能服務管理暫行辦法》確定了“對生成式人工智能服務實行包容審慎和分類分級監(jiān)管”的基本理念,金融監(jiān)管部門可以在此方向上進一步探索生成式AI在金融行業(yè)應用的分類分級監(jiān)管體系。建議基于不同的金融業(yè)務模式與流程環(huán)節(jié)的特點、生成式AI對金融業(yè)務價值創(chuàng)造與風險生成的影響機制、金融服務的客戶覆蓋面等因素,結(jié)合國內(nèi)外金融行業(yè)先進實踐經(jīng)驗,由監(jiān)管機構(gòu)和市場主體共同探索并制定不同金融業(yè)務與流程環(huán)節(jié)中應用生成式AI的風險識別、分類評估、技術(shù)規(guī)范、差異化流程監(jiān)測體系、責任認定等配套規(guī)則。
第三,加強行業(yè)共享的技術(shù)基礎(chǔ)設(shè)施建設(shè),以行業(yè)云或團體云為基礎(chǔ),建立金融行業(yè)基礎(chǔ)大模型,支持各金融機構(gòu)構(gòu)建大模型基礎(chǔ)能力。一是建立金融領(lǐng)域大模型訓練和推理平臺試點。由監(jiān)管機構(gòu)或政府牽頭協(xié)調(diào),聯(lián)合科技公司及金融機構(gòu),實現(xiàn)資源集中規(guī)劃建設(shè)、迭代升級,避免行業(yè)內(nèi)“重復造輪子”,造成算力浪費。二是探索建設(shè)金融行業(yè)云和行業(yè)大模型融合的金融機構(gòu)技術(shù)基礎(chǔ)設(shè)施平臺。幫助中小金融機構(gòu)“一站式”夯實科技底座,構(gòu)建金融大模型基礎(chǔ)能力,加快金融機構(gòu)從數(shù)字化到數(shù)智化轉(zhuǎn)型的進程。
第四,推動公共數(shù)據(jù)開放,共建金融領(lǐng)域?qū)I(yè)數(shù)據(jù)集,完善數(shù)據(jù)安全規(guī)范。一是推動公共數(shù)據(jù)開放。公共數(shù)據(jù)的開放將充實大模型通用語料庫,為大模型語言力及推理力升級奠定基礎(chǔ)。二是建設(shè)金融領(lǐng)域?qū)I(yè)數(shù)據(jù)集。建立跨主體數(shù)據(jù)歸集、共享機制及商業(yè)模式,緩解數(shù)據(jù)割裂,避免數(shù)據(jù)重復收集處理導致的資源浪費。例如,建議由行業(yè)協(xié)會或監(jiān)管下屬機構(gòu)歸集市場交易數(shù)據(jù)、研究報告、上市公司公告等行業(yè)數(shù)據(jù),推動金融語料庫建設(shè)。三是完善數(shù)據(jù)安全規(guī)范。避免模型訓練中數(shù)據(jù)使用不當導致用戶隱私泄露、信息濫用,加強知識產(chǎn)權(quán)保護,避免產(chǎn)權(quán)不清造成侵權(quán)行為和商業(yè)糾紛。與此同時,可推行一些數(shù)據(jù)訓練的版權(quán)收費豁免。
第五,構(gòu)建多元分層的大模型技術(shù)生態(tài),降低大模型在金融場景應用的成本,緩解模型輸出一致性問題。一是構(gòu)建基礎(chǔ)大模型開源技術(shù)生態(tài)。技術(shù)開源可以避免對訓練資源要求最高的基礎(chǔ)大模型的資源重復投入,促進模型快速迭代,防止技術(shù)壟斷。二是豐富大模型微調(diào)、大小模型交互的金融場景應用技術(shù)生態(tài)。通過豐富基礎(chǔ)大模型在各類金融場景應用所需的內(nèi)容標注、提示詞工程、對抗測試等微調(diào)服務,以及與大模型配合的判別式AI小模型技術(shù)服務的供給生態(tài),讓各類金融機構(gòu)以較低成本基于自身業(yè)務場景特點采購大模型場景落地應用所需的服務,也可以通過多元化差異化的大模型場景應用解決方案降低模型輸出一致性的問題,有效避免模型共振導致的“羊群效應”,維護金融穩(wěn)定。
注釋:
① 英偉達, State of AI in Financial Services 2024。
② 麥肯錫,The State of AI in 2023: Generative AI's Breakout
Year,此報告基于對全球1 684位參與者的調(diào)研。
③ 麥肯錫, The Economic Potential of Generative AI。
④ 《亞太聚焦:生成式AI如何重塑中國非銀金融行業(yè)?》。
⑤ 2023年下半年,恒生電子對國內(nèi)金融機構(gòu)進行調(diào)研走訪,被調(diào)研對象涵蓋券商、公募、銀行、三方、保險、信托、期貨和私募等。
⑥ 基礎(chǔ)模型被定義為一種依托大量數(shù)據(jù)被規(guī)?;柧毜腁I模型,為確保生成結(jié)果之通用性而設(shè)計,并能適應廣泛的特定任務。
⑦ 包括星展銀行、華僑銀行、大華銀行、渣打銀行、花旗新加坡、匯豐銀行、谷歌云、微軟、MAS、埃森哲和新加坡銀行協(xié)會組成的聯(lián)盟。
The Current Status, Challenges, and Recommendations for the Application of Generative AI in the Financial Industry
Abstract: At the end of 2022, large language model technology, exemplified by ChatGPT, emerged dramatically, significantly enhancing artificial intelligence's cognitive, reasoning, and linguistic capabilities. Concurrently, the financial industry is gradually exploring the application of generative AI in areas such as financial information, investment advisory, and investment research. Currently, the application of generative AI in the financial industry still requires improvements in controllability, professionalism, and security at the technical level, and faces constraints such as insufficient computing power and training data at the industry level. To enable generative AI to serve the financial industry more effectively, domestic and international market institutions are actively exploring ways to enhance knowledge, tools, and data, continually improving the safety and reliability of generative AI applications in the financial sector. Regulatory agencies are also developing governance norms and industry guidelines to safeguard the application of new technologies. As artificial intelligence leads a new wave of technological revolution and industrial transformation, how to promote its value in the financial industry will become a focal point for regulatory bodies and market participants worldwide. It is recommended to support the continuous improvement of generative AI by building scalable computing power infrastructure, industry datasets, and an open and diverse model ecosystem, thereby promoting high-quality digital and intelligent upgrades in the financial industry.
Keywords: Generative AI; Financial industry; Digital transformation; AI governance