• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于ChatGPT的問答式財務(wù)知識庫構(gòu)建與應(yīng)用

      2023-09-15 16:01:40金源魏振李成智
      財會月刊·上半月 2023年9期
      關(guān)鍵詞:知識管理

      金源 魏振 李成智

      【摘要】ChatGPT是繼數(shù)據(jù)庫和搜索引擎之后的全新一代知識存儲和調(diào)用方式。本文提出了一種基于ChatGPT構(gòu)建問答式財務(wù)知識庫的可行框架, 并以H公司為例, 展示了該知識庫在財務(wù)部門的實施路徑和應(yīng)用價值。本文的研究結(jié)論為AIGC時代企業(yè)財務(wù)知識庫的構(gòu)建提供了新視角, 同時也為其他垂直領(lǐng)域的知識庫建設(shè)提供了參考和借鑒。

      【關(guān)鍵詞】財務(wù)知識庫;ChatGPT;AIGC;知識管理

      【中圖分類號】F275? ? ? 【文獻標識碼】A? ? ? 【文章編號】1004-0994(2023)17-0046-6

      一、 引言

      2022年, 科技部等六部門印發(fā)《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展的指導(dǎo)意見》, 指出要以需求為牽引謀劃人工智能技術(shù)應(yīng)用場景, 融合人工智能模型算法和領(lǐng)域數(shù)據(jù)知識, 推動人工智能場景創(chuàng)新。2023年7月, 國家網(wǎng)信辦等七部門聯(lián)合公布的《生成式人工智能服務(wù)管理暫行辦法》也指出, 國家鼓勵探索優(yōu)化生成式人工智能技術(shù)應(yīng)用場景, 構(gòu)建應(yīng)用生態(tài)體系。

      2022年11月底, OpenAI發(fā)布基于GPT(Generative Pre-Training,生成式預(yù)訓練)語言模型GPT-3.5 Turbo構(gòu)建的智能聊天機器人ChatGPT。ChatGPT是繼數(shù)據(jù)庫和搜索引擎之后的全新一代“知識存儲和調(diào)用方式”, 是當前AIGC(AI-Generated Content,人工智能內(nèi)容生成)領(lǐng)域的代表性技術(shù)。ChatGPT憑借精準的語義理解能力、 強大的語言表達能力、 嚴謹?shù)倪壿嬎季S能力, 對新聞媒體、 教育培訓、 客戶服務(wù)與支持、 法律服務(wù)、 會計審計等行業(yè)均造成一定程度的沖擊, 引發(fā)全社會熱議。

      為積極應(yīng)對ChatGPT對會計領(lǐng)域的沖擊, 已有多位學者思考并探討了ChatGPT對會計科技(金源和李成智,2023a)、 會計行業(yè)變革(劉勤,2023)、 智能財務(wù)(金源和李成智,2023b)等方面的影響, 并且積極探索其在財務(wù)咨詢、 審計、 稅務(wù)管理等具體財務(wù)場景的應(yīng)用可行性。然而, 現(xiàn)有研究多集中在理論框架構(gòu)建和實踐構(gòu)想層面, 對ChatGPT在財務(wù)場景中落地實踐的研究尚存在空白。

      在數(shù)字經(jīng)濟蓬勃發(fā)展的時代背景下, 財務(wù)RPA、 數(shù)電發(fā)票、 智能財務(wù)、 ESG等新概念層出不窮, 會計行業(yè)對于知識更新迭代的要求也越來越高。財務(wù)人員需要及時、 精準地獲取前沿的財務(wù)知識以更好地完成本職工作, 賦能企業(yè)管理決策。然而, 當前財務(wù)人員基于搜索引擎和內(nèi)部知識庫的知識檢索模式存在著信息過載、 檢索質(zhì)量參差不齊、 信息更新滯后、 難以滿足個性化需求等諸多痛點, 這些痛點嚴重制約了財務(wù)人員獲取和使用財務(wù)知識的效率?;谝陨媳尘?, 本文提出基于ChatGPT構(gòu)建問答式財務(wù)知識庫的可行框架, 并以H公司的問答式財務(wù)知識庫ChatDoc作為案例, 具體呈現(xiàn)了問答式財務(wù)知識庫在財務(wù)部門的落地路徑及其在賦能財務(wù)知識管理過程中的應(yīng)用價值。本研究為AIGC時代企業(yè)財務(wù)知識庫的構(gòu)建提供了新視角。此外, 本文的研究方法和思路, 也為其他垂直領(lǐng)域知識庫的建設(shè)提供了參考與借鑒。

      二、 DIKW視角下財務(wù)知識管理的演變邏輯

      DIKW(Data-Information-Knowledge-Wisdom)模型是被廣泛應(yīng)用于知識管理領(lǐng)域的模型, 它指出人類決策智慧的形成經(jīng)歷了從噪聲中分揀出數(shù)據(jù), 再將數(shù)據(jù)轉(zhuǎn)化為信息, 升級為知識, 最終升華為智慧的過程。在這一過程中, 數(shù)據(jù)的“清楚、 簡明、 完整、 正確”程度在不斷提升, 對于數(shù)據(jù)理解的深度也在逐層增加。金源和李成智(2023c)研究指出, 數(shù)據(jù)驅(qū)動下的財務(wù)決策支持工作本質(zhì)上也是從業(yè)財數(shù)據(jù)到?jīng)Q策有用的信息和知識, 最終再到?jīng)Q策智慧的加工收斂過程。在該過程中, 數(shù)據(jù)沿著財務(wù)金字塔(財務(wù)核算、業(yè)務(wù)財務(wù)、戰(zhàn)略財務(wù))由下至上被逐層傳遞, 傳遞內(nèi)容的數(shù)量不斷下降、 質(zhì)量不斷提升(如圖1所示)。

      在上述過程中, 財務(wù)相關(guān)工作也經(jīng)歷著從數(shù)據(jù)管理、 信息管理再到知識管理以及智慧管理的演變。數(shù)據(jù)管理主要關(guān)注數(shù)據(jù)收集、 存儲和處理。信息管理則更進一步, 關(guān)注如何從海量數(shù)據(jù)中提取決策有用信息并進行有效管理。知識管理的關(guān)注重點是將信息轉(zhuǎn)化為可復(fù)用、 可傳播的知識, 以持續(xù)支持組織的決策和創(chuàng)新。智慧管理是知識管理的下一階段, 包括對決策智慧、 高級財務(wù)管理人員經(jīng)驗等的管理。在財務(wù)領(lǐng)域, 上述四階段體現(xiàn)如下:

      第一階段: 數(shù)據(jù)管理。財務(wù)領(lǐng)域最初的數(shù)據(jù)管理體現(xiàn)為對紙質(zhì)憑證、 文檔的保存和歸檔。自1979年開始, 我國財務(wù)管理進入電算化階段, 數(shù)據(jù)開始被存儲在電子表格或小型數(shù)據(jù)庫中, 使得數(shù)據(jù)的存儲、 檢索和分析更加方便, 同時也保障了數(shù)據(jù)的安全性和完整性。

      第二階段: 信息管理。20世紀90年代, 隨著ERP(Enterprise Resourse Planning, 企業(yè)資源管理計劃)的普及, 我國財務(wù)管理進入信息化階段, 業(yè)財數(shù)據(jù)實現(xiàn)初步整合, ERP系統(tǒng)在財務(wù)管理中的應(yīng)用使得企業(yè)的各項資源配置更加合理, 管理者可以依照多方有效信息來進行更為科學合理的決策。2005年財務(wù)共享模式的興起以及2008年XBRL(可擴展商業(yè)報告語言)中國地區(qū)組織的成立, 使得財務(wù)信息管理的標準化程度進一步提高。

      第三階段: 知識管理。2016年, 德勤和Kira Systems宣布將人工智能引入財會領(lǐng)域, 標志著我國財務(wù)管理進入智能化階段(劉勤和楊寅,2019)。劉勤(2021)指出, 由于存儲在人類財務(wù)專家頭腦中的財經(jīng)知識大多具有隱性特點, 因此如何借助有效的知識表示方式, 將人類專家的知識轉(zhuǎn)化為計算機可以自動處理的顯性知識并使之得到有效應(yīng)用, 就成為財務(wù)智能化建設(shè)中的關(guān)鍵問題。為解決上述問題, 部分企業(yè)的財務(wù)部門開始將財務(wù)知識庫、 專家系統(tǒng)和知識圖譜等技術(shù)引入財務(wù)領(lǐng)域以實現(xiàn)財務(wù)知識管理的集中化、 顯性化。

      第四階段: 智慧管理。在DIKW模型中, 智慧是對知識的深入理解和應(yīng)用, 是對復(fù)雜問題的洞見和創(chuàng)新性解決。在財務(wù)管理領(lǐng)域, 智慧管理表現(xiàn)為將決策者的個人智慧與財務(wù)預(yù)測模型、 異常告警與歸因模型的機器智慧進行人機協(xié)同, 以發(fā)現(xiàn)問題背后的隱藏模式, 預(yù)測未來發(fā)展趨勢, 提出業(yè)務(wù)優(yōu)化建議。

      以上從DIKW視角對財務(wù)領(lǐng)域的知識管理模式演變進行了梳理, 而ChatGPT的問世為財務(wù)工作拓展了更大的想象空間, 使得財務(wù)知識管理模式從單向管理向雙向智慧問答演變。例如: 在數(shù)據(jù)管理方面, 微軟的Microsoft 365 Copilot(微軟365智能副駕), 可以對Word、 Excel、 PowerPoint、 Outlook、 Teams等應(yīng)用中的數(shù)據(jù)和文檔以對話的形式進行增刪改查; 在信息管理方面, 微軟的Dynamics 365 Copilot可嵌入ERP系統(tǒng)中實現(xiàn)對于庫存信息、 供應(yīng)商信息的交互式查詢; 在知識管理方面, 可將ChatGPT與財務(wù)知識庫結(jié)合構(gòu)建起問答式財務(wù)知識庫; 在智慧管理方面, GPT-4的Code Interpreter(代碼解釋器)插件通過雙向?qū)υ捄土愦a的形式極大地降低了財務(wù)人員進行海量數(shù)據(jù)處理的門檻。如表1所示。

      三、 基于ChatGPT構(gòu)建問答式財務(wù)知識庫的必要性與可行性

      ChatGPT的出現(xiàn)為財務(wù)人員提供了一種通過自然語言與大模型交互進行知識檢索的模式, 但ChatGPT直接用于財務(wù)知識檢索仍存在著以下問題: ①對于財務(wù)專業(yè)縱深領(lǐng)域知識的理解不足。ChatGPT在不利用財務(wù)知識進一步微調(diào)(Fine Tuning)的情況下, 僅基于其預(yù)訓練(Pre-training)所習得的知識可能無法準確理解財務(wù)工作中一些復(fù)雜的術(shù)語、 流程和實踐。②受限于過高的算力成本, 企業(yè)利用財務(wù)領(lǐng)域數(shù)據(jù)對大模型進行微調(diào)或訓練財務(wù)垂直領(lǐng)域的大模型在當前可行性較低。③ChatGPT在中文語境下訓練不充分, 該缺陷會進一步加劇對財務(wù)術(shù)語的誤解。④對會計準則和稅務(wù)法規(guī)溯源不準確, 該缺陷將影響相關(guān)法規(guī)查詢結(jié)果的可靠性。

      由于以上缺陷的存在, 無論是單獨基于搜索引擎、 內(nèi)部知識庫還是ChatGPT, 均無法較為完善地實現(xiàn)財務(wù)知識庫功能(如表2所示)。但單獨看來, 三者又各有所長: ChatGPT相較于傳統(tǒng)搜索引擎和聊天機器人, 具有深度學習、 多模態(tài)理解、 長文本生成、 上下文感知、 自我學習和良性價值觀等突出特點; 內(nèi)部知識庫具有知識精準度高、 “實務(wù)經(jīng)驗類”知識豐富、 準則和法規(guī)溯源準確等突出特點; 搜索引擎具有實時更新、 覆蓋范圍廣等突出特點。因此, 本文認為可將三者的核心優(yōu)勢相結(jié)合, 構(gòu)建基于ChatGPT的問答式財務(wù)知識庫。

      四、 基于ChatGPT的問答式財務(wù)知識庫框架設(shè)計

      問答式財務(wù)知識庫的構(gòu)建目的是提供一個自助、 便捷、 精準的個性化財務(wù)知識查詢平臺, 使得財務(wù)人員可以通過多輪對話, 就日常工作、 管理決策和技能學習過程中遇到的各類問題, 依據(jù)個人需求和偏好實現(xiàn)個性化檢索。

      (一)財務(wù)知識庫的系統(tǒng)架構(gòu)

      本文認為, 基于ChatGPT的問答式財務(wù)知識庫系統(tǒng)至少需由文檔庫、 組件庫、 向量數(shù)據(jù)庫、 OpenAI的API接口、 日志系統(tǒng)和用戶界面六大模塊組成, 如圖2所示。文檔庫是財務(wù)知識庫的核心模塊, 用于存儲財務(wù)領(lǐng)域的相關(guān)知識, 如會計準則、 稅法以及財務(wù)理論知識等。組件庫(包含文檔分割、 數(shù)據(jù)連接、 索引構(gòu)建、 查詢接口等相關(guān)組件)用于對文檔庫中的文檔進行一系列操作, 將其切分、 加工為計算機易于處理的向量格式。向量數(shù)據(jù)庫則用于存儲經(jīng)組件加工而生成的特征向量, 以便后續(xù)高效地依據(jù)文檔相似度進行匹配和檢索。OpenAI的API接口是財務(wù)知識庫用于調(diào)用ChatGPT等其他服務(wù)的通道, 從而可以基于ChatGPT的自然語言處理能力, 實現(xiàn)對用戶問題的解析并給出自然語言形式的回答。日志系統(tǒng)用于記錄用戶的查詢行為和系統(tǒng)的運行情況, 以便開展后續(xù)的數(shù)據(jù)分析、 性能優(yōu)化和可追溯審計。用戶界面是用戶獲得財務(wù)知識庫服務(wù)的系統(tǒng)入口和人機交互界面。

      接下來, 本文將對上述系統(tǒng)架構(gòu)中最為核心的文檔庫、 組件庫中文檔分割組件、 向量數(shù)據(jù)庫展開進一步解釋。

      1.文檔庫。文檔庫是問答式財務(wù)知識庫最為核心的部分。通常文檔庫至少需包含以下方面的知識: 一是外部的規(guī)章制度, 包括國家和地方政府頒布的各種規(guī)章制度和政策, 以及通行的企業(yè)會計準則、 稅法、 會計人員職業(yè)道德規(guī)范等。二是通用型的財務(wù)知識, 例如財務(wù)經(jīng)典理論知識(會計恒等式、杜邦分析法、投資組合理論、成本性態(tài)分析法等)和財務(wù)前沿知識(數(shù)電發(fā)票、財務(wù)RPA、智能財務(wù)等)。三是公司財務(wù)部門內(nèi)部總結(jié)的經(jīng)驗和知識, 包括財務(wù)人員在日常工作中逐步積累、 總結(jié)和提煉出來的各種財務(wù)管理的技巧、 方法和經(jīng)驗, 以及財務(wù)管理中一些常見問題和解決方法。

      2. 文檔分割組件。受到模型結(jié)構(gòu)、 算力等因素的影響, ChatGPT具有一定的輸入輸出長度限制, 例如GPT-3.5的提問加回答的總長度限制為4096個token, GPT-4擴展為32768個token(token是GPT處理文本的基本單位, 指一個句子中的最小詞元, 它可以是一個字、 一個詞或是一個特殊符號)。由于上述限制的存在, 用戶無法將大型文檔一次性發(fā)送給ChatGPT, 文檔分割組件的主要作用是將文檔庫中的大型文檔按照段落、 句子或關(guān)鍵詞等方式進行分割, 以便于后續(xù)的向量化操作和問答匹配。

      3. 向量數(shù)據(jù)庫。在計算機科學中, 向量數(shù)據(jù)庫是區(qū)別于常規(guī)數(shù)據(jù)庫的一種特殊數(shù)據(jù)庫。常規(guī)數(shù)據(jù)庫以數(shù)據(jù)作為存儲和檢索的對象, 而向量數(shù)據(jù)庫存儲和檢索的對象是計算機更容易處理的向量, 并可高效地依據(jù)向量間的相似性進行檢索。如果將文檔庫視為一個儲存著海量商品的倉庫, 向量數(shù)據(jù)庫存儲的就是這些商品的“標簽”, “標簽”與商品間存在著索引關(guān)系, 可以通過“標簽”快速地檢索到對應(yīng)商品。

      當用戶向問答式財務(wù)知識庫提問時, 系統(tǒng)會首先將提問轉(zhuǎn)化為向量表示形式, 并在向量數(shù)據(jù)庫中匹配與該向量最相似的文檔向量, 再根據(jù)索引關(guān)系從文檔庫中提取相應(yīng)的文本段落, 將該段落作為背景知識, 與用戶的提問共同拼裝為提示詞(Prompt)發(fā)送給ChatGPT, 讓ChatGPT基于提示詞里的用戶原始提問以及依據(jù)提問從文檔庫中匹配到的背景知識給出回復(fù)。該方法在提高ChatGPT回答精準度的同時, 也妥善解除了輸入上限的限制。

      (二)財務(wù)知識庫的運行過程

      本文認為, 問答式財務(wù)知識庫的運行過程可以分為文檔準備和用戶問答兩個階段。在文檔準備階段, 財務(wù)知識庫將各類財務(wù)文獻和報告等信息資源導(dǎo)入文檔庫中, 并通過文檔分割組件和調(diào)用OpenAI的詞句轉(zhuǎn)向量(Word to Vector,Word2vec)API接口, 提取其中的關(guān)鍵信息和特征, 形成文檔的特征向量, 存入向量數(shù)據(jù)庫。在用戶問答階段, 用戶可以通過輸入文本的方式向系統(tǒng)提出問題, 系統(tǒng)將解析用戶的問題并返回最佳答案。在此過程中, 系統(tǒng)會利用向量數(shù)據(jù)庫中存儲的特征向量進行相似度匹配和檢索, 以確保返回的答案盡可能準確和全面。兩階段的具體流程如圖3所示。

      1. 第一階段: 文檔準備階段。文檔準備階段主要是對文檔庫里的文本進行預(yù)處理, 包括轉(zhuǎn)換格式、 分割、 使用OpenAI的Word2vec功能把文本轉(zhuǎn)換成向量。各環(huán)節(jié)的具體操作如下:

      (1)轉(zhuǎn)換文檔格式。由于ChatGPT是一個基于NLP(Natural Language Processing,自然語言處理)的大語言模型, 比較擅長理解文本語言, 所以如果文檔庫里存在PDF格式的文檔或電子表格數(shù)據(jù), 則需轉(zhuǎn)換為純文本格式以便ChatGPT理解。以轉(zhuǎn)換Excel電子表格為例, 可以把電子表格另存為csv格式, 這樣電子表格的表頭和每一行的數(shù)據(jù)信息就被轉(zhuǎn)化為一串以逗號隔開的文本。

      (2)分割文檔。如前文所述, ChatGPT一次對話可處理的token數(shù)量存在上限, 對于大文檔就需要使用文檔分割組件將其分割成小塊(chunk)。此外, 為了滿足每個小塊都有完整語義的要求, 在分割過程中要使用技術(shù)手段保證塊與塊之間存在一些重合。

      (3)使用OpenAI的Word2vec功能把小塊(chunk)的文本轉(zhuǎn)換成向量, 用以表達該段文本的語義, 處理完成后再將計算出來的向量存入向量數(shù)據(jù)庫。

      2. 第二階段: 用戶問答階段。從用戶向財務(wù)知識庫發(fā)起提問到最后系統(tǒng)將回答呈現(xiàn)在用戶界面的全過程中, 系統(tǒng)內(nèi)部經(jīng)歷了如下流程: ①尋找最相關(guān)文本。系統(tǒng)調(diào)用OpenAI的Word2vec功能把用戶提問文本轉(zhuǎn)換成向量, 通過相似度計算, 從向量數(shù)據(jù)庫中匹配最相關(guān)的文本向量。②依據(jù)向量數(shù)據(jù)庫和文檔庫間的索引, 查詢相應(yīng)的背景知識。③將背景知識和提問組合成提示詞(Prompt), 通過接口傳輸至ChatGPT。④系統(tǒng)把提示詞發(fā)給ChatGPT, 在獲得ChatGPT的回答后, 將回答呈現(xiàn)至用戶界面。

      (三)財務(wù)知識庫的日常維護

      問答式財務(wù)知識庫構(gòu)建后, 后續(xù)還可能面臨外部會計準則和稅務(wù)法規(guī)更新、 新文檔入庫以及舊文檔廢棄等情況, 此時就需要建立知識庫的維護規(guī)范, 持續(xù)對文檔庫進行更新。

      首先, 在知識入庫時需要對文檔進行分類管理, 制定標準化的入庫流程, 以確保知識能夠被高效地記錄和管理。為了保證高頻更新文檔的入庫效率, 可以采用RPA技術(shù), 通過批量下載法規(guī)文檔或者對文檔進行預(yù)處理的方法, 將知識快速地錄入文檔庫中。以RPA輔助稅務(wù)法規(guī)入庫為例, RPA可以定期訪問指定網(wǎng)站, 先瀏覽并抓取法規(guī)清單內(nèi)容(包括法規(guī)的標題、 正文、 發(fā)布日期等), 再將抓取到的法規(guī)清單與在庫法規(guī)清單對比以形成一張新增法規(guī)清單, 之后依據(jù)新增法規(guī)清單逐個瀏覽法規(guī)頁面、 抓取法規(guī)內(nèi)容并寫入一個文本文檔, 再通過RPA把本次下載的法規(guī)文本文檔上傳到財務(wù)知識庫的文檔庫里, 最后RPA更新在庫法規(guī)清單以便用于下次比對。

      其次, 知識更新和棄用也是財務(wù)知識庫維護的重要方面。在知識更新方面, 可以利用RPA技術(shù)定期檢查法規(guī)的有效狀態(tài), 確保知識庫中的信息始終保持最新、 準確和可靠。而在知識棄用方面, 需要確保知識庫中的信息經(jīng)過充分的篩選和審核, 將不再適用或不準確的信息標記為棄用, 以避免給用戶帶來誤導(dǎo)或困擾。

      五、 H公司問答式財務(wù)知識庫ChatDoc實踐案例

      (一)案例背景

      H公司是我國領(lǐng)先的科技公司, 聚焦于為各行各業(yè)客戶提供數(shù)字化解決方案, 助力客戶數(shù)字化轉(zhuǎn)型, 為客戶持續(xù)創(chuàng)造價值, 多年來在數(shù)字化方面積累了大量經(jīng)驗。作為財務(wù)數(shù)字化轉(zhuǎn)型的持續(xù)探索者, H公司目前已應(yīng)用多種數(shù)字化技術(shù)構(gòu)建起一套先進的財務(wù)管理體系。隨著ChatGPT的推出, H公司同時成立了多個項目組對其應(yīng)用積極地展開探索, 問答式財務(wù)知識庫ChatDoc是其中的一個項目。通過該項目, H公司旨在提升財務(wù)人員檢索知識的精度和效率。

      (二)ChatDoc的系統(tǒng)結(jié)構(gòu)

      H公司搭建的問答式財務(wù)知識庫架構(gòu)圖如圖4所示。

      ChatDoc的系統(tǒng)組件包括: OpenAI的Embedding模型(用于實現(xiàn)前文所述的詞句轉(zhuǎn)向量功能)、 ChatGPT模型(負責基于問題和背景知識給出回復(fù))、 LlamaIndex組件(負責讀取并切割文檔資料, 構(gòu)建索引, 檢索并匹配向量相似度, 查詢并轉(zhuǎn)接信息)、 文檔庫(負責存儲文檔資料)、 向量數(shù)據(jù)庫(負責存儲文本信息的向量)。

      1. 知識庫的運行過程。H公司ChatDoc系統(tǒng)的運作過程如下: ①文檔庫管理員通過財務(wù)知識庫用戶交互界面上傳文檔到文檔庫。②LlamaIndex讀取文檔資料, 把長文檔切割成小塊文本信息, 并建立索引。③LlamaIndex把小塊文本信息發(fā)給OpenAI的Embedding模型, 并接收被Embedding模型轉(zhuǎn)換好的文本向量。④LlamaIndex把文本向量按照之前建立的索引存入向量數(shù)據(jù)庫, 以備用戶提問時查詢使用。⑤用戶通過用戶交互界面提出問題。⑥LlamaIndex把用戶問題發(fā)給OpenAI的Embedding模型, 并接收被Embedding模型轉(zhuǎn)換好的用戶問題文本向量。⑦LlamaIndex根據(jù)問題文本向量, 從向量數(shù)據(jù)庫中找到相似度高的文本向量。⑧LlamaIndex把用戶問題文本與文檔文本組合成提示詞發(fā)給ChatGPT模型, 并接收ChatGPT的回復(fù)。⑨用戶在用戶交互界面接收到問題的答案。

      從以上運行過程中可以發(fā)現(xiàn), 最終發(fā)給ChatGPT的提示詞(Prompt)不僅包含用戶最初輸入的提問文本, 還包括從文檔庫中檢索出的背景知識。此外, 為了盡可能規(guī)范ChatGPT的回答, 保證輸出結(jié)果的穩(wěn)定性, H公司還在知識庫中內(nèi)置了固定的Prompt模板, 該模板規(guī)定了ChatGPT回答的格式、 依據(jù)和方式。在此基礎(chǔ)上, 將用戶原提問、 從文檔庫中檢索出的背景知識、 固定的Prompt模板三者組合成最終的組合提示詞。組合提示詞的實例如下:

      (固定的Prompt模板)你是一個提供財務(wù)咨詢的專家。你會拿到下面的一段背景知識和一個問題。請基于這些上下文提供一個對話形式的回復(fù)。如果你在這些上下文中找不到答案, 就說“對不起, 我不知道答案。”不要編造答案。如果這個問題與上下文的內(nèi)容無關(guān), 那么就禮貌地回復(fù)你被訓練的能力是只能回復(fù)與上下文有關(guān)的問題。請用中文回復(fù)。背景知識和提問信息如下所示:

      上述組合提示詞里第一段為固定模板, 背景知識文本和用戶問題文本是LlamaIndex在每次用戶提問后插入進去的文本, 其中背景知識文本是借助向量相似度運算從文檔庫里匹配出來的。如此一來, 就可以讓ChatGPT基于本地文檔庫進行回答, 從而使得ChatGPT在回復(fù)用戶提問時給出一個更加理想的答案。

      2. 用戶交互界面的設(shè)計。ChatDoc的用戶交互界面被設(shè)計成文檔列表區(qū)、 文檔內(nèi)容展示區(qū)和問答區(qū)三個部分。在文檔列表區(qū), 用戶可以上傳文檔, 并可查看文檔索引的狀態(tài), 在系統(tǒng)完成對文檔的索引后, 用戶就可以選擇多個文檔, 并且基于這些文檔進行提問。在文檔內(nèi)容展示區(qū), 用戶可以查看文檔內(nèi)容預(yù)覽。在問答區(qū), 用戶可以提出問題, 問題會被實時展示在對話框里, 在短時間的延遲后, 用戶就能獲得回復(fù)。

      (三)ChatDoc的應(yīng)用場景

      1. 實現(xiàn)公司財務(wù)制度查詢。ChatDoc可作為智能財務(wù)客服, 幫助員工便捷、 迅速地查詢和理解公司的財務(wù)政策, 常用場景包括: ①報銷查詢: 員工經(jīng)常需要報銷工作相關(guān)的餐費、 差旅費等費用, 用戶可通過ChatDoc查詢公司報銷政策涉及的細節(jié), 如可供報銷的費用類別、 差標額度、 出差天數(shù)計算方式、 所需提供證明等。②薪資政策查詢: 員工可以向ChatDoc提問薪資的計算方式、 發(fā)放日期、 稅務(wù)處理等薪資政策相關(guān)問題。

      2. 實現(xiàn)會計準則、 稅法精準溯源。目前直接使用ChatGPT進行會計準則、 稅法查詢時, 由于其本身訓練數(shù)據(jù)的限制, 會導(dǎo)致ChatGPT回答我國企業(yè)會計準則和稅法相關(guān)問題時出現(xiàn)憑空捏造準則、 法規(guī)的情況, 該問題嚴重影響了ChatGPT在應(yīng)用于財務(wù)實務(wù)工作時的可信度。H公司的ChatDoc在回答準則和稅法相關(guān)問題時可精準溯源回答所參考的準則或法規(guī), 包括它是在哪個文件中提及的, 是由哪個機構(gòu)發(fā)布的, 以及發(fā)布和修改的日期等信息。

      3. 實現(xiàn)跨文檔查詢。跨文檔查詢是指用戶可在ChatDoc文檔列表區(qū)同時勾選多個文件, 讓ChatDoc綜合參考多個文件給出回答。例如, 在進行投資決策時, 財務(wù)人員需要對多份公司財報、 行業(yè)報告等進行對比分析。通過跨文檔查詢, 財務(wù)人員可以更全面地理解信息, 從而做出更明智的投資決策。又如, 在進行會計分錄編制時, 會計人員需綜合考慮準則要求、 適用稅率、 業(yè)務(wù)背景等相關(guān)文檔, 通過跨文檔查詢, ChatDoc可在綜合考慮以上信息的情況下給出編制某一業(yè)務(wù)相關(guān)會計分錄的參考建議。有研究表明, 目前ChatGPT受限于邏輯能力, 在中文語境下, 其分錄編制能力大約在中級會計師水平, 因此在上述場景中ChatGPT難以勝任較為復(fù)雜的分錄編制場景。

      4. 實現(xiàn)財務(wù)專業(yè)理論查詢。ChatDoc可用于專業(yè)財務(wù)理論的查詢, 如財務(wù)理論(有效市場假說、莫迪格利亞尼—米勒定理等)、 投資理論(現(xiàn)代投資組合理論、CAPM模型等)、 財務(wù)模型(貝塔系數(shù)、DCF模型等)。ChatDoc還可在此基礎(chǔ)上提供實例對理論給出進一步闡釋, 以便于財務(wù)人員理解。

      5. 對公開財報進行分析。目前, ChatDoc支持用戶上傳pdf、 xlsx、 csv格式的報表文件, 并可進行初步的財務(wù)報表比率分析(營利性分析、流動性分析、償債能力分析、杜邦分析等)和趨勢分析。

      (四)ChatDoc的實踐成效

      H公司通過將ChatDoc小范圍投入測試并搜集反饋后發(fā)現(xiàn), 基于ChatGPT的問答式財務(wù)知識庫彌補了原有基于搜索引擎和內(nèi)部知識庫的知識檢索模式存在的不足, 能為用戶提供更精準的答案, 使用戶獲得更佳的使用體驗。具體表現(xiàn)在如下方面:

      首先, ChatDoc可以更精確地理解用戶的問題和意圖, 提供更為精準的答案。傳統(tǒng)的知識庫系統(tǒng)往往只能匹配用戶輸入的關(guān)鍵詞, 無法理解用戶的意圖和上下文, 用戶往往需要多次嘗試才能得到滿意的答案。而ChatDoc則可以憑借ChatGPT的自然語言理解能力, 更好地理解用戶意圖。這不僅有利于提高用戶的滿意度, 還能節(jié)省用戶的時間和精力。

      其次, ChatDoc能夠提供更加個性化的答案。傳統(tǒng)的知識庫系統(tǒng)往往只能列出相關(guān)的規(guī)則和條款, 而無法根據(jù)用戶輸入的問題給出符合實務(wù)場景的答案。ChatDoc不僅可以提供個性化的答案, 還可以根據(jù)規(guī)則庫中的知識, 給出一個詳細的邏輯推理過程, 用戶可以通過查看推理過程來判斷答案的可靠性。

      最后, ChatDoc減輕了財務(wù)人員的工作壓力。在財務(wù)日常工作中, H公司財務(wù)人員除了需承擔本職工作, 還要為公司員工提供有關(guān)報銷政策、 報銷進度等方面的咨詢服務(wù)。通過ChatDoc, 員工可以便捷地咨詢報銷制度等內(nèi)容, 這種自助查詢服務(wù)將減輕財務(wù)人員的工作壓力。例如, 員工可以在知識庫中查詢報銷規(guī)則和計算出差天數(shù)的方法, 無須等待人工客服的回復(fù)。這種自助服務(wù)不僅可以提高效率, 也可以提高員工對公司財務(wù)規(guī)則的理解和遵守程度。同時, H公司還將ChatDoc集成到辦公軟件中, 用戶可隨時隨地通過手機、 電腦接入ChatDoc自助獲取服務(wù)。

      在研究中, H公司還注意到, 當前ChatGPT本身能力的不足也在一定程度上限制了ChatDoc的價值發(fā)揮, 具體體現(xiàn)在如下方面: ①ChatGPT對文本以外的資料理解并不好, 比如在處理復(fù)雜表格數(shù)據(jù)時存在取數(shù)不準的問題, 在編制復(fù)雜會計分錄時會存在邏輯錯誤, 這會影響財務(wù)報表編制和財務(wù)分析相關(guān)知識問答的效果。②H公司也注意到用戶提問的提示詞(Prompt)對于答案的可靠性至關(guān)重要。用戶就同一個問題使用不同的提示詞, 從財務(wù)知識庫中獲得的答案有時是對的, 有時是錯的。甚至在使用相同提示詞時也會出現(xiàn)答案不一致的情況, 這種情況被學界稱為“大模型幻覺”。對此, H公司通過加入要求ChatGPT給出推理過程和嚴格依據(jù)背景知識的提示詞, 以便用戶核實所獲得答案的可靠性。

      六、 結(jié)論與展望

      (一)結(jié)論

      本文創(chuàng)新性地將ChatGPT應(yīng)用于問答式財務(wù)知識庫的構(gòu)建, 并通過理論框架搭建和案例研究驗證了該方法的有效性和實用性。通過研究得到以下結(jié)論: ①設(shè)計基于文檔庫、 組件庫、 向量數(shù)據(jù)庫、 OpenAI接口、 日志系統(tǒng)、 用戶界面的體系框架是當前階段構(gòu)建基于ChatGPT的問答式財務(wù)知識庫行之有效的一種方式。②基于ChatGPT構(gòu)建財務(wù)知識庫可以提高財務(wù)知識的管理效率和問答的可靠性, 還可以實現(xiàn)動態(tài)知識更新, 從而保證知識庫的時效性和全面性, 為財務(wù)人員和其他領(lǐng)域的從業(yè)者提供更加高效和準確的知識管理和智能問答服務(wù)。

      (二)展望

      財務(wù)部門作為連接企業(yè)采購、 生產(chǎn)、 運營、 銷售等經(jīng)營行為的關(guān)鍵樞紐, 匯集并管理著企業(yè)從業(yè)務(wù)前端到財務(wù)管理后端的海量核心機密數(shù)據(jù), 因此在基于ChatGPT構(gòu)建財務(wù)知識庫的過程中, 數(shù)據(jù)安全必須引起高度重視。盡管文檔庫和向量數(shù)據(jù)庫可以儲存在企業(yè)本地, 但是在問答過程中系統(tǒng)會把提取的文本發(fā)給ChatGPT, 雖然OpenAI承諾不會使用這些數(shù)據(jù)用于訓練, 但不能保證數(shù)據(jù)在傳輸過程中不會發(fā)生泄露。本文認為, 解決該問題的第一種可行方案是嚴格限制可納入文檔庫的資料范圍, 對機密資料進行脫敏處理后再納入文檔庫。第二種可行方案是將ChatGPT替換成其他可以本地化部署的大模型, 從而使得所有的文檔和傳輸均在企業(yè)本地, 然而, 企業(yè)本地化部署大模型的硬件成本、 軟件成本疊加服務(wù)成本通常在千萬元級別, 企業(yè)需要權(quán)衡成本收益后審慎決定。數(shù)據(jù)安全是財務(wù)系統(tǒng)建設(shè)的紅線和底線, 未來企業(yè)知識庫的建設(shè)要注意守住底線、 提升上限、 優(yōu)化體驗, 朝著助力財務(wù)人員轉(zhuǎn)型升級、 賦能財務(wù)管理的大方向穩(wěn)步探索。

      【 主 要 參 考 文 獻 】

      陳虎,郭奕.數(shù)據(jù)價值體系推動財務(wù)數(shù)字化轉(zhuǎn)型[ J].財會月刊,2022(8):37 ~ 42.

      金源,李成智.ChatGPT+Acctech:ChatGPT對會計科技的影響研究[ J].商業(yè)會計,2023a(7):4 ~ 10.

      金源,李成智.ChatGPT對智能財務(wù)體系的影響:場景優(yōu)化、技術(shù)革新與人員轉(zhuǎn)型[ J].財會月刊,2023b(15):23 ~ 30.

      金源,李成智.數(shù)據(jù)驅(qū)動下的財務(wù)決策支持研究[ J].財會通訊,2023c(3):140 ~ 147.

      劉勤,楊寅.改革開放40年的中國會計信息化:回顧與展望[ J].會計研究,2019(2):26 ~ 34.

      劉勤.ChatGPT及其對會計工作的影響探討[ J].會計之友,2023(6):158 ~ 161.

      劉勤.智能財務(wù)中的知識管理與人機協(xié)同[ J].財會月刊,2021(24):15 ~ 19.

      猜你喜歡
      知識管理
      提升企業(yè)知識管理能力 增強企業(yè)的強勁發(fā)展態(tài)勢
      檔案管理與知識管理的關(guān)系研究
      大數(shù)據(jù)時代高校學生知識管理
      科技視界(2016年21期)2016-10-17 18:42:37
      我國高新技術(shù)企業(yè)實施知識管理的重要性研究
      株洲市| 电白县| 彩票| 东港市| 固始县| 晋州市| 台前县| 安义县| 建湖县| 惠东县| 红安县| 丹巴县| 洪洞县| 阳新县| 五华县| 铜鼓县| 北海市| 苏尼特左旗| 镇安县| 邻水| 西盟| 抚宁县| 兰考县| 家居| 上林县| 鲁甸县| 安新县| 达孜县| 长乐市| 五常市| 巴里| 会昌县| 宜兰县| 滨州市| 增城市| 扶绥县| 安国市| 长沙县| 米易县| 朝阳县| 惠来县|