• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于小樣本采集環(huán)境下的合同智能化應(yīng)用研究

    2021-05-07 10:44:32張?zhí)m蘭
    關(guān)鍵詞:語(yǔ)料機(jī)器智能化

    張?zhí)m蘭

    (中海油信息科技有限公司,天津 300452)

    作為企業(yè)業(yè)務(wù)經(jīng)營(yíng)的重要依據(jù),合同的管理已經(jīng)越來(lái)越被企業(yè)所關(guān)注,隨著國(guó)家對(duì)于法治央企建設(shè)的相關(guān)政策性要求與文件的出臺(tái),集團(tuán)公司對(duì)于合同管理的合法性、合規(guī)性、抗風(fēng)險(xiǎn)能力的要求也越來(lái)越高,從而對(duì)于法律共享中心的法務(wù)工作人員合同審核的專業(yè)程度、及時(shí)響應(yīng)及準(zhǔn)確程度均提出了更高的要求。

    因此需要在合同審核階段的業(yè)務(wù)處理過(guò)程中引入智能化應(yīng)用以輔助業(yè)務(wù)的辦理,將法務(wù)工作人員從大量的重復(fù)性、常識(shí)性、規(guī)律性的工作中解放出來(lái),從而提升集團(tuán)法律共享中心的法務(wù)工作人員的工作效率、服務(wù)質(zhì)量以及審查的準(zhǔn)確性。

    1 關(guān)鍵技術(shù)說(shuō)明

    1.1 自然語(yǔ)言處理(NLP)

    自然語(yǔ)言處理(Natural Language Processing,NLP)是語(yǔ)言信息處理的一個(gè)重要分支,是實(shí)現(xiàn)人機(jī)交互的重要溝通方式,在我國(guó)就是中文信息處理的意思[1]。

    1.2 機(jī)器學(xué)習(xí)技術(shù)

    機(jī)器學(xué)習(xí)就是要使計(jì)算機(jī)能模擬人的學(xué)習(xí)行為,自動(dòng)地通過(guò)學(xué)習(xí)獲取知識(shí)和技能,重新組織已有的知識(shí)結(jié)構(gòu),不斷改善自身的性能,實(shí)現(xiàn)自我完善。

    在機(jī)器學(xué)習(xí)的主要方式為三種,分別為類監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)以及半監(jiān)督學(xué)習(xí)[2]。

    2 智能化技術(shù)在合同審核中的應(yīng)用

    為了提升合同管理的信息化水平、提高合同管理業(yè)務(wù)處理效率,2014年集團(tuán)開始了合同管理的數(shù)字化管理進(jìn)程,合同管理始建于2015年,并同期開始提供全集團(tuán)的內(nèi)部服務(wù),覆蓋了合同業(yè)務(wù)管理的簽訂前、簽訂中、履行中、履行后及統(tǒng)計(jì)分析的全生命周期。

    人工智能通用技術(shù)研究有助于深入理解技術(shù)前景及其局限。當(dāng)前人工智能領(lǐng)域以“AI+行業(yè)”的方式展開,人臉識(shí)別、人臉支付、語(yǔ)音識(shí)別、智能醫(yī)療、智能家居、智能零售等應(yīng)用快速步入社會(huì)經(jīng)濟(jì)。在這些新興應(yīng)用領(lǐng)域的背后,是機(jī)器學(xué)習(xí)、知識(shí)圖譜、自然語(yǔ)言處理、人機(jī)交互、計(jì)算機(jī)視覺、生物特征識(shí)別、虛擬現(xiàn)實(shí)等通用技術(shù)的支撐。新技術(shù)在帶來(lái)熱潮和繁榮的同時(shí)也有其局限性。通過(guò)對(duì)人工智能通用技術(shù)的研究,能夠了解當(dāng)前技術(shù)發(fā)展?fàn)顩r,充分認(rèn)識(shí)技術(shù)的更多可能以及其局限性。

    2.1 人工智能技術(shù)在合同智能審核中的應(yīng)用

    人工智能技術(shù)在法律事務(wù)及合同管理領(lǐng)域的應(yīng)用,國(guó)內(nèi)外同類軟件提供的主要應(yīng)用包括合同關(guān)鍵信息結(jié)構(gòu)化、合同預(yù)篩選、合同審查、風(fēng)險(xiǎn)狀況統(tǒng)計(jì)、風(fēng)險(xiǎn)分析報(bào)告以及自助式訓(xùn)練等,其中合同審查功能是所有軟件的核心應(yīng)用。研發(fā)這些軟件涉及到的人工智能關(guān)鍵技術(shù),包括機(jī)器學(xué)習(xí)算法、文本分析、自然語(yǔ)言處理、知識(shí)圖譜等技術(shù)。

    2.2 項(xiàng)目總體技術(shù)架構(gòu)

    總體技術(shù)架構(gòu)通過(guò)以下幾層展開(圖1):

    (1)系統(tǒng)層是系統(tǒng)的支撐,是整個(gè)技術(shù)架構(gòu)的基礎(chǔ)。

    (2)數(shù)據(jù)層描述的是系統(tǒng)涉及到的不同方面的數(shù)據(jù)的存儲(chǔ)。

    圖1 項(xiàng)目技術(shù)架構(gòu)圖Fig.1 Project technical architecture diagram

    圖2 語(yǔ)義分析處理過(guò)程Fig.2 Semantic analysis processing process

    (3)數(shù)據(jù)訪問層負(fù)責(zé)與數(shù)據(jù)庫(kù)存儲(chǔ)設(shè)備打交道,為業(yè)務(wù)層提供數(shù)據(jù)服務(wù)。

    (4)算法層負(fù)責(zé)數(shù)據(jù)對(duì)象的運(yùn)算和操作,為業(yè)務(wù)層提供符合業(yè)務(wù)場(chǎng)景的數(shù)據(jù)運(yùn)算服務(wù)。

    (5)業(yè)務(wù)層確定業(yè)務(wù)的邏輯結(jié)構(gòu)和工作流程,以各種協(xié)議及中間件為依托,為整個(gè)系統(tǒng)提供專門的服務(wù)能力。

    (6)負(fù)載分配層為服務(wù)提供高可用,可擴(kuò)展,高負(fù)載的服務(wù)能力提供有效保障。

    (7)系統(tǒng)中各個(gè)子系統(tǒng)及服務(wù)通過(guò)RESTful API的方式進(jìn)行統(tǒng)一的權(quán)限與認(rèn)證及配置體系,通過(guò)統(tǒng)一的消息系統(tǒng)進(jìn)行系統(tǒng)間消息的傳遞與接收,通過(guò)統(tǒng)一的日志處理進(jìn)行日志的記錄與查看,從而形成一整套完整的技術(shù)體系架構(gòu)。

    2.3 小語(yǔ)料、多范本數(shù)據(jù)模型研究

    眾所周知,如果想要得到一個(gè)性能良好的模型,需要大量的數(shù)據(jù)標(biāo)注工作,同時(shí)也需要大量的用于標(biāo)注的數(shù)據(jù)。對(duì)于通用模型,我們可以從互聯(lián)網(wǎng)獲取很多免費(fèi)的可供標(biāo)注的數(shù)據(jù)資源,同時(shí)也有大量的提供標(biāo)注服務(wù)的公司。但是對(duì)于合同這個(gè)領(lǐng)域,一方面合同數(shù)量極其有限,另一方面合同中包含大量敏感信息,不便外泄。所以就需要一個(gè)能在小語(yǔ)料的場(chǎng)景下能夠提供更多泛化能力的模型來(lái)進(jìn)行自然語(yǔ)言處理的工作。

    本項(xiàng)目通過(guò)對(duì)近200份包含三類(分別是IT類硬件設(shè)備采購(gòu)合同-中心2017修訂模板,IT類系統(tǒng)維護(hù)與技術(shù)支持服務(wù)合同-中心2017修訂模板,IT類實(shí)施服務(wù)合同-中心2017修訂模板)合同進(jìn)行標(biāo)注,如圖2。

    圖3 智能化應(yīng)用管理平臺(tái)處理機(jī)制Fig.3 Processing mechanism of intelligent application management platform

    模型訓(xùn)練除了必不可少的語(yǔ)料之外,還加入了實(shí)體詞庫(kù)。前者來(lái)自人工標(biāo)注的數(shù)據(jù),經(jīng)過(guò)加工形成語(yǔ)料,后者一部分來(lái)自人工標(biāo)注的數(shù)據(jù),一部分來(lái)自表達(dá)式匹配抽取的數(shù)據(jù),后續(xù)還可以通過(guò)結(jié)合已有系統(tǒng)的數(shù)據(jù)來(lái)充實(shí)實(shí)體詞庫(kù)。這樣就為模型訓(xùn)練提供了更多的特征數(shù)據(jù),相當(dāng)于間接地?cái)U(kuò)充了語(yǔ)料。

    在進(jìn)行合同要素提取的時(shí)候,通過(guò)對(duì)模型預(yù)測(cè)的結(jié)果進(jìn)行二次優(yōu)化,也是提升精確率的一個(gè)關(guān)鍵步驟,通過(guò)總結(jié)提煉合同每個(gè)要素信息的特點(diǎn),完善優(yōu)化算法,對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行必要的糾錯(cuò)及補(bǔ)充,最終達(dá)到合同文本內(nèi)關(guān)鍵要素提取的較高的準(zhǔn)確率。

    3 研究成果說(shuō)明

    由于企業(yè)經(jīng)營(yíng)合同信息屬于商業(yè)機(jī)密要件,在無(wú)法為智能化應(yīng)用場(chǎng)景中的機(jī)器訓(xùn)練提供足夠的樣本,作為訓(xùn)練的數(shù)據(jù)依據(jù),只能在應(yīng)用智能化應(yīng)用場(chǎng)景中采用小樣本、小語(yǔ)料環(huán)境下采用半監(jiān)督模式進(jìn)行學(xué)習(xí)與訓(xùn)練。因此在本次項(xiàng)目中采用了機(jī)器學(xué)習(xí)與人工干預(yù)相結(jié)合的方式增加信息抽取與標(biāo)定的精度。經(jīng)過(guò)研究與驗(yàn)證,本次項(xiàng)目構(gòu)建的智能化應(yīng)用管理平臺(tái)的處理機(jī)制為,如圖3所示。

    同時(shí)滿足了合同審核業(yè)務(wù)中的如下業(yè)務(wù)要求:

    (1) 統(tǒng)一后臺(tái)管理,提供模型數(shù)據(jù)的全過(guò)程處理能力。

    (2)提供模型的版本管理能力,可實(shí)現(xiàn)在線的版本切換、回退。

    (3)提供機(jī)器學(xué)習(xí)算法的擴(kuò)展接口,便于改進(jìn)升級(jí)新的算法。

    (4)提供模型評(píng)估能力,便于跟蹤模型訓(xùn)練效果。

    基于合同智能應(yīng)用平臺(tái),技術(shù)開發(fā)人員和合同管理業(yè)務(wù)人員可以共同進(jìn)行合同審查相關(guān)數(shù)據(jù)模型、審查規(guī)則的不斷優(yōu)化完善。

    猜你喜歡
    語(yǔ)料機(jī)器智能化
    智能化戰(zhàn)爭(zhēng)多維透視
    軍事文摘(2022年19期)2022-10-18 02:41:14
    機(jī)器狗
    機(jī)器狗
    印刷智能化,下一站……
    未來(lái)機(jī)器城
    電影(2018年8期)2018-09-21 08:00:06
    基于“物聯(lián)網(wǎng)+”的智能化站所初探
    基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
    華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
    石油石化演進(jìn)智能化
    能源(2015年8期)2015-05-26 09:15:56
    無(wú)敵機(jī)器蛛
    安徽省| 吉隆县| 五莲县| 惠州市| 普格县| 台南县| 安吉县| 东山县| 湘阴县| 兴宁市| 武汉市| 阿勒泰市| 德昌县| 台东市| 黑河市| 静宁县| 大荔县| 西乌珠穆沁旗| 苍南县| 华容县| 泾川县| 镇巴县| 龙游县| 昆明市| 潞西市| 和政县| 东乡族自治县| 株洲县| 茌平县| 鄂州市| 平山县| 定结县| 泾源县| 西乌| 修武县| 商河县| 晋城| 晋中市| 运城市| 景谷| 莲花县|