周向明 貝聿運(yùn)
摘要:近年來,機(jī)器人過程自動(dòng)化(RPA)因代替人工操作電腦以實(shí)現(xiàn)業(yè)務(wù)自動(dòng)化而備受矚目。從業(yè)務(wù)流程自動(dòng)化(BPA)到機(jī)器人過程自動(dòng)4GRPA,商業(yè)領(lǐng)域基于規(guī)則自動(dòng)化業(yè)務(wù)流程,有效簡化了企業(yè)運(yùn)營并降低成本。本文探討了如何基于機(jī)器深度學(xué)習(xí)構(gòu)建智能材料預(yù)審模型,簡化政務(wù)領(lǐng)域材料預(yù)審人力成本,以期為各地“一網(wǎng)通辦”線上線下實(shí)現(xiàn)申請(qǐng)材料預(yù)審智能化、自動(dòng)化提供可供借鑒參考的方法。
關(guān)鍵詞:智能材料預(yù)審;深度學(xué)習(xí);Faster R-CNN;OCR;NLP
隨著各地“一網(wǎng)通辦”工作的深入推進(jìn),越來越多的政務(wù)服務(wù)實(shí)現(xiàn)在線可辦。與此同時(shí),由于線上線下服務(wù)不同源、申請(qǐng)人業(yè)務(wù)不熟悉等原因,申請(qǐng)人容易提交不規(guī)范、不完備、無關(guān)聯(lián)的“無效電子材料”,導(dǎo)致用戶材料反復(fù)補(bǔ)正、在線申報(bào)效率較低。本文在通過引用深度學(xué)習(xí)技術(shù)、OCR技術(shù)和NLP技術(shù),構(gòu)建智能材料預(yù)審模型,推動(dòng)實(shí)現(xiàn)智能材料預(yù)審場景的落地應(yīng)用,有效減少用戶提交“無效材料”的情況,提升審批效率,增進(jìn)企業(yè)及群眾辦事便捷度和獲得感。
1智能材料預(yù)審要點(diǎn)與核心問題
1.1行政預(yù)審材料受理要點(diǎn)
在日常審批過程中,審核人員主要關(guān)注三個(gè)方面,即申請(qǐng)內(nèi)容的完備性、一致性和規(guī)范性。完備性是指申請(qǐng)人是否提供數(shù)量完整的材料,材料包含的內(nèi)容和要素是否全部涵蓋。一致性指申請(qǐng)材料與填報(bào)內(nèi)容是否一致,材料與材料之間的關(guān)聯(lián)信息是否一致。規(guī)范性指申報(bào)內(nèi)容和材料類型是否符合常規(guī)、常識(shí);申報(bào)內(nèi)容和材料的格式是否滿足申報(bào)條件和法律規(guī)章制度要求。
1.2智能材料預(yù)審需解決的兩個(gè)核心問題
針對(duì)審核人員的關(guān)注要點(diǎn)的分析和技術(shù)論證,要實(shí)現(xiàn)智能材料預(yù)審需重點(diǎn)解決兩個(gè)問題:一是如何提取申請(qǐng)人上傳附件材料中的關(guān)鍵信息;二是如何自動(dòng)鑒別非固定版式材料的申請(qǐng)內(nèi)容,如何自動(dòng)核驗(yàn)非固定版式材料的規(guī)范性。
(1)附件材料關(guān)鍵信息要素提取
針對(duì)申請(qǐng)附件材料的關(guān)鍵信息提取問題,本文分析常見的行政審核材料類型,提出相應(yīng)技術(shù)解決方案。常見的附件材料主要分為兩類:
2.2關(guān)鍵技術(shù)
(1)材料信息識(shí)別——基于深度學(xué)習(xí)的OCR模型構(gòu)建
1)固定版式材料:如證照類、圖紙類、照片類;承諾書、通知書、表格類等。這類材料格式比較固定,通過基于深度學(xué)習(xí)的OCR(光學(xué)字符識(shí)別)技術(shù)能夠?qū)崿F(xiàn)關(guān)鍵信息的快速準(zhǔn)確提取。
2)非固定版式材料:證明類(婚育證明、表格類等)、文檔類(告知承諾、判決書等),這類材料一般沒有有統(tǒng)一模板,需要針對(duì)每類材料進(jìn)行要點(diǎn)識(shí)別提取和分析建模,通過深度學(xué)習(xí)技術(shù)結(jié)合光學(xué)字符識(shí)別(OCR)技術(shù),快速完成歷史材料數(shù)據(jù)的關(guān)鍵信息標(biāo)注,自動(dòng)生成抽取模型。
(2)申請(qǐng)內(nèi)容信息處理
對(duì)于非固定版式材料申請(qǐng)內(nèi)容、材料的規(guī)范性辨別,本文采用自然語言處理技術(shù)(NLP)和規(guī)則模型算法,通過機(jī)器學(xué)習(xí)自動(dòng)處理大量重復(fù)性、基于規(guī)則的預(yù)審業(yè)務(wù)流程,模擬人工操作路徑,完成業(yè)務(wù)信息的查詢和校驗(yàn),自動(dòng)判斷申請(qǐng)內(nèi)容的規(guī)范性。
2智能材料預(yù)審模型構(gòu)建
2.1智能預(yù)審流程
本文構(gòu)建的材料智能預(yù)審流程如圖1所示。材料智能預(yù)審可分為線上自動(dòng)預(yù)審與線下輔助預(yù)審。當(dāng)申請(qǐng)人在線上提交材料時(shí),通過智能材料預(yù)審模型識(shí)別比對(duì),對(duì)申請(qǐng)人提交的材料進(jìn)行在線核驗(yàn),對(duì)申請(qǐng)人提交材料存在的錯(cuò)誤實(shí)時(shí)提醒。當(dāng)申請(qǐng)人在“綜合窗口”進(jìn)行業(yè)務(wù)辦理時(shí),通過OCR識(shí)別、掃描驗(yàn)證等方式將申請(qǐng)材料識(shí)別處理,基于材料智能預(yù)審模型識(shí)別比對(duì),輔助工作人員錯(cuò)誤告知申請(qǐng)人。
OCR技術(shù)在智能材料預(yù)審中的作用主要是信息識(shí)別提取,基于現(xiàn)有技術(shù)和材料預(yù)審涉及的OCR場景為受控場景,本文構(gòu)建了基于深度學(xué)習(xí)的OCR模型框架,模型架構(gòu)由四個(gè)部分組成,輸入材料圖像、基于Faster R-CNN受控場景文字定位、基于序列識(shí)別學(xué)習(xí)的文本識(shí)別、識(shí)別輸出結(jié)果。
1)基于Faster R-CNN的受控場景文字檢測
對(duì)于受控場景(如身份證、營業(yè)執(zhí)照等)的文字檢測,采用基于Faster R-CNN算法的關(guān)鍵字檢測。Famer R_CNN算法結(jié)構(gòu)由RPN(候選區(qū)域生成網(wǎng)絡(luò))和RCN(區(qū)域分類網(wǎng)絡(luò))兩個(gè)子網(wǎng)絡(luò)組成。RPN通過監(jiān)督學(xué)習(xí)的方法判斷候選框是否為目標(biāo),輸出結(jié)果為無標(biāo)簽的區(qū)域和粗定位結(jié)果。RCN引入類別概念,對(duì)候選區(qū)域進(jìn)行分類損失和位置回歸,輸出精細(xì)定位結(jié)果。Faster R-CNN整個(gè)網(wǎng)絡(luò)流程都能共享卷積神經(jīng)網(wǎng)絡(luò)提取的特征信息,可以通過多次檢測確定不同粒度的文本區(qū)域。
2)基于CNN序列學(xué)習(xí)的文本識(shí)別
基于序列學(xué)習(xí)的文本識(shí)別網(wǎng)絡(luò)結(jié)構(gòu)分為三層:卷積層、遞歸層和解譯層。模型構(gòu)建過程如圖2所示,首先通過卷積層網(wǎng)絡(luò)神經(jīng)模型(CNN)提取字符特征,生成卷積特征圖;其次在遞歸層,利用基于雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(BLSTM)的遞歸神經(jīng)網(wǎng)絡(luò)作為序列學(xué)習(xí)器,學(xué)習(xí)特征序列中字符特征和字符的先后關(guān)系,有效建模序列內(nèi)部關(guān)系;最后在解譯層,通過CTC(聯(lián)結(jié)主義時(shí)間分類器)操作將每一時(shí)刻的預(yù)測結(jié)果聯(lián)合起來,去掉空白和重復(fù)的模式,就形成最終的序列預(yù)測結(jié)果文本“勞動(dòng)合同書”。
(2)材料信息處理—基于深度學(xué)習(xí)的自然語言處理技術(shù)
對(duì)于已經(jīng)識(shí)別提取的材料信息,需進(jìn)行文本語義分析。本文采用NLP最新算法BERT(Bidirectional EncoderRepresentations from Transformers),使政務(wù)領(lǐng)域材料預(yù)審中的關(guān)鍵信息抽取、材料預(yù)審合規(guī)性檢查等需要認(rèn)知參與的復(fù)雜任務(wù)實(shí)現(xiàn)智能化、自動(dòng)化的應(yīng)用效果。輸入表示
針對(duì)不同的輸入表示要求,可以在一個(gè)詞序列中表示單個(gè)文本句或一對(duì)文本。對(duì)于給定的詞,表征由其對(duì)應(yīng)的詞表征(Token Embedding)、段表征(Segment Embedding)和位置表征(Position Embedding)三部分求和組成。
1)預(yù)訓(xùn)練任務(wù)
本文引用一個(gè)下一句預(yù)測任務(wù)NSP(Next SentencePrediction)進(jìn)行句子之間關(guān)系理解模型的訓(xùn)練。訓(xùn)練語料從預(yù)審材料語料庫中抽取包括A和B的兩個(gè)句子進(jìn)行生產(chǎn),其中50%的概率是A是B的下一句,50%的概率是A是語料庫中的一個(gè)隨機(jī)句。NSP的任務(wù)是通過獲取句子間的信息預(yù)測A是否是B的下一句。
2)算法模型構(gòu)建
本文通過四個(gè)階段構(gòu)建BERT模型。
①開啟混合精度實(shí)現(xiàn)訓(xùn)練加速,使用混合精度訓(xùn)練可以加速訓(xùn)練過程并且減少顯存開銷;
②在通用型材料預(yù)審語料基礎(chǔ)上加入個(gè)性化材料語料進(jìn)行模型訓(xùn)練;
③預(yù)訓(xùn)練過程中融入政務(wù)知識(shí)圖譜中的實(shí)體信息,這種基于符號(hào)語義的計(jì)算模型,可以為BERT提供先驗(yàn)知識(shí),使其具備一定的常識(shí)和推理能力;
④在業(yè)務(wù)數(shù)據(jù)上進(jìn)行微調(diào),支持不同類型的業(yè)務(wù)材料預(yù)審。
(3)規(guī)則算法構(gòu)建
規(guī)則應(yīng)用算法指對(duì)材料格式糾錯(cuò)、文字糾錯(cuò)、表單糾錯(cuò)、材料與材料之間的關(guān)系校驗(yàn)功能進(jìn)行算法設(shè)計(jì)和加工,每個(gè)功能點(diǎn)都有獨(dú)立的算法和規(guī)則。
1)兩項(xiàng)關(guān)鍵工作——規(guī)則和數(shù)據(jù)
“規(guī)則”和“數(shù)據(jù)”是實(shí)現(xiàn)材料智能預(yù)審兩項(xiàng)關(guān)鍵工作。規(guī)則是通過深度學(xué)習(xí),梳理不同類型材料的預(yù)審規(guī)則,構(gòu)建預(yù)審規(guī)則模型;數(shù)據(jù)是指基于政務(wù)知識(shí)圖譜產(chǎn)生的大量材料文本數(shù)據(jù),基于前面輸入的預(yù)審規(guī)則模型進(jìn)行大規(guī)模樣本訓(xùn)練。完成上述兩項(xiàng)工作后,從召回率和準(zhǔn)確率兩個(gè)方面,對(duì)于系統(tǒng)智能預(yù)審效果進(jìn)行衡量,以提升模型計(jì)算能力。通過規(guī)則的梳理分析,訓(xùn)練樣本的不斷輸入,持續(xù)地反饋和優(yōu)化算法,逐步提高召回率和準(zhǔn)確率。
2)業(yè)務(wù)規(guī)則分類
材料預(yù)審由于涉及的業(yè)務(wù)及材料類型多種多樣,還需對(duì)不同類型材料和不同審批事項(xiàng)的業(yè)務(wù)規(guī)則進(jìn)行分類。本文應(yīng)用深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為典型的監(jiān)督學(xué)習(xí)方法,基于遷移學(xué)習(xí)對(duì)模型進(jìn)行微調(diào)。模型遷移通過固定網(wǎng)絡(luò)特定層次的參數(shù),用目標(biāo)域的數(shù)據(jù)來訓(xùn)練其他層次。對(duì)于業(yè)務(wù)規(guī)則分類任務(wù)而言,首先根據(jù)分類的類別數(shù)修改網(wǎng)絡(luò)輸出層,接著固定較淺的卷積層,基于業(yè)務(wù)標(biāo)注數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)倒數(shù)若干層參數(shù)。相比于直接提取圖像的高層語義特征來進(jìn)行監(jiān)督學(xué)習(xí),采用分階段的參數(shù)遷移對(duì)原始域與目標(biāo)域間的差異性更健壯。
基于深度學(xué)習(xí)的業(yè)務(wù)規(guī)則分類與檢測方法替代傳統(tǒng)機(jī)器學(xué)習(xí)方法,在構(gòu)建的預(yù)審模型與遷移學(xué)習(xí)的基礎(chǔ)上,通過從海量數(shù)據(jù)中的持續(xù)學(xué)習(xí),實(shí)現(xiàn)了材料預(yù)審場景落地。
3結(jié)束語
隨著各地政府越來越多的探索“秒批”、“無人干預(yù)自動(dòng)審批”的實(shí)現(xiàn),本文研究的基于深度學(xué)習(xí)構(gòu)建智能材料預(yù)審模型的方法,對(duì)政務(wù)領(lǐng)域?qū)崿F(xiàn)材料智能預(yù)審具有重要意義,也為審批智能化提的后續(xù)發(fā)展提供參考借鑒的方法。同時(shí),本研究也存在以下不足:一是模型運(yùn)轉(zhuǎn)效能還需通過實(shí)驗(yàn)應(yīng)用進(jìn)行檢測,二是模型應(yīng)用落地的場景還有待豐富。這些不足也構(gòu)成了本文后續(xù)的研究方向。