• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      防范虛假申報(bào)引發(fā)項(xiàng)目管理風(fēng)險(xiǎn)的研究
      ——申報(bào)資料校驗(yàn)系統(tǒng)設(shè)計(jì)及應(yīng)用為例

      2021-07-11 08:26:42王鴻飛
      科技管理研究 2021年11期
      關(guān)鍵詞:分詞校驗(yàn)申報(bào)

      王鴻飛,何 悅

      (廣東省科學(xué)技術(shù)情報(bào)研究所,廣東廣州 510033)

      1 研究背景

      2020 年7 月29 日,廣東省審計(jì)廳發(fā)布《廣東省人民政府關(guān)于2019 年度省級(jí)預(yù)算執(zhí)行和其他財(cái)政收支的審計(jì)工作報(bào)告》,工作報(bào)告指出科技孵化育成體系建設(shè)績(jī)效存在的問題,對(duì)廣東省2015 至2018年度科技企業(yè)孵化育成體系建設(shè)政策落實(shí)和相關(guān)資金管理使用績(jī)效進(jìn)行了審計(jì)調(diào)查,抽查相關(guān)孵化載體,發(fā)現(xiàn)6 家孵化器存在虛假申報(bào),騙取相關(guān)資質(zhì)認(rèn)定和財(cái)政補(bǔ)助;通過數(shù)據(jù)篩查發(fā)現(xiàn)7 391 家在孵企業(yè)、畢業(yè)企業(yè)不符合孵化器入駐條件[1]。科技項(xiàng)目申報(bào)資料真實(shí)性存疑的問題一直存在,虛假申報(bào)在傳統(tǒng)形式審查過程中難以識(shí)別,未能發(fā)現(xiàn)并有效制止較普遍存在的財(cái)政資金被騙取和公共資源損失浪費(fèi)問題。孵化載體資質(zhì)認(rèn)定中的虛假申報(bào)行為,主要表現(xiàn)為參與孵化載體資質(zhì)認(rèn)定的申報(bào)單位在不符合認(rèn)定條件的情況下,偽造在孵企業(yè)的工商信息及知識(shí)產(chǎn)權(quán)信息,希望通過填報(bào)虛假信息達(dá)到符合認(rèn)定條件資格。從廣東省審計(jì)廳在工作報(bào)告中提出的問題分析,可判斷審計(jì)部門對(duì)科技項(xiàng)目監(jiān)督管理運(yùn)用了新的技術(shù)手段,在數(shù)據(jù)挖掘及邏輯關(guān)聯(lián)方面已優(yōu)于科技管理部門事前形式審查的技術(shù)手段,無形中對(duì)科技管理部門在科技項(xiàng)目管理工作上也提出新的挑戰(zhàn)??萍际聵I(yè)的發(fā)展事關(guān)科技進(jìn)步和國家未來發(fā)展的競(jìng)爭(zhēng)力,其中項(xiàng)目的申報(bào)和遴選是科技事業(yè)發(fā)展的一個(gè)重要入口,過往項(xiàng)目事前形式審查的方式已不適應(yīng)現(xiàn)監(jiān)督管理的要求,虛假申報(bào)導(dǎo)致的項(xiàng)目管理問題較為突出,隨之引發(fā)的項(xiàng)目管理風(fēng)險(xiǎn)已逐步呈現(xiàn)。

      在此背景下,本研究聚焦于項(xiàng)目申報(bào)資料中的工商信息及知識(shí)產(chǎn)權(quán)信息校驗(yàn)研究,結(jié)合孵化載體資質(zhì)認(rèn)定管理工作的風(fēng)險(xiǎn)特征,對(duì)化解項(xiàng)目管理風(fēng)險(xiǎn)提出新的技術(shù)手段,對(duì)在孵化企業(yè)的工商信息及知識(shí)產(chǎn)權(quán)信息進(jìn)行真實(shí)性校驗(yàn),通過實(shí)踐引證了防范項(xiàng)目管理風(fēng)險(xiǎn)的有效措施。

      2 文獻(xiàn)綜述及現(xiàn)狀分析

      2.1 文獻(xiàn)綜述

      2.1.1 理論實(shí)踐方面

      邱瑩等[2]對(duì)2018 年廣東省自然科學(xué)基金項(xiàng)目形式審查情況進(jìn)行總結(jié)和分析,形式審查的內(nèi)容僅對(duì)申報(bào)要求進(jìn)行審查,并無對(duì)申報(bào)資料進(jìn)行真實(shí)性校驗(yàn)。姚寧廣[3]在安徽省科學(xué)技術(shù)獎(jiǎng)勵(lì)管理工作中,對(duì)形式審查提出新的要求,除了過往常見的限項(xiàng)申報(bào)審查外,對(duì)是否使用上一年度落選項(xiàng)目、獲獎(jiǎng)材料是否重復(fù)使用等均有進(jìn)行校驗(yàn),但該校驗(yàn)是通過人工完成。翁振群等[4]通過對(duì)2012 年至2016 年度自然科學(xué)基金不予受理的常見原因進(jìn)行分析,形式審查的手段較為簡(jiǎn)單,無法校驗(yàn)真實(shí)性。劉培云等[5]以科研項(xiàng)目管理實(shí)踐為例,從健全完善信息化項(xiàng)目管理系統(tǒng)、建設(shè)推進(jìn)科研信用體系、管控研究人員風(fēng)險(xiǎn)、監(jiān)控項(xiàng)目經(jīng)費(fèi)風(fēng)險(xiǎn)、研判項(xiàng)目失敗風(fēng)險(xiǎn)、監(jiān)測(cè)技術(shù)與實(shí)驗(yàn)平臺(tái)風(fēng)險(xiǎn)等方面,討論提出了若干可選擇的項(xiàng)目風(fēng)險(xiǎn)應(yīng)對(duì)策略。劉春林[6]基于信息不對(duì)稱理論,對(duì)常見的編輯可以介入的學(xué)術(shù)不端行為提出應(yīng)對(duì)措施和建議。顧卓[7]認(rèn)為科研項(xiàng)目信息存在不對(duì)稱的現(xiàn)象,提出加強(qiáng)科技項(xiàng)目的過程管理,建立健全科技項(xiàng)目管理問責(zé)制等管理風(fēng)險(xiǎn)控制的建議。姚佳良[8]提出新型學(xué)術(shù)不端判定模式,增加了“專業(yè)人員復(fù)檢”步驟,形成“計(jì)算機(jī)審查系統(tǒng)初檢-專業(yè)人員復(fù)檢-專家判定”模式,可有效減少對(duì)復(fù)制比高的學(xué)術(shù)論文的誤判,增加判定的專業(yè)性。錢乾等[9]認(rèn)為科技項(xiàng)目管理中存在風(fēng)險(xiǎn),需對(duì)風(fēng)險(xiǎn)進(jìn)行準(zhǔn)確識(shí)別、判斷,并制定針對(duì)性的管理策略,應(yīng)運(yùn)用信息化手段全面降低科技項(xiàng)目管理風(fēng)險(xiǎn)。

      2.1.2 技術(shù)設(shè)想方面

      馬瑾男[10]在基于數(shù)據(jù)池的項(xiàng)目形式審查智能評(píng)判系統(tǒng)在解釋數(shù)據(jù)池內(nèi)涵的基礎(chǔ)上,從審查主體與評(píng)判規(guī)則入手,詳細(xì)介紹了基于數(shù)據(jù)池的項(xiàng)目形式審查智能評(píng)判系統(tǒng)的功能,通過智能評(píng)判系統(tǒng),可實(shí)現(xiàn)數(shù)據(jù)的積累、匯聚,減少人力操作,但僅限于科研誠信和財(cái)務(wù)審查,數(shù)據(jù)來源于自有數(shù)據(jù)的校驗(yàn),無法多維度對(duì)申報(bào)資料的真實(shí)性進(jìn)行校驗(yàn)。張重毅等[11]對(duì)科技論文隱性學(xué)術(shù)不端行為判別特征分析。針對(duì)論文中的公式或圖表抄襲、跨語種抄襲,提出了相關(guān)的算法模型。上官學(xué)奎等[12]對(duì)科技項(xiàng)目申報(bào)限項(xiàng)核查構(gòu)建研究,在項(xiàng)目的限項(xiàng)申報(bào)提出了校驗(yàn)規(guī)則與反饋流程。柳亭等[13]在獎(jiǎng)勵(lì)申報(bào)系統(tǒng)中增加歷史數(shù)據(jù)查詢功能,對(duì)涉及重復(fù)報(bào)獎(jiǎng)的專利、論文、專著、標(biāo)準(zhǔn)等獲獎(jiǎng)情況進(jìn)行查重,實(shí)現(xiàn)知識(shí)產(chǎn)權(quán)狀態(tài)檢索、知識(shí)產(chǎn)權(quán)重復(fù)使用校驗(yàn),避免重復(fù)報(bào)獎(jiǎng)。潘昕昕[14]提出建立統(tǒng)一的監(jiān)督評(píng)估信息系統(tǒng),建立相關(guān)數(shù)據(jù)庫,通過提交結(jié)構(gòu)化的報(bào)告和數(shù)據(jù),實(shí)現(xiàn)對(duì)項(xiàng)目實(shí)施全過程的痕跡管理,匯集項(xiàng)目管理和監(jiān)督信息,對(duì)項(xiàng)目實(shí)施動(dòng)態(tài)監(jiān)控和風(fēng)險(xiǎn)預(yù)警,在項(xiàng)目信息分析的基礎(chǔ)上選取項(xiàng)目進(jìn)行重點(diǎn)監(jiān)督。簡(jiǎn)國明等[15]構(gòu)建了大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目結(jié)項(xiàng)材料查重系統(tǒng),通過結(jié)項(xiàng)材料的文本比對(duì)、相似判別、數(shù)據(jù)甄別和線上運(yùn)行,得出結(jié)項(xiàng)材料查重報(bào)告。陶秀杰等[16]對(duì)企業(yè)科研項(xiàng)目管理流程進(jìn)行深入的設(shè)計(jì)與研究,設(shè)計(jì)并實(shí)現(xiàn)基于情報(bào)和知識(shí)管理的科研項(xiàng)目管理系統(tǒng),有效地提高科研項(xiàng)目的管理效率。王欣宇[17]設(shè)計(jì)相似度分析模型,利用大數(shù)據(jù)分析技術(shù)對(duì)科技項(xiàng)目申報(bào)材料進(jìn)行相似度計(jì)算,計(jì)算出申報(bào)材料的相似度比率,并詳細(xì)列出相似的具體內(nèi)容,可輔助項(xiàng)目管理決策。朱昆等[18]以項(xiàng)目、信息、報(bào)表為核心,設(shè)計(jì)了科研項(xiàng)目管理系統(tǒng),實(shí)現(xiàn)科研單位的高效率、精細(xì)化、全方位、決策型管理。楊朝紅等[19]提出了一種交換數(shù)據(jù)格式標(biāo)準(zhǔn)、數(shù)據(jù)庫標(biāo)準(zhǔn)和文檔開發(fā)標(biāo)準(zhǔn)的行業(yè)信息化標(biāo)準(zhǔn)的自動(dòng)化校驗(yàn)方法,能夠替代部分人工驗(yàn)證工作。王晨輝等[20]在項(xiàng)目評(píng)審中利用神經(jīng)網(wǎng)絡(luò)自動(dòng)擬合能力,對(duì)知識(shí)產(chǎn)權(quán)關(guān)聯(lián)度進(jìn)行分析,代替人工進(jìn)行輔助評(píng)審,為人工評(píng)審提供參考。

      2.2 現(xiàn)狀分析

      在孵化載體資質(zhì)認(rèn)定中,在孵企業(yè)的數(shù)量及真實(shí)性直接影響申報(bào)單位是否符合認(rèn)定條件。在孵化企業(yè)的工商信息包括統(tǒng)一社會(huì)信用代碼、成立時(shí)間、注冊(cè)地址、注冊(cè)資本、企業(yè)類型、登記機(jī)關(guān),偽造工商信息是為了偽證在孵企業(yè)主要研發(fā)、辦公場(chǎng)所是否在所屬孵化器場(chǎng)地內(nèi),孵化時(shí)限是否超過時(shí)限。知識(shí)產(chǎn)權(quán)信息包括專利、商標(biāo)、軟件著作權(quán)、作品著作權(quán),偽造知識(shí)產(chǎn)權(quán)信息是為了偽證在孵企業(yè)知識(shí)產(chǎn)權(quán)的所有權(quán)歸屬、專利在途狀態(tài)。偽造手段一般通過利用修圖軟件編造虛假材料及對(duì)照申報(bào)條件利用反向工程的原理,偽造在孵企業(yè)的工商信息或知識(shí)產(chǎn)權(quán)信息。導(dǎo)致作造假例頻現(xiàn),原因在于過往沒有手段或方法對(duì)申報(bào)資料進(jìn)行多維度真實(shí)性校驗(yàn)。雖然科技管理部門已加大力度實(shí)施現(xiàn)場(chǎng)檢查,打破了之前只重“書面審核”,不看“企業(yè)實(shí)際”的慣例。但這種檢查單純依靠檢查人員的經(jīng)驗(yàn)判斷,仍然缺乏有效的工具或手段,無法有效甄別各樣佐證材料的真實(shí)性。同時(shí)“上有政策,下有對(duì)策”,眾多網(wǎng)絡(luò)自媒體對(duì)如何規(guī)避科技部門的檢查都有科學(xué)合理的套路教學(xué),使實(shí)際的檢查效果大打折扣。針對(duì)虛假申報(bào)的問題,2020 年廣東科技管理部門在陽光政務(wù)平臺(tái)及時(shí)補(bǔ)增了知識(shí)產(chǎn)權(quán)校驗(yàn)功能,但只針對(duì)高企校驗(yàn),其他專題項(xiàng)目暫時(shí)無法校驗(yàn)。

      2.3 存在問題

      綜上,理論實(shí)踐的文獻(xiàn)均聚焦于申報(bào)資料合規(guī)性的問題上,形式審查多數(shù)通過人工鑒別,對(duì)申報(bào)資料的真實(shí)性無法進(jìn)行校驗(yàn)。技術(shù)設(shè)想的文獻(xiàn)止步于具體功能的構(gòu)思或架構(gòu)設(shè)計(jì),實(shí)踐以查重或限項(xiàng)為主,并無對(duì)申報(bào)資料進(jìn)行真實(shí)性校驗(yàn)的實(shí)踐。針對(duì)文獻(xiàn)及現(xiàn)狀,仍存在以下問題,一是無法校驗(yàn)項(xiàng)目申報(bào)資料真實(shí)性,缺乏有效工具;二是形式審查單憑個(gè)人經(jīng)驗(yàn)判斷,人工審核工作量大;三是虛假申報(bào)引發(fā)的項(xiàng)目管理風(fēng)險(xiǎn)依然隱性存在,亟需采取有效手段防范風(fēng)險(xiǎn)。

      3 申報(bào)資料校驗(yàn)系統(tǒng)設(shè)計(jì)

      本系統(tǒng)設(shè)計(jì)思路是結(jié)合孵化載體資質(zhì)認(rèn)定項(xiàng)目管理工作過程中存在的風(fēng)險(xiǎn)特征,圍繞填報(bào)的工商信息及知識(shí)產(chǎn)權(quán)信息與第三方數(shù)據(jù)庫提供的接口進(jìn)行校驗(yàn)匹配,達(dá)到判斷在孵企業(yè)真實(shí)性的效果。

      3.1 系統(tǒng)整體設(shè)計(jì)

      系統(tǒng)設(shè)計(jì)在標(biāo)準(zhǔn)方面,依托國家電子政務(wù)建設(shè)的各種信息技術(shù)標(biāo)準(zhǔn)(環(huán)境、技術(shù)、信息、安全、信息交換標(biāo)準(zhǔn)等),針對(duì)不同層面的使用者的應(yīng)用水平,充分考慮系統(tǒng)的易用性。在可擴(kuò)展方面,兼顧二次開發(fā)的需要及支持未來可能出現(xiàn)擴(kuò)展的需要,系統(tǒng)采用開放的可擴(kuò)充模塊結(jié)構(gòu),保證以后可以方便地升級(jí)和不斷增加新功能、增加容量、以及在同一平臺(tái)上擴(kuò)充其他業(yè)務(wù)應(yīng)用功能。在安全方面,采用安全保密技術(shù)進(jìn)行用戶身份認(rèn)證,應(yīng)用系統(tǒng)的登錄、流轉(zhuǎn)等功能模塊中,操作方式應(yīng)簡(jiǎn)單快捷。應(yīng)具備完善的日志管理等功能,能夠追蹤記錄每次操作情況,并對(duì)非法操作進(jìn)行告警。

      3.1.1 架構(gòu)設(shè)計(jì)

      申報(bào)資料校驗(yàn)系統(tǒng)架構(gòu)分為5 層,包括應(yīng)用層、業(yè)務(wù)層、管理層、執(zhí)行模型、資源層(見圖1)??梢灾苯釉谄脚_(tái)上使用,無需下載軟件或者小程序,可內(nèi)嵌到各種系統(tǒng)中,使用方便靈活,大大提高形式審查的準(zhǔn)確率及審查效率,對(duì)形式審查及項(xiàng)目評(píng)審起到重要的輔助作用。

      圖1 申報(bào)資料校驗(yàn)系統(tǒng)架構(gòu)

      3.1.2 流程設(shè)計(jì)

      工商信息及知識(shí)產(chǎn)權(quán)信息導(dǎo)入后,先從暫存庫數(shù)據(jù)校驗(yàn)信息,若暫存庫無對(duì)應(yīng)的數(shù)據(jù)可校驗(yàn),則通過第三方接口進(jìn)行校驗(yàn),通過校驗(yàn)后顯示出對(duì)應(yīng)的校驗(yàn)結(jié)果(見圖2)。

      圖2 校驗(yàn)流程

      3.1.3 校驗(yàn)內(nèi)容

      申報(bào)資料校驗(yàn)系統(tǒng)根據(jù)不同項(xiàng)目/需求方的要求可設(shè)計(jì)不同字段的校驗(yàn),本次校驗(yàn)字段如下.

      (1)工商信息可校驗(yàn)的字段包括:企業(yè)名稱、統(tǒng)一社會(huì)信用代碼、成立時(shí)間、注冊(cè)地址、注冊(cè)資本、所屬行業(yè)、企業(yè)類型、登記機(jī)關(guān)。

      (2)知識(shí)產(chǎn)權(quán)信息可校驗(yàn)的字段,具體如表1所示。

      表1 知識(shí)產(chǎn)權(quán)信息校驗(yàn)字段

      3.1.4 校驗(yàn)?zāi)P驮O(shè)計(jì)

      申報(bào)資料校驗(yàn)系統(tǒng)包括6 大模型,在數(shù)據(jù)標(biāo)準(zhǔn)化方面,涉及到大量的數(shù)據(jù)錄入和采集工作,需對(duì)數(shù)據(jù)進(jìn)行清洗及標(biāo)準(zhǔn)化,設(shè)計(jì)了數(shù)據(jù)清洗模型。在應(yīng)對(duì)網(wǎng)絡(luò)延時(shí)、接口數(shù)量過多及校驗(yàn)數(shù)據(jù)量較大方面,設(shè)計(jì)了緩存處理模型、接口聚合與探查邏輯模型、防過載或高并發(fā)模型。在校驗(yàn)實(shí)施邏輯方面,設(shè)計(jì)了中文分詞計(jì)算關(guān)鍵相似度模型及分詞學(xué)習(xí)模型,提高模糊判斷的準(zhǔn)確率。

      (1)數(shù)據(jù)清洗模型。通過刪除、更正數(shù)據(jù)中錯(cuò)誤、不完整、格式有誤或多余的數(shù)據(jù),使數(shù)據(jù)具備邏輯上的準(zhǔn)確性,保障來自各個(gè)數(shù)據(jù)源的數(shù)據(jù)的一致性。在異常值以及噪聲的處理方面,主要是創(chuàng)建清洗應(yīng)用庫和清洗規(guī)則,主要對(duì)錄入的數(shù)據(jù)源創(chuàng)建清洗規(guī)則、清洗運(yùn)行時(shí)間以及創(chuàng)建和修改清洗后數(shù)據(jù)結(jié)構(gòu)(見圖3)。如工商信息的成立時(shí)間采用自動(dòng)化標(biāo)準(zhǔn)格式,會(huì)對(duì)2020.10.21、2020 年10 月21 日和2020/10/21 等類型進(jìn)行轉(zhuǎn)化為2020-10-21 格式。知識(shí)產(chǎn)權(quán)編號(hào)采用多條件綜合判斷,在匹配前先過濾填寫與接口數(shù)據(jù)中的空格、所有字母和小數(shù)點(diǎn)及后面數(shù)字/字母、特殊符號(hào),包含“ ()();;,,.&-《》{}”。

      圖3 數(shù)據(jù)清洗模型

      (2)緩存處理模型。由于系統(tǒng)需調(diào)用第三方接口,而第三方接口存在網(wǎng)絡(luò)延時(shí)、服務(wù)不用等不可控因素,系統(tǒng)采用較主流的Redis+數(shù)據(jù)庫結(jié)合的緩存技術(shù)(見圖4)。

      圖4 工商信息緩存處理模型

      (3)接口聚合與探查邏輯模型。知識(shí)產(chǎn)權(quán)校驗(yàn)的類型主要分為商標(biāo)、發(fā)明專利、實(shí)用新型、商標(biāo)、軟著等類型,需校驗(yàn)的字段較多,各類型的接口分散在不同的第三方數(shù)據(jù)商,實(shí)施校驗(yàn)的邏輯也較為復(fù)雜。為確保準(zhǔn)確性,需要聚合不同的第三方接口,再進(jìn)行分類、整理、梳理邏輯,并進(jìn)行二次開發(fā)滿足校驗(yàn)需求。此外,還需實(shí)現(xiàn)企業(yè)知識(shí)產(chǎn)權(quán)內(nèi)容探查邏輯。因單次調(diào)用第三方數(shù)據(jù)商接口進(jìn)行校驗(yàn)時(shí),部分第三方數(shù)據(jù)商提供的數(shù)據(jù)有條數(shù)限制,每次調(diào)用均只返回指定條數(shù)的數(shù)據(jù)(如10 條)。如某個(gè)企業(yè)的知識(shí)產(chǎn)權(quán)數(shù)據(jù)有50 條,需調(diào)用約5 次第三方接口才能完成校驗(yàn),為提升用戶使用體驗(yàn)和降低成本系統(tǒng)運(yùn)營成本,結(jié)合緩存技術(shù),設(shè)計(jì)了知識(shí)產(chǎn)權(quán)探查邏輯進(jìn)行處理,即合理的使用緩存和主動(dòng)調(diào)用接口策略(見圖5)。

      圖5 知識(shí)產(chǎn)權(quán)信息校驗(yàn)?zāi)P?/p>

      (4)防過載或高并發(fā)模型。由于每條校驗(yàn)數(shù)據(jù)都要訪問一次接口,這存在數(shù)據(jù)請(qǐng)求和處理的過程,若導(dǎo)入校驗(yàn)數(shù)據(jù)太多(大于200 條),會(huì)造成數(shù)據(jù)延遲、瀏覽器報(bào)錯(cuò)或服務(wù)器卡機(jī)的情況,為了解決實(shí)際用戶操作和大批量數(shù)據(jù)校驗(yàn)卡機(jī)的問題,優(yōu)化了相關(guān)執(zhí)行判斷。具體如下:第一步,數(shù)據(jù)導(dǎo)入后,先判斷前序任務(wù)是否有正在匹配中的數(shù)據(jù),無前序任務(wù)則直接進(jìn)入下一步,若顯示“待匹配”需等待前序任務(wù)匹配完后再進(jìn)入下一步;第二步,判斷導(dǎo)入模板的校驗(yàn)數(shù)量是否大于50 條數(shù)據(jù),若導(dǎo)入模板數(shù)據(jù)少于或等于50 條,則導(dǎo)入后顯示校驗(yàn)結(jié)果頁,若導(dǎo)入模板數(shù)據(jù)大于50 條,則導(dǎo)入后跳轉(zhuǎn)到校驗(yàn)記錄頁,顯示數(shù)據(jù)“匹配中”,再進(jìn)入下一步;第三步,數(shù)據(jù)校驗(yàn)采用定時(shí)器+異步處理方式,每分鐘向第三方接口發(fā)送50 條數(shù)據(jù)請(qǐng)求并校驗(yàn),直到數(shù)據(jù)校驗(yàn)完畢,校驗(yàn)記錄才顯示“已匹配”,并可查看匹配結(jié)果。

      若同時(shí)上傳多個(gè)大于50 條的模板,系統(tǒng)有隊(duì)列校驗(yàn)過程狀態(tài),未開始校驗(yàn)的模板顯示“待匹配”,未處理完模板顯示“匹配中”,匹配完畢模板顯示“已匹配”;工商信息校驗(yàn)和知識(shí)產(chǎn)權(quán)校驗(yàn)并行校驗(yàn),可以同時(shí)校驗(yàn),不相互影響(見圖6)。

      圖6 知識(shí)產(chǎn)權(quán)信息校驗(yàn)?zāi)P?/p>

      (5)基于中文分詞計(jì)算關(guān)鍵相似度模型。以工商信息的企業(yè)注冊(cè)地址文本內(nèi)容為例,用戶實(shí)際填報(bào)的內(nèi)容、格式無法有效統(tǒng)一,本系統(tǒng)使用了分詞技術(shù)并結(jié)合計(jì)算關(guān)鍵詞相似度來有效提升校驗(yàn)的準(zhǔn)確性。如系統(tǒng)期望填報(bào)的企業(yè)注冊(cè)地址內(nèi)容標(biāo)準(zhǔn)格式為“*省*市*區(qū)*路*號(hào)”,實(shí)際填報(bào)基本為“*市*路*園區(qū)*號(hào)”,與期望存在較大出入,為保障快速、精確校驗(yàn)企業(yè)注冊(cè)地址,采用中文分詞技術(shù)后再進(jìn)行相似度算法進(jìn)行校驗(yàn)比對(duì)。對(duì)填報(bào)的企業(yè)注冊(cè)地址和通過第三方數(shù)據(jù)接口獲取的企業(yè)地址分別進(jìn)行中文分詞。Ca 為用戶填報(bào)內(nèi)容,Cb 為第三方接口數(shù)據(jù)。根據(jù)用戶填報(bào)的企業(yè)注冊(cè)地址文本內(nèi)容Ca 與通過第三方接口獲得的企業(yè)注冊(cè)地址文本內(nèi)容Cb,分別使用JieBa 分詞組件工具對(duì)文本內(nèi)容采取前向查找模式進(jìn)行切分,得到詞串集合Sa、Sb。

      用戶填報(bào)內(nèi)容:

      用戶填報(bào)內(nèi)容切詞分組:

      第三方接口內(nèi)容:

      第三方接口內(nèi)容切詞分組:

      通過計(jì)算方法,計(jì)算出用戶填報(bào)內(nèi)容切詞分組后與第三方接口內(nèi)容切詞分組后的相似度模型,為切詞分組后的Sa 詞串,為切詞分組后的Sb 詞串,計(jì)算相似度差值越小,內(nèi)容越接近,可判斷為相似度越高,計(jì)算方法為:

      (6)分詞學(xué)習(xí)模型。在校驗(yàn)系統(tǒng)中實(shí)現(xiàn)詞庫智能學(xué)習(xí),將申報(bào)資料中的語句轉(zhuǎn)化成語料庫中的詞,當(dāng)有新文本信息導(dǎo)入時(shí),針對(duì)文本中出現(xiàn)的新詞進(jìn)行智能學(xué)習(xí),同時(shí)將新詞通過字符串分詞算法抽取出來,添加至?xí)捍鎺煸~典中。該算法能夠經(jīng)過語料訓(xùn)練從而分出“新詞”,即過往數(shù)據(jù)中沒有收錄到的詞。只要它的出現(xiàn)次數(shù)超過一定的閾值,就能被識(shí)別,以便之后在分詞過程中能抽取出來,實(shí)時(shí)更新語料庫,完成智能學(xué)習(xí)功能。分詞學(xué)習(xí)模型改進(jìn)了傳統(tǒng)字符串分詞中的詞典結(jié)構(gòu),提高了分詞過程中的匹配速度,提高了分詞效率,為校驗(yàn)提供了快速、準(zhǔn)確的查詢對(duì)比方法。分詞學(xué)習(xí)模型主要采用正向和逆向匹配算法。

      正向匹配分詞算法處理流程步驟如下:

      1)數(shù)據(jù)清洗標(biāo)點(diǎn)符號(hào)預(yù)處理,并把每段文字提取出單獨(dú)存放,預(yù)處理完的結(jié)果存為單個(gè)分詞輸入文件。

      2)按順序讀出分詞輸入文件中的一段文字,記一段文字為Sn,分詞結(jié)果為Kn(n=1,2…),全部讀取完畢時(shí),算法結(jié)束。

      3)待切分的中文字串為Sn=C0C1C2…Cn,當(dāng)前正在匹配字為Ci(0<=i<=n,i初始為O),j=i。首先根據(jù)Ci 為開頭的詞條樹,然后沿著樹結(jié)點(diǎn)逐層匹配,直到出現(xiàn)以下3 種情況之一:找不到匹配節(jié)點(diǎn)、找到可以成詞的節(jié)點(diǎn)、i 等于n。

      4)此時(shí),Ci 最小匹配,切分出的結(jié)果為Ki=CjC1C2…Ci。若i等于n,此段文字分詞結(jié)束,轉(zhuǎn)步驟2)。若i小于n,i=i+l,轉(zhuǎn)步驟3)。

      逆向匹配算法處理流程步驟如下:

      當(dāng)進(jìn)行逆向逐字匹配時(shí),只要使用上文所述倒轉(zhuǎn)詞典中的詞條,對(duì)算法稍作改動(dòng)即可。由后向前對(duì)文本進(jìn)行匹配。

      1)與正向算法一致。

      2)與正向算法一致。

      3)待切分的中文字串為Sn=C0C1C2…Cn,當(dāng)前正在匹配字為Ci(0<=i<=n,i初始為n),j=i。首先根據(jù)Ci 為開頭的詞條樹,然后沿著樹節(jié)點(diǎn)逐層匹配,直到出現(xiàn)以下3 種情況之一:找不到匹配節(jié)點(diǎn)、到達(dá)樹的葉子節(jié)點(diǎn)、i等于0。

      4)此時(shí),C0 為最大匹配,切分出的結(jié)果為Ki=CjC1C2…Ci。若i等于0,此段文字分詞結(jié)束,轉(zhuǎn)步驟2)。若i大于0,i=i-1,轉(zhuǎn)步驟3)。

      當(dāng)工商信息及知識(shí)產(chǎn)權(quán)信息導(dǎo)入校驗(yàn)系統(tǒng)后,經(jīng)過內(nèi)部的分詞算法,對(duì)導(dǎo)入的信息進(jìn)行分詞處理,通過對(duì)文本中的已錄詞和未學(xué)習(xí)詞進(jìn)行識(shí)別,完成分詞了解,最終根據(jù)校驗(yàn)系統(tǒng)要求將語句相同率和相同語句標(biāo)示,輸出對(duì)比結(jié)果。

      3.1.5 校驗(yàn)邏輯

      (1)工商信息。以企業(yè)的名稱作為主鍵,第一步先通過“企業(yè)名稱”進(jìn)行校驗(yàn),如校驗(yàn)無誤,進(jìn)入第二步;如校驗(yàn)有誤,無法調(diào)出接口信息,顯示“企業(yè)名稱有誤”。第二步同時(shí)對(duì)統(tǒng)一社會(huì)信用代碼、成立時(shí)間、注冊(cè)地址、注冊(cè)資本、企業(yè)類型、登記機(jī)關(guān)的信息進(jìn)行校驗(yàn)。如發(fā)生錯(cuò)誤則提示錯(cuò)誤的類型,并提示出錄入與第三方數(shù)據(jù)比對(duì)校驗(yàn)的詳細(xì)內(nèi)容,方便用戶快速定位找出問題并解決(見圖7)。

      圖7 工商信息校驗(yàn)邏輯

      (2)知識(shí)產(chǎn)權(quán)信息。知識(shí)產(chǎn)權(quán)信息校驗(yàn)按照以下校驗(yàn)順序進(jìn)行校驗(yàn):企業(yè)名稱->知識(shí)產(chǎn)權(quán)類型->知識(shí)產(chǎn)權(quán)編號(hào)->知識(shí)產(chǎn)權(quán)名稱->知識(shí)產(chǎn)權(quán)狀態(tài)。以企業(yè)的名稱作為主鍵,第一步對(duì)企業(yè)名稱進(jìn)行校驗(yàn),如校驗(yàn)無誤,進(jìn)入第二步;如校驗(yàn)有誤,無法調(diào)出接口信息,顯示“無知識(shí)產(chǎn)權(quán)數(shù)據(jù)”。第二步校驗(yàn)知識(shí)產(chǎn)權(quán)類型,如校驗(yàn)無誤,進(jìn)入第三步;如果校驗(yàn)有誤,無法調(diào)出接口信息,同樣顯示“無知識(shí)產(chǎn)權(quán)數(shù)據(jù)”;第三步依次對(duì)知識(shí)產(chǎn)權(quán)編號(hào)、知識(shí)產(chǎn)權(quán)名稱、知識(shí)產(chǎn)權(quán)狀態(tài)進(jìn)行校驗(yàn)。如發(fā)生錯(cuò)誤則提示錯(cuò)誤的類型,系統(tǒng)提示出錯(cuò)類型和錄入與比對(duì)校驗(yàn)的詳細(xì)內(nèi)容,方便用戶快速定位找出問題并解決(見圖8)。其中,知識(shí)產(chǎn)權(quán)狀態(tài)在糾錯(cuò)對(duì)比欄目中顯示正確的狀態(tài)與具體法律狀態(tài)描述。

      圖8 知識(shí)產(chǎn)權(quán)信息校驗(yàn)邏輯

      因知識(shí)產(chǎn)權(quán)存在多種狀態(tài),會(huì)存在信息不對(duì)稱的問題,難以判斷真實(shí)性。特別是已申請(qǐng)未授權(quán)或已授權(quán)未拿到證書的仍屬于在途狀態(tài),故知識(shí)產(chǎn)權(quán)狀態(tài)采用法律狀態(tài)進(jìn)行判斷,具體以第三方數(shù)據(jù)方反饋的參數(shù)狀態(tài)為依據(jù)。通過梳理分析,理清了公告號(hào)與申請(qǐng)?zhí)柕倪壿嬯P(guān)系,能準(zhǔn)確判斷知識(shí)產(chǎn)權(quán)是否處于有效狀態(tài)。

      最終梳理為三種狀態(tài),已擁有、已申請(qǐng)屬于有效狀態(tài),已失效屬于無效狀態(tài),如表2 所示。

      表2 知識(shí)產(chǎn)權(quán)狀態(tài)判斷表

      表2(續(xù))

      3.2 創(chuàng)新點(diǎn)

      (1)暫存庫模塊。該功能主要是避免短時(shí)間內(nèi)反復(fù)查詢或測(cè)試,造成數(shù)據(jù)數(shù)據(jù)冗余及影響統(tǒng)計(jì)分析的效果。在校驗(yàn)數(shù)據(jù)過程中,先從暫存庫數(shù)據(jù)校驗(yàn)信息,若暫存庫無對(duì)應(yīng)的數(shù)據(jù)可校驗(yàn),則通過第三方接口進(jìn)行校驗(yàn)。調(diào)用第三方接口后,新數(shù)據(jù)會(huì)自動(dòng)更新到暫存庫,供下次查詢使用;暫存庫數(shù)據(jù)設(shè)置為7 天的保留期限,7 天后數(shù)據(jù)將會(huì)自動(dòng)刪除,保證數(shù)據(jù)實(shí)時(shí)性。

      (2)相似度的容錯(cuò)設(shè)置。實(shí)際填報(bào)信息與真實(shí)信息存在差異,可能是填錯(cuò)或填漏一兩個(gè)字符,但并非虛假信息;為避免誤判填錯(cuò)或填漏的信息,通過概率模型提升模糊判斷的準(zhǔn)確率,形成容錯(cuò)機(jī)制,容錯(cuò)率可自行調(diào)節(jié),最低限度可設(shè)置為70%,即填報(bào)內(nèi)容與第三方數(shù)據(jù)匹配達(dá)到70%以上相同,視為真實(shí)信息;最高可調(diào)節(jié)為100%,即填報(bào)內(nèi)容需與第三方數(shù)據(jù)匹配,需絕對(duì)相同毫無偏差,才能視為真實(shí)。

      3.3 實(shí)用性

      (1)數(shù)據(jù)實(shí)時(shí)性高。通過與官方數(shù)據(jù)對(duì)比,實(shí)際與市場(chǎng)監(jiān)督管理部門及知識(shí)產(chǎn)權(quán)管理管理部門的數(shù)據(jù)延遲時(shí)間在10 天內(nèi)。

      (2)可視化統(tǒng)計(jì)分析。通過對(duì)數(shù)據(jù)歸集和梳理,可形成工商信息及知識(shí)產(chǎn)權(quán)信息的數(shù)據(jù)簡(jiǎn)報(bào),可生成數(shù)據(jù)可視化界面如折線圖、柱形圖、餅形圖等,作為輔助評(píng)審決策的依據(jù)。

      4 實(shí)踐研究

      廣東省科學(xué)技術(shù)情報(bào)研究所創(chuàng)業(yè)孵化中心作為孵化載體認(rèn)定項(xiàng)目管理的專業(yè)機(jī)構(gòu),研發(fā)及運(yùn)用了申報(bào)資料校驗(yàn)系統(tǒng),對(duì)2020 年度孵化載體資質(zhì)認(rèn)定項(xiàng)目的申報(bào)資料采用了真實(shí)性校驗(yàn),主要是校驗(yàn)申報(bào)填報(bào)在孵企業(yè)的工商信息和知識(shí)產(chǎn)權(quán)信息的真實(shí)性。校驗(yàn)結(jié)果如下,對(duì)在孵企業(yè)工商信息進(jìn)行真實(shí)校驗(yàn)6 398 項(xiàng),主要校驗(yàn)在孵企業(yè)工商信息的真實(shí)性,正確率為85%;知識(shí)產(chǎn)權(quán)校驗(yàn)總數(shù)13 624 項(xiàng),主要是校驗(yàn)知識(shí)產(chǎn)權(quán)(專利、商標(biāo)、版權(quán))的真實(shí)性,校驗(yàn)正確率為82%。具體內(nèi)容詳見表3。對(duì)系統(tǒng)校驗(yàn)的結(jié)果進(jìn)行20%以上的人工抽查,與官方網(wǎng)站數(shù)據(jù)對(duì)比工商信息及知識(shí)產(chǎn)權(quán)信息,判斷準(zhǔn)確率達(dá)100%。

      表3 工商信息及知識(shí)產(chǎn)權(quán)信息校驗(yàn)結(jié)果統(tǒng)計(jì) 單位:項(xiàng)

      通過加強(qiáng)事前對(duì)孵化載體申報(bào)資料的真實(shí)性校驗(yàn),提高了形式審查的準(zhǔn)確率及審查效率,對(duì)判斷申報(bào)資料的真實(shí)性起到關(guān)鍵作用,隔絕了虛假的申報(bào)資料,有效地控制虛假申報(bào)進(jìn)入評(píng)審環(huán)節(jié),使風(fēng)險(xiǎn)管理能力明顯改善,項(xiàng)目質(zhì)量明顯提高,運(yùn)用新的技術(shù)手段化解審計(jì)風(fēng)險(xiǎn),及時(shí)解決了審計(jì)部門對(duì)2019 年科技孵化育成體系專項(xiàng)資金提出的問題,避免管理風(fēng)險(xiǎn)循環(huán)發(fā)生,孵化載體資質(zhì)認(rèn)定項(xiàng)目管理工作的經(jīng)驗(yàn)值得借鑒及推廣示范。

      5 本文局限

      本文基于孵化載體資質(zhì)認(rèn)定管理工作的需求,只針對(duì)工商信息及知識(shí)產(chǎn)權(quán)信息的校驗(yàn)方法及實(shí)踐進(jìn)行研究,可校驗(yàn)的維度仍然受限,后續(xù)將加快完善可校驗(yàn)的類別,增加社保人數(shù)、上市企業(yè)、融資歷程、投資機(jī)構(gòu)、行政處罰、稅收違法、嚴(yán)重違法、論文、稅收情況、歐美日國際專利、ISO、獎(jiǎng)勵(lì)、CMMI、植物新品種、國家級(jí)農(nóng)作物品種、國家一級(jí)中藥保護(hù)品種、國家新藥、集成電路布圖設(shè)計(jì)等企業(yè)常用資質(zhì)。例如社保人數(shù)的數(shù)據(jù),可向人社部門或數(shù)字廣東申請(qǐng)調(diào)用接口;論文可以從知網(wǎng)、萬方、維普等機(jī)構(gòu)獲取對(duì)應(yīng)的數(shù)據(jù)接口,接入系統(tǒng)進(jìn)行校驗(yàn)。同時(shí),還需保障第三方校驗(yàn)數(shù)據(jù)源頭的充足性,以多方數(shù)據(jù)源作為校驗(yàn)邏輯的依據(jù),避免發(fā)生誤判。

      6 相關(guān)建議

      (1)引導(dǎo)專業(yè)機(jī)構(gòu)做好項(xiàng)目管理“守門人”。加強(qiáng)科技項(xiàng)目申報(bào)資料的事前審查,把好第一道關(guān)。借鑒本文研究?jī)?nèi)容基礎(chǔ)上,要進(jìn)一步加強(qiáng)專業(yè)機(jī)構(gòu)以風(fēng)險(xiǎn)防范為基礎(chǔ)的管理意識(shí),以事加強(qiáng)前形式審查為重點(diǎn),以有效的手段或工具為支撐,以校驗(yàn)結(jié)果為保障,通過加強(qiáng)形式審查,防范審計(jì)風(fēng)險(xiǎn)。建議加強(qiáng)省新型研發(fā)機(jī)構(gòu)、省工程中心、重點(diǎn)實(shí)驗(yàn)室、重點(diǎn)研發(fā)計(jì)劃等計(jì)劃項(xiàng)目的事前審查,對(duì)申報(bào)的佐證材料進(jìn)行“應(yīng)驗(yàn)盡驗(yàn)”,排除后顧之憂。

      (2)加強(qiáng)項(xiàng)目風(fēng)險(xiǎn)預(yù)判及管理。應(yīng)對(duì)項(xiàng)目風(fēng)險(xiǎn)需加強(qiáng)挖掘項(xiàng)目管理潛在的風(fēng)險(xiǎn)和引起這些風(fēng)險(xiǎn)的內(nèi)外部因素、項(xiàng)目風(fēng)險(xiǎn)的征兆與表現(xiàn)等,準(zhǔn)確地分析和處理在科技項(xiàng)目中可能出現(xiàn)的風(fēng)險(xiǎn),對(duì)項(xiàng)目風(fēng)險(xiǎn)應(yīng)對(duì)措施計(jì)劃進(jìn)行不斷更新與完善。當(dāng)前和今后一個(gè)時(shí)期,要把防范審計(jì)風(fēng)險(xiǎn)作為一項(xiàng)緊迫的任務(wù),切實(shí)抓好風(fēng)險(xiǎn)防范。建立一套符合科技項(xiàng)目管理自身情況的風(fēng)險(xiǎn)管理框架,最大限度地減少風(fēng)險(xiǎn)的發(fā)生概率和可能造成的不良影響,從而保證科技項(xiàng)目的順利實(shí)施。

      (3)落實(shí)科學(xué)技術(shù)活動(dòng)違規(guī)行為處理措施。為規(guī)范科學(xué)技術(shù)活動(dòng)違規(guī)行為處理,營造風(fēng)清氣正的良好科研氛圍,按照科學(xué)技術(shù)部令第19 號(hào)《科學(xué)技術(shù)活動(dòng)違規(guī)行為處理暫行規(guī)定》,發(fā)現(xiàn)在科學(xué)技術(shù)活動(dòng)的申報(bào)、評(píng)審、實(shí)施、驗(yàn)收、監(jiān)督檢查和評(píng)估評(píng)價(jià)等活動(dòng)中提供虛假材料,應(yīng)對(duì)申報(bào)單位或相關(guān)責(zé)任人采取嚴(yán)格處罰措施。根據(jù)負(fù)面影響或財(cái)政資金損失的嚴(yán)重程度,禁止申報(bào)單位或相關(guān)責(zé)任人在一定期限內(nèi)承擔(dān)或參與財(cái)政性資金支持的科學(xué)技術(shù)活動(dòng);記入科研誠信嚴(yán)重失信行為數(shù)據(jù)庫。造成特別嚴(yán)重負(fù)面影響或財(cái)政資金損失,應(yīng)采用頂格處罰,對(duì)違規(guī)單位和個(gè)人取消5年以上直至永久相關(guān)資格。

      猜你喜歡
      分詞校驗(yàn)申報(bào)
      “少年工程院活動(dòng)?!濒摺昂教煳磥砣瞬排囵B(yǎng)?!惫餐陥?bào)
      國際收支間接申報(bào)問答
      中國外匯(2019年13期)2019-10-10 03:37:42
      結(jié)巴分詞在詞云中的應(yīng)用
      爐溫均勻性校驗(yàn)在鑄鍛企業(yè)的應(yīng)用
      值得重視的分詞的特殊用法
      《申報(bào)》與上海民國時(shí)期禁戲
      中華戲曲(2016年1期)2016-09-26 08:49:02
      大型電動(dòng)機(jī)高阻抗差動(dòng)保護(hù)穩(wěn)定校驗(yàn)研究
      基于加窗插值FFT的PMU校驗(yàn)方法
      鍋爐安全閥在線校驗(yàn)不確定度評(píng)定
      高考分詞作狀語考點(diǎn)歸納與疑難解析
      乐平市| 合阳县| 甘洛县| 故城县| 名山县| 黄山市| 马尔康县| 济南市| 西畴县| 泌阳县| 通海县| 桐乡市| 东安县| 台北市| 井研县| 侯马市| 垦利县| 梅州市| 宝鸡市| 乌苏市| 塔河县| 衡山县| 惠水县| 土默特左旗| 临高县| 绥德县| 西青区| 台东县| 吕梁市| 同江市| 马鞍山市| 休宁县| 东源县| 柳江县| 大理市| 咸阳市| 南华县| 广州市| 无为县| 鄂托克前旗| 旅游|