趙 建 梁 爽
(1. 中國科學(xué)院文獻(xiàn)情報(bào)中心 北京 100190;2. 中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院信息資源管理系 北京 100190)
關(guān)鍵核心技術(shù)是國之重器,加強(qiáng)關(guān)鍵核心技術(shù)攻關(guān),對(duì)推動(dòng)我國經(jīng)濟(jì)高質(zhì)量發(fā)展、實(shí)現(xiàn)新舊動(dòng)能轉(zhuǎn)換、保障國防和經(jīng)濟(jì)安全具有十分重要的意義[1]。突破關(guān)鍵核心技術(shù)是我國“十四五”規(guī)劃中實(shí)現(xiàn)科技自立自強(qiáng)的重要部署,也是二〇三五年遠(yuǎn)景目標(biāo)的重要規(guī)劃,關(guān)系著我國能否如期進(jìn)入創(chuàng)新型國家前列、建成世界科技強(qiáng)國。因此,在新一輪科技革命和產(chǎn)業(yè)變革加速演進(jìn)的背景下,準(zhǔn)確、有效地識(shí)別關(guān)鍵核心技術(shù)對(duì)我國政府和管理部門在制定科技政策和戰(zhàn)略規(guī)劃、保障國家安全和國際競爭力、產(chǎn)業(yè)發(fā)展規(guī)劃、資源優(yōu)化配置、實(shí)現(xiàn)關(guān)鍵核心技術(shù)自主可控等方面具有重要意義。
目前已有部分學(xué)者針對(duì)關(guān)鍵核心技術(shù)的概念、特征以及識(shí)別方法進(jìn)行了研究,產(chǎn)生了一系列研究成果,但鮮有學(xué)者對(duì)關(guān)鍵核心技術(shù)識(shí)別方法的研究進(jìn)展進(jìn)行系統(tǒng)梳理和對(duì)比分析。鑒于此,本文在對(duì)關(guān)鍵核心技術(shù)的概念內(nèi)涵和特征進(jìn)行辨析的基礎(chǔ)上,歸納總結(jié)關(guān)鍵核心技術(shù)識(shí)別的主要方法,對(duì)比分析各種方法的優(yōu)缺點(diǎn),提出現(xiàn)有研究存在的問題以及未來可能的發(fā)展方向,以期為后續(xù)關(guān)鍵核心技術(shù)識(shí)別提供借鑒和參考。
目前,學(xué)術(shù)界對(duì)于關(guān)鍵核心技術(shù)的概念尚未達(dá)成共識(shí),學(xué)者們從不同視角對(duì)關(guān)鍵核心技術(shù)進(jìn)行了界定。對(duì)相關(guān)文獻(xiàn)進(jìn)行梳理后發(fā)現(xiàn),現(xiàn)有研究主要從技術(shù)體系、產(chǎn)業(yè)鏈中的關(guān)鍵技術(shù)、關(guān)鍵技術(shù)與核心技術(shù)的融合、國際競爭與國家安全等視角對(duì)關(guān)鍵核心技術(shù)的概念進(jìn)行闡釋,如表1所示。基于學(xué)者們對(duì)關(guān)鍵核心技術(shù)的定義,筆者認(rèn)為關(guān)鍵核心技術(shù)是在產(chǎn)業(yè)鏈中處于主導(dǎo)地位,難以被其他技術(shù)所替代,并對(duì)產(chǎn)業(yè)鏈中的其他技術(shù)具有支撐作用,對(duì)國家經(jīng)濟(jì)、國防和社會(huì)等方面安全產(chǎn)生深遠(yuǎn)影響的技術(shù)體系。
表1 關(guān)鍵核心技術(shù)的概念
對(duì)關(guān)鍵核心技術(shù)的概念進(jìn)行分析后可知,關(guān)鍵核心技術(shù)具有如下特征:(1)地位壟斷性。因?yàn)殛P(guān)鍵核心技術(shù)不可替代并且不易掌握,所以掌握產(chǎn)業(yè)關(guān)鍵核心技術(shù)的國家或企業(yè)在國際市場中擁有競爭優(yōu)勢(shì),占據(jù)壟斷地位[10]。(2)研發(fā)長期性。由于關(guān)鍵核心技術(shù)本身的復(fù)雜性和和不確定性,攻克關(guān)鍵核心技術(shù)依賴多學(xué)科、跨學(xué)科的知識(shí)支撐,需要國家、企業(yè)在基礎(chǔ)研究上的持續(xù)投入以及專業(yè)技術(shù)人才的培養(yǎng)和引進(jìn)[11]。(3)技術(shù)主導(dǎo)性。關(guān)鍵核心技術(shù)是產(chǎn)業(yè)鏈或技術(shù)體系中的關(guān)鍵組成部分,決定著整個(gè)技術(shù)體系的發(fā)展方向,對(duì)其他技術(shù)具有主導(dǎo)作用。
經(jīng)文獻(xiàn)調(diào)研后發(fā)現(xiàn),與關(guān)鍵核心技術(shù)相關(guān)的概念包括關(guān)鍵技術(shù)、核心技術(shù)、“卡脖子”技術(shù)、顛覆性技術(shù)、突破性技術(shù)、新興技術(shù)、前沿技術(shù)以及核心專利等。關(guān)鍵核心技術(shù)與這些相關(guān)概念之間有密切的關(guān)聯(lián),同時(shí)不同概念各有側(cè)重。為了厘清關(guān)鍵核心技術(shù)的內(nèi)涵,本文對(duì)關(guān)鍵核心技術(shù)及其相關(guān)概念進(jìn)行辨析比較,如表2所示。
表2 關(guān)鍵核心技術(shù)與相關(guān)概念的辨析
對(duì)國內(nèi)外相關(guān)文獻(xiàn)進(jìn)行系統(tǒng)梳理后發(fā)現(xiàn),關(guān)鍵核心技術(shù)識(shí)別方法總體上可分為定性分析法和定量分析法兩類。其中,定性分析法主要依靠領(lǐng)域?qū)<业慕?jīng)驗(yàn)和知識(shí),通過專家評(píng)估和判斷確定技術(shù)的重要性和關(guān)鍵性。隨著社會(huì)網(wǎng)絡(luò)分析、自然語言處理技術(shù)的發(fā)展,學(xué)者們嘗試使用專利指標(biāo)、專利間的引用、共現(xiàn)關(guān)系和技術(shù)主題等定量方法進(jìn)行關(guān)鍵核心技術(shù)的識(shí)別。鑒于此,本文將關(guān)鍵核心技術(shù)識(shí)別方法總結(jié)為基于專家經(jīng)驗(yàn)的方法、基于專利指標(biāo)的方法、基于專利網(wǎng)絡(luò)的方法以及基于文本挖掘的方法四種。
基于專家經(jīng)驗(yàn)識(shí)別關(guān)鍵核心技術(shù)屬于定性分析方法,主要基于德爾菲法、頭腦風(fēng)暴法等方法,借助相關(guān)領(lǐng)域?qū)<业膶I(yè)知識(shí)和背景,通過專家定性評(píng)價(jià)的方式識(shí)別出技術(shù)領(lǐng)域的關(guān)鍵核心技術(shù)。例如,任佳妮借助德爾菲法識(shí)別出醫(yī)療機(jī)器人領(lǐng)域的7項(xiàng)關(guān)鍵核心技術(shù)[20]。Ma等結(jié)合專家咨詢法和模糊層次分析法識(shí)別臺(tái)灣LED產(chǎn)業(yè)的關(guān)鍵核心技術(shù)[21]。
該方法操作簡便,能夠充分利用領(lǐng)域?qū)<业闹腔?識(shí)別結(jié)果具有較強(qiáng)的權(quán)威性。但是該方法的主觀性較強(qiáng),識(shí)別結(jié)果的準(zhǔn)確性依賴專家知識(shí)的廣度和深度。同時(shí),隨著科技文獻(xiàn)數(shù)量的激增以及不同學(xué)科間的交叉融合,僅僅依靠某一領(lǐng)域的專家較難準(zhǔn)確識(shí)別領(lǐng)域關(guān)鍵核心技術(shù)。因此,學(xué)者們通常將該方法與其他定量分析方法相結(jié)合來識(shí)別領(lǐng)域關(guān)鍵核心技術(shù)。
專利文獻(xiàn)中記載著技術(shù)成果,常被看作技術(shù)創(chuàng)新活動(dòng)的載體和結(jié)晶。核心專利是技術(shù)領(lǐng)域內(nèi)高價(jià)值、高競爭力的核心技術(shù)的表征,代表產(chǎn)業(yè)內(nèi)核心技術(shù)的發(fā)展動(dòng)向[22]。因此,部分學(xué)者設(shè)計(jì)專利指標(biāo)從海量專利文獻(xiàn)中識(shí)別出核心專利,將其作為該領(lǐng)域的關(guān)鍵核心技術(shù)。對(duì)相關(guān)文獻(xiàn)進(jìn)行調(diào)研后發(fā)現(xiàn),基于專利指標(biāo)的關(guān)鍵核心技術(shù)識(shí)別方法可細(xì)分為三種:基于單一指標(biāo)方法的識(shí)別、基于組合指標(biāo)的識(shí)別方法以及基于指標(biāo)體系的識(shí)別方法。
2.2.1單一指標(biāo)
部分學(xué)者通過統(tǒng)計(jì)專利文獻(xiàn)的被引頻次、同族專利數(shù)量、權(quán)利要求數(shù)量、分類號(hào)數(shù)量等單一的外部計(jì)量特征來識(shí)別某技術(shù)領(lǐng)域的核心專利。例如,陳旭認(rèn)為同族專利數(shù)量反映了專利申請(qǐng)者對(duì)相關(guān)技術(shù)的重視程度,因此利用同族專利數(shù)可以篩選領(lǐng)域核心技術(shù)[23]。Berger等發(fā)現(xiàn)核心專利的權(quán)利要求數(shù)多于其他專利,可以利用權(quán)利要求數(shù)來識(shí)別核心專利[24]。
基于單一指標(biāo)的識(shí)別方法使用專利的某一外部計(jì)量特征進(jìn)行核心專利的識(shí)別,外部計(jì)量特征容易獲取,簡單直接,易于評(píng)價(jià)。該方法的缺點(diǎn)是單一指標(biāo)的識(shí)別結(jié)果較為片面,可能會(huì)忽略其他因素的影響,導(dǎo)致結(jié)果不夠全面、準(zhǔn)確。同時(shí),如果選擇的指標(biāo)不合適可能會(huì)導(dǎo)致結(jié)果不夠準(zhǔn)確,甚至產(chǎn)生誤導(dǎo)。
2.2.2組合指標(biāo)
為了克服單一指標(biāo)的片面性,部分學(xué)者結(jié)合多個(gè)指標(biāo)進(jìn)行關(guān)鍵核心技術(shù)的識(shí)別。詹文青等結(jié)合專利自引頻次、他引頻次以及同族專利等指標(biāo)識(shí)別自動(dòng)駕駛領(lǐng)域的核心技術(shù)[25]。馬瑞敏等利用四年內(nèi)被引頻次、同族專利數(shù)、權(quán)利要求數(shù)等多個(gè)指標(biāo)識(shí)別OLED領(lǐng)域的核心技術(shù)[26]。Wang等結(jié)合專利被引頻次、同族專利數(shù)量、專利覆蓋范圍、權(quán)利要求數(shù)量以及專利訴訟數(shù)量五個(gè)指標(biāo)識(shí)別風(fēng)力發(fā)電領(lǐng)域的核心技術(shù)[27]。
相比單一指標(biāo),組合指標(biāo)可以綜合考慮多個(gè)指標(biāo),能夠更全面地識(shí)別領(lǐng)域的關(guān)鍵核心技術(shù),避免單一指標(biāo)可能存在的局限性,從而在一定程度上提高識(shí)別結(jié)果的準(zhǔn)確性。組合指標(biāo)可以根據(jù)不同的技術(shù)領(lǐng)域和技術(shù)的發(fā)展變化進(jìn)行調(diào)整和更新,具有一定的靈活性。該方法的局限在于沒有考慮各個(gè)指標(biāo)的權(quán)重,僅將各指標(biāo)的識(shí)別結(jié)果取并集,導(dǎo)致最終識(shí)別結(jié)果較為粗糙。同時(shí),組合指標(biāo)的選擇需要根據(jù)專業(yè)知識(shí)和判斷,因此可能會(huì)受到個(gè)人主觀因素的影響,導(dǎo)致結(jié)果不夠客觀和準(zhǔn)確。
2.2.3指標(biāo)體系
為了更加準(zhǔn)確地識(shí)別領(lǐng)域關(guān)鍵核心技術(shù),部分學(xué)者從專利的技術(shù)特征、經(jīng)濟(jì)特征、法律特征以及受重視程度等維度設(shè)計(jì)指標(biāo)體系,利用主觀賦權(quán)法或客觀賦權(quán)法對(duì)各指標(biāo)賦予不同的權(quán)重,從多個(gè)維度評(píng)估技術(shù)創(chuàng)新的水平,以識(shí)別技術(shù)領(lǐng)域的關(guān)鍵核心技術(shù)。陳旭等從戰(zhàn)略安全性、前沿技術(shù)性以及經(jīng)濟(jì)價(jià)值性三個(gè)維度設(shè)計(jì)指標(biāo)體系篩選得到了集成電路產(chǎn)業(yè)的關(guān)鍵核心技術(shù)[28]。江瑤等從前沿技術(shù)性、復(fù)雜創(chuàng)新性以及國家戰(zhàn)略性三個(gè)維度設(shè)計(jì)指標(biāo)體系,利用熵權(quán)法對(duì)各指標(biāo)賦予權(quán)重,識(shí)別出人工智能產(chǎn)業(yè)的關(guān)鍵核心技術(shù)[29]。楊大飛等依據(jù)核心技術(shù)的三個(gè)屬性(創(chuàng)新力、發(fā)展力和控制力)設(shè)計(jì)專利指標(biāo)體系,利用最優(yōu)組合賦權(quán)法對(duì)指標(biāo)賦予權(quán)重,識(shí)別OLED平板顯示產(chǎn)業(yè)的核心技術(shù)[30]。楊武等建立核心技術(shù)識(shí)別指標(biāo)體系并確定指標(biāo)權(quán)重,構(gòu)建得到核心技術(shù)評(píng)價(jià)指數(shù),依據(jù)指數(shù)值對(duì)專利類型進(jìn)行劃分,識(shí)別得到5G移動(dòng)通信產(chǎn)業(yè)的核心技術(shù)[31]。Wang等從基本特征、核心特征以及戰(zhàn)略特征三個(gè)維度設(shè)計(jì)指標(biāo)體系,利用熵權(quán)法對(duì)不同指標(biāo)賦予權(quán)重,識(shí)別出信息技術(shù)產(chǎn)業(yè)的關(guān)鍵核心技術(shù),并對(duì)世界主要國家的競爭態(tài)勢(shì)進(jìn)行了評(píng)價(jià)[32]。
此外,已有實(shí)際典型案例利用專利指標(biāo)體系對(duì)高價(jià)值專利進(jìn)行評(píng)選,例如中國專利獎(jiǎng)。該獎(jiǎng)項(xiàng)設(shè)專利獎(jiǎng)項(xiàng)和外觀設(shè)計(jì)獎(jiǎng)項(xiàng)兩類,分別從發(fā)明、實(shí)用新型專利和外觀設(shè)計(jì)專利中評(píng)選產(chǎn)生,兩類獎(jiǎng)項(xiàng)的評(píng)選均設(shè)置了相應(yīng)的評(píng)價(jià)指標(biāo)體系,其中,專利獎(jiǎng)項(xiàng)的指標(biāo)體系包括專利質(zhì)量、技術(shù)先進(jìn)性、運(yùn)用及保護(hù)措施和成效、社會(huì)效益及發(fā)展前景四種,指標(biāo)權(quán)重分別為25%、25%、35%、15%[33]。參照2018年《科技日?qǐng)?bào)》中提出的“35項(xiàng)亟待攻克的關(guān)鍵核心技術(shù)”、我國“十四五”規(guī)劃以及國家自然科學(xué)基金“十四五”發(fā)展規(guī)劃中所列舉的關(guān)鍵核心技術(shù),第二十四屆中國專利獎(jiǎng)獲獎(jiǎng)項(xiàng)目涵括了芯片、元器件、網(wǎng)絡(luò)通信、操作系統(tǒng)、激光雷達(dá)、鋰電池隔膜等在內(nèi)的多項(xiàng)關(guān)鍵核心技術(shù)[34-38]。從中國專利獎(jiǎng)的評(píng)審方法及獲獎(jiǎng)的技術(shù)內(nèi)容來看,該獎(jiǎng)項(xiàng)的關(guān)注點(diǎn)通常是在核心領(lǐng)域具有重要意義與影響力的技術(shù),并與關(guān)鍵核心技術(shù)存在重合。這一案例也表明了基于專利指標(biāo)體系的關(guān)鍵核心技術(shù)識(shí)別方法已在實(shí)際問題中得到了較好應(yīng)用。
基于指標(biāo)體系的識(shí)別方法從不同維度設(shè)計(jì)指標(biāo)體系識(shí)別技術(shù)領(lǐng)域的關(guān)鍵核心技術(shù),同時(shí)利用層次分析法、熵權(quán)法或?qū)<易稍兊确椒▽?duì)各指標(biāo)賦予不同權(quán)重,考慮了不同指標(biāo)的重要程度,具有較強(qiáng)的科學(xué)性。該方法的局限是評(píng)價(jià)指標(biāo)的普適性和全面性有待進(jìn)一步完善;同時(shí)部分研究中指標(biāo)的權(quán)重設(shè)置主觀性較強(qiáng),需要依賴專家的專業(yè)背景和知識(shí),從而降低了識(shí)別結(jié)果的準(zhǔn)確性和客觀性。
隨著網(wǎng)絡(luò)科學(xué)的發(fā)展,部分學(xué)者開始引入復(fù)雜網(wǎng)絡(luò)分析的思想,以專利文獻(xiàn)為數(shù)據(jù)源,基于專利文獻(xiàn)間的引用關(guān)系、專利分類號(hào)的共現(xiàn)關(guān)系、技術(shù)交叉影響矩陣構(gòu)建專利關(guān)系網(wǎng)絡(luò),結(jié)合社會(huì)網(wǎng)絡(luò)分析法識(shí)別領(lǐng)域中的關(guān)鍵核心技術(shù)。常見的專利關(guān)系網(wǎng)絡(luò)包括專利引文網(wǎng)絡(luò)、專利共類網(wǎng)絡(luò)、技術(shù)交叉影響網(wǎng)絡(luò)以及投入產(chǎn)出網(wǎng)絡(luò)等。
2.3.1專利引文網(wǎng)絡(luò)
基于專利引文網(wǎng)絡(luò)的識(shí)別方法利用專利文獻(xiàn)間的引用關(guān)系構(gòu)建引文網(wǎng)絡(luò),結(jié)合社會(huì)網(wǎng)絡(luò)分析指標(biāo)從引文網(wǎng)絡(luò)中識(shí)別代表該技術(shù)領(lǐng)域核心技術(shù)的關(guān)鍵節(jié)點(diǎn)。常見的引文網(wǎng)絡(luò)包括直接引用網(wǎng)絡(luò)、共被引網(wǎng)絡(luò)以及引文耦合網(wǎng)絡(luò)。
a.直接引用網(wǎng)絡(luò)。專利文獻(xiàn)通過引證與被引證的關(guān)系形成引文鏈,多條引文鏈交叉融合得到引用網(wǎng)絡(luò),反映了技術(shù)演進(jìn)的路徑和方向[39]。因此,部分學(xué)者利用專利文獻(xiàn)間的直接引用關(guān)系構(gòu)建專利引用網(wǎng)絡(luò),結(jié)合社會(huì)網(wǎng)絡(luò)分析指標(biāo)或主路徑分析識(shí)別網(wǎng)絡(luò)中的重要節(jié)點(diǎn),將其定義為關(guān)鍵核心技術(shù)。戚筠等在專利引用網(wǎng)絡(luò)的基礎(chǔ)上結(jié)合小世界網(wǎng)絡(luò)特性和主路徑分析法識(shí)別石墨烯領(lǐng)域的關(guān)鍵核心技術(shù)[40]。Lai等在專利引用網(wǎng)絡(luò)的基礎(chǔ)上,結(jié)合專利指標(biāo)、中心性指標(biāo)以及主路徑分析,識(shí)別薄膜太陽能領(lǐng)域的關(guān)鍵核心技術(shù)[41]。Lee等依據(jù)1985-2012年間USPTO中的專利數(shù)據(jù)構(gòu)建引文網(wǎng)絡(luò),利用PageRank算法識(shí)別關(guān)鍵核心技術(shù)[42]。
b.共被引網(wǎng)絡(luò)。1973年,美國情報(bào)學(xué)家Small和蘇聯(lián)情報(bào)學(xué)家Irina Marshakova同時(shí)首次提出了文獻(xiàn)共被引的概念[43, 44]。如果兩篇或多篇文獻(xiàn)同時(shí)被后來的一篇或多篇文獻(xiàn)引證,則稱這兩篇或多篇文獻(xiàn)具有共被引關(guān)系。部分學(xué)者基于專利文獻(xiàn)間的共同引用關(guān)系構(gòu)建共被引網(wǎng)絡(luò),結(jié)合專利指標(biāo)和社會(huì)網(wǎng)絡(luò)分析指標(biāo)識(shí)別網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn),從而發(fā)現(xiàn)技術(shù)領(lǐng)域中的關(guān)鍵核心技術(shù)。劉紅光等對(duì)國際燃料電池汽車領(lǐng)域的高被引專利進(jìn)行共被引分析,結(jié)合同族專利以及專利壽命等指標(biāo)識(shí)別該領(lǐng)域的關(guān)鍵核心技術(shù)[45]。Yang等構(gòu)建專利共被引網(wǎng)絡(luò),結(jié)合社會(huì)網(wǎng)絡(luò)分析法識(shí)別極紫外光刻機(jī)領(lǐng)域的核心技術(shù)[46]。
c.引文耦合網(wǎng)絡(luò)。1963年美國科學(xué)家Kessler首次提出了文獻(xiàn)耦合的概念[47]。如果A和B兩篇文獻(xiàn)共同引證了一篇或多篇參考文獻(xiàn),則A和B兩篇文獻(xiàn)具有耦合關(guān)系。Noh等結(jié)合引文耦合網(wǎng)絡(luò)和文本挖掘方法識(shí)別電信領(lǐng)域的核心技術(shù)[48]。Huang等結(jié)合文獻(xiàn)耦合和共被引分析法識(shí)別光伏領(lǐng)域的核心技術(shù)[49]。
基于專利引文網(wǎng)絡(luò)的識(shí)別方法原理簡單,專利文獻(xiàn)間的引用關(guān)系容易獲取,且當(dāng)前社會(huì)網(wǎng)絡(luò)分析理論較為成熟,可以對(duì)其引用關(guān)系進(jìn)行可視化分析,可解釋性較強(qiáng)。但該方法僅依靠專利文獻(xiàn)的外部引用特征,未深入到專利文獻(xiàn)內(nèi)容層面,無法判斷作者的引用動(dòng)機(jī)、引用強(qiáng)度等更復(fù)雜的引用機(jī)理。同時(shí),專利文獻(xiàn)間引用關(guān)系的時(shí)滯性導(dǎo)致引文網(wǎng)絡(luò)不能及時(shí)反映技術(shù)領(lǐng)域的最新動(dòng)態(tài),從而降低識(shí)別結(jié)果的準(zhǔn)確性。
2.3.2專利共類網(wǎng)絡(luò)
同一領(lǐng)域的專利文獻(xiàn)往往會(huì)涉及相同或相近的技術(shù)領(lǐng)域,因此其分類號(hào)往往會(huì)存在共現(xiàn)現(xiàn)象,即相同或相近的分類號(hào)會(huì)同時(shí)出現(xiàn)在專利文獻(xiàn)中。通過分析專利分類號(hào)的共現(xiàn)現(xiàn)象,可以找到代表該領(lǐng)域核心技術(shù)的關(guān)鍵分類號(hào)?;趯@差惥W(wǎng)絡(luò)方法的主要思路是利用專利分類號(hào)的共現(xiàn)關(guān)系構(gòu)建專利共類網(wǎng)絡(luò),結(jié)合社會(huì)網(wǎng)絡(luò)分析指標(biāo)從專利共類網(wǎng)絡(luò)中識(shí)別關(guān)鍵節(jié)點(diǎn),將其作為關(guān)鍵核心技術(shù)。常見的專利共類網(wǎng)絡(luò)包括國際專利分類號(hào)(以下簡稱“IPC分類號(hào)”)共現(xiàn)網(wǎng)絡(luò)和德溫特手工代碼共現(xiàn)網(wǎng)絡(luò)兩種。
a.國際專利分類號(hào)共現(xiàn)網(wǎng)絡(luò)。毛薦其等首先利用專利共類分析法識(shí)別光刻技術(shù)領(lǐng)域的核心技術(shù)和潛力技術(shù),然后借助結(jié)構(gòu)洞理論從中識(shí)別出該領(lǐng)域的關(guān)鍵核心技術(shù)[50]。Tang等在IPC共現(xiàn)網(wǎng)絡(luò)的基礎(chǔ)上結(jié)合信息熵對(duì)核心技術(shù)進(jìn)行識(shí)別[51]。Park等在IPC共現(xiàn)網(wǎng)絡(luò)的基礎(chǔ)上利用中心性指標(biāo)識(shí)別建筑信息建模領(lǐng)域的關(guān)鍵核心技術(shù)[52]。Long等基于我國地鐵領(lǐng)域的專利數(shù)據(jù)構(gòu)建了國際專利分類信息共現(xiàn)網(wǎng)絡(luò),利用加權(quán)節(jié)點(diǎn)重要度共現(xiàn)關(guān)聯(lián)矩陣分析網(wǎng)絡(luò)中節(jié)點(diǎn)的重要程度,進(jìn)而識(shí)別出中國地鐵領(lǐng)域的關(guān)鍵核心技術(shù)[53, 54]。
b.德溫特手工代碼共現(xiàn)網(wǎng)絡(luò)。張迎新等構(gòu)建德溫特手工代碼共現(xiàn)網(wǎng)絡(luò)識(shí)別五軸聯(lián)動(dòng)數(shù)控機(jī)床領(lǐng)域的核心技術(shù)[55]。侯劍華等基于專利家族的視角,構(gòu)建德溫特手工代碼共現(xiàn)網(wǎng)絡(luò),識(shí)別太陽能光伏電池領(lǐng)域的核心技術(shù)及其演進(jìn)路徑[56]。Zhang等通過構(gòu)建德溫特手工代碼共現(xiàn)網(wǎng)絡(luò),識(shí)別數(shù)字程控交換機(jī)領(lǐng)域的核心技術(shù)[57]。
基于專利共類網(wǎng)絡(luò)的方法在專利分類號(hào)共現(xiàn)網(wǎng)絡(luò)的基礎(chǔ)上,借助社會(huì)網(wǎng)絡(luò)分析方法識(shí)別關(guān)鍵技術(shù)領(lǐng)域。該方法可操作性強(qiáng),簡單易行,對(duì)專業(yè)知識(shí)的掌握程度要求相對(duì)較低。不足之處在于該方法僅利用了專利分類號(hào)這一外部特征來表征領(lǐng)域中的關(guān)鍵核心技術(shù),未深入到專利文獻(xiàn)內(nèi)容層面,識(shí)別結(jié)果粒度較粗,且分類號(hào)數(shù)量和分類粒度的選擇會(huì)影響結(jié)果的準(zhǔn)確性。對(duì)于新興技術(shù)領(lǐng)域,由于分類號(hào)的數(shù)量較少,分類號(hào)間的共現(xiàn)關(guān)系不顯著,可能無法準(zhǔn)確識(shí)別其關(guān)鍵核心技術(shù)。
2.3.3技術(shù)交叉影響
技術(shù)交叉影響分析的概念最早是由Choi等學(xué)者于2007年提出的,其核心思想是計(jì)算多個(gè)不同技術(shù)領(lǐng)域間的交叉影響系數(shù),在此基礎(chǔ)上構(gòu)建技術(shù)領(lǐng)域的技術(shù)交叉影響矩陣,從中選擇對(duì)其他技術(shù)領(lǐng)域具有較大影響的技術(shù)作為關(guān)鍵核心技術(shù)。
趙璞等利用關(guān)聯(lián)規(guī)則挖掘共現(xiàn)頻次較高的技術(shù)領(lǐng)域,然后計(jì)算不同技術(shù)領(lǐng)域的交叉影響系數(shù),構(gòu)建交叉影響系數(shù)矩陣,識(shí)別太陽能光伏領(lǐng)域的關(guān)鍵核心技術(shù)[58]。Kim等通過對(duì)專利數(shù)據(jù)共分類信息進(jìn)行關(guān)聯(lián)規(guī)則挖掘計(jì)算支持度、提升度和置信度,構(gòu)建強(qiáng)度、關(guān)聯(lián)度和交叉影響視角的技術(shù)關(guān)聯(lián)矩陣,結(jié)合網(wǎng)絡(luò)分析方法比較不同技術(shù)的重要程度,最后得到領(lǐng)域關(guān)鍵核心技術(shù)[59, 60]。Lee等將網(wǎng)絡(luò)層次分析法(ANP)應(yīng)用于技術(shù)網(wǎng)絡(luò),對(duì)技術(shù)的極限中心性進(jìn)行測(cè)度,表示技術(shù)對(duì)其他技術(shù)影響的重要性,以此來識(shí)別技術(shù)網(wǎng)絡(luò)中的核心技術(shù)[61]。
基于技術(shù)交叉影響的識(shí)別方法從關(guān)鍵核心技術(shù)的概念和特征出發(fā),從技術(shù)影響力的角度識(shí)別關(guān)鍵核心技術(shù),可以充分結(jié)合技術(shù)交叉影響的測(cè)度結(jié)果,較好地反映技術(shù)之間的相互關(guān)聯(lián)程度,使得結(jié)果更具有可解釋性和實(shí)用性。該方法的不足是將專利分類號(hào)作為技術(shù)領(lǐng)域的表征,未能充分利用專利文獻(xiàn)的語義信息,識(shí)別結(jié)果粒度較粗。同時(shí),技術(shù)交叉影響的測(cè)度方式也有待進(jìn)一步完善。
2.3.4投入產(chǎn)出網(wǎng)絡(luò)
投入產(chǎn)出分析法是經(jīng)濟(jì)學(xué)領(lǐng)域的常用方法,常被用于分析經(jīng)濟(jì)系統(tǒng)各部分之間的投入產(chǎn)出關(guān)系。部分學(xué)者借鑒投入產(chǎn)出分析法的基本思想,將專利引用看作投入,將專利發(fā)表看作產(chǎn)出,利用專利的引用關(guān)系構(gòu)建技術(shù)投入產(chǎn)出矩陣,結(jié)合技術(shù)領(lǐng)域間的影響力指標(biāo)識(shí)別出在技術(shù)體系中占據(jù)重要地位的技術(shù)節(jié)點(diǎn),進(jìn)而確定關(guān)鍵核心技術(shù)。王智琦等利用投入產(chǎn)出分析法,計(jì)算混合動(dòng)力汽車的主要技術(shù)子領(lǐng)域的影響力系數(shù),從而識(shí)別該領(lǐng)域的關(guān)鍵核心技術(shù)[62]。姜照華等利用投入產(chǎn)出分析法,在專利引用矩陣的基礎(chǔ)上計(jì)算傳送帶行業(yè)不同技術(shù)子領(lǐng)域間的影響力系數(shù),從而識(shí)別該領(lǐng)域的關(guān)鍵核心技術(shù)[63]。Xu等結(jié)合頻率模式增長算法和投入產(chǎn)出分析法,識(shí)別我國新能源汽車領(lǐng)域的關(guān)鍵核心技術(shù)[64]。
基于投入產(chǎn)出網(wǎng)絡(luò)的方法在不同技術(shù)子領(lǐng)域間專利文獻(xiàn)引用矩陣的基礎(chǔ)上,利用技術(shù)影響力系數(shù)衡量不同技術(shù)子領(lǐng)域在引用網(wǎng)絡(luò)中的技術(shù)影響力,從而識(shí)別關(guān)鍵核心技術(shù)。該方法原理簡單,專利引用數(shù)據(jù)易獲取,可操作性強(qiáng)。不足之處在于該方法在分析過程中需要人工進(jìn)行干預(yù)和判斷,存在一定的主觀性。同時(shí),僅通過專利引用數(shù)量來衡量領(lǐng)域的技術(shù)影響力大小,測(cè)度維度較為單一,難以全面客觀地解釋領(lǐng)域技術(shù)影響力。
文本挖掘是指從大量非結(jié)構(gòu)化文本中分析、提取重要的語義內(nèi)容信息,并將其整理、組織、加工成有價(jià)值的知識(shí)的過程。隨著大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,學(xué)者們開始嘗試?yán)米匀徽Z言處理和文本挖掘技術(shù),從專利文獻(xiàn)、科技論文的文本內(nèi)容中抽取關(guān)鍵詞、主題詞或語義單元,進(jìn)而識(shí)別領(lǐng)域關(guān)鍵核心技術(shù)。經(jīng)文獻(xiàn)調(diào)研后發(fā)現(xiàn),基于文本挖掘的關(guān)鍵核心技術(shù)識(shí)別方法大致可分為三種:共詞分析、主題模型以及SAO語義網(wǎng)絡(luò)。
2.4.1共詞分析
基于共詞分析識(shí)別關(guān)鍵核心技術(shù)的核心思想是從專利文獻(xiàn)中抽取關(guān)鍵詞或主題詞,構(gòu)建關(guān)鍵詞或主題詞共現(xiàn)網(wǎng)絡(luò),通過聚類分析或社會(huì)網(wǎng)絡(luò)分析指標(biāo)發(fā)現(xiàn)網(wǎng)絡(luò)中節(jié)點(diǎn)之間的內(nèi)在聯(lián)系,進(jìn)而識(shí)別領(lǐng)域中的關(guān)鍵核心技術(shù)。詹愛嵐利用RAKE算法從專利文獻(xiàn)的摘要中抽取關(guān)鍵詞,構(gòu)建關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),從中識(shí)別移動(dòng)通信產(chǎn)業(yè)的關(guān)鍵核心技術(shù)[65]。樓旭明等繪制專利關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),結(jié)合專利技術(shù)領(lǐng)域分析識(shí)別無人機(jī)領(lǐng)域的核心技術(shù)[66]。Xu等通過獲取論文、技術(shù)報(bào)告等多種數(shù)據(jù)資源,從中提取關(guān)鍵詞,建立超網(wǎng)絡(luò)模型,利用改進(jìn)的SuperedgeRank算法識(shí)別核心技術(shù)[67]。
基于共詞分析的方法從專利文獻(xiàn)中提取高頻關(guān)鍵詞或主題詞構(gòu)建共現(xiàn)網(wǎng)絡(luò),通過聚類分析識(shí)別領(lǐng)域關(guān)鍵核心技術(shù),相比基于專利外部特征的方法具有一定的優(yōu)勢(shì)。該方法的局限是僅從共現(xiàn)頻次角度進(jìn)行統(tǒng)計(jì)分析,無法體現(xiàn)關(guān)鍵詞間深層次的語義關(guān)聯(lián);僅關(guān)鍵詞難以充分全面地揭示領(lǐng)域技術(shù)內(nèi)容,需要結(jié)合其他方法進(jìn)行綜合分析。
2.4.2主題模型
主題模型是一種基于無監(jiān)督學(xué)習(xí)的方法在海量文獻(xiàn)中挖掘潛在主題的統(tǒng)計(jì)模型。針對(duì)共詞分析的方法難以全面揭示專利文獻(xiàn)內(nèi)容的弊端,學(xué)者們開始嘗試使用主題模型進(jìn)行關(guān)鍵核心技術(shù)識(shí)別。經(jīng)文獻(xiàn)調(diào)研后發(fā)現(xiàn),基于主題模型的識(shí)別方法主要分為兩種:一種是使用傳統(tǒng)的LDA模型識(shí)別領(lǐng)域關(guān)鍵核心技術(shù)主題;另一種是對(duì)傳統(tǒng)LDA模型進(jìn)行改進(jìn),以彌補(bǔ)傳統(tǒng)LDA模型在主題解釋性、主題歧義等方面的缺陷。
a.傳統(tǒng)的LDA模型。李維思等從產(chǎn)業(yè)鏈角度出發(fā),基于關(guān)鍵核心技術(shù)的特征采集多源數(shù)據(jù),利用LDA模型識(shí)別人工智能領(lǐng)域的關(guān)鍵核心技術(shù)[68]。楊恒等通過構(gòu)建核心專利識(shí)別指標(biāo)體系得到人工智能領(lǐng)域的核心專利,然后利用LDA模型和Word2Vec詞向量模型識(shí)別該領(lǐng)域的核心專利技術(shù)主題[69]。Chun等利用LDA模型和網(wǎng)絡(luò)分析法識(shí)別智能農(nóng)場技術(shù)領(lǐng)域的關(guān)鍵核心技術(shù)[70]。
b.改進(jìn)的LDA模型。王秀紅等將BERT模型和LDA模型進(jìn)行結(jié)合,使用BERT-LDA模型識(shí)別農(nóng)業(yè)機(jī)器人領(lǐng)域的關(guān)鍵技術(shù),提高了識(shí)別結(jié)果的主題連貫性[71]。劉自強(qiáng)等使用語義增強(qiáng)的主題模型Chunk-LDAvis識(shí)別納米農(nóng)業(yè)領(lǐng)域的技術(shù)主題,利用社會(huì)網(wǎng)絡(luò)分析法得到該領(lǐng)域的關(guān)鍵核心技術(shù)主題[72]。伊惠芳等將IPC分類號(hào)與傳統(tǒng)的LDA模型進(jìn)行結(jié)合,提出了IPC語境增強(qiáng)的LDA模型,識(shí)別石墨烯領(lǐng)域的關(guān)鍵核心技術(shù)主題[73]。Su等獲取碳中和領(lǐng)域的論文數(shù)據(jù),采用BERT-LDA模型和K-means聚類實(shí)現(xiàn)技術(shù)主題的識(shí)別與聚類可視化,結(jié)合專家知識(shí)和粒度分析當(dāng)前的關(guān)鍵技術(shù)主題[74]。
基于主題模型的方法無需人工標(biāo)注語料,便可以挖掘出專利文獻(xiàn)中的潛在主題,同時(shí)能夠處理大規(guī)模的專利數(shù)據(jù),具有高效性和可擴(kuò)展性。該方法的局限在于得到的技術(shù)主題含義較為寬泛,可解釋性較低,在沒有上下文的情況下較難準(zhǔn)確理解技術(shù)主題的含義;某些技術(shù)主題存在多義性,從而導(dǎo)致識(shí)別結(jié)果具有歧義。
2.4.3SAO語義網(wǎng)絡(luò)
基于SAO語義網(wǎng)絡(luò)識(shí)別關(guān)鍵核心技術(shù)的主要思路是從文獻(xiàn)的標(biāo)題、摘要等文本內(nèi)容中抽取主體、動(dòng)作和客體三個(gè)要素,得到SAO三元組,在此基礎(chǔ)上構(gòu)建知識(shí)網(wǎng)絡(luò)或技術(shù)樹,結(jié)合社會(huì)網(wǎng)絡(luò)分析指標(biāo)識(shí)別領(lǐng)域關(guān)鍵核心技術(shù)。
任海英等從專利文獻(xiàn)中抽取SAO結(jié)構(gòu),構(gòu)建領(lǐng)域知識(shí)網(wǎng)絡(luò),結(jié)合K-核分析法和主路徑分析法從知識(shí)網(wǎng)絡(luò)中識(shí)別核心技術(shù)鏈,以量子計(jì)算領(lǐng)域進(jìn)行實(shí)證研究[75]。Yang等從專利文獻(xiàn)中提取SAO結(jié)構(gòu),結(jié)合“相似性指標(biāo)”識(shí)別石墨烯領(lǐng)域的核心技術(shù)[76]。Choi等從專利文獻(xiàn)中抽取SAO結(jié)構(gòu),在此基礎(chǔ)上構(gòu)建技術(shù)樹,識(shí)別質(zhì)子交換燃料電池領(lǐng)域的核心技術(shù)[77]。Lin等從專利文獻(xiàn)中抽取SAO結(jié)構(gòu),構(gòu)建復(fù)雜網(wǎng)絡(luò),結(jié)合結(jié)構(gòu)洞和中心性指標(biāo)識(shí)別技術(shù)領(lǐng)域的核心技術(shù)[78]。
基于SAO語義網(wǎng)絡(luò)的方法充分利用了文獻(xiàn)的內(nèi)容信息,根據(jù)詞間語義關(guān)系和社會(huì)網(wǎng)絡(luò)分析法從語義層面挖掘關(guān)鍵核心技術(shù)主題,識(shí)別結(jié)果較為準(zhǔn)確。該方法的局限性在于抽取的三元組中可能會(huì)存在同義詞或近義詞的情況,對(duì)識(shí)別結(jié)果造成影響。同時(shí)識(shí)別結(jié)果的可讀性相對(duì)較差,需要進(jìn)一步的人工理解和解釋。
當(dāng)前,學(xué)者們對(duì)關(guān)鍵核心技術(shù)的識(shí)別方法進(jìn)行了積極探索,取得了豐碩的研究成果。本文對(duì)相關(guān)文獻(xiàn)進(jìn)行系統(tǒng)梳理后,將關(guān)鍵核心技術(shù)的識(shí)別方法歸納為四種:基于專家經(jīng)驗(yàn)的方法、基于專利指標(biāo)的方法、基于專利關(guān)系網(wǎng)絡(luò)的方法以及基于文本挖掘的方法。本文從主要思路、優(yōu)勢(shì)和局限三個(gè)方面對(duì)上述四種方法進(jìn)行了對(duì)比分析,如表3所示。
通過對(duì)關(guān)鍵核心技術(shù)的概念、特征以及主要識(shí)別方法進(jìn)行歸納總結(jié),本文認(rèn)為現(xiàn)有研究存在以下幾點(diǎn)局限:
a.關(guān)鍵核心技術(shù)的概念尚未達(dá)成共識(shí)。鑒于專業(yè)領(lǐng)域和研究目的存在差別,學(xué)者們對(duì)關(guān)鍵核心技術(shù)的定義存在一定的差異。目前學(xué)術(shù)界主要從技術(shù)體系、國際競爭、產(chǎn)業(yè)鏈等視角對(duì)關(guān)鍵核心技術(shù)進(jìn)行界定,但尚未就關(guān)鍵核心技術(shù)的概念達(dá)成共識(shí)。這導(dǎo)致了學(xué)者在構(gòu)建指標(biāo)體系時(shí)存在較大差異,難以形成統(tǒng)一標(biāo)準(zhǔn),建立全面、科學(xué)的評(píng)價(jià)體系,從而無法實(shí)現(xiàn)對(duì)不同領(lǐng)域關(guān)鍵核心技術(shù)的系統(tǒng)性評(píng)估。同時(shí),缺乏科學(xué)性判定標(biāo)準(zhǔn)也導(dǎo)致在關(guān)鍵核心技術(shù)識(shí)別過程中存在主觀性、片面性和不確定性,難以進(jìn)行客觀、全面的關(guān)鍵核心技術(shù)識(shí)別。
b.用于識(shí)別關(guān)鍵核心技術(shù)的數(shù)據(jù)源較為單一?,F(xiàn)有研究主要以專利文獻(xiàn)和科技論文為數(shù)據(jù)源進(jìn)行關(guān)鍵核心技術(shù)的識(shí)別,而與科技發(fā)展具有密切關(guān)系的基金項(xiàng)目、科技政策、行業(yè)報(bào)告以及市場信息等數(shù)據(jù)尚未得到充分利用。由于現(xiàn)有研究的數(shù)據(jù)來源較為單一,識(shí)別結(jié)果可能會(huì)受到數(shù)據(jù)的局限,未能全面反映某些領(lǐng)域的關(guān)鍵核心技術(shù),對(duì)識(shí)別結(jié)果的準(zhǔn)確性和全面性產(chǎn)生一定的影響。同時(shí),雖然部分學(xué)者基于多源數(shù)據(jù)融合來識(shí)別關(guān)鍵核心技術(shù),但是融合層次大多局限于數(shù)據(jù)級(jí)層面,即將不同數(shù)據(jù)源的原始數(shù)據(jù)進(jìn)行簡單的合并,較少有研究深入到特征層面。雖然數(shù)據(jù)級(jí)層面的多源數(shù)據(jù)融合在一定程度上可以提供更全面的數(shù)據(jù)視角,但對(duì)于挖掘潛在的關(guān)鍵核心技術(shù)仍然有一定局限性。
c.關(guān)鍵核心技術(shù)識(shí)別方法的自動(dòng)化程度較低。部分關(guān)鍵核心技術(shù)識(shí)別方法在指標(biāo)權(quán)重的設(shè)置、技術(shù)領(lǐng)域劃分、技術(shù)主題含義確定、結(jié)果的有效性和準(zhǔn)確性驗(yàn)證等方面需要人工干預(yù),導(dǎo)致識(shí)別方法的自動(dòng)化程度較低,尤其在處理大規(guī)模文本數(shù)據(jù)時(shí),識(shí)別過程可能會(huì)非常繁瑣,會(huì)耗費(fèi)大量時(shí)間和資源。盡管已有學(xué)者嘗試使用文本挖掘方法來提高關(guān)鍵核心技術(shù)識(shí)別的自動(dòng)化程度,但目前仍未達(dá)到完全自動(dòng)化的階段,識(shí)別過程仍需依賴專家的背景知識(shí)和經(jīng)驗(yàn),導(dǎo)致識(shí)別結(jié)主觀性較強(qiáng),識(shí)別效率低下、成本較高。
d.關(guān)鍵核心技術(shù)識(shí)別結(jié)果粒度較粗。一方面,關(guān)鍵核心技術(shù)的概念定義尚不明確,導(dǎo)致在識(shí)別時(shí)難以準(zhǔn)確定義關(guān)鍵核心技術(shù)的范圍和層次。另一方面,現(xiàn)有的識(shí)別方法通常只能對(duì)技術(shù)進(jìn)行較為宏觀的識(shí)別和分析,無法深入挖掘技術(shù)的內(nèi)在結(jié)構(gòu)。目前大多數(shù)研究的識(shí)別結(jié)果停留在以專利分類號(hào)為表征的技術(shù)領(lǐng)域?qū)用?識(shí)別結(jié)果粒度較粗。雖然基于文本挖掘的方法能夠深入到文本內(nèi)容,從技術(shù)主題層面表示關(guān)鍵核心技術(shù),但技術(shù)主題間缺乏語義關(guān)聯(lián),導(dǎo)致識(shí)別結(jié)果的可解釋性較低。
關(guān)鍵核心技術(shù)是國之重器,準(zhǔn)確、有效地識(shí)別關(guān)鍵核心技術(shù)對(duì)我國政府、管理機(jī)構(gòu)以及研發(fā)人員具有重要意義。在國家層面,識(shí)別關(guān)鍵核心技術(shù)有助于了解我國在相關(guān)領(lǐng)域的技術(shù)實(shí)力和競爭優(yōu)勢(shì),為未來科技政策和戰(zhàn)略規(guī)劃的制定提供重要依據(jù)。在管理機(jī)構(gòu)層面,識(shí)別關(guān)鍵核心技術(shù)有助于管理機(jī)構(gòu)確定優(yōu)先發(fā)展的產(chǎn)業(yè)方向,制定相應(yīng)的產(chǎn)業(yè)發(fā)展規(guī)劃,推動(dòng)產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化升級(jí)。在研發(fā)人員層面,識(shí)別關(guān)鍵核心技術(shù)有助于研發(fā)人員聚焦于重要的研究領(lǐng)域,明確科研方向和目標(biāo),使其研究更加具有針對(duì)性和實(shí)踐意義。鑒于此,本文首先對(duì)關(guān)鍵核心技術(shù)的概念和特征進(jìn)行了界定;然后系統(tǒng)梳理了現(xiàn)有的關(guān)鍵核心技術(shù)識(shí)別方法,將其總結(jié)為四類:基于專家經(jīng)驗(yàn)的方法、基于專利指標(biāo)的方法、基于專利關(guān)系網(wǎng)絡(luò)的方法以及基于文本挖掘的方法;最后對(duì)比了各種方法的優(yōu)劣,提出了現(xiàn)有研究存在的主要問題。
針對(duì)目前關(guān)鍵核心技術(shù)識(shí)別研究現(xiàn)狀以及存在的問題,本文對(duì)未來的研究方向提出以下幾點(diǎn)思考:
a.加強(qiáng)關(guān)鍵核心技術(shù)的基礎(chǔ)理論研究。目前學(xué)術(shù)界對(duì)關(guān)鍵核心技術(shù)的概念、特征以及影響因素等理論問題進(jìn)行了積極探索,但還未達(dá)成共識(shí)。未來研究應(yīng)進(jìn)一步加強(qiáng)關(guān)鍵核心技術(shù)基本理論的探討,加強(qiáng)學(xué)術(shù)界間及其與產(chǎn)業(yè)界的交流合作,努力就其基本理論問題達(dá)成共識(shí),明確定義關(guān)鍵核心技術(shù)的范圍和概念,并建立相應(yīng)的標(biāo)準(zhǔn)和評(píng)估方法,為后續(xù)關(guān)鍵核心技術(shù)的識(shí)別提供理論基礎(chǔ)與方法基礎(chǔ)。
b. 融合多源數(shù)據(jù)進(jìn)行關(guān)鍵核心技術(shù)的識(shí)別。專利文獻(xiàn)、科技論文、基金項(xiàng)目、科技政策以及行業(yè)報(bào)告等數(shù)據(jù)源在內(nèi)容、用途、可信度、時(shí)效性、覆蓋范圍、可獲取性、數(shù)據(jù)質(zhì)量等方面存在區(qū)別。因此,未來研究應(yīng)充分利用專利文獻(xiàn)、科技論文、基金項(xiàng)目、行業(yè)報(bào)告、科技政策以及市場信息等與科技發(fā)展密切相關(guān)的多種數(shù)據(jù)源,從特征層面融合多源數(shù)據(jù)進(jìn)行關(guān)鍵核心技術(shù)的識(shí)別。首先,可以從每種數(shù)據(jù)源中抽取有意義的特征,例如,從專利文獻(xiàn)中抽取技術(shù)關(guān)鍵詞、專利分類號(hào)、引用信息等特征;從科技論文中抽取標(biāo)題、摘要、關(guān)鍵詞、作者等特征;從基金項(xiàng)目中抽取項(xiàng)目名稱、研究目標(biāo)、資助機(jī)構(gòu)等特征。然后,采用加權(quán)平均、特征連接、特征相似度匹配等方法將不同數(shù)據(jù)源中抽取的特征進(jìn)行融合,建立全面、多元的數(shù)據(jù)體系,在此基礎(chǔ)上建立不同數(shù)據(jù)源間的相關(guān)信息的鏈接關(guān)系。最后,利用數(shù)據(jù)挖掘方法從融合后的數(shù)據(jù)體系中識(shí)別關(guān)鍵核心技術(shù),提高識(shí)別結(jié)果的精度、廣度和深度,從而為技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展提供更科學(xué)的決策依據(jù)。
c.利用人工智能技術(shù)提高識(shí)別方法的自動(dòng)化程度。近期人工智能技術(shù)的最新進(jìn)展主要得益于大規(guī)模數(shù)據(jù)集和類ChatGPT等生成式語言模型的使用。人工智能技術(shù)的發(fā)展為關(guān)鍵核心技術(shù)識(shí)別過程的智能化和自動(dòng)化提供了技術(shù)支撐。針對(duì)現(xiàn)有研究中存在的關(guān)鍵核心技術(shù)識(shí)別方法自動(dòng)化程度低的不足,未來研究可以考慮建立不同技術(shù)領(lǐng)域大規(guī)模、高質(zhì)量的訓(xùn)練數(shù)據(jù)集,涵蓋專利文獻(xiàn)、科技論文、基金項(xiàng)目、科技報(bào)告等多源數(shù)據(jù),同時(shí)使用數(shù)據(jù)增強(qiáng)技術(shù)增加數(shù)據(jù)的多樣性。其次,在大規(guī)模數(shù)據(jù)集的基礎(chǔ)上訓(xùn)練類ChatGPT等生成式語言模型,學(xué)習(xí)豐富的語義和知識(shí)。同時(shí),利用大型語言模型的In Context Learning能力,捕捉上下文之間的關(guān)系,結(jié)合Prompt工程通過對(duì)話的方式,提升自動(dòng)化識(shí)別的靈活性和適應(yīng)性,使得模型能夠根據(jù)具體的需求進(jìn)行定制化的技術(shù)識(shí)別,提高關(guān)鍵核心技術(shù)識(shí)別的效率,降低人工參與的程度,縮短識(shí)別周期。
d.進(jìn)一步細(xì)化關(guān)鍵核心技術(shù)的識(shí)別粒度。針對(duì)現(xiàn)有研究中存在的關(guān)鍵核心技術(shù)識(shí)別結(jié)果粒度較粗的問題,未來需要細(xì)化關(guān)鍵核心技術(shù)識(shí)別的粒度,采用更先進(jìn)的自然語言處理技術(shù),例如預(yù)訓(xùn)練語言模型BERT、GPT等,在大規(guī)模文本語料上進(jìn)行訓(xùn)練,更準(zhǔn)確地理解關(guān)鍵詞或主題詞之間的語義關(guān)系。單純依靠詞匯本身的含義可能導(dǎo)致識(shí)別結(jié)果的準(zhǔn)確性較低,因此,在進(jìn)行關(guān)鍵核心技術(shù)識(shí)別時(shí),應(yīng)該將關(guān)鍵詞與其周圍上下文進(jìn)行綜合考慮。例如,采用上下文感知的詞嵌入技術(shù)或者上下文注意力機(jī)制,更好地理解關(guān)鍵詞或主題詞在特定語境中的含義。同時(shí),引入語義關(guān)聯(lián)度度量方法,加強(qiáng)關(guān)鍵詞或主題詞在語義層面的關(guān)聯(lián),提高識(shí)別結(jié)果的粒度和解釋性,使識(shí)別結(jié)果更具有實(shí)際應(yīng)用價(jià)值,為技術(shù)創(chuàng)新和戰(zhàn)略決策提供更加準(zhǔn)確、全面的決策支撐和信息參考。