• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作伙伴識(shí)別方法研究綜述

      2023-10-07 12:09:58趙展一鐘永恒
      現(xiàn)代情報(bào) 2023年10期
      關(guān)鍵詞:相似性關(guān)聯(lián)語義

      趙展一 鐘永恒 王 輝 劉 佳

      (1.中國(guó)科學(xué)院武漢文獻(xiàn)情報(bào)中心,湖北 武漢 430071;2.中國(guó)科學(xué)院大學(xué)經(jīng)濟(jì)管理學(xué)院信息資源管理系,北京 100190;3.科技大數(shù)據(jù)湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430071)

      研發(fā)合作(R&D Cooperation),是指多個(gè)創(chuàng)新主體通過共享獨(dú)有技術(shù)來加速創(chuàng)新過程所采取的聯(lián)合行動(dòng),常用于產(chǎn)業(yè)界[1]。企業(yè)研發(fā)合作則是指企業(yè)作為需求主體,與同行、上下游供應(yīng)商、科研院校、客戶等主體共同研究與開發(fā)新技術(shù)、新產(chǎn)品的行動(dòng),其本質(zhì)是一種共同的知識(shí)創(chuàng)造過程。目前,技術(shù)創(chuàng)新過程越來越復(fù)雜,研發(fā)難度大,學(xué)科交叉性強(qiáng),產(chǎn)品更新快,風(fēng)險(xiǎn)和不確定性高,為降低研發(fā)風(fēng)險(xiǎn),增強(qiáng)競(jìng)爭(zhēng)優(yōu)勢(shì),企業(yè)已將研發(fā)合作視為生存發(fā)展與技術(shù)創(chuàng)新的重要手段之一。

      現(xiàn)有研究對(duì)研發(fā)合作的影響因素及其之間的關(guān)系進(jìn)行了探索,發(fā)現(xiàn)創(chuàng)新主體之間的戰(zhàn)略契合程度、需求匹配程度、合作偏好程度、信任水平程度以及政府支持力度、中介代理水平等[2-5]外部因素均會(huì)對(duì)研發(fā)合作產(chǎn)生影響,為了解研發(fā)合作行為的機(jī)理奠定了基礎(chǔ)。關(guān)于研發(fā)合作伙伴的評(píng)價(jià)指標(biāo)體系也不斷完善,在候選合作伙伴已知的情況下,通常從研發(fā)能力、市場(chǎng)能力、合作能力等維度考慮選擇最佳合作伙伴[6]。但如何在候選合作伙伴未知的情況下,從眾多創(chuàng)新主體中識(shí)別具有合作潛力的伙伴,預(yù)先掌握合作伙伴情況,降低研發(fā)合作風(fēng)險(xiǎn),仍是研究難點(diǎn)。

      梳理文獻(xiàn)發(fā)現(xiàn),潛在研發(fā)合作識(shí)別方法主要包括兩類:基于實(shí)體鏈接關(guān)系的方法和基于技術(shù)關(guān)聯(lián)關(guān)系的方法。基于實(shí)體鏈接關(guān)系的方法,是指以實(shí)體之間已經(jīng)真實(shí)存在的鏈接為依據(jù),如專利合作申請(qǐng)關(guān)系、專利轉(zhuǎn)讓許可關(guān)系等,利用復(fù)雜網(wǎng)絡(luò)、鏈路預(yù)測(cè)、深度學(xué)習(xí)等方法推斷實(shí)體之間未來進(jìn)行研發(fā)合作的概率。這類方法考慮了實(shí)體之間的合作偏好程度,但受限于現(xiàn)有網(wǎng)絡(luò),無法擴(kuò)展到新增節(jié)點(diǎn)去發(fā)現(xiàn)新的合作關(guān)系,也未深入到技術(shù)內(nèi)容層面去分析實(shí)體之間合作的合理性,不夠有說服力?;诩夹g(shù)關(guān)聯(lián)關(guān)系的方法,是指實(shí)體擁有的技術(shù)存在某種關(guān)聯(lián)關(guān)系,如共同關(guān)注某一個(gè)技術(shù)領(lǐng)域、擁有同一技術(shù)問題的不同解決方案等,依據(jù)這種內(nèi)在的技術(shù)關(guān)聯(lián)關(guān)系去識(shí)別潛在合作伙伴。這類方法考慮了研發(fā)合作的本質(zhì)動(dòng)因,即創(chuàng)新主體希望獲取異質(zhì)技術(shù)知識(shí)來提高自身競(jìng)爭(zhēng)力,只有在分析技術(shù)知識(shí)的基礎(chǔ)上去識(shí)別研發(fā)合作伙伴,得出的結(jié)果才是科學(xué)可靠的。因此,有必要系統(tǒng)梳理基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作伙伴識(shí)別方法,了解現(xiàn)有方法和識(shí)別效果,揭示其中存在的問題,總結(jié)未來的發(fā)展方向,為完善面向企業(yè)研發(fā)潛在合作伙伴識(shí)別的情報(bào)分析方法體系提供借鑒,助力企業(yè)尋找對(duì)口伙伴,制定合作戰(zhàn)略,提升研發(fā)效率。

      1 技術(shù)關(guān)聯(lián)關(guān)系

      技術(shù)是為實(shí)現(xiàn)某一特定目標(biāo)所采用的特定方法,是制造某種產(chǎn)品所需要的系統(tǒng)知識(shí)、工藝或服務(wù)[7],因具有系統(tǒng)性和隱含性的特征,技術(shù)以縱向或橫向的方式不斷擴(kuò)散、交融,并重新組合為新的技術(shù),形成龐大的技術(shù)關(guān)聯(lián)網(wǎng)絡(luò)。通常,某一項(xiàng)技術(shù)發(fā)生變化時(shí),也會(huì)引起與之關(guān)聯(lián)的多項(xiàng)技術(shù)的變化,如智能手機(jī)技術(shù)直接影響了通信、傳媒、教育等技術(shù),還催生了電子商務(wù)等新技術(shù)。由此可見,技術(shù)不是孤立的,而是存在著復(fù)雜的關(guān)聯(lián)關(guān)系,深入分析創(chuàng)新主體之間的技術(shù)關(guān)聯(lián)關(guān)系有利于細(xì)粒度地、準(zhǔn)確地分析其合作潛力與合作方向。

      技術(shù)關(guān)聯(lián)關(guān)系的定義與類型尚未統(tǒng)一。黃斌等[8]依據(jù)專利是否共類將技術(shù)關(guān)聯(lián)劃分為直接關(guān)聯(lián)和間接關(guān)聯(lián)。馮秀珍等[9]依據(jù)技術(shù)是否具有共同用途將技術(shù)關(guān)聯(lián)劃分為直接關(guān)聯(lián)、間接關(guān)聯(lián)、關(guān)鍵關(guān)聯(lián),并提出技術(shù)關(guān)聯(lián)鏈、環(huán)、網(wǎng)、群、子群等概念。Vaez-Alaeim M等[10]將企業(yè)間的技術(shù)關(guān)聯(lián)關(guān)系劃分為相似性技術(shù)、互補(bǔ)性技術(shù)、無關(guān)性技術(shù)。徐珍珍等[11]依據(jù)研究問題與技術(shù)方案的對(duì)應(yīng)關(guān)系將技術(shù)關(guān)聯(lián)劃分為直接競(jìng)爭(zhēng)關(guān)系、間接競(jìng)爭(zhēng)關(guān)系、合作關(guān)系、包含關(guān)系,并提出了基于問題—技術(shù)矩陣的技術(shù)關(guān)聯(lián)自動(dòng)發(fā)現(xiàn)方法。王莎莎等[12]將技術(shù)關(guān)聯(lián)關(guān)系劃分為基于技術(shù)知識(shí)結(jié)構(gòu)與內(nèi)容的等價(jià)性關(guān)聯(lián)關(guān)系和基于技術(shù)知識(shí)溢出與流動(dòng)情況的非等價(jià)性技術(shù)關(guān)聯(lián)關(guān)系?,F(xiàn)有研究對(duì)技術(shù)關(guān)聯(lián)關(guān)系的分類大多較為粗糙,僅劃分為強(qiáng)、弱或直接、間接,少有研究關(guān)注技術(shù)關(guān)聯(lián)關(guān)系的具體類型。

      楊冬敏[13]比較全面地考慮了時(shí)間、空間等因素的影響,從技術(shù)沿革、技術(shù)應(yīng)用、技術(shù)體系結(jié)構(gòu)、技術(shù)知識(shí)單元4個(gè)維度將技術(shù)關(guān)聯(lián)關(guān)系細(xì)分為取代、發(fā)展、完善、補(bǔ)充、競(jìng)爭(zhēng)、互補(bǔ)、包含、平行、交叉、繼承、兄弟、交融關(guān)系。借鑒該分類方式,并結(jié)合技術(shù)關(guān)聯(lián)關(guān)系在企業(yè)研發(fā)潛在合作伙伴識(shí)別領(lǐng)域的應(yīng)用,本文將技術(shù)關(guān)聯(lián)關(guān)系劃分為技術(shù)承繼、共現(xiàn)、結(jié)構(gòu)、應(yīng)用關(guān)系以及復(fù)合技術(shù)關(guān)系。

      如圖1所示,技術(shù)承繼關(guān)系,是指隨著時(shí)間推移技術(shù)之間相互借鑒、創(chuàng)新、完善、融合的關(guān)系,T1、T2、T3、T4、T5、T6為典型的承繼關(guān)系;技術(shù)共現(xiàn)關(guān)系,是指技術(shù)之間共同出現(xiàn)或通過第三方共現(xiàn)的關(guān)系,T1與T9、T10為直接共現(xiàn)關(guān)系,T1與T11通過T10形成間接共現(xiàn)關(guān)系;技術(shù)結(jié)構(gòu)關(guān)系,是指從技術(shù)體系結(jié)構(gòu)和知識(shí)單元的角度理解技術(shù)關(guān)聯(lián)關(guān)系,技術(shù)體系結(jié)構(gòu)是指根技術(shù)與其分支技術(shù)構(gòu)成的技術(shù)系統(tǒng),具有層次性、整體性,t1、t2為T6的分支技術(shù),屬于同一技術(shù)體系結(jié)構(gòu)。技術(shù)知識(shí)單元是指某一技術(shù)及其同級(jí)技術(shù)構(gòu)建的技術(shù)模塊,具有并行性、協(xié)同性,T6、T7、T8為并列技術(shù),t1、t2也為并列技術(shù),屬于同一技術(shù)知識(shí)單元,技術(shù)知識(shí)單元是技術(shù)體系結(jié)構(gòu)的一部分;技術(shù)應(yīng)用關(guān)系,是指依據(jù)是否用于解決同一問題將技術(shù)關(guān)聯(lián)關(guān)系劃分為直接競(jìng)爭(zhēng)關(guān)系、合作關(guān)系、間接競(jìng)爭(zhēng)關(guān)系,T2、T3可用于解決Q1,形成直接競(jìng)爭(zhēng)關(guān)系,T3、T4可分別用于解決Q2、Q3,也可通過組合用于解決Q4,形成合作關(guān)系,相互補(bǔ)充,還可與T5組合用于解決Q4,此時(shí)T3、T4與T5形成間接競(jìng)爭(zhēng)關(guān)系?,F(xiàn)實(shí)中的技術(shù)關(guān)聯(lián)關(guān)系往往是多維且復(fù)雜的,本文將涉及兩種及兩種以上類型的技術(shù)關(guān)聯(lián)關(guān)系定義為復(fù)合技術(shù)關(guān)系。

      圖1 技術(shù)關(guān)聯(lián)關(guān)系的類型

      2 基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作伙伴識(shí)別方法

      為全面把握基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在競(jìng)合目標(biāo)識(shí)別方法及其效果,檢索并梳理國(guó)際國(guó)內(nèi)相關(guān)研究進(jìn)展。國(guó)內(nèi)研究以“CNKI”為數(shù)據(jù)源,以“R&D合作”“研發(fā)合作”“產(chǎn)學(xué)研合作”“合作識(shí)別”“伙伴選擇”“技術(shù)關(guān)系”“技術(shù)關(guān)聯(lián)”為主題詞進(jìn)行檢索,國(guó)際研究以“Google Scholar”為數(shù)據(jù)源,以“R&D Cooperation”“R&D Partner”“Technology Cooperation”“University and Industrial Cooperation”“Cooperation Identification”“Cooperation Selection”“Technology Relation”“Technology Association”為主題詞進(jìn)行檢索,篩選出136篇重點(diǎn)文獻(xiàn)。基于此,將企業(yè)研發(fā)潛在合作伙伴識(shí)別方法按照基于技術(shù)承繼、共現(xiàn)、結(jié)構(gòu)、應(yīng)用關(guān)系以及復(fù)合技術(shù)關(guān)系5個(gè)維度來梳理,如圖2所示,歸納各類方法的優(yōu)缺點(diǎn),總結(jié)當(dāng)前研究存在的問題和未來研究方向。

      圖2 基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作伙伴識(shí)別方法分類

      2.1 基于技術(shù)承繼關(guān)系的識(shí)別方法

      作為技術(shù)成果的重要載體,專利文獻(xiàn)已成為技術(shù)情報(bào)的關(guān)鍵來源,專利引用本身就體現(xiàn)了技術(shù)流動(dòng)和演進(jìn)的過程,現(xiàn)有研究基于技術(shù)承繼關(guān)系的識(shí)別方法主要通過專利引用分析實(shí)現(xiàn)。

      專利引用是申請(qǐng)人和審查員共同的行為,包括直引、共引和共被引。直引是指多件專利直接相互引用的關(guān)系,通常與分類號(hào)、關(guān)鍵詞等信息結(jié)合使用,如表1所示。例如,李睿等[14]建立兩國(guó)專利權(quán)人的直引關(guān)系,通過關(guān)聯(lián)強(qiáng)度篩選候選合作組對(duì),再通過引用跨越度分析競(jìng)合技術(shù)。共引和共被引分析應(yīng)用較多,分別指多件專利引用同一件專利或被同一件專利引用,通常認(rèn)為共引或共被引次數(shù)越多,技術(shù)關(guān)聯(lián)越強(qiáng),研發(fā)合作概率越大。例如,李睿等[15]基于專利共引關(guān)系建立兩國(guó)專利權(quán)人—技術(shù)領(lǐng)域二模網(wǎng)絡(luò),通過不同技術(shù)領(lǐng)域之間的專利共引強(qiáng)度定位兩國(guó)共同關(guān)注的技術(shù)領(lǐng)域,揭示國(guó)家(地區(qū))間的研發(fā)合作機(jī)會(huì)。許海云等[16]以論文—專利的共引與共被引關(guān)系表示科學(xué)—技術(shù)的關(guān)聯(lián)關(guān)系,根據(jù)被專利引用的論文比例、被論文引用的專利比例確定科學(xué)—技術(shù)關(guān)聯(lián)特征,提出了不同關(guān)聯(lián)特征下的新興主題產(chǎn)學(xué)研合作模式,完善了產(chǎn)學(xué)研合作識(shí)別的方法體系。

      表1 引用分析方法對(duì)比

      引用關(guān)系可以反映雙方是否具有共同關(guān)注的技術(shù)領(lǐng)域,并且具有成熟的理論、方法和工具支持,但其局限性在于:①動(dòng)機(jī)不明,無法區(qū)分積極引用和消極引用;②具有時(shí)滯性,無法反映最新文獻(xiàn)的引用關(guān)系;③未深入技術(shù)文本層面,無法進(jìn)一步揭示合作潛力。

      2.2 基于技術(shù)共現(xiàn)關(guān)系的識(shí)別方法

      基于技術(shù)共現(xiàn)關(guān)系的方法是指通過分析技術(shù)特征項(xiàng)共同出現(xiàn)的現(xiàn)象揭示創(chuàng)新主體之間的關(guān)聯(lián),包括共類分析、共詞分析等,如表2所示。專利分類號(hào)能夠體現(xiàn)技術(shù)的應(yīng)用領(lǐng)域和主要功能,易獲取和量化,應(yīng)用最多,例如,溫芳芳[17]通過專利權(quán)人的共類數(shù)量、共類頻次分析企業(yè)潛在合作關(guān)系,認(rèn)為共類數(shù)量越多,共類頻次越高,專利權(quán)人技術(shù)相似性越強(qiáng),合作潛力越大。專利文獻(xiàn)沒有關(guān)鍵詞,現(xiàn)有研究通過TF-IDF等方法抽取特征詞作為共詞分析的依據(jù),以進(jìn)一步分析機(jī)構(gòu)之間的合作方向。例如,Li S等[18]基于機(jī)構(gòu)共同分類、引用耦合、主題共現(xiàn)關(guān)系建立機(jī)構(gòu)相似性矩陣,識(shí)別核心專利組合和技術(shù)轉(zhuǎn)讓合作伙伴?;诙嘀毓铂F(xiàn)關(guān)系的綜合分析結(jié)果更加可靠,例如,F(xiàn)ritsch M等[19]建立基于合作項(xiàng)目、專利、論文的多模異構(gòu)網(wǎng)絡(luò),發(fā)現(xiàn)結(jié)合3種數(shù)據(jù)捕獲的合作關(guān)系更全面。

      表2 共現(xiàn)分析方法對(duì)比

      共現(xiàn)分析通過技術(shù)特征項(xiàng)的共現(xiàn)現(xiàn)象揭示隱含的技術(shù)關(guān)聯(lián),可以為識(shí)別潛在合作提供參考。但其局限性在于:①共現(xiàn)分析無法提供潛在合作概率;②共類分析、共詞分析都無法深入地揭示文本語義關(guān)系;③共現(xiàn)分析大多通過共現(xiàn)數(shù)量、共現(xiàn)頻次體現(xiàn)合作潛力,信息量較少。

      2.3 基于技術(shù)結(jié)構(gòu)關(guān)系的識(shí)別方法

      基于技術(shù)結(jié)構(gòu)關(guān)系的識(shí)別方法是指從技術(shù)文本中抽取符合規(guī)則的語義特征,形成技術(shù)體系結(jié)構(gòu)或知識(shí)單元,通常以技術(shù)樹或知識(shí)圖譜的方式呈現(xiàn),如表3所示。

      表3 語義特征抽取分析方法對(duì)比

      技術(shù)樹是指用于表示某一技術(shù)領(lǐng)域中技術(shù)特征及其關(guān)系的樹形結(jié)構(gòu)圖,包含技術(shù)、功能、產(chǎn)品等要素,可以輔助決策者梳理技術(shù)體系,把握技術(shù)架構(gòu)和創(chuàng)新主體在技術(shù)發(fā)展過程中的位置,選擇相匹配的合作目標(biāo)。例如,翟東升等[20]對(duì)專利文獻(xiàn)的標(biāo)題、摘要進(jìn)行切分和標(biāo)注,抽取功能、功能效果、科學(xué)效應(yīng)等語義特征,通過合并同義概念確定樹的基礎(chǔ)模塊,通過語義特征的共現(xiàn)關(guān)系實(shí)現(xiàn)概念之間的聯(lián)接,構(gòu)建技術(shù)樹,與企業(yè)提供的結(jié)構(gòu)化需求文檔進(jìn)行匹配,篩選能夠滿足企業(yè)需求的專利權(quán)人。伊惠芳等[21]爬取公開信息中的需求文檔,并將技術(shù)需求劃分為廣泛、單一、綜合性3類,采用百度語義工具和Python語言技術(shù)從技術(shù)需求文檔和高校專利文獻(xiàn)中抽取技術(shù)領(lǐng)域、功能、功效和技術(shù)方案,通過LDA模型聚類,實(shí)現(xiàn)各項(xiàng)語義特征之間的聯(lián)接,建立高校專利技術(shù)樹,與不同類型的技術(shù)需求進(jìn)行模糊、特定、多目標(biāo)匹配,再根據(jù)需求的滿足程度、技術(shù)的有用性確定高校專利轉(zhuǎn)移目標(biāo)。

      知識(shí)圖譜可以完整規(guī)范地描述實(shí)體及其屬性之間的關(guān)系,幫助實(shí)現(xiàn)實(shí)體關(guān)聯(lián)和語義推理,有利于理解技術(shù)主體之間的關(guān)聯(lián)關(guān)系。例如,李家全等[22]利用新能源汽車領(lǐng)域的術(shù)語層次關(guān)系構(gòu)建了知識(shí)圖譜,根據(jù)兩個(gè)術(shù)語的類型、出現(xiàn)頻次以及在知識(shí)圖譜中的層次深度計(jì)算實(shí)體概念相似度,根據(jù)兩個(gè)術(shù)語的類型、最短距離計(jì)算實(shí)體距離相似度,利用Word2Vec、Bert模型計(jì)算實(shí)體語義相似度,利用TextRank提取術(shù)語屬性句子中的關(guān)鍵詞計(jì)算實(shí)體屬性相似度,對(duì)上述指標(biāo)進(jìn)行綜合賦權(quán)得到實(shí)體相似度,可用于識(shí)別相似實(shí)體。Deng W等[23]繪制專利、企業(yè)、行業(yè)的知識(shí)圖譜,將從專利標(biāo)題和摘要中提取的關(guān)鍵詞及其共現(xiàn)關(guān)系作為圖的邊權(quán)重,再通過融合共同節(jié)點(diǎn)、邊權(quán)重、總權(quán)重的圖編輯距離度量不同圖的相似性,為企業(yè)匹配相似策略、互補(bǔ)策略、混合策略下的專利轉(zhuǎn)讓目標(biāo),該方法已成功應(yīng)用于江西省技術(shù)交易平臺(tái)。

      抽取語義特征并進(jìn)行匹配分析的方法可以更精準(zhǔn)地捕獲文本的語義信息,展示技術(shù)結(jié)構(gòu)關(guān)系,匹配合作需求。但其局限性在于:①技術(shù)樹或知識(shí)圖譜的構(gòu)建過程復(fù)雜,人工成本較高,不適合應(yīng)用于大規(guī)模數(shù)據(jù)集;②通常需要人工標(biāo)注,標(biāo)注的準(zhǔn)確性與統(tǒng)一性有待考量;③方法不具有通用性,難以重復(fù)。

      2.4 基于技術(shù)應(yīng)用關(guān)系的識(shí)別方法

      基于技術(shù)應(yīng)用關(guān)系的識(shí)別方法是指從是否用于解決同一問題的角度分析技術(shù)的競(jìng)合性質(zhì),據(jù)此識(shí)別競(jìng)爭(zhēng)對(duì)手或合作伙伴。競(jìng)爭(zhēng)性技術(shù)是指可用于解決同一問題的技術(shù),具有相似性和取代性,如通信領(lǐng)域的3G與5G技術(shù)、低碳領(lǐng)域的藍(lán)氫與綠氫技術(shù);合作性技術(shù)是指可通過組合用于解決同一問題的技術(shù),具有互補(bǔ)性和協(xié)同性,如汽車領(lǐng)域的車窗制造與車門制造技術(shù)、3D打印領(lǐng)域的打印機(jī)噴頭與打印材料。目前,相似性技術(shù)的識(shí)別方法更加成熟,語義相似性分析可以細(xì)粒度地從文本語義的層面揭示技術(shù)的相似性,在潛在合作識(shí)別領(lǐng)域應(yīng)用較為廣泛,主要包括文本聚類分析、依存句法分析、基于預(yù)測(cè)的詞嵌入分析等,如表4所示。

      表4 語義相似性分析方法對(duì)比

      文本聚類分析是指通過聚類算法從同一類簇中識(shí)別潛在合作,主題模型是一種典型的聚類方法,先從技術(shù)文本中識(shí)別技術(shù)主題,再根據(jù)相似主題識(shí)別合作潛力大的創(chuàng)新主體。例如,Kang J等[24]運(yùn)用LDA模型識(shí)別特定領(lǐng)域的子技術(shù)主題,再通過K-means聚類算法確定子技術(shù)集群,從子技術(shù)集群中根據(jù)相似專利密度確定技術(shù)轉(zhuǎn)移伙伴,考慮了企業(yè)的多元化研發(fā)方向。類似地,崔晶等[25]利用關(guān)聯(lián)規(guī)則分析目標(biāo)企業(yè)的技術(shù)同心多元化領(lǐng)域,再通過LDA模型將創(chuàng)新主體劃分到不同的技術(shù)主題,根據(jù)專業(yè)能力和合作能力為企業(yè)推薦不同技術(shù)主題的研發(fā)合作伙伴。周洪等[26]采用t-SNE主題模型對(duì)專利中的新穎性和用途部分聚類,建立基于技術(shù)—應(yīng)用主題的二維分析框架,結(jié)合目標(biāo)企業(yè)的技術(shù)布局,與其他創(chuàng)新主體的技術(shù)相似性、應(yīng)用相似性識(shí)別潛在競(jìng)爭(zhēng)對(duì)手。Qi Y等[27]利用LDA模型識(shí)別論文與專利的主題,基于論文與專利的主題相似度確定可以合作的技術(shù)主題,根據(jù)創(chuàng)新能力與開放程度對(duì)相關(guān)主體進(jìn)行排序,確定是否有合作的潛力,再建立這些主體基于主題的合作網(wǎng)絡(luò),進(jìn)行鏈路預(yù)測(cè),識(shí)別潛在合作機(jī)構(gòu)與合作方向。武川等[28]通過LDA-Gibbs Sampling模型識(shí)別專利文本的主題,建立專利權(quán)人合作網(wǎng)絡(luò)和主題相似網(wǎng)絡(luò),認(rèn)為網(wǎng)絡(luò)的平均加權(quán)度越高,專利主題相似性越高,合作潛力越大。

      依存句法分析是指通過提取分析主謂賓等語義要素及其關(guān)聯(lián)關(guān)系識(shí)別潛在合作。例如,汪雪鋒等[29]通過SAO方法識(shí)別染敏太陽能電池領(lǐng)域的研發(fā)合作組對(duì),通過Stanford Parser軟件提取專利文本的SAO結(jié)構(gòu),篩選、歸類后繪制基于時(shí)間序列的“材料—技術(shù)與組件—目標(biāo)”SAO結(jié)構(gòu)圖,挖掘具有相似研發(fā)目標(biāo)的機(jī)構(gòu)。Li R等[30]抽取專利標(biāo)題和摘要中的SAO語義結(jié)構(gòu),利用專業(yè)醫(yī)學(xué)術(shù)語系統(tǒng)識(shí)別與目標(biāo)技術(shù)相關(guān)的SAO語義結(jié)構(gòu),判斷SAO語義結(jié)構(gòu)之間的相似性,評(píng)價(jià)專利權(quán)人的技術(shù)相似性,再通過TF-IDF獲取關(guān)鍵詞重要性作為SAO語義結(jié)構(gòu)的特征權(quán)重,構(gòu)建專利權(quán)人向量,評(píng)價(jià)專利權(quán)人的技術(shù)互補(bǔ)性,為識(shí)別R&D合作提供更精準(zhǔn)的參考。Li X等[31]運(yùn)用SAO語義結(jié)構(gòu)分析抽取論文中的技術(shù)問題和專利中的解決方案,計(jì)算相似度,進(jìn)行聚類,分析每個(gè)聚類主題下問題與方案的差異,并將論文中檢測(cè)出的離群點(diǎn)納入技術(shù)機(jī)會(huì)的識(shí)別范圍,再結(jié)合專家知識(shí)確定合作技術(shù)機(jī)會(huì)。

      詞嵌入是將詞語映射為向量的自然語言處理技術(shù),基于預(yù)測(cè)的嵌入可以較好地解決數(shù)據(jù)稀疏、詞表膨脹等問題,分辨語義細(xì)節(jié),極大地優(yōu)化了文本表示效果,如Word2Vec、Doc2Vec等,在衡量技術(shù)相似性方面得到廣泛應(yīng)用。例如,向姝璇等[32]以Jaccard算法計(jì)算IPC組合相似度定義功能相似性、以Doc2Vec計(jì)算獨(dú)立權(quán)利要求相似度定義技術(shù)相似性,構(gòu)建基于功能—技術(shù)的專利整體相似網(wǎng)絡(luò),分析主題簇下的競(jìng)爭(zhēng)組合。Lee C等[33]基于美國(guó)專利商標(biāo)局?jǐn)?shù)據(jù)庫提取3D打印領(lǐng)域?qū)@c產(chǎn)品的對(duì)應(yīng)關(guān)系,運(yùn)用Word2Vec識(shí)別具有相似技術(shù)的產(chǎn)品,識(shí)別目標(biāo)產(chǎn)品的技術(shù)機(jī)會(huì),再從技術(shù)、企業(yè)維度對(duì)其價(jià)值進(jìn)行評(píng)價(jià),為識(shí)別潛在技術(shù)機(jī)會(huì)和合作伙伴提供參考。李冰等[34]建立企業(yè)引用專利的二分網(wǎng)絡(luò),采用Sim Rank算法預(yù)測(cè)潛在競(jìng)合對(duì)象、Text2Vec算法對(duì)其專利進(jìn)行向量化表示,計(jì)算專利相似度,衡量技術(shù)的差異性,確定競(jìng)合目標(biāo)?;陬A(yù)測(cè)的嵌入可以很好地表示詞向量、句子向量,但對(duì)整篇文檔向量的表示通常采用加權(quán)平均的方式獲取,比較粗糙。以2018年Google AI研究所提出的BERT模型為標(biāo)志,基于預(yù)訓(xùn)練的嵌入開始受到關(guān)注,一些改進(jìn)的模型如ALBERT、RoBERTa等也取得了比較好的效果,但這類模型在技術(shù)關(guān)聯(lián)關(guān)系分析和潛在合作識(shí)別領(lǐng)域還未得到廣泛應(yīng)用。

      語義相似性分析方法可以對(duì)大規(guī)模文本進(jìn)行處理,深入分析文本語義特征,判斷創(chuàng)新主體之間的技術(shù)關(guān)系,匹配特定需求,提高識(shí)別結(jié)果的可靠性。但其局限性在于:①聚類分析易生成高維稀疏向量,需要進(jìn)行降維處理;②依存句法分析需要高質(zhì)量的人工標(biāo)注,成本較高,不太適用于大規(guī)模數(shù)據(jù);③詞嵌入分析對(duì)整篇文檔以及機(jī)構(gòu)之間多篇文檔語義特征的處理方式較為粗糙,有待完善;④大多數(shù)研究認(rèn)為,相似即具有合作潛力,但相似性技術(shù)更趨于競(jìng)爭(zhēng)性質(zhì),忽略了企業(yè)研發(fā)合作的內(nèi)在動(dòng)因。

      相較來看,互補(bǔ)性技術(shù)的識(shí)別難度更大,如表5所示,主要基于分類號(hào)[35]、技術(shù)空白點(diǎn)[36]、產(chǎn)業(yè)鏈或創(chuàng)新鏈分析[37-38]以及指標(biāo)評(píng)價(jià)[39]方法確定,也有研究深入文本語義層面嘗試測(cè)算企業(yè)之間的技術(shù)互補(bǔ)性,例如,Wang X等[40]采用HLDA模型識(shí)別3D打印領(lǐng)域的技術(shù)主題,建立主題層次樹,發(fā)現(xiàn)主題之間的關(guān)聯(lián)關(guān)系,再通過企業(yè)之間的主題補(bǔ)集數(shù)量衡量技術(shù)互補(bǔ)性。技術(shù)互補(bǔ)性的量化方法亟待完善。

      表5 技術(shù)互補(bǔ)性分析方法對(duì)比

      識(shí)別互補(bǔ)型合作伙伴可以為企業(yè)填補(bǔ)技術(shù)空白,尋找技術(shù)機(jī)會(huì)提供參考,往往比相似型合作伙伴更能產(chǎn)生重大創(chuàng)新。現(xiàn)有研究的局限性在于:①大多數(shù)研究認(rèn)為“空白”即互補(bǔ),可以進(jìn)行研發(fā)合作,較少對(duì)雙方技術(shù)的用途進(jìn)行細(xì)致區(qū)分,結(jié)果的可靠性有待考量;②定量方法主要基于專利類別實(shí)現(xiàn),未深入技術(shù)文本語義層面;③技術(shù)互補(bǔ)性的判斷仍以定性方法為主,實(shí)施過程復(fù)雜且受主觀影響較大。

      2.5 基于復(fù)合技術(shù)關(guān)系的識(shí)別方法

      為了彌補(bǔ)基于單一關(guān)系的識(shí)別方法的不足,優(yōu)化識(shí)別效果,已有研究綜合利用多種技術(shù)關(guān)系分析技術(shù)關(guān)聯(lián)情況,識(shí)別潛在研發(fā)合作,如表6所示。例如,傅俊英等[41]構(gòu)建基于專利共引、共被引關(guān)系和文本相似關(guān)系3種元路徑和包括專利權(quán)人、發(fā)明人、IPC分類號(hào)、專利所屬國(guó)家等信息的異構(gòu)網(wǎng)絡(luò),運(yùn)用PathSelClus算法進(jìn)行聚類,認(rèn)為同一聚簇中的機(jī)構(gòu)與聚類種子存在技術(shù)相似性,識(shí)別中小企業(yè)的潛在合作伙伴。吳菲菲等[42]從網(wǎng)絡(luò)信息獲取領(lǐng)域市場(chǎng)需求,采用LDA模型識(shí)別需求主題,再結(jié)合領(lǐng)域?qū)@湍繕?biāo)企業(yè)專利確定目標(biāo)企業(yè)的研發(fā)需求,查閱科技文獻(xiàn)獲取解決方案,進(jìn)行檢索,得到與目標(biāo)企業(yè)產(chǎn)業(yè)類別不同的候選合作伙伴,從技術(shù)能力、合作能力、市場(chǎng)能力3個(gè)方面進(jìn)行評(píng)價(jià),確定最佳合作伙伴。劉小玲等[43]分別構(gòu)建專利共同分類強(qiáng)度向量、共同引文強(qiáng)度向量、專利標(biāo)題和摘要文本向量,各向量首尾相連,進(jìn)而得到多屬性融合的專利相似度,優(yōu)于僅考慮單個(gè)屬性的結(jié)果,可以為判斷技術(shù)相似度提供參考。

      表6 多方法綜合分析對(duì)比

      利用復(fù)雜網(wǎng)絡(luò)可以將引用、共現(xiàn)、語義等復(fù)雜關(guān)系刻畫為拓?fù)浣Y(jié)構(gòu),形成異構(gòu)網(wǎng)絡(luò)、加權(quán)網(wǎng)絡(luò)、有向網(wǎng)絡(luò)、多分網(wǎng)絡(luò)、多層網(wǎng)絡(luò),結(jié)合使用鏈路預(yù)測(cè)、深度學(xué)習(xí)等技術(shù),利用網(wǎng)絡(luò)性質(zhì)和多類節(jié)點(diǎn)的屬性、關(guān)系識(shí)別潛在合作。例如,Wang Q等[44]建立融合專利交易關(guān)系、發(fā)明關(guān)系、引用關(guān)系以及本體、文本信息的異構(gòu)網(wǎng)絡(luò),運(yùn)用基于元路徑的相似性測(cè)量方法AvgSim識(shí)別專利轉(zhuǎn)讓目標(biāo)。何喜軍等[45]從專利和組織維度建立影響專利交易的屬性指標(biāo)體系,構(gòu)建屬性異構(gòu)網(wǎng)絡(luò),設(shè)計(jì)AHNRL-PTR模型進(jìn)行表示學(xué)習(xí),可以為節(jié)點(diǎn)推薦具有相似屬性的專利交易目標(biāo)。此類方法在研發(fā)合作領(lǐng)域應(yīng)用較少,可能與技術(shù)創(chuàng)新主體具有很強(qiáng)的競(jìng)爭(zhēng)性、合作網(wǎng)絡(luò)稀疏、有用信息較少、識(shí)別結(jié)果可用性較差有關(guān)。在科研合作領(lǐng)域應(yīng)用較多,包括融合節(jié)點(diǎn)的共同鄰居、研究?jī)?nèi)容、研究興趣、多模體[46-49]等特征,或在超網(wǎng)絡(luò)的基礎(chǔ)上改進(jìn)傳統(tǒng)的資源分配指標(biāo)[50],識(shí)別潛在科研合作關(guān)系。

      復(fù)合型方法能夠集成多種方法的優(yōu)勢(shì),充分挖掘引用關(guān)系、共現(xiàn)關(guān)系、文本語義、復(fù)雜網(wǎng)絡(luò)中蘊(yùn)含的有用信息,綜合統(tǒng)計(jì)特征和語義特征識(shí)別潛在合作伙伴,效果更好,但此類方法實(shí)施過程較為復(fù)雜,融合多維屬性的難度較大,成熟的實(shí)施流程仍有待探索。

      3 當(dāng)前研究存在的主要問題

      通過對(duì)現(xiàn)有方法的比較,發(fā)現(xiàn)每種方法各有優(yōu)劣,如表7所示,總結(jié)當(dāng)前研究存在的主要問題如下:

      表7 基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作識(shí)別方法對(duì)比

      1)數(shù)據(jù)源和數(shù)據(jù)范圍較為受限。除專利文獻(xiàn)以外,產(chǎn)品、商標(biāo)、標(biāo)準(zhǔn)等文獻(xiàn)以及一些網(wǎng)絡(luò)資源也是技術(shù)信息的重要載體,現(xiàn)有研究大多以專利文獻(xiàn)為數(shù)據(jù)源進(jìn)行技術(shù)關(guān)聯(lián)分析,缺乏對(duì)其他類型文獻(xiàn)的考慮,能夠利用的屬性信息有限。另外,基于合作歷史篩選出的候選合作伙伴,本質(zhì)上沒有從技術(shù)關(guān)聯(lián)視角考慮機(jī)構(gòu)之間的合作潛力,已經(jīng)將一些可能的潛在伙伴剔除在外,無法發(fā)現(xiàn)新增主體和已有鏈路之外的潛在合作關(guān)系,影響識(shí)別效果。

      2)技術(shù)文本的語義分析方法存在較多缺陷?,F(xiàn)有研究通過文本聚類、依存句法分析、知識(shí)圖譜等方法實(shí)現(xiàn)了對(duì)大規(guī)模技術(shù)文本的語義挖掘,相比基于分類號(hào)的方法蘊(yùn)含了更豐富的語義信息,優(yōu)化了識(shí)別效果。但在技術(shù)關(guān)聯(lián)分析領(lǐng)域所用到的語義分析方法仍有很多弊端,例如,基于主題詞的方法易生成高維稀疏向量,無法較好地識(shí)別細(xì)分類目;基于語義特征抽取的方法需要統(tǒng)一的、高質(zhì)量的人工標(biāo)注,成本較高;Word2Vec、Doc2Vec等神經(jīng)網(wǎng)絡(luò)方法受不同語境的影響較大,仍未能較好地解決多義性問題。機(jī)構(gòu)層多篇技術(shù)文本的語義相似性分析方法仍采用單篇文本相似度加權(quán)平均的方式,較為粗糙,容易模糊機(jī)構(gòu)之間的技術(shù)關(guān)聯(lián)特征。技術(shù)互補(bǔ)性的測(cè)算方法仍以定性判讀為主,缺乏成熟的量化方法,區(qū)分互補(bǔ)方向也是一大難點(diǎn)。

      3)技術(shù)關(guān)聯(lián)與合作行為的關(guān)系尚未梳理清晰。技術(shù)關(guān)聯(lián)是企業(yè)進(jìn)行研發(fā)合作的基礎(chǔ),已存在研發(fā)合作關(guān)系的主體必定存在著某種技術(shù)關(guān)聯(lián),現(xiàn)有研究通過獲取技術(shù)相似度、合作偏好等參數(shù)對(duì)潛在合作進(jìn)行定量推斷,取得了較好效果。但缺乏對(duì)技術(shù)關(guān)聯(lián)與合作行為關(guān)系的系統(tǒng)分析,例如,共現(xiàn)關(guān)系具體反映何種技術(shù)關(guān)聯(lián),擁有何種共現(xiàn)關(guān)系的機(jī)構(gòu)合作潛力大;引用關(guān)系受引用動(dòng)機(jī)影響,何種引用特征可以反映機(jī)構(gòu)的合作潛力;技術(shù)相似可能會(huì)使雙方傾向于競(jìng)爭(zhēng)而非合作;同一產(chǎn)業(yè)鏈的機(jī)構(gòu)不一定合作,反而會(huì)在其他產(chǎn)業(yè)鏈尋求伙伴等。技術(shù)關(guān)聯(lián)與合作行為的關(guān)系不清晰,直接影響到合作潛力測(cè)度指標(biāo)的合理性以及識(shí)別結(jié)果的準(zhǔn)確性和可用性。

      4 未來研究方向

      針對(duì)上述問題,提出基于技術(shù)關(guān)聯(lián)關(guān)系的企業(yè)研發(fā)潛在合作識(shí)別方法領(lǐng)域的未來研究方向如下:

      1)納入多源數(shù)據(jù)并保障識(shí)別范圍的完整性。利用專利、產(chǎn)品、商標(biāo)、標(biāo)準(zhǔn)等多種文獻(xiàn)蘊(yùn)含的技術(shù)信息以及企業(yè)等機(jī)構(gòu)網(wǎng)站/專業(yè)數(shù)據(jù)庫的市場(chǎng)經(jīng)營(yíng)信息[51],獲取豐富的屬性參數(shù),有利于全面客觀地判斷技術(shù)關(guān)聯(lián)關(guān)系和研發(fā)合作潛力。以產(chǎn)品為例,產(chǎn)品名稱或功能的高相似性往往被用于識(shí)別競(jìng)爭(zhēng)對(duì)手,而低相似性不被重視,不以相似度的高低簡(jiǎn)單判定競(jìng)合關(guān)系,而應(yīng)該對(duì)相似性進(jìn)行分層、分級(jí)、分情況的討論,面向不同用途的高相似性和面向同一用途的低相似性是有合作可能的。同時(shí),不應(yīng)該囿于機(jī)構(gòu)之間的合作歷史,而是優(yōu)先考慮技術(shù)關(guān)聯(lián)關(guān)系,判斷雙方進(jìn)行研發(fā)合作的技術(shù)匹配程度,例如對(duì)方技術(shù)與企業(yè)現(xiàn)有技術(shù)資源加以組合是否有利于提高企業(yè)技術(shù)創(chuàng)新能力,在此基礎(chǔ)上再考慮合作歷史等因素,判斷合作潛力,提高識(shí)別結(jié)果的科學(xué)性。

      2)完善技術(shù)文本語義分析與計(jì)算的理論方法體系。技術(shù)文本語義分析直接影響技術(shù)關(guān)聯(lián)判斷結(jié)果的準(zhǔn)確性,現(xiàn)有知識(shí)組織方式不斷朝著結(jié)構(gòu)化、標(biāo)準(zhǔn)化的方向發(fā)展,為文本挖掘提供了較好的基礎(chǔ),但仍面臨詞語歧義、情感傾向、復(fù)雜語境等問題,應(yīng)模擬現(xiàn)實(shí)世界的語義分析環(huán)境與習(xí)慣,系統(tǒng)性地完善語義分析、計(jì)算、推理、應(yīng)用方面的理論與方法體系,利用復(fù)雜網(wǎng)絡(luò)、深度學(xué)習(xí)、知識(shí)圖譜、人工智能等技術(shù)從大規(guī)模數(shù)據(jù)中自動(dòng)化、智能化地學(xué)習(xí)有效特征,優(yōu)化文本特征表示效果;在機(jī)構(gòu)技術(shù)文本語義分析方面,可以采用將多個(gè)機(jī)構(gòu)多篇文檔的相似度進(jìn)行分類來代替多個(gè)機(jī)構(gòu)多篇文檔的相似度直接加權(quán)平均的方式,既可以利用現(xiàn)有機(jī)器學(xué)習(xí)多分類的成熟方法,也可以更大程度地保留機(jī)構(gòu)技術(shù)文本語義的特征,提供有價(jià)值的、可解釋的分析結(jié)果。在技術(shù)互補(bǔ)性的測(cè)算方面,考慮互補(bǔ)的出發(fā)點(diǎn)是基于雙方技術(shù)結(jié)構(gòu)還是技術(shù)用途,明確判斷標(biāo)準(zhǔn)和測(cè)度指標(biāo),借鑒技術(shù)相似性的測(cè)算方法,深入文本語義層面加以挖掘,同時(shí)可以考慮利用復(fù)雜網(wǎng)絡(luò)等工具展示互補(bǔ)方向。

      3)系統(tǒng)梳理技術(shù)關(guān)聯(lián)與研發(fā)合作行為的關(guān)系,完善測(cè)度指標(biāo)。研發(fā)合作是一種復(fù)雜的選擇行為,本質(zhì)上要以研發(fā)技術(shù)的匹配程度作為選擇合作伙伴的出發(fā)點(diǎn),應(yīng)系統(tǒng)梳理各類技術(shù)關(guān)聯(lián)關(guān)系與研發(fā)合作行為的關(guān)系,完善測(cè)度合作潛力的指標(biāo)和方法,提升識(shí)別結(jié)果的客觀性和可靠性。以技術(shù)應(yīng)用關(guān)系為例,當(dāng)雙方技術(shù)強(qiáng)相似、弱互補(bǔ)時(shí),表明雙方很可能在研發(fā)相似技術(shù)或產(chǎn)品,競(jìng)爭(zhēng)激烈,但在細(xì)分領(lǐng)域上也可以嘗試合作;當(dāng)雙方技術(shù)弱相似、強(qiáng)互補(bǔ)時(shí),表明此類機(jī)構(gòu)可能正好擁有企業(yè)沒有且需要的技術(shù),未來可能助力企業(yè)形成重大技術(shù)創(chuàng)新或革命性產(chǎn)品;當(dāng)雙方強(qiáng)相似、強(qiáng)互補(bǔ)時(shí),表明此類機(jī)構(gòu)可能會(huì)幫助企業(yè)解決現(xiàn)有研發(fā)過程遇到的技術(shù)瓶頸,優(yōu)化企業(yè)技術(shù)或產(chǎn)品性能,也對(duì)激發(fā)雙方在共同領(lǐng)域的潛能,實(shí)現(xiàn)雙贏有促進(jìn)作用;當(dāng)雙方弱相似、弱互補(bǔ)時(shí),企業(yè)可考慮將此類機(jī)構(gòu)作為未來技術(shù)擴(kuò)張的備選目標(biāo),以提升技術(shù)或產(chǎn)品多樣性。厘清技術(shù)關(guān)聯(lián)關(guān)系與研發(fā)合作之間的組合方式,才能建立起科學(xué)的識(shí)別依據(jù)和識(shí)別指標(biāo)。

      猜你喜歡
      相似性關(guān)聯(lián)語義
      一類上三角算子矩陣的相似性與酉相似性
      淺析當(dāng)代中西方繪畫的相似性
      語言與語義
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      奇趣搭配
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      低滲透黏土中氯離子彌散作用離心模擬相似性
      “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
      認(rèn)知范疇模糊與語義模糊
      V4國(guó)家經(jīng)濟(jì)的相似性與差異性
      永登县| 阳城县| 礼泉县| 湖州市| 丰镇市| 万载县| 大冶市| 额尔古纳市| 兴和县| 筠连县| 衡阳市| 商丘市| 常山县| 河东区| 巩留县| 电白县| 德兴市| 瓦房店市| 左权县| 晋宁县| 尤溪县| 吐鲁番市| 靖西县| 乌拉特后旗| 宜阳县| 葵青区| 天长市| 两当县| 绥中县| 浦城县| 镇坪县| 陵川县| 图们市| 龙州县| 和顺县| 姜堰市| 宾阳县| 玛纳斯县| 若羌县| 白山市| 永泰县|