姚毅凡,沈 喆,王 毅,成 穎
十九大報告強調創(chuàng)新是引領發(fā)展的第一動力[1]。專利作為技術創(chuàng)新的成果,已經成為集技術、科學、法律以及經濟等信息為一體的重要信息源[2]。目前對專利的計量分析已經引起了圖書情報學[3]、管理科學與工程[4]、經濟學[5]等多個學科的關注。宏觀層面,專利分析有利于學界與業(yè)界把握技術前沿、推動學術交流、促進學科發(fā)展、激發(fā)技術創(chuàng)新并進而創(chuàng)造經濟價值和社會價值。微觀層面,對專利進行引用分析已經成為專利計量學的重要方法,被廣泛應用于識別核心專利[6]、評估企業(yè)專利價值[7]等,具有易用、高效等特點[8]。
目前專利計量學界普遍接受的觀點是,專利被引體現了其經濟價值和技術水平[9-11],可以衡量其對后續(xù)技術的影響,體現了其作為現有技術的法律功能[12],是專利質量評價指標體系不可或缺的維度[13-14]。值得關注的是,專利被引存在明顯的二八定律,即少量專利獲得了大量的引用,而更多的專利被引甚少,甚至零被引。學界深入探討此現象背后的原因,發(fā)掘出了豐富的影響專利被引的因素。結果顯示,專利的被引頻次會受到發(fā)明人、專利權人、技術范圍、國家以及時間等多種因素的影響。
現有研究尚未見對專利被引影響因素的全面梳理,考慮到該主題重要的科學意義與應用價值,本文對其進行系統綜述。借鑒Tahamtan等[15]的做法,本文在Web Of Science、Scopus、PubMed和LISA等數據庫中采用TI=(Determin*OR Factor*OR Effect*OR Relation*OR Influence*OR Impact*OR Predict*OR Function*OR Significance*OR Feature*OR Characteristic*OR Distribution*OR Increas*)AND TI=(Patent*)AND TI=(Citation*)進行檢索,中國知網的檢索策略為限定主題中包含“專利”及“被引”或者“專利”及“引用”,首次檢索時間是2019年12月5日,并于2020年11月18日進行了補充檢索,結合參考文獻,排除無關論文,最終獲得相關文獻共87篇,其中中文文獻65篇、英文文獻22篇。
通過對相關文獻的主題分析,提煉出14個被引影響因素,并將其概括為3類,即“后向引用因素”(后向引用文獻數量、后向引用文獻質量、引證深度以及引證廣度)、“專利自身因素”(時間、早期被引、IPC分類數、專利主題、權利要求數量、同族專利數量)、“專利產生因素”(專利權人、合作、國家、資金),見圖1所示。
圖1 專利文獻被引影響因素
后向引用(backward citation)指展現于專利參考文獻列表中的對先前專利和非專利文獻的引用,一定程度上反映了專利接受的知識溢出[16]。其中,非專利文獻(non-patent literature,NPL)指后向引用了專利文獻以外的其他文獻,通常包括科技圖書、期刊論文以及索引工具等[17],該類引用可以在一定程度上體現科學與技術之間的聯系,比如,對美國生物技術行業(yè)以及納米技術領域的分析發(fā)現后向引用NPL是科學與技術之間的橋梁,基于我國在美申請的醫(yī)藥領域專利的分析進一步發(fā)現引用了NPL的專利獲得了更多被引,可見科學與技術之間多方面的相互作用[18-20]。
1.1.1 后向引用文獻數量
多項研究探討了后向引用專利文獻和NPL的數量對被引頻次的影響。后向引用專利文獻的數量越多,則被引頻次也就越高[16,21];但在新興產業(yè)燃料電池領域中,該結果在不同數據集上的表現并不穩(wěn)健[22];而使用零膨脹負二項回歸和突變級數法對傳統產業(yè)中藥專利進行的分析顯示,無論靜態(tài)抑或動態(tài)視角均發(fā)現了顯著的負向影響[23]。
NPL數量與專利被引頻次的關系研究中未發(fā)現二者間的顯著正向影響[24]。部分學者聚焦于NPL中的部分文獻類型,發(fā)現高被引專利引用了更多的科學文獻[22,25],也有研究在動態(tài)模型中發(fā)現其影響隨著時間的推進逐漸由消極轉變?yōu)榉e極,而在靜態(tài)模型中影響則不顯著[23];在僅探討NPL中學術論文數量對專利被引頻次的影響時,多項研究中均發(fā)現了顯著的正相關關系[16,21,26-27],不過,該結果在中藥專利中未能重現[28]。對于科學論文之外的其他文獻,研究中未發(fā)現其數量對專利被引頻次的顯著影響[27],個別研究中甚至發(fā)現了二者間的負相關關系[16]。
1.1.2 后向引用文獻質量、引證深度和廣度
除了后向引用文獻數量外,相關研究分別探討了后向引用專利文獻質量、引證深度以及廣度對被引頻次的影響。少量研究中將后向引用文獻質量量化為其被引數,分析發(fā)現后向引用科學論文的質量對專利被引存在顯著正向影響,后向引用專利文獻的質量對專利被引不顯著[26];采用HHI指標量化的引證深度指標對專利被引存在顯著的正向影響[29]。
引證廣度即“一項專利所引證的不同技術領域的數量”,可通過后向引用專利的UPC以及IPC等分類數進行量化,相關分析顯示其在整體上與專利被引呈顯著的正相關關系[30],多元回歸分析的結論與之相似[31-32]。此外,針對后向引用專利的IPC分類數,其在高低被引專利之間存在顯著差異[33];而且在用后向引用專利的IPC分類信息熵量化技術會聚時,結果也表明5個分類層級的技術會聚程度均對專利被引頻次存在顯著正向影響[34],研究中還發(fā)現隨著技術會聚程度的增加,其間關系呈倒U型,且交叉領域的影響顯著高于非交叉領域[35]。不過,少量研究未證實引證廣度對被引的正向影響[29]。
1.2.1 時間
專利被引頻次需要時間的積累,越早出現的專利,其被引的概率越大[36],該觀點已經成為眾多實證研究的共性結論,但不同學者對時間的量化方式存在差別。專利被引頻次可能會受到專利年齡的影響[37],部分研究還發(fā)現其遵循Logistic擴散模型[38-39],優(yōu)先權年越早的專利可以獲得更多的被引[40];通過對美國國家經濟研究局(the U.S.National Bureau of Economic Research,NBER)六大技術領域的方差分析也發(fā)現年齡大于20年的長期專利的平均被引顯著高于中短期專利[41]。值得注意的是,專利被引存在“時間截面”“引證膨脹”[12]“隊列效應”[42]等問題,不同年份公開的專利可能無法直接比較,鑒于此,有學者利用固定效應法對專利被引頻次進行了修正,發(fā)現若固定公開年,則專利被引頻次隨統計年的增長呈上升趨勢,若固定統計年,則其與公開年的關系呈倒U型[43]。
1.2.2 早期被引
研究表明早期被引次數越多的專利未來被引的可能性越大[44]。生命表法關注的是專利授予和首次被引的時間差,結果發(fā)現一半專利的首次被引發(fā)生在授予日后的前125個月(前10年)內[45]。具體到專利被引的時間分布,有研究通過對11項樣本專利的引文分析發(fā)現,專利公布后的前一兩年內幾乎沒有被引,被引量從第三年開始大幅增加,一般在第四或第五年達到高峰[46];專利授予年與首次被引用年之間的時滯越長,專利被引將越少,即被快速引用的專利將獲得更多的引用[47]。此外,也有研究將專利劃分為高、低被引兩類并結合Logistic回歸分析,結果顯示專利發(fā)布2年內的被引證數對總被引存在顯著的正向影響,而首次被引時間的影響不顯著[29]。
1.2.3 IPC分類數
IPC分類是目前國際通用的專利文獻分類和檢索工具,采用部、大類、小類、主組、分組5級分類的方式[34],可用于確定專利所涉及的技術領域范圍。專利的IPC分類數越多,表明專利覆蓋的技術范圍越廣。學者們探討了專利本身的IPC分類數對專利被引的影響,結果發(fā)現二者間呈顯著的正相關關系[30-32,48-50];采用DC分類法的研究也顯示專利的技術多元化特征越明顯則越有可能產生重大的發(fā)明創(chuàng)造(即高被引專利)[51]。
1.2.4 專利主題
多項研究從宏觀的主題視角對專利被引進行了分析,結果發(fā)現不同主題專利的被引量存在顯著差異,如美國專利商標局10個高被引專利中有7項都屬于噴墨技術及相關主題[52];中國專利的類似分析也表明人類生活需要類專利的被引頻次最高[53-54]。在具體的主題領域中,在移動支付領域,關于移動支付的相關技術、體系結構及解決方案等子主題具有被引優(yōu)勢[55];在生物技術領域,與微生物技術相關的專利平均被引超過100次,而“抗生素”“維生素”“激素”“甲狀腺激素”“前列腺素”等主題被引甚少[56];在加密技術領域,加密通信系統和方法類專利獲得了更多的被引[57];在全球密集型企業(yè)(全球范圍內擁有的專利數量最多且專利總被引次數最大)專利的引用分析中,“電子、電氣設備”行業(yè)被引頻次最高,技術知識溢出明顯[58];美國洛克希德·馬丁公司的高被引專利也集中于化學、計算機與通信領域[59]。少量研究還探討了專利主題的相關特征與被引間的關系,如專利主題的新穎性和常規(guī)性以及二者的交互作用均對被引存在正向影響[60];部分研究還探索關鍵詞模式對專利被引的預測價值[61]等。
1.2.5 權利要求數量
權利要求體現了專利的保護范圍,權利要求數量越多,則保護的范圍越大[62]。部分研究發(fā)現權利要求數量對專利被引頻次存在顯著正向影響[37,40,49]。在生物技術領域中,負二項回歸分析表明權利要求數量對專利被引的影響呈倒U型曲線,作者的解釋是隨著權利要求數量的增加,與專利申請領域相關的不確定性隨之增加,從而會降低使用該專利作為后續(xù)技術來源的可能性[63]。1.2.6同族專利數量
同族專利是“根據同一發(fā)明創(chuàng)造,在多個國家或者地區(qū)進行的專利申請或者專利授權,或者在同一國家多次進行的專利申請或者專利授權而形成的專利組合”[64],亦被稱為專利家族。同族專利可表征專利權人對專利質量的主觀判斷和后續(xù)投入[16],多項研究表明其與專利被引頻次正相關[16,48];也有研究顯示三方專利家族(是否同時在日本、歐盟和美國申請并授予專利)對專利被引頻次存在顯著負向影響[29]。此外,有學者采用ERG模型分析專利引用關系的形成機理,結果顯示專利家族規(guī)模、非專利引文、專利申請范圍等特征在其中的影響被高估[65]。
1.3.1 專利權人
專利權人(專利申請人、專利受讓人)是專利權的所有人及持有人的統稱,可以是單位或個人[66],其類型特征會對專利被引產生一定影響。研究發(fā)現,機構專利的被引頻次要高于個人[47]。在機構中,大公司和高水平大學、科研院所、實驗室等擁有的重要且具有影響力的專利技術,會獲得更多引用[67-68]。不過,在我國醫(yī)藥領域中,相較于大學、研究所及個人專利權人,企業(yè)專利權人在專利被引頻次上優(yōu)勢明顯[69]。針對企業(yè),在位主導企業(yè)(專利市場份額前三、五位)與否對專利被引未見顯著影響[22],機構持股比例則對上市公司創(chuàng)新質量(專利被引)存在顯著促進作用,尤其是長期、主動的機構投資者[70]。
多項工作對我國高校專利權人的專利被引進行了研究。我國985高校間的專利競爭力差異明顯,就高被引專利比例來看,西北工業(yè)大學、清華大學、廈門大學和復旦大學遠高于其他高校[71];C9高校的專利申請數量均表現出增長趨勢,但專利被引頻次存在較大差異,其中清華大學優(yōu)勢明顯[72];廣東7所高水平大學中,華南理工大學專利的轉化率處于領先位置[73]。
最后何冰鐵了心搬了出來,同時放話給趙曉峰:現在同意離婚的話,房子家產自己都不要,等到分居期滿,自己絕對要他人財兩空。
1.3.2 合作
現有研究中,合作可通過發(fā)明人數量、產學研合作以及跨國合作等進行量化。
(1)發(fā)明人數量。高被引專利的發(fā)明者合作率、合作強度(即平均每項專利的發(fā)明者數量、單項專利最高發(fā)明者數量)均高于中低被引和零被引[74];燃料電池[22]、納米領域的區(qū)域引證分析[48]也顯示發(fā)明人數量對專利被引存在顯著正向影響;進一步,平均擁有8個及以上共同發(fā)明人的專利在前5年被引的頻率明顯高于擁有較少發(fā)明人的專利,在對專利的技術領域、受讓人部門(公共/私營)、引用來源(申請人/審查員)、自引等進行亞組分析時該關系依然成立[75];也有部分研究顯示發(fā)明人數量對專利被引的影響不顯著[16,29,40]。
(2)產學研合作。在以平均被引頻次表征專利質量時,研究發(fā)現1978-2005年間中日兩國校企合作專利質量整體上高于非校企合作,但該差異在韓國并不明顯[76],也有研究表明產學合作確實有助于提高專利質量[77-78];針對高校(雙一流、其他)和企業(yè)(國企、民營、其他)之間可能存在的六種產學協同創(chuàng)新主體,其被引分析表明民營企業(yè)和其他高校合作的專利被引頻次較高[79]。
(3)跨國合作。在以國家為單位的研究中發(fā)現專利跨國合作次數對國家專利產出的數量和被引頻次均存在顯著正向影響,即跨國專利合作能促進本國產生數量更多、影響力更大的專利[80];對中國ICT領域的專利分析也顯示,相較于國內合作,國際合作對專利被引的影響更大,其中中美合作在提高專利質量方面的優(yōu)勢更為明顯[81];此外,也有研究表明與美國專利所有權合作對專利被引頻次存在顯著正向影響[50]。
1.3.3 國家
專利被引頻次存在地理上的差異,部分研究證實了專利引證行為會受到其所屬國家的影響。比如,法國專利被引用的次數少于英國專利[47],美國專利被引和引用頻次均居全球首位,韓國專利引用頻次是被引的近乎兩倍,德國被引則遠多于引用頻次[82]。
現有研究發(fā)現美國和日本專利質量在全球多個領域的優(yōu)勢地位。比如,在微生物燃料電池[83]、臨氫/供氫劑減黏裂化技術[84]、醫(yī)用治療設備[85]、電子診斷設備[86]、馬鈴薯淀粉深加工[87]以及分子設計育種[88]等領域,美國專利的被引表現均優(yōu)于其他國家。日本占據美國專利商標局10個高被引專利的7席[52],且相較于中韓,其專利的總被引頻次也明顯較高[76];此外,在全球液晶顯示產業(yè)中,日本半導體能源公司(SEME)平均被引也是最高的[89]。總體而言,我國專利被引頻次與發(fā)達國家相比還存在較大差距[90-93];不過,在金磚五國中我國專利的被引情況仍處于領先地位[94]。1.3.4資金
有關資金,學界關注到的主要有專利申請費用以及財政資助。圍繞前者,選取美國1982年和2005年兩個專利申請費用上調和下調時間點來進行對比分析,可以發(fā)現專利申請費用上調后低被引專利比例降低,下調時則上升[95]。針對后者,現有研究從多個角度進行了探討。對于國家而言,研發(fā)經費投入對國家專利被引頻次存在顯著正向影響[80];就區(qū)域而言,科技經費籌集額與區(qū)域專利被引頻次正相關[48];此外,對于企業(yè)而言,研究發(fā)現世界主要鋼鐵企業(yè)的研發(fā)投入率和投入額與總被引頻次也高度相關[96]。不過,也存在即使投入了大量資金,專利影響力仍然較低的情況(如對中石油的專利分析結果)[97],即資金投入對專利被引的影響尚不能一概而論。
本文綜述的三類影響專利被引的因素間也存在相互作用,具體表現為學科領域的調節(jié)效應、專利產生以及專利自身因素對專利自身的影響、專利產生對后向引用的影響等。
不同學科領域的專利后向引用科學文獻存在很大差異,表現為在臨床醫(yī)學、基礎醫(yī)學、生物學、化學以及物理學等學科中科學與技術之間的聯系更強,而數學等學科較弱[101-102];與其他技術領域相比,化工領域專利后向引用的非專利文獻量較高[103];與納米和轉基因技術領域相比,制藥領域知識更新緩慢,參考周期較長且科學知識轉化為技術的速度較慢[104]。即使在同一領域中,不同子領域也表現迥異,比如動力電池領域,鋰電池和燃料電池后向引用科學論文的數量對專利被引頻次存在顯著正向影響,鎳氫電池的該影響則不顯著[21]。此外,后向引用非專利文獻、權利要求數量等因素對專利被引的影響在生物技術行業(yè)內外存在差異[63];時間因素對專利被引頻次的影響在不同技術領域也不一致[43];而且,一項專利的技術變異度越大,獲得的被引將越多[47]。
專利維持時間作為與專利自身相關的因素之一,多項研究發(fā)現多個與專利產生以及專利自身相關的其他因素對其存在一定的作用。比如回歸分析發(fā)現發(fā)明者人數(合作)、IPC分類數、權利要求數、同族專利數等因素對專利維持時間存在影響,且這些因素對不同類型專利權人的影響程度存在差異[105];中國、美國、法國和德國專利的權利要求數對維持時間存在顯著正向影響[106]。此外,在另一與專利自身相關的因素——早期被引上,也得到了類似的發(fā)現,比如,與第一發(fā)明人相關的變量(發(fā)明數量、發(fā)明被引次數)會影響早期被引的速度[45],具體表現為第一發(fā)明人在領域內獲得的被引頻次越高,則專利首次被引的時間就越短,其專利發(fā)明數量越多,則該時間越長;隨著IPC分類數以及同族專利數量的增加,則專利的首次被引時間在不斷前移,同時,隨著權利要求數量的增加而不斷延遲[107]。
不同國家專利后向引用存在較大差異,比如相較于日本,中國專利后向引用專利文獻的數量更多且范圍更廣[108];在中國、美國、瑞士以及德國四個國家中,美國專利的科學關聯度(后向引用論文數量)一直高于平均水平[109]。而且,不同類型專利權人引用科學文獻的平均數量也存在較大差異,高水平大學科學關聯度較高[68]。此外,財政資助專利[110]和存在專利運營(專利權人獲得授權以后對其有收益、處分的權利,最常見的就是質押、許可和轉移,統稱為專利運營)[28]現象的專利在引用科學論文上的表現也要高于其他專利。
通過本文第一和第二部分的梳理發(fā)現,影響因素與專利被引間的關系在多項研究中表現不一致,相關研究也探討了其內在機制。
3.1.1 法律規(guī)定對引用行為的影響
不同于科學論文,專利引證包含申請人引文和審查員引文[111],前者一般是展示該發(fā)明的現有技術,后者則是為了限制專利權利要求[112]。在專利法的約束下,申請人的引用通常作為技術背景指出先前研究存在的問題或局限,是被引專利先進性的負面證據;審查員引文則是為了提供駁回申請的理由,授權專利獲得的引用越多其新穎性越經得住考驗[113]。引用行為還會受到激勵政策和信息素養(yǎng)的影響,例如,當把申請駁回率當作績效指標時,審查過程會更加嚴苛[114],二者尤其是申請人的引用能力會受到檢索能力和文獻資源獲得能力的影響[115]。此外,各國專利法對引用行為的規(guī)定也存在差異[116],比如,中國和EPO等國家和地區(qū)并沒有類似美國的申請人“坦誠義務”,同時,前者的專利數據庫中大多只包含審查員引文,而后者的相關數據庫則包含了二者,從而審查員引文在可獲得性和數量上都有明顯優(yōu)勢[117]。
專利引證數據是申請人和審查員基于各自的引用動機和引用能力,在專利法規(guī)的作用下形成的結果[115],其中引用主體屬性的不同造成了最終數據的差異,故在進行相關研究時應區(qū)分申請人和審查員引用[114],以獲得更為精細的樣本。此外,不同國家專利引用法規(guī)的差異也提醒研究者在構建樣本時對引證數據加以區(qū)分,在進行跨領域、跨地區(qū)研究時尤甚。
3.1.2 本土優(yōu)勢
多項研究發(fā)現不同國家的專利被引存在差異,比如美國無論在引用還是被引都處于世界前列,相關研究通過對引用行為的分析揭示了本土優(yōu)勢的影響。比如,目前中國專利的被引在世界范圍內尚未體現出優(yōu)勢,卻存在明確的本土優(yōu)勢,即總被引頻次和篇均被引頻次均高于國外來華發(fā)明專利[103]。技術知識在語言[46,118]和地理距離[118-119]相近的國家間傳播得更快。專利授權機構借助于專利審查/批準的法律規(guī)則和程序也促進了本土優(yōu)勢[120]。不過,隨著國際通訊和旅行成本的下降,信息跨越國界流動變得更加容易,本土優(yōu)勢呈逐漸減弱之勢[121]。
3.1.3 后向引用文獻類型
一是專利文獻。新的技術發(fā)明通常建立在前人的研究基礎之上[22],后向引用專利文獻有助于打破固有思維模式、突破技術限制,如果引用涉及不同的技術領域,可形成思維碰撞、產生新突破[23]。不過,引用大量專利文獻會限制專利的權利范圍,且專利文獻質量參差不齊,引用低質量專利文獻會降低專利的新穎性和創(chuàng)造性[23,49]。此外,從技術生命周期來看,越接近起點的專利越基本,也越重要,其后向引用的專利文獻也越少[42]。二是科學文獻?;A研究為發(fā)明創(chuàng)造提供了理論基礎和方法指導,后向引用更多的科學文獻可以增強專利發(fā)明人前沿科學知識的儲備和知識結構的異質性,提升創(chuàng)新能力,繼而提高技術創(chuàng)新的質量[20]。此外,科學文獻從經濟學角度來看具有公共物品非競爭性和非排他性兩個基礎特性[22,25],個人對科學文獻的引用并不會降低其價值更不會影響他人,引用過程促進了知識的流動,有利于創(chuàng)造新知識,故而科學文獻具有正外部性。不過,科學文獻的質量、年齡均存在差異[26],且后向引用科學文獻的動機多樣,部分引用難以體現科學與技術的聯系[19]。3.1.4同族專利數量
一項專利能夠通過專利審查,在不同國家獲得授予,既表明該專利自身質量較高[20],也顯示出專利權人對其價值以及未來潛力的肯定和重視[29],同族專利也可以減輕距離和語言差異對專利知識擴散的負面影響[46]。不過,專利權人的主觀判斷和規(guī)劃會受到自身的限制,相比于規(guī)劃明晰的大企業(yè),實力較弱的中小企業(yè)更可能因為缺乏前期市場調查而致盲目申請,進而耗費更多的人力、物力和財力[29]。
3.1.5 發(fā)明人數量
較多的專利發(fā)明者匯聚了豐富、多源的知識,顯示了該專利人力資源投入以及潛在質量較高[16]。不過,有必要考慮發(fā)明者之間順利合作需具備的一些前提條件,如知識的多樣性、個人觀點的獨立性、不存在特殊權利以及其他準則等[122]。此外,還需要關注林格爾曼效應[123],即團隊中的每個個體是否發(fā)揮了其最大的價值。
現有專利被引影響因素研究的一個基本假設是專利被引頻次可以衡量專利質量。不過,有研究認為即使是被引證數為0的專利依然可能是高價值專利[36],是“放錯地方的資源”[10]。多項研究提示,該量化方法的魯棒性不夠充分[124-125]。其原因可能有,被引頻次具有時間滯后性、見樹木不見森林(單篇專利之間的引證關系難以體現技術之間的整體關聯)、判斷閾值無法形成統一標準、不當引證時有發(fā)生、公眾獲取中國專利引證信息困難[8]、技術領域差異[12]以及個體檢索能力提升導致的引證膨脹[12]等。針對存在的這些問題,有學者采用固定效應法分析了時間因素對專利被引頻次的影響[43],也有學者對原始被引頻次指標進行了標準化(除以同一年份和同一專利分類中所有專利被引用的平均數量),并針對不同技術領域、引用來源等進行了亞組分析[75]。
專利被引的影響因素研究主要采用了三類方法。相關分析:在考慮單一因素與專利被引頻次之間的相關關系時多采用該方法,包括Spearman、Kendall's tau-b以及Pearson等相關系數,其中Spearman相關系數對原始變量的分布要求較弱,在研究中更為常見?;貧w分析:研究中常用的回歸分析方法有負二項回歸、Logistic回歸、Tobit回歸以及Cox回歸等。在專利被引影響因素研究中,由于被引頻次是非負的離散整型變量,計數模型更為適宜[16],其中負二項回歸是更為常用的方法。在僅考慮專利分類、發(fā)明人以及現有技術的參考資料等事前指標(exante indicator)時,深度學習方法在預測專利被引方面的表現要優(yōu)于引文滯后分布和Tobit回歸[126]。此外,有學者將負二項回歸與其他研究方法相結合進行研究,如結合突變級數模型,繼而從靜動兩個視角分析專利文獻和科學文獻對專利被引的影響[23]。其他方法包括ERG模型、決策樹方法、技術共類分析等。決策樹避免變量獨立條件[40],ERG模型避免了獨立性與分布假設的約束[65],在現有研究中的應用尚較少。
本文系統梳理專利被引影響因素的相關研究,識別并歸納了三類共14個影響專利被引頻次的因素:后向引用因素,包括后向引用文獻數量、后向引用文獻質量、引證深度以及引證廣度;專利自身因素,包括時間、早期被引、IPC分類數、專利主題、權利要求數量、同族專利數量;專利產生因素,包括專利權人、合作、國家、資金。三類因素在對專利被引產生影響的同時彼此之間也存在相互作用,如學科領域的調節(jié)效應。針對同一影響因素在不同研究中效應不一致的現象,本文從法律規(guī)定對引用行為的影響、本土優(yōu)勢、后向引用文獻類型、同族專利數量以及發(fā)明人數量五個角度進行了討論。此外,還對研究方法進行歸納,指出采用被引頻次衡量專利質量的爭議,為專利被引影響因素的后續(xù)研究提供了借鑒和啟示。