郭永正
(河南師范大學(xué)馬克思主義學(xué)院 河南新鄉(xiāng) 453007)
(河南師范大學(xué)政治與公共管理學(xué)院 河南新鄉(xiāng) 453007)
一般情況下,被引頻次常用來表征論文的質(zhì)量和影響力。過去,高被引論文得到了學(xué)者的較多關(guān)注,而低被引乃至零被引論文卻很少引起學(xué)者的興趣。論文零被引率指一個(gè)國家、機(jī)構(gòu)、期刊或個(gè)人在某段時(shí)間內(nèi)發(fā)表的論文集合中,在發(fā)表后的某個(gè)特定時(shí)間窗口內(nèi)未被引用的比例。筆者利用博士論文的相關(guān)數(shù)據(jù)比較了中國和印度國際合作論文的零被引率的歷時(shí)變化、學(xué)科特征和合作關(guān)系規(guī)律,發(fā)現(xiàn)了它們各自國際合作論文零被引率的一些規(guī)律,國際合作關(guān)系結(jié)構(gòu)和國際合作論文質(zhì)量是導(dǎo)致各自國際合作論文零被引率差異的兩個(gè)原因。
就目前而言,國內(nèi)外有關(guān)零被引率的研究雖然并不少見,但都沒有對研究樣本進(jìn)行細(xì)致的分類,僅就某一時(shí)間段、某一學(xué)科領(lǐng)域、某些期刊或某一國的論文為樣本,籠統(tǒng)地研究論文零被引率。隨著科學(xué)研究的國際化發(fā)展,國際合作論文日益增多。而國際合作論文和非國際合作論文具有明顯不同的文獻(xiàn)特征。若不做零被引率的細(xì)分研究,難以避免科研政策的籠統(tǒng)性,缺乏針對性。因此,將非國際合作論文與國際合作論文區(qū)分開來研究,將是一件很有意義的工作。本文就是以中國的非國際合作論文和印度的非國際合作論文為樣本,并將其細(xì)分到學(xué)科層面,比較研究中國和印度的論文零被引率,嘗試為我國科技政策提供依據(jù)。
本文的數(shù)據(jù)來自網(wǎng)絡(luò)版的科學(xué)引文索引數(shù)據(jù)庫(SCI-E)。該索引由美國科學(xué)信息研究所(ISI)編輯出版,是一個(gè)多學(xué)科綜合性檢索系統(tǒng),主要收錄生命科學(xué)、醫(yī)學(xué)、生物、物理、化學(xué)、農(nóng)業(yè)、工程技術(shù)領(lǐng)域內(nèi)的科技文獻(xiàn)。雖然它也存在一些不足,但仍被認(rèn)為是最全面的數(shù)據(jù)庫,涵蓋了世界上最有影響力的研究成果,具有很強(qiáng)的代表性,特別是在基礎(chǔ)研究領(lǐng)域。它可以用來評價(jià)一個(gè)國家的科技實(shí)力,學(xué)術(shù)機(jī)構(gòu)和個(gè)人的學(xué)術(shù)水平,優(yōu)化圖書期刊的館藏結(jié)構(gòu)。所以,采用此數(shù)據(jù)庫進(jìn)行中印兩國的比較研究是可行的。
我們選取的數(shù)據(jù)跨度為1985~2004年。原因有兩個(gè):一是1985年為我國科技發(fā)展的新階段,從此,我國的科技發(fā)展步入正常階段;二是我們采用先前研究的數(shù)據(jù),最新數(shù)據(jù)的補(bǔ)充難度很大。數(shù)據(jù)下載時(shí)間與數(shù)據(jù)產(chǎn)生的對應(yīng)關(guān)系是,2005年11月27日~12月2日對應(yīng)1995~2004年出版的論文,2006年1月12日~20日對應(yīng)1985~1994年出版的論文,檢索條件是作者地址“國家/地區(qū)”字段為Peoples RChina的Article文獻(xiàn)類型和作者地址“國家/地區(qū)”字段為India的Article文獻(xiàn)類型。之所以選擇Article文獻(xiàn)類型,是因?yàn)樵撐墨I(xiàn)類型反映了實(shí)質(zhì)的研究內(nèi)容,且在常 被 選 用 的 文 獻(xiàn) 類 型 :Articles,Letters,Notes,Editorials中占比達(dá)80%以上,有的學(xué)科甚至高達(dá)95%。
在SCI-E數(shù)據(jù)庫中,1997年后的中國論文包括了香港論文。而中國大陸與香港并不屬于一個(gè)科技系統(tǒng),且香港的論文產(chǎn)出也不是一個(gè)小數(shù)目,因此,不去除中國香港的論文而進(jìn)行中印比較,會(huì)遮蔽中國大陸的一些問題。所以,我們認(rèn)為有必要暫時(shí)去除中國香港和澳門的論文,只進(jìn)行中國大陸與印度的非國際合作論文零被引率比較 (最終得到的研究樣本數(shù)量見表1)。
中印兩國的非國際合作論文的獲取步驟與筆者之前的研究成果《學(xué)科層面國際合作結(jié)構(gòu)的中印比較——文獻(xiàn)計(jì)量學(xué)的視角》一文基本相同,只有第三步不同:抽取的是非國際合作論文,它的完成人均為中國大陸作者或印度作者。最后,我們共獲得中國的非國際合作論文245430篇,其中52篇不能確定學(xué)科歸屬;印度的非國際合作論文244986篇,其中117篇不能確定學(xué)科歸屬。
論文零被引率的研究可以分為兩類:一類是限定論文引用的起點(diǎn),不限定論文引用的止點(diǎn),研究不同時(shí)間引用窗口的零被引率,這類研究往往不需要改變樣本就可以觀察到論文零被引率隨著引用窗口變化的規(guī)律;另一類是不限定論文引用的起點(diǎn),限定論文引用的止點(diǎn),這類研究的樣本往往需要改變,否則無法觀察到論文零被引率隨著引用窗口變化的特征。本文屬于第二類情況。由于數(shù)據(jù)庫的改變,往往導(dǎo)致數(shù)據(jù)提取困難增加,例如1997年之前區(qū)分中國大陸和中國香港的論文是十分容易的,之后就變得相當(dāng)困難。所以,我們選擇了第二類研究樣本,因?yàn)檫@類樣本更適合中印比較研究。我們在這類樣本中花費(fèi)了較大的精力抽取出了中國大陸的論文。顯然,根據(jù)我們下載論文的時(shí)間可以知道,1978~1994年的論文的引用窗口是2006減去出版年份,1995~2004年的論文的引用窗口也可看作是2006減去出版年份。因?yàn)?,前者的下載時(shí)間是2006年1月中旬,后者的下載時(shí)間是2005年11月底,二者相差不足2個(gè)月。引用窗口被標(biāo)在相應(yīng)出版年份的括號(hào)內(nèi)。
表1 1985~2004年中印兩國的非國際合作論文分布
首先,我們從總體上比較不同年度非國際合作論文的零被引率,以考察兩國的科學(xué)研究影響力。由于不同年份發(fā)表論文的引用窗口不同會(huì)影響論文的引用,為了保證論文引證時(shí)間窗口的相同,所以我們只能進(jìn)行年對年的比較。我們分析這些數(shù)據(jù)的一個(gè)基本前提是:如果沒有重大事情發(fā)生,一個(gè)國家在一定時(shí)期內(nèi)的科學(xué)影響力不會(huì)發(fā)生較大變化。
圖1 各年度非國際合作論文零被引率的中印比較
從各年度非國際合作論文零被引率的中印比較(見圖1)可以看出,在中國非國際合作論文產(chǎn)出較少的年份,中國的零被引率較高在40%上下;1992~2002年中國的論文零被引率均在30%左右;2003年和2004年的論文由于引用時(shí)間窗口較短導(dǎo)致其零被引率較高。印度論文的零被引率在低于30%的水平上維持了4~5年的平穩(wěn)發(fā)展,然后逐漸降低,之后又緩慢升至30%左右,2002~2004年的論文由于引用時(shí)間窗口變小而致其零被引率上升。這些數(shù)值和普萊斯等人的測量大體相當(dāng)。
兩國的非國際合作論文零被引率的演變可以簡單地歸結(jié)為U型。只不過在下降的過程中乃至最初上升的過程中,“中國論文”的零被引率高于印度,只是從2000年開始“中國論文”的零被引率才低于印度。1985~1998年,雖然中國的非國際合作論文零被引率一直高于印度,但兩者的差距一直在縮??;1999~2004年,中國的非國際合作論文零被引率一直低于印度,且差距日益明顯。這說明我國科學(xué)研究的質(zhì)量在提升或中國科學(xué)的影響力在加強(qiáng),并且從2000年開始超過印度。當(dāng)然,2002~2004年的論文零被引率低于印度是中國科學(xué)的即時(shí)影響力提升還是中國科學(xué)質(zhì)量的提高,這個(gè)問題還有待于排除本國自引后做進(jìn)一步研究。
論文的引用因?qū)W科不同而存在顯著的差異,因此,我們還需要對樣本進(jìn)行學(xué)科分類做更進(jìn)一步的考察。本文采用了Essential Science Indicator的學(xué)科分類法,依據(jù)載文期刊名稱將論文分為22個(gè)學(xué)科。其中,經(jīng)濟(jì)學(xué)&商學(xué)和社會(huì)科學(xué)總論屬于社會(huì)科學(xué)的論文,本文不作考慮。
學(xué)科比較分兩種:一種是對各學(xué)科進(jìn)行一一比較,比較不同年度出版論文的零被引率;另一種是以某年度出版的論文為樣本,比較全部學(xué)科的零被引率。按照第一種思路對20個(gè)學(xué)科進(jìn)行一一比較是一件龐雜的工作,超出了一篇文章的篇幅;按照第二種思路對20個(gè)出版年度進(jìn)行截面比較,也需要較大的篇幅。而有些學(xué)科的論文很少,比較起來意義有限。因此,本文只選擇部分學(xué)科和某些出版年度進(jìn)行比較。選擇學(xué)科的標(biāo)準(zhǔn):要么該學(xué)科的論文產(chǎn)出較多,如物理學(xué)、化學(xué)、臨床醫(yī)學(xué)、工程學(xué)、材料學(xué)、植物與動(dòng)物學(xué);要么該學(xué)科具有兩國的國家特色,如農(nóng)業(yè)科學(xué)、數(shù)學(xué)(數(shù)學(xué)領(lǐng)域各年度論文零被引率及1999年所選學(xué)科論文零被引率的中印比較見圖2)。
基于上述8個(gè)學(xué)科零被引率的統(tǒng)計(jì),我們發(fā)現(xiàn)中國和印度在學(xué)科層面上的比較結(jié)果具有X的形狀特征:在前一時(shí)期,一個(gè)國家的零被引率高于另一個(gè)國家且差距不斷變小至某一年份后,兩國具有相同的零被引率,隨后該國家的零被引率低于另一個(gè)國家。在1999年,中國的非國際合作論文零被引率開始低于印度時(shí),并不是各個(gè)學(xué)科的論文零被引率都低于印度:在所選的8個(gè)學(xué)科中,數(shù)學(xué)、農(nóng)業(yè)科學(xué)和植物與動(dòng)物學(xué)的論文零被引率低于印度,而化學(xué)、臨床醫(yī)學(xué)、材料科學(xué)和物理學(xué)的論文零被引率仍然高于印度。
圖2 數(shù)學(xué)領(lǐng)域各年度論文零被引率及1999年所選學(xué)科論文零被引率的中印比較
在8個(gè)學(xué)科中,數(shù)學(xué)、物理學(xué)、化學(xué)、臨床醫(yī)學(xué)和農(nóng)業(yè)科學(xué)為一類。前一時(shí)期,中國的學(xué)科零被引率高于印度,后一時(shí)期中國的學(xué)科零被引率低于印度。數(shù)學(xué)的交叉點(diǎn)在1989年與1990年之間,物理學(xué)和臨床醫(yī)學(xué)的交叉點(diǎn)在2001年和2002年之間,化學(xué)的交叉點(diǎn)在2000年與2001年之間,植物與動(dòng)物學(xué)的交叉點(diǎn)在1988年與1989年之間。中國和印度在工程學(xué)領(lǐng)域的零被引率基本沒有差別。在材料科學(xué)領(lǐng)域,前一時(shí)期是中國論文的零被引率低于印度,后一時(shí)期是中國論文的零被引率高于印度,交叉點(diǎn)在1994年與1995年之間。
根據(jù)胡澤文等人的調(diào)查,論文發(fā)表時(shí)間較短、論文質(zhì)量不太高、論文主題偏冷或不夠新穎、所發(fā)期刊的影響力較低等是導(dǎo)致論文零被引的主要因素。在科學(xué)計(jì)量學(xué)領(lǐng)域,論文質(zhì)量一般用篇均被引頻次表征,其他因素較難量化,我們暫不作分析。論文作者作為知識(shí)傳播的主體,有助于論文擺脫零被引的困境,所以,我們認(rèn)為論文作者的多少,應(yīng)該是論文零被引率的一個(gè)影響因素;參考文獻(xiàn)作為論文產(chǎn)生的知識(shí)基礎(chǔ),也會(huì)影響論文的質(zhì)量,從而影響論文的零被引率。
回歸分析是對具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種統(tǒng)計(jì)方法。一個(gè)國家的非國際合作論文集合的零被引率和該集合論文篇均被引頻次是反映該國科研影響力的兩個(gè)變量,前者為負(fù)變量,后者為正變量,這兩個(gè)變量之間應(yīng)該存在負(fù)相關(guān)關(guān)系。從中印非國際合作論文零被引率與篇均被引頻次的回歸分析結(jié)果(見表2),可以看出,中國的相關(guān)數(shù)據(jù)除了農(nóng)業(yè)科學(xué)、物理學(xué)和臨床醫(yī)學(xué)外,都具有較高的相關(guān)指數(shù);印度的相關(guān)數(shù)據(jù)無一例外都具有較高的相關(guān)指數(shù);無論是中國還是印度,從相關(guān)指數(shù)來看,指數(shù)擬合優(yōu)于直線擬合,這說明兩國的非國際合作論文零被引率與篇均被引頻次符合指數(shù)關(guān)系;就指數(shù)回歸分析來看,印度的相關(guān)指數(shù)高于中國,這說明印度科研影響力對其論文零被引率的解釋力要優(yōu)于中國。
作者是科學(xué)知識(shí)傳播的一個(gè)重要起源。較早研究作者數(shù)量對論文被引情況影響的是Richard E.Stern。盡管他采用的方法簡單,但還是發(fā)現(xiàn)作者的數(shù)量是論文是否被引的一個(gè)因素,只不過影響較小而已?,F(xiàn)任科學(xué)計(jì)量學(xué)學(xué)會(huì)主席魯索早就發(fā)現(xiàn),一個(gè)作者僅有8%機(jī)會(huì)被別人引用,而多作者的合作論文有更多的機(jī)會(huì)被別人引用。在中國和印度的非國際合作論文中,作者數(shù)量的多少與零被引率之間是什么關(guān)系?
表2 1985~2004年中印非國際合作論文的篇均被引頻次與零被引率相關(guān)指數(shù)
從中印不同出版年度非國際合作論文在對應(yīng)的引用時(shí)間窗口內(nèi)各個(gè)學(xué)科的零被引率與篇均作者數(shù)之間的相關(guān)指數(shù)變化(見圖3)可以看出,兩國不同學(xué)科的論文零被引率與篇均作者數(shù)均呈負(fù)相關(guān)關(guān)系,且在論文出版后2~4年內(nèi),r的絕對值都達(dá)到了0.6,0.89;中國的相關(guān)系數(shù)有隨著引用時(shí)間窗口變小而減小再增大的趨勢,雖然有較大的跳躍性;印度的數(shù)據(jù)隨著引用時(shí)間窗口變小而起伏變化。這說明中國的非國際合作論文在出版2~4年內(nèi),一個(gè)學(xué)科的論文作者數(shù)與該學(xué)科的論文零被引率呈高度負(fù)相關(guān)關(guān)系,之后該相關(guān)關(guān)系先起伏減弱而后震蕩增強(qiáng);印度的非國際合作論文在論文出版2~8年內(nèi),學(xué)科的論文作者數(shù)與論文零被引率呈高度負(fù)相關(guān)關(guān)系,之后雖變?yōu)橹卸认嚓P(guān)關(guān)系,但馬上又恢復(fù)至高度負(fù)相關(guān)關(guān)系。
是新知識(shí)的產(chǎn)生基礎(chǔ),所以參考文獻(xiàn)很可能會(huì)影響論文的引用。我們以某一學(xué)科論文的篇均參考文獻(xiàn)數(shù)為變量,分析該學(xué)科領(lǐng)域論文零被引率與它的關(guān)系。
通過分析中印兩國的非國際合作論文的零被引率與篇均參考文獻(xiàn)數(shù)的相關(guān)系數(shù)(見圖4),可以看出,兩國論文的零被引率與篇均參考文獻(xiàn)數(shù)都呈負(fù)相關(guān)關(guān)系,相關(guān)系數(shù)的絕對值基本上都大于0.5,中國的最高值將近0.8,印度的最高值為0.8396。這說明中國和印度的非國際合作論文的零被引率與參考文獻(xiàn)是高度相關(guān)的,印度的相關(guān)性略高于中國,且相關(guān)性均隨著引文時(shí)間窗口的變小而增強(qiáng)。
雖然從總體來看,中國的非國際合作論文零被引率相對于印度而言,中國經(jīng)歷了一個(gè)趕超的過程,1999年是一個(gè)分界點(diǎn),但是并不意味著在學(xué)科層面上,中國與印度相比也是同樣的模式。在學(xué)科層面上,中國和印度之間存在三種模式:第一種是中國趕超模式,這種模式較常見;第二種是印度趕超模式;第三種是兩國比肩發(fā)展模式,后兩種模式不常見但確實(shí)存在,主要表現(xiàn)在工程學(xué)和材料科學(xué)領(lǐng)域。
圖3 中印非國際合作論文零被引率與篇均作者數(shù)的相關(guān)系數(shù)比較
圖4 中印非國際合作論文零被引率與篇均參考文獻(xiàn)數(shù)的相關(guān)系數(shù)比較
在所考察的因素中,對于印度而言,篇均被引頻次是其論文零被引率的主要因素,其次是篇均參考文獻(xiàn),第三是篇均作者數(shù)。且隨著引文時(shí)間窗口的變小,篇均參考文獻(xiàn)的影響增強(qiáng),篇均作者的影響減弱。對于中國而言,篇均被引頻次對其論文零被引率的影響因?qū)W科而異,有的學(xué)科較強(qiáng),有的學(xué)科較弱;篇均參考文獻(xiàn)對其論文零被引率的影響較大,其次是篇均作者數(shù),且兩因素的影響都隨著引文時(shí)間窗口的變小而增強(qiáng)。這樣的變化是由于引文時(shí)間窗口的縮短導(dǎo)致的?還是由于論文本身的原因造成的?還需進(jìn)一步研究。
鑒于以上分析結(jié)果,我們推測中國科學(xué)的影響力不僅來自科學(xué)內(nèi)部,也來自科學(xué)外部。中國要想降低其論文的零被引率,有必要進(jìn)一步擴(kuò)大科學(xué)合作的作者規(guī)模,規(guī)范作者的引用行為。
參考文獻(xiàn):
[1] 胡澤文.論文零被引率的演變規(guī)律及其影響因素研究[D].南京:南京大學(xué),2014.
[2] 郭永正.國際合作論文零被引率的中印比較[J].情報(bào)雜志,2014(12):89-93.
[3] Price,D.J.D.Networks of scientific papers[J].Science,1965,149(3683):510-515.
[4] Koenig,M.E.D.Bibliometric indicators versus expert opinion in assessing research performance[J].Journal of the American Society for Information Science,1983,34(2):136-145.
[5] Garfield,E.How to use citation analysis for faculty evaluations,and when is it relevant?[J].Current Conrents,1983,26(45):5-14.
[6] Abt HA.Long-term citation histories of astronomical papers [J].Publications of the Astronomical.Society of the Pacific,1981,93(552):207-210.
[7] Pendlebury,D.A.Science,Citation,and Funding[J].Science,1991,251(5000):1410-1411.
[8] 中國科技信息所,譯.美國國家科學(xué)基金匯編[S].科學(xué)和工程指標(biāo),1996:181.
[9] 中國科學(xué)院成都文獻(xiàn)情報(bào)中心戰(zhàn)略情報(bào)研究小組,編譯.《美國科學(xué)與工程技術(shù)指標(biāo)》報(bào)告綜述[R].2004.
[10] Luukkonen T,Persson O,Sivertsen G.Understanding patterns of international scientific collaboration[J].Science,Technology&Human Values,1992,17(1):101-126.
[11] Gupta BM,Dhawan S M.Measures of progress of science in India:An analysis of the publication output in science and technology[R].New Delhi:National Institute of Science,Technology and Development Studies(NISTADS),2006:29-30.
[12]Braun T,Glanctz W,Schubert A.趙紅州,蔣國華,譯.科學(xué)計(jì)量學(xué)指標(biāo)——32國自然科學(xué)文獻(xiàn)與引文影響的比較分析[M].北京:科學(xué)出版社,1989.
[13] 唐品.《科學(xué)引文索引》及其在科研評價(jià)中的作用[J].圖書與情報(bào),2005(1):68-70.
[14] 譚文華.科技政策與科技管理研究[M].北京:人民出版社,2011.
[15] Arunachalam S,Gunasekaran S.Diabetes research in India and China today:From literature-based mapping to healthcare policy[J].Current Science,2002,82(9):1086-1097.
[16] Garg K C.Scientometrics of laser research in India and China[J].Scientometrics,2002,55(1):71-85.
[17] 郭永正.學(xué)科層面國際合作結(jié)構(gòu)的中印比較——文獻(xiàn)計(jì)量學(xué)的視角[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2013(2):72-81.
[18] 劉雪立,方紅玲,周志新,等.科技期刊反向評價(jià)指標(biāo)——零被引論文率及其與其他文獻(xiàn)計(jì)量學(xué)指標(biāo)的關(guān)系[J].中國科技期刊研究,2011,22(4):525-528
[19] Stern,R.E.Uncitedness in the biomedical literature [J].Journal of the American society for information science,1990(41):193-196.
[20] R.Rousseau.Why am I not cited,or,why are multi-authored papers more cited than others?[J].Journal of Documentation,1992(48):79-80.
[21] Liang L,Zhong Z,Rousseau R.Scientists’ referencing(mis)behavior revealed by the dissemination network of referencing errors [J].Scientometrics,2014,101(3):1973-1986.