,, ,
當(dāng)前,越來越多的專家、學(xué)者意識到同一期刊中不同論文的影響力存在較大差距,只以期刊影響因子評價學(xué)術(shù)論文的質(zhì)量顯得過于片面。甚至有學(xué)者認(rèn)為論文的被引頻次主要與其內(nèi)容質(zhì)量有關(guān), 而與發(fā)表期刊的影響因子關(guān)系不大[1-2]。而且,科研工作者更關(guān)心的是自己的研究成果被國內(nèi)外同行的認(rèn)可程度,而非所處文章群的平均學(xué)術(shù)水平。單篇學(xué)術(shù)論文的被引次數(shù)在一定程度上反映了人們對某項研究工作的關(guān)注程度和重視程度, 體現(xiàn)了該論文在學(xué)術(shù)交流中的作用和地位。因而, 在科研評價工作中越來越傾向于將論文的被引次數(shù)作為衡量論文重要性的客觀指標(biāo)。
基金資助為科學(xué)研究提供了必要的條件,為基礎(chǔ)科學(xué)研究的持續(xù)健康發(fā)展奠定了堅實有效的基礎(chǔ),同時也提高了科學(xué)工作者解決重大問題的能力[3]。與此同時,隨著各國科技與經(jīng)濟競爭的加劇以及科研資金投入的不斷增大,要求說明科研資金使用效益與效率、加強科研經(jīng)費的管理以及打擊學(xué)術(shù)腐敗的呼聲日益高漲。這些都使定量研究基金資助對論文的學(xué)術(shù)水平或?qū)W術(shù)影響力是否更大顯得非常必要。如果采用論文的被引次數(shù)作為論文學(xué)術(shù)質(zhì)量的表征,就需要研究基金資助論文是否比非基金資助論文獲得更高的引用次數(shù)[4-8]。
然而,類似于醫(yī)學(xué)研究中的觀察性數(shù)據(jù),由于沒有經(jīng)過隨機化分組,直接以二分類變量為分組變量,對兩組數(shù)據(jù)進(jìn)行比較是不具有可比性的。論文的累積被引次數(shù)也受很多因素(如論文發(fā)表時間)的影響,如果直接對基金論文和非基金論文的被引次數(shù)進(jìn)行比較而不考慮這些因素的影響,同樣會造成兩組論文不可比,最終造成研究結(jié)果的失真。傾向指數(shù)法的概念由Rosenbaum和Rubin在1983年首次提出,它是通過構(gòu)造每個個體的傾向指數(shù)得分,然后通過匹配等方法重新選擇研究樣本,使非隨機化的數(shù)據(jù)達(dá)到類似隨機化數(shù)據(jù)的特點,又稱為“事后隨機化”。本文采用傾向指數(shù)法研究基金資助對學(xué)術(shù)期刊論文的累積被引次數(shù)的影響,同時為研究期刊論文累積被引次數(shù)的其他影響因素提供參考。
數(shù)據(jù)來源于“中國知網(wǎng)”(http://www.edu.cnki.net)的“中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫”,進(jìn)入高級檢索,跨庫選擇只選擇“期刊”,檢索項為“關(guān)鍵詞”,檢索詞為“艾滋病”,并且匹配“精確檢索”,以保證檢索到的文獻(xiàn)資料都是關(guān)于艾滋病專題研究的期刊論文,選擇學(xué)科領(lǐng)域“預(yù)防醫(yī)學(xué)與衛(wèi)生學(xué)”??紤]到論文累積被引次數(shù)和發(fā)表時間的非線性關(guān)系,以及檢索文獻(xiàn)時2015年以后發(fā)表的論文發(fā)表時間短、被引少等情況,檢索區(qū)間限定在2010-2014年,共檢索到相關(guān)文獻(xiàn)675篇,除去非期刊論文和影響因子未查到的論文,共624篇。將所有檢索結(jié)果導(dǎo)入Excel進(jìn)行數(shù)據(jù)整理,對檢索出的文獻(xiàn)按題名、作者等進(jìn)行排序,剔除抄襲和一稿多投的文章。對入選期刊論文的特征進(jìn)行分析,內(nèi)容包括被引頻次、影響因子、基金項目、第一作者的發(fā)文量、第一作者的h指數(shù)(指其發(fā)表的Np篇論文中有h篇每篇至少被引h次、而其余Np-h篇論文每篇被引均小于或等于h次,h指數(shù)能夠很好的反映一個人的學(xué)術(shù)水平,h指數(shù)越高,表明發(fā)表論文的質(zhì)量越高[9-10])、期刊是否為中文核心和發(fā)表時間等。本研究的發(fā)表時間指下載期刊論文的時間和期刊論文發(fā)表時間的時間間隔,以年為單位。
1.2.1 傾向指數(shù)匹配法
傾向指數(shù)匹配法(Propensity Score Matching)是以處理因素(基金資助)為應(yīng)變量,混雜因素為自變量,建立logistic模型,根據(jù)模型計算每個期刊論文的傾向指數(shù)[11]。
傾向指數(shù)的定義:在給定一組協(xié)變量xi條件下,將任意一個研究對象分配到處理組或者對照組的條件概率,第i個研究對象被分配到處理組而非對照組的概率可以表示為:e(xi)=P(zi=1|xi),假定分組變量zi和協(xié)變量xi相互獨立,則對任意一個觀察變量xi[11]:
其中,P被稱為傾向指數(shù)[11]。傾向指數(shù)的主要研究方法包括匹配、分層法和協(xié)變量調(diào)整等。本文采用傾向指數(shù)最近距離匹配法對組間相同或相近的個體進(jìn)行配對,并將差值設(shè)定在某個范圍內(nèi),即為卡鉗匹配[12],該研究中卡鉗值設(shè)置為0.02,匹配比例為1:1。
1.2.2 標(biāo)準(zhǔn)化差異法
傾向指數(shù)匹配法的目的是使非隨機化的數(shù)據(jù)達(dá)到類似隨機化數(shù)據(jù)的效果。以往很多研究都是假設(shè)檢驗法來評價組間的混雜因素的均衡性,近年來,標(biāo)準(zhǔn)化差異法在傾向指數(shù)的研究中應(yīng)用較多。
連續(xù)性變量的定義是:
分類變量的定義是:
其中,PT和PC分別表示處理組和對照組中待檢驗變量的率。一般認(rèn)為,當(dāng)標(biāo)準(zhǔn)化差異小于10%時,認(rèn)為組間變量的均衡性較好[13]。
1.2.3 分析方法
對整理的數(shù)據(jù)(基金組和非基金組)分別進(jìn)行基本的統(tǒng)計描述,定量資料采用兩獨立樣本u檢驗,定性資料比較采用兩獨立樣本χ2檢驗。通過描述分析發(fā)現(xiàn)兩組間協(xié)變量分布不均衡。為了均衡混雜因素采用傾向指數(shù)匹配法,對匹配后的資料采用假設(shè)檢驗法和標(biāo)準(zhǔn)化差異法評價組間協(xié)變量是否均衡,并采用配對t檢驗對基金論文與非基金論文的被引次數(shù)進(jìn)行分析。本文用到的傾向指數(shù)匹配法由自編的R 程序?qū)崿F(xiàn),其他統(tǒng)計計算在R統(tǒng)計軟件以及Excel中進(jìn)行[14-15]。檢驗水準(zhǔn)α=0.05。
檢索到相關(guān)文獻(xiàn)675篇,除去非期刊論文和影響影子未查到的論文,共624篇,有效率為92.44%。其中基金論文192篇,占30.77%。所屬期刊影響因子小于0.5的論文所占比例最大,達(dá)到62.66%。作者的發(fā)文量主要是1篇或2篇,作者的h指數(shù)都比較低,論文的零被引率為23.72%,論文的被引次數(shù)為1-5次,被引次數(shù)在16次以上論文只有14篇(僅占2.24%),約有一半的論文作者為1-3個,核心期刊論文所占比例不足25%(表1)。
2.2.1 單篇被引頻次區(qū)間分布情況
由于選擇的文獻(xiàn)發(fā)表時間較短,624篇被引論文無論是從基金組還是從非基金組來看,多數(shù)論文被引次數(shù)均較低(0-5次),基金組單篇被引頻次在16次及以上的論文有6篇(僅占3.12%),非基金組57.41%的論文僅被引用了1-5次,26.16%的論文被引頻次為0,單篇被引頻次在16次及以上的論文有8篇(僅占1.85%)。被引論文分布呈現(xiàn)被引次數(shù)越高,分布篇數(shù)越少;被引次數(shù)越低,分布篇數(shù)越多的特點(表2)。
2.2.2 零被引率情況
2010-2014年基金論文零被引率與非基金論文零被引率的比較見表3。從表3可見,除2012年基金論文零被引率略高于非基金組零被引率外,基金論文零被引率均低于非基金論文零被引率,非基金論文零被引率是逐年增加的,到2014年零被引率達(dá)到60%。
表1 研究對象基本信息
表2 單篇被引頻次區(qū)間分布
表3 基金論文零被引率與非基金論文零被引率的比較
2.2.3 平均被引次數(shù)分布情況
2010年發(fā)表的論文非基金組獲得了較多的引用,平均被引次數(shù)為4.88,高于基金組的平均被引次數(shù);而其他年份發(fā)表的論文平均被引次數(shù)表現(xiàn)出明顯的規(guī)律性,基金組的平均被引次數(shù)均大于非基金組的平均被引次數(shù),但都呈現(xiàn)逐年遞減趨勢(圖1)。
圖1 2010-2014年論文平均被引次數(shù)分布
2.3.1 基金論文與非基金論文主要文獻(xiàn)計量指標(biāo)的均衡性分析
原始資料中入選的協(xié)變量包括影響因子、發(fā)表時間、作者個數(shù)、第一作者發(fā)文量、第一作者h(yuǎn)指數(shù)、期刊是否中文核心。采用傾向指數(shù)匹配之前,對兩組間的協(xié)變量進(jìn)行基本統(tǒng)計描述與分析,定量資料采用 檢驗,定性資料采用χ2檢驗。所有協(xié)變量中影響因子、作者個數(shù)、第一作者發(fā)文量、第一作者h(yuǎn)指數(shù)、期刊是否中文核心等變量在兩組間分配不平衡(P<0.05 ),見表4。
2.3.2 用傾向指數(shù)法匹配兩組間協(xié)變量
傾向指數(shù)匹配法通過構(gòu)建Logistic回歸模型計算傾向得分進(jìn)行匹配。有研究表明,回歸模型變量選擇的標(biāo)準(zhǔn)應(yīng)該是納入所有與結(jié)果有關(guān)的變量。本文以基金資助為因變量,影響因子(χ1)、是否中文核心(χ2)、作者個數(shù)(χ3)、第一作者發(fā)文量(χ4)、第一作者h(yuǎn)指數(shù)(χ5)、發(fā)表時間(χ6)為自變量擬合Logistic回歸模型。得傾向指數(shù)(PS)的計算公式為:
表4 傾向指數(shù)匹配前主要文獻(xiàn)計量指標(biāo)分布
以傾向指數(shù)為依據(jù),逐一對基金論文和非基金論文進(jìn)行卡鉗匹配,共有148對匹配成功。匹配之后,納入模型的6個協(xié)變量,用假設(shè)檢驗法(配對t檢驗)檢驗組間的均衡性,得到P值均大于0.05,兩組間差異無統(tǒng)計學(xué)意義,說明匹配之后兩組間協(xié)變量達(dá)到了均衡??紤]到匹配之后樣本量變小而導(dǎo)致P值增大,為了真實地表明組間協(xié)變量達(dá)到了均衡,采用標(biāo)準(zhǔn)化差異來評價均衡性,得到標(biāo)準(zhǔn)化差異均小于10%,因此可以認(rèn)為組間變量的均衡性較好(表5)。
表5 傾向指數(shù)匹配后協(xié)變量分布
2.3.3 傾向指數(shù)匹配后對兩組間的被引情況進(jìn)行分析
對匹配后的基金論文與非基金論文被引次數(shù)進(jìn)行比較,采用配對t檢驗,t統(tǒng)計量為-0.866,P>0.05,說明基金論文與非基金論文被引次數(shù)的差異不具有統(tǒng)計學(xué)意義(表6)。
表6 傾向指數(shù)匹配后兩組被引次數(shù)的比較
基金資助是科學(xué)研究必要的物質(zhì)條件,在提高創(chuàng)新能力、提高科學(xué)技術(shù)水平和促進(jìn)社會進(jìn)步等方面起重要作用,為科學(xué)事業(yè)的持續(xù)健康發(fā)展奠定了強大而堅實的基礎(chǔ),同時也提高了科學(xué)研究解決社會經(jīng)濟等重大問題的能力[6-8]。本文的結(jié)果說明基金資助對中文預(yù)防醫(yī)學(xué)論文被引次數(shù)的影響無統(tǒng)計學(xué)意義。為了使單因素分析結(jié)果更加準(zhǔn)確可靠,本文還同時采用負(fù)二項回歸模型對論文被引次數(shù)進(jìn)行多因素分析,結(jié)果同樣表明基金資助對論文被引次數(shù)的影響無統(tǒng)計學(xué)意義[5]。
造成基金論文被引次數(shù)并不比非基金論文高的原因,一方面可能是由于科研工作者為了提高科研成果的顯示度,并不把基金資助課題最核心的論文發(fā)表在國內(nèi)期刊上[16]。據(jù)文獻(xiàn)報道,1999-2009年我國內(nèi)地作者的高影響力論文 (被引用位列各學(xué)科的前 1%) 有4 433篇,其中只有51篇 (1.2%) 在內(nèi)地期刊發(fā)表[17]。論文外流現(xiàn)象不只是在中國存在,而是一個世界性的問題,這與各國科學(xué)技術(shù)發(fā)展水平有很大的關(guān)系,但是這種現(xiàn)象嚴(yán)重影響了我國科技期刊的發(fā)展。另一方面,近年來,學(xué)術(shù)期刊質(zhì)量評價體系中將基金論文比作為衡量期刊學(xué)術(shù)水平的重要指標(biāo)[5],尤其是2008年成為中文核心期刊評價指標(biāo)之一,造成很多雜志社傾向于發(fā)表標(biāo)注了基金資助的論文,而國內(nèi)期刊標(biāo)注基金論文會出現(xiàn)人為操縱的可能[5]。甚至有些作者在標(biāo)注基金項目時,可能是出于結(jié)題或為以后申請更多基金項目考慮,在發(fā)表醫(yī)學(xué)論文時多標(biāo)基金資助項目的情況,此行為會導(dǎo)致基金論文與優(yōu)質(zhì)非基金論文的質(zhì)量不存在明顯差別。
國家應(yīng)出臺相關(guān)政策公平對待國內(nèi)學(xué)術(shù)期刊論文,采取措施加強引導(dǎo),努力創(chuàng)造條件扶持重點學(xué)科創(chuàng)辦網(wǎng)絡(luò)版期刊,提高國內(nèi)期刊國際化水平,創(chuàng)辦國際化英文刊物,吸引優(yōu)秀科研成果發(fā)表在國內(nèi)期刊上發(fā)表。在論文出版和獲取方面,降低出版費用,在一定程度上實現(xiàn)論文的開放獲取,提高論文展示度和被引次數(shù)。應(yīng)全方面評價科研成果與學(xué)術(shù)期刊,不能過度依賴影響因子、基金論文比等量化指標(biāo),應(yīng)讓科研評價工作回歸到科學(xué)本身上來。不過分量化科研成果,而通過同行評議與學(xué)術(shù)影響力本身來評價科研工作者、科研成果、學(xué)術(shù)期刊是抑制論文外流最重要的方法,最終推動我國整個科學(xué)事業(yè)尤其是學(xué)術(shù)期刊的發(fā)展。
在審理論文時,期刊編輯部嚴(yán)格加強對基金立項書進(jìn)行審核,同時要求論文作者提供基金項目的所有信息,包括研究方向,期刊社要仔細(xì)核查論文是否符合本課題內(nèi)容,然后決定是否標(biāo)注。審稿是期刊工作中權(quán)威性很強的一項工作,因此雜志社建設(shè)科學(xué)合理的審稿專家隊伍是非常有必要的。
科研工作者要積極主動投身科學(xué)事業(yè),不應(yīng)過分追求獲得基金資助而忽略了科研工作本身,在現(xiàn)有的科研資源下開拓進(jìn)取、努力創(chuàng)新、堅持不懈才能使自己的科研成果真正具有價值。科研工作者在發(fā)表論文標(biāo)注基金項目時,要恪守科研道德,實事求是地列出受資助的基金項目,使基金論文比成為一個更科學(xué)、有效的期刊評價指標(biāo)。