宗張建
(南京醫(yī)科大學(xué) 圖書館,江蘇 南京 211166)
引文是表征期刊學(xué)術(shù)影響力的重要方式。 1955年,E.Garfield 首次基于“引用關(guān)系”提出影響因子的概念;1963 年,E.Garfield 與H.Irving 創(chuàng)立期刊影響因子(JIF);1976 年,E.Garfield 創(chuàng)辦的科學(xué)信息研究所出版了第一期期刊引證報(bào)告(JCR),報(bào)告提供了詳細(xì)的期刊引用數(shù)據(jù),并發(fā)布了完整的影響因子列表[1]。 至此,這種利用引文分析評估期刊影響力的方法得到了期刊出版乃至科研人員的廣泛關(guān)注,影響因子也成為影響最大、使用最廣泛的期刊影響力計(jì)量指標(biāo)。 然而,影響因子也存在諸多局限,如不能排除自引操縱、評價(jià)周期過短、引文同質(zhì)對待、不能跨學(xué)科比較等。 因此,近年來JCR 相繼推出他引影響因子(JIF Without Self Cites)、五年影響因子(5 Year JIF)、特征因子(Eigenfactor)、論文影響力(Article Influence Score)、影響因子百分位(JIF Percentile)等計(jì)量指標(biāo),用以補(bǔ)充和豐富期刊評價(jià)指標(biāo)庫。 2021 年,JCR 再增加了一個(gè)新指標(biāo)——Journal Citation Indicator(JCI)。科睿唯安公告宣稱,該指標(biāo)通過對不同科研領(lǐng)域、文獻(xiàn)類型以及引用比率進(jìn)行標(biāo)準(zhǔn)化處理,以便于跨學(xué)科解釋和比較[2]。
引文標(biāo)準(zhǔn)化(Standardization)處理是消除文獻(xiàn)發(fā)表時(shí)間、類型以及學(xué)科差異的有效方法。 JCI 作為JCR 新提出指標(biāo),其計(jì)算原理、與影響因子的差異、指標(biāo)數(shù)值分布特點(diǎn)、與其他期刊影響力指標(biāo)相關(guān)度等均需進(jìn)一步深入分析。 本文從JCI 計(jì)算原理入手,通過實(shí)證數(shù)據(jù)分析指標(biāo)數(shù)值分布特征以及與影響因子的區(qū)別,并通過相關(guān)性檢驗(yàn),進(jìn)一步分析JCI 與其他期刊計(jì)量指標(biāo)的關(guān)系。
學(xué)科規(guī)范化引文影響力指標(biāo)(Category Normalized Citation Impact,CNCI)是JCI 的上游指標(biāo),該指標(biāo)可實(shí)現(xiàn)論文級(jí)別的被引頻次標(biāo)準(zhǔn)化[3]。 具體是,對于單篇論文i,當(dāng)其僅歸屬于一個(gè)學(xué)科領(lǐng)域時(shí),其CNCI值是通過其實(shí)際被引次數(shù)除以同文獻(xiàn)類型、同出版年、同學(xué)科領(lǐng)域文獻(xiàn)的期望被引次數(shù)獲得的。 計(jì)算公式如下:
但當(dāng)一篇論文i歸屬于n個(gè)學(xué)科領(lǐng)域時(shí),則該篇論文的CNCI 值為每個(gè)學(xué)科領(lǐng)域?qū)嶋H被引頻次與期望被引次數(shù)比值的平均值:
式中:ci為單篇論文被引頻次;e表示同學(xué)科同出版年同文獻(xiàn)類型的論文平均被引次數(shù)(基線);f,t,d分別表示學(xué)科領(lǐng)域、年份和文獻(xiàn)類型;n為論文歸屬的學(xué)科數(shù)量。
CNCI 排除了出版年、學(xué)科領(lǐng)域與文獻(xiàn)類型對被引頻次的影響,是一個(gè)無偏影響力指標(biāo)。 在實(shí)踐中,通常還可以通過計(jì)算一組論文集CNCI 的平均數(shù),實(shí)現(xiàn)不同分析對象(如國家、機(jī)構(gòu)等)學(xué)術(shù)成果影響力的比較。 JCI 的定義就是期刊過去3 年發(fā)表的所有論文和綜述的CNCI 平均值[2],計(jì)算方式如下。
式中,θ表示JCR 出版年。 CNCI 的基準(zhǔn)值是1,當(dāng)論文CNCI 值高于1 時(shí),表明論文引用超過全球平均水平;當(dāng)論文CNCI 值低于1 時(shí),則表明論文引用低于全球平均水平。 同理,數(shù)值1 也是衡量期刊引用表現(xiàn)的基準(zhǔn)值。 當(dāng)JCI 值高于1 時(shí),表明該期刊超過所有期刊的平均引用水平;當(dāng)JCI 低于1 時(shí),即表明該期刊引用表現(xiàn)未達(dá)到平均引用水平。
為了了解JCI 數(shù)值的基本特點(diǎn),本文選擇數(shù)學(xué)學(xué)科(Mathematics)期刊為研究對象。 在2020 年度JCR中,數(shù)學(xué)學(xué)科是期刊數(shù)量最多的學(xué)科,較大的樣本量可保證研究的穩(wěn)健性[4]。 但需注意的是,2020 年度JCR 較往期出現(xiàn)較大變化。 變化之一就是擴(kuò)大了JCR 收錄期刊的范圍,不僅包含原有的SCI/SSCI 期刊,同時(shí)還將ESCI 等索引期刊納入。 如2020 年度JCR 收錄的471 本數(shù)學(xué)學(xué)科期刊中,SCIE 收錄期刊有330 本,ESCI 期刊則有141 本。 但ESCI 期刊沒有獲得期刊影響因子以及相關(guān)衍生指標(biāo)數(shù)據(jù)。 此外,部分SCIE 期刊也存在少數(shù)指標(biāo)數(shù)據(jù)缺失的情況。 因此,為了保證分析數(shù)據(jù)的完整性,本次研究盡量納入全部樣本數(shù)據(jù),并利用SPSS 18.0 對相關(guān)數(shù)據(jù)進(jìn)行分析。各指標(biāo)的描述統(tǒng)計(jì)如表1 所示。
表1 指標(biāo)描述統(tǒng)計(jì)
對471 本樣本期刊JCI 數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn),頻數(shù)分布圖(見圖1)和正態(tài)Q-Q 圖(見圖2)均提示JCI數(shù)值不服從正態(tài)分布。 以基準(zhǔn)值1 為分界值,471 本期刊中,JCI 低于基準(zhǔn)值的期刊有350 本,占全部期刊的74.3%;JCI 等于或高于基準(zhǔn)值1 的期刊有121 本,占全部期刊的25.7%。 即使在SCIE 期刊中,也有216 本期刊JCI 值低于1,占全部SCIE 期刊的65.5%。 因此,JCI 數(shù)值呈偏態(tài)分布,引用水平低于平均水平的期刊占多數(shù)。
圖1 JCI 頻數(shù)分布圖
圖2 JCI 的正態(tài)Q-Q 圖
進(jìn)一步比較JCI 與影響因子的統(tǒng)計(jì)學(xué)特征,以330 本同時(shí)包含兩項(xiàng)指標(biāo)數(shù)據(jù)的SCI 期刊為研究對象,對比分析兩項(xiàng)指標(biāo)極值、極差、均值、標(biāo)準(zhǔn)差、偏度和峰度的差異。 結(jié)果(見表2)顯示,JCI 數(shù)值分布的極差、均值以及標(biāo)準(zhǔn)差均小于影響因子。 這表明,JCI的離散性較小,且JCI 的值比影響因子更為集中,JCI減弱了具有較高影響因子期刊的優(yōu)勢。 此外,JCI 數(shù)值的偏度和峰度稍高于影響因子,表明JCI 數(shù)據(jù)的不對稱性和陡峭性高于影響因子。
表2 JCI 與影響因子的統(tǒng)計(jì)學(xué)特征分析
為了分析JCI 與其他文獻(xiàn)計(jì)量指標(biāo)的關(guān)系,本文采用斯皮爾曼(Spearman) 相關(guān)系數(shù)進(jìn)行分析。Spearman 相關(guān)系數(shù)可用于非正態(tài)分布數(shù)值的相關(guān)性檢驗(yàn)。 分析結(jié)果(見表3)顯示,JCI 與影響因子、5 年影響因子、他引影響因子以及影響因子百分位高度正相關(guān),相關(guān)系數(shù)在0.9 左右;與總被引頻次、即年指標(biāo)、特征因子、標(biāo)準(zhǔn)化特征因子、論文影響分值中度正相關(guān);與載文量、引用半衰期相關(guān)度較低。 此外,被引半衰期的相關(guān)系數(shù)沒有通過統(tǒng)計(jì)檢驗(yàn)。
表3 相關(guān)系數(shù)
相較于影響因子,JCI 的優(yōu)點(diǎn)表現(xiàn)在兩個(gè)方面。首先,JCI 延長了期刊引用區(qū)間。 影響因子計(jì)算的引用區(qū)間是2 年,而JCI 將引用區(qū)間延長為3 年,這在一定程度降低了不同主題領(lǐng)域引用行為的差異。 其次,JCI 采用了論文出版后所有的引用,并將其進(jìn)行標(biāo)準(zhǔn)化處理,而影響因子只采用了論文在JCR 當(dāng)年的引用,且未經(jīng)過標(biāo)準(zhǔn)化處理。 經(jīng)過標(biāo)準(zhǔn)化處理后的數(shù)據(jù)可以按照一個(gè)統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行比較,增強(qiáng)了數(shù)據(jù)的可比性。
但從指標(biāo)特征本質(zhì)上看,JCI 與影響因子一樣,均屬于平均數(shù)指標(biāo)。 影響因子可認(rèn)為是期刊論文平均被引頻次;而JCI 則是期刊的標(biāo)準(zhǔn)化平均被引頻次,其分母為期刊論文集合的論文數(shù)量,分子是標(biāo)準(zhǔn)化的論文總被引頻次。 這一點(diǎn)或許解釋了JCI為何與影響因子及其相關(guān)衍生指標(biāo)高度正相關(guān)的原因。 因此,JCI 在指標(biāo)設(shè)計(jì)上仍存在與影響因子類似的缺陷。 首先,JCI 作為平均數(shù)指標(biāo),容易受期刊高被引論文和零被引論文引用極值的影響。其次,JCI 沒有對期刊的自引情況進(jìn)行相應(yīng)的處理,因此JCI 不能排除自引操縱。 最后,JCI 存在引文同質(zhì)對待。 JCI 將每一條引文的作用都看成是相同的,沒有區(qū)分不同引用的權(quán)重,因而沒有體現(xiàn)高影響力引文在期刊評價(jià)中的重要性。
盡管科睿唯安聲稱JCI 作為一個(gè)單一的期刊級(jí)別指標(biāo),為輕松地進(jìn)行跨學(xué)科解釋和比較提供了可能。 但TheScholarlyKitchen編輯P.Davis 依然從計(jì)算結(jié)果的科學(xué)性、透明度以及可重復(fù)性提出了質(zhì)疑[5]。JCI 的第一個(gè)挑戰(zhàn)是計(jì)算結(jié)果的科學(xué)性。 JCI 的計(jì)算嚴(yán)重依賴期刊學(xué)科劃分體系,而Web of Science(WoS)的期刊分類多基于“刊與刊”的關(guān)系。 目前,WoS 數(shù)據(jù)庫使用235 個(gè)學(xué)科類別,但隨著科學(xué)的發(fā)展,期刊的主題可能隨著時(shí)間而變化。 此外,大約三分之一的期刊被分配到多個(gè)主題類別中。 種類繁多的主題可能對JCI 的計(jì)算造成混亂。 JCI 的第二個(gè)挑戰(zhàn)是數(shù)據(jù)透明度和可重復(fù)性。 JCI 依賴學(xué)科數(shù)據(jù)集的平均引用次數(shù),但對于大多數(shù)用戶而言,用于重新創(chuàng)建指標(biāo)的整個(gè)數(shù)據(jù)集和方法基本上是不可行的。