■張良輝 董國雅 劉 虹
1)四川農(nóng)業(yè)大學圖書館,四川省雅安市雨城區(qū)新康路46號 625014
2)西南石油大學圖書館,四川省成都市新都區(qū)新都大道8號 610500
期刊刊載的文獻并非所有的都會獲得被引,在被引用過的文獻中,各期刊之間的被引頻次相差非常懸殊;即使是同一期刊刊載的文獻,被引頻次也是呈不均衡分布的??蒲泄ぷ髡哂捎谑軙r間和精力的約束以及出于文獻可信度等方面的考慮,傾向于引用有較高學術影響力的期刊刊載的文獻;科研工作者又傾向于把研究成果發(fā)表于較高影響因子等高評價指標的具有較高影響力的期刊,以獲得更廣泛的同行承認。而期刊則傾向于從來稿中選擇并刊載有較高創(chuàng)新性的研究成果,以獲得較高的同行承認。科研工作者及期刊的長期互動,使得高影響力期刊刊載的文獻較多被高影響力期刊的其他刊載的文獻所引用。學者基于期刊學術影響力的擇刊發(fā)表和擇高被引文獻引用,形成了期刊文獻之間引用與被引用的關系。期刊的學術影響力、期刊對稿件的錄用標準和期刊所刊載文獻的學術影響力三者之間存在著同向加強的機制,因此期刊的學術影響力與期刊所刊載的文獻影響力總體上存在著正相關的關系[1,2]。在期刊作者、讀者和期刊的長期互動下,期刊在學術影響力方面客觀地呈現(xiàn)出分層現(xiàn)象,本質上是科研工作者長期互動的結果[3],這不僅導致了大量高水平的研究成果發(fā)表在少數(shù)影響力較高的期刊上,也導致了大量文獻的引用主要集中于少量影響力較高的期刊及文獻。
科研工作者在文獻引用方面由于各種因素的存在而具有一定的偶然性[1],雖然個人的選擇行為會包含非學術性的動機和偏好,但當統(tǒng)計量達到一定閾值時,學者對期刊學術影響力的共識性判斷就會顯露出來。20世紀60年代,美國科學社會學家默頓(Merton)指出同行承認是反映科學家社會角色被同行承認的指標,是科學王國的硬通貨[4]。在科學研究的資源分配體制中,同行承認是給予科研工作者科研資源分配的重要依據(jù)[5]。高被引文獻不能說都很重要,但重要的文獻通常都具有較高的同行承認,因而具有較高的被引量,少數(shù)高水平論文貢獻了期刊絕大多數(shù)的被引頻次,期刊的影響力主要是由少數(shù)高被引文論文(high cited paper)貢獻的,近年來已有學者對高被引論文做了大量的關于引文偏態(tài)分布的研究。Seglen通過分析發(fā)現(xiàn)引文數(shù)據(jù)具有冪律分布特征,是典型的偏態(tài)分布[6]。Glanzel[7]和 Bornmann等[8]認為用算術平均值來反映引用的集中趨勢可能歪曲引用的真實分布,并發(fā)現(xiàn)了引文是非正態(tài)分布的。Vinkler認為使用影響因子對文獻被引測度反映的不是文獻的真實被引量,并證明了引文分布具有右偏性[9]。Adler等認為,根據(jù)冪律法則,算術平均數(shù)主要反映了部分高被引文獻的引用值,引文分布同樣具有右偏性[10]。Van Raan的研究發(fā)現(xiàn)將引文數(shù)據(jù)作為單一平均值的做法,其評價結果會遠高于或低于論文的真實影響[11]。俞立平首次采用基尼系數(shù)分析期刊評價指標的內部差距,發(fā)現(xiàn)期刊評價指標普遍是右偏的,并且不服從正態(tài)分布[12]。這些研究都發(fā)現(xiàn)引文分布是偏態(tài)分布,引文大量集中在了少數(shù)的文獻上。
1934年,英國文獻學家布拉德福(Bradford)認為學術期刊核心區(qū)(nucleus)是專題文獻較為密集的期刊,并首次提出了文獻集中與離散規(guī)律[13];1955年,加菲爾德(Garfield)博士發(fā)現(xiàn)期刊的影響可以通過論文的被引頻次來測度[14]。隨著引文分析法的進一步發(fā)展,核心區(qū)期刊表現(xiàn)出了學術質量較高的特性,引證分析成為了評價期刊影響力的有效手段,核心區(qū)的期刊即為核心期刊[15]。
期刊文獻的引用是典型的偏態(tài)分布,那么能不能基于引文偏態(tài)分布并通過某些方式找到期刊刊載文獻的核心區(qū)呢?因此,本文根據(jù)期刊論文被引頻次不均的特點,基于論文被引頻次提出期刊文獻核心區(qū)的概念。期刊文獻核心區(qū)是某期刊刊載文獻的核心區(qū),也就是在某一時期內,某一期刊所刊載的全部文獻中的高被引文獻部分,這部分文獻即為期刊文獻核心區(qū)。期刊文獻核心區(qū)有如下特征:第一,核心區(qū)的文獻總體上有著較高的被引頻次;第二,核心區(qū)文獻占期刊載文量比值較低;第三,核心區(qū)的文獻篇均被引頻次較高。
目前關于期刊核心區(qū)的研究大多是關于某學科的劃分學科核心期刊及其相關研究,而關于期刊文獻的核心區(qū)劃分還鮮見報道,僅有嚴建新等基于被引頻次對Nature和Science的引刊做了核心區(qū)劃分的嘗試性研究[16,17]。那么,從期刊影響力的角度看,怎樣的區(qū)域是受到特別重視獲得了較高的被引量,能對期刊影響力產(chǎn)生特別的影響?如何找到期刊文獻的核心區(qū)?用H指數(shù)和二八法則能劃分出核心區(qū)嗎?劃分出的核心區(qū)是H指數(shù)還是二八法則更具有集中性?這些問題都將是本研究的重點。
本文的研究對象為WoS收錄的圖書情報學(Information Science and Library Science,LIS)領域的期刊,在WoS中共檢索到84種期刊15592篇文獻的數(shù)據(jù)。本研究中分別記錄這15592篇文獻的被引頻次,作為研究的主要數(shù)據(jù)。本研究中的數(shù)據(jù)收集時間為2015年3月10日至2015年3月20日。
2005年美國加州大學圣迭哥分校Hirsch教授提出了 H指數(shù)(H-index)[18]并用 H指數(shù)評價科學家的學術成就,之后經(jīng)過延伸和擴展,H指數(shù)被應用到學術期刊評價[19]。Martínez用 H指數(shù)的方法選出了經(jīng)典引文[20],本文期刊文獻核心區(qū)的劃分借鑒了這一做法。
1897年,意大利經(jīng)濟學家帕累托(Pareto)發(fā)現(xiàn)20%的人占有80%的財富并提出了“二八法則”;1969年,美國學者特魯斯維爾(Trueswell)研究館藏與流通的時候發(fā)現(xiàn)圖書館流通量的80%產(chǎn)生于館藏量的20%,將二八法則引入到了館藏研究中[21]。李江等研究發(fā)現(xiàn)20%的期刊占據(jù)了80%的被引頻次,因此推測在期刊文獻的引用方面二八法則普遍存在[22]。
本研究采用H指數(shù)和二八法則對采集到的數(shù)據(jù)進行期刊文獻核心區(qū)的劃分,并分析了期刊核心區(qū)劃分的差異。其數(shù)據(jù)處理的具體方法為:第一,記錄一種期刊所有的文獻的被引頻次并按降序排列;第二,用H指數(shù)法遴選出H核內文獻,用二八法則遴選出占總被引頻次百分之八十的文獻;第三,計算遴選出的文獻量與期刊載文量的比值,其余83種期刊做相同的處理,所得到的數(shù)據(jù)即為本研究的數(shù)據(jù)。
從圖1可知,按H指數(shù)來劃分核心區(qū),每種期刊其核心區(qū)文獻量與期刊載文量的比值均小于按二八法則劃分的核心區(qū),說明按H指數(shù)來劃分的期刊文獻核心區(qū)比按二八法則劃分的文獻核心區(qū)更具集中趨勢。
嚴建新對Nature和Science期刊被引核心區(qū)的研究表明,8942種施引期刊中4.1%的期刊集中了被引量的80%,20%的期刊集中了被引量的93.5%,引文分布的集中情況遠高于二八法則[17]。從表1可知,采用二八法則劃分文獻核心區(qū),被引頻次達百分之八十的文獻量占總文獻量為6.12%~48.61%,均值為33.81%;而采用H指數(shù)劃分文獻核心區(qū),其核心區(qū)文獻量占總文獻量為0.56%~26.09%,均值為7.80%。
圖1 核心區(qū)文獻占載文量比值
表1 H指數(shù)與二八法則核心區(qū)文獻量與期刊載文量比值
計算H指數(shù)劃分的文獻核心區(qū)、二八法則劃分的文獻核心區(qū)和期刊全部文獻的篇均被引頻次。從圖2可知,其篇均被引頻次均呈現(xiàn)出H指數(shù)劃分的文獻核心區(qū)>二八法則劃分的文獻核心區(qū)>期刊全部文獻。每種期刊的核心區(qū)文獻篇均被引頻次均呈現(xiàn)出H指數(shù)劃分的文獻核心區(qū)最高的趨勢。
從表2可知,核心區(qū)文獻篇均被引頻次與期刊總文獻被引頻次比值均呈現(xiàn)出H指數(shù)劃分的文獻核心區(qū)>二八法則劃分的文獻核心區(qū),并且H指數(shù)劃分的文獻核心區(qū)篇均被引頻次與期刊所有文獻篇均被引頻次最大值達到19.66倍之多。H指數(shù)劃分的文獻核心區(qū)與二八法則劃分的文獻核心區(qū)之比最高達3.61。
表2 核心區(qū)文獻篇均被引頻次比值
圖2 核心區(qū)不同劃分方式篇均被引頻次
縱觀學科總體,我們以整個學科按H指數(shù)和二八法則來劃分核心區(qū),來分析H指數(shù)和二八法則的差異。通過對學科所有載文的計算得出學科H指數(shù)為75,其核心區(qū)文獻占總文獻量為0.67%,占總被引頻次為8.58%;而二八法則劃分文獻核心區(qū),其核心區(qū)的被引量占總文獻量百分之八十的文獻量為38.05%。H指數(shù)來劃分的期刊文獻核心區(qū),被引頻次達到76次的文獻為核心區(qū)文獻;而二八法則劃分文獻核心區(qū),被引頻次達到6次的文獻為核心區(qū)文獻。就學科而言,6次的被引頻次相對來說是較低的,76次的被引頻次是較高的,如何在節(jié)省各種資源的情況下找到核心區(qū)的文獻,選擇較低被引頻次作為閾值,那么將浪費巨大的資源;選擇較高的被引頻次作為閾值,則會節(jié)省資源。因此從學科的角度來看,采用H指數(shù)來劃分的期刊文獻核心區(qū)比按二八法則劃分的文獻核心區(qū)更具集中趨勢,能節(jié)約大量資源而精確定位核心區(qū)文獻。
表3 學科H指數(shù)與學科二八法則核心區(qū)差異
本研究中采用H指數(shù)劃分文獻核心區(qū),其核心區(qū)文獻量占總文獻量為0.56%~26.09%,均值為7.80%;而采用二八法則劃分文獻核心區(qū),其占被引量百分之八十的文獻量占總文獻量為6.12%~48.61%,均值為33.81%。就整個學科而言,按H指數(shù)和二八法則來劃分核心區(qū),通過對學科所有載文的計算得出學科H指數(shù)為75,其核心區(qū)文獻占總文獻量為0.67%,占總被引頻次為8.58%;而二八法則劃分文獻核心區(qū),其核心區(qū)的被引量占總文獻量百分之八十的文獻量為38.05%。H指數(shù)劃分的文獻核心區(qū)與二八法則劃分的文獻核心區(qū)相比,其篇均被引頻次均呈現(xiàn)出H指數(shù)劃分的文獻核心區(qū)>二八法則劃分的文獻核心區(qū),并且H指數(shù)劃分的文獻核心區(qū)篇均被引頻次為二八法則劃分的文獻核心區(qū)的數(shù)倍。
嚴建新等的研究發(fā)現(xiàn)引用Nature和Science最多的都是美國科研機構的學者,且引用Nature比引用Science多32%。中國科研機構的學者引用Science略多于引用Nature,其他國家的學者更多地是引用Nature[16]。本研究發(fā)現(xiàn)采用H指數(shù)來劃分期刊文獻核心區(qū)比采用二八法則來劃分期刊文獻核心區(qū)更具有集中優(yōu)勢,與嚴建新研究Nature和Science引刊發(fā)現(xiàn)現(xiàn)實被引頻次比二八法則具有更高的集中度有著相似性。
較少論文擁有較多的被引頻次,而大量的論文擁有的僅為較少的被引頻次,由于馬太效應,高被引論文會獲得持續(xù)的關注,因而能獲得持續(xù)的被引頻次,而低被引論文隨時間的推移獲得高被引的概率不大,除非是“睡美人”的蘇醒。期刊文獻核心區(qū)是期刊所受到特別重視的文獻部分,這揭示了期刊管理的另一種模式,即并非全面、均衡的讓所有文獻獲得均衡的被引頻次,而是著眼于某些具有特別意義或重要性的文獻,利用起對于期刊被引頻次的優(yōu)勢地位,以實現(xiàn)期刊影響力的擴大。這一模式有助于揭示期刊影響力管理的方式及變化,探討期刊文獻核心區(qū)在期刊全部載文結構中的地位和作用,分析核心區(qū)和非核心區(qū)差異的形成原因、過程及對期刊的影響。抓住了期刊文獻被引頻次極度不均衡這一重要特征,并進一步指出期刊提高影響力的根本途徑——通過深度挖掘高被引論文和“睡美人”論文而提高期刊影響力。特別應注意的是期刊文獻核心區(qū),決不是固定不變的,而是會隨著被引頻次的改變而變化。隨著“睡美人”論文的挖掘,低被引及零被引論文獲得了較高的被引頻次時,這些論文成為了高被引論文,期刊將會建立新的文獻核心區(qū)。
跟蹤某一學科領域近幾年的熱點論文,分析熱點論文的特征、屬性,了解行業(yè)學科發(fā)展態(tài)勢,從而使得在組約稿過程中做到有的放矢,這對于提高期刊的學術水平無疑具有重要促進作用[23]。本研究發(fā)現(xiàn)按H指數(shù)來劃分的期刊文獻核心區(qū)比按二八法則劃分的文獻核心區(qū)更具集中趨勢,因此編輯可以根據(jù)H指數(shù)的劃分核心區(qū)的方式迅速抓住學科發(fā)展動向并約請到熱點文章,使這些文獻成為期刊的高被引文獻,并提高期刊影響因子等一系列期刊影響力評價指標[24],同樣,科研工作者也可以根據(jù)相同的方法找出當前的研究熱點從而把握研究方向。
本研究選擇的期刊發(fā)文年代是一個時間跨度,隨著年份的增加,期刊文獻的被引頻次有所改變,因此,發(fā)表時間較近的文獻由于時間關系或許沒有成為高被引文獻,這對本研究產(chǎn)生了一定的影響。這需要從歷史的角度來加以追蹤,并挖掘“睡美人”論文建立新的期刊文獻核心區(qū)。H指數(shù)劃分期刊文獻核心區(qū),提供了一種定位文獻的新方式,但是不同學科的期刊在學術維度上的分層存在著巨大的差異,學科的百分比也存在著巨大的差異,使用不同的方式方法劃分期刊文獻核心區(qū),并進一步研究期刊在學術緯度上的分層機制將是我們今后研究的一個方向。
[1]邱均平,嵇麗.美國《科學引文索引》與科學評價研究[J].科研管理,2003,24(4):22-28.
[2]邱均平.關于核心期刊幾個問題的思考[J].圖書情報知識,1995(4):16-19.
[3]嚴建新,王續(xù)琨.中國科學技術期刊的學術分層機制[J].科學學研究,2008,26(1):52-57.
[4]默頓.科學社會學[M].魯旭東,林聚任,譯.北京:商務印書館,2003:395-397.
[5]李正風.科學知識生產(chǎn)方式及其演變[M].北京:清華大學出版社,2006:209-223.
[6]Seglen PO.The skewness of science[J].Journal of the American Society for Information Science,1992,43(9):628-638.
[7]Gl?nzelW.Seven Myths in Bibliometrics About facts and fiction in quantitative science studies[J].Collnet Journal of Scientometrics and Information Management,2008,2(1):9-17.
[8]Bornmann L,Mutz R,Neuhaus C,et al.Citation counts for research evaluation:standards of good practice for analyzing bibliometric data and presenting and interpreting results[J].Ethics in Science and Environmental Politics,2008(1):93-102.
[9]Vinkler P.Introducing the Current Contribution Index for characterizing the recent,relevant impact of journals[J].Scientometrics,2009,79(2):409-420.
[10]Adler R,Ewing J,Taylor P.Citation statistics[J].Statistical Science,2009(1):1-14.
[11]Van Raan,Anthony F J.Measurement of Central Aspects of Scientific Research:Performance,Interdisciplinarity,Structure[J].Measurement Interdisciplinary Research&Perspectives,2005,3(1):1-19.
[12]俞立平,劉愛軍.指標數(shù)據(jù)分布與內部差距對學術期刊評價的影響——以JCR數(shù)學期刊為例[J].圖書情報工作,2014,58(21):105-110.
[13]Bradford S C.Sources of information on specific subjects[J].Engineering,1934,137(3550):85.
[14]Garfield E.Citation indexes for science:a new dimension in documentation through association of ideas.[J].Science,1955,122(3159):108-111.
[15]Garfield E.Citation analysis as a tool in journal evaluation[J].Science,1972,178(4060):471-479.
[16]嚴建新,蘇芳荔,徐莉莉.期刊引證形象的量化表達——以2010年Nature和Science的引證形象為例[J].圖書情報工作,2014,58(21):99-104.
[17]嚴建新,徐莉莉,蘇芳荔,等.Nature和Science期刊基礎核心區(qū)的劃分——基于其2003~2012年載文的引刊分析[J].中國科技期刊研究,2014,25(2):264-270.
[18]Hirsch JE.An index to quantify an individual's scientific research output[J].Proceedings of the National Academy of Sciences,2005,102(46):16569-16572.
[19]Braun T,Gl?nzel W,Schubert A.A Hirsch-type index for journals[J].Scientometrics,2006,69(1):169-173.
[20]Martínez M A,Herrera M,López-Gijón J,et al.H-Classics:characterizing the concept of citation classics through H-index[J].Scientometrics,2014,98(3):1971-1983.
[21]Trueswell R L.Some Behavioral Patterns of Library Users:The 80/20 Rule.[J].Wilson Libr Bull,1969,43(5):458-461.
[22]李江,伍軍紅,孫秀坤.中國科技期刊的“核心區(qū)”研究——基于布拉德福定律與二八法則的統(tǒng)計分析[J].中國科技期刊研究,2011,22(6):869-873.
[23]丁佐奇,王明華.基于ESI的植物動物學研究領域熱點論文分析及對編輯組稿的啟示[J].中國科技期刊研究,2014,25(11):1384-1390.
[24]任勝利.國際學術期刊出版動態(tài)及相關思考[J].中國科技期刊研究,2012,23(5):701-704.