(浙江旅游職業(yè)學(xué)院,浙江 杭州 311231)
在科技文獻(xiàn)計量學(xué)的三大定律中,洛特卡定律是一個揭示某一學(xué)科領(lǐng)域的核心作者與該領(lǐng)域總作者所占比的定律。在洛特卡(Lotke,Alfred James,1880-1949)所處的那個時代,他所給出的定律還能比較準(zhǔn)確的計量出核心作者的占比,但隨著20世紀(jì)中期以后科技信息爆炸時代的到來,特別是進(jìn)入21世紀(jì)后媒體的多樣化,單純以寫作論文的數(shù)量來遴選核心作者顯然是嚴(yán)重背離了科學(xué)講理的真實性。這是因為一個人也許寫的論文的數(shù)量很大,但影響力卻很小,或者影響力雖然也很高,但所影響的作者的層次相對很低,這都不能說明該作者可以進(jìn)入核心作者群,所以必須對洛特卡定律進(jìn)行修正。
洛特卡定律揭示的是某一領(lǐng)域是作為核心作者所占總作者數(shù)的比例[1]。
其具體表述為:
F(x)=c/xnx:1,2,3,…,k
(1)
(1)式中,F(xiàn)(x)為寫了x篇論文的作者數(shù)。C為寫一篇論文的作者數(shù),即C=F(1)。在科技領(lǐng)域的論文中,n通常取值為2。則上式為:
F(x)=C/x2
(2)
既:
把發(fā)表k~k′篇論文的作者數(shù)記為F(k,k′),則有:
把每人都發(fā)表了k篇論文的作者所發(fā)表論文的總數(shù)記作P(k),則有:
P(k)=kF(k)
把發(fā)表了k~k′篇論文的作者所發(fā)表論文總數(shù)記作P(k,k′),則有:
(3)
普賴斯對洛特卡定律進(jìn)行拓展得到如下結(jié)論,某領(lǐng)域中論文作者總數(shù)開平方乘以0.749所得的數(shù)為寫作該領(lǐng)域一半論文的作者數(shù)[2]。具體表述為:
(4)
從上式可以更直接地確定某一領(lǐng)域的核心作者人數(shù)M。如某領(lǐng)域共有10000名作者,則寫作其中5000篇論文的核心作者只有75人。
進(jìn)一步的計算如下:
(5)
(6)
將(4)代入(6)有:
(7)
上式為發(fā)m到xmax篇的核心作者的總數(shù)。但這個公式并無法體現(xiàn)具體哪些作者能進(jìn)入核心作者群。下面引入影響因子和h,g指數(shù)來實現(xiàn)這一目的。
期刊影響因子(Impact Factor)是美國科學(xué)情報所SCI創(chuàng)辦人加菲爾德(Eugene Garfield)提出了一個表征期刊影響大小的計量指標(biāo),鑒于文獻(xiàn)計量學(xué)家普賴斯認(rèn)為科學(xué)論文一般在其發(fā)表的一二年后即可達(dá)到被引用的峰值,因此,加氏提出的期刊影響因子的計算方法為:一種期刊在某年的影響因子等于全部源刊物在某年引證該期刊前兩年發(fā)表論文的次數(shù),與兩年間該刊所發(fā)表的全部源論文數(shù)之比。
其計算公式為:
IF(k)= (nk-1+nk-2)/(Nk-1+Nk-2)
(8)
上式中IF(k)為某年(k)的影響因子,Nk-1+Nk-2為該刊在k年的前2年發(fā)表的論文數(shù)量,nk-1+nk-2為該刊在k年的前2年被引用數(shù)量。即某刊在2018年的影響因子是其2016和2017兩年刊載的論文的被引總數(shù)除該刊在這兩年的所載論文的總數(shù)。
IF(k)能較準(zhǔn)確地反映一個刊物的影響力,但并不能因些準(zhǔn)確地反映其作者的影響力。為此,2005年J.E.Hisrhc提出一種新的科學(xué)計量評價指標(biāo)即h指數(shù)(highly cited index)。
Hisrhc提出的h指數(shù)的定義是: 將作者發(fā)表的所有N篇論文按引頻的大小遞減排序,當(dāng)且僅當(dāng)排序前h篇論文每篇論文的引頻至少為h,同時排序第h+ 1篇論文的引頻小于h+ 1時,則這個h值被定義為該作者的h指數(shù)[3]。其數(shù)學(xué)表達(dá)式為:
h=gmax(i):ci≥1
( 9)
上式中ci為第i篇文章的引頻,繪成圖像則為:
考慮到引文的影響力的不同,Egghet等提出了根據(jù)引文影響力調(diào)整權(quán)重的hw指數(shù), 即連續(xù)引文權(quán)變h指數(shù) (the continuous citation-weighted h-index) 。其數(shù)學(xué)表達(dá)式為:
(9)
上式中ui為第j篇文章被引頻次,r0是指數(shù)j的最大行,且:rw≤yj
圖1 作者的h指數(shù)與作者所發(fā)表的論文數(shù)及被引數(shù)的關(guān)系
圖2 核心作者計算程序圖
g指數(shù)是Eggle提出的反映高引頻論文的指標(biāo),這對找出精英作者更有意義[4]。
g指數(shù)是h指數(shù)的衍生指數(shù),g指數(shù)定義為:論文按被引次數(shù)排序后相對排前的累積被引至少g2次的最大論文序次g,亦即第(g+1)序次論文對應(yīng)的累積引文數(shù)將小于(g+1)2。
g= max(i):∑cici≥i2
某一領(lǐng)域的核心作者可以借助洛特卡定律確定,其中的精英作者則可以借助普賴斯定律確定,但具體哪些作者可以成為核心或精英作者則不是單純靠其寫作論文的數(shù)量可以確定的,還需要考核其論文的質(zhì)量,其客觀的評價指標(biāo)就是所刊發(fā)的期刊的影響因子,作者每篇論文的g指數(shù)的和來進(jìn)行綜合考評。
設(shè)U={u1,u1,u1,…,un},un為刊載某作者所發(fā)表的第n篇論文的刊物的影響因子與該篇論文的g指數(shù)的乘積,即:un=gn*IF(kn)
實現(xiàn)以上意圖的程序框圖如圖2。
將洛特卡定律與g指數(shù)相結(jié)合并借助數(shù)據(jù)庫檢索技術(shù),可以準(zhǔn)確而迅速地遴選出某一學(xué)科的精英作者,這對指導(dǎo)圖書館藏書建設(shè)和讀者閱讀,有著重大的意義。