陳京蓮
三種科技文獻半衰期算法的比較研究
陳京蓮
(井岡山大學(xué)圖書館,江西,吉安 343009)
文獻半衰期是測度文獻老化速度的一個重要指標,利用文獻計量學(xué)和數(shù)理統(tǒng)計學(xué)的方法,對《工程力學(xué)》自1992年~2008年10月間的載文引文用三種半衰期的計算方法進行了計算,并且將結(jié)果和用插值法計算的結(jié)果進行了比較,計算結(jié)果表明:對《工程力學(xué)》而言,使用B-K方程計算的半衰期與插值法得到的結(jié)果最為接近。但是對超導(dǎo)專業(yè)期刊載文引文而言,新的半衰期計算公式得到的半衰期與插值法的結(jié)果最為接近。由此可見,在計算半衰期時,要選擇最合適的公式進行計算。
半衰期;文獻老化;同時法
文獻具有自身的老化規(guī)律,人們對其進行研究是因為能指導(dǎo)圖情部門的實際工作和進行科學(xué)研究。首先,可以根據(jù)老化速度的快慢,指導(dǎo)人們選購文獻,掌握文獻的老化規(guī)律,幫助人們判斷某類文獻的實效和現(xiàn)有價值。對老化越快的文獻要及時采購和迅速報道,對老化慢些的文獻可以適當讓位于那些老化快的。為了解決書刊數(shù)量的激增和存放空間日益擁擠的矛盾,要剔除那些陳舊而無用的文獻,這也必須要依據(jù)文獻的老化規(guī)律來進行。對文獻老化規(guī)律的研究,可以使剔舊變得有標準可依,而不是以主觀為主。其次對文獻老化的研究,可以揭示科技文獻在時間序列上的選擇規(guī)律,可以對某些學(xué)科當前所處的發(fā)展階段作出預(yù)測,同時也能為學(xué)科今后的發(fā)展方向和發(fā)展速度進行預(yù)測,這對于科學(xué)管理、科學(xué)規(guī)劃都有重要意義[1]。
早在1944年美國的C.F.Gosnell就提出了科技文獻老化的問題,指出科技文獻具有隨時間推移而使用頻次逐漸減少的現(xiàn)象,即老化(obsolescence)。該詞原意為“逐漸變得過時”(becoming out of date)或“某物被使用得越來越少”(something is less and less used)之意。前蘇聯(lián)情報學(xué)家米哈依洛夫認為老化是科技文獻隨著其“年齡”的增長,失去了作為情報的價值,以及越來越少被科學(xué)工作者和專家們利用的過程。文獻的老化是一個動態(tài)的概念,是針對某一類文獻集合而不是單個或者少數(shù)文獻的,研究的是某個類或?qū)W科領(lǐng)域文獻的老化規(guī)律。
人們用來衡量和揭示文獻老化的最常用的指標是文獻半衰期和普賴斯指數(shù),本文僅討論文獻半衰期的求法。文獻半衰期這一概念是1958 年首先由貝爾納( J. D. Bernal)提出的,他借用放射化學(xué)術(shù)語“半衰期”來描述科技文獻的老化速度。后來伯頓( R. E. Burton) 和開普勒( R. W. Kebler) 將文獻的半衰期(Half-Life)定義為: 在統(tǒng)計當年引用的全部參考文獻中,較新的一半是在多長一段時間內(nèi)出版的。這個定義也被稱為“中值引文年限”( median citationage)[2]。人們對文獻半衰期的研究有同時法( synchronous) 和歷時法( diachronous )兩種,兩種方法是從不同的角度出發(fā)來研究的。同時法( synchronous)是指這樣一段時間:在此期間發(fā)表了正在被利用文獻中較新的一半,也就是固定引文的數(shù)量比例(一半) 求出版年限;歷時法( diachronous )正好相反, 固定出版年限求引文的數(shù)量比例。共時半衰期通常用于評價某一學(xué)科或?qū)I(yè)文獻的老化趨勢,而不是個別文獻。歷時半衰期可以是某一學(xué)科文獻老化的半衰期,也可以是一種期刊,甚至一篇文獻老化的半衰期[3]。本文是基于共時半衰期來討論的。
文獻半衰期是測度文獻老化速度和深度的指標。不同學(xué)科文獻的老化速度是不同的,有些差異還很大,而且用不同的計算方法來計算的半衰期也有些許差異。這就提醒人們要用最合適的方法去計算,才能得出更為精確的數(shù)值。
對文獻半衰期的求法歸納起來有以下三種,即作圖法、插值法和公式法。
利用圖形來求得,具體做法是根據(jù)統(tǒng)計到的數(shù)據(jù)列成引文頻次分布表,以縱坐標表示引文累計量或百分累積量,以橫坐標表示被引文獻出版的年齡。根據(jù)文獻半衰期的定義可知,在縱坐標上引文累積量或百分累積量一半處對應(yīng)的橫坐標就是半衰期(見圖1)。作圖法是根據(jù)半衰期的定義,通過圖形形象直觀地表述半衰期的內(nèi)涵,這種方法較為粗糙,所求的半衰期也不是那么精確,但是能客觀描述半衰期,簡單易懂。
圖1 利用作圖法計算科技文獻的引文半衰期
根據(jù)統(tǒng)計的數(shù)據(jù),找出引用累積百分比最接近50%的年份,計算距離統(tǒng)計當年的間隔時間,列出計算式求出文獻半衰期,這樣求出的文獻半衰期很準確,但這只是一個單純的數(shù)值,無法形象地描述引文數(shù)量的變化過程和發(fā)展趨勢。例如由表1可知,中文引文中最接近50%的引用累積百分比是1998年,該年的引用累積量達到51.37%,距離統(tǒng)計當年即2008年是11年,根據(jù)插值法計算出《工程力學(xué)》中文引文文獻半衰期為10.74年。同理可知《工程力學(xué)》外文引文文獻半衰期為15.76年。用這種方法求出的文獻半衰期與作圖法不同,精確但不直觀。
目前人們利用的經(jīng)典公式有Burton和Kebler文獻老化方程(簡稱為B- K方程)、莫蒂列夫(B.M.MOTIЛeB)修正式。筆者根據(jù)半衰期和普賴斯指數(shù)的關(guān)系,推導(dǎo)出了一個新的半衰期計算公式[4],這里分別作一簡單介紹。
1960年美國的B.E.Burton和R.W.Kebler為了計算科技文獻老化的半衰期,得出了B- K方程:
式中是時間,以10年為單位;是經(jīng)過時間時該學(xué)科總的引文比率,所以,1-是時間以外的引文比率。該公式包括了被引文獻峰值以前的引文文獻數(shù)據(jù),因而可以說該公式描述了文獻使用過程中數(shù)量的變化情況,人們能夠根據(jù)公式的計算,繪制出文獻使用過程中的數(shù)量變化圖形。其半衰期的計算公式為:
1982年前蘇聯(lián)文獻計量學(xué)工作者莫蒂列夫提出了巴爾頓—凱普勒方程的修正式即莫蒂列夫修正式:
該修正式與原B- K方程相比有其優(yōu)勢,揭示了文獻引用過程中的延時問題。其半衰期的計算公式為:
隨著人們對文獻老化研究理論上的深入,對這兩種模型也進行了修正和完善。例如,北大學(xué)者丁學(xué)東就提出了B- K方程的級數(shù)形式,實證表明擬合效果良好。
筆者根據(jù)半衰期和普賴斯指數(shù)的關(guān)系也推導(dǎo)出了一個新的半衰期計算公式[4],所計算的文獻半衰期的范圍為1.74-15.2年,應(yīng)用范圍較廣。下面具體介紹新的半衰期計算公式的推導(dǎo)過程。
由(5)式就可以得到系數(shù)與普賴斯指數(shù)之間的關(guān)系為:
=2.649 - 4.19I(6)
如果以1/2為某學(xué)科(專業(yè))文獻的半衰期,則由(1)式可得其文獻的半衰期為:
(7) 式就是B-K方程的文獻半衰期計算公式。
聯(lián)合(6)式和(7)式,可得到科技文獻引文的半衰期與普賴斯指數(shù)之間的關(guān)系為:
從(8)式可以知道,科技文獻的半衰期與普賴斯指數(shù)的關(guān)系即不是線性關(guān)系,也不是負冪函數(shù)關(guān)系,只要知道科技文獻的普賴斯指數(shù)就可以計算出其半衰期。此外由(8)式可知,當 0≤1≤1 時,所計算的文獻半衰期的區(qū)間為:
1.74(年)≤1/2≤15.2(年)
這表明引文半衰期計算新方法所給出的文獻半衰期的區(qū)間在1/2∈[1.74,15.2]年,即它可以描述的范圍是半衰期為 1.74- 15.2 年的學(xué)科或?qū)I(yè)。而B- K方程半衰期計算公式描述的范圍是3.47-6.93年的學(xué)科或?qū)I(yè),莫蒂列夫修正式半衰期計算公式描述的范圍是3.64-7.93年的學(xué)科或?qū)I(yè),可見新的半衰期計算公式的適用范圍更大。
可見作圖法、插值法、公式法對半衰期的求法各有側(cè)重,但是公式法更具科學(xué)意義,它不僅能準確地求出各學(xué)科的半衰期,還能描述和揭示文獻引用過程中產(chǎn)生的問題,比如B-K方程的修正式揭示了文獻引用過程中的延時問題;筆者推導(dǎo)出新的半衰期計算公式則揭示了文獻半衰期和普賴斯指數(shù)的關(guān)系。這些問題的明晰對揭示半衰期的數(shù)學(xué)意義具有積極的作用,故人們致力于對它的研究。
下文將用新推導(dǎo)出的文獻半衰期計算公式、B- K方程半衰期計算公式、莫蒂列夫修正式半衰期計算公式對《工程力學(xué)》自1992年―2008年10月間的載文引文進行實證研究以比較計算的結(jié)果。
為了比較幾種半衰期的求法,本文選取應(yīng)用最廣泛的B- K方程、莫蒂列夫修正式以及筆者推導(dǎo)出新的半衰期計算公式,利用王惠翔、宋曉燕、王佳飛等2009年發(fā)表在《工程力學(xué)》上的數(shù)據(jù)(表1)和圖2分別計算半衰期,然后與用插值法求出的半衰期進行比對,看哪個計算公式的計算結(jié)果更貼近實際值?!豆こ塘W(xué)》(月刊),是中國力學(xué)學(xué)會主辦,清華大學(xué)土木系承辦的我國工程力學(xué)領(lǐng)域的重要學(xué)術(shù)期刊[5]。該刊自1984年創(chuàng)刊以來一直站在學(xué)術(shù)的前沿,報道我國工程力學(xué)領(lǐng)域的最新研究成果,吸引了本行業(yè)的專家學(xué)者在刊物上發(fā)表研究成果,培養(yǎng)了本行業(yè)的年輕新秀,是我國工程力學(xué)領(lǐng)域具有重要影響的學(xué)術(shù)刊物。
表1 《工程力學(xué)》中、外文引文的年代分布
圖2 《工程力學(xué)》中外文引文累積頻率
表2和表3分別給出了用不同文獻半衰期計算方法計算的《工程力學(xué)》和超導(dǎo)期刊的半衰期。
表2 《工程力學(xué)》半衰期的計算結(jié)果與插值法比較
表3 超導(dǎo)專業(yè)期刊半衰期的結(jié)果與插值法比較
科技文獻的老化是多個因素綜合作用的結(jié)果,一般來說,文獻老化的影響因素有文獻的增長、學(xué)科的差異、學(xué)科發(fā)展階段的差異、文獻的種類和性質(zhì)、用戶需求及情報環(huán)境等[6]。具體說來,第一、文獻的老化是與文獻增長緊密聯(lián)系在一起的,大量新的知識、新的技術(shù)、新的理念等等的出現(xiàn)都促進了現(xiàn)有文獻的老化。第二、不同的學(xué)科,具有不同的性質(zhì),其文獻的老化速度也是不同的,例如Burton和Kebler計算出化工、機械、冶金等九個學(xué)科的半衰期,最短的是冶金學(xué)科為3.9年,最長的是植物學(xué)為10.0年[7],可見不同學(xué)科的半衰期相差還很大。第三、同一個學(xué)科在不同的發(fā)展階段其半衰期也是有差異的。在發(fā)展的初級階段,半衰期會短些,成熟階段則會長些。第四、不同種類和性質(zhì)的文獻半衰期也不同。同一學(xué)科的圖書、期刊、學(xué)位論文、標準文獻等半衰期也不同,尤其是現(xiàn)在由于網(wǎng)絡(luò)技術(shù)和通訊技術(shù)的快速發(fā)展,各種電子文獻大量涌現(xiàn),這些電子文獻和紙質(zhì)文獻的半衰期也是差異顯著。第五、用戶的文獻需求特點及其所處的情報環(huán)境的質(zhì)量,也是影響文獻老化的一個不可忽視的因素[8]。對于科研人員而言,需要獲取最具前沿性的文獻資料,只有掌握了最新的知識和本學(xué)科的發(fā)展方向,才不會重復(fù)勞動,才可以“站在巨人的肩膀上”,取得新的研究成果最終推動科學(xué)的發(fā)展。從已經(jīng)計算出的《工程力學(xué)》的半衰期來看,中文引文半衰期達到了10年多,這和陳立新等人計算出的2003年力學(xué)專業(yè)期刊的半衰期為10.3488是相吻合的。陳立新等人[9]還根據(jù)計算結(jié)果得出從1954-2003年的50年間,力學(xué)專業(yè)領(lǐng)域的引文半衰期越來越長, 力學(xué)文獻的老化速度正在減慢。而本文中算出的半衰期則印證了這個結(jié)果,同時也延續(xù)了這種趨勢。究其原因,筆者估計《工程力學(xué)》的半衰期延長是因為網(wǎng)絡(luò)環(huán)境的影響,索傳軍和游毅[10]利用數(shù)據(jù)庫的分析功能,在對1994-2006年40種圖情類期刊的引文數(shù)據(jù)分析后得出結(jié)論:網(wǎng)絡(luò)環(huán)境下文獻老化延緩的現(xiàn)象具有一定的學(xué)科普遍性。因而可以猜測《工程力學(xué)》也是這種現(xiàn)象。
從表2中可知用四種方法算出的《工程力學(xué)》的中文半衰期和外文半衰期有差距,用四種方法計算的結(jié)果分別為:插值法計算出的中、外文半衰期相差5.02年;B-K方程計算出的中、外文半衰期相差3.93年;莫蒂列夫修正式計算出的中、外文半衰期相差3.88年;新的半衰期公式計算出的中、外文半衰期相差2.04年??梢娡馕奈墨I的老化速度比中文明顯要慢。
文獻半衰期測度方法依據(jù)老化模型的不同而存在數(shù)值上的顯著差異,但所反映的文獻老化總體趨勢與學(xué)科差異具有一致性[11]。盡管如此,我們在比較不同學(xué)科的半衰期時,盡量要選擇計算準確的公式來進行以保證比較結(jié)果的客觀性。
目前,經(jīng)常采用的文獻半衰期算法均是基于文獻之間的引用關(guān)系建立起來的[12],由于文獻的被引用,可表明該文獻的傳播和影響力,因而這種方法是科學(xué)可行的,文獻半衰期的計算,揭示了文獻老化的規(guī)律,所以對文獻半衰期的研究有著重要的理論意義和實際意義。目前應(yīng)用最廣泛的兩種計算方法是B-K方程和B-K方程的莫蒂列夫修正式,但人們在實際應(yīng)用過程中發(fā)現(xiàn)B-K方程的擬合結(jié)果并不理想, 其理論計算值與實際統(tǒng)計結(jié)果之間存在著顯著差異[13],而B-K方程的莫蒂列夫修正式在理論計算上比B-K方程有所改進,但這種情況也不是一概而論的。筆者首次把文獻半衰期與普賴斯指數(shù)這兩個衡量科技文獻老化速度和程度的量度指標聯(lián)系起來,并給出了這兩個量度指標之間的關(guān)系式,推導(dǎo)出了一個計算半衰期的新關(guān)系式。
筆者用B-K方程、B-K方程的莫蒂列夫修正式、新的半衰期公式三種方法對1992年―2008年10月間的《工程力學(xué)》中外文引文的半衰期進行計算,并且和插值法的結(jié)果進行比較,結(jié)果顯示(表2和表3):中文半衰期誤差比率最小的是B-K方程,為1.676%;外文半衰期誤差比率最小的也是B-K方程,為5.774%,可見,對《工程力學(xué)》的引文半衰期來說,用B-K方程來計算是最合適的。而同樣用以上三個公式計算超導(dǎo)專業(yè)期刊的半衰期時發(fā)現(xiàn),新的計算公式得到的半衰期值與插值法的最為接近(表3)??梢?,盡管半衰期的計算公式有幾個,但對不同的學(xué)科,具體情況不同,應(yīng)該選擇的公式也不同,不能偏向于某一個公式。
[1] 丁學(xué)東.文獻計量學(xué)基礎(chǔ)[M].北京: 北京大學(xué)出版社,1993:119-120.
[2] Burton R E, Kebler R W. The “half‐life” of some scientific and technical literatures[J]. American documentation, 1960, 11(1): 18-22.
[3] 郭紅梅,邵艷娥,何欽成.文獻半衰期研究現(xiàn)狀[J].醫(yī)學(xué)信息學(xué)雜志,2011,32(1):56-59.
[4] 陳京蓮,胡瑋.文獻半衰期與普賴斯指數(shù)之間的關(guān)系研究[J].大學(xué)圖書情報學(xué)刊,2010,28(1):3-5.
[5] 王惠翔,宋曉燕,王佳飛.《工程力學(xué)》載文調(diào)查、引文分析及核心著者測評[J].工程力學(xué),2009,26(1):8-16.
[6] 黃利平. 基于引文分析的文獻老化研究[J].情報雜志,2011,30(10):30-35.
[7] 丁學(xué)東.文獻計量學(xué)基礎(chǔ)[M].北京: 北京大學(xué)出版社,1993:101.
[8] 徐恩元,徐建華.文獻老化理論研究[J].四川圖書館學(xué)報,2006,154(6):63-67.
[9] 陳立新,梁立明,劉則淵.力學(xué)文獻老化速度50 年(1954- 2003) 的變化趨勢[J].現(xiàn)代情報,2006,(10):12-15,18.
[10] 索傳軍,游毅.試論網(wǎng)絡(luò)環(huán)境下圖情類文獻利用狀況[J].圖書情報工作,2010,54(7):63-67,126.
[11] 游毅,索傳軍,鐘晶晶. 科技期刊長期老化趨勢與影響因素實證研究[J]. 圖書情報工作,2011,55(12):140-144.
[12] 邱均平.信息計量學(xué)[M].武漢:武漢大學(xué)出版社,2007: 67-96.
[13] 靖培棟,劉忠厚. 科技文獻經(jīng)典老化模型的新修正[J]. 情報學(xué)報,1999, 18(1):85-90.
THE STUDY AND ANALYSIS ON THREE HALF OBSOLESCENCE LIFE CALCULATION METHODS OF SCIENCE AND TECHNOLOGY DOCUMENTS
CHEN Jing-lian
(Library of Jinggangshan University, Ji’an, Jiangxi 343009,China)
Half-life of literature is one of important index to evaluate literature obsolescence, by using the theoretical methods of bibliometrics and mathematical statistic to calculate the half-life of the "Engineering Mechanics" from Jan 1992 to Oct 2008 as an example by three methods. The comparisons of results fitted by three methods were shown that the result of B-K equation was the closest to the results calculated by interpolation method. But for data of references in superconductor journals, the result of half-life calculated by new method was the closest to the results calculated by interpolation method. So we must choose the most suitable formula when we calculate half-life of literature.
half-life; literature obsolescence; synchronous
G256
A
10.3969/j.issn.1674-8085.2014.04.012
1674-8085(2014)04-0053-05
2014-02-09;
2014-03-11
陳京蓮(1970-),女,湖南湘潭人,副研究館員,碩士,主要從事信息資源管理和計量文獻學(xué)的研究(Email: chenjinglian@jgsu.edu.cn).