劉富康,茍震宇,黃文彬,步 一
一般認(rèn)為科學(xué)文獻(xiàn)的生命力取決于其他文獻(xiàn)對該文獻(xiàn)的引用,而科學(xué)文獻(xiàn)的使用頻率會隨文獻(xiàn)年齡增長而下降,該現(xiàn)象稱為“科學(xué)文獻(xiàn)老化”或“文獻(xiàn)老化”(Literature obsolescence)[1]。文獻(xiàn)老化這一概念最早于1927 年由情報學(xué)家Gross提出。通過對期刊Chemical Literature的引用數(shù)據(jù)進(jìn)行分析,Gross發(fā)現(xiàn)文獻(xiàn)在發(fā)表15年后引用數(shù)量達(dá)到總引用次數(shù)一半[2-4]。1943 年Gosnell對文獻(xiàn)老化展開更深入的理論研究[5],從老化速率角度分析三份高校圖書館藏書清單,提出知識載體會隨著時間推移逐漸失去價值。此后文獻(xiàn)老化研究迅速發(fā)展,并大量引入定量研究方法。1958年Bernal在國際科學(xué)信息會議上首次提出使用“半衰期”衡量科技文獻(xiàn)的老化速率[1-2];1960年Burton等對科學(xué)文獻(xiàn)“半衰期”進(jìn)行深入研究,提出經(jīng)典的引文老化負(fù)指數(shù)模型——Burton-Kebler 模型[6];1971 年 Price 提出普賴斯指數(shù)(Price Index)用以衡量各學(xué)科領(lǐng)域文獻(xiàn)老化程度[7]。此后的研究主要針對這些經(jīng)典模型和指標(biāo)進(jìn)行進(jìn)一步拓展。國內(nèi)文獻(xiàn)老化研究集中于Burton-Kebler方程等老化模型及其一系列修正式和普賴斯指數(shù)、引文半衰期指標(biāo)的實證性研究[8],關(guān)注這些模型、指標(biāo)在特定學(xué)科的應(yīng)用。隨著網(wǎng)絡(luò)技術(shù)發(fā)展,文獻(xiàn)老化研究開始更多關(guān)注網(wǎng)絡(luò)信息的老化問題[9-10]。
科學(xué)文獻(xiàn)老化既是一種客觀的社會現(xiàn)象,又是一個復(fù)雜的動態(tài)過程。通過對科學(xué)文獻(xiàn)老化問題的深入研究,圖書情報學(xué)領(lǐng)域的學(xué)者、圖書館和情報所工作人員可以理解文獻(xiàn)傳播的動態(tài)規(guī)律,用以指導(dǎo)文獻(xiàn)采購、剔舊;對未來科學(xué)文獻(xiàn)的利用情況作出預(yù)測,為文獻(xiàn)情報的組織管理提供指導(dǎo),還能為科學(xué)計量學(xué)、科學(xué)學(xué)及科技史研究提供定量依據(jù)和建模途徑。邱均平將文獻(xiàn)老化研究分為三類:文獻(xiàn)老化理論研究、關(guān)于研究方法和定量描述方法的研究以及應(yīng)用研究[11],其中應(yīng)用研究包含館藏文獻(xiàn)老化研究、網(wǎng)絡(luò)文獻(xiàn)老化研究和學(xué)科文獻(xiàn)的老化研究[12]。本文從理論模型、影響因素、現(xiàn)象特征和實踐應(yīng)用4個方面綜述國內(nèi)外科學(xué)文獻(xiàn)老化的研究方法和定量描述方法及應(yīng)用研究,為后續(xù)研究提供參考。
根據(jù)研究者時序視角的差異,文獻(xiàn)老化理論模型分為基于共時法和基于歷時法兩類[13]。基于共時法模型關(guān)注的是某焦點文獻(xiàn)的參考文獻(xiàn),一般按照時間倒序研究,也叫“回溯法”;基于歷時法的理論模型關(guān)注的是某焦點文獻(xiàn)的施引文獻(xiàn),研究該文獻(xiàn)在整個生命周期的引用頻次,也叫“前瞻法”。在過去,計量學(xué)者提出許多文獻(xiàn)老化理論模型,并引入各種指標(biāo)對文獻(xiàn)老化程度進(jìn)行測算。這些經(jīng)典研究成果關(guān)注不同層次的文獻(xiàn)老化現(xiàn)象。例如,普賴斯指數(shù)適用于學(xué)科、期刊和文獻(xiàn)三個層面[14-17];Brookes 負(fù)指數(shù)模型、Burton-Kebler模型及其修正式、引文半衰期指標(biāo)等主要適用于學(xué)科層面[18],從期刊和文獻(xiàn)層面開展的研究較少,剩余有益性指標(biāo)主要關(guān)注期刊層面;基于知識元的文獻(xiàn)老化模型[19]、Ye模型[20]和文獻(xiàn)老化編碼模型[21]則從文獻(xiàn)層面進(jìn)行研究。文獻(xiàn)老化理論模型成果豐富。一方面半衰期和普賴斯指數(shù)等傳統(tǒng)模型仍受到青睞;另一方面,基于文獻(xiàn)生命周期視角的研究近年興起[21-24]。與此同時,一些學(xué)者不僅提出創(chuàng)新性的知識元模型[19],還吸收、借鑒其他學(xué)科研究成果,如從生物學(xué)領(lǐng)域引入Ye模型進(jìn)行老化研究[20]。圖1對目前主要的文獻(xiàn)老化理論模型進(jìn)行分類梳理,表1對目前模型細(xì)節(jié)、優(yōu)缺點等進(jìn)行了詳細(xì)梳理。
表1 文獻(xiàn)老化理論模型比較
圖1 文獻(xiàn)老化理論模型體系
(1)基于半衰期計算文獻(xiàn)老化程度的模型包括負(fù)指數(shù)模型和概率模型:負(fù)指數(shù)模型以Burton-Kebler模型[6]為核心,但未考慮引用延遲對老化的影響。莫德列夫修正式[25-26]將引用延遲因素引入Burton-Kebler方程以提高模型的準(zhǔn)確性;丁學(xué)東[27]提出了分段模型用以描述引文數(shù)量隨時間的變化,其本質(zhì)是基于Burton-Kebler模型的級數(shù)模擬,在特定參數(shù)下,丁學(xué)東模型可以轉(zhuǎn)化為Burton-Kebler模型。概率模型則通過使用不同的概率分布(包括但不限于使用正態(tài)分布[28-29]、對數(shù)正態(tài)分布[30]、伽馬分布[31]和泊松分布[32]等)對引用數(shù)據(jù)進(jìn)行擬合,獲得對應(yīng)參數(shù)的估計值。
(2)普賴斯指數(shù)[7]是Price1971年提出的衡量各學(xué)科文獻(xiàn)老化程度的指標(biāo),適用范圍廣、計算較簡單,仍受到學(xué)者的青睞。但普賴斯指數(shù)采用固定五年引文窗口,不完全適用于不同學(xué)科領(lǐng)域文獻(xiàn)老化的計算。
(3)文獻(xiàn)生命周期模型關(guān)注文獻(xiàn)發(fā)表后的生命歷程。Bouabid提出基于論文被引次數(shù)的文獻(xiàn)生命周期模型[22],使用二階導(dǎo)數(shù)計算文獻(xiàn)初始被引次數(shù)增長和減少的最快速率以識別文獻(xiàn)老化與否,該模型也可以用來預(yù)測未來剩余被引率并計算引文的生命周期長度;Gou 等[21]完善了Bailón-Moreno 等提出的文獻(xiàn)老化過程GMAV模型[33],創(chuàng)新性地提出文獻(xiàn)老化編碼模型,通過對文獻(xiàn)老化字符串的統(tǒng)計分析,揭示不同學(xué)科老化現(xiàn)象的特點和規(guī)律,為文獻(xiàn)老化研究提供新的方向。林輝等[23]、Wang等[24]也從文獻(xiàn)生命周期理論出發(fā)提出適用范圍不同的老化模型。
(4)基于知識元的文獻(xiàn)老化模型[19]認(rèn)為科學(xué)文獻(xiàn)老化速度本質(zhì)上是知識元在新老文獻(xiàn)中轉(zhuǎn)移的速度,文獻(xiàn)的知識元全部轉(zhuǎn)移則表示該文獻(xiàn)已經(jīng)完全老化,但“知識元”的概念如何操作化仍需進(jìn)一步研究。陳京蓮等人將生物學(xué)領(lǐng)域中描述植物在光抑制條件下光合作用的響應(yīng)模型——Ye模型引入到文獻(xiàn)老化領(lǐng)域[20],發(fā)現(xiàn)相較于負(fù)指數(shù)模型等,Ye模型的擬合效果更好,理論結(jié)果與實際值具有高度一致性。
學(xué)界對文獻(xiàn)老化的影響因素及各因素的影響程度沒有達(dá)成一致,但對文獻(xiàn)老化現(xiàn)象達(dá)成基本共識:文獻(xiàn)老化只表明特定文獻(xiàn)的引用頻次的降低,是文獻(xiàn)本身(載體)的老化而非知識的老化。文獻(xiàn)老化的影響因素主要包括:文獻(xiàn)數(shù)量增長、學(xué)科類型、學(xué)科發(fā)展階段、學(xué)科需求、信息技術(shù)的發(fā)展、語言、文獻(xiàn)質(zhì)量等[14,25,34-37],前四點主要是從學(xué)科和期刊層面解釋文獻(xiàn)老化現(xiàn)象的發(fā)生,最后兩點主要從期刊和文獻(xiàn)個體層面進(jìn)行解釋。
李慧總結(jié)邱均平和徐恩元的研究[11,34-35],將影響文獻(xiàn)老化的因素歸納為:一是文獻(xiàn)數(shù)量增長:科學(xué)文獻(xiàn)老化的根本原因是科學(xué)知識的增長和更新,一般而言(新)文獻(xiàn)增長越快,(舊文獻(xiàn))老化越快。二是文獻(xiàn)的學(xué)科特點:文獻(xiàn)所屬學(xué)科領(lǐng)域的差異會導(dǎo)致文獻(xiàn)老化速率差異。三是學(xué)科的發(fā)展階段:在學(xué)科發(fā)展初期,由于原始文獻(xiàn)較少,文獻(xiàn)數(shù)量呈指數(shù)增長,文獻(xiàn)老化速率較快,隨著學(xué)科發(fā)展成熟,文獻(xiàn)數(shù)量不再保持指數(shù)增長態(tài)勢,文獻(xiàn)老化速率較慢[34]。四是文獻(xiàn)的類型和性質(zhì):如同一學(xué)科的圖書、期刊、學(xué)位論文、標(biāo)準(zhǔn)文獻(xiàn)等不同類型的文獻(xiàn)老化速率不同[25]。五是用戶需求和信息環(huán)境:從需求看,不同類型用戶對文獻(xiàn)的需求不同,科研骨干人員對最新文獻(xiàn)更感興趣,而剛剛進(jìn)入科研崗位的人員需要了解歷史背景文獻(xiàn)資料[34];從信息環(huán)境看,數(shù)據(jù)庫、檢索系統(tǒng)和搜索引擎等技術(shù)的發(fā)展導(dǎo)致較老的文獻(xiàn)通過這些技術(shù)數(shù)字化后,其被發(fā)現(xiàn)和使用的概率會增加[14-15]。
劉茜等[37]認(rèn)為引文動機也會影響文獻(xiàn)老化速率計算的準(zhǔn)確性,在計算文獻(xiàn)老化速率時需要考慮“引文不均等”現(xiàn)象,也即通過引文動機區(qū)分不同引文的重要性。施引文獻(xiàn)的引用行為可能包含多種引用動機,其作者的引用目的和態(tài)度不盡相同,單純使用文獻(xiàn)被引頻次來計算文獻(xiàn)老化速率可能存在偏差,但問題有待進(jìn)一步探討。
文獻(xiàn)本身的質(zhì)量、撰寫的語言也是影響文獻(xiàn)老化的重要因素。Burton等[6]認(rèn)為在某個學(xué)科領(lǐng)域,研究熱點的迅速變化會縮短半衰期,即加速文獻(xiàn)老化。在某種程度上,較快的老化速度可能源于文獻(xiàn)本身信息質(zhì)量差,許多文獻(xiàn)在發(fā)表之初就有一種內(nèi)在的“過時性”,導(dǎo)致這些文獻(xiàn)在發(fā)表后迅速老化。Alvarado[1]認(rèn)為語言可能是影響文獻(xiàn)老化的重要因素,他對2007-2010年發(fā)表的86篇研究洛特卡定律的文獻(xiàn)進(jìn)行分析,發(fā)現(xiàn)這些文獻(xiàn)最常見的是英語、葡萄牙語和西班牙語,并且使用這些語言撰寫的文獻(xiàn)老化速度更慢,而使用中文、德文等撰寫的文獻(xiàn)被所謂的國際社會使用或引用的頻次會更少,老化速度相對更快。
不同學(xué)科領(lǐng)域的引文膨脹速率不同,一般認(rèn)為引文膨脹具有延緩文獻(xiàn)老化的作用。Galiani等[38]從引文膨脹的角度出發(fā)研究文獻(xiàn)老化影響因素,構(gòu)建了一個包含12 個領(lǐng)域近6 萬篇文獻(xiàn)、500萬條引用關(guān)系的數(shù)據(jù)集,發(fā)現(xiàn)經(jīng)濟(jì)學(xué)、金融學(xué)、數(shù)學(xué)、政治學(xué)、心理學(xué)、社會學(xué)和統(tǒng)計學(xué)受引文膨脹的影響較大,文獻(xiàn)生命周期更長,老化速率更慢。Higham等[39]也認(rèn)為引文膨脹會延緩文獻(xiàn)老化的速度。
國內(nèi)外其他研究對文獻(xiàn)老化的影響因素也多有涉獵[40-44],或可歸入上述七類影響因素,或可通過上述影響因素間接解釋。
文獻(xiàn)老化實證研究主要關(guān)注圖書和論文文獻(xiàn)的老化。多數(shù)學(xué)者認(rèn)為,無論是論文還是圖書,如果從學(xué)科這一層次來研究文獻(xiàn)老化速度,結(jié)論總體來看和Price提出的“硬科學(xué)的老化速率較高,軟科學(xué)的老化速率較低”[7]的觀點一致,但在具體的學(xué)科分類中可能會有細(xì)微差別。
對圖書老化規(guī)律的研究發(fā)現(xiàn),人文社科的圖書老化速率明顯低于自然科學(xué),這一現(xiàn)象與學(xué)科特點有關(guān):人文社科研究更新迭代速度較慢,而自然科學(xué)對文獻(xiàn)的研究時效性有較高要求,更新迭代速度較快。Walker等[45]對康奈爾大學(xué)2002年、2004年、2006年、2008年的圖書使用情況進(jìn)行研究,發(fā)現(xiàn)2002年圖書使用率最高的學(xué)科是歷史和醫(yī)學(xué);2002-2008年政治、教育、數(shù)學(xué)和計算機科學(xué)、軍事科學(xué)等老化速率最快;老化速率較慢的是通用圖書及歷史、藝術(shù)、農(nóng)業(yè)和圖書館學(xué)等領(lǐng)域的專業(yè)圖書,其中通用類型圖書使用率相對更高,每年超過9%。O’Neill等[46]、Fry[47]分別使用OhioLink數(shù)據(jù)集中不同時間的數(shù)據(jù),都發(fā)現(xiàn)生物科學(xué)等自然科學(xué)的圖書老化速率最快,文學(xué)、歷史等領(lǐng)域的圖書老化速率相對較慢,圖書老化速率最慢的是藝術(shù)與娛樂領(lǐng)域。
論文文獻(xiàn)老化研究集中于學(xué)科之間老化速率對比研究或特定學(xué)科的老化現(xiàn)象研究??傮w看,文獻(xiàn)老化速率在逐漸變慢[1,4,27,48],且社會科學(xué)文獻(xiàn)老化速率低于自然科學(xué)。
Alvarado[1]分析 2007-2010 年發(fā)表的 86 篇研究洛特卡定律的文獻(xiàn),發(fā)現(xiàn)這些文獻(xiàn)老化速率非常慢,平均老化年齡為17.4年,且老化速率以每年9%下降。Bouabid等[48]基于發(fā)達(dá)國家(六國集團(tuán),G6)和新興國家(金磚國家,BRICS)在Web of Science(WoS)中收錄的文獻(xiàn)數(shù)據(jù),也發(fā)現(xiàn)各學(xué)科文獻(xiàn)老化速率降低,而且不同學(xué)科的文獻(xiàn)預(yù)期壽命差異很大。Finardi[49]使用1999-2010年JCR學(xué)科分類中管理學(xué)和化學(xué)(多學(xué)科)兩種類別的文獻(xiàn),研究其老化特征的區(qū)別,發(fā)現(xiàn)化學(xué)文獻(xiàn)從發(fā)表后第二年就開始老化,而管理學(xué)文獻(xiàn)在10年的時間窗口中較少出現(xiàn)老化現(xiàn)象。Zhang和Gl?nzel[14-15]使用 WoS 核心合集 1992 年 74.9 萬篇和2014年173.3萬篇文獻(xiàn),利用普賴斯指數(shù)對文獻(xiàn)老化程度進(jìn)行度量,發(fā)現(xiàn)社會科學(xué)文獻(xiàn)的老化速率最慢-,物理學(xué)和生物化學(xué)文獻(xiàn)的老化速率較快;物理學(xué)和生物化學(xué)文獻(xiàn)老化特點的相似性在Vieira等[50]研究其引文分布特點時也有發(fā)現(xiàn),Parolo等[51]在研究生物學(xué)、化學(xué)、醫(yī)學(xué)和物理學(xué)文獻(xiàn)的老化速率時也得到了相似的結(jié)論。
國內(nèi)不少研究也關(guān)注期刊文獻(xiàn)老化現(xiàn)象的學(xué)科差異問題。邱均平等[12]以CSSCI 2006-2008年收錄的近30 萬篇文獻(xiàn)及其引文數(shù)據(jù)為樣本,基于共時法對比分析人文社會科學(xué)七大學(xué)科門類的老化規(guī)律,發(fā)現(xiàn)歷史學(xué)科的老化并不嚴(yán)格遵循負(fù)指數(shù)函數(shù)規(guī)律,人文學(xué)科比社會學(xué)科文獻(xiàn)老化速率慢,且人文社會學(xué)科目前最大引文年限為3年,比普賴斯提出的2年更長一些。李瓊等[52]發(fā)現(xiàn)西夏學(xué)文獻(xiàn)對“檔案性”文獻(xiàn)的依賴性強,這和邱均平等提出的歷史學(xué)和哲學(xué)兩類學(xué)科對“檔案性”文獻(xiàn)依賴大的觀點[12]是一致的。游毅等[4]使用SCI/SSCI中數(shù)學(xué)、經(jīng)濟(jì)學(xué)、計算機科學(xué)和歷史學(xué)4門學(xué)科中各40種期刊在1980-2009年的期刊發(fā)文和被引數(shù)據(jù),發(fā)現(xiàn)文獻(xiàn)老化總體趨勢變緩,且新興學(xué)科老化速率高于傳統(tǒng)學(xué)科。
綜合相關(guān)實證研究還發(fā)現(xiàn),實驗數(shù)據(jù)集的時間窗口、覆蓋范圍對于文獻(xiàn)老化研究的結(jié)論有重要影響。王富國[53]基于CSSCI 2006-2009年間管理學(xué)和圖書情報與文獻(xiàn)學(xué)學(xué)科領(lǐng)域的引文數(shù)據(jù),對兩個學(xué)科的文獻(xiàn)進(jìn)行負(fù)指數(shù)老化模型分析、老化指標(biāo)分析,發(fā)現(xiàn)圖書情報與文獻(xiàn)學(xué)的老化速度比管理學(xué)快,并近似計算出該階段這兩個學(xué)科的半衰期分別為4.6年、5.3年。這一結(jié)論和黃利平對圖書情報和管理學(xué)的文獻(xiàn)老化研究成果略有差異:黃利平[54]認(rèn)為圖書情報學(xué)的被引半衰期為3年,管理學(xué)領(lǐng)域的被引半衰期為3-5年;但在圖書情報學(xué)的老化速率高于管理學(xué)這一點上,兩者的結(jié)論一致。研究結(jié)論的差異可能和二人所使用的數(shù)據(jù)集有關(guān),兩人均使用CSSCI管理學(xué)和圖書情報與檔案學(xué)的部分期刊引用數(shù)據(jù),但王富國使用的引用數(shù)據(jù)平均時間晚于黃利平,計算出圖書情報和管理學(xué)的文獻(xiàn)半衰期也更短。前述O’Neill等[46]和Fry[47]的研究結(jié)果的差異也是使用不同時段的OhioLink數(shù)據(jù)集所導(dǎo)致。
鐘晶晶、俞立平等學(xué)者在特定學(xué)科領(lǐng)域也曾進(jìn)行學(xué)科老化現(xiàn)象的實證研究[55-63]。此外,楊思洛等[64]對中國引文數(shù)據(jù)庫中1994-2013年標(biāo)準(zhǔn)類引文數(shù)據(jù)進(jìn)行計量分析,發(fā)現(xiàn)大部分社會學(xué)科的標(biāo)準(zhǔn)引用量為零,自然科學(xué)的標(biāo)準(zhǔn)引文數(shù)量和被引頻次相對較高。
科學(xué)文獻(xiàn)老化現(xiàn)象特征研究成果豐富,對典型文獻(xiàn)(發(fā)表后短時間內(nèi)即達(dá)到引用峰值,而后引用逐年減少)的引用老化特征研究較完善,針對非典型文獻(xiàn)的研究近年逐漸興起。He 等[65]使用1900-2015年WoS數(shù)據(jù)和部分APS數(shù)據(jù)對非典型的文獻(xiàn)進(jìn)行研究,根據(jù)引用年齡分布特點將其分為喚醒型文獻(xiàn)(awakened articles)、第二行為型文獻(xiàn)(second-actarticles)和以上二者的綜合型文獻(xiàn)(second-act awakened articles)三類。Li等[66-67]也研究了該類具有雙峰特征的延遲承認(rèn)文獻(xiàn)的引用特點,并提出此類文獻(xiàn)的識別方法。此外,Yin 等[13]從時間的維度對引用行為進(jìn)行研究,建立理論框架,找到“回溯法”和“前瞻法”的年齡分布之間的數(shù)學(xué)轉(zhuǎn)換關(guān)系,為未來文獻(xiàn)老化研究提供更堅實的實證和理論基礎(chǔ)。
另一方面,隨著網(wǎng)絡(luò)技術(shù)進(jìn)步,信息爆炸增長,網(wǎng)絡(luò)信息老化受到關(guān)注。一些學(xué)者在研究時將文獻(xiàn)老化理論“移植”在網(wǎng)絡(luò)信息老化研究上[68-69],也有學(xué)者從傳播學(xué)理論出發(fā),結(jié)合已有文獻(xiàn)老化理論,建立新的網(wǎng)絡(luò)信息老化模型[70-72]。目前網(wǎng)絡(luò)信息老化研究熱點集中在微博[68-69,71-73]、Twitter[74-75]等社交平臺的信息老化上,對其他方面的網(wǎng)絡(luò)老化信息關(guān)注較少。而且當(dāng)前網(wǎng)絡(luò)信息老化研究仍然集中于老化速率描述及不同類型、平臺的網(wǎng)絡(luò)信息老化速率比較,對新的模型、方法的探索研究相對不足。
文獻(xiàn)老化的應(yīng)用主要體現(xiàn)在圖書館等知識服務(wù)組織的管理和文獻(xiàn)推薦與排序活動中。文獻(xiàn)剔舊源于信息資源數(shù)量增長帶來的藏書空間緊張問題,是圖書館和其他知識服務(wù)組織管理工作的重要部分。文獻(xiàn)剔舊需根據(jù)藏書容量和類型執(zhí)行多樣化的標(biāo)準(zhǔn)。蔡曉麗[18]針對這一問題,基于文獻(xiàn)老化現(xiàn)象中不同學(xué)科之間的差異性,為自然科學(xué)和社會科學(xué)分別制定不同的剔舊標(biāo)準(zhǔn),并且強調(diào)社會科學(xué)由于老化速率較慢和本身的文獻(xiàn)的特殊性,需要結(jié)合其他統(tǒng)計指標(biāo)共同構(gòu)建剔舊標(biāo)準(zhǔn)。蔡迎春[76]以圖書引用半衰期和圖書借閱次數(shù)兩個指標(biāo)為主,輔以定性分析,以館藏經(jīng)濟(jì)類圖書為例進(jìn)行了藏書復(fù)選的實證分析。謝明詮[77]認(rèn)為不能將老化文獻(xiàn)直接剔除出圖書館,而應(yīng)當(dāng)將老化文獻(xiàn)轉(zhuǎn)移至儲存圖書館,這有利于文獻(xiàn)的長期保存、保障圖書館資源的完整性。李卓卓等[78]提出了基于布拉德福常數(shù)和半衰期的文獻(xiàn)老化分布象限圖,指出不同象限內(nèi)的文獻(xiàn)在剔舊時應(yīng)當(dāng)使用不同的策略。
在文獻(xiàn)推薦與排序的實踐應(yīng)用中,將文獻(xiàn)老化特征融入原有推薦系統(tǒng)中是當(dāng)前學(xué)者的主要研究方向。鄧齊強等[79]從書目推薦入手,通過降低老化圖書的關(guān)聯(lián)支持度,減少老化圖書中較弱的關(guān)聯(lián)規(guī)則,以實現(xiàn)從推薦書目中剔除老化程度較高的文獻(xiàn)的目的。王玉斌等[80]將信息老化量度與協(xié)同過濾推薦算法結(jié)合,通過實驗分析發(fā)現(xiàn),與傳統(tǒng)的協(xié)同過濾算法相比,新的協(xié)同過濾算法的推薦結(jié)果具備更好的時效性。Wang等[81]在文獻(xiàn)重要性排名中引入老化特征,將老化特征加入PageRank算法中,并使用美國物理學(xué)會APS數(shù)據(jù)集進(jìn)行實驗。結(jié)果表明,加入老化特征后PageRank算法在論文和作者排名精度方面的性能有了顯著的提升。熊回香等[82]在進(jìn)行學(xué)術(shù)論文推薦時,借助文獻(xiàn)老化指標(biāo),加入不同類型論文的時間價值特征,獲得了更好的推薦效果。
自20世紀(jì)上半葉被正式提出以來,文獻(xiàn)老化領(lǐng)域取得了豐富的研究成果。然而梳理近年來國內(nèi)外關(guān)于文獻(xiàn)老化的新近研究成果后,發(fā)現(xiàn)顛覆性、創(chuàng)新性研究較少,多為圍繞已有經(jīng)典模型進(jìn)行的補充性、實證性研究。部分研究關(guān)注文獻(xiàn)老化理論模型的優(yōu)化改進(jìn),如基于概率統(tǒng)計模型提出對數(shù)正態(tài)分布模型、泊松分布模型和伽馬分布模型,但這些模型不僅計算復(fù)雜度高,而且效果也需更為廣泛數(shù)據(jù)集的驗證[20];基于知識元[19]和老化編碼[21]的模型在創(chuàng)新性上有了一定的突破,但將其應(yīng)用于實踐中仍需更多探索。
現(xiàn)有研究將文獻(xiàn)老化的影響因素歸納為文獻(xiàn)數(shù)量的增長、學(xué)科類型、學(xué)科發(fā)展階段、學(xué)科需求、信息技術(shù)的發(fā)展、語言、質(zhì)量。對前四點因素而言,以往研究已經(jīng)進(jìn)行大量質(zhì)性和量化的分析;但針對后三點影響因素的探索仍顯不足。比如,不同學(xué)者就信息技術(shù)的發(fā)展對文獻(xiàn)老化的影響得到了相矛盾的觀點[14-15,51]:技術(shù)發(fā)展使得老舊的經(jīng)典文獻(xiàn)更容易獲取,這表現(xiàn)為文獻(xiàn)的老化速率減慢;但又使得大量具有替代性的新文獻(xiàn)涌現(xiàn),這可能導(dǎo)致文獻(xiàn)的老化速率提升。另一方面,語言因素關(guān)乎學(xué)者獲取信息的認(rèn)知、行為、特點。語言對文獻(xiàn)老化的影響可進(jìn)一步衍生為學(xué)術(shù)群體信息行為特點對文獻(xiàn)老化的影響,因此文獻(xiàn)的載體形式、內(nèi)容表達(dá)形式等可能同樣對文獻(xiàn)的老化速率有著重要影響[1,35],這些也有待于更深入的研究。但目前的定性研究缺乏實際調(diào)研[18],定量分析則大多停留于現(xiàn)象描述層面,缺乏機制或因果層面的分析。
學(xué)者很關(guān)注文獻(xiàn)老化問題的實證性研究。從較為傳統(tǒng)的論文文獻(xiàn)[50-63,83-87]和圖書文獻(xiàn)的老化程度實證研究[1,8,45-47,88],到非典型老化特征文獻(xiàn)研究[65]和網(wǎng)絡(luò)信息的老化特征研究[9,68-75],實證研究起到了檢驗已有理論成果、增進(jìn)對老化規(guī)律的認(rèn)識、指導(dǎo)管理實踐的重要作用。但現(xiàn)有的實證性研究往往是應(yīng)用已有的模型、指標(biāo)對某一特定集合的文獻(xiàn)的老化速率進(jìn)行計算,較少有根據(jù)實踐活動的實際經(jīng)驗對已有的模型、指標(biāo)提出改進(jìn)或應(yīng)用建議,少有能夠根據(jù)實踐反饋結(jié)果促進(jìn)相關(guān)理論的進(jìn)一步發(fā)展。同時,實證研究還多存在結(jié)論局限性大、部分結(jié)論存在矛盾等問題,這是由研究數(shù)據(jù)對象的限制所引發(fā)的。
文獻(xiàn)老化應(yīng)用研究集中在圖書館剔舊、書目及信息推薦和排序領(lǐng)域。從目前研究來看,大多數(shù)學(xué)者仍停留在“建議”層次,缺乏對圖書館現(xiàn)有剔舊標(biāo)準(zhǔn)的實際考察,較少提出詳細(xì)、具有可行性的剔舊標(biāo)準(zhǔn)。顯然,不同圖書館應(yīng)當(dāng)根據(jù)其藏書容量和藏書類型設(shè)置不同的剔舊標(biāo)準(zhǔn)[18,76-77],這要求研究者們進(jìn)一步將其研究成果“落地”,切合實踐之需要。相較其他研究而言,文獻(xiàn)老化研究成果的應(yīng)用研究已邁入一個更廣闊的天地。除剔舊外,相關(guān)研究成果還廣泛應(yīng)用于推薦、評價等其他與文獻(xiàn)相關(guān)的活動中。比如,在設(shè)計圖書館書目推薦系統(tǒng)時,除考慮到用戶需求與圖書內(nèi)容的匹配程度外,還需要考慮到圖書自身的老化程度[79];在進(jìn)行與文獻(xiàn)相關(guān)的學(xué)術(shù)評價時,不僅考慮評價對象本身的價值、意義,還考慮到評價對象的老化特征[81],有針對性地對不同類型的文獻(xiàn)使用不同的評價標(biāo)準(zhǔn)。
文獻(xiàn)老化不僅是文獻(xiàn)計量學(xué)的子領(lǐng)域,而且被泛化為一種思想,即從時間維度觀察事物的一種思維方式。這使得在進(jìn)行很多研究時,研究者或多或少地會以文獻(xiàn)老化的視角思考問題。例如,在期刊、論文影響力評價時,評價者需要考慮文獻(xiàn)的老化特征和引文時間窗口[80-81];在知識服務(wù)組織中,管理者需要考慮文獻(xiàn)的老化程度[18,76-79,88-89];在文獻(xiàn)和信息的發(fā)布、獲取、利用過程中,用戶需要考慮到文獻(xiàn)和信息老化過程[14-15,68-69,71-72,74-75]。當(dāng)信息日益成為一種生產(chǎn)要素,文獻(xiàn)成為學(xué)術(shù)和相關(guān)實踐活動的必要資源,文獻(xiàn)老化及其相關(guān)問題的研究就愈發(fā)體現(xiàn)其價值。近年來文獻(xiàn)老化相關(guān)研究繼承了經(jīng)典的研究成果,并在此基礎(chǔ)上做出改進(jìn)、優(yōu)化和發(fā)展;但另一方面,這些研究多數(shù)囿于以往的研究模型,相對缺乏新的研究模式和視角。文獻(xiàn)老化研究已有近百年歷史,如何在新的時代環(huán)境、技術(shù)背景下挖掘文獻(xiàn)老化研究的新價值,探索新的研究范式;如何借助文獻(xiàn)老化研究的思想成果,將其融入更廣泛的研究問題領(lǐng)域中,還有待于更多具有創(chuàng)新性、顛覆性的深入研究。最后,本文列舉以下值得關(guān)注的問題,以期引起學(xué)界更多的探討。
(1)如何利用復(fù)雜網(wǎng)絡(luò)的理論與方法,將文獻(xiàn)老化的量化模型從“數(shù)數(shù)”變?yōu)椤敖ňW(wǎng)”,從而對焦點文獻(xiàn)和施引文獻(xiàn)之間形成的引用網(wǎng)絡(luò)結(jié)構(gòu)及其互動、交叉、衍化等諸多復(fù)雜關(guān)系在時序維度下的變化進(jìn)行表達(dá)和描述[90]?
(2)隨著結(jié)構(gòu)化全文數(shù)據(jù)資源可獲得性的不斷提高和自然語言處理技術(shù)進(jìn)步,如何將文獻(xiàn)老化研究從基于題錄數(shù)據(jù)全面轉(zhuǎn)向基于全文本數(shù)據(jù)的研究,以細(xì)化文獻(xiàn)老化研究的粒度,提高文獻(xiàn)老化研究的精度?譬如,基于對引文句內(nèi)容、引用句位置、引用動機的分析,剔除偽引,設(shè)置引用權(quán)重,從而“修正”原始的引文曲線,提高文獻(xiàn)老化研究結(jié)論的準(zhǔn)確度。
(3)如何進(jìn)一步拓寬文獻(xiàn)老化研究的應(yīng)用場景,挖掘潛在的理論、實踐和政策意義,更好地服務(wù)于學(xué)術(shù)評價、信息服務(wù)和情報工作?以學(xué)術(shù)評價為例,學(xué)術(shù)評價總是需要在及時性與準(zhǔn)確性之間做出平衡[91],一方面需要更長的時間以獲取足夠的信息進(jìn)行恰當(dāng)?shù)脑u價;另一方面,需要在盡可能短的周期內(nèi)完成評價以指導(dǎo)后續(xù)實踐。因此,研究時間維度下文獻(xiàn)信息價值變化的文獻(xiàn)老化有著重要的潛在價值,這仍有待于未來作出更深入的探討和研究。