隨著數(shù)字技術(shù)和因特網(wǎng)的發(fā)展,數(shù)字資源已成為人們獲取知識和信息的主要來源。然而,由于數(shù)字資源及其利用所依賴的網(wǎng)絡(luò)和存儲媒體的不穩(wěn)定性,使數(shù)字資源容易消失,難以長期為人們所利用。因此,越來越多的國家和機構(gòu)開始關(guān)注數(shù)字資源的長期保存的研究。
我國對數(shù)字資源長期保存的研究始于20世紀90年代,本文以國內(nèi)論述數(shù)字資源長期保存相關(guān)論文為出發(fā)點,通過對論文數(shù)量、作者、來源期刊、主題和引文等相關(guān)信息進行分析,從而概括我國數(shù)字資源長期研究的進展情況,并指出研究中的不足。
本文以CNKI為檢索工具,選擇中國期刊全文數(shù)據(jù)庫,分別以“數(shù)字資源長期保存”、“網(wǎng)絡(luò)信息長期保存”、“數(shù)字信息長期保存”、“數(shù)字資源長期存取”、“網(wǎng)絡(luò)信息長期存取”、“數(shù)字信息長期存取”為題名檢索,檢索時間段為1999年到2011年,得出216篇論文,去掉征文通知和會議通知等無效論文,得到有效論文205篇。根據(jù)這些論文的發(fā)表時間分年匯總,得出論文時間分布表和文獻增長曲線,如表1和圖1。
從表1和圖1可以看出,我國關(guān)于數(shù)字資源長期保存的研究始于20世紀末,伴隨著國內(nèi)學(xué)者對數(shù)字資源長期保存的重視,該領(lǐng)域的研究文獻逐年增長,根據(jù)文獻增長速度可以把數(shù)字資源長期保存的研究分為三個階段:第一階段(1999年到2002年):這一階段是我國數(shù)字資源長期保存研究伊始,文獻增長緩慢,所發(fā)表論文多是關(guān)于數(shù)字資源長期保存策略和技術(shù)的研究,2002年關(guān)于數(shù)字資源長期保存的論文發(fā)表了10篇,相比2001年明顯增長,這表明數(shù)字資源長期保存這一研究已經(jīng)引起了我國相關(guān)專家的重視;第二階段(2003年到2006年):這一階段關(guān)于數(shù)字資源長期保存的研究論文穩(wěn)步增長,主要是因為數(shù)字資源長期保存的研究已經(jīng)引起我國政府和相關(guān)專家的重視,特別是2004年中歐數(shù)字資源長期保存研討會在北京舉行后,對數(shù)字資源長期保存的研究不僅包含國外經(jīng)驗的借鑒,我國學(xué)者開始重視長期保存的技術(shù)問題,尋求我國數(shù)字資源長期保存的技術(shù)策略;第三階段(2007年到2011年):這一階段我國關(guān)于數(shù)字資源長期保存的研究已趨于成熟,主要是針對我國數(shù)字資源長期保存管理、法律、責(zé)任和技術(shù)等方面策略的研究。
檢索到的205篇論文中去除1篇未署名的,共有著者146人,其發(fā)文情況見表2。
從著者人數(shù)與所著論文數(shù)之間的關(guān)系來看,發(fā)表1篇論文的著者有117人,發(fā)表2篇論文的著者有17人,發(fā)表3篇論文的著者5人,發(fā)表4篇論文的著者3人,發(fā)表5篇和6篇論文的著者各1人,發(fā)表8篇論文的著者2人。洛特卡定律指出:寫n篇文章的作者數(shù)是生產(chǎn)1篇作者數(shù)的1/n2,且生產(chǎn)1篇文章的作者數(shù)是全體作者數(shù)的60%左右。從表2可知,發(fā)表1篇論文的著者數(shù)量約占總著者數(shù)的80.1%,這與洛特卡定律的描述不符,表明數(shù)字資源長期保存的研究尚未成熟,寫1篇論文的群體過大。
表1 論文時間分布表
為進一步分析這一領(lǐng)域著者結(jié)構(gòu),本文引用邱均平教授“作者活躍度”這一概念,領(lǐng)域年齡=當下年份-作者在該領(lǐng)域內(nèi)發(fā)表第一篇論文的年份;著者活躍度=作者發(fā)表該領(lǐng)域論文/領(lǐng)域年齡。領(lǐng)域年齡越長而且活躍值越高的作者群是該領(lǐng)域的領(lǐng)軍人物,領(lǐng)域年齡小而活躍值比較高的作者群,則是構(gòu)成該領(lǐng)域發(fā)展的中堅力量。筆者分別計算發(fā)文量前七位的著者的領(lǐng)域年齡和活躍值得出著者活躍度表(見表3)。
從表3可知,劉家真、宛玲、吳振新為數(shù)字資源長期保存研究領(lǐng)域的領(lǐng)軍人物,郭家義、劉喜球為該領(lǐng)域的中堅力量。其中劉家真教授的領(lǐng)域年齡最長,因為其發(fā)表的文章都集中在前期,所以發(fā)文量高但活躍值不高;劉喜球教授雖然只發(fā)了四篇相關(guān)論文,但其領(lǐng)域年齡只有三年,所以活躍值較高,可能成為本領(lǐng)域的領(lǐng)軍人物。
檢索到的205篇論文分布在69種期刊上,其中圖情和檔案類期刊53種,占總期刊數(shù)的76.8%;學(xué)報類期刊10種,占總期刊數(shù)的10%;其他類期刊6種,占總期刊數(shù)的8.7%。由此可見,關(guān)于數(shù)字資源長期保存的研究多集中在圖情和檔案類期刊,受到了圖情及檔案領(lǐng)域?qū)W者的重視。筆者按每種期刊發(fā)表數(shù)字資源長期保存相關(guān)論文的數(shù)量進行排序,選出前十位期刊得出論文期刊分布表(表4)。
從表4可知,數(shù)字資源長期保存論文刊登較集中的11種期刊全部為核心期刊,其中10種為圖情專業(yè)核心期刊,1種為檔案專業(yè)核心期刊,說明數(shù)字資源長期保存的研究受到了足夠的重視,且多集中在圖情領(lǐng)域。這11種期刊上發(fā)表的關(guān)于數(shù)字資源長期保存研究的論文數(shù)量為92篇,占本領(lǐng)域論文總數(shù)的44.88%,形成了該領(lǐng)域的核心期刊群。
筆者將1999年到2011年期間國內(nèi)關(guān)于數(shù)字資源長期保存的研究主題分為綜合策略研究、技術(shù)策略研究、國外經(jīng)驗介紹、管理策略研究及法律策略研究五個方面,將205篇論文按主題進行分別統(tǒng)計,得到主題分布表(見表5)。
從表5可知,1999年到2011年期間國內(nèi)關(guān)于數(shù)字資源長期保存的研究中最多的是關(guān)于綜合策略的論文,共77篇,其次是關(guān)于技術(shù)策略的論文,共52篇,兩者論文數(shù)量占總數(shù)的62.93%,說明我國學(xué)者數(shù)字資源長期保存的綜合策略研究已取得一定成果,且重視長期保存過程中的技術(shù)問題。伴隨著數(shù)字資源長期保存實踐的進行,我國學(xué)者也逐漸認識到管理策略和法律策略研究的重要性,關(guān)于這兩方面的研究數(shù)量從2007年以后增幅明顯。
表2 作者發(fā)文情況
表3 著者活躍度表
表4 論文期刊分布表
表5 主題分布表
表6 引文統(tǒng)計表
圖1
論文被引用次數(shù)是衡量該論文學(xué)術(shù)水平和科研價值的重要尺度之一,對文獻進行被引分析可以讓我們了解該學(xué)科領(lǐng)域的經(jīng)典文獻和成果。
筆者將數(shù)字資源長期保存方面論文按被引用次數(shù)進行排序,得出被引用次數(shù)較多的10篇論文,并對其排列得出引文統(tǒng)計表(見表6)。
在本文統(tǒng)計的引文統(tǒng)計表中,被引次數(shù)最多的是劉家真教授在1999年發(fā)表的《維護數(shù)字信息長期存取的管理策略》,說明劉家真教授的《維護數(shù)字信息長期存取的管理策略》是該領(lǐng)域的經(jīng)典文獻,為以后數(shù)字資源長期保存的研究奠定了基礎(chǔ);在被引用次數(shù)最多的10篇論文中排名第二、第三、第六和第九的4篇論文均為宛玲所著,說明宛玲為數(shù)字資源長期保存研究領(lǐng)域的經(jīng)典學(xué)者。
從表6可知,被引頻率較高的10篇論文中有9篇都刊登在本專業(yè)核心期刊上,有7篇為核心著者所著,說明被引頻率較高的10篇論文質(zhì)量普遍較高,但從發(fā)表時間來看這10篇論文均發(fā)表于2006年以前,時間較長,在一定程度上影響論文的權(quán)威性。
我國數(shù)字資源長期保持方面的研究已經(jīng)取得了一定的進展,論文數(shù)量穩(wěn)步增長,確定了核心期刊群和核心著者群,發(fā)表了一些經(jīng)典論文,但論文總量較少,著者活躍值不高,研究缺乏持續(xù)性,研究方向主要是一些理論性問題,缺乏對我國數(shù)字資源長期保存實踐的研究。
[1]邱均平,矯翠翠.網(wǎng)絡(luò)鏈接分析論文的計量研究[J].情報科學(xué),2008(8):1130-1134.
[2]邱均平,劉華華.網(wǎng)絡(luò)信息計量學(xué)的文獻計量規(guī)律及發(fā)展現(xiàn)狀研究[J].圖書館論壇,2009(6):58-62.
[3]張靖,邵波.國內(nèi)數(shù)字資源長期保存研究定量分析[J].新世紀圖書館,2011(1):33-35.
[4]邱均平.信息計量學(xué)[M].武漢:武漢大學(xué)出版社,2007.1.