■蔣 靜
上海市地方稅務局稅收科學研究所,上海市陸家浜路1056號 200011,E-mail:assignmentj@126.com
期刊因其出版的規(guī)范性、對學術質量控制的嚴格性及其提供內容的實時性,成為科研人員獲取信息的第一來源。隨著OA運動的發(fā)展,通過網絡免費開放的OA期刊日益增多,不僅涌現(xiàn)出大量創(chuàng)刊即以OA方式出版的期刊,傳統(tǒng)期刊也在逐步開放其內容,以借助網絡優(yōu)勢增強傳播效果、擴大學術影響力。國內原生的OA期刊數(shù)量少且分散,國際開放期刊目錄DOAJ目前收錄中國出版的OA期刊僅51種。而傳統(tǒng)期刊開放內容的比重在日益增長,如中國科協(xié)期刊2013年已有1/3左右的期刊實現(xiàn)了開放獲取(364/1056)[1]。
對期刊學術影響力和學術質量的測度,傳統(tǒng)上以引用研究為基礎。隨著期刊越來越多地借助網絡平臺進行傳播,從其下載情況可以即時反映出讀者利用情況。讀者下載獲取文獻內容之后,或僅僅為了了解相關信息,或應用于實際工作,或在信息吸收的基礎上轉化產生新的學術成果,第三種使用以引用的方式反映出來。下載與引用都是測度信息傳播效果的重要指標,從理論上來說,先有下載后有引用,引用是由下載的一部分轉化而來的。
就期刊下載與引用的相關性方面的考察,對傳統(tǒng)學術期刊研究中,普遍發(fā)現(xiàn)下載與引用存在正相關關系。如劉筱梅統(tǒng)計了15種英文化學類期刊2003-2005年間在數(shù)據(jù)庫中的總下載量,及其在中國科學引文數(shù)據(jù)庫中的引用次數(shù),發(fā)現(xiàn)二者呈較強的相關關系[2]。龐景安選擇了《中國科技期刊引證報告》和《中國學術期刊網絡計量測試報告》共有的1471種期刊為研究對象,發(fā)現(xiàn)這些期刊的總被引次數(shù)與總下載次數(shù)存在相關關系[3]。
在對OA期刊論文的研究中,就下載量與被引次數(shù)之間相關性的發(fā)現(xiàn)結果不一。牛昱昕等對《中國科技論文在線》上的論文進行了統(tǒng)計分析,發(fā)現(xiàn)單篇論文的下載次數(shù)(CNKI與中國科技論文在線網站二者的下載次數(shù)之和)與被引次數(shù)之間的相關性不顯著,當從整體上考察被引次數(shù)與平均下載次數(shù),發(fā)現(xiàn)二者則呈正相關趨勢[4]。方紅玲統(tǒng)計分析了《中國科技期刊研究》2007-2011年的論文,發(fā)現(xiàn)各年網站下載量均高于CNKI下載量,而CNKI下載量與被引次數(shù)的相關度高于網站下載量與被引次數(shù)的相關性,其中部分年度網站下載量與被引次數(shù)未呈現(xiàn)相關關系[5]。
對于OA期刊及論文傳播效果的研究,國外很多學者集中于探討OA論文與非OA論文相比是否存在引用上的優(yōu)勢,以證明OA出版方式在促進學術信息傳播上更具優(yōu)勢。例如Michael Norris等針對生物學、應用數(shù)學、社會學、經濟學四個領域的OA與非OA論文進行了研究,發(fā)現(xiàn)OA論文具有明顯的引用優(yōu)勢,但不同學科領域OA論文的引用優(yōu)勢存在差異—社會學OA論文的引用優(yōu)勢最為明顯,而生物學 OA論文的引用優(yōu)勢表現(xiàn)最弱[6]。Davis Philip M等人以美國生理學會出版的11種期刊為研究對象,發(fā)現(xiàn)在出版半年之后,OA論文的下載量高于非OA論文,而出版一年之后,OA論文未呈現(xiàn)出明顯的引用優(yōu)勢(OA論文的被引率為59%,非OA論文為63%)[7]。
國內原創(chuàng)的OA期刊相對較少,而傳統(tǒng)期刊轉型而來的OA期刊多。這部分OA期刊的發(fā)展現(xiàn)狀及其傳播效果如何,國內有針對性的研究還比較少。本文首先以自動化和計算機技術學科(以下簡寫為中圖分類號TP)為例,調查學科內核心期刊實現(xiàn)開放獲取的現(xiàn)狀,并對比分析通過網站開放與通過商業(yè)數(shù)據(jù)庫發(fā)布兩種傳播方式的特點,最后分析這些OA期刊網站的使用和傳播效果:以下載量考察不同OA期刊的即時傳播效果,并比較不同期刊網站下載量與引用次數(shù)的相關性,同時以商業(yè)數(shù)據(jù)庫下載量與引用次數(shù)的相關性進行對比考察。
選取《北大中文核心期刊目錄(2011年)》收錄的31種TP類期刊為調查對象,調查時間為2014年6月(于8月底更新)。利用搜索引擎Google和Bing分別對這31種期刊進行搜索,查詢其有無獨立網站,有則進入其網站,考察其內容開放情況。
對于調查發(fā)現(xiàn)已實現(xiàn)OA的期刊,為了考察其使用和傳播效果,分別從期刊網站和CNKI數(shù)據(jù)庫分別獲取下載量數(shù)據(jù)進行比較分析,并考察兩種下載量與引用之間的相關關系。
首先是獲取合適的即時下載數(shù)據(jù)。選擇15種提供下載量統(tǒng)計的OA期刊網站為調查對象,選取每種期刊的2014年第1-2期進行數(shù)據(jù)采樣,以反映期刊網站最新的使用情況。采集時間為2014年8月28日。
其次是獲取合適的引用數(shù)據(jù)。根據(jù)相關研究,下載和引用至少有2年的時間差,即2008年發(fā)表論文的被引情況在2010年及之后才可反映出來[8]。同時,各個學科的文獻均有一定的時效性,計算機科學的時效性尤強,若干年以前的文獻可能由于使用價值較低而較少被下載并引用。研究發(fā)現(xiàn),計算機科學期刊的引用峰值在第5年[9],即2008年發(fā)表的論文在2013年達到引用的高峰,其后被引用次數(shù)呈下降趨勢。權衡以上因素,為了獲得較為穩(wěn)定的引用數(shù)據(jù),本文選取2008年發(fā)表的文獻為考察對象。21種開放全文的期刊中,開放了2008年的全文內容,并且提供下載量數(shù)據(jù)的有12種期刊,以其在2008年第1-2期發(fā)表的論文進行相關分析。數(shù)據(jù)采集時間為2014年8月29日。
期刊網站具有多種功能,最基本的是作為一個在線稿件管理系統(tǒng),為作者、編輯和專家評審處理稿件之用,而對更廣范圍的讀者來說,期刊網站能夠提供內容才是其價值所在。31種TP類核心期刊中,有22種不同程度實現(xiàn)了全文開放(占比71%),另有2種開放了摘要信息,及4種僅開放目錄信息。其余3種期刊中,有1種無獨立網址,1種有網址但訪問異常,1種雖有網址但尚無目錄、摘要或全文等任何與期刊內容有關的信息。以往有針對測繪類、農學類期刊開放情況的調查,其全文開放的比例分別為26%及37%[10-11],筆者同時間也針對28種法律類核心期刊的開放情況進行了調查,發(fā)現(xiàn)僅有3種期刊實現(xiàn)了全文開放(11%)。比較之下,TP類核心期刊71%的開放比例處于較高的水平,因而更具開發(fā)利用的價值。詳見表1。
計算機、自動化是發(fā)展很快的學科,通過內容的實時開放,可使讀者及時獲取并轉化利用這些成果,加快整個學術信息交流的進程,實現(xiàn)信息傳播效用的最大化。調查發(fā)現(xiàn),有1種期刊較印刷本提前開放,有16種期刊與印刷本同步開放,有1種較印刷本滯后1期,2種滯后2期,1種開放部分過刊,1種僅開放1期??傮w來說,TP類核心OA期刊開放的實時性較好。是否同步開放以“當期目錄”是否提供全文作為主要判斷依據(jù),并與數(shù)據(jù)庫收錄情況進行比較作綜合判斷。
讀者不僅要了解最新的研究進展,也需要追溯過去的研究歷史和發(fā)展過程,因此過刊也具有重要的利用價值。調查發(fā)現(xiàn),有5種期刊回溯至創(chuàng)刊年,分別為:《軟件學報》、《自動化學報》、《中國圖象圖形學報》、《國土資源遙感》、《信息與控制》,此5種期刊同時也實現(xiàn)了與印刷本同步實時的開放。發(fā)現(xiàn)《信息與控制》、《計算機科學》、《傳感技術學報》部分過刊內容空缺,這部分內容可能正在回溯過程中。
表1 TP類核心期刊OA情況
其余17種未回溯至創(chuàng)刊年的期刊中,均至少開放最近2年的內容,其中最長的回溯了近34年以來的內容(《機器人》)。猜測若干期刊亦在回溯過程中,未來可能實現(xiàn)全部內容的開放。
調查發(fā)現(xiàn),有19種期刊沒有任何訪問限制,允許直接瀏覽或下載全文,而有1種期刊需注冊為會員登錄后方可訪問全文,有2種期刊需輸入驗證碼訪問全文。從網站管理的角度看,設置訪問限制可能是為了阻止機器人自動訪問、采集數(shù)據(jù)之考慮,但也給正常訪問的讀者增加了獲取信息的障礙。
清晰合理的網站導航和檢索功能可以幫助讀者快速準確地獲取信息。調查發(fā)現(xiàn),多數(shù)期刊均有清晰的訪問路徑,可通過“過刊瀏覽”、“全文檢索”等標識到達全文瀏覽和下載頁面?!队嬎銠C研究與發(fā)展》沒有發(fā)現(xiàn)明確的訪問路徑,其“當期目錄”(2014年7月)的url地址包含“vol=2014&issue=7”,由此猜測而得到2005以來各期的全文訪問路徑。有21種期刊提供檢索功能,具體因其使用的軟件系統(tǒng)不同而有所差異。
商業(yè)數(shù)據(jù)庫將各學科各種層次的期刊聚合在一起,提供一站式的檢索服務,自1990年代出現(xiàn)以來,成為圖書情報機構用來提供信息服務的重要工具。以CNKI和維普為例,考察其對于TP類核心期刊的收錄情況。詳見表2。
比較對TP類核心期刊品種的覆蓋率,CNKI收錄了全部31種,維普收錄了30種,而OA期刊為22種??疾鞂^刊的收錄情況,兩種商業(yè)期刊回溯的年份比較久遠,其中維普多回溯至1989年,CNKI回溯至創(chuàng)刊年的情況較多。OA期刊網站目前有5種回溯至創(chuàng)刊年。因而商業(yè)數(shù)據(jù)庫對于品種的覆蓋率和對于過刊的回溯情況優(yōu)于OA期刊網站。
考察發(fā)布信息的實時性,以22種OA期刊作為考察對象,發(fā)現(xiàn)CNKI提前或實時發(fā)布的期刊有12種,其余有10種滯后1-3期。維普發(fā)布的期刊均有不同程度的滯后,1種未收,11種滯后2-4期不等(其中2種有缺期現(xiàn)象),10種滯后7-32期、自2012年以來的內容未見更新。因而就計算機核心期刊的情況,CNKI數(shù)據(jù)庫優(yōu)于維普數(shù)據(jù)庫,而不及OA期刊網站。
表2 TP類OA核心期刊被商業(yè)數(shù)據(jù)庫收錄的情況
使用商業(yè)數(shù)據(jù)庫的前提是,提供信息服務的圖書情報機構需購買這些數(shù)據(jù)庫,并視其簽訂協(xié)議的不同,或提供數(shù)據(jù)庫的館內訪問、或提供網絡遠程訪問,其中后一種方式給讀者提供較大的便利。與商業(yè)數(shù)據(jù)庫相比較,OA期刊網站提供了一種免費、直接的傳播方式,讀者不必經過圖書館等中介者,可以直接訪問期刊網站獲取內容。
商業(yè)數(shù)據(jù)庫與OA期刊網站相比,最明顯的優(yōu)勢在于可提供一站式檢索,允許讀者跨期刊通過主題、作者等檢索獲取相關文獻。而OA期刊由于版權政策的限制,目前難以建立全文內容的聚合平臺。不同于國外OA期刊較多遵循CC協(xié)議的情況,我國傳統(tǒng)期刊轉換而來的OA期刊,除了在期刊網站開放全文,允許讀者在線閱讀或下載閱讀之外,絕大多數(shù)并沒有任何版權政策上的改變,即期刊論文的版權仍屬于期刊所有,期刊內容的再傳播受到限制,因此讀者仍需訪問期刊網站獲取內容,期刊內檢索功能的實現(xiàn)因期刊網站的建設情況而異。
通用搜索引擎可在跨越不同的OA期刊進行建設,但僅可索引以網頁形式發(fā)布的題名、作者等題錄信息和摘要,并不能針對OA期刊網站發(fā)布的pdf文件建立全文索引,因而檢索效果受到一定限制。
OA期刊網站的使用數(shù)據(jù)可以直接反映OA網站的傳播效果。一部分OA期刊網站提供摘要點擊量和全文下載量。為了考察讀者對全文內容的獲取情況,同時與商業(yè)數(shù)據(jù)庫的下載量做橫向比較,這里選擇“全文下載量”考察OA網站的使用情況。統(tǒng)計結果見表3。
表3 期刊網站下載量與CNKI下載量
由表3可見,大部分OA期刊的讀者使用情況已經遠超出商業(yè)數(shù)據(jù)庫。14種期刊中,有12種期刊的網站下載量超過其CNKI下載量,其中半數(shù)期刊的網站下載量遠超出其CNKI下載量,5種期刊的網站下載量略高于CNKI下載量;2種期刊的網站下載量低于CNKI下載量。期刊的網站下載量與其CNKI下載量之間中度相關(r=0.5423,p=0.0451<0.05)。
OA期刊網站之間的使用情況差異明顯。讀者對期刊網站的使用情況涉及多種因素,不僅與期刊的學術質量和影響力、期刊所覆蓋的讀者群大小等有密切關系,與其OA內容的網絡知名度和網絡可見性也有直接關系。期刊轉換為OA期刊的時間有先后,網站建設情況不一,因而影響其被讀者知曉的情況,及被搜索引擎收錄的情況,從而影響其被讀者使用的情況。網站建設起步早且影響因子較高的《軟件學報》、《自動化學報》、《控制理論與應用》,其下載量排名也較高:從網站簡介和網站備案號推斷,三種期刊分別創(chuàng)建于2001、2005和2008年,屬于TP類OA期刊中創(chuàng)建較早的;三種期刊的影響因子在31種TP核心期刊中的排位分別是1、3、8(影響因子參照表1)。
對于較新內容的網站下載量可以反映網站的即時使用情況,隨著期刊學術質量的提高、網絡顯示度的提高并及時發(fā)布全文內容,以下載量反映出來的讀者使用情況應當隨之有所提升。
根據(jù)獲取的數(shù)據(jù),分別以文章和期刊為單位考察了兩種下載量與引用次數(shù)的相關關系。統(tǒng)計結果見表4-5。
4.2.1 以文章為單位進行考察
表4反映了以文章為單位考察每種期刊的下載與引用的相關關系。就網站下載量與引用的相關性來看,《軟件學報》的網站下載量與引用呈高度線性相關(r≥0.8,p<0.05),《機器人》等2 種期刊的網站下載量與引用為中度相關(0.5≤r<0.8,p<0.05),《計算機工程與科學》的網站下載量與引用呈低度線性相關(0.3≤r<0.5,p<0.05),其余7 種期刊的網站下載量與引用不相關(|r|<0.3)。比較之下,11種期刊的CNKI下載量與引用均呈現(xiàn)線性相關關系,其中6種為高度相關,5種為中度相關。
表4 下載與引用之間的相關性——以文章為單位
如前所述,OA期刊網站的網絡知名度和網絡可見性對于讀者使用率有直接影響,從而影響下載之后的引用行為。
另外,期刊網站開放該期內容的時間對期刊論文的下載和引用有直接影響,自2008年或更早時間同步開放全文的期刊,其下載量與引用更有可能呈現(xiàn)相關關系。
以《軟件學報》為例[12],其自從2003年開始在網站同步實時開放期刊全文,之后網站點擊量急劇上升,從而帶動期刊的總被引頻次和影響因子指標得到迅速提升??梢酝茰y,至2008年,該刊網站已經形成了一個龐大穩(wěn)定的用戶群,從而對基于學術研究目的的內容獲取(轉化為引用行為)產生了積極的影響。而相比之下,網站創(chuàng)建時間晚并且對2008年全文內容的開放時間可能距離論文出版時間滯后較長時間的期刊,其網站下載的起點必會不同程度晚于CNKI,因而造成以文章考察的網站下載量與引用的不相關。
除此之外,部分期刊網站可能存在系統(tǒng)平臺故障造成的異常下載,以及主辦方及作者本人在網站上產生的非基于信息利用目的的下載,因而造成下載與引用背離的現(xiàn)象。相比之下,CNKI的下載量則相對統(tǒng)一準確,其下載與引用呈現(xiàn)出更高的相關性。
4.2.2 以期刊為單位進行考察
由表5可知,從整體上看,OA期刊網站下載量與引用次數(shù)、CNKI下載量與引用次數(shù)均呈中度相關關系(0.5≤r<0.8,p<0.05)。這表明,從整體上看,無論網站下載還是CNKI下載,都與引用有著密切關系。
表5 下載與引用之間的相關性——以期刊為單位
以上統(tǒng)計結果與牛昱昕等人的發(fā)現(xiàn)有相似之處,即單篇OA論文的網站下載與引用相關性不明顯,而以平均數(shù)從整體上考察的下載與引用則明顯相關。作者認為高下載不必然導致高被引,例如論文可能僅僅因為顯示度高而獲得大量下載,如果其內在質量不高,則引用轉化率也會很低;而從長期、整體上看,高被引必然代表之前存在著高下載,二者存在相關趨勢[4]。
就本文以文章為單位及期刊為單位的統(tǒng)計結果看,CNKI下載與引用均表現(xiàn)出相關性,OA期刊網站的總下載量與引用存在相關性,而以文章為單位具體考察每種期刊的網站下載與引用的相關關系時,部分相關、部分不相關。如4.2.1所述,期刊網站在網絡知名度和網絡顯示度上的不足、全文開放時間上的滯后性,以及基于非文獻利用目的的引用,可能是造成部分期刊網站下載與引用背離的原因。以期刊網站總下載量進行考察時,網站下載則與引用存在相關的趨勢。
此處以歷史文獻計算的網站下載量與CNKI下載量呈現(xiàn)高度相關關系(r≥0.8,p<0.05),4.1 以較新文獻計算的網站下載量與CNKI下載量中度相關(0.5≤r<0.8,p<0.05)。這里認為,兩種下載量相比,新文獻的下載量是一個即時的也是相對不穩(wěn)定的數(shù)據(jù),網站下載量與CNKI下載量隨時間推移均會發(fā)生較大的變化,歷史文獻的下載量則是相對穩(wěn)定的數(shù)據(jù)。
本文通過調查分析和定量研究的方法,對自動化和計算機技術類下核心期刊的全文開放情況、網站開放的特點及傳播效果進行了分析,得到一些有益的發(fā)現(xiàn):
(1)截止目前,TP類核心期刊有71%實現(xiàn)了不同程度的全文開放,開放的實時性較好,絕大多數(shù)期刊的全文內容至少回溯至2012年的內容(20/22),大部分期刊沒有設置訪問限制(19/22),并且可以實現(xiàn)檢索功能(21/22)。
(2)TP類核心期刊網站實時開放的比例高于商業(yè)數(shù)據(jù)庫CNKI和維普,網站訪問比較便利,但對于過刊回溯情況及檢索功能尚不及商業(yè)數(shù)據(jù)庫。
(3)從傳播效果來看,絕大多數(shù)OA期刊網站的下載量已高于或遠遠高于商業(yè)數(shù)據(jù)庫,成為科研人員獲取信息的重要來源。以文章為單位考察每種期刊下載量與引用的相關性,發(fā)現(xiàn)CNKI下載量與引用均呈現(xiàn)高度或中度相關性,有部分OA期刊網站的網站下載與引用呈相關關系(4/11),部分不相關(7/11);以期刊為單位考察下載量與引用的相關性,兩種下載量與引用次數(shù)均呈相關關系,證明網站下載與CNKI下載均與引用有密切關系。對于部分期刊的網站下載量與引用不相關的現(xiàn)象,各期刊網站在網絡知名度和網絡可見性上的不足、全文內容開放的滯后性、以及部分網站可能存在的異常下載可能是造成這種背離的一部分原因。
1 程維紅,任勝利,沈錫賓等.中國科協(xié)科技期刊數(shù)字出版及傳播力建設.中國科技期刊研究,2014,25(3):340-345
2 劉筱敏,張建勇.數(shù)字資源獲取對科學研究的影響—電子期刊全文下載與引用分析.大學圖書館學報,2009,27(1):60-63
3 龐景安.中文科技期刊下載計量指標與引用計量指標的比較研究.情報理論與實踐,2006,29(1):44-48
4 牛昱昕,宗乾進,袁勤儉.開放存取論文下載與引用情況計量研究.中國圖書館學報,2012,(7):119-127
5 方紅玲.OA網站與商業(yè)網站論文高下載量對比分析及其與被引頻次的相關性研究.中國科技期刊研究.2013,24(5):866-869
6 Norris M,Oppenheim C,Rowland F.The citation advantage of open-access articles.Journal of the American Society for Information Science and Technology,2008,59(12):1963-1972
7 Davis P M,Lewenstein B V,Simon D H,et al.Open access publishing,article downloads,and citations:randomised controlled trial.BMJ,2008,337
8 丁佐奇,鄭曉南,吳曉明.科技論文被引頻次與下載頻次的相關性分析.中國科技期刊研究,2010,21(4):467-470
9 黨蘭學.科技期刊論文被學位論文引用的文獻計量分析.中國科技期刊研究,2013,24(2):291-294
10 蔣紅艷.我國測繪類期刊OA現(xiàn)狀調查與分析.測繪通報,2013,(1):110-114
11 張鳳麗.農學類核心期刊開放存取現(xiàn)狀.安徽農業(yè)科學,2012,40(22):11500,11513
12 方梅,李桂云.全文上網對《軟件學報》發(fā)行量及其主要計量指標的影響.中國科技期刊研究,2007,18(2):275-277