摘要:對(duì)開(kāi)放獲取倉(cāng)儲(chǔ)目錄(DOAR)中收錄的1798個(gè)開(kāi)放獲取倉(cāng)儲(chǔ)的地域、語(yǔ)言、類(lèi)型、內(nèi)容、運(yùn)行狀況等分布規(guī)律進(jìn)行詳細(xì)分析,以揭示開(kāi)放獲取倉(cāng)儲(chǔ)的發(fā)展和運(yùn)行狀況。指出與國(guó)外發(fā)達(dá)國(guó)家或地區(qū)相比,我國(guó)大陸地區(qū)開(kāi)放獲取倉(cāng)儲(chǔ)發(fā)展十分緩慢。
關(guān)鍵詞:開(kāi)放獲取 開(kāi)放獲取倉(cāng)儲(chǔ) 開(kāi)放獲取倉(cāng)儲(chǔ)目錄
中圖分類(lèi)號(hào):G237 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-5853(2011)03-0080-05
2002年2月,開(kāi)放社會(huì)協(xié)會(huì)發(fā)布了布達(dá)佩斯開(kāi)放獲取計(jì)劃(BOAI),提出實(shí)現(xiàn)科學(xué)信息資源開(kāi)放獲取的兩種途徑:一是創(chuàng)辦開(kāi)放獲取期刊;二是自行存檔,即建立開(kāi)放獲取倉(cāng)儲(chǔ)。在過(guò)去幾年中,開(kāi)放獲取倉(cāng)儲(chǔ)已經(jīng)粗具規(guī)模,同時(shí)技術(shù)和相關(guān)政策也日趨成熟。為了全面深入地了解開(kāi)放獲取倉(cāng)儲(chǔ)的發(fā)展現(xiàn)狀,我們根據(jù)DOAR對(duì)其進(jìn)行分布研究。DOAR是由英國(guó)諾丁漢大學(xué)和瑞典倫德大學(xué)圖書(shū)館于2005年2月共同創(chuàng)建的開(kāi)放獲取倉(cāng)儲(chǔ)目錄檢索系統(tǒng),截至2010年12月25日,共收錄1798個(gè)開(kāi)放獲取倉(cāng)儲(chǔ)。
從數(shù)量來(lái)看,DOAR收錄的開(kāi)放獲取倉(cāng)儲(chǔ)經(jīng)歷了兩個(gè)顯著增長(zhǎng)階段:第一階段是2005年12月到2006年12月,在此期間,收錄的倉(cāng)儲(chǔ)數(shù)量呈跨越式增長(zhǎng),數(shù)量驟增至800余個(gè),其中又以2005年12月至2006年1月以及2006年8月至9月這兩個(gè)時(shí)間段的增長(zhǎng)最為顯著。第二階段是2007年至今,倉(cāng)儲(chǔ)數(shù)量由原先的跨越式發(fā)展向平穩(wěn)發(fā)展轉(zhuǎn)變。見(jiàn)圖1。
開(kāi)放獲取倉(cāng)儲(chǔ)數(shù)量不斷增長(zhǎng)的同時(shí),分布也呈現(xiàn)出一定特點(diǎn)。本文從三個(gè)方面詳細(xì)研究DOAR收錄的放獲取倉(cāng)儲(chǔ)的具體分布情況。
1、開(kāi)放獲取倉(cāng)儲(chǔ)基本信息分析
1.1 開(kāi)放獲取倉(cāng)儲(chǔ)地域分布
自1991年8月arXw預(yù)印本文庫(kù)在美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室建立以來(lái),世界各國(guó)紛紛開(kāi)始本國(guó)的開(kāi)放獲取倉(cāng)儲(chǔ)計(jì)劃。迄今為止,DOAR收錄的開(kāi)放獲取倉(cāng)儲(chǔ)分布在世界不同國(guó)家,并呈現(xiàn)出一定的地域分布特點(diǎn)?,F(xiàn)從大洲和國(guó)家兩個(gè)角度研究開(kāi)放獲取倉(cāng)儲(chǔ)的地域分布特點(diǎn)。
1.1.1 開(kāi)放獲取倉(cāng)儲(chǔ)洲際分布
開(kāi)放獲取倉(cāng)儲(chǔ)源于歐美,這一先發(fā)優(yōu)勢(shì)為其在歐美的發(fā)展打下了良好基礎(chǔ)。從圖2可以看到,全世界近半數(shù)開(kāi)放獲取倉(cāng)儲(chǔ)分布在歐洲各國(guó),比重達(dá)46%。其次是北美洲,擁有量占總量的25%。這兩個(gè)區(qū)域集中了全球逾七成開(kāi)放獲取倉(cāng)儲(chǔ)。亞洲位居第三,但僅占總量的16%,和歐美相比尚有距離。此外,南美洲、大洋洲、非洲等區(qū)域所占比重更小,均不超過(guò)5%,擁有的倉(cāng)儲(chǔ)數(shù)量也不足100個(gè)。這些區(qū)域尚處于開(kāi)放獲取倉(cāng)儲(chǔ)發(fā)展的起步階段。
1.1.2 開(kāi)放荻取倉(cāng)儲(chǔ)國(guó)家及地區(qū)分布
不同國(guó)家擁有開(kāi)放獲取倉(cāng)儲(chǔ)的情況也不盡相同。如圖3所示,擁有開(kāi)放獲取倉(cāng)儲(chǔ)數(shù)量最多的幾個(gè)國(guó)家分別為美國(guó)(21%)、英國(guó)(10%)、德國(guó)(8%)、日本(7%)、西班牙(4%)、澳大利亞(3%)、法國(guó)(3%)和意大利(3%)。盡管當(dāng)前世界上近一半開(kāi)放獲取倉(cāng)儲(chǔ)集中在歐洲,但美國(guó)卻是擁有開(kāi)放獲取倉(cāng)儲(chǔ)數(shù)量最多的國(guó)家。英國(guó)排名第二,但不足美國(guó)的一半。除美、英兩國(guó)之外,其余國(guó)家擁有的開(kāi)放獲取倉(cāng)儲(chǔ)數(shù)量均少于10%。排在前八位的國(guó)家中,亞洲、北美洲和大洋洲各有一個(gè)國(guó)家,其余五個(gè)皆為歐洲國(guó)家。
從擁有的倉(cāng)儲(chǔ)數(shù)量來(lái)看,排在前幾位的均為經(jīng)濟(jì)發(fā)達(dá)、科技實(shí)力雄厚的發(fā)達(dá)國(guó)家,這些國(guó)家同時(shí)也是科技出版強(qiáng)國(guó)。一個(gè)國(guó)家的科研投入與其經(jīng)濟(jì)發(fā)展對(duì)科技的需求、經(jīng)濟(jì)發(fā)展階段特征和國(guó)家采取的發(fā)展戰(zhàn)略密切相關(guān)。而上述因素又往往在很大程度上影響科技出版業(yè)的發(fā)展以及學(xué)術(shù)資源的增長(zhǎng)。據(jù)統(tǒng)計(jì),2009年科學(xué)研究與發(fā)展(R&D)經(jīng)費(fèi)支出最多的前三個(gè)國(guó)家依次為美國(guó)、英國(guó)和德國(guó),與開(kāi)放獲取倉(cāng)儲(chǔ)擁有量的排名完全吻合。緊隨這三個(gè)國(guó)家之后,我國(guó)研發(fā)投入位居世界第四,但在DOAR中登記的開(kāi)放獲取倉(cāng)儲(chǔ)數(shù)量(香港、澳門(mén)、臺(tái)灣除外)僅為4個(gè),可見(jiàn)我國(guó)對(duì)開(kāi)放獲取倉(cāng)儲(chǔ)建設(shè)的重視程度嚴(yán)重不足。
1.2 開(kāi)放獲取倉(cāng)儲(chǔ)類(lèi)型分布
DOAR將開(kāi)放獲取倉(cāng)儲(chǔ)分為四類(lèi):機(jī)構(gòu)倉(cāng)儲(chǔ)、學(xué)科倉(cāng)儲(chǔ)、整合倉(cāng)儲(chǔ)和政府倉(cāng)儲(chǔ)。從圖4可以看出,其數(shù)量最多的是由學(xué)會(huì)或相關(guān)科研機(jī)構(gòu)建立的機(jī)構(gòu)倉(cāng)儲(chǔ),超過(guò)總量的八成,占81%。其次是跨機(jī)構(gòu)的、以學(xué)科為基礎(chǔ)的學(xué)科倉(cāng)儲(chǔ),占總量的12%。排在第三的是通過(guò)整合多個(gè)子倉(cāng)儲(chǔ)形成的整合型倉(cāng)儲(chǔ),占總量的4%。由政府建立的匯集政府?dāng)?shù)據(jù)的政府倉(cāng)儲(chǔ)所占比重最小,僅有2%。由此可見(jiàn),學(xué)會(huì)等科研機(jī)構(gòu)對(duì)開(kāi)放獲取倉(cāng)儲(chǔ)的建設(shè)展示出較高熱情。我國(guó)大陸地區(qū)登記的4個(gè)開(kāi)放獲取倉(cāng)儲(chǔ)均為機(jī)構(gòu)倉(cāng)儲(chǔ)。
1.3 開(kāi)放獲取倉(cāng)儲(chǔ)運(yùn)行狀況分析
開(kāi)放獲取倉(cāng)儲(chǔ)的建立固然重要,但更需要建立之后長(zhǎng)期的維護(hù)以保證正常運(yùn)行。過(guò)去幾年,絕大多數(shù)開(kāi)放獲取倉(cāng)儲(chǔ)運(yùn)行正常,此類(lèi)倉(cāng)儲(chǔ)占總量的94%。此外有4%左右的倉(cāng)儲(chǔ)尚處于試用階段,另外1%的倉(cāng)儲(chǔ)由于技術(shù)性故障無(wú)法正常運(yùn)行,還有1%的開(kāi)放獲取倉(cāng)儲(chǔ)關(guān)閉了??傮w而言,當(dāng)前開(kāi)放獲取倉(cāng)儲(chǔ)的運(yùn)營(yíng)情況比較樂(lè)觀,僅有2%左右無(wú)法正常運(yùn)行(參見(jiàn)圖5)。
2、開(kāi)放獲取倉(cāng)儲(chǔ)內(nèi)容分析
開(kāi)放獲取倉(cāng)儲(chǔ)由不同類(lèi)型、不同語(yǔ)種、不同主題的信息和內(nèi)容組成,并采用不同的軟硬件技術(shù)以協(xié)助讀者存取、閱讀并滿(mǎn)足其他各種需要。下面對(duì)開(kāi)放獲取倉(cāng)儲(chǔ)的內(nèi)容分布情況進(jìn)行具體分析。
2.1 開(kāi)放荻取倉(cāng)儲(chǔ)文檔類(lèi)型分布
開(kāi)放獲取倉(cāng)儲(chǔ)包含海量信息。這些信息的類(lèi)型也多種多樣,既有傳統(tǒng)的科技文獻(xiàn)出版物,如期刊論文、圖書(shū)、專(zhuān)刊等,也有未出版的工作報(bào)告、會(huì)議論文、參考文獻(xiàn)等灰色文獻(xiàn),此外還有部分新型科技信息,如多媒體資料、數(shù)字化學(xué)習(xí)對(duì)象、數(shù)據(jù)集成以及軟件等。就數(shù)量而言,期刊論文等傳統(tǒng)形式的文獻(xiàn)信息依然占據(jù)主導(dǎo)地位,約占總量64%的倉(cāng)儲(chǔ)提供期刊論文存取服務(wù):新型信息尚未進(jìn)入開(kāi)放獲取倉(cāng)儲(chǔ)存儲(chǔ)的主流信息行列(參見(jiàn)圖6)。形成這一現(xiàn)象的原因主要是傳統(tǒng)類(lèi)型的信息經(jīng)過(guò)較長(zhǎng)時(shí)間發(fā)展已經(jīng)有了深厚積累,數(shù)量大,質(zhì)量高。相比之下,新型信息由于發(fā)展時(shí)間短,在數(shù)量和影響力方面都顯現(xiàn)出明顯弱勢(shì)。但隨著網(wǎng)絡(luò)應(yīng)用以及多媒體技術(shù)的發(fā)展,今后會(huì)涌現(xiàn)出越來(lái)越多的文檔類(lèi)型,其數(shù)量和比例也會(huì)不斷上升。另外,統(tǒng)計(jì)發(fā)現(xiàn)大多數(shù)機(jī)構(gòu)倉(cāng)儲(chǔ)中都包含多種類(lèi)型的文獻(xiàn)信息,僅收錄某一類(lèi)型文獻(xiàn)的倉(cāng)儲(chǔ)非常少見(jiàn)。
2.2 開(kāi)放獲取倉(cāng)儲(chǔ)主題分布
開(kāi)放獲取倉(cāng)儲(chǔ)中存儲(chǔ)的文獻(xiàn)涉及科學(xué)研究的各個(gè)領(lǐng)域,包括自然科學(xué)、社會(huì)科學(xué)、人文藝術(shù)等。從圖7發(fā)現(xiàn),超過(guò)60%的開(kāi)放獲取倉(cāng)儲(chǔ)收錄的主題涉及多個(gè)學(xué)科,收錄單一學(xué)科文獻(xiàn)信息的倉(cāng)儲(chǔ)數(shù)量相對(duì)較少,且涉及主題較為分散。其中,僅有科學(xué)總論、衛(wèi)生醫(yī)學(xué)和歷史考古學(xué)這三個(gè)主題的倉(cāng)儲(chǔ)數(shù)量超過(guò)100個(gè),其余主題的倉(cāng)儲(chǔ)數(shù)量在總量中所占比例較小。從單一主題倉(cāng)儲(chǔ)的數(shù)量來(lái)看,涉及自然科學(xué)主題的倉(cāng)儲(chǔ)數(shù)量多于社會(huì)科學(xué)。一直以來(lái),開(kāi)放獲取運(yùn)動(dòng)在自然科學(xué)領(lǐng)域的發(fā)展領(lǐng)先于社會(huì)科學(xué),這一現(xiàn)象同樣存在于開(kāi)放獲取倉(cāng)儲(chǔ)的建設(shè)中。
2.3 開(kāi)放獲取倉(cāng)儲(chǔ)語(yǔ)言分布
DOAR收錄的1798個(gè)開(kāi)放獲取倉(cāng)儲(chǔ)分布于世界各地,這一現(xiàn)象也決定倉(cāng)儲(chǔ)內(nèi)容涉及的語(yǔ)種具有多樣性特點(diǎn)。這些倉(cāng)儲(chǔ)共運(yùn)用30種語(yǔ)言(參見(jiàn)圖8)。其中英語(yǔ)是最常用語(yǔ)種,占全部倉(cāng)儲(chǔ)的78%。德語(yǔ)和話(huà)班牙語(yǔ)是僅次于英語(yǔ)的語(yǔ)種,這也反過(guò)來(lái)證明這兩個(gè)國(guó)家的開(kāi)放獲取倉(cāng)儲(chǔ)已經(jīng)具備一定發(fā)展規(guī)模。
需要密切關(guān)注的是,包含中文文獻(xiàn)內(nèi)容的開(kāi)放獲取倉(cāng)儲(chǔ)僅有65個(gè),只占總量的3%。雖然這一數(shù)據(jù)在過(guò)去幾年也呈增長(zhǎng)態(tài)勢(shì),但其中相當(dāng)一部分是由香港、臺(tái)灣等地區(qū)的機(jī)構(gòu)創(chuàng)建的,大陸地區(qū)的政府和科研機(jī)構(gòu)顯然應(yīng)該關(guān)注并積極投入開(kāi)放獲取倉(cāng)儲(chǔ)的建設(shè)與發(fā)展。
2.4 開(kāi)放獲取倉(cāng)儲(chǔ)應(yīng)用軟件分析
開(kāi)放獲取倉(cāng)儲(chǔ)的正常運(yùn)轉(zhuǎn)離不開(kāi)相關(guān)技術(shù)的支持,圖9顯示了當(dāng)前開(kāi)放獲取倉(cāng)儲(chǔ)軟件的應(yīng)用情況。其中,36%的開(kāi)放獲取倉(cāng)儲(chǔ)選擇DSpace這一開(kāi)源軟件,16%選擇EPrints。此外還有Digital Commons(4%)、OPUS(3%)、Greenstone(1%)、Diva-P0rtal(1%)、HTML(1%)等多款軟件應(yīng)用于開(kāi)放獲取倉(cāng)儲(chǔ)的設(shè)計(jì)和建設(shè)。主流為開(kāi)源軟件,如應(yīng)用最廣的DSpace、EPrints以及OPUS等。
3、開(kāi)放獲取倉(cāng)儲(chǔ)相關(guān)政策研究
開(kāi)放獲取倉(cāng)儲(chǔ)在建設(shè)時(shí)往往制定相關(guān)政策,規(guī)定倉(cāng)儲(chǔ)包含的元數(shù)據(jù)和全文數(shù)據(jù)能否以及如何再利用,信息如何存儲(chǔ)、提交等。下面對(duì)相關(guān)政策情況加以分析。
3.1 全文數(shù)據(jù)再利用政策
不同的開(kāi)放獲取倉(cāng)儲(chǔ)對(duì)全文數(shù)據(jù)再利用提出了不同要求(參見(jiàn)圖10),如有6個(gè)倉(cāng)儲(chǔ)明確申明所有全文數(shù)據(jù)都禁止再利用,有6%左右的倉(cāng)儲(chǔ)申明禁止機(jī)器人遍歷全文數(shù)據(jù)信息,有3%左右的倉(cāng)儲(chǔ)政策隨使用情況不同而發(fā)生改變,有6%的倉(cāng)儲(chǔ)允許本倉(cāng)儲(chǔ)的全文數(shù)據(jù)信息用于非盈利目的,幾乎沒(méi)有倉(cāng)儲(chǔ)允許將全文數(shù)據(jù)用于商業(yè)性目的。
綜合以上數(shù)據(jù),真正明確這一政策的倉(cāng)儲(chǔ)僅占總量的15%,更多倉(cāng)儲(chǔ)采取含糊態(tài)度,有的未在網(wǎng)頁(yè)中明確表明立場(chǎng),有的沒(méi)有給出清晰界定,還有的根本只字未提??梢?jiàn)開(kāi)放獲取倉(cāng)儲(chǔ)相關(guān)政策的制定并未引起建設(shè)者的足夠重視。盡管開(kāi)放獲取運(yùn)動(dòng)倡導(dǎo)的是免費(fèi)開(kāi)放與交流,但制定政策、保障作者利益的行為依然有必要。
3.2 元數(shù)據(jù)再利用政策
和對(duì)待全文數(shù)據(jù)再利用的態(tài)度相類(lèi)似,開(kāi)放獲取倉(cāng)儲(chǔ)對(duì)元數(shù)據(jù)再利用的態(tài)度也明確(參見(jiàn)圖11)。超過(guò)80%的開(kāi)放獲取倉(cāng)儲(chǔ)對(duì)這一政策未加明確定義,僅有12%的倉(cāng)儲(chǔ)管理者表明了態(tài)度,其中134個(gè)開(kāi)放獲取倉(cāng)儲(chǔ)允許將元數(shù)據(jù)用于非盈利目的,占總量的7%,僅有5%的倉(cāng)儲(chǔ)同意將元數(shù)據(jù)用于商業(yè)用途。
3.3 存儲(chǔ)政策
開(kāi)放獲取倉(cāng)儲(chǔ)現(xiàn)有的存儲(chǔ)方式包括自存儲(chǔ)、強(qiáng)制性存儲(chǔ)和協(xié)議性代存儲(chǔ)。所謂自存儲(chǔ),顧名思義是由作者完全以自愿為原則,選擇將自己的研究成果存入開(kāi)放獲取倉(cāng)儲(chǔ)供讀者免費(fèi)閱讀和使用。與之相對(duì)的是強(qiáng)制性存儲(chǔ),即某一機(jī)構(gòu)要求所屬人員的某部分科研成果必須提交給開(kāi)放獲取倉(cāng)儲(chǔ)。目前最有代表性的是高校學(xué)位論文的收集。第三是協(xié)議性代存儲(chǔ)(自存檔代理),主要應(yīng)用在學(xué)術(shù)機(jī)構(gòu)內(nèi)部。存儲(chǔ)管理機(jī)構(gòu)收集到作者的知識(shí)成果并與作者直接聯(lián)系,獲得作者許可后由機(jī)構(gòu)代為把成果上傳到機(jī)構(gòu)倉(cāng)儲(chǔ),或通過(guò)存檔軟件進(jìn)行批量存儲(chǔ),并在作者許可范圍內(nèi)使用相關(guān)成果。
自存儲(chǔ)知識(shí)庫(kù)的建立能有效提高知識(shí)的積累速度和利用效率,但完全依靠作者的自發(fā)行為往往難以滿(mǎn)足開(kāi)放獲取運(yùn)動(dòng)發(fā)展的需要,因此目前只有較小比例的學(xué)術(shù)成果通過(guò)自愿原則進(jìn)行自存儲(chǔ)。強(qiáng)制性存儲(chǔ)能保證開(kāi)放資源的數(shù)量與質(zhì)量,但這種強(qiáng)制力并不是每一個(gè)開(kāi)放獲取倉(cāng)儲(chǔ)都擁有的。不同的存儲(chǔ)政策對(duì)開(kāi)放獲取倉(cāng)儲(chǔ)的發(fā)展會(huì)產(chǎn)生不同程度的影響。從圖12發(fā)現(xiàn),明確界定了存儲(chǔ)政策的開(kāi)放獲取倉(cāng)儲(chǔ)數(shù)量并不多,僅占倉(cāng)儲(chǔ)總量的8%,絕大多數(shù)倉(cāng)儲(chǔ)對(duì)這一政策依然未加以明示。
4、小結(jié)
從開(kāi)放獲取倉(cāng)儲(chǔ)的分布規(guī)律來(lái)看,在地域分布方面,大部分開(kāi)放獲取倉(cāng)儲(chǔ)由歐美發(fā)達(dá)國(guó)家的機(jī)構(gòu)或組織創(chuàng)辦和建設(shè);在倉(cāng)儲(chǔ)類(lèi)型方面,81%的倉(cāng)儲(chǔ)屬于機(jī)構(gòu)倉(cāng)儲(chǔ),學(xué)科倉(cāng)儲(chǔ)、整合型倉(cāng)儲(chǔ)和政府倉(cāng)儲(chǔ)數(shù)量相對(duì)較少;在倉(cāng)儲(chǔ)運(yùn)行方面,98%的倉(cāng)儲(chǔ)處于正常運(yùn)行狀態(tài)i在倉(cāng)儲(chǔ)使用語(yǔ)言方面,78%的倉(cāng)儲(chǔ)用英語(yǔ)為用戶(hù)提供包括期刊論文、圖書(shū)、工作報(bào)告、多媒體資料等多種資源在內(nèi)的開(kāi)放獲取服務(wù),其他語(yǔ)種所占比例較?。辉谡咧朴喎矫?,僅有15%左右的倉(cāng)儲(chǔ)明確規(guī)定在某種限制條件下允許用戶(hù)對(duì)全文數(shù)據(jù)進(jìn)行再利用,12%左右允許用戶(hù)對(duì)元數(shù)據(jù)再利用,8%左右制訂了相關(guān)存儲(chǔ)政策。也就是說(shuō),絕大部分倉(cāng)儲(chǔ)還沒(méi)有針對(duì)全文數(shù)據(jù)和元數(shù)據(jù)的再利用以及資源存儲(chǔ)問(wèn)題制訂相關(guān)政策。
與國(guó)外相比,我國(guó)大陸地區(qū)開(kāi)放獲取倉(cāng)儲(chǔ)的發(fā)展情況相對(duì)緩慢。目前在DOAR上僅登記了中國(guó)科學(xué)院機(jī)構(gòu)倉(cāng)儲(chǔ)、廈門(mén)大學(xué)機(jī)構(gòu)倉(cāng)儲(chǔ)、中國(guó)西部環(huán)境與生態(tài)科學(xué)倉(cāng)儲(chǔ)以及福建師范大學(xué)圖書(shū)館系機(jī)構(gòu)倉(cāng)儲(chǔ)四個(gè)機(jī)構(gòu)倉(cāng)儲(chǔ)。這與我國(guó)的科技水平和學(xué)術(shù)出版現(xiàn)狀極不相符,需要引起政府部門(mén)及相關(guān)機(jī)構(gòu)的高度重