靳光明
[摘 要]跨入信息時(shí)代以來,中國的數(shù)據(jù)庫研究不斷取得進(jìn)步和發(fā)展,從20世紀(jì)90年代以來,中國逐漸形成了以CNKI、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫為主的三大數(shù)據(jù)庫。因此,文章首先簡單介紹了數(shù)據(jù)庫的內(nèi)涵,以及CNKI、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫這三大數(shù)據(jù)庫的發(fā)展情況。而后對三大數(shù)據(jù)庫的特點(diǎn)進(jìn)行了對比分析。最后對中國數(shù)據(jù)建設(shè)現(xiàn)狀做出了簡單分析。
[關(guān)鍵詞]CNKI;萬方數(shù)據(jù)庫;維普數(shù)據(jù)庫;數(shù)據(jù)建設(shè)
[DOI]10.13939/j.cnki.zgsc.2017.15.299
1 數(shù)據(jù)庫的內(nèi)涵及CNKI、萬方、維普數(shù)據(jù)庫簡述
1.1 數(shù)據(jù)庫的內(nèi)涵
數(shù)據(jù)庫產(chǎn)生于20世紀(jì)五六十年代,到20世紀(jì)90年代后取得了較大的發(fā)展,功能從儲(chǔ)存、管理數(shù)據(jù),發(fā)展到了根據(jù)用戶需要而進(jìn)行各種數(shù)據(jù)管理的程度。所謂數(shù)據(jù)庫,即能將數(shù)據(jù)以一定的方式存儲(chǔ)起來,所有客戶都可以共享這些數(shù)據(jù)資料。
在當(dāng)下的社會(huì)之中,數(shù)據(jù)庫的應(yīng)用范圍極其廣泛,各單位都建有或簡單或復(fù)雜的數(shù)據(jù)庫。例如,學(xué)校會(huì)建立數(shù)據(jù)庫以儲(chǔ)存教師和學(xué)生的相應(yīng)的信息,發(fā)布校方的官方新聞消息。與此同時(shí),師生都可以通過他們自己的編號和密碼進(jìn)入數(shù)據(jù)庫,搜索和下載自己需要的資源。并且,學(xué)校的數(shù)據(jù)庫簡單容易操作,資源也實(shí)現(xiàn)了共享,而且資源安全可靠,并有專人維護(hù)等。由此可見,人們在生活之中都會(huì)直接或者間接地與數(shù)據(jù)庫接觸,數(shù)據(jù)庫廣泛地存在于人們的生活之中。
從20世紀(jì)80年代以來,國內(nèi)的電子期刊數(shù)據(jù)庫迅速發(fā)展,逐漸形成了以CNKI、萬方、維普數(shù)據(jù)庫為主的三大數(shù)據(jù)庫。這三大數(shù)據(jù)庫各具特色。
1.2 CNKI、萬方、維普數(shù)據(jù)庫簡述
CNKI、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫是我國的三大數(shù)據(jù)庫。它們在不同的時(shí)間發(fā)展起來,也各具特色。
“CNKI”是“China National Knowledge Infrastructure”的簡稱,即“中國知識(shí)基礎(chǔ)設(shè)施工程”,也就是當(dāng)下學(xué)術(shù)界使用范圍非常廣泛的中國知網(wǎng)。CNKI是由清華大學(xué)和清華同方共同發(fā)起并由清華大學(xué)直接領(lǐng)導(dǎo)的一項(xiàng)知識(shí)項(xiàng)目工程,CNKI在1995年正式立項(xiàng),在1999年,CNKI所發(fā)行的學(xué)術(shù)期刊從光盤版本實(shí)現(xiàn)了網(wǎng)絡(luò)化。CNKI收錄期刊、報(bào)紙、優(yōu)秀學(xué)位論文、會(huì)議文件等,所囊括的范圍極其廣泛。據(jù)資料統(tǒng)計(jì),CNKI所收錄的期刊和文獻(xiàn)的完整率都高于99.9%。
萬方數(shù)據(jù)庫由萬方數(shù)據(jù)公司所開發(fā),也是和CNKI齊名的專業(yè)的學(xué)術(shù)數(shù)據(jù)庫。數(shù)據(jù)庫分為中文版本和英文版本,所收納的期刊包括理科、工科、醫(yī)學(xué)類和人文科學(xué)類的期刊全文,據(jù)資料統(tǒng)計(jì),共包括70多個(gè)類目,4529種科技類的期刊。萬方數(shù)據(jù)庫以網(wǎng)絡(luò)為主要平臺(tái),為其用戶提供了豐富的數(shù)據(jù)資料,為中國學(xué)術(shù)收錄工作做出了巨大的貢獻(xiàn)。
維普數(shù)據(jù)庫由重慶維普資訊公司所開發(fā)。從2000年建立以來,維普數(shù)據(jù)庫綜合整理了中國國內(nèi)館藏的外文期刊,以及互聯(lián)網(wǎng)之上的外文期刊。維普數(shù)據(jù)庫使得其用戶在同一數(shù)據(jù)庫之中就能找到中國館藏和互聯(lián)網(wǎng)之上的外文期刊,用戶不用再耗費(fèi)精力四處查找資料。既幫助用戶節(jié)省了他們的時(shí)間,又為用戶開拓了廣泛的閱讀空間。
CNKI、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫分別以其先進(jìn)的理念,跟隨時(shí)代發(fā)展步伐。為廣大用戶提供了海量的學(xué)術(shù)資源,便利了用戶的材料搜索渠道,拓寬了用戶的學(xué)術(shù)資源視野。
2 CNKI、萬方、維普數(shù)據(jù)庫的特點(diǎn)對比分析
CNKI、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫都具有非常強(qiáng)大的數(shù)據(jù)資料收錄功能。但是,具體來說,各數(shù)據(jù)庫既有相同之處,又都有自己的特點(diǎn)。
首先,CNKI、萬方、維普數(shù)據(jù)庫有許多相同之處。具體體現(xiàn)在三個(gè)方面。第一,在檢索方式上,CNKI、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫都可以按照“題名”“關(guān)鍵詞”“摘要”“作者”“作者單位”的方式進(jìn)行檢索。第二,在收錄內(nèi)容方面,都收錄了較為全面的中文期刊,為廣大用戶提供了豐富的學(xué)術(shù)資源。第三,在用戶群體方面,三大數(shù)據(jù)庫的主要用戶一般都是高等院校的學(xué)生,以碩士研究生、博士研究生群體居多。
其次,CNKI、萬方、維普數(shù)據(jù)庫各有優(yōu)勢。也正因?yàn)槿绱?,CNKI、萬方、維普數(shù)據(jù)庫也有許多的不同之處??蓮氖珍浄秶?、瀏覽清晰度,以及收錄時(shí)間三方面進(jìn)行比較。
從收錄范圍來看,CNKI的地位是不可動(dòng)搖的。具體來說,CNKI的優(yōu)勢主要體現(xiàn)在以下四個(gè)方面。
第一,在檢索方式上,雖然都可以按照用戶的需求進(jìn)行檢索,但是CNKI有分類檢索、初級檢索、高級檢索和專業(yè)檢索這四種方式,并且每次檢索以后,可以在其檢索結(jié)果中進(jìn)行二次檢索,這個(gè)操作步驟可以進(jìn)行無數(shù)遍,直至檢索結(jié)果為零。
第二,在收費(fèi)方式方面,CNKI的收費(fèi)方式最為靈活,維普數(shù)據(jù)庫的收費(fèi)方式較為靈活,而萬方數(shù)據(jù)庫的收費(fèi)方式相較于CNKI、維普數(shù)據(jù)庫來說則欠缺靈活性,且萬方數(shù)據(jù)庫和維普數(shù)據(jù)庫的收費(fèi)相較于CNKI來說,相對較貴。
第三,在收錄的學(xué)科范圍方面,CNKI最為全面,而萬方數(shù)據(jù)庫次之,維普數(shù)據(jù)庫的收錄范圍相較于CNKI、萬方來說則相對不夠全面。CNKI所包含的范圍幾乎是囊括了所有學(xué)科。維普數(shù)據(jù)庫所收錄的內(nèi)容主要包括自然科學(xué)、農(nóng)業(yè)科學(xué)、醫(yī)藥衛(wèi)生、經(jīng)濟(jì)管理,以及教育科學(xué)和圖書情報(bào),但是,近幾年以來,維普數(shù)據(jù)庫所收錄的醫(yī)藥衛(wèi)生方面的內(nèi)容幾乎沒有再更新了。而萬方數(shù)據(jù)庫所搜集的東西則主要包括理科、工科、醫(yī)學(xué)、農(nóng)學(xué)和人文類學(xué)科的內(nèi)容。
第四,在期刊來源、引文數(shù)量以及更新速度方面,也使CNKI具有更強(qiáng)的優(yōu)勢。在期刊來源上,屬于CNKI的來源最多,據(jù)資料統(tǒng)計(jì),CNKI包括了6000多種期刊來源,而維普數(shù)據(jù)庫只有5000多種,萬方數(shù)據(jù)庫則僅有3000多種。在引文數(shù)量方面,CNKI有790多萬篇,而萬方數(shù)據(jù)庫只有490多萬篇,維普數(shù)據(jù)庫則僅有140多萬篇。在更新速度上,CNKI的更新速度是最快的,CNKI基本上保持了每日更新的速度,而維普數(shù)據(jù)庫是半個(gè)月才更新一次,萬方數(shù)據(jù)庫則是一個(gè)月才更新一次。
而從數(shù)據(jù)庫的瀏覽清晰度比較,則屬于萬方數(shù)據(jù)庫的瀏覽清晰度最高,其閱讀模式主要采用PDF格式,上傳的清晰度非常高,就像在閱覽紙質(zhì)版一樣。而CNKI采用的是PDF、CAJ的瀏覽器,必須下載相關(guān)的瀏覽器才可以進(jìn)行閱讀,相對來說,清晰度沒有萬方數(shù)據(jù)庫的高。而維普數(shù)據(jù)庫文檔的清晰度相對萬方和CNKI來說,則較差。
從收錄時(shí)間來看,則是維普的收錄時(shí)間最早,它收錄了從1990年開始以后的相關(guān)數(shù)據(jù)資料。CNKI所收錄的內(nèi)容是從1994年開始的,萬方數(shù)據(jù)庫則是從2001年開始。
由此綜合來看,屬于CNKI的使用范圍更為廣泛。無論是在收費(fèi)方式,還是在期刊來源、引文數(shù)量、更新速度上,以及所囊括的學(xué)科范圍上,CNKI都具有更多的優(yōu)勢。對學(xué)生群體來說,一般都是使用CNKI進(jìn)行資料查詢。
3 中國數(shù)據(jù)建設(shè)現(xiàn)狀
首先,就數(shù)據(jù)建設(shè)成就來說,從20世紀(jì)90年代以來,我國的數(shù)據(jù)建設(shè)取得了豐碩的發(fā)展成果。據(jù)資料統(tǒng)計(jì),2009年,我國的各類數(shù)據(jù)中心和機(jī)房總數(shù)量為519990個(gè),在2012時(shí),數(shù)量已經(jīng)達(dá)到約540777個(gè)。并且在21世紀(jì)初,逐漸形成了以CNKI、萬方和維普為主的三大專業(yè)的學(xué)術(shù)期刊收錄數(shù)據(jù)庫。在2016年,在貴州省建立了國家級別的大數(shù)據(jù)中心,是我國的數(shù)據(jù)建設(shè)事業(yè)大跨步發(fā)展的實(shí)踐證明。
其次,數(shù)據(jù)建設(shè)的發(fā)展還存在三方面的阻礙因素:第一,數(shù)據(jù)建設(shè)的法律法規(guī)不完善;第二,數(shù)據(jù)共享觀念的缺失;第三,數(shù)據(jù)平臺(tái)建設(shè)存在重心偏移傾向。
總之,我國數(shù)據(jù)建設(shè)還處于發(fā)展階段,有極大的開發(fā)空間。但在數(shù)據(jù)建設(shè)發(fā)展過程中,要注重解決當(dāng)下存在的問題,例如,完善相關(guān)的法律法規(guī),培養(yǎng)數(shù)據(jù)共享觀念,平衡數(shù)據(jù)平臺(tái)建設(shè)的重心等。只有充分利用當(dāng)前數(shù)據(jù)建設(shè)的發(fā)展成果并解決了當(dāng)下存在的問題,才能使我國數(shù)據(jù)建設(shè)邁上更高的臺(tái)階。
參考文獻(xiàn):
李金蘭.CNKI、萬方、維普資源比較分析[J].情報(bào)探索,2011(4).