蔡明月
(臺灣政治大學圖書資訊與檔案學研究所,臺北 116)
商業(yè)引文數(shù)據(jù)庫與開放獲取引文系統(tǒng)的比較研究*
蔡明月
(臺灣政治大學圖書資訊與檔案學研究所,臺北 116)
本文旨在以商業(yè)引文數(shù)據(jù)庫和開放獲取引文系統(tǒng)為研究對象,深入比較兩種學術傳播機制的特色及涵蓋資源的完整性、重復性與獨特性。研究以經(jīng)濟學開放獲取期刊論文系統(tǒng)Research Papers in Economics收錄的2001—2012年共25位諾貝爾經(jīng)濟學獎得主的著作為樣本,采用文獻計量法,交叉比對兩兩數(shù)據(jù)庫的重復性及獨特性。所選的6個數(shù)據(jù)庫及系統(tǒng),包括商業(yè)引文數(shù)據(jù)庫Web of Science及Scopus,開放獲取引文系統(tǒng)Google Scholar、Microsoft Academic Search、OAIster、OpenDOAR。其中,Google Scholar及Microsoft Academic Search為綜合性學科搜索引擎系統(tǒng),OAIster、OpenDOAR為匯集式機構典藏系統(tǒng)。研究結果表明:在數(shù)據(jù)完整性、重復性和獨特性上,搜索引擎最優(yōu),其次為商業(yè)引文數(shù)據(jù)庫,再次為匯集式機構典藏系統(tǒng)。
商業(yè)性引文數(shù)據(jù)庫;開放獲取引文系統(tǒng);數(shù)據(jù)庫完整性;數(shù)據(jù)庫重復率
學術研究是國家發(fā)展的重要基礎。隨著傳播媒體及學術傳播方式的改變,學者傳遞知識的途徑也不斷演進。2000年以來,計算機及網(wǎng)絡的快速發(fā)展,促使信息生產(chǎn)、檢索、傳遞和利用發(fā)生很大變化。商業(yè)機制與開放獲取機制的引文數(shù)據(jù)庫,皆因?qū)W術傳播而產(chǎn)生,但其產(chǎn)生的目的和方法不同,因此,本研究旨在通過商業(yè)引文數(shù)據(jù)庫和開放獲取引文系統(tǒng),深入比較兩種學術傳播機制的特色及涵蓋資源的完整性、重復性與獨特性,以期為研究者與圖書館選擇引文索引資料庫或引文系統(tǒng)提供參考。此外,基于各系統(tǒng)的評估結果,提出學術評鑒指標與工具的建議。
文獻重復性及獨特性相關研究由Bradford于1937年提出,主要探討期刊文獻被索引摘要工具收錄的重復性,即引用文獻在2個以上的數(shù)據(jù)庫同時出現(xiàn)的情況;Yerkey等提出的分散理論,也指同主題論文分散在不同數(shù)據(jù)庫中收錄的情況[1]。Martyn利用Bradford提出的重復性理論,對其研究的摘要期刊收錄范圍進行分析,發(fā)現(xiàn)超過一半的文獻被收錄在1個以上的索引與摘要數(shù)據(jù)庫,認為索引與摘要數(shù)據(jù)庫的重復性會導致用戶查詢到重復數(shù)據(jù),造成人力浪費[2]。
Wood等從Biological Abstracts、Chemical Abstracts及Engineering Index數(shù)據(jù)庫選取14 592種期刊,并對標題字段進行分析,結果顯示:1%的期刊同時被3個數(shù)據(jù)庫收錄,27%的期刊同時被2個數(shù)據(jù)庫收錄,72%的期刊被1個數(shù)據(jù)庫收錄,顯示其唯一的獨特性[3]。
Read等針對圖書館與信息科學領域的數(shù)據(jù)庫Library and Information Science Abstracts(LISA)、Library Literature and Information Science(LLIS)及Information Science Abstracts(ISA),包含CD-ROM和在線兩種類別數(shù)據(jù)庫進行重復性研究[4]。結果顯示,LLIS包含的數(shù)據(jù)最多(30 542篇),ISA最少(5 094篇);在重復性比較上,LISA和ISA數(shù)據(jù)重復性為12.2%,LISA和LLIS的數(shù)據(jù)重復性為10.3%,ISA和LLIS的數(shù)據(jù)重復性為5.8%,3個數(shù)據(jù)庫同時存在的重復性數(shù)據(jù)低于3%,由此可知,3個數(shù)據(jù)庫的數(shù)據(jù)獨特性很高。
Walters等對7個單一學科數(shù)據(jù)庫及5個跨學科數(shù)據(jù)庫作內(nèi)容比較,二者分別收集1990—2000年美國與加拿大出版的later-life migration主題相關的數(shù)據(jù),經(jīng)檢驗后選取155篇進行研究[5],發(fā)現(xiàn)5個跨學科數(shù)據(jù)庫中有4個數(shù)據(jù)庫收錄的數(shù)據(jù)比任何單一學科數(shù)據(jù)庫收錄的數(shù)據(jù)都要完整,不同數(shù)據(jù)庫間平均重復率約45%。
Rather等對Google、AltaVista、HotBot、Scopus、Bioweb 5個搜索引擎進行重復性研究[6]。結果表明,HotBot與其他搜索引擎的平均重復性最高,其次是Google,另外,復合和復雜式的檢索查詢會產(chǎn)生更多重復結果。
Esmaeil等研究比較searchenginewatch.com網(wǎng)站介紹的6個常用搜索引擎系統(tǒng)及數(shù)據(jù)庫的重復性[7]。研究發(fā)現(xiàn),在不同的搜索引擎系統(tǒng)中,Yahoo與其他搜索引擎系統(tǒng)的平均重復率最高(約40%);Curry Guide檢索物理學類文獻的召回率為77%,與其他5個系統(tǒng)的平均重復率約44%。
Wang等以乳腺癌為檢索詞對Google、Yahoo、Bing和Ask.com進行分析比較[8]。研究結果顯示,4個搜索引擎對乳腺癌的6個標準檢索結果均排列前30名。從有效性看,Google最好,其次為Bing與Ask.com,最差為Yahoo;從重復性看,各搜索引擎兩兩對比,其收錄數(shù)據(jù)重復性均超過50%;從內(nèi)容看,4個搜索引擎皆強調(diào)不同類型的內(nèi)容;從使用者滿意度看,Bing的滿意度最好,其次為Yahoo與Google,最差的是Ask.com。研究認為依據(jù)不同的信息類型需求,選取適合的搜索引擎才能事半功倍。
重復性與獨特性的研究范圍十分廣泛,既包括出版社、數(shù)據(jù)庫與搜索引擎等數(shù)據(jù)源提供者,也包括各種數(shù)據(jù)源類型(如期刊、專利、網(wǎng)絡資源等)。重復性和獨特性的優(yōu)劣,是圖書館選擇索引與摘要數(shù)據(jù)庫的重要依據(jù)。
本研究采用文獻探討法及文獻計量法比較Web of Science、Scopus、Google Scholar、Microsoft Academic Search、OAIster、OpenDOAR數(shù)據(jù)庫及系統(tǒng),以RePEc的IDEAS系統(tǒng)提供的諾貝爾經(jīng)濟學獎得主2001—2012年的文獻清單為基準[9],針對上述各數(shù)據(jù)庫及系統(tǒng)進行文獻核對;利用Excel工具并輔以人工方式加以查證,評鑒各數(shù)據(jù)庫及系統(tǒng)的完整性;再用兩兩交叉比對的方式比較各數(shù)據(jù)庫及系統(tǒng)間的重復性及獨特性,評鑒其優(yōu)劣。一般而言,數(shù)據(jù)庫評鑒的假設:收錄數(shù)據(jù)越完整,與其他數(shù)據(jù)庫重復率越低,說明其獨特性越高,涵蓋數(shù)據(jù)范圍越優(yōu)異。
RePEc用戶使用的界面為IDEAS,IDEAS特別設置諾貝爾經(jīng)濟學獎得主所著的圖書及各類文獻,并在每月的第1天更新諾貝爾得主的文獻清單[10]。本研究考慮期刊文獻為學術傳播的主體,因此,圖書、網(wǎng)站資源、數(shù)字資源等皆不列入本研究范圍。
本文就商業(yè)引文數(shù)據(jù)庫及開放獲取引文系統(tǒng)現(xiàn)況與特性、完整性、重復性與獨特性進行研究分析。
4.1商業(yè)引文數(shù)據(jù)庫及開放獲取引文系統(tǒng)現(xiàn)況與特性
商業(yè)數(shù)據(jù)庫受營利性出版商的建設和定期維護,具有數(shù)據(jù)完整、學科范圍多元且選擇數(shù)據(jù)政策嚴謹?shù)忍厣?,因此其?shù)據(jù)具有權威性。
4.1.1商業(yè)引文數(shù)據(jù)庫
(1)Web of Science為美國湯森路透(Thomson Reuters)于1997年建立的網(wǎng)絡版引文索引數(shù)據(jù)庫,提供理、工、醫(yī)、農(nóng)、人文及社會科學等各學科領域的文獻書目、摘要及引用文獻等資料,收錄期刊超過1.3萬種,更新頻率為1次/周[11]。該數(shù)據(jù)庫特有的文獻間相互引用關系檢索,可提供研究人員更完整的研究參考信息,使其可依循前人研究軌跡,進一步了解同行及競爭對手的研究。
(2)Scopus是由Elsevier公司于2002年建立,2004年11月正式推出的索引摘要數(shù)據(jù)庫。截至2016年1月,Scopus收錄超過2.1萬種同行評審期刊(包含4 200種開放獲取期刊),且有超過5 000條國際出版社提供的摘要與引文索引(更新頻率1次/天),包括文獻紀錄6 000萬篇,回溯建檔文獻2 200萬篇;內(nèi)容包括學術期刊、會議論文及書評等。通過Scopus讀者可檢索到廣泛的人文與藝術領域、社會科學及生命科學領域等學術文獻,并通過單一接口提供整合檢索的功能。Scopus收錄論文除依據(jù)使用者意見外還遵循①收錄文獻必須為學術性刊物;②收錄期刊需有同行評審制度,以確保論文質(zhì)量;③論文必需提供英文摘要,且期刊必須定期出版,以保持資料庫收錄文獻的穩(wěn)定性[12]。
4.1.2綜合性學科搜索引擎
(1)Google Scholar于2004年開始運營,是免費的學術文獻檢索系統(tǒng)。其利用爬蟲(crawlers)在各合作者的資料庫和網(wǎng)絡中漫游獲取文獻資料,包含①許多大型且知名的出版者和大學機構(如美國電子電機工程師學會等)的資料庫;②數(shù)位主機(如HighWire Press、MetaPress、Ingenta等);③政府及其他學術組織和政府基金會(如美國物理學會、國家衛(wèi)生研究院等);④預印、重印服務者(如arXiv.org、Astrophysics Data System、RePEc及CiteBase等)[13]。此外,Google Scholar也歡迎個人用戶將其作品及個人資料庫加入其爬蟲清單。Google Scholar收錄資料類型包含同行評審論文、學位論文、圖書、預印本、摘要、技術報告、電子刊物等;按照出版物來源劃分,包含學術出版方、專業(yè)學會、預印本寄存出版商、大學機構及網(wǎng)絡資源等;按照提供管道劃分,包含出版社付費取用、開放取閱信息及圖書館登入取用信息等[14]。
(2)Microsoft Academic Search是微軟亞洲研究院于2009年開發(fā)的開放獲取學術搜索引擎系統(tǒng)。自2012年不更新系統(tǒng)收錄的內(nèi)容[15],其提供超過1.5億篇文獻,及數(shù)十億學術圖、表與文獻的鏈接,以知識概念和語意網(wǎng)作為其檢索系統(tǒng)的基礎,改進系統(tǒng)檢索方式,并強化與外部全文的連結。因此,Microsoft Academic Search的學術檢索除提供相關學術文獻外,還在頁面顯示相關研究者、研究機構、會議、期刊等學術信息,以構建學術網(wǎng)絡社群,推動學術傳播[16]。另外,與傳統(tǒng)搜索引擎系統(tǒng)相比,其開發(fā)時參考H指數(shù)排名,因此系統(tǒng)能查找到不同領域內(nèi)H指數(shù)較高的科學家或期刊文獻。
4.1.3匯集式機構典藏系統(tǒng)
(1)開放存取知識庫名錄(the Directory of Open Access Repositories,OpenDOAR)旨在利用全球性開放獲取系統(tǒng)進行數(shù)據(jù)搜集、組織及傳遞,提高開放獲取資源的取用效益,推動開放獲取的發(fā)展。OpenDOAR受開放社會研究所、英國聯(lián)合信息系統(tǒng)委員會、英國大學學術圖書館聯(lián)盟、歐洲學術出版與學術資源聯(lián)盟資助,由英國諾丁漢大學和瑞典蘭德大學于2005年共同創(chuàng)辦。此外,OpenDOAR和開放獲取期刊指南(Directory of Open Access Journals,DOAJ)并列為當前開放獲取學術資源檢索的主要平臺,其數(shù)據(jù)類型包含期刊論文、會議論文、學位論文、技術報告、專利數(shù)據(jù)、學習資源、多媒體資源、數(shù)據(jù)集、工作手稿及數(shù)據(jù)、預印本等,涵蓋29個學科領域[17]。截至2016年6月,有超過3 000家研究機構參與該系統(tǒng)建設,包含3 099個數(shù)據(jù)庫,其中有2 621個數(shù)據(jù)庫為機構典藏數(shù)據(jù)庫,并以美國、英國、日本及德國的機構典藏數(shù)據(jù)庫為主,四者共占總數(shù)35.6%[18]。
(2)OAIster為美國密歇根大學圖書館于2002年建立的匯集式機構典藏資源聯(lián)合目錄系統(tǒng)。主要提供數(shù)字資源搜尋服務,其典藏雖非自身產(chǎn)出的數(shù)字內(nèi)容,但目標是建立開放獲取的數(shù)字資源,使散布在網(wǎng)絡的學術性數(shù)字資源被方便地檢索使用。為擴大系統(tǒng)使用率及曝光度,2009年10月,密歇根大學將OAIster資料移至Online Computer Library Center,使全球使用者可通過WorldCat.org檢索OAIster的資料。OAIster收錄資料類型包括圖書、學位論文、期刊論文、研究報告、報紙、手稿、聲音文件、圖片、圖像文件、統(tǒng)計資料等[19]。OAIster包含全球1 500多所機構提供的數(shù)字資源,數(shù)據(jù)超過3 000萬篇(部分電子全文)。
綜上所述,商業(yè)引文數(shù)據(jù)庫的成立宗旨是為特定用戶建立,而開放獲取引文系統(tǒng)是為全球用戶建立;除Google Scholar無明確收錄范圍,其他數(shù)據(jù)庫及系統(tǒng)皆有明確收錄范圍;學科主題皆為綜合性學科;從時間看,Web of Science網(wǎng)絡版建立最早(1997年),Microsoft Academic Search建立最晚(2009年);各商業(yè)引文數(shù)據(jù)庫及開放獲取引文系統(tǒng)皆為全球性,在語言上均為多種語言,并以英文為主。
4.2商業(yè)引文數(shù)據(jù)庫與開放獲取引文系統(tǒng)完整性分析
2001—2012年諾貝爾經(jīng)濟學獎得主在期刊發(fā)表文獻1 888篇,在商業(yè)引文數(shù)據(jù)庫Web of Science中檢索到1 034篇文獻,占總量的54.77%;Scopus可檢索到1 117篇文獻,占總量的59.16%;可見相較Web of Science,Scopus資源擁有量更多。綜合性學科搜索引擎系統(tǒng)Google Scholar、Microsoft Academic Search及開放獲取引文系統(tǒng)OAIster、OpenDOAR所檢索到的文獻數(shù)占諾貝爾經(jīng)濟學獎得主發(fā)表文獻總數(shù)的比例分別為94.86%、93.59%、45.13%和28.81%(見表1)??梢姡阉饕娴钠诳墨I數(shù)據(jù)最豐富,其次是商業(yè)引文數(shù)據(jù)庫,再次是匯集式機構典藏系統(tǒng)。
表1 商業(yè)引文數(shù)據(jù)庫及開放獲取引文系統(tǒng)期刊文獻完整性比較
4.3商業(yè)引文數(shù)據(jù)庫與開放獲取引文系統(tǒng)重復性分析
4.3.1Web of Science
Web of Science和Scopus檢索到重復期刊文獻714篇,重復文獻量占Web of Science含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的69%,占Scopus的64%。Web of Science與Google Scholar、Microsoft Academic Search、OAIster、OpenDOAR的交叉比較及重復情況,具體見表2。其中,Web of Science與Google Scholar檢索到重復的期刊文獻數(shù)量最多,與OpenDOAR重復的期刊文獻數(shù)量最少;Web of Science在收錄期刊數(shù)據(jù)重復性的表現(xiàn)不及Scopus、Google Scholar、Microsoft Academic Search,但優(yōu)于OAIster和OpenDOAR。
表2 Web of Science與其他數(shù)據(jù)庫及系統(tǒng)重復性比較
4.3.2Scopus
Scopus和Google Scholar檢索到重復期刊文獻1 085篇,重復文獻量占Scopus含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的97%,占Google Scholar的61%。Scopus與Web of Science、Microsoft Academic Search、OAIster、OpenDOAR的交叉比較及重復情況,具體見表3。其中,Scopus與Google Scholar檢索到重復的期刊文獻數(shù)量最多,與OpenDOAR重復的期刊文獻數(shù)量最少;Scopus在收錄期刊文獻數(shù)據(jù)重復性的表現(xiàn)遠不及Google Scholar、Microsoft Academic Search,但優(yōu)于Web of Science、OAIster和OpenDOAR。Web of Science、OAIster和OpenDOAR與Scopus的期刊文獻重復率均不足70%,說明其表現(xiàn)雖較差但仍有其重要性。
4.3.3Google Scholar
Google Scholar和Microsoft Academic Search檢索到重復期刊文獻數(shù)為1 694篇,重復文獻量占Google Scholar含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的95%,占Microsoft Academic Search的96%。Google Scholar與Scopus、Web of Science、OAIster、OpenDOAR的交叉比較及重復情況,具體見表4。其中,Google Scholar與Microsoft Academic Search檢索到重復的期刊文獻數(shù)量最多,二者收錄期刊文獻數(shù)據(jù)重復性相近;與OpenDOAR重復的期刊文獻數(shù)量最少,整體而言,Google Scholar的重復性表現(xiàn)優(yōu)于其他檢索數(shù)據(jù)庫及系統(tǒng)。因此,在檢索文獻數(shù)據(jù)時,幾乎可以使用Google Scholar系統(tǒng)替代其他數(shù)據(jù)庫及系統(tǒng)。e
表3 Scopus與其他數(shù)據(jù)庫及系統(tǒng)重復性比較
表4 Google Scholar與其他數(shù)據(jù)庫及系統(tǒng)重復性比較
4.3.4Microsoft Academic Search
從表5可見,Microsoft Academic Search與Web of Science、Scopus、Google Scholar的重復文獻量占Microsoft Academic Search含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的比例與重復文獻量占各數(shù)據(jù)庫及系統(tǒng)的比例相比,Microsoft Academic Search的重復性遠低于Web of Science與Scopus,僅超出Google Scholar 1%。
Microsoft Academic Search和OAIster重復文獻量占Microsoft Academic Search含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的46%,占OAIster的96%;Microsoft Academic Search和OpenDOAR重復文獻量占Microsoft Academic Search含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的30%,占OpenDOAR的96%。
雖然Microsoft Academic Search與Google Scholar重復性相近,但優(yōu)于Scopus、Web of Science、OAIster及OpenDOAR數(shù)據(jù)庫及系統(tǒng)。
表5 Microsoft Academic Search與其他數(shù)據(jù)庫及系統(tǒng)重復性比較
4.3.5OAIster
OAIster和OpenDOAR檢索到重復期刊文獻331篇,重復文獻量占OAIster含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的39%,占OpenDOAR的61%。OAIster與Web of Science、Scopus、Microsoft Academic Search、Google Scholar的交叉比較及重復情況,具體見表6。
表6 OAIster與其他數(shù)據(jù)庫及系統(tǒng)重復性比較
其中,OAIster收錄期刊數(shù)據(jù)重復性不佳,只優(yōu)于OpenDOAR系統(tǒng),而OpenDOAR整體表現(xiàn)均不及其他數(shù)據(jù)庫及系統(tǒng)。
通過期刊文獻數(shù)據(jù)重復性比較可見,搜索引擎優(yōu)于商業(yè)引文數(shù)據(jù)庫,商業(yè)引文數(shù)據(jù)庫優(yōu)于匯集式機構典藏系統(tǒng)。搜索引擎Google Scholar優(yōu)于Microsoft Academic Search;商業(yè)引文數(shù)據(jù)庫Scopus優(yōu)于Web of Science;匯集式機構典藏系統(tǒng)OAIster優(yōu)于OpenDOAR。Google Scholar對Microsoft Academic Search的重復率最高,近100%,推測原因為Google Scholar及Microsoft Academic Search皆為搜索引擎,互相抓取的數(shù)據(jù)范圍基本相同。
4.4商業(yè)引文數(shù)據(jù)庫與開放獲取引文系統(tǒng)獨特性分析
從表7可見,與Scopus相比,Web of Science獨有的期刊文獻量占Web of Science含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的31%,Scopus獨有的文獻占Scopus含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的36%,二者獨特性相差不大。各數(shù)據(jù)庫及系統(tǒng)兩兩獨特性交叉比較,Web of Science期刊文獻獨特性與Google Scholar相比,Web of Science獨特性為2%,Google Scholar獨特性為43%,可見Web of Science獨有的期刊文獻資源不及Google Scholar。此外,Web of Science期刊文獻獨特性也遠不及Microsoft Academic Search,但優(yōu)于OAIster和OpenDOAR。
表7 商業(yè)引文數(shù)據(jù)庫及開放獲取引文系統(tǒng)期刊文獻獨特性比較
Scopus與Google Scholar相比,Scopus獨有的期刊文獻量為32篇,占Scopus含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的3%;Google Scholar獨有的期刊文獻量為706篇,占Google Scholar含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的39%;Scopus獨有的期刊文獻資源不及Google Scholar。此外,Scopus期刊文獻獨特性不及Microsoft Academic Search,但優(yōu)于OAIster和OpenDOAR。
Google Scholar與Microsoft Academic Search期刊文獻獨特性相近,均優(yōu)于Web of Science、Scopus、OAIster、OpenDOAR。匯集式機構典藏系統(tǒng)OAIster和OpenDOAR獨特性不及其他4個數(shù)據(jù)庫及系統(tǒng);二者相比,OAIster期刊文獻獨特性略優(yōu)于OpenDOAR,推測原因為OpenDOAR所擁有數(shù)據(jù)量最少,故對應其獨特性最低。
綜上所述,本研究中的商業(yè)引文數(shù)據(jù)庫及開放獲取引文系統(tǒng)期刊文獻獨特性優(yōu)劣順序為Google Scholar、Microsoft Academic Search、Scopus、Web of Science、OAIster、OpenDOAR。
本研究主要探討各數(shù)據(jù)庫及系統(tǒng)特性與現(xiàn)況,歸納其優(yōu)、缺點,進而分析各數(shù)據(jù)庫及系統(tǒng)的完整性。此外,還進一步交叉對比兩兩數(shù)據(jù)庫及系統(tǒng)的重復性及獨特性。
(1)搜索引擎數(shù)據(jù)完整性優(yōu)于商業(yè)引文數(shù)據(jù)庫,商業(yè)引文數(shù)據(jù)庫優(yōu)于匯集式機構典藏系統(tǒng)。搜索引擎Google Scholar與Microsoft Academic Search的數(shù)據(jù)相對完整;Google Scholar因包含各種子系統(tǒng),所以可檢索到多元數(shù)據(jù),在研究中,Google Scholar最常鏈接到的子系統(tǒng)為Google Book及Google Search;Microsoft Academic Search收錄數(shù)據(jù)也非常完整,二者完整性約95%與94%。商業(yè)引文數(shù)據(jù)庫完整性次之,兩個數(shù)據(jù)庫與搜索引擎數(shù)據(jù)量相差均超過34%。匯集式機構典藏系統(tǒng)完整性表現(xiàn)最差。各數(shù)據(jù)庫及系統(tǒng)完整性由高到低的順序為Google Scholar、Microsoft Academic Search、Scopus、Web of Science、OAIster、OpenDOAR。
(2)各數(shù)據(jù)庫及系統(tǒng)兩兩對比重復率后發(fā)現(xiàn),Google Scholar與其他各數(shù)據(jù)庫及系統(tǒng)重復文獻量占Google Scholar含諾貝爾經(jīng)濟學獎者發(fā)表文獻總量的比例均低于重復文獻量占各數(shù)據(jù)庫及系統(tǒng)的比例,其重復性最低。其次是Microsoft Academic Search;Scopus的重復性低于Web of Science、OAIster與OpenDOAR,卻高于Google Scholar、Microsoft Academic Search;Web of Science的重復性低于OAIster與OpenDOAR,卻高于Scopus、Google Scholar與Microsoft Academic Search;匯集式機構典藏系統(tǒng)OAIster重復性只低于OpenDOAR,卻遠高于其他系統(tǒng)與數(shù)據(jù)庫,即OpenDOAR的重復性是各數(shù)據(jù)庫及系統(tǒng)中最高的。
(3)各數(shù)據(jù)庫及系統(tǒng)兩兩對比獨特性后發(fā)現(xiàn),綜合性學科搜索引擎Google Scholar與Microsoft Academic Search獨特性優(yōu)于商業(yè)引文數(shù)據(jù)庫Web of Science與Scopus;匯集式機構典藏系統(tǒng)OAIster與OpenDOAR獨特性較差,其中OAIster獨特性略優(yōu)于OpenDOAR;商業(yè)引文數(shù)據(jù)庫的獨特性則介于搜索引擎與匯集式機構典藏系統(tǒng)之間,獨特性低于搜索引擎36%—41%,卻超過匯集式機構典藏系統(tǒng)11%—33%;其中Scopus獨特性又優(yōu)于Web of Science。換言之,商業(yè)引文數(shù)據(jù)庫質(zhì)量不及搜索引擎卻優(yōu)于匯集式機構典藏系統(tǒng)。
[1] YERKEY N,GLOGOWSKI M.Scatter of library and information science topics among bibliographic data bases[J].Journal of American Society for Information Science,1990,41(4):245-253.
[2] MARTYN J.Tests on abstracts journals:coverage overlap and indexing[J]. Journal of Documentation,2013,23(1):45-70.
[3] WOOD J L,F(xiàn)LANAGAN C,KENNEDY H E.Overlap in the list of journals monitored by BIOSIS,CAS,EI[J].Journal of the American Society for Information Science,1972,23(1):36-38.
[4] READ E,SMITH C.Searching for library and information science literature:a comparison of coverage in three database[J].Library Computing, 2000,19(1):118-126.
[5] WALTERS W H,WILDER E I.Bibliographic index coverage of a multidisciplinary field[J].Journal of the American Society for Information Science and Technology, 2003,54(14):1305-1312.
[6] RATHER R A,LONE F A,SHAH G J.Overlap in web search results:a study of five search engines[J].Library Philosophy and Practice,2008(12):1-6.
[7] ESMAEIL S M,KIAIE R M,KETAB F.A comparison between search engines and meta-search engines in retrieving information related to physics and the extent of their overlap[J].Library and Information Studies,2011,22(3):130-140.
[8] WANG L,WANG J,WANG M,et al.Using Internet search engines to obtain medical information:a comparative study[J].Journal of Medical Internet Research,2012,14(3):74.
[9] Nobel Prize.All Nobel Prizes in economic sciences[EB/OL]. http://www. nobelprize.org/nobel_prizes/economic-sciences/laureates.
[10] RePEc. RePEcservices[EB/OL].[2016-08-01].http://repec.org.
[11] Web of Science.Introduction to web of science[EB/OL].[2016-08-01]. http://concert.stpi.narl.org.tw/fdb/Web of Science /index.html.
[12] Scopus.Scopus in Detail: What does it cover?[EB/OL].[2016-08-01]. http://info.scopus.com/detail/what.
[13] O'LEARY M.Google Scholar:what's in it for you?[J].Information Today,2005,22(7):35-39.
[14] Google Scholar[EB/OL].[2016-08-01].https://scholar.google.com.tw.
[15] Microsoft.AcademicSearch[EB/OL].[2016-08-01].http://academic. research.microsoft.com/default.aspx.
[16] Microsoft Academic.Research more, search less[EB/OL].[2016-08-01]. http://academic.research.microsoft.com.
[17] 何琳.OpenDOAR和機構知識庫發(fā)展現(xiàn)狀[J].圖書館工作與研究,2009(2):30-33.
[18] OpenDOAR.The directory of open access repositories[EB/OL].[2016-08-01].http://www.opendoar.org
[19] OCLC.The OAIster? database[EB/OL].[2016-08-01].http://www.oclc. org/oaister.en.html.
A Comparison Study on Citation Index: Commercial Databases and Open Access Systems
CAI MingYue
(Graduate Institute of Library, Information and Archival Studies National ChengChi University, Taibei 116, China)
In this study, scholarly communication system of commercial services and open access will be examined through user interface and comprehensiveness of coverage for commercial citation index databases (Web of Science and Scopus) and open access citation system (Google Scholar, Microsoft Academic Search,OAIster and OpenDOAR). Retrievals will be conducted in the six citation index databases and systems stated above to analyze and compare their retrieval interfaces,and evaluations of each system will be made as well according to the output of retrieval results. Noble laureates in economic sciences from 2001 to 2012 are selected as samples in this study. Bibliographic records of their publications will be retrieved and downloaded from each system, and a computer program will be developed to perform the analytical tasks of sorting, comparison, elimination, aggregation and statistics. Bibliographic records retrieved from the six databases and systems will undertake quantitative analyses and cross references to determine the comprehensiveness of their system coverage. The results of the study may provide better references for libraries to acquire citation index databases, to build institutional repositories, or to create citation index systems on their own in the future. Suggestions on indicators and tools for academic assessment will be presented based on the comprehensiveness assessment of each system as well.
Citation Index Database; Open Access System; Database Coverage; Database Overlap
G255.51;G252.7
10.3772/j.issn.1673-2286.2016.10.004
蔡明月,女,1956年生,臺灣政治大學圖書資訊與檔案學研究所特聘教授,兼圖書館館長暨社會科學資料中心主任,研究方向:信息計量學、網(wǎng)絡計量學、圖書情報學、用戶研究,E-mail:mytsay@nccu.edu.tw。
(2016-08-19)