劉建輝,朱 蕾
(中國(guó)地質(zhì)大學(xué),武漢 430074)
當(dāng)前,信息產(chǎn)生的速度正以幾何級(jí)數(shù)形式增長(zhǎng),信息資源也隨之以幾何級(jí)數(shù)的速度增長(zhǎng),尤其是網(wǎng)絡(luò)信息資源,較傳統(tǒng)信息資源增長(zhǎng),更新速度更快,數(shù)量更大。在這種情況下,加強(qiáng)對(duì)國(guó)內(nèi)外網(wǎng)絡(luò)地學(xué)文獻(xiàn)信息源的研究,掌握網(wǎng)絡(luò)地學(xué)文獻(xiàn)信息源的分布情況、規(guī)律和特點(diǎn),為地學(xué)學(xué)科發(fā)展提供針對(duì)性的服務(wù),成為高校圖書館學(xué)科服務(wù)人員的責(zé)任和義務(wù),如對(duì)網(wǎng)上信息資源進(jìn)行篩選、分類、鑒別和鏈接,制作專業(yè)網(wǎng)站,為用戶在浩瀚無際的互聯(lián)網(wǎng)信息海洋中采擷信息提供導(dǎo)航等,即通過引導(dǎo)用戶快速、準(zhǔn)確地進(jìn)入特定網(wǎng)站,檢索到所需的有效信息,以優(yōu)化檢索質(zhì)量。
信息是指應(yīng)用文字、數(shù)據(jù)或符號(hào)等形式通過一定的傳遞或處理,來表現(xiàn)各種相互聯(lián)系的客觀事物在運(yùn)動(dòng)中所具有的特征內(nèi)容的總稱。地球科學(xué)飛速發(fā)展,新理論、新方法、新技術(shù)層出不窮,相應(yīng)地,地學(xué)信息源也日益擴(kuò)大。地學(xué)信息資源涵蓋了涉及地學(xué)的文獻(xiàn)、知識(shí)、信息的所有方面。其中,學(xué)術(shù)文獻(xiàn)信息資源是最常用、內(nèi)容最豐富的一種信息資源。對(duì)國(guó)際地球科學(xué)發(fā)展趨勢(shì)的分析表明,現(xiàn)代地球科學(xué)的概念與傳統(tǒng)相比已經(jīng)發(fā)生了巨大的變化,出現(xiàn)了“大地質(zhì)”、“大資源”、“大國(guó)土”的理念。根據(jù)這一思路,將傳統(tǒng)的地學(xué)概念進(jìn)一步拓展,研究范圍也進(jìn)一步拓寬,主要包括2個(gè)方面:(1)從狹義的地質(zhì)學(xué)向廣義的資源科學(xué)拓寬,涉及范圍包括地質(zhì)、礦產(chǎn)、土地、海洋、水資源、環(huán)境、測(cè)繪等方面,逐步確立“大資源”、“大地質(zhì)”的理念;(2)從單純的以科學(xué)研究為主的文獻(xiàn)信息,向科研信息和管理信息并重拓寬,從某種意義上看,更側(cè)重于加強(qiáng)管理文獻(xiàn)信息源的建設(shè)。
地學(xué)信息按出版方式不同分為:期刊、博碩論文、會(huì)議、專利、科技報(bào)告等等。Internet上免費(fèi)電子資源十分豐富,如專業(yè)的搜索引擎、社區(qū)和論壇、免費(fèi)電子期刊、免費(fèi)電子圖書、免費(fèi)軟件下載等等,其中有很多學(xué)術(shù)價(jià)值較高的地學(xué)資源。圖書館工作人員通過網(wǎng)絡(luò)收集整理免費(fèi)的電子資源,從中選擇與地學(xué)有關(guān)的網(wǎng)站,專供用戶瀏覽、下載。以此增加圖書館的虛擬館藏,這對(duì)于緩解圖書館經(jīng)費(fèi)緊張,提升圖書館的服務(wù)質(zhì)量,改善圖書館的服務(wù)模式有著深遠(yuǎn)的影響。
如何從海量的網(wǎng)絡(luò)信息資源中選出具有專業(yè)學(xué)術(shù)價(jià)值的信息資源,是導(dǎo)航庫建設(shè)過程中非常重要的一環(huán),因此必須在遵循網(wǎng)絡(luò)信息選擇標(biāo)準(zhǔn)的前提下,建立嚴(yán)格的信息采集原則,并借助科學(xué)的信息獲取方法和途徑。信息采集原則應(yīng)遵循:
(1)需求性。所謂需求性就是根據(jù)用戶信息的需求來決策采集內(nèi)容,信息采集要為教學(xué)服務(wù)、為科研服務(wù)、為廣大師生服務(wù)。
(2)特色化。有特色才有生命力,在信息資源的收集中,要體現(xiàn)中國(guó)地質(zhì)大學(xué)的辦學(xué)特色。只有在文獻(xiàn)資源的采集時(shí)特色突出,才能形成以地球科學(xué)為主,其他專業(yè)為輔的特色館藏資源。既要區(qū)別于專業(yè)單一的圖書館,又要區(qū)別于其他綜合型大學(xué)圖書館。
(3)系統(tǒng)性。系統(tǒng)性就是不是簡(jiǎn)單地將收集到數(shù)據(jù)堆砌、拼湊,而是按照導(dǎo)航庫的基本框架系統(tǒng)地收集、組織、編輯、處理、存儲(chǔ)地球科學(xué)領(lǐng)域中的信息。
采集方法主要包括隨機(jī)累積法、專題累積法、使用評(píng)估和專家推薦法。隨機(jī)累積法就是通過平時(shí)隨機(jī)積累與分類,變一般資源為專題資源,增加其用途和價(jià)值;專題累積法就是設(shè)置專題,有的放矢、持之以恒地進(jìn)行專項(xiàng)積累;使用評(píng)估就是讓用戶通過一段時(shí)間的使用對(duì)信息資源進(jìn)行評(píng)價(jià),信息采集人員通過統(tǒng)計(jì)分析后判斷資源的利用價(jià)值,從而最終取舍;專家推薦法是由地學(xué)專家向圖書館推薦高質(zhì)量的圖書、電子數(shù)據(jù)庫和免費(fèi)網(wǎng)站。
利用數(shù)據(jù)挖掘技術(shù)對(duì)Internet上無序的地學(xué)信息采集和分類,使圖書館的信息資源更加豐富。數(shù)據(jù)挖掘包括數(shù)據(jù)抽取、數(shù)據(jù)分類、數(shù)據(jù)聚類和數(shù)據(jù)關(guān)聯(lián)四個(gè)方面:(1)數(shù)據(jù)抽取是從無限龐雜的信息源中以多維的數(shù)據(jù)分析方法抽取與地學(xué)有關(guān)的信息數(shù)據(jù)。(2)數(shù)據(jù)分類是對(duì)網(wǎng)絡(luò)中發(fā)現(xiàn)的相關(guān)數(shù)據(jù)進(jìn)行分析、比較、識(shí)別、分類和整理,從大量的信息中剝離出與地學(xué)主題或子題類目有密切關(guān)聯(lián)的數(shù)據(jù)。(3)數(shù)據(jù)聚類是將屬于地學(xué)主題和子題類目的各種數(shù)據(jù),或近似類目的數(shù)據(jù)進(jìn)行分析比較聚類。(4)數(shù)據(jù)關(guān)聯(lián)不僅將搜集到的有關(guān)地學(xué)各目錄的數(shù)據(jù)分類取舍、聚類于相應(yīng)的類目中,還要將有關(guān)聯(lián)的其他學(xué)科的數(shù)據(jù)聚類于相應(yīng)的類目之下,揭示邊緣交叉學(xué)科的一些理論與地學(xué)有關(guān)理論的關(guān)聯(lián)性,引導(dǎo)用戶把學(xué)科理論的研究推向更深、更廣。其中數(shù)據(jù)分析和歸類是最為重要的步驟。
如果沒有一個(gè)有效地工具,在網(wǎng)絡(luò)中查找信息就如同大海撈針。網(wǎng)絡(luò)搜索引擎為解決這一問題提供了非常有效地手段。網(wǎng)絡(luò)搜索引擎包括:分類式搜索引擎和關(guān)鍵詞搜索引擎。分類式搜索引擎的性能取決于如何獲得網(wǎng)絡(luò)信息和對(duì)已獲得的網(wǎng)絡(luò)信息怎樣進(jìn)行分類。關(guān)鍵詞搜索引擎不是按主題來檢索信息,而是用提供關(guān)鍵詞的方法進(jìn)行檢索。這兩種途徑在地學(xué)信息采集中都非常有效,兩者相互相成,為地學(xué)信息采集提供幫助。目前網(wǎng)上提供的搜索引擎不計(jì)其數(shù),但任何一個(gè)搜索引擎只能側(cè)重于某幾個(gè)方面,難以面面俱到。以下是根據(jù)工作經(jīng)驗(yàn),介紹幾種適合信息資源采集的學(xué)術(shù)搜索引擎:
(1)SCIRUS (http://www.scirus.com/).SCIRUS是由愛思唯爾科學(xué)公司(Elsevier Science)于2001年4月推出的、迄今為止國(guó)際互聯(lián)網(wǎng)上最全面的科技信息專用搜索引擎。它以自身擁有的資源為主體,對(duì)網(wǎng)上具有科學(xué)價(jià)值的資源進(jìn)行整合,集聚了帶有科學(xué)內(nèi)容的網(wǎng)站及與科學(xué)相關(guān)的網(wǎng)頁上的科學(xué)論文、科技報(bào)告、會(huì)議論文、專業(yè)文獻(xiàn)、預(yù)印本等。SCIRUS的檢索界面友好,簡(jiǎn)潔方便。
(2)Google Scholar(http://scholar.google.cn/).Google scholar是由Google推出的免費(fèi)學(xué)術(shù)搜索工具,可以幫助用戶快速查找學(xué)術(shù)資料,包括來自學(xué)術(shù)著作出版商、專業(yè)性社團(tuán)、預(yù)印本、各大學(xué)及其他學(xué)術(shù)組織的經(jīng)同行評(píng)論的文章、論文、圖書、摘要和技術(shù)報(bào)告。Google Scholar在索引中涵蓋了來自多方面的信息,信息來源包括萬方數(shù)據(jù)資源系統(tǒng)、維普資訊、主要大學(xué)發(fā)表的學(xué)術(shù)期刊、公開的學(xué)術(shù)期刊、中國(guó)大學(xué)的論文、中國(guó)國(guó)家數(shù)字圖書館的館藏圖書以及網(wǎng)上可以搜索到的各類文章。
(3)INFOMINE (http://infomine.ucr.edu/).INFO-MINE是為大學(xué)教師、學(xué)生和研究人員建立的網(wǎng)絡(luò)學(xué)術(shù)資源虛擬圖書館。它擁有電子期刊、電子圖書、公告欄、郵件列表、圖書館在線目錄、研究人員人名錄,以及其他類型的信息資源40000多個(gè)。INFOMINE對(duì)所有用戶免費(fèi)開放,但是它提供的資源站點(diǎn)并不都是免費(fèi)的,能否免費(fèi)使用,取決于用戶所在圖書館是否擁有該資源的使用權(quán)。INFOMINE共有12個(gè)數(shù)據(jù)庫,其中包括地圖和地理信息系統(tǒng)(GIS)數(shù)據(jù)庫,物理、工程、計(jì)算機(jī)和數(shù)學(xué)數(shù)據(jù)庫。
地球科學(xué)數(shù)據(jù)信息導(dǎo)航 http://esdip.llas.ac.cn/SPT——Home.php是2002年9月由中國(guó)科學(xué)院批準(zhǔn)的中國(guó)科學(xué)院知識(shí)創(chuàng)新工程重要方向項(xiàng)目。該項(xiàng)工作的目的是為集成揭示國(guó)內(nèi)外主要地球科學(xué)數(shù)據(jù)資源提供深入的導(dǎo)航服務(wù),宣傳和推介地球科學(xué)數(shù)據(jù)資源,積極有效地提高和促進(jìn)用戶對(duì)地球科學(xué)基礎(chǔ)性數(shù)據(jù)的利用和共享。目前導(dǎo)航系統(tǒng)已經(jīng)收集了5000余條國(guó)內(nèi)外地球科學(xué)及其相關(guān)學(xué)科數(shù)據(jù)資源的元數(shù)據(jù)信息,并全部提供開放式服務(wù)。
國(guó)內(nèi)著名的地學(xué)圖書館中國(guó)地質(zhì)圖書館 http://124.42.30.4/ngds/.該庫以中國(guó)地質(zhì)圖書館館藏期刊、圖書為主要數(shù)據(jù)源,收錄中文地球科學(xué)、土地科學(xué)及相關(guān)內(nèi)容期刊、專著、匯編、會(huì)議論文集等文獻(xiàn)資料。
國(guó)外著名的大學(xué)和科研機(jī)構(gòu)有:哈佛大學(xué)地質(zhì)系http://www-eps.harvard.edu/;澳大利亞地球科學(xué)http://earthsci.org/;康奈爾大學(xué)地質(zhì)科學(xué)系 http://www.eas.cornell.edu/;耶魯大學(xué)地質(zhì)與地球物理系Department of Geology and Geophysics http://www.geology.yale.edu/;普林斯頓大學(xué)Princeton University Department of geosciences http://geoweb.princeton.edu/;華盛頓大學(xué)University of Washington Earth and Space Sciences(Geology,Geophysics,Geological Sciences)http://www.vsc.washington.edu/;斯坦福大學(xué)地球物理系Geophysics Departmenthttp://pangea.stanford.edu/GP/;斯坦福大學(xué)Geological&Environmental Sciences Department http://pangea.stanford.edu/GES/GES.html;斯坦福大學(xué)能源與資源工程系Energy Resources Engineering http://pangea.stanford.edu/ERE/;斯坦福大學(xué)地球科學(xué)學(xué)院SCHOOL OF EARTH SCIENCES http://pangea.stanford.edu/,等等。
專業(yè)期刊歷來都是學(xué)術(shù)資源的重要來源,其網(wǎng)絡(luò)版亦然。目前很多專業(yè)期刊都有網(wǎng)絡(luò)版,在其紙質(zhì)版本上一般都有其網(wǎng)址的介紹。其中由中國(guó)地質(zhì)大學(xué)主辦的《地球科學(xué)一一中國(guó)地質(zhì)大學(xué)學(xué)報(bào)》是中國(guó)自然科學(xué)核心期刊,進(jìn)入EI、CA,PX,CBST等世界著名國(guó)際檢索系統(tǒng)。
國(guó)外的地學(xué)類專業(yè)全文數(shù)據(jù)庫主要有:Geo-ScienceWorld數(shù)據(jù)庫,它是由7家地球科學(xué)領(lǐng)域的頂尖協(xié)會(huì)共同建立的非營(yíng)利型組織,現(xiàn)已出版32種地球科學(xué)領(lǐng)域相關(guān)的期刊文獻(xiàn)。AGU(美國(guó)地球物理協(xié)會(huì))是以地球科學(xué)為核心內(nèi)容的跨學(xué)科的綜合性研究站點(diǎn),信息來源于世界上117個(gè)國(guó)家的38000余個(gè)科學(xué)家的研究進(jìn)展和研究成果。外文文摘數(shù)據(jù)庫主要有GEOREF,是由美國(guó)地質(zhì)協(xié)會(huì)(American Geological Institute)編輯的地學(xué)數(shù)據(jù)庫。它收錄了1785年以來的北美地學(xué)文獻(xiàn)和1933年以來的全世界地學(xué)文獻(xiàn),至1994年共計(jì)170萬條,現(xiàn)年遞增8萬條文獻(xiàn)。GEOREF收錄的文獻(xiàn)范圍很廣,包括期刊、會(huì)議錄、圖書、地形圖和地質(zhì)圖、學(xué)位論文、報(bào)告、傳記等,70%的文獻(xiàn)來源于世界各國(guó)出版的4000余種期刊,2%的文獻(xiàn)來源于會(huì)議錄。
互聯(lián)網(wǎng)上有許多高質(zhì)量的學(xué)術(shù)網(wǎng)站和論壇。如:自然資源與環(huán)境Natural Resources&Environment http://www.snre.umich.edu/;中國(guó)國(guó)家地理 http://www.dili360.com/;中國(guó)地學(xué)網(wǎng) http://bbs.geonet.cn/;地學(xué)探索 http://www.geology.com.cn/forum/;礦物記實(shí)雜志http://www.minrec.org/;極光 http://www.geo.mtu.edu/weather/aurora/;火山世界 http://volcano.und.nodak.edu/;中國(guó)地震科普網(wǎng)http://www.dizhen.ac.cn;化石網(wǎng) http://www.uua.cn;地質(zhì)與板塊科學(xué)http://www.gps.caltech.edu/;試驗(yàn)巖石學(xué) http://expet.gps.caltech.edu/;地質(zhì)網(wǎng) http://geology.com/;地球科學(xué)世界 http://geology.geoscienceworld.org/;地質(zhì)與板塊http://www.gps.caltech.edu/等等。
對(duì)采集到的資源按一定策略進(jìn)行重組與發(fā)布,建立地學(xué)學(xué)科導(dǎo)航體系,提高資源的可用性。學(xué)科館員可以建立專業(yè)的地學(xué)網(wǎng)站來組織、存儲(chǔ)和發(fā)布采集到的信息,也可以利用一些成熟數(shù)據(jù)庫商提供的工具組織和存儲(chǔ)。如中國(guó)知網(wǎng)提供了機(jī)構(gòu)館工具,學(xué)科館員可以建立地學(xué)專業(yè)機(jī)構(gòu)館,利用“文獻(xiàn)管理和互聯(lián)網(wǎng)信息挖掘”欄目為讀者推送地學(xué)研究領(lǐng)域相關(guān)的學(xué)術(shù)網(wǎng)站,并可進(jìn)行分類管理和利用。
當(dāng)然由于網(wǎng)絡(luò)資源更新速度快,不斷有新的資源產(chǎn)生,也不斷有過時(shí)的資源從網(wǎng)絡(luò)上消失,因此,學(xué)科館員要跟蹤學(xué)科資源發(fā)展變化,及時(shí)更新資源鏈接及本地副本資源,保證信息的時(shí)效性。
[1]張顯忠.“地學(xué)信息港”專業(yè)網(wǎng)站建設(shè)初探[J].圖書館學(xué)研究,2003,(6).
[2]常 青.農(nóng)業(yè)網(wǎng)絡(luò)信息資源的采集[J].情報(bào)雜志,2007,(9).
[3]馬翠鳳.地質(zhì)圖書館的專題特色數(shù)據(jù)庫建設(shè)[J].圖書館學(xué)研究,2006,(11).
[4]馬 冰,劉洪光,金真針.國(guó)內(nèi)外地學(xué)文獻(xiàn)的信息源[J].地質(zhì)通報(bào),2009,(1).
[5]李 萍.網(wǎng)絡(luò)信息資源的采集策略[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2006,(8).
[6]付光宇,劉克偉.試論網(wǎng)絡(luò)信息資源的采集策略[J].網(wǎng)絡(luò)財(cái)富,2008,(9).
[7]譚建豪.數(shù)據(jù)挖掘技術(shù)[M].北京:中國(guó)水利水電出版社,2009.
(編輯:陸繼玲)