藍(lán)冬梅
(廣西民族師范學(xué)院圖書館,廣西 崇左 532200)
?
大數(shù)據(jù)環(huán)境下高校圖書館開放獲取文獻的采訪策略
藍(lán)冬梅
(廣西民族師范學(xué)院圖書館,廣西 崇左 532200)
關(guān)鍵詞:高校圖書館;文獻采訪;開放獲取;大數(shù)據(jù)環(huán)境
摘 要:文章從大數(shù)據(jù)環(huán)境與開放獲取文獻資源、大數(shù)據(jù)環(huán)境下高校圖書館開放獲取文獻采訪來源、大數(shù)據(jù)環(huán)境下高校圖書館開放獲取文獻采訪程序三個方面,對大數(shù)據(jù)環(huán)境下高校圖書館開放獲取文獻的采訪策略進行了研究。
1.1 大數(shù)據(jù)及其解讀
大數(shù)據(jù)是指體量巨大、高速獲取、類型多樣化、具有真實價值的數(shù)據(jù)。伴隨著2013年“大數(shù)據(jù)元年”的腳步,大數(shù)據(jù)時代正在快步走來。在大數(shù)據(jù)環(huán)境下,大數(shù)據(jù)無處不在,它對人們的研究、工作、學(xué)習(xí)和生活各方面施加著越來越重要的影響。由于大數(shù)據(jù)是需要采用新的處理模式和處理技術(shù)才能開發(fā)、利用和增值其中蘊含的信息價值的數(shù)據(jù)信息資產(chǎn),因此,大數(shù)據(jù)已經(jīng)被視為一種新的生產(chǎn)要素和創(chuàng)新驅(qū)動力而格外受到重視。大數(shù)據(jù)技術(shù)和大數(shù)據(jù)應(yīng)用的戰(zhàn)略意義在于,在掌握大數(shù)據(jù)信息的基礎(chǔ)上,對這些用戶所需要的含有實際意義和利用價值的大數(shù)據(jù)進行專業(yè)化檢索、獲取、整序、加工和處理,從而實現(xiàn)數(shù)據(jù)價值的提升,所以,大數(shù)據(jù)的價值含量和獲取成本比大數(shù)據(jù)的數(shù)量本身更為重要。對于很多行業(yè)而言,如何利用這些大數(shù)據(jù)已經(jīng)成為事業(yè)成功的關(guān)鍵所在。
1.2 大數(shù)據(jù)環(huán)境下的開放獲取文獻數(shù)據(jù)
大數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),與圖書館文獻型數(shù)據(jù)相關(guān)的多為非結(jié)構(gòu)化數(shù)據(jù)[1],尤其是其中的數(shù)字化文獻數(shù)據(jù),包括文本數(shù)據(jù)、圖像數(shù)據(jù)、聲音數(shù)據(jù)、影像數(shù)據(jù)、超媒體數(shù)據(jù)、三維數(shù)據(jù)等。根據(jù)國際數(shù)據(jù)公司的測算,與文獻密切相關(guān)的非結(jié)構(gòu)化數(shù)據(jù)量在2005年為22EB,2015年將增加到1,600EB,年復(fù)合增長率約60%,遠(yuǎn)遠(yuǎn)高于結(jié)構(gòu)化數(shù)據(jù)年復(fù)合增長率20%的速度。其中,對于非結(jié)構(gòu)化大數(shù)據(jù)中具有“學(xué)術(shù)共產(chǎn)主義”性質(zhì)的開放獲取文獻數(shù)據(jù),已經(jīng)引起全球相關(guān)行業(yè)和機構(gòu)的高度重視。2012年,由美國、德國科學(xué)基金會和中國科學(xué)院等11家機構(gòu)發(fā)起,創(chuàng)立了旨在探討和尋求國際科學(xué)發(fā)展方略,推動和實現(xiàn)國際科技合作的全球研究理事會。在2014年北京召開的全球研究理事會上,中國科學(xué)院與中國國家自然科學(xué)基金委員會發(fā)布了各自的開放獲取政策,引起世界各國科研資助和教育機構(gòu)、國際知名學(xué)會、國際出版組織及國際圖書館界的高度重視,對中國以文獻大數(shù)據(jù)為核心的開放獲取發(fā)展倍加期待。
1.3 大數(shù)據(jù)環(huán)境下的我國開放獲取文獻資源體系
目前我國非常重視大數(shù)據(jù)工作,2015年9月國務(wù)院印發(fā)了《關(guān)于促進大數(shù)據(jù)發(fā)展的行動綱要》,從國家層面系統(tǒng)地部署了我國的大數(shù)據(jù)發(fā)展工作。事實上,我國目前已經(jīng)基本形成了具有一定規(guī)模的開放獲取文獻資源體系。這一體系具有開放獲取文獻資源類型多樣化、文獻資源格式多樣化、文獻資源數(shù)量巨大、學(xué)科專業(yè)門類齊全、下載獲取方式多樣化等特點[2]。目前我國開放獲取文獻資源的類型已經(jīng)達(dá)到約50種,分別隸屬于常規(guī)文獻、教學(xué)文獻、科研文獻、特種文獻、歷史文獻、格式文獻、其他文獻和綜合文獻系列,分為正常和非正常下載獲取兩種主要方式。這些豐富的開放獲取文獻資源,無疑為我國高校圖書館開放獲取文獻采訪提供了極為豐富的文獻來源。因此,研究我國高校圖書館開放獲取文獻采訪策略,充分采訪互聯(lián)網(wǎng)上的開放獲取文獻資源,成為高校圖書館開放獲取文獻采訪工作中亟待研究的課題。
2.1 文獻采訪來源策略
在高校圖書館利用文獻資源為用戶開展服務(wù)工作的過程中,需要使用到各種類型、內(nèi)容、格式、系列、利用方式的開放獲取文獻資源。正是由于開放獲取文獻資源具有成本為零、類型多樣、數(shù)量巨大、使用方便的特點,因此,它們順理成章地就成為高校圖書館數(shù)字化文獻資源采訪的重要來源之一[3]。而通過哪些采訪來源策略,可以使這些開放獲取文獻資源順利進入到高校圖書館的文獻資源體系中,就成為高校圖書館開放獲取文獻資源采訪策略需要研究和實踐的重要內(nèi)容。高校圖書館開放獲取文獻資源的采訪來源策略主要可分為4種,即文獻資源網(wǎng)站鏈接采訪來源策略、文獻資源在線利用采訪來源策略、文獻資源下載獲取采訪來源策略和新建文獻資源網(wǎng)站采訪來源策略。
2.2 文獻資源網(wǎng)站鏈接
對于擁有大量開放獲取文獻資源的網(wǎng)站,由于其文獻資源數(shù)量過多,實在不方便下載獲取。因此,可以將其網(wǎng)站名稱及其所對應(yīng)的網(wǎng)址與本館的網(wǎng)站進行鏈接,即所謂的單線鏈接,使之成為本館開放獲取文獻資源的采訪來源資源,使本館的用戶可以通過本館網(wǎng)站鏈接到此類來源文獻資源網(wǎng)站,從而實現(xiàn)對于其開放獲取文獻資源的有效利用[4]。同時,這也是高校圖書館開放獲取文獻采訪中最為簡便的采訪來源策略,因為它可以使高校圖書館在使用最少的人力資源投入,在投入最少工作量的條件下,可以完成對大量開放獲取文獻資源網(wǎng)站的鏈接采訪工作,并且可以用最短的時間擁有大量的開放獲取文獻資源。所以,它應(yīng)當(dāng)成為高校圖書館開放獲取文獻資源首選的采訪來源策略。
2.3 文獻資源在線利用
對于那些無法下載獲取的開放獲取文獻資源,在作為高校圖書館開放獲取文獻采訪來源時,也可以通過由高校圖書館直接給用戶提供網(wǎng)址的方法,讓用戶直接在線利用文獻資源網(wǎng)站的開放獲取文獻資源。此外,高校圖書館本身也可以將這種開放獲取文獻資源作為文獻采訪的一種來源加以利用。當(dāng)然,這種在線利用的采訪來源策略是有局限性的,它們一般除了適用于那些只能在線利用,而無法下載獲取的開放獲取文獻資源之外,還適用于既可以下載獲取,同時又可以在線利用的開放獲取文獻資源。當(dāng)然,對于此類開放獲取文獻資源,高校圖書館也同樣可以作為一種文獻采訪來源,使之成為高校圖書館開放獲取文獻資源的組成部分。
2.4 文獻資源下載獲取
這是指將那些允許開放下載獲取,而高校圖書館或用戶又需要下載獲取利用的開放獲取文獻資源進行下載獲取采訪來源的策略。也就是說,可以使高校圖書館或用戶能夠?qū)崒嵲谠诘赝ㄟ^下載獲取擁有所需要的開放獲取文獻資源[5],這種采訪來源策略也是文獻采訪來源中效果最好的一種。當(dāng)然,它也存在著如果下載獲取文獻的數(shù)量過多,不僅需要耗費大量的下載獲取時間,而且也需要對這些已經(jīng)下載獲取的開放獲取文獻資源騰出大量的存儲空間進行存儲和保管的問題。所以,這種采訪來源策略一般僅適用于那些用戶特定需要的文獻,或者對于高校圖書館而言是重要的和具有長久保存價值的文獻資源,如:古籍善本文獻資源等的采訪。
2.5 新建文獻資源網(wǎng)站
是指可以利用開放獲取文獻資源網(wǎng)站鏈接或下載獲取的文獻資源,重新建設(shè)高校圖書館自己的開放獲取文獻資源網(wǎng)站。也就是說,這是在文獻采訪中采用拿來主義,將互聯(lián)網(wǎng)上的開放獲取文獻資源轉(zhuǎn)化為高校圖書館本館館藏文獻資源的采訪來源策略。這種文獻采訪來源策略的意義在于,高校圖書館可以在新建文獻資源網(wǎng)站的過程中,對互聯(lián)網(wǎng)上的開放獲取文獻資源進行一定標(biāo)準(zhǔn)的篩選,將符合本校教育教學(xué)、科學(xué)研究和學(xué)校管理所需要的開放獲取文獻進行匯聚和集中,在新建的文獻資源網(wǎng)站上發(fā)布出來,供本校用戶和其他用戶利用。這樣一來,可以為用戶解決自己在互聯(lián)網(wǎng)上需要花費大量的時間查找,但是查找的效果卻往往不甚理想的問題與困擾。
3.1 文獻采訪調(diào)研
調(diào)研互聯(lián)網(wǎng)大數(shù)據(jù)中的開放獲取文獻資源,是高校圖書館開放獲取文獻采訪的首要程序策略。因為能否采訪到本館所需要的開放獲取文獻資源,是最終衡量高校圖書館開放獲取文獻采訪工作成敗或質(zhì)量優(yōu)劣的重要標(biāo)準(zhǔn)[6]。采訪調(diào)研的內(nèi)容有多種,其中涉及選擇利用不同品牌的網(wǎng)絡(luò)瀏覽器以及不同的網(wǎng)絡(luò)搜索引擎等檢索工具。由于不同品牌的瀏覽器和搜索引擎,在反映和揭示開放獲取文獻資源方面具有收錄網(wǎng)頁數(shù)量不同、檢索功能不同的特點,從而導(dǎo)致對于開放獲取文獻檢索和獲取的全面性和精準(zhǔn)度不同,有時候甚至?xí)町惡艽?。所?高校圖書館在進行開放獲取文獻資源采訪時,需要提前進行相關(guān)的調(diào)研工作,了解和熟練掌握不同品牌瀏覽器和搜索引擎的綜合狀況。在同樣的條件下,盡量選用檢索全面、功能強大、方便快捷的瀏覽器和搜索引擎品牌,以便取得更好的檢索和獲取效果。此外,高校圖書館還需要調(diào)研選擇利用的檢索方法和檢索技術(shù)。如:檢索方法包括簡單檢索、高級檢索、限定檢索等文獻檢索方法,檢索技術(shù)包括中文文獻檢索技術(shù)、外文文獻檢索技術(shù)、外文文獻中文利用檢索技術(shù)等。
3.2 文獻采訪驗證
由于來源于互聯(lián)網(wǎng)上的開放獲取文獻資源都屬于免費的文獻資源,不存在任何法律和版權(quán)保護方面的問題(實際上是自動獲得了知識創(chuàng)用共享協(xié)議的法律保護[7])。因此,互聯(lián)網(wǎng)上相當(dāng)多的開放獲取文獻資源具有穩(wěn)定性差的特點,具體表現(xiàn)為某些開放獲取文獻資源在互聯(lián)網(wǎng)上時有時無、資源網(wǎng)站時開時閉、文獻資源在網(wǎng)頁上的位置也不固定以及存在一些表面上看起來為開放獲取文獻資源,而實際上則是收費的非開放獲取文獻資源等情況。所以,為了確保高校圖書館開放獲取文獻采訪的準(zhǔn)確性和真實性,需要對互聯(lián)網(wǎng)上的開放獲取文獻資源進行必要的驗證。驗證的目的就是要證實開放獲取文獻資源的真實性和可用性,滿足高校圖書館開放獲取文獻資源采訪的需求,防止出現(xiàn)虛假的和無法實際使用的開放獲取文獻資源,從而影響到高校圖書館開放獲取文獻資源的采訪質(zhì)量。驗證互聯(lián)網(wǎng)大數(shù)據(jù)中的開放獲取文獻資源,包括對于開放獲取文獻資源網(wǎng)站的驗證、對于開放獲取文獻資源的驗證以及對于開放獲取文獻資源下載獲取可行性的驗證等方面。
3.3 文獻采訪下載
高校圖書館開放獲取文獻資源采訪的目的,是要使來源于互聯(lián)網(wǎng)上的開放獲取文獻資源通過采訪工作程序,成為高校圖書館數(shù)字化館藏文獻資源建設(shè)體系中的重要構(gòu)成成分,與商業(yè)化數(shù)據(jù)庫文獻資源和自建數(shù)字化文獻資源組成一個相互補充、相互依托、相得益彰的高校圖書館數(shù)字化文獻資源體系[8]。因此,根據(jù)高校圖書館開放獲取文獻資源的采訪計劃,應(yīng)當(dāng)對高校圖書館所需要的開放獲取文獻資源進行下載獲取、保存管理和研究利用。所以,下載獲取互聯(lián)網(wǎng)上的開放獲取文獻資源就成為高校圖書館開放獲取文獻資源采訪工作的重要環(huán)節(jié)。因為只有通過采訪下載環(huán)節(jié),才能使原本散布于互聯(lián)網(wǎng)上各處的開放獲取文獻資源,成為高校圖書館開放獲取文獻資源體系中的有機組成部分。采訪下載互聯(lián)網(wǎng)大數(shù)據(jù)中的開放獲取文獻資源包括:常規(guī)采訪下載獲取,如:在線閱讀獲取和直接下載獲取;非常規(guī)采訪下載獲取,如:利用專用下載器、專用下載軟件、特定下載方法下載獲取。
3.4 文獻采訪分析
為了進一步提高開放獲取文獻資源采訪工作的質(zhì)量和水平,其中一項重要任務(wù)就是要對互聯(lián)網(wǎng)大數(shù)據(jù)中的開放獲取文獻資源以及下載獲取到本地的開放獲取文獻資源進行分析和研究。分析研究的內(nèi)容包括對于開放獲取文獻資源的文獻類型、采用格式、所屬系列、所屬學(xué)科、所屬專業(yè)、文獻容量、文獻來源等多種因素進行分析和研究[9]。分析研究的目的是使高校圖書館采訪工作對于所采訪的開放獲取文獻資源,做到心中有數(shù)、心里有底,從而可以有的放矢地根據(jù)本校各學(xué)科教育教學(xué)、科學(xué)研究和學(xué)校管理工作的需要,采訪到最具有價值、利用率最高的開放獲取文獻資源。高校圖書館開放獲取文獻采訪分析策略的另一項內(nèi)容,就是要分析和研究不同學(xué)科專業(yè)開放獲取文獻的生命周期,這樣才可以能夠科學(xué)地、有根據(jù)地預(yù)測這些開放獲取文獻資源的使用高峰期時限,從而為及時更新不同學(xué)科專業(yè)的開放獲取文獻資源、及時剔舊已經(jīng)進入衰退期的開放獲取文獻提供科學(xué)依據(jù),保持館藏開放獲取文獻資源旺盛的生命力。
3.5 文獻采訪建庫
為了使開放獲取文獻資源采訪工作具有可持續(xù)性,便于統(tǒng)計分析采訪到的開放獲取文獻資源,及時了解開放獲取文獻資源的整體狀況,了解開放獲取文獻資源在高校圖書館整體文獻資源和數(shù)字化文獻資源體系中的地位與作用,應(yīng)當(dāng)建設(shè)相應(yīng)的高校圖書館開放獲取文獻資源采訪數(shù)據(jù)庫[10]。在這個數(shù)據(jù)庫中,應(yīng)包含高校圖書館歷年來所采訪到的開放獲取文獻資源。采訪數(shù)據(jù)庫的項目應(yīng)當(dāng)盡可能詳盡, 如:應(yīng)設(shè)置有開放獲取文獻資源的所屬類型、采用格式、文獻容量、所屬系列、所屬學(xué)科、所屬專業(yè)、中國分類號、多級主題詞、來源渠道、互聯(lián)網(wǎng)網(wǎng)址、下載獲取方法、采訪時間、采訪人員、備注說明等信息。這些高校圖書館開放獲取文獻資源采訪數(shù)據(jù)庫的各項內(nèi)容信息數(shù)據(jù),應(yīng)當(dāng)可以通過高校圖書館文獻管理軟件的相應(yīng)功能,很方便地調(diào)入高校圖書館的館藏文獻資源總數(shù)據(jù)庫中,成為高校圖書館文獻資源管理大數(shù)據(jù)中開放獲取文獻資源數(shù)據(jù)的重要組成部分。
隨著互聯(lián)網(wǎng)時代和大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)上的大數(shù)據(jù)正在迅速增加。隨著我國政府對于大數(shù)據(jù)的日益重視,大數(shù)據(jù)事業(yè)必將會有一個爆發(fā)性的發(fā)展前景。在國內(nèi)外各種開放獲取政策落實的環(huán)境下,與互聯(lián)網(wǎng)文獻大數(shù)據(jù)緊密相關(guān)的開放獲取文獻資源,正在成為高校圖書館文獻采訪的巨大寶庫。因此,深入研究大數(shù)據(jù)環(huán)境下高校圖書館開放獲取文獻的采訪策略,勢必會提升高校圖書館數(shù)字化開放獲取文獻資源的建設(shè)與服務(wù)水平。
參考文獻:
[1] 馬曉亭.大數(shù)據(jù)時代圖書館數(shù)據(jù)可用性:價值、挑戰(zhàn)和保障[J].圖書館理論與實踐,2014(10): 5-8.
[2] 袁明倫.我國開放獲取模式下的文獻信息資源體系研究[J].現(xiàn)代情報,2015(7):153-155,161.
[3] 薛冬.學(xué)術(shù)共產(chǎn)主義開放獲取文獻資源網(wǎng)站研究[J].辦公室業(yè)務(wù),2015(7):26,29.
[4] 劉文云,翟羽佳,王文穎.基于鏈接分析法的高校圖書館網(wǎng)站影響力評價研究[J].情報科學(xué),2013(6):99-102,106.
[5] 張玲.大數(shù)據(jù)2.0時代文獻資源融合與共享利用研究:以圖書、情報、檔案文獻信息資源為例[J].檔案管理,2015(1):36-37.
[6] 姚小萍.網(wǎng)絡(luò)環(huán)境下圖書館文獻采訪的前期調(diào)研[J].河南圖書館學(xué)刊,2014(7):64-67.
[7] 張媛,王偉.大數(shù)據(jù)時代圖書館OA文獻資源建設(shè)研究[J].蘭臺世界,2015(11):129-130.
[8] 黃麗娟,鄒蔭生.基于開放獲取的數(shù)字圖書館文獻資源建設(shè)[J].蘭臺世界,2015(17):134-135.
[9] 王曉燕.圖書館應(yīng)用大數(shù)據(jù)的文獻分析與思考[J].大學(xué)圖書情報學(xué)刊,2015(1):55-60.
[10] 張志廣,張瀟.基于高校圖書館文獻采訪分布式數(shù)據(jù)庫挖掘的合作協(xié)同模式[J].農(nóng)業(yè)圖書情報學(xué)刊,2015(6):65-68.
(編校:崔 萌)
作者簡介:藍(lán)冬梅(1972— ),廣西民族師范學(xué)院圖書館館員。
收稿日期:2015 - 12 - 04
中圖分類號:G253.1
文獻標(biāo)識碼:A
文章編號:1003 - 1588 ( 2016 ) 01 - 0065 - 03