黃尤精
[摘 要] 數(shù)字化信息資源建設(shè)是圖書館發(fā)展的新趨勢,面對這種新變化,圖書館必須加大力度建設(shè)數(shù)字化信息資源。互聯(lián)網(wǎng)資源采集是圖書館獲取數(shù)字資源的一個重要途徑,文章從互聯(lián)網(wǎng)資源采集方向、采集標(biāo)準(zhǔn)、資源保存等方面描述了圖書館的網(wǎng)絡(luò)資源建設(shè)工作。
[關(guān)鍵詞] 圖書館;互聯(lián)網(wǎng);資源采集;資源保存
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 07. 056
[中圖分類號] G251 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2018)07- 0136- 02
0 前 言
隨著網(wǎng)絡(luò)化和信息化的快速發(fā)展,圖書館業(yè)務(wù)系統(tǒng)環(huán)境也發(fā)生了翻天覆地的變化。圖書館館藏類型已經(jīng)發(fā)生了很大變化,從圖書館內(nèi)部所具有的資料擴展到了互聯(lián)網(wǎng)書目數(shù)據(jù)庫、全文數(shù)據(jù)庫等,此外,圖書館采集收藏的對象還擴大到了網(wǎng)絡(luò)上其他信息資源。因此豐富圖書館數(shù)字資源,讓讀者能夠方便順利地獲取知識,成為新一代圖書館人思考的話題。
網(wǎng)絡(luò)信息資源的發(fā)展,為豐富圖書館的館藏資源建設(shè)提供了更廣闊的發(fā)展空間,但是網(wǎng)絡(luò)資源又存在分散分布性、大量無序性、資源品質(zhì)的優(yōu)劣不一性等特點,又給圖書館采集網(wǎng)絡(luò)資源帶來了困難。
目前,各地圖書館開始注重對網(wǎng)絡(luò)資源的采集和保存的研究, 但對如何從館藏資源建設(shè)政策的角度,制定網(wǎng)絡(luò)資源的采集和保存制度及策略的不多。本文試圖從網(wǎng)絡(luò)資源的采集方向、網(wǎng)絡(luò)資源的采集標(biāo)準(zhǔn)、網(wǎng)絡(luò)資源保存等方面探討網(wǎng)絡(luò)資源的采集及保存制度。
1 網(wǎng)絡(luò)資源采集方向
1.1 重視特色資源的采集
圖書館建立文獻(xiàn)資源的出發(fā)點就是實現(xiàn)館際間和網(wǎng)絡(luò)上的資源共享,資源有效共享的前提是館藏文獻(xiàn)信息特色化,因此,圖書館在在資源收集時,應(yīng)該重點考慮采集各地區(qū)、各單位有特色的網(wǎng)絡(luò)信息資源。同時,達(dá)到完整級、研究級的水平,特色資源庫還應(yīng)該具有一定規(guī)模且有較高的學(xué)術(shù)品位和信息價值,同時,還必須在網(wǎng)絡(luò)環(huán)境下能實現(xiàn)方便、快捷、系統(tǒng)的利用。所以,建設(shè)特色館藏應(yīng)注意以下幾點:第一,選題準(zhǔn),要根據(jù)本館性質(zhì)、任務(wù)、藏書優(yōu)勢和服務(wù)特點確定館藏特色。第二,文獻(xiàn)信息的收集內(nèi)容要全要廣,要突出重點,力求系統(tǒng)、完整和新穎, 做到人無我有, 人有我全,人全我好[1]。
1.2 大力發(fā)展本地資源
地方文獻(xiàn)信息是特色資源信息采集的一個重要來源,但是地方文獻(xiàn)類型多樣、內(nèi)容豐富、時間跨度較大,且文獻(xiàn)源分布分散,不僅有公開發(fā)行和內(nèi)部發(fā)行的,還有私人珍藏的,采集工作難度較大。因此在采集的時候應(yīng)做到以下三點。第一,提前制定詳細(xì)的采集大綱,按照大綱有重點地實施。第二,為保障該項工作能長期、穩(wěn)定堅持下去,并使采集工作在圍繞本館地方文獻(xiàn)采集大綱的基礎(chǔ)上向廣度、深度展開,采集工作必須有專款支持。第三,采集方式要明確,信息采集要準(zhǔn)確,可以通過地方政府網(wǎng)站、地方報紙網(wǎng)站、地方電視臺和地方檔案館、博物館網(wǎng)站、地方出版物等渠道采集信息[2]。
1.3 加強對網(wǎng)絡(luò)學(xué)術(shù)資源的采集
隨著網(wǎng)絡(luò)信息技術(shù)的發(fā)展,網(wǎng)絡(luò)學(xué)術(shù)信息資源日益增多,來源廣泛,其中可以通過網(wǎng)絡(luò)檢索到大量在正式出版系統(tǒng)中無法獲得的“灰色文獻(xiàn)”。因此, 在進(jìn)行網(wǎng)絡(luò)信息資源采集時,應(yīng)當(dāng)把網(wǎng)絡(luò)學(xué)術(shù)信息的采集作為重點工作之一,通過對網(wǎng)絡(luò)學(xué)術(shù)資源的采集、整序和評價,并加以保存和提供使用,充分發(fā)揮其應(yīng)有的作用。
2 網(wǎng)絡(luò)資源采集標(biāo)準(zhǔn)
網(wǎng)絡(luò)資源作為圖書館館藏資源建設(shè)的組成部分,應(yīng)當(dāng)對資源采集的品質(zhì)和資源采集的程度制定一個標(biāo)準(zhǔn)。
2.1 網(wǎng)絡(luò)信息資源的采集與傳統(tǒng)文獻(xiàn)資源的采集互補
在采集資源的時候,第一,需要充分考慮用戶對信息的需求,從實用性、針對性和經(jīng)濟性出發(fā)采選網(wǎng)絡(luò)資源。第二,需要將傳統(tǒng)文獻(xiàn)與網(wǎng)絡(luò)資源作為互相補充,相互結(jié)合,傳統(tǒng)文獻(xiàn)具有很好的史料性、理論性和專業(yè)性較強,網(wǎng)絡(luò)資源具有動態(tài)性,更新速度快,二者相輔相成,組成信息資源保障體系,不僅能彌補出版物嚴(yán)重滯后問題還能彌補網(wǎng)絡(luò)資源史料少的不足。
2.2 對網(wǎng)絡(luò)數(shù)據(jù)庫的選擇,要求質(zhì)量第一
由于一些基層圖書館資金較為匱乏,入藏量不足現(xiàn)象在各地均存在,導(dǎo)致館藏文獻(xiàn)資源在一定程度上不能滿足讀者需求。而一些大性網(wǎng)絡(luò)數(shù)據(jù)庫學(xué)術(shù)性和時效性較強,因此圖書館采集的重點應(yīng)面向這個專業(yè)性的網(wǎng)絡(luò)數(shù)據(jù)庫,如CNKI中國知網(wǎng)數(shù)據(jù)庫、Apabi電子圖書、龍源電子期刊等。另外還可以申請試用一些免費的數(shù)據(jù)庫,如博看期刊數(shù)據(jù)庫等。
2.3 數(shù)據(jù)庫資源集中購買,共建共享
數(shù)據(jù)庫的使用權(quán)限希望能夠做到集體統(tǒng)一購買,費用共同分擔(dān),或者上一級圖書館購買資源,下級圖書館免費使用,這樣費用就可能少得多。例如天津市圖書館在購買眾多數(shù)據(jù)庫資源的時候,都以成員館的方式將本地18個區(qū)縣圖書館囊括其中,要求數(shù)據(jù)庫企業(yè)為區(qū)縣圖書館提供數(shù)據(jù)訪問服務(wù),這無疑能豐富圖書館館藏資源又能減輕區(qū)縣圖書館的財政負(fù)擔(dān)。
2.4 注重網(wǎng)絡(luò)資源來源的真實性和可靠性
由于互聯(lián)網(wǎng)的開放性,每個人都能在互聯(lián)網(wǎng)上發(fā)布網(wǎng)絡(luò)信息,信息良莠不齊且不能保證信息真實性,因此圖書館工作人員應(yīng)對網(wǎng)絡(luò)資源進(jìn)行篩選,盡量選擇那些由政府機構(gòu)、企事業(yè)單位、科研院所、大型網(wǎng)站等有較高信譽度的機構(gòu)提供的網(wǎng)絡(luò)資源,確保采集到網(wǎng)絡(luò)資源真實可靠[3]。
2.5 注重網(wǎng)絡(luò)資源來源的時效性和準(zhǔn)確性
時效性和準(zhǔn)確性是網(wǎng)絡(luò)資源的生命力所在,因此,時效性強而又相對穩(wěn)定信息源顯得非常重要,在確定采集網(wǎng)站后,隨時跟蹤相關(guān)網(wǎng)站,采集其更新的信息,提高所采網(wǎng)絡(luò)信息資源的時效性。如今有一些專業(yè)的抓取軟件,能夠自動抓取相關(guān)信息,可以節(jié)省一些人力物力,但是為了保證信息的完整性、準(zhǔn)確性,對于“抓取”的信息必須經(jīng)過嚴(yán)格的校準(zhǔn)審核才能提供給讀者使用。
3 網(wǎng)絡(luò)資源保存
為了使圖書館的數(shù)字資源長期保存,確保其數(shù)字資源能夠持續(xù)地、長期地為其用戶提供服務(wù)。因此對網(wǎng)絡(luò)資源的保存工作,可以分為兩部分,一是網(wǎng)絡(luò)資源加工處理保存,二是網(wǎng)絡(luò)設(shè)備安全維護(hù)。
3.1 網(wǎng)絡(luò)資源加工處理保存
3.1.1 認(rèn)真校對文字,保證質(zhì)量
網(wǎng)上的資源,有時候由于發(fā)布者檢查不仔細(xì),以及計算機軟件版本不同等原因,采集到的信息可能會存在錯字、格式錯位等現(xiàn)象。另外在信息采集中有時候會用到一些文字識別工具,而這些工具盡管設(shè)計越來越精良,準(zhǔn)確度越來越高,但是不可否認(rèn)還是存在一些錯誤,如OCR文字識別時,對于一些相近字符區(qū)分還不是十分準(zhǔn)確,如“侯”識別成“候”、“末”識別成“未”,甚至有時候還會出現(xiàn)亂碼等,由此可見,內(nèi)容必須經(jīng)過人工審校后,確保準(zhǔn)確無誤才能錄入到計算機數(shù)據(jù)庫中供讀者使用。
3.1.2 數(shù)字資源保存格式盡量要求統(tǒng)一
數(shù)字資源,尤其是本地自建的特色資源在存儲格式上,以及數(shù)據(jù)庫建設(shè)上盡量要求格式統(tǒng)一,這是信息資源共建共享的基礎(chǔ)。按照行業(yè)規(guī)范,用統(tǒng)一規(guī)劃、統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一運行規(guī)則來指導(dǎo)數(shù)字資源的分類和編碼,使其有序地存入計算機,既可避免造成人力、物力、時間上的浪費,還能夠方便讀者查詢使用,否則,這些信息將成為一堆雜亂無章的數(shù)據(jù),無法查找,失去使用價值。
3.2 網(wǎng)絡(luò)設(shè)備安全維護(hù)
信息安全歷來是人們關(guān)注的焦點,大量的信息都保存在服務(wù)器中,因此,如何保護(hù)好網(wǎng)絡(luò)設(shè)備成為重中之重。設(shè)備保養(yǎng)主要就是從數(shù)據(jù)信息備份、設(shè)備運行環(huán)境等方面入手。
3.2.1 認(rèn)真做好備份工作,防止數(shù)據(jù)意外丟失
數(shù)據(jù)安全性是數(shù)據(jù)保存中最為重要的環(huán)節(jié),硬盤損壞、人為原因、計算機病毒、停電或是天災(zāi)人禍等,都有可能造成數(shù)據(jù)的丟失和損壞。目前被采用最多的備份策略主要有:(1)完全備份,每次備份過程都將所有的數(shù)據(jù)完全備份,一旦發(fā)生數(shù)據(jù)丟失或損壞,只需要一個備份就能完全恢復(fù)數(shù)據(jù),但是這種備份方式數(shù)據(jù)量極大,且備份時間較長。(2)增量備份,備份的時候先進(jìn)行完全備份,以后每天再對新增或被修改的數(shù)據(jù)備份,備份速度較快,備份數(shù)據(jù)量較小,但是恢復(fù)數(shù)據(jù)較為麻煩。(3)差分備份,先對數(shù)據(jù)進(jìn)行一次完全備份,然后再將每天與完全備份不同的數(shù)據(jù)進(jìn)行備份。這種備份方式吸收了前兩種備份方式的優(yōu)點,又避免了前兩種方式的缺點,備份時間較短,數(shù)據(jù)恢復(fù)也較簡單方便[4]。
結(jié)合圖書館的實際情況,備份策略可以采用以上三種策略的結(jié)合,例如每周一至周六進(jìn)行一次增量備份或差分備份,每周日進(jìn)行全備份。
3.2.2 購置UPS,保障設(shè)備24小時不間斷運行
意外停電往往會給數(shù)據(jù)安全帶來極大的影響,因此配備一臺性能較好的UPS非常有必要,它可以保障網(wǎng)絡(luò)設(shè)備在停電之后繼續(xù)工作一段時間,使負(fù)載維持正常工作并保護(hù)負(fù)載軟、硬件不受損壞,用戶不致因停電而影響工作或丟失數(shù)據(jù)。在選購UPS的時候,首先盡量選擇穩(wěn)定性較強、后備時間較長、在線式的設(shè)備。其次由于電網(wǎng)中經(jīng)常會出現(xiàn)諧波干擾、頻率不穩(wěn)、電壓不穩(wěn)等情況,故在選擇UPS的時候應(yīng)選擇適應(yīng)范圍大的UPS。最后還應(yīng)考慮UPS的智能化,智能化的UPS不僅方便操作與管理,還具有遠(yuǎn)程監(jiān)控報警,能夠?qū)崿F(xiàn)計算機機房無人職守。
4 結(jié) 語
網(wǎng)絡(luò)資源的采集和長期保存的工作是十分艱巨和復(fù)雜的。圖書館作為一個重要的文化陣地,應(yīng)當(dāng)立足自身條件,加強館際、區(qū)域間的協(xié)作協(xié)調(diào),合理采集、開發(fā)利用數(shù)字信息資源,最大限度地保存有價值的數(shù)字信息資源, 為子孫后代長期利用、為傳承人類文明作出自己的貢獻(xiàn)。
主要參考文獻(xiàn)
[1]梁蕙瑋.公共圖書館自建資源整合研究與實例分析[M].北京:國家圖書館出版社,2014.
[2]李其紅. 淺談圖書館數(shù)字信息資源采集的原則、途徑和方法[J]. 金融時代,2010(5):169-170.
[3]胡曉雯. 黨校圖書館文獻(xiàn)采集工作之我見[J]. 文教資料,2017(25):88-89.
[4]曹海霞. 圖書館在網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)備份策略[J]. 資源共享與數(shù)字圖書館,2008(1):57-58.