徐芳
摘 要:在信息技術(shù)的推動(dòng)下,傳統(tǒng)的文獻(xiàn)信息資源收藏和服務(wù)模式已經(jīng)無法滿足用戶不斷提高的使用需求,圖書館資源共建、共享、共知成為必然的趨勢,聯(lián)合目錄應(yīng)運(yùn)而生。本文主要對(duì)浙江省高校數(shù)字圖書館(ZADL)聯(lián)合目錄的建設(shè)實(shí)踐進(jìn)行了具體的介紹,包括工作原理、數(shù)據(jù)采集、內(nèi)容與功能、管理與維護(hù)等幾個(gè)方面,并對(duì)ZADL聯(lián)合目錄的特色進(jìn)行了總結(jié)。
關(guān)鍵詞:數(shù)字圖書館;ZADL;聯(lián)合目錄
隨著信息技術(shù)和互連網(wǎng)絡(luò)的迅速發(fā)展,圖書館的“館藏”內(nèi)容不斷擴(kuò)展, “讀者”數(shù)量迅速增加,傳統(tǒng)文獻(xiàn)信息資源收藏和服務(wù)模式遭受著嚴(yán)重的沖擊。任何一個(gè)組織機(jī)構(gòu)想憑借一己之力收藏全部的文獻(xiàn)資源,都是不可能的。圖書館資源共建、共享、共知成為必然的趨勢,聯(lián)合目錄系統(tǒng)也在這種環(huán)境下應(yīng)運(yùn)而生。
聯(lián)合目錄通過反映各成員館的文獻(xiàn)收藏,揭示和報(bào)道多個(gè)文獻(xiàn)收藏單位的文獻(xiàn)目錄,使圖書館能夠得到準(zhǔn)確的館藏分布信息,以便對(duì)資源進(jìn)行有效的協(xié)調(diào)配置;使讀者能夠?qū)崿F(xiàn)跨庫搜索定位資源,為資源利用和增殖服務(wù)奠定基礎(chǔ)。聯(lián)合目錄是其它資源共享的基礎(chǔ),對(duì)于圖書館來說,聯(lián)合目錄的建設(shè)提供了充分發(fā)掘各個(gè)圖書館館藏文獻(xiàn)的機(jī)會(huì),文獻(xiàn)保障體系從單個(gè)圖書館的保障逐步過渡到區(qū)域性保障甚至全國保障。
1 浙江省高校數(shù)字圖書館聯(lián)合目錄建設(shè)概況
浙江省高校數(shù)字圖書館(Zhejiang Academic Digital Library,簡稱ZADL),是在浙江省教育廳領(lǐng)導(dǎo)下,由全省各個(gè)高校圖書館共同參與建設(shè),服務(wù)于全省高校的數(shù)字化文獻(xiàn)保障服務(wù)體系。ZADL聯(lián)合目錄是浙江省高校數(shù)字圖書館的核心部分,旨在建設(shè)浙江省高校圖書館文獻(xiàn)資源目錄數(shù)據(jù)庫和目錄導(dǎo)航,全面整合和揭示全省高校圖書圖實(shí)體印刷型書刊文獻(xiàn)和虛擬數(shù)字資源的收藏、建設(shè)狀況,提高全省書目數(shù)據(jù)標(biāo)準(zhǔn)化著錄水平,方便各館進(jìn)行文獻(xiàn)交流和館際互借,最終實(shí)現(xiàn)全省高校文獻(xiàn)資源共建、共知、共享。
目前聯(lián)合目錄的整體框架建設(shè)已基本完成。截至2014年初,ZADL已經(jīng)匯集了大量數(shù)據(jù)信息 ,圖書方面,匯集了浙江省50多家高校圖書館的127萬多種圖書的書目信息,其中大部分為本科院校,亦有少量高職院校;期刊方面,匯集了浙江省24所本科高校的161個(gè)期刊數(shù)據(jù)庫的 56701萬種期刊;數(shù)據(jù)庫方面,匯集了浙江省高校圖書館的547個(gè)數(shù)字資源庫,其中中文數(shù)據(jù)庫208個(gè),外文數(shù)據(jù)庫257個(gè)。ZADL聯(lián)合目錄數(shù)據(jù)庫服務(wù)體系由1個(gè)省級(jí)服務(wù)中心和5個(gè)高教園區(qū)分中心組成,向浙江省高校廣大師生提供聯(lián)合目錄的導(dǎo)航和檢索服務(wù)。
2 ZADL聯(lián)合目錄的工作原理
ZADL聯(lián)合目錄平臺(tái)以CERNET為依托,各高校圖書館通過對(duì)CERNET的連接來實(shí)現(xiàn)互連互通。省中心網(wǎng)絡(luò)通過千兆鏈路與校園網(wǎng)的主干相連,分中心以百兆上連到CERNET,采用TCP/IP網(wǎng)絡(luò)協(xié)議和星型拓?fù)浣Y(jié)構(gòu),確保數(shù)字資源共享帶寬。為保證各中心的共享數(shù)字化資源服和能夠?yàn)楦鞲咝:戏ㄓ脩羰褂茫L問權(quán)限可以用軟硬件通過IP地址控制來實(shí)現(xiàn),省中心負(fù)責(zé)向CERNET申請(qǐng)IP地址,用于各中心資源服務(wù)器的對(duì)外服務(wù),并通過硬件防火墻將數(shù)據(jù)中心分隔,根據(jù)相應(yīng)的安全策略來控制數(shù)據(jù)訪問,防止非法訪問。關(guān)鍵的核心設(shè)備組網(wǎng)冗余連接,關(guān)鍵部件冗余配置,核心設(shè)備的配置能夠?qū)崿F(xiàn)如組播、IPv6等多樣化的業(yè)務(wù),網(wǎng)絡(luò)設(shè)備及網(wǎng)絡(luò)環(huán)境實(shí)行智能管理和監(jiān)控。各分中心為ZADL在當(dāng)?shù)馗呓虉@區(qū)的統(tǒng)一匯集點(diǎn)以及信息資源的分發(fā)點(diǎn)。
在這樣的網(wǎng)絡(luò)技術(shù)保障下,ZADL聯(lián)合目錄采用集中管理的模式,即來自各成員館的數(shù)據(jù)匯集在一個(gè)數(shù)據(jù)庫中?;趜39.50協(xié)議或HTTP協(xié)議,成員館將各自的數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換成OAI(Open Archive Initiative)元數(shù)據(jù),并通過Web方式進(jìn)行發(fā)布,數(shù)據(jù)中心利用元數(shù)據(jù)收割機(jī)(Metadata Harvester)獲取這些數(shù)據(jù),整合建庫,加工清理之后提供服務(wù)。采用自動(dòng)收割的方式有效地解決了集中式聯(lián)合目錄不能動(dòng)態(tài)反映各成員館的館藏情況的難題,基本保證了中心庫和各成員館數(shù)據(jù)庫之間的數(shù)據(jù)同步。
3 ZADL聯(lián)合目錄數(shù)據(jù)的采集
ZADL聯(lián)合目錄數(shù)據(jù)的采集分為三個(gè)部分,即圖書書目數(shù)據(jù)的采集,期刊數(shù)據(jù)的采集和數(shù)據(jù)庫數(shù)據(jù)的采集。
3.1 圖書書目數(shù)據(jù)的采集和處理
圖書聯(lián)合目錄采用兩種格式;即ISO格式和MARC格式。中文采用CNMARC格,西文采用CNMARC格式和USMARC格式或LCMARC格式。書目數(shù)據(jù)著錄標(biāo)準(zhǔn)與規(guī)范采用CALIS推薦的《中文文獻(xiàn)著錄原則》和《西文文獻(xiàn)著錄原則》,或國家圖書館推薦的中西文著錄規(guī)則。
3.1.1 OPAC書目數(shù)據(jù)的采集和處理
ZADL聯(lián)合目錄對(duì)OPAC數(shù)據(jù)采用自動(dòng)采集的方式,由系統(tǒng)對(duì)OPAC中的數(shù)據(jù)進(jìn)行自動(dòng)收割。OPAC數(shù)據(jù)的采集功能支持支持aleph,innopac,ilas,匯文,金盤,圖創(chuàng), 北郵等各類浙江高校圖書館自動(dòng)化系統(tǒng)。
OPAC數(shù)據(jù)的采集:對(duì)于具有Z39.5開發(fā)接口的opac系統(tǒng)或具有查詢接口的opac系統(tǒng),可以直接自動(dòng)采集;對(duì)于無接口無直接讀取權(quán)限的opac系統(tǒng),則可以采用頁面分析法,監(jiān)控opac系統(tǒng)的最新更新榜單,實(shí)現(xiàn)自動(dòng)采集;對(duì)于具有MARC數(shù)據(jù)庫讀取權(quán)限的系統(tǒng),可以通過自動(dòng)采集程序直接將MARC數(shù)據(jù)導(dǎo)出;自動(dòng)采集程序可以設(shè)定每日實(shí)施采集更新的時(shí)間,一般設(shè)置在凌晨1:00-5:00之間,以避開系統(tǒng)訪問的高峰期。
OPAC數(shù)據(jù)的處理:通過導(dǎo)出程序得到的MARC數(shù)據(jù)首先要進(jìn)行解碼,通過接口采集的數(shù)據(jù)無需解碼,解碼后的數(shù)據(jù)先進(jìn)入到預(yù)處理數(shù)據(jù)庫;通過對(duì)預(yù)處理數(shù)據(jù)庫進(jìn)行過濾和清洗工作,去除多余信息和編碼錯(cuò)誤信息;與圖書書目總庫進(jìn)行合并篩查處理,對(duì)于來源于不同圖書館相同版本的圖書書目進(jìn)行合并根據(jù)書目總庫的圖書價(jià)值評(píng)分系統(tǒng)對(duì)圖書進(jìn)行權(quán)重標(biāo)識(shí),按照分詞建立搜索索引。endprint