□周明明
從1998年美國(guó)啟動(dòng)NSDL項(xiàng)目開(kāi)始,數(shù)字圖書(shū)館門(mén)戶經(jīng)歷了十多年的發(fā)展,國(guó)外知名的有亞利桑那大學(xué)利用ZPORTAL建成的門(mén)戶、衣阿華州立大學(xué)的E-Library、哈佛大學(xué)的LDI二期項(xiàng)目和斯坦福大學(xué)的Google數(shù)字圖書(shū)館計(jì)劃;國(guó)內(nèi)知名的有廈門(mén)大學(xué)的知識(shí)資源港、北京航空航天大學(xué)利用TRS建立的門(mén)戶、清華大學(xué)圖書(shū)館以 MetaLib+SFX+EMS為基礎(chǔ)的數(shù)字圖書(shū)館整體解決方案,北京師范大學(xué)圖書(shū)館以MetaLib和SFX為入口構(gòu)建的數(shù)字圖書(shū)館等[1]。
但國(guó)內(nèi)眾多的圖書(shū)館門(mén)戶建設(shè)目前還僅僅停留在本單位的數(shù)字圖書(shū)館門(mén)戶建設(shè)上,如何整合多家不同類型圖書(shū)館的資源到一個(gè)平臺(tái)上,實(shí)現(xiàn)數(shù)字圖書(shū)館聯(lián)盟體的資源在更廣更深范圍內(nèi)的共享,最終做到給讀者“全球范圍內(nèi)的信息發(fā)現(xiàn),本地和區(qū)域?qū)用嫔系奈墨I(xiàn)保障,讓盡可能多的資源通過(guò)一個(gè)平臺(tái)來(lái)讓用戶能夠找到”[2]。這是目前國(guó)內(nèi)區(qū)域數(shù)字圖書(shū)館聯(lián)盟面對(duì)的新課題。
2009年上半年,隨著寧波市數(shù)字圖書(shū)館門(mén)戶、深圳文獻(xiàn)港門(mén)戶的先后面世[3][4]。區(qū)域數(shù)字圖書(shū)館門(mén)戶建設(shè)的一種新模式展現(xiàn)在用戶面前,本文以深圳區(qū)域數(shù)字圖書(shū)館門(mén)戶“深圳文獻(xiàn)港”(www.szdnet.org.cn)的建設(shè)為例,探討基于“讀秀數(shù)字圖書(shū)館平臺(tái)”建設(shè)的區(qū)域數(shù)字圖書(shū)館門(mén)戶整合方案,以期為數(shù)字圖書(shū)館聯(lián)盟建設(shè)提供一種新的資源共享、讀者服務(wù)模式。
數(shù)字圖書(shū)館門(mén)戶是通過(guò)統(tǒng)一檢索、數(shù)據(jù)收割、推送服務(wù)等技術(shù)手段,將分布在不同信息源的內(nèi)容整合在一起集中提供給用戶的網(wǎng)絡(luò)服務(wù)[5]。它既是數(shù)字圖書(shū)館聯(lián)盟資源與服務(wù)整合的載體,也是用戶利用圖書(shū)館資源和服務(wù)的訪問(wèn)接入點(diǎn)。數(shù)字圖書(shū)館聯(lián)盟建設(shè)的目的是為用戶提供區(qū)域?qū)用娴奈墨I(xiàn)保障,而統(tǒng)一的門(mén)戶建設(shè)的目的則是支持用戶檢索,方便用戶利用數(shù)字資源,它是一個(gè)資源集成的平臺(tái),提供一站式的信息服務(wù)、統(tǒng)一的檢索認(rèn)證,以及個(gè)性化服務(wù)。因此數(shù)字圖書(shū)館門(mén)戶的建設(shè)對(duì)數(shù)字圖書(shū)館聯(lián)盟具有重要意義。
基于對(duì)“深圳文獻(xiàn)港”數(shù)字圖書(shū)館戶門(mén)的分析,筆者總結(jié)出數(shù)字圖書(shū)館門(mén)戶的功能特點(diǎn):
(1)統(tǒng)一檢索:門(mén)戶需具有支持多個(gè)異構(gòu)資源的跨庫(kù)檢索功能,包括OPAC、書(shū)目數(shù)據(jù)庫(kù)、外部異構(gòu)的商用資源和免費(fèi)web資源等,要具備的檢索協(xié)議應(yīng)該包括H TTP 、Z39.50、Zing、CA LIS-ODL 等,支持的元數(shù)據(jù)應(yīng)該包括DC、MARK、EAD等;
(2)資源鏈接:應(yīng)該具有及時(shí)調(diào)度資源的功能,使電子資源之間實(shí)現(xiàn)無(wú)縫連接,提供一站式的檢索,并能夠?qū)z索結(jié)果進(jìn)行揭示,推送給用戶;
(3)資源導(dǎo)航:給用戶提供多種資源的多種分類導(dǎo)航瀏覽方式,如提供學(xué)科導(dǎo)航、資源類型導(dǎo)航等,便于用戶快速定位所需資源和服務(wù);
(4)內(nèi)容聚合:將其他資源、數(shù)據(jù)庫(kù)中的結(jié)構(gòu)與非結(jié)構(gòu)化數(shù)據(jù)通過(guò)收割、復(fù)制、導(dǎo)入等技術(shù)聚合起來(lái),建立聯(lián)合資源倉(cāng)儲(chǔ)。這些內(nèi)容可包括導(dǎo)航數(shù)據(jù)、元數(shù)據(jù)、全文數(shù)據(jù)、多媒體數(shù)據(jù)等,提供對(duì)聯(lián)合倉(cāng)儲(chǔ)中多種類型元數(shù)據(jù)的聯(lián)合檢索;
(5)統(tǒng)一認(rèn)證:通過(guò)一次登陸訪問(wèn),向用戶提供各種類型的資源和服務(wù),即支持統(tǒng)一檢索,能夠同時(shí)檢索多個(gè)IP認(rèn)證、密碼認(rèn)證的商用資源,而無(wú)需用戶自己登錄這些資源;
(6)流量報(bào)表:能夠記錄用戶對(duì)數(shù)字資源的使用情況、創(chuàng)建分析日志系統(tǒng),實(shí)現(xiàn)用戶信息使用行為挖掘。
“深圳文獻(xiàn)港”于2009年6月正式推出,將深圳區(qū)域內(nèi)的文獻(xiàn)資源有效整合在“讀秀”平臺(tái)上,實(shí)現(xiàn)面向用戶的區(qū)域數(shù)字圖書(shū)館聯(lián)盟的服務(wù)。深圳文獻(xiàn)港門(mén)戶構(gòu)建模型如圖1。
圖1 深圳文獻(xiàn)港(區(qū)域數(shù)字圖書(shū)館聯(lián)盟門(mén)戶構(gòu)建模型)
該模型的整體架構(gòu)分三層,分別是應(yīng)用層、業(yè)務(wù)層和數(shù)據(jù)層。全面整合了包括深圳圖書(shū)館(公共館)、深圳市科技圖書(shū)館(專業(yè)館)、深圳大學(xué)圖書(shū)館(高校館)三家圖書(shū)館的各種文獻(xiàn)資源,為區(qū)域內(nèi)的企業(yè)、學(xué)校、科研單位和用戶構(gòu)建了一個(gè)基于網(wǎng)絡(luò)、遠(yuǎn)程利用資源的和諧使用環(huán)境,同時(shí)通過(guò)系統(tǒng)平臺(tái)、技術(shù)手段和圖書(shū)館員工作,對(duì)信息資源進(jìn)行充分的挖掘和關(guān)聯(lián),從而實(shí)現(xiàn)對(duì)資源的整體性揭示,將信息以更加細(xì)化和便捷的方式呈現(xiàn)給用戶。
都柏林核心(Dublin Core,簡(jiǎn)稱DC)是一個(gè)由15個(gè)元數(shù)據(jù)組成的元數(shù)據(jù)標(biāo)準(zhǔn),目的是促進(jìn)網(wǎng)絡(luò)資源(包括文本及多媒體資源)的發(fā)現(xiàn)。DC元數(shù)據(jù)在網(wǎng)絡(luò)資源檢索中的主要功能為:側(cè)重于對(duì)信息資源的描述、整合和控制,在描述過(guò)程中特別強(qiáng)調(diào)忠實(shí)于原有資源和標(biāo)引過(guò)程中的標(biāo)準(zhǔn)形式和詞表的采用,這與現(xiàn)行的用于網(wǎng)絡(luò)資源檢索的搜索引擎相比,無(wú)疑將大大提高檢索效率[6]。深圳文獻(xiàn)港基于對(duì)元數(shù)據(jù)進(jìn)行存儲(chǔ)和預(yù)處理,經(jīng)過(guò)去重排序、索引處理,為用戶提供了搜索引擎方式的檢索體驗(yàn),元數(shù)據(jù)的應(yīng)用流程如圖2。
圖2 元數(shù)據(jù)應(yīng)用流程圖
元數(shù)據(jù)的建設(shè)是實(shí)現(xiàn)這一搜索方式的基礎(chǔ),如表1。
表1 元數(shù)據(jù)建設(shè)對(duì)象
元數(shù)據(jù)建設(shè)不僅保障了格式的統(tǒng)一,而且數(shù)據(jù)結(jié)構(gòu)清晰,可以按照用戶的需求建立各種分類體系,或者按照更高級(jí)的知識(shí)本體對(duì)數(shù)據(jù)進(jìn)行再組織和管理?;谠獢?shù)據(jù)的深圳文獻(xiàn)港保障了搜索的效率和系統(tǒng)性。
深圳文獻(xiàn)港針對(duì)各種異構(gòu)數(shù)字資源進(jìn)行整合檢索,一次檢索可以得到8種相關(guān)聯(lián)的文獻(xiàn)的檢索結(jié)果,如圖3。
圖3 統(tǒng)一檢索資源類型揭示圖
門(mén)戶的全文搜索引擎可對(duì)文章題名、主題、作者等進(jìn)行分析型檢索,特別是實(shí)現(xiàn)了全文檢索。統(tǒng)一的檢索界面和統(tǒng)一的檢索語(yǔ)言,使用戶能對(duì)本地和異地的各種資源系統(tǒng)同時(shí)檢索。不同的檢索范圍對(duì)應(yīng)相應(yīng)的檢索模式,包括基本檢索、二次檢索及高級(jí)檢索;在檢索任一種資源時(shí),同時(shí)顯示其他相關(guān)資源信息,并自動(dòng)形成聚類分類,如圖4。
圖4 中文期刊統(tǒng)一檢索頁(yè)面
用戶在數(shù)字資源平臺(tái)中最期望得到的是一站式服務(wù)。在一個(gè)提供信息查找的門(mén)戶中,用戶希望得到學(xué)科知識(shí)導(dǎo)航服務(wù)、多類型文獻(xiàn)的關(guān)聯(lián)鏈接、異構(gòu)數(shù)據(jù)庫(kù)的跨庫(kù)檢索服務(wù),以及獲取目標(biāo)信息的服務(wù)[6]。系統(tǒng)對(duì)資源的調(diào)度是滿足讀者需求的基礎(chǔ)。
深圳文獻(xiàn)港的資源調(diào)度系統(tǒng)有效地實(shí)現(xiàn)了原文鏈接和文獻(xiàn)上下文敏感信息的揭示。該系統(tǒng)是基于OpenURL標(biāo)準(zhǔn)的多級(jí)調(diào)度系統(tǒng),能夠自動(dòng)更新知識(shí)庫(kù)。資源調(diào)度系統(tǒng)以動(dòng)態(tài)腳本技術(shù)制定調(diào)度規(guī)則,便于增加新的資源和新的服務(wù),更有效地實(shí)現(xiàn)服務(wù)的調(diào)度。
資源調(diào)度遵循以下規(guī)則:
(1)授權(quán)方便原則:用戶通過(guò)統(tǒng)一認(rèn)證后,系統(tǒng)自動(dòng)判斷該用戶的授權(quán)使用資源,若用戶需要獲取非授權(quán)資源時(shí),系統(tǒng)自動(dòng)提示可授權(quán)的成員館名稱,并提供資源調(diào)度申請(qǐng)表;
(2)就近最快原則:給資源設(shè)立權(quán)重,根據(jù)用戶端情況判斷,優(yōu)先調(diào)度最快資源,權(quán)重依次為本地已有資源、成員館遠(yuǎn)程資源、文獻(xiàn)傳遞資源;
(3)自動(dòng)傳遞原則:常用資源實(shí)現(xiàn)自動(dòng)傳遞,無(wú)法判斷是否可以自動(dòng)傳遞的請(qǐng)求,自動(dòng)轉(zhuǎn)到人工傳遞隊(duì)列;
(4)全文傳遞原則:對(duì)于權(quán)限內(nèi)的用戶直接提供全文訪問(wèn)連接,無(wú)法直接訪問(wèn)的用戶,通過(guò)填寫(xiě)表單,提供區(qū)域共享和文獻(xiàn)傳遞服務(wù),將用戶的傳遞需求分發(fā)到收藏該資源的成員館進(jìn)行傳遞服務(wù)。
統(tǒng)一認(rèn)證、文獻(xiàn)服務(wù)統(tǒng)計(jì)管理系統(tǒng)實(shí)現(xiàn)區(qū)域范圍內(nèi)的用戶的統(tǒng)一管理與文獻(xiàn)服務(wù)統(tǒng)計(jì),并通過(guò)接口開(kāi)發(fā)與定制,將數(shù)字圖書(shū)館內(nèi)其他應(yīng)用系統(tǒng)集成到平臺(tái)中來(lái)。建設(shè)模塊內(nèi)容見(jiàn)表2。
(1)統(tǒng)一認(rèn)證
任何用戶都可以訪問(wèn)權(quán)限范圍內(nèi)所有資源。“權(quán)限范圍”就是各種資源授權(quán)使用的IP范圍。
(2)文獻(xiàn)服務(wù)統(tǒng)計(jì)
對(duì)各成員館的信息服務(wù)進(jìn)行統(tǒng)計(jì)分析,特別是實(shí)現(xiàn)單位用戶之間文獻(xiàn)服務(wù)的統(tǒng)計(jì),為各成員館提供結(jié)算參考。
表2 統(tǒng)一認(rèn)證、文獻(xiàn)服務(wù)統(tǒng)計(jì)系統(tǒng)模塊內(nèi)容
元數(shù)據(jù)的多少是衡量信息揭示度的重要標(biāo)準(zhǔn),基于元數(shù)據(jù)的檢索在嚴(yán)格保證DC的15個(gè)基本元數(shù)據(jù)項(xiàng)的基礎(chǔ)上,應(yīng)根據(jù)資金和人力等資源情況,進(jìn)一步擴(kuò)大資源的揭示深度和廣度。
網(wǎng)站的信息經(jīng)常更新,甚至?xí)霈F(xiàn)網(wǎng)站關(guān)閉的情況,產(chǎn)生死鏈接,這就需要對(duì)索引資源盡快更新。網(wǎng)頁(yè)快照是解決此問(wèn)題的重要方法,可在一定時(shí)期內(nèi)保留網(wǎng)站的原貌。定期檢查是及時(shí)發(fā)現(xiàn)和減少死鏈接現(xiàn)象的根本手段,門(mén)戶管理人員也可根據(jù)用戶的信息反饋,有針對(duì)性地進(jìn)行補(bǔ)救[7]。
在信息門(mén)戶中可有針對(duì)性地開(kāi)發(fā)“用戶使用情況調(diào)查模塊”,基于用戶的選擇,從聚合的點(diǎn)擊流中直接挖掘信息,進(jìn)而能夠基于使用進(jìn)行新的開(kāi)發(fā)。此外,利用這些挖掘的用戶數(shù)據(jù)還可以構(gòu)建額外服務(wù),如推薦服務(wù)。建立相應(yīng)的指標(biāo)體系,從用戶使用的角度來(lái)評(píng)估資源建設(shè)情況,可以更有效地改善區(qū)域圖書(shū)館聯(lián)盟的協(xié)調(diào)采訪和各成員館的館藏資源質(zhì)量。
可考慮在現(xiàn)有應(yīng)用系統(tǒng)的基礎(chǔ)上添加包括博客 、RSS 、W iki、SNS(社會(huì)網(wǎng)絡(luò))、P2P 、IM等應(yīng)用,提供圖書(shū)館以外的應(yīng)用內(nèi)容,使系統(tǒng)上的每一個(gè)用戶都能實(shí)現(xiàn)交互,這樣就組成了一個(gè)以數(shù)字圖書(shū)館為主題的用戶網(wǎng)絡(luò)[8]。
圖書(shū)館要想將用戶牢固鎖定,就必須去適應(yīng)用戶信息獲取習(xí)慣。圖書(shū)館聯(lián)盟可以改變采購(gòu)商業(yè)數(shù)據(jù)庫(kù)的模式,可以優(yōu)惠價(jià)購(gòu)買(mǎi)更多的全文數(shù)據(jù)庫(kù),以滿足用戶“更快、更方便、更自如”地獲取全文的需求。
參考資料
1 張春紅,廖三三,沈蕓蕓.數(shù)字圖書(shū)館門(mén)戶的關(guān)鍵需求設(shè)計(jì)——以北京大學(xué)數(shù)字圖書(shū)館門(mén)戶為案例.現(xiàn)代圖書(shū)情報(bào)技術(shù),2006(11):7
2 姜愛(ài)蓉.區(qū)域性圖書(shū)館合作發(fā)展座談會(huì)會(huì)議實(shí)錄.公共圖書(shū)館.2009(2):6
3 寧波數(shù)字圖書(shū)館網(wǎng)站主頁(yè).[2009-06-19].http://www.nbdl.gov.cn/
4 深圳文獻(xiàn)港網(wǎng)站主頁(yè).[2009-06-19].http://www.szdnet.org.cn/
5 陳定權(quán),朱維鳳等.數(shù)字圖書(shū)館門(mén)戶的個(gè)性化.新世紀(jì)圖書(shū)館,2009(2):30
6 毛燕梅,張百靈等.DC元數(shù)據(jù)與網(wǎng)絡(luò)信息的檢索效率.北方工業(yè)大學(xué)學(xué)報(bào),2001(2):82-84
7 李輝.從中外信息門(mén)戶比較看CSDL學(xué)科信息門(mén)戶的發(fā)展.圖書(shū)情報(bào)工作,2005(2):34
8 孟曉川,馬自衛(wèi).基于Liferay的多維化門(mén)戶系統(tǒng)在數(shù)字圖書(shū)館中的研究與實(shí)現(xiàn).現(xiàn)代圖書(shū)情報(bào)技術(shù),2008(12):11
9 超星數(shù)字圖書(shū)館區(qū)域數(shù)字圖書(shū)館方案.2009年6月