新疆 李森
有關(guān)SRU/W和OAI信息檢索協(xié)議的使用研究
新疆 李森
為解決不同數(shù)據(jù)結(jié)構(gòu)信息資源的檢索、集成和共享的問(wèn)題,先后有一些相關(guān)的協(xié)議開(kāi)發(fā)應(yīng)用,其中SRU/W和OAI是其中具有代表性的協(xié)議,本文根據(jù)兩個(gè)協(xié)議的特點(diǎn)從提出時(shí)間、最新版本、與用戶的上下文相關(guān)敏感性、請(qǐng)求/響應(yīng)中是否帶版本號(hào)、傳輸機(jī)理、服務(wù)提供方的工作、對(duì)于大規(guī)模響應(yīng)信息的處理、體系結(jié)構(gòu)、對(duì)元數(shù)據(jù)格式的要求的等幾個(gè)方面進(jìn)行研究并相互比較,最后對(duì)這兩個(gè)協(xié)議的協(xié)同使用進(jìn)行深入分析,為使用者在應(yīng)用中提供了相關(guān)理論依據(jù)。
SRU/W協(xié)議;OAI協(xié)議;協(xié)同使用
SRU/W和OAI就是具有一定代表性的協(xié)議。SRU/W和OAI是幾乎在同一時(shí)間由不同的組織基于不同的應(yīng)用背景所開(kāi)發(fā)的信息檢索協(xié)議。SRU/W是為了解決之前信息檢索協(xié)議過(guò)于復(fù)雜,無(wú)法直接與WEB連接等問(wèn)題而提出的下一代協(xié)議的一個(gè)組成部分,SRW根據(jù)最近WEB技術(shù)的發(fā)展,提出的一個(gè)基于WEB服務(wù)(WEBService)的信息檢索協(xié)議。OAI是在原有信息檢索協(xié)議基礎(chǔ)上進(jìn)行改進(jìn),其目標(biāo)是通過(guò)元數(shù)據(jù)收獲這種模式實(shí)現(xiàn)在Web上發(fā)布信息的不同組織(主要在歐美等地)之間的互操作,形成一個(gè)與應(yīng)用無(wú)關(guān)的互操作框架,是一項(xiàng)簡(jiǎn)單、靈活的元數(shù)據(jù)互操作協(xié)議,OAI支持選擇性的收割方式,適合于系統(tǒng)間元數(shù)據(jù)的循環(huán)交換。
以上兩種協(xié)議都是為了解決分布、異構(gòu)的數(shù)據(jù)資源的檢索、集成和共享問(wèn)題提出的,它們之間存在著相同點(diǎn)和不同點(diǎn),本文根據(jù)實(shí)際工作情況對(duì)這兩個(gè)協(xié)議進(jìn)行比較,并對(duì)這兩個(gè)協(xié)議的協(xié)同使用進(jìn)行研究,其研究的目的是如何將這兩個(gè)協(xié)議結(jié)合起來(lái),發(fā)揮各自的優(yōu)點(diǎn),從而實(shí)現(xiàn)數(shù)字信息的資源的更好地集成和共享。
SRW是一個(gè)針對(duì)WEB應(yīng)用的信息檢索協(xié)議,提供基于Web Services的各種用戶訪問(wèn)機(jī)制,它定義了一個(gè)通用的、抽象的模型,各個(gè)系統(tǒng)可以將其具體實(shí)現(xiàn)映射到該抽象模型上,實(shí)現(xiàn)了不同網(wǎng)絡(luò)資源、分布式數(shù)據(jù)庫(kù)的統(tǒng)一檢索功能。SRW的設(shè)計(jì)一方面根據(jù)了Z39.50信息檢索通訊協(xié)議標(biāo)準(zhǔn),另一方面運(yùn)用了現(xiàn)有的技術(shù)基礎(chǔ)如SOAP、XPath等。SRW使用的是模塊化的整合方式。更進(jìn)一步說(shuō),SRW設(shè)計(jì)的理念是將信息檢索視為各種查詢檢索服務(wù)的集合。
OAI的設(shè)計(jì)思路和核心思想相對(duì)容易和簡(jiǎn)單:在HTTP協(xié)議的基礎(chǔ)上,制定了一些命令動(dòng)詞,其中主要應(yīng)用的有6個(gè)命令動(dòng)詞,這6個(gè)命令動(dòng)詞中,有三個(gè)是用來(lái)揭示知識(shí)庫(kù)的特征(ListSets、Identify、ListMetadataFormats),另外三個(gè)是用來(lái)從知識(shí)庫(kù)中提取元數(shù)據(jù)(GetRecord、ListRecords、ListIdentifiers)。
SRU/W和OAI都是為了解決信息資源檢索的整合和共享而提出的解決方案,它們之間存在著相同點(diǎn)和不同點(diǎn)。根據(jù)兩個(gè)協(xié)議提出時(shí)間最新版本、響應(yīng)中是否帶版本號(hào)、上下文相關(guān)敏感性、傳輸機(jī)理、服務(wù)提供方的工作、響應(yīng)信息的處理等幾個(gè)方面作出相應(yīng)的比較。比較結(jié)果如表1所示。
表 1:OAI、SRU/W 的比較
對(duì)于二者的協(xié)同使用中,單純依靠任何一種協(xié)議方式不能滿足數(shù)字信息檢索中的分布、異構(gòu)資源的整合、共享需求,為了能夠?yàn)樾畔z索用戶提供的流暢的信息檢索服務(wù),需要將這些協(xié)議結(jié)合起來(lái)使用。
SRW與OAI可以通過(guò)特定的接口結(jié)合使用,根據(jù)需要再實(shí)現(xiàn)OAI元數(shù)據(jù)收割接口。在OAI框架中,為了提供能夠響應(yīng)OAI請(qǐng)求,數(shù)據(jù)提供者必須為找到能夠與其現(xiàn)有數(shù)據(jù)庫(kù)配置相匹配的OAI實(shí)現(xiàn)。OCLCOAIcat通過(guò)對(duì)數(shù)據(jù)庫(kù)引擎、數(shù)據(jù)存儲(chǔ)格式映射機(jī)制進(jìn)行抽象,可以為任意數(shù)據(jù)庫(kù)系統(tǒng)建立OAI元數(shù)據(jù)接口,實(shí)現(xiàn)基于OAI-PHM2.0協(xié)議的元數(shù)據(jù)開(kāi)放。但開(kāi)發(fā)能夠訪問(wèn)不同數(shù)據(jù)庫(kù)的應(yīng)用程序不僅僅是OAI實(shí)現(xiàn)所需要解決的問(wèn)題。理想的解決方案是具有一個(gè)能夠工作于不同的數(shù)據(jù)庫(kù)配置的標(biāo)準(zhǔn)檢索API,可以考慮采用SRU/W來(lái)實(shí)現(xiàn)。
目前對(duì)于用OAI所收割的元數(shù)據(jù)集,存在著多種檢索服務(wù)Web接口,每種檢索服務(wù)都有自己的查詢語(yǔ)法和服務(wù)規(guī)范,這種狀況不利于集成檢索。為了解決這一問(wèn)題,可以為通過(guò)OAI所收割的元數(shù)據(jù)提供SRU/W檢索接口,使得用戶可以直接通過(guò)SRU/W接口實(shí)現(xiàn)對(duì)OAI元數(shù)據(jù)集的檢索。這一思想及模型目前已在資源發(fā)現(xiàn)網(wǎng)絡(luò)(Resource Discovery Network),歐洲圖書(shū)館(The European Library)等項(xiàng)目中加以利用,這一模型同時(shí)也是幾個(gè)大規(guī)模系統(tǒng)架構(gòu)的基礎(chǔ),如Andy Powell所描述的JISC信息環(huán)境。
本文對(duì)數(shù)字圖書(shū)館中實(shí)現(xiàn)分布、異構(gòu)資源的集成、共享的兩種協(xié)議(OAI、SRU/W)進(jìn)行了介紹和比較。雖然兩個(gè)協(xié)議對(duì)于同一個(gè)問(wèn)題采用了不同的解決方式,但兩個(gè)協(xié)議可以互為補(bǔ)充,協(xié)同使用,來(lái)更好地實(shí)現(xiàn)數(shù)字圖書(shū)館資源的整合和共享。
SRU/W and OAI are protocols for retrieval,integration and sharing of distributed and heterogeneous resources.Firstlythe twoprotocols are introduced,and then the two protocols are compared from creation time,new protocol version,user context-sensitive,transport mechanism,work of service provider and architecture etc.,finally,Implementations ofCooperation oftwoprotocols are analyzed.
SRU/W protocol;comparison study;implementation ofCooperation
(作者單位:新疆石河子職業(yè)技術(shù)學(xué)院計(jì)算機(jī)系)
(編輯呂智飛)