• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      國外公共數(shù)字文化資源整合元數(shù)據(jù)互操作方式研究*

      2015-12-03 08:27:48李金芮
      圖書與情報 2015年1期
      關(guān)鍵詞:數(shù)據(jù)格式資源整合圖書館

      楊 蕾 李金芮

      (1.武漢大學(xué)圖書館 湖北武漢 430072)

      (2.暨南大學(xué)圖書館 廣東廣州 510632)

      公共數(shù)字文化資源整合需要圖書館、博物館、檔案館、文化館、美術(shù)館、科技館等多個公共文化服務(wù)機構(gòu)主體的共同參與,所整合的信息資源對象囊括了眾多學(xué)科門類,數(shù)量極其巨大,類型特別繁多。主客體的復(fù)雜性必然導(dǎo)致公共數(shù)字文化整合中多種元數(shù)據(jù)標(biāo)準(zhǔn)并存、不同信息系統(tǒng)的互操作難以進行等問題。然而在網(wǎng)絡(luò)環(huán)境下,用戶更希望建立一個統(tǒng)一檢索平臺,“一站式”地獲取各類公共文化服務(wù)機構(gòu)的數(shù)字資源。紛繁復(fù)雜的元數(shù)據(jù)標(biāo)準(zhǔn)與公共數(shù)字文化資源需求接口單一性之間的沖突,使得元數(shù)據(jù)互操作問題的解決勢在必行。本文將對國外典型項目的元數(shù)據(jù)互操作方式進行調(diào)查分析,探討國外在元數(shù)據(jù)互操作方面所采取的多元化策略,從而為我國提供某些借鑒與參考。

      1 研究內(nèi)容與數(shù)據(jù)來源

      元數(shù)據(jù)的互操作是指在由不同的組織制定與管理且技術(shù)規(guī)范不盡相同的元數(shù)據(jù)環(huán)境下,要向用戶提供一個統(tǒng)一的數(shù)據(jù)檢索界面,確保系統(tǒng)對用戶的一致性服務(wù)。也就是說,元數(shù)據(jù)互操作問題就是不同元數(shù)據(jù)格式間的信息共享、轉(zhuǎn)換和跨系統(tǒng)檢索等相關(guān)問題。元數(shù)據(jù)的互操作是分層次的,因此互操作問題也必須分層次解決。曾蕾提出的三級(模式級、記錄級、倉儲級)互操作框架(見表1)是本次調(diào)查的主要依據(jù)。該框架在時間上涵蓋了元數(shù)據(jù)從標(biāo)準(zhǔn)構(gòu)建、記錄產(chǎn)生到檢索應(yīng)用的全過程,又兼顧了信息資源描述從元素、記錄到框架模式的不同深度,其歸納的每個級別的主要操作方式基本體現(xiàn)了目前元數(shù)據(jù)互操作的發(fā)展現(xiàn)狀。

      本文選取了世界數(shù)字圖書館(WorldDigitalLibrary,WDL)、國際敦煌項目(International Dunhuang Project,IDP)、歐洲數(shù)字圖書館(Europeana)、歐洲Michael Culture項目、美國記憶(American Memory,AM)、美國公共數(shù)字圖書館(Digital Public Library of America,DPLA)、英國聚寶盆(Cornucopia)、日本國會圖書館等八個國外公共數(shù)字文化資源整合的典型項目,通過登錄各項目網(wǎng)站并查閱與其信息資源建設(shè)相關(guān)的文獻,對各項目的元數(shù)據(jù)互操作方式進行了調(diào)查。調(diào)查顯示,目前國外公共數(shù)字文化整合項目所采用的互操作方式主要包括:采用統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)、應(yīng)用規(guī)范、映射等模式級互操作方式,數(shù)據(jù)復(fù)用與集成等記錄級互操作方式,協(xié)議、API等倉儲級互操作方式。

      表1 元數(shù)據(jù)的三級互操作框架

      2 模式級元數(shù)據(jù)互操作

      2.1 建立統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)

      采用統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)是指在一個聯(lián)盟內(nèi)或一個知識庫內(nèi)采用統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),以獲得高度的一致性。理論上講,這是一種從根本上解決元數(shù)據(jù)互操作問題的方法。雖然曾蕾的元數(shù)據(jù)三級互操作框架中并沒有提到“采用統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)”這一方式,但是因為這一方式也被一些資源整合項目所采用,且該方式也發(fā)生在數(shù)據(jù)記錄被創(chuàng)造出來之前,故筆者把這一方式也歸為模式級的互操作方式。

      世界數(shù)字圖書館(WDL)一個杰出的貢獻便是在項目規(guī)劃之初就逐步建立了一套一致的、高質(zhì)量的元數(shù)據(jù)標(biāo)準(zhǔn),對來自全球的資源重新進行統(tǒng)一描述和編目,確保了各合作伙伴在資源組織過程中的一致性。WDL委托美國國會圖書館協(xié)同其他成員機構(gòu)確定元數(shù)據(jù)、數(shù)字化和文件傳輸標(biāo)準(zhǔn),設(shè)計人員開發(fā)了一個支持元數(shù)據(jù)需求的新的編目應(yīng)用程序。WDL的數(shù)字內(nèi)容采用杜威十進分類法進行分類,按照主題進行組織。成員機構(gòu)按照通用的國家或國際編目系統(tǒng)的規(guī)則制作元數(shù)據(jù),最后由WDL進行統(tǒng)一的補充。每一個條目固定的元數(shù)據(jù)包括標(biāo)題、描述、地點、時間、主題、條目類型、機構(gòu)及語言等,附加字段提供了條目的物理特性或其他相關(guān)主題信息。在WDL多項元數(shù)據(jù)元素中,令人印象最深刻的一條是對每一項的“描述”,它回答了“這一項是什么和它為什么意義重大”的問題,由館長和其他專家共同撰寫的這些內(nèi)容為用戶提供了至關(guān)重要的參考信息,這些是為激發(fā)學(xué)生和廣大公眾對了解所有國家文化遺產(chǎn)的好奇心而設(shè)計的。

      英國MLA的聚寶盆項目也采用了一個統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)——RSLP資源集合描述標(biāo)準(zhǔn)(RSLP Collection Description)。RSLP資源集合描述項目是英國研究支持圖書館計劃(Research Support Libraries Programme,RSLP)資助的一個項目,目標(biāo)是使得RSLP資助的所有項目能夠以一種一致且機器可讀的方式描述資源集合。根據(jù)項目組提出的資源集合描述模型,聚寶盆的數(shù)字資源均由三個元素區(qū)構(gòu)成元數(shù)據(jù)標(biāo)準(zhǔn)進行描述,即資源集合(Collection),資源集合位置(Location)以及與資源集合的收集、管理等相關(guān)的個人和機構(gòu)(Agent),每個元素區(qū)內(nèi)包含若干個元素。

      對于目前能提供的數(shù)字化作品和影音文件分別僅為10244件與6000多件的WDL和聚寶盆而言,采用統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)是從根本上解決元數(shù)據(jù)互操作問題的方法,這一方法在不用耗費過多人力物力的前提下,有效地確保了各合作伙伴在資源組織過程中的一致性。但是在不同應(yīng)用領(lǐng)域和應(yīng)用層次已存在多達40余種元數(shù)據(jù)格式的開放信息環(huán)境下,對于資源整合量達數(shù)以億計的其他資源整合項目而言,這種方法并不總是可行或現(xiàn)實的。很多公共文化服務(wù)機構(gòu)的數(shù)字資源已經(jīng)采用了不同的元數(shù)據(jù)描述方式,在對其進行整合的過程中若采取一種統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),將不利于充分利用合作機構(gòu)已有資源,從而耗費巨大的人力、物力和財力。需要整合的資源數(shù)量越大,無謂的支出就會越多,這會使經(jīng)費本來就很有限的公共數(shù)字文化資源整合項目難以正常運行。這種情況下,就有必要尋求其他的元數(shù)據(jù)互操作方式來解決問題了。

      2.2 應(yīng)用規(guī)范

      元數(shù)據(jù)應(yīng)用規(guī)范(Application Profiles)是一種元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的應(yīng)用形式,也可以看成是一種規(guī)范的元數(shù)據(jù)方案。允許在應(yīng)用中采用組合來自多個不同的元數(shù)據(jù)標(biāo)準(zhǔn)中的數(shù)據(jù)元素,并對“混合型”元數(shù)據(jù)方案從內(nèi)容和形式上進行規(guī)范,保證具有相似的基本結(jié)構(gòu)和通用元素。

      歐洲Michael Culture項目以都柏林核心集(DC)作為數(shù)字資源描述與保存的基本格式,在這個基本格式的基礎(chǔ)上通過組合Michael項目自建元數(shù)據(jù)、RSLP資源集合描述等元數(shù)據(jù)格式,建立專門的Michael-EU都柏林核心應(yīng)用規(guī)范(MICHAEL-EU Dublin Core Application Profile,MICHAEL-EU DCAP)。MICHAEL-EU DCAP 由 28個要素構(gòu)成,其中11個來自DC,6個來自DC Terms,9個來自Michael項目,2個來自RSLP(各要素與源元數(shù)據(jù)格式的對應(yīng)關(guān)系如表2所示)。這種應(yīng)用規(guī)范的建立確保了Michael Culture項目的元數(shù)據(jù)格式具有相似的基本結(jié)構(gòu)和共同元素,并具有不同的深度和細節(jié)以滿足不同的需要。

      美國公共數(shù)字圖書館(DPLA)在Europeana數(shù)據(jù)模型(Europeana Data Model,EDM)的基礎(chǔ)上建立了新的數(shù)據(jù)模型DPLA元數(shù)據(jù)應(yīng)用規(guī)范(Metadata Application Profile,MAP),該應(yīng)用規(guī)范除了擁有EDM特定的類與屬性之外,還組合了以下元數(shù)據(jù)格式的定義:RDF(ResourceDescription Framework,資源描述框架)和 RDF Schema,ORE,DC 元素的名稱空間、條目和類型,基本地理(WGS84緯度/經(jīng)度)詞匯(DPLA MAP的基本數(shù)據(jù)模型見圖1)。

      2.3 映射

      元數(shù)據(jù)映射(Metadata Mapping/Metadata Crosswalks)又稱元數(shù)據(jù)對照,是從一個元數(shù)據(jù)格式的元素、語義和語法到另一種元數(shù)據(jù)格式的元素、語義和語法的映射,通過一對一、多對一及多對多等多種方式映射,以解決語義互換及統(tǒng)一檢索問題。相較于其他互操作方式,元數(shù)據(jù)映射在項目創(chuàng)建的初始階段應(yīng)用,可以從根本上提高互操作的范圍,且采用這一方式的簡易程度高于采用統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)這一方式,因此被公共數(shù)字文化資源整合項目廣泛采用。

      表2 MICHAEL-EU DCAP元數(shù)據(jù)與源元數(shù)據(jù)的對應(yīng)關(guān)系

      幾乎所有的資源整合項目均結(jié)合實際需求,采用了元數(shù)據(jù)映射方式解決互操作問題。如Europeana將自建的元數(shù)據(jù)標(biāo)準(zhǔn)Europeana Data Model(EDM)與美術(shù)館、圖書館、檔案館和博物館等不同類型文化機構(gòu)常用的元數(shù)據(jù)標(biāo)準(zhǔn)如 DC,MARC,EAD(Encoded Archival Description,檔案編碼描述格式標(biāo)準(zhǔn)),CIDOC-CRM(CIDOC Conceptual Reference Model,國際文獻工作委員會概念參考模型)和LIDO等均建立了映射關(guān)系,以與來自不同機構(gòu)的原始文獻建立關(guān)系,并滿足數(shù)字資源采集、檢索和使用的需求。

      歐洲Michael Culture項目為了實現(xiàn)模式級的互操作,也在自建的Michael數(shù)據(jù)模型與其他常用的元數(shù)據(jù)標(biāo)準(zhǔn)如 LOM(Learning Object Metadata,學(xué)習(xí)對象元數(shù)據(jù)),DC,ISAD之間實現(xiàn)了映射,建立映射關(guān)系的還包括由參與機構(gòu)采用的其他元數(shù)據(jù)標(biāo)準(zhǔn),如TEL、KB等。這些Michael映射關(guān)系被用于創(chuàng)造遷移工具以將其他機構(gòu)的現(xiàn)有內(nèi)容導(dǎo)入Michael數(shù)據(jù)庫,從而最小化文化機構(gòu)需要進行的人工輸入,并且建立盡可能多的現(xiàn)有注釋。

      美國公共數(shù)字圖書館(DPLA)在EDM基礎(chǔ)上建立的新的數(shù)據(jù)模型DPLA MAP(見圖1)幾乎可以與任何元數(shù)據(jù)標(biāo)準(zhǔn)相連接。 目前,MAP已經(jīng)與 DC、MODS、METS-wrapped MODS、MARC XML以及一些本地元數(shù)據(jù)規(guī)范建立了映射關(guān)系,并且能與VRA Core(Visual Resources Association Core,美國可視資料協(xié)會核心類目),CDWA(Categories For The Description Of Works Of Art,藝術(shù)作品描述目錄)以及CIDOC等其他元數(shù)據(jù)標(biāo)準(zhǔn)和應(yīng)用規(guī)范兼容。另外,如果一個元數(shù)據(jù)標(biāo)準(zhǔn)已與EDM建立了映射關(guān)系,那么它也能映射到 DPLA MAP。

      圖1 DPLA MAP的基本數(shù)據(jù)模型[12]

      國際敦煌項目(IDP)提取了一套標(biāo)準(zhǔn)的基層元數(shù)據(jù),與國際標(biāo)準(zhǔn)保持一致,并與它們建立了映射關(guān)系。例如,IDP映射了DC所定義的十五個基礎(chǔ)的核心元素(題名、創(chuàng)建者、主題、說明、出版者、其他責(zé)任者、日期、類型、格式、識別字、來源、語種、關(guān)系、覆蓋范圍和許可證)。

      元數(shù)據(jù)映射轉(zhuǎn)換準(zhǔn)確、轉(zhuǎn)換效率高,是一種比較有效的元數(shù)據(jù)互操作方式,但同時也有其局限性:一是元素之間無法做到避免完全映射帶來的信息丟失問題;二是這種映射方法在涉及的元數(shù)據(jù)格式數(shù)量較少時可以很好地發(fā)揮作用,但隨著元數(shù)據(jù)格式數(shù)量的增多,映射的工作量將大大增加,應(yīng)用效率從而明顯降低。因此,元數(shù)據(jù)格式映射只能作為元數(shù)據(jù)互操作的暫時解決方案,而無法徹底解決元數(shù)據(jù)互操作問題。

      3 記錄級元數(shù)據(jù)互操作

      公共數(shù)字文化資源整合項目通常是對已采用不同元數(shù)據(jù)描述標(biāo)準(zhǔn)的多種公共文化服務(wù)機構(gòu)的數(shù)字資源進行整合,在項目建設(shè)過程中,很多元數(shù)據(jù)記錄已經(jīng)產(chǎn)生,映射等模式級互操作方式無法有效滿足已賦值的元數(shù)據(jù)互操作需求,這就需要借助復(fù)用、集成等方式,實現(xiàn)各機構(gòu)的元數(shù)據(jù)記錄間的整合。復(fù)用與集成方式遵循元數(shù)據(jù)組織模塊化原則,一條元數(shù)據(jù)記錄的各個組成部分可以被當(dāng)作不同的獨立單元,按需要將不同元數(shù)據(jù)源的這些單元組合在一起,或重新應(yīng)用這些單元來產(chǎn)生新的記錄。在模塊化的元數(shù)據(jù)環(huán)境中,各種標(biāo)準(zhǔn)、詞表、應(yīng)用規(guī)范和其他模塊中的不同類型的元數(shù)據(jù)元素,都可以按互操作的方式組合在一起。

      公共數(shù)字文化資源整合項目實現(xiàn)復(fù)用與集成的方式以RDF/XML為主。RDF是W3C提出的基于XML的用于描述Web資源的標(biāo)準(zhǔn),它提出了一個簡單的模型用來表示任意類型的數(shù)據(jù),即“資源—屬性—值”三元組。RDF通過這個三元組來提供元數(shù)據(jù)的基本使用模式,并通過XML Namespace機制引用已有的元數(shù)據(jù)格式中的元素定義,從而直接使用合適的元素作為屬性名來描述相應(yīng)的資源。因此,只要有一個系統(tǒng)能解析RDF的標(biāo)準(zhǔn)描述框架,就能解讀相應(yīng)的元數(shù)據(jù)格式。

      Michael Culture項目采用的SKOS(Simple Knowledge Organization System,簡單知識組織系統(tǒng))核心詞匯應(yīng)用了RDF模型。RDF為描述對象及其屬性、相互關(guān)系及分類(類目)提供了一個簡單的數(shù)據(jù)形式。使用RDF能使數(shù)據(jù)通過語義網(wǎng)絡(luò)應(yīng)用程序和其他RDF數(shù)據(jù)連接和(或)合并。在實踐中,這意味著數(shù)據(jù)源能夠以分散的方式分布在網(wǎng)絡(luò)中,但仍能被應(yīng)用程序以新穎和意料之外的方式有效地組合并集成。

      Europeana的數(shù)據(jù)模型 EDM綜合應(yīng)用了多種元數(shù)據(jù)標(biāo)準(zhǔn),如將 OAI-ORE(Open Archives Initiative Object Reuse and Exchange,開放檔案協(xié)議數(shù)據(jù)復(fù)用與交換)用于不同數(shù)字對象及其衍生形式組織管理,將DC用于描述,將SKOS用于概念詞匯的選擇與表述(見圖2)。應(yīng)用RDF可以靈活調(diào)用上述元數(shù)據(jù)標(biāo)準(zhǔn)集成與復(fù)用,而且可以保存元數(shù)據(jù)并支持互操作。此外,為了適應(yīng)語義網(wǎng)的發(fā)展,Europeana將其數(shù)字資源的相關(guān)數(shù)據(jù)都采用OpenLink Virtuoso或4Store等RDF存儲方式,其目的是為了方便在語義環(huán)境中,Europeana的元數(shù)據(jù)可以通過關(guān)聯(lián)數(shù)據(jù)有效揭示,提高資源可用性。

      4 倉儲級元數(shù)據(jù)互操作

      4.1 互操作協(xié)議

      公共數(shù)字文化資源整合項目通常由多個機構(gòu)合作完成,整合的數(shù)字資源多為分布式存儲,且存在由于規(guī)劃導(dǎo)致的異構(gòu)狀態(tài)。此時跨庫檢索面臨的一個主要問題是檢索結(jié)果無法以系統(tǒng)一致的格式顯示,同時分布式獨立元數(shù)據(jù)資源還存在另一個問題,即每一個元數(shù)據(jù)源的提供者都可能各自使用不同的元數(shù)據(jù)標(biāo)準(zhǔn)來建立數(shù)據(jù)記錄。解決這種問題可以通過定義一個公認(rèn)的、彼此遵循的檢索協(xié)議開展倉儲級的元數(shù)據(jù)互操作。此協(xié)議應(yīng)該滿足以下基本條件:本身具備互操作性;允許用戶在協(xié)議范圍內(nèi)建立滿足自己特殊需要的元數(shù)據(jù)格式;具有可操作性,簡單、靈活且易于遵循。

      支持元數(shù)據(jù)互操作的協(xié)議有很多種,如OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting,開放檔案元數(shù)據(jù)收割協(xié)議)、Z39.50、ZING(SRU/SRW)等,公共數(shù)字文化資源整合項目根據(jù)建設(shè)的需求可選擇應(yīng)用。Europeana同時支持 OAI-PMH、Z39.50、SRU三種協(xié)議,其統(tǒng)計顯示:超過70%的館藏支持OAI-PMH協(xié)議,27%的館藏支持Z39.50協(xié)議,3%的館藏支持SRU協(xié)議。日本國立國會圖書館根據(jù)SRU/SRW、Open-Search等協(xié)議,能夠?qū)?22個數(shù)據(jù)庫進行跨庫檢索。

      OAI-PMH協(xié)議在被調(diào)查的公共數(shù)字文化資源整合項目中使用率最高,而且功能完善。OAI-PMH協(xié)議是一個在分布式網(wǎng)絡(luò)化環(huán)境中獲取元數(shù)據(jù)信息的標(biāo)準(zhǔn)協(xié)議,它通過定義一個標(biāo)準(zhǔn)化的接口,使網(wǎng)絡(luò)服務(wù)器能夠?qū)⒋鎯ζ渲械脑獢?shù)據(jù)有選擇地提供給需要這些數(shù)據(jù)的外部應(yīng)用程序或其他服務(wù)器。

      美國記憶(American Memory,AM)利用OAI-PMH協(xié)議不僅實現(xiàn)了參建機構(gòu)的元數(shù)據(jù)互操作及采集整合,并以此為途徑將其資源開放給其他相關(guān)項目使用。AM首先將來源于AM、全球門戶(Global Gateway)、印刷品及圖片部在線目錄(Prints&Photographs Division Online Catalog)、美國編年史(Chronicling America)和其他參建機構(gòu)的元數(shù)據(jù)進行采集整合;然后針對不同類型文獻的元數(shù)據(jù)分別進行聚類,大致分為圖書、手冊、地圖、海報、影片、音頻、期刊等十類;再根據(jù)各類別的具體情況,分層次提供基于OAI-PMH協(xié)議的開放采集,其中照片類的元數(shù)據(jù)集最多,共有27個數(shù)據(jù)庫可供采集,圖書可采集數(shù)據(jù)庫有11個,大多數(shù)類別中僅有一個數(shù)據(jù)庫開放。此外,為了滿足用戶對不同格式元數(shù)據(jù)的需求,AM提供了OAI-DC、MARC21和MODS三種格式的元數(shù)據(jù)便于采集,并且還提供一些遵守OAI-PMH協(xié)議的、預(yù)先編制的元數(shù)據(jù)采集請求碼供有需要的機構(gòu)參考(見圖3)。

      圖2 EDM的RDF構(gòu)成及來源

      4.2 API

      公共文化服務(wù)機構(gòu)為了支持遠程和平臺調(diào)用自身資源,還可以通過提供本機構(gòu)的API來實現(xiàn)元數(shù)據(jù)記錄的互操作。 API(Application Program Interface,應(yīng)用程序接口)功能是將系統(tǒng)原有的登陸方式、數(shù)據(jù)的檢索與瀏覽、數(shù)據(jù)管理與更新等操作及參數(shù)按照某種協(xié)議進行封裝,外部程序就可以按照封裝后的調(diào)用方式通過API實現(xiàn)與系統(tǒng)的數(shù)據(jù)交互。

      日本國立國會圖書館為了滿足其它系統(tǒng)對NDL Search資源和服務(wù)的調(diào)用,提供了遵循Z39.50協(xié)議的API。 外部機構(gòu)在安裝 NDL Search的 API后可以將國立國會圖書館的數(shù)據(jù)導(dǎo)入并與本機構(gòu)的數(shù)據(jù)進行整合,從而提供更高質(zhì)量的服務(wù)。歐洲數(shù)字圖書館也提供了Europeana API,允許任何人通過建立應(yīng)用程序來搜尋和檢索Europeana倉儲中豐富的文化遺產(chǎn)對象。Europeana API使用REST標(biāo)準(zhǔn)技術(shù)來調(diào)用HTTP,并以JSON格式返回響應(yīng)結(jié)果。Michael Culture的發(fā)布模塊也包括了一個基于REST標(biāo)準(zhǔn)技術(shù)的API,使用簡單的HTTP請求和XML響應(yīng)來搜尋和檢索記錄。用戶可以通過以下三個簡要的步驟使用DPLA提供的API:①從DPLA申請一個API秘鑰;②啟動瀏覽器并在地址欄中輸入請求;③讀取響應(yīng)。

      利用API開展元數(shù)據(jù)互操作的優(yōu)勢在于:API是對操作及操作參數(shù)和功能調(diào)用的封裝,與內(nèi)容無關(guān);服務(wù)提供方通過調(diào)用API進行解析和鏈接而獲取資源與服務(wù),不必再根據(jù)內(nèi)容的變化而不停地維護資源鏈接,從而大大降低了工作負擔(dān)。

      除了以上常用的元數(shù)據(jù)互操作方式外,有的項目還應(yīng)用了一些其他的互操作方式,如衍生(Michael Culture項目的數(shù)據(jù)模型就是由RSLP資源描述框架和DC元數(shù)據(jù)資源描述協(xié)議衍生而來)、注冊(如Europeana的元數(shù)據(jù)注冊系統(tǒng)Europeana Metadata Registry,EuMDR)、關(guān)聯(lián)數(shù)據(jù)(如Europeana Linked Open Data)等。值得指出的是,目前國外公共數(shù)字文化資源整合項目所采用的互操作方式不僅僅局限于某一種方式,而是在模式級、記錄級和倉儲級各層級綜合應(yīng)用多種方式實現(xiàn)或促進元數(shù)據(jù)的互操作。

      5 啟示

      長期以來,我國圖書、檔案、博物等資源在分類標(biāo)準(zhǔn)、著錄規(guī)則和描述習(xí)慣上存在巨大差別,不同系統(tǒng)間的互操作常常難以進行。從目前的實踐看,我國公共數(shù)字文化資源整合的成功案例本來就很少,其中能真正實現(xiàn)元數(shù)據(jù)互操作的項目則更是鳳毛麟角。在這種形勢下,借鑒國外在元數(shù)據(jù)互操作中積累的經(jīng)驗顯得更為迫切。根據(jù)國外各項目的成功經(jīng)驗,我國可以從以下幾個方面著手改進元數(shù)據(jù)互操作問題:

      (1)將元數(shù)據(jù)互操作納入項目建設(shè)規(guī)劃。通過調(diào)查發(fā)現(xiàn),國外項目開展的模式級互操作方式是最多的。這是因為在項目建設(shè)初期,開展模式級互操作的方式越及時、越多樣,工作量和工作難度相對越小。所以,在我國公共數(shù)字文化資源整合項目建設(shè)過程中,應(yīng)在項目規(guī)劃階段就考慮元數(shù)據(jù)互操作問題。首先應(yīng)調(diào)查了解相似項目和相關(guān)資源,選擇或構(gòu)建一種適合當(dāng)前資源環(huán)境的元數(shù)據(jù)描述方式,避免項目建成后再去彌補和修正。

      (2)構(gòu)建統(tǒng)一的元數(shù)據(jù)模型。公共數(shù)字文化資源整合項目的參建機構(gòu)性質(zhì)多樣,所采取的元數(shù)據(jù)標(biāo)準(zhǔn)存在很大差異。即使機構(gòu)的性質(zhì)相同,由于自身一些固有的特點,所采用的標(biāo)準(zhǔn)也不盡相同,如圖書館通常采用MARC,檔案館采用EAD,而有的博物館則采用DC。在這種情況下,建立一個統(tǒng)一的元數(shù)據(jù)模型十分必要。

      圖3 AM提供的基于簡單DC格式的OAI請求內(nèi)容(部分)

      (3)推進多種技術(shù)在元數(shù)據(jù)互操作中的綜合應(yīng)用。從國外的實踐可知,以某種單一的方式徹底解決元數(shù)據(jù)互操作問題是不大現(xiàn)實的。我國公共數(shù)字文化資源整合項目采用的元數(shù)據(jù)互操作方式主要集中在映射和協(xié)議等方面,單一的方式會直接影響到互操作的廣度和深度,所以豐富元數(shù)據(jù)互操作方式是目前我國公共數(shù)字文化資源整合項目面臨的主要問題。綜合采用映射、應(yīng)用規(guī)范、RDF/XML、協(xié)議、API等多種方式促進或?qū)崿F(xiàn)模式級、記錄級、倉儲級各級別的元數(shù)據(jù)互操作尤為重要。

      [1] 陳虹濤,李志俊.元數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范及其互操作性[J].情報雜志,2005 (7):93-95.

      [2] Chan L M,Zeng M L.Metadata Interoperability and Standardization-A Study of Methodology Part I[EB/OL].[2014-05-02].http://dlib.org/dlib/june06/chan/06chan.html.

      [3] Zeng M L,Chan L M.Metadata interoperability and standardization-A study of methodology,Part II[EB/OL].[2014-05-02].http://mirror.dlib.org/dlib/june06/zeng/06 zeng.html.

      [4] 申曉娟,高紅.從元數(shù)據(jù)映射出發(fā)談元數(shù)據(jù)互操作問題[J].國家圖書館學(xué)刊,2006(4): 51-55.

      [5] WDL.關(guān)于世界數(shù)字圖書館:背景[EB/OL].[2014-05-02].http://www.wdl.org/zh/background/.

      [6] 張衛(wèi)東,趙紅穎,李洋.歐美圖書檔案數(shù)字化融合服務(wù)實踐及啟示[J].圖書情報工作,2013(6): 23-27,22.

      [7] About Cornucopia[EB/OL].[2014-05-02].http://www.co rnucopia.org.uk/html/about.

      [8] RSLP Collection Description[EB/OL].[2014-05-02].http://www.ukoln.ac.uk/metadata/rslp/.

      [9] 秦雪平.圖書館檔案館與博物館數(shù)字資源整合研究——以世界數(shù)字圖書館為例[J].情報探索,2013(1):69-72.

      [10] 韓夏,李秉嚴(yán).元數(shù)據(jù)的互操作研究[J].情報科學(xué),2004(7): 812-814.

      [11] MICHAEL-EU Dublin Core Application Profile[EB/OL].[2014-05-04].http://www.ukoln.ac.uk/metadata/micha el/michael-eu/dcap/#DigitalCollectiondctermsextent.

      [12] DPLA.Metadata Application Profile,Version 3 [EB/OL].[2014-05-04].http://dp.la/info/wp-content/uploads/2013/04/DPLAMetadataApplicationProfileV3.pdf.

      [13] Europeana Professional.Metadata [EB/OL].[2014-05-06].http://www.pro.europeana.eu/web/guest/metadata.

      [14] Christaki A,Tzouvaras V,Fresa A,et al.Achieving Interoperability in the MichaelPlus Project[EB/OL].[2014-05-06].http://www.delos.info/files/pdf/DELOS%20Multimatch%202007/Papers/8tzouvaras.pdf.

      [15] DPLA.An introduction to the DPLA metadata model[EB/OL].[2014-05-06].http://dp.la/info/wp-content/uploads/2014/03/Intro-to-DPLA-metadata-model-2014.pdf.

      [16] IDP.技術(shù)基礎(chǔ)構(gòu)造[EB/OL].[2014-05-08].http://idp.dha.ac.cn/pages/technical_infra.a4d#5.

      [17] Europeana Professional.Definition of the Europeana Data Model elements[EB/OL].[2014-05-08].http://pro.europeana.eu/documents/866205/13001/EDM_v5.2.2.pdf.

      [18] Haslhofer B,Momeni Roochi E,Schandl B,et al.Europeana rdf store report[EB/OL].[2014-05-08].http://eprints.cs.univie.ac.at/2833/1/europeana_ts_report.pdf.

      [19] 孔慶杰,宋丹輝.元數(shù)據(jù)互操作問題技術(shù)解決方案研究[J].情報科學(xué),2007 (5): 754-758.

      [20] Freire N,Reis D.Guidelines for preparing a Z39.50/SRU target to enable metadata harvesting [EB/OL].[2014-05-10].http://cyberdoc.univ-lemans.fr/PUB/Cf U/Journee_UNIMARC_Lyon/TELplus-D2.3_v1.0%5B1%5D.pdf.

      [21] 陳瑜,尹銘莉.日本國立國會圖書館新檢索服務(wù)“NDL Search”介紹及分析[J].圖書館雜志,2013(5):81-84.

      [22] McCallum S H.Library of Congress metadata landscape[J].Zeitschrift für Bibliothekswesen und Bibliographie,2003,50(4): 182-187.

      [23] The Library of Congress.OAI-harvestable records for digitized historical collections[EB/OL].[2014-05-20].http://memory.loc.gov/ammem/oamh/index.html.

      [24] Europeana.IntroductionofEuropeanaAPI[EB/OL].[2014-05-20].http://www.europeana.eu/.

      [25] DPLA.API Basics[EB/OL].[2014-05-20].http://dp.la.

      [26] 宋琳琳,李海濤.大型文獻數(shù)字化項目元數(shù)據(jù)互操作調(diào)查與啟示[J].中國圖書館學(xué)報,2012(9): 27-37.

      猜你喜歡
      數(shù)據(jù)格式資源整合圖書館
      少先隊活動與校外資源整合的實踐與探索
      “五育并舉”下家校社資源整合的價值意義
      海外并購中的人力資源整合之道
      中國外匯(2019年19期)2019-11-26 00:57:32
      智慧高速資源整合方式實踐
      圖書館
      小太陽畫報(2018年1期)2018-05-14 17:19:25
      在智能交通系統(tǒng)中PLC數(shù)據(jù)格式轉(zhuǎn)換方法的研究
      電子測試(2018年1期)2018-04-18 11:52:49
      飛躍圖書館
      論子函數(shù)在C語言數(shù)據(jù)格式輸出中的應(yīng)用
      DWG與SHP數(shù)據(jù)格式互轉(zhuǎn)換方法研究——以龍巖規(guī)劃測繪數(shù)據(jù)為例
      去圖書館
      阿拉善左旗| 高唐县| 长丰县| 交城县| 桑植县| 图木舒克市| 武川县| 嫩江县| 新津县| 鄂州市| 新蔡县| 义马市| 宜章县| 济阳县| 化州市| 赤水市| 白玉县| 丰都县| 玛沁县| 冕宁县| 什邡市| 钦州市| 韶山市| 昌乐县| 木兰县| 时尚| 墨竹工卡县| 吴川市| 新河县| 丘北县| 大冶市| 新巴尔虎左旗| 工布江达县| 青州市| 平乡县| 上虞市| 湄潭县| 游戏| 崇明县| 独山县| 长武县|