• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理研究

      2012-04-27 05:39:54西北大學(xué)圖書館西安710069
      圖書館理論與實(shí)踐 2012年9期
      關(guān)鍵詞:關(guān)聯(lián)圖書館

      ●吳 旻(西北大學(xué) 圖書館,西安 710069)

      1 對(duì)關(guān)聯(lián)數(shù)據(jù)的初步認(rèn)識(shí)

      關(guān)聯(lián)數(shù)據(jù)(Linked data) 描述了通過(guò)可鏈接的URI方式來(lái)發(fā)布、分享、連接Web中各類資源的方法,一般認(rèn)為是語(yǔ)義網(wǎng)的主題之一。[1]關(guān)聯(lián)數(shù)據(jù)的基本原理是用一種基于標(biāo)準(zhǔn)的知識(shí)表示與檢索協(xié)議、可逐步擴(kuò)展的機(jī)制來(lái)實(shí)現(xiàn)可動(dòng)態(tài)關(guān)聯(lián)的知識(shí)對(duì)象網(wǎng)絡(luò),并支持以此為基礎(chǔ)的知識(shí)發(fā)現(xiàn)與知識(shí)組織。[2]這樣看來(lái),關(guān)聯(lián)數(shù)據(jù)將對(duì)圖書館的知識(shí)組織起促進(jìn)作用。

      研究者認(rèn)為,關(guān)聯(lián)數(shù)據(jù)的核心技術(shù)是使用資源描述框架(RDF)進(jìn)行資源的組織與交換。關(guān)聯(lián)數(shù)據(jù)通過(guò)URI、HTTP、RDF等語(yǔ)義網(wǎng)技術(shù)將網(wǎng)絡(luò)上相關(guān)的數(shù)據(jù)資源進(jìn)行關(guān)聯(lián),是從文件網(wǎng)絡(luò)向數(shù)據(jù)網(wǎng)絡(luò)轉(zhuǎn)化的一種優(yōu)化策略,其技術(shù)體系框架如圖1所示。[3]圖書館擁有大量的結(jié)構(gòu)化數(shù)據(jù),國(guó)外圖書館界對(duì)關(guān)聯(lián)數(shù)據(jù)的應(yīng)用已引起了足夠重視并進(jìn)行推廣,比較典型的是美國(guó)國(guó)會(huì)圖書館和瑞典國(guó)家圖書館。目前國(guó)內(nèi)關(guān)于關(guān)聯(lián)數(shù)據(jù)在圖書館應(yīng)用的研究成果較少,筆者查閱了國(guó)內(nèi)外相關(guān)資料,經(jīng)過(guò)一番探索后認(rèn)為,圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理可歸納為關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建、關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)構(gòu)建、關(guān)聯(lián)數(shù)據(jù)的發(fā)布、關(guān)聯(lián)數(shù)據(jù)的瀏覽、關(guān)聯(lián)數(shù)據(jù)的鏈接維護(hù)。

      圖1 關(guān)聯(lián)數(shù)據(jù)的技術(shù)體系

      2 圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理

      2.1 圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建

      圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建是實(shí)現(xiàn)其集成管理的首要環(huán)節(jié)。圖書館創(chuàng)建關(guān)聯(lián)數(shù)據(jù)需要用規(guī)范形式描述內(nèi)容對(duì)象的內(nèi)部結(jié)構(gòu)、描述內(nèi)容的語(yǔ)義(如作者、書名、出版社、內(nèi)含數(shù)據(jù)集和圖表等)。該描述深度取決于所依據(jù)元數(shù)據(jù)格式的豐富程度和內(nèi)容對(duì)象的內(nèi)容深度,描述結(jié)果是依據(jù)元數(shù)據(jù)格式轉(zhuǎn)換的RDF關(guān)聯(lián)記錄。圖書館關(guān)聯(lián)數(shù)據(jù)創(chuàng)建過(guò)程中較有難度的工作是在描述信息中建立彼此內(nèi)容對(duì)象之間的關(guān)聯(lián)描述,只有建立該關(guān)聯(lián)描述,所創(chuàng)建的數(shù)據(jù)才算是關(guān)聯(lián)數(shù)據(jù)。在關(guān)聯(lián)數(shù)據(jù)創(chuàng)建前,圖書館已積累了大量的文獻(xiàn)和電子資源,如何將現(xiàn)有的數(shù)據(jù)資源創(chuàng)建成關(guān)聯(lián)數(shù)據(jù)并在網(wǎng)上發(fā)布,成為當(dāng)前急需解決的問(wèn)題之一。圖書館的數(shù)據(jù)量非常龐大,需要將其放進(jìn)RDF數(shù)據(jù)庫(kù)中,并選擇合適的服務(wù)器作為關(guān)聯(lián)數(shù)據(jù)服務(wù)的前端。一般而言,圖書館關(guān)聯(lián)數(shù)據(jù)的更新頻率相對(duì)較快,那么還需要引入更新機(jī)制,或在請(qǐng)求關(guān)聯(lián)數(shù)據(jù)時(shí)依據(jù)原始數(shù)據(jù)在線生成RDF,但這可能影響用戶的在線連續(xù)訪問(wèn)。在圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建中,還將面臨一些現(xiàn)實(shí)問(wèn)題:詞表的定義和選擇、復(fù)雜數(shù)據(jù)的結(jié)構(gòu)化(RDF化)、數(shù)據(jù)集內(nèi)數(shù)據(jù)關(guān)聯(lián)的自動(dòng)生成等。[4]

      2.2 圖書館關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)構(gòu)建

      圖書館關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)關(guān)系構(gòu)建與圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建是兩個(gè)不同的過(guò)程,二者存在本質(zhì)的區(qū)別。關(guān)聯(lián)數(shù)據(jù)通過(guò)“鏈接”來(lái)為用戶開展服務(wù),并通過(guò)鏈接實(shí)現(xiàn)不同數(shù)據(jù)集的關(guān)聯(lián)。[5]對(duì)于圖書館來(lái)說(shuō),關(guān)聯(lián)數(shù)據(jù)關(guān)聯(lián)關(guān)系的構(gòu)建是圖書館關(guān)聯(lián)數(shù)據(jù)發(fā)布的前提??梢哉J(rèn)為,圖書館關(guān)聯(lián)數(shù)據(jù)中關(guān)聯(lián)關(guān)系的構(gòu)建是圖書館關(guān)聯(lián)數(shù)據(jù)集成管理的核心環(huán)節(jié)。圖書館關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)構(gòu)建主要采取兩種方式:映射關(guān)聯(lián)和非映射關(guān)聯(lián),可采取三種常見的自動(dòng)關(guān)聯(lián)構(gòu)建方法:基于圖相似度的映射、基于規(guī)則的關(guān)聯(lián)構(gòu)建和基于實(shí)體的文本映射?;趫D相似度的映射是對(duì)單一三元組比較方法的擴(kuò)展,基于實(shí)體的文本映射是實(shí)現(xiàn)自動(dòng)關(guān)聯(lián)的基本方法,這兩種方法具有通用性,但創(chuàng)建的關(guān)系類型比較有限。而基于規(guī)則的關(guān)聯(lián)構(gòu)建能創(chuàng)建較復(fù)雜的關(guān)系,但要依賴特定的相關(guān)規(guī)則和數(shù)據(jù)模型。對(duì)圖書館的書目數(shù)據(jù)來(lái)說(shuō),館員希望通過(guò)識(shí)別和確定不同對(duì)象間的屬性關(guān)系來(lái)構(gòu)建較為豐富的關(guān)聯(lián)關(guān)系。以瑞典聯(lián)合目錄LIBRIS系統(tǒng)為例,該系統(tǒng)通過(guò)關(guān)聯(lián)數(shù)據(jù)發(fā)布了600多萬(wàn)條書目數(shù)據(jù),其規(guī)范文檔數(shù)據(jù)集的類型為組織機(jī)構(gòu)名稱或人名,URI為http://libris.db.se/resource/auth/<number>;其書目數(shù)據(jù)類型為書目,URI為 http://libris.kb.se/resource/bib/<number>。[6]

      2.3 圖書館關(guān)聯(lián)數(shù)據(jù)的發(fā)布

      如何將已有的數(shù)據(jù)或新生成的數(shù)據(jù)發(fā)布為RDF三元組,是關(guān)聯(lián)數(shù)據(jù)發(fā)布的核心,通常需考慮待發(fā)布數(shù)據(jù)的規(guī)模、更新頻率和當(dāng)前的存儲(chǔ)方式。根據(jù)關(guān)聯(lián)數(shù)據(jù)的基本原理,在Web中發(fā)布關(guān)聯(lián)數(shù)據(jù)必須具有可參照的HTTP或URI標(biāo)識(shí)。一般來(lái)說(shuō),RDF數(shù)據(jù)的生成方式主要有4種:生成并發(fā)布靜態(tài)RDF文件,通過(guò)其他類型信息的RDF轉(zhuǎn)換實(shí)現(xiàn),通過(guò)關(guān)系型數(shù)據(jù)庫(kù)的RDF轉(zhuǎn)換實(shí)現(xiàn),通過(guò)對(duì)已有應(yīng)用或Web API的封裝實(shí)現(xiàn)。[7]

      我們首先應(yīng)該弄清楚圖書館大規(guī)模的關(guān)聯(lián)數(shù)據(jù)集是怎么發(fā)布到網(wǎng)上的。對(duì)于儲(chǔ)存在關(guān)系型數(shù)據(jù)庫(kù)里的數(shù)據(jù),可用D2R Server將數(shù)據(jù)轉(zhuǎn)換成RDF格式,并發(fā)布到網(wǎng)上。[7]關(guān)聯(lián)數(shù)據(jù)的發(fā)布步驟如下:(1)從網(wǎng)上下載,然后安裝D2R Server服務(wù)軟件;(2) 用D2R Server軟件將關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)自動(dòng)生成D2RQ mapping映像文件(包括RDF格式數(shù)據(jù)):(3) 根據(jù)已有的詞匯集對(duì)自動(dòng)生成的D2RQ mapping文件進(jìn)行手工改動(dòng),對(duì)D2RQ mapping文件中的資源用網(wǎng)絡(luò)中已有的資源代替;(4)把圖書館的關(guān)聯(lián)數(shù)據(jù)集發(fā)布到網(wǎng)上,并通過(guò)RDF links與網(wǎng)上其他數(shù)據(jù)集相連,使瀏覽器或搜索器能搜索和瀏覽圖書館發(fā)布的數(shù)據(jù)。除此之外,還有其他的關(guān)聯(lián)數(shù)據(jù)發(fā)布工具,如:Virtuoso Universal Server,較多的關(guān)聯(lián)數(shù)據(jù)集通過(guò)Virtuoso U-niversal Server轉(zhuǎn)換并發(fā)布。舉例來(lái)說(shuō),美國(guó)國(guó)會(huì)圖書館以簡(jiǎn)單知識(shí)組織系統(tǒng)(SKOS) 格式將國(guó)會(huì)標(biāo)題表(LCSH)全部關(guān)聯(lián)數(shù)據(jù)化,并且提供LCSH詞表的下載,成為關(guān)聯(lián)數(shù)據(jù)在圖書館應(yīng)用的成功范例。除了將權(quán)威文檔LCSH發(fā)布為關(guān)聯(lián)數(shù)據(jù)外,還創(chuàng)建了不同資源之間的關(guān)聯(lián)(如LCSH與瑞典聯(lián)合目錄LIBRIS關(guān)聯(lián))。可以認(rèn)為,美國(guó)國(guó)會(huì)圖書館的做法可作為國(guó)際上其他圖書館的成功實(shí)踐范例,已經(jīng)覺察到了圖書館發(fā)布關(guān)聯(lián)數(shù)據(jù)的較大益處。

      2.4 圖書館關(guān)聯(lián)數(shù)據(jù)的瀏覽

      圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理另外需解決的問(wèn)題是怎樣在網(wǎng)上瀏覽圖書館的關(guān)聯(lián)數(shù)據(jù)。瀏覽關(guān)聯(lián)數(shù)據(jù)需要專門的瀏覽器或插件,目前主要的瀏覽器有Open Link RDF Browser, Tabulator Browser, Zitgist RDF Browser等。實(shí)驗(yàn)結(jié)果表明,當(dāng)多個(gè)關(guān)系頻繁地進(jìn)行連接操作時(shí),關(guān)聯(lián)數(shù)據(jù)分布樹CDDT(conjunction data distribution tree)能提高整個(gè)分布式系統(tǒng)的查詢性能。所謂關(guān)聯(lián)數(shù)據(jù)分布樹,可以這樣理解:如果某一關(guān)系聯(lián)系圖中不存在回路,則該關(guān)系圖就構(gòu)成一個(gè)關(guān)聯(lián)數(shù)據(jù)分布樹,如果該關(guān)系聯(lián)系圖中存在回路,則刪除最少的邊使得該關(guān)系聯(lián)系圖中不存在回路。當(dāng)刪除一個(gè)聯(lián)系時(shí),將其中的一個(gè)關(guān)系復(fù)制到另一個(gè)關(guān)系一端,使其構(gòu)成新的聯(lián)系,該新的聯(lián)系是被刪除聯(lián)系的一個(gè)副本。關(guān)聯(lián)數(shù)據(jù)分布樹如圖2所示,在CDDT中其中的一個(gè)關(guān)系也可稱為一個(gè)結(jié)點(diǎn),刪除了U、S之間的一條邊,關(guān)系R為CDDT的根結(jié)點(diǎn),其中和U相連的關(guān)系為S的一個(gè)副本。[8]

      圖2 關(guān)聯(lián)數(shù)據(jù)分布樹示意圖

      2.5 圖書館關(guān)聯(lián)數(shù)據(jù)的鏈接維護(hù)

      隨著圖書館關(guān)聯(lián)數(shù)據(jù)集的不斷增多,不同數(shù)據(jù)集之間的關(guān)系將會(huì)越來(lái)越復(fù)雜。任何一個(gè)數(shù)據(jù)集的狀態(tài)發(fā)生變化,都有可能導(dǎo)致與之相鏈接的其他數(shù)據(jù)集發(fā)生訪問(wèn)故障。因此,圖書館關(guān)聯(lián)數(shù)據(jù)集之間的鏈接關(guān)系建立之后,對(duì)這些動(dòng)態(tài)變化的鏈接進(jìn)行及時(shí)、有效的維護(hù)是發(fā)揮關(guān)聯(lián)數(shù)據(jù)的作用、維系數(shù)據(jù)集之間鏈接關(guān)系的重要手段,也是體現(xiàn)關(guān)聯(lián)數(shù)據(jù)價(jià)值的重要保證。一般認(rèn)為,關(guān)聯(lián)數(shù)據(jù)鏈接的狀態(tài)主要有5種:初態(tài)、不變、消失、斷鏈、新鏈接。由源數(shù)據(jù)集到目標(biāo)數(shù)據(jù)集的鏈接建立后,需要采取一定的方法對(duì)其進(jìn)行維護(hù),包括及時(shí)修補(bǔ)斷鏈、刪除已消失的鏈接、建立新鏈接等。有關(guān)研究表明,主要有三種動(dòng)態(tài)鏈接的維護(hù)方法:基于WOD-LMP協(xié)議的方法要求鏈接雙方都遵守WOD-LMP協(xié)議(是專用的關(guān)聯(lián)數(shù)據(jù)鏈接維護(hù)協(xié)議);基于主動(dòng)監(jiān)測(cè)機(jī)制的方法對(duì)目標(biāo)數(shù)據(jù)集的要求較低,只需要提供SPARQL查詢接口或支持RDF堆下載即可;[9]基于更新通知的方法適用于目標(biāo)數(shù)據(jù)集具有數(shù)據(jù)更新通知機(jī)制的情況,需要針對(duì)目標(biāo)數(shù)據(jù)集的數(shù)據(jù)更新通知機(jī)制采取相應(yīng)的更新數(shù)據(jù)獲取方法。相對(duì)而言,第二種方法的適應(yīng)性較其他方法的適應(yīng)性要強(qiáng)。

      3 圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理主要注意事項(xiàng)

      3.1 關(guān)聯(lián)數(shù)據(jù)的效用問(wèn)題

      隨著美國(guó)、瑞典等國(guó)家的圖書館將自身關(guān)聯(lián)數(shù)據(jù)發(fā)布到Web網(wǎng)上的實(shí)踐,其他國(guó)家的圖書館也展開了發(fā)布關(guān)聯(lián)數(shù)據(jù)的嘗試。但是,也可能出現(xiàn)關(guān)聯(lián)數(shù)據(jù)斷鏈的問(wèn)題,因?yàn)殛P(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)中的數(shù)據(jù)保持著更新狀態(tài),新的數(shù)據(jù)不斷增加,舊的數(shù)據(jù)需要更改或刪除,數(shù)據(jù)之間的鏈接也發(fā)生變化。數(shù)據(jù)源之間的關(guān)聯(lián)可能產(chǎn)生斷鏈,這將引起關(guān)聯(lián)數(shù)據(jù)的應(yīng)用發(fā)生錯(cuò)誤,并導(dǎo)致關(guān)聯(lián)數(shù)據(jù)失效。目前的一般做法是將該問(wèn)題暫時(shí)忽略,當(dāng)在具體應(yīng)用中發(fā)現(xiàn)斷鏈時(shí)再加以解決。雖然Web網(wǎng)絡(luò)結(jié)構(gòu)允許一定數(shù)量死鏈接的存在,但過(guò)多的死鏈接無(wú)疑會(huì)影響數(shù)據(jù)網(wǎng)絡(luò)的使用效率。圖書館應(yīng)該保證數(shù)據(jù)源關(guān)聯(lián)關(guān)系的有效性,還應(yīng)建立關(guān)聯(lián)數(shù)據(jù)的監(jiān)測(cè)和修正機(jī)制,以維護(hù)關(guān)聯(lián)數(shù)據(jù)的效用。

      3.2 關(guān)聯(lián)數(shù)據(jù)的安全問(wèn)題

      數(shù)據(jù)安全對(duì)圖書館來(lái)說(shuō)特別重要,一旦丟失書目數(shù)據(jù)或流通數(shù)據(jù)等,后果將是特別嚴(yán)重的。那么圖書館創(chuàng)建并發(fā)布了關(guān)聯(lián)數(shù)據(jù),是不是就意味著萬(wàn)無(wú)一失了呢?答案是否定的。盡管關(guān)聯(lián)數(shù)據(jù)依賴較完善的鏈接保存策略和模式映射,但關(guān)聯(lián)數(shù)據(jù)的安全問(wèn)題仍是圖書館界擔(dān)憂的主要議題之一。關(guān)聯(lián)數(shù)據(jù)的理想目標(biāo)是將目前的Web資源通過(guò)鏈接關(guān)系打造成為一個(gè)全球共享數(shù)據(jù)庫(kù),這為Web服務(wù)帶來(lái)了極大的便利,但同時(shí)也帶來(lái)諸多安全障礙,如用戶的個(gè)人數(shù)據(jù)有可能被泄漏,無(wú)意中可能侵犯別人的知識(shí)產(chǎn)權(quán)和網(wǎng)絡(luò)隱私權(quán)。因此,圖書情報(bào)界應(yīng)高度重視關(guān)聯(lián)數(shù)據(jù)的安全問(wèn)題,首先要求用戶具有良好的安全意識(shí),其次依靠技術(shù)手段與法律方式相結(jié)合,共同確保圖書館關(guān)聯(lián)數(shù)據(jù)的安全,更好地為讀者服務(wù),提升圖書館的社會(huì)價(jià)值。

      [1]Wikipedia.Linked data[EB/OL].[2011-09-28].http∶//en.wikipedia.org/wiki/linked_data.

      [2]沈志宏,張曉林.關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2010(11):1-9.

      [3] Passant A,etal.Meaningofatag:acollaborativeapproach tobridge the gap between taggingand linked data[C]//Proceedingsofthewww2008workshop Linked Dataonthe Web (LDOW2008).Beijing:China,2008.

      [4]黃永文.關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2010(5):1-7.

      [5]Malmsten M.Making a library catalogue part of the semantic web [EB/OL].[2011-09-28].http∶//dcpa pers.dublincore.org/ojs/pubs/article/view/927/923.

      [6]白海燕.關(guān)聯(lián)數(shù)據(jù)及DBPedia實(shí)例分析[J].現(xiàn)代圖書情報(bào)技術(shù),2010(3):33-39.

      [7]譚潔清.關(guān)聯(lián)數(shù)據(jù)的簡(jiǎn)介與進(jìn)展[J].信息與電腦,2011(1):103,106.

      [8]陳慶奎,黃雨田.關(guān)聯(lián)數(shù)據(jù)分布樹在分布式查詢中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(15):4009-4012.

      [9]郭少友.關(guān)聯(lián)數(shù)據(jù)的動(dòng)態(tài)鏈接維護(hù)研究[J].圖書情報(bào)工作,2011,55(17):112-116.

      猜你喜歡
      關(guān)聯(lián)圖書館
      不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
      圖書館
      文苑(2019年20期)2019-11-16 08:52:12
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      時(shí)間重疊的圖書館
      文苑(2018年17期)2018-11-09 01:29:40
      圖書館
      奇趣搭配
      基于廣義關(guān)聯(lián)聚類圖的分層關(guān)聯(lián)多目標(biāo)跟蹤
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      飛躍圖書館
      去圖書館
      林西县| 乐陵市| 红安县| 昭通市| 梁山县| 溧阳市| 新津县| 昌黎县| 清水县| 三门峡市| 楚雄市| 天等县| 宁夏| 屏边| 中超| 靖边县| 广平县| 梁河县| 聂拉木县| 青阳县| 伊川县| 长岛县| 固始县| 井研县| 北碚区| 威远县| 临澧县| 马公市| 驻马店市| 南郑县| 抚州市| 安福县| 大渡口区| 玉环县| 湖口县| 淳化县| 伊宁市| 临泉县| 兴业县| 邻水| 滨州市|