張 燕
(邯鄲市圖書館,河北 邯鄲 056002)
張 燕 女,1975年生。本科學(xué)歷,館員。研究方向:自動化。
關(guān)聯(lián)數(shù)據(jù)是由“萬維網(wǎng)之父”——英國人蒂姆·伯納斯·李(Tim Berners-Lee)在2006年所提出的一種發(fā)布數(shù)據(jù)方式,關(guān)聯(lián)數(shù)據(jù)作為一種可以將各種數(shù)據(jù)、知識和信息進行相互聯(lián)接的規(guī)范,被國際互聯(lián)網(wǎng)協(xié)會推薦使用。一方面,創(chuàng)建關(guān)聯(lián)數(shù)據(jù)這一發(fā)布數(shù)據(jù)方式并不是簡單地為了創(chuàng)建能夠讓人們讀懂的文檔,更重要的是創(chuàng)建計算機能夠理解的一種具備結(jié)構(gòu)化、富有語義的數(shù)據(jù)組織結(jié)構(gòu)。另一方面,關(guān)聯(lián)數(shù)據(jù)注重的是數(shù)據(jù)之間的關(guān)聯(lián)性、交互性及共享性,它可以將同一機構(gòu)下的不同系統(tǒng)無法關(guān)聯(lián)的數(shù)據(jù)或者是來自不同機構(gòu)數(shù)據(jù)庫的數(shù)據(jù)進行相互關(guān)聯(lián)。這樣對于任意數(shù)據(jù)庫,它既可以被其他數(shù)據(jù)庫數(shù)據(jù)鏈接,也可以將自身數(shù)據(jù)鏈接到其他數(shù)據(jù)庫數(shù)據(jù)之中。
2009年,蒂姆·伯納斯·李在 TED(Technology,Entertainment,Design)大會上發(fā)表了關(guān)聯(lián)數(shù)據(jù)創(chuàng)建時所必須遵守的4條原則:①將任何事物的名稱使用URI進行標識;②確保任何人都可以由HTTP URI訪問這些標識;③在標識被訪問時,提供訪問人有用的信息;④提供給訪問人盡可能多的URI,用來幫助發(fā)展更多的信息。
由以上原則可知,用戶可以訪問、關(guān)聯(lián)并再次利用關(guān)聯(lián)數(shù)據(jù),而且無論是網(wǎng)頁、RDF等傳統(tǒng)文件還是圖片、音像等特殊文件都可以用URI進行標識。與目前的HTML相比,URI除了能夠?qū)?shù)據(jù)資源進行標識、定位外,還能夠據(jù)此關(guān)聯(lián)到網(wǎng)絡(luò)上的其他數(shù)據(jù)資源,進而形成新應(yīng)用(見圖1)。
作為國際互聯(lián)網(wǎng)協(xié)會所推薦的一種發(fā)布、聯(lián)接各種數(shù)據(jù)和信息方式的關(guān)聯(lián)數(shù)據(jù),并不是簡單的全文檢索,而是能夠在互聯(lián)網(wǎng)上進行數(shù)據(jù)層面的檢索,這種檢索所具備的基礎(chǔ)性、徹底性及多功能性正在使萬維網(wǎng)發(fā)生著深刻的變革。現(xiàn)在,諸如《紐約時報》、BBC等一些大型企業(yè)、媒體及政府部門已經(jīng)開始著手將他們所擁有的數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù)。
關(guān)聯(lián)數(shù)據(jù)最為典型的應(yīng)用是2007年啟動的Open Linked Data項目。這一項目的目標是將目前已經(jīng)公開存在的數(shù)據(jù)資源進行整合,并遵循關(guān)聯(lián)數(shù)據(jù)的原則將其轉(zhuǎn)化為RDF,在HTTP傳輸方式下改善原有數(shù)據(jù)的網(wǎng)絡(luò)結(jié)構(gòu)。目前,該項目還處在進行之中,并且已經(jīng)有美國國會圖書館、BBC等組織參與此項目。
圖書館作為整合、搜集、處理信息資源的專業(yè)機構(gòu),更應(yīng)該注重關(guān)聯(lián)數(shù)據(jù)的應(yīng)用進展,積極參與到關(guān)聯(lián)數(shù)據(jù)的建設(shè)之中。2010年,由萬維網(wǎng)聯(lián)盟成立的圖書館關(guān)聯(lián)數(shù)據(jù)孵化小組(Library Linked Data Incubator Group),能夠?qū)D書館的主題、編目及MARC等數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù)。目前,瑞典國家圖書館、美國國會圖書館分別將各自的館級書目、主題標目LCSH轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù);德國國家圖書館關(guān)聯(lián)了館內(nèi)的權(quán)威資源;OCLC則關(guān)聯(lián)了虛擬權(quán)威檔案信息及杜威分類法。而國內(nèi)圖書館對于關(guān)聯(lián)數(shù)據(jù)的研究還處在初級階段,主要是對國外關(guān)聯(lián)數(shù)據(jù)研究的闡述及介紹,因此,我國應(yīng)加強對于關(guān)聯(lián)數(shù)據(jù)的綜合研究,使其更好地應(yīng)用于我國圖書館及其他領(lǐng)域。
圖1 基于關(guān)聯(lián)數(shù)據(jù)的信息聚合
與傳統(tǒng)數(shù)據(jù)庫相比,關(guān)聯(lián)數(shù)據(jù)更具開放性?;陉P(guān)聯(lián)數(shù)據(jù)的圖書館知識服務(wù),允許讀者通過某一點關(guān)聯(lián)到更廣泛的信息資源(見圖2)。圖書館作為知識服務(wù)的主要機構(gòu),要站在讀者的角度為其服務(wù),所提供的知識服務(wù)內(nèi)容,不應(yīng)僅僅局限于本館館藏已存在的信息數(shù)據(jù)資源,可將本館館藏數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù),在為讀者提供館外數(shù)據(jù)資源的前提下,爭取將越來越多的讀者吸引到圖書館。
圖2 關(guān)聯(lián)數(shù)據(jù)的數(shù)據(jù)共享
知識發(fā)現(xiàn)是一個復(fù)雜而系統(tǒng)的過程,在知識發(fā)現(xiàn)的過程中,需要對眾多的數(shù)據(jù)庫資源、數(shù)據(jù)知識庫進行深層次分析,以探究數(shù)據(jù)之間所存在的潛在關(guān)聯(lián)及規(guī)則。而關(guān)聯(lián)數(shù)據(jù)的出現(xiàn)則對知識發(fā)現(xiàn)服務(wù)的發(fā)展起到了促進作用,在關(guān)聯(lián)數(shù)據(jù)的作用下,可以將圖書館內(nèi)部館藏資源及圖書館外部資源有效關(guān)聯(lián),為讀者提供圖書館以外的知識資源,使讀者發(fā)現(xiàn)資源越來越便捷,提高圖書館知識發(fā)現(xiàn)服務(wù)的質(zhì)量。
一方面,關(guān)聯(lián)數(shù)據(jù)可以將不同領(lǐng)域、不同系統(tǒng)、不同數(shù)據(jù)庫的數(shù)據(jù)進行相互關(guān)聯(lián),使得網(wǎng)絡(luò)中的任何數(shù)據(jù)、信息、資源實現(xiàn)共享成為可能。通過數(shù)據(jù)、信息、知識的網(wǎng)絡(luò)共享關(guān)聯(lián),可以讓圖書館知識服務(wù)館員及讀者獲得豐富的檢索結(jié)果,提高知識服務(wù)的質(zhì)量及效率。另一方面,共享網(wǎng)絡(luò)中的關(guān)聯(lián)數(shù)據(jù)并不是固定不變的,在關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)的發(fā)展過程中,必定涉及新的關(guān)聯(lián)數(shù)據(jù)的加入及舊數(shù)據(jù)的淘汰,此外,還會包括數(shù)據(jù)關(guān)系的變化。所以說,關(guān)聯(lián)數(shù)據(jù)雖然在一定程度上解決了異構(gòu)資源的整合問題,但是也使數(shù)據(jù)資源管理變得日趨復(fù)雜。
關(guān)聯(lián)數(shù)據(jù)的最大優(yōu)點是能夠解決異構(gòu)資源的整合,將來自不同數(shù)據(jù)庫的全面相關(guān)數(shù)據(jù)信息提供給讀者。這使得讀者面對指數(shù)級增長的數(shù)據(jù)信息時,往往需要的不再是簡單的文獻檢索及傳遞服務(wù),而是需要館員在基于海量的數(shù)據(jù)信息之上為他們提供更為專業(yè)、更為具體、更具指導(dǎo)性的信息服務(wù),這就對圖書館知識服務(wù)方式提出了更高的要求。
對于單一圖書館而言,其內(nèi)部館藏資源是有限的。但是經(jīng)過對數(shù)據(jù)資源進行關(guān)聯(lián)之后,其知識資源體系可以擴展到整個網(wǎng)絡(luò)。加強建設(shè)以關(guān)聯(lián)數(shù)據(jù)為核心的知識服務(wù)資源體系,可以保證讀者發(fā)現(xiàn)新知識資源的方便、快捷、高效性,也可以滿足讀者對于新興科研主題、時事熱點等問題的咨詢追蹤。
對于關(guān)聯(lián)數(shù)據(jù),雖然其包括了來自不同數(shù)據(jù)庫的異構(gòu)數(shù)據(jù)資源,方便了讀者對于館外資源的使用,但是讀者更希望能夠享受到“一站式”服務(wù),這就要求圖書館在館內(nèi)數(shù)據(jù)關(guān)聯(lián)的基礎(chǔ)上,加強對館外異構(gòu)關(guān)聯(lián)數(shù)據(jù)的組織、整合,使這些數(shù)據(jù)資源得到形式上的統(tǒng)一。
3.2.1 加強對館內(nèi)數(shù)據(jù)的關(guān)聯(lián),將圖書館內(nèi)部數(shù)據(jù),包括圖書館檢索系統(tǒng)、管理系統(tǒng)、參考咨詢系統(tǒng)等數(shù)據(jù)進行關(guān)聯(lián)整合,方便讀者使用。同時,在這些數(shù)據(jù)的基礎(chǔ)上,了解讀者需求,把握館藏資源的利用情況。
3.2.2 加強對館內(nèi)、館外數(shù)據(jù)的關(guān)聯(lián)整合,將讀者所需知識資源轉(zhuǎn)換成為多層語義互聯(lián)及單一語義映像的數(shù)據(jù)資源,將傳統(tǒng)的文獻層次的整合加深到邏輯關(guān)系、語義方面的整合。
對基于關(guān)聯(lián)數(shù)據(jù)的圖書館知識服務(wù)而言,其能夠整合其他數(shù)據(jù)庫的異構(gòu)數(shù)據(jù)資源,對于讀者的檢索結(jié)果起到很好的擴充作用。對此,我們要在海量知識數(shù)據(jù)資源的基礎(chǔ)上,深入理解讀者需求,明確知識服務(wù)目標,豐富知識服務(wù)方式,提高知識服務(wù)質(zhì)量。為此,我們可以通過團隊合作、服務(wù)集成及系統(tǒng)集成等不同方式,根據(jù)讀者實際需求的變化靈活選擇知識服務(wù)內(nèi)容,合理組織、安排相關(guān)知識服務(wù)工作。
在建設(shè)以關(guān)聯(lián)數(shù)據(jù)為核心的知識資源服務(wù)體系過程中,不僅需要對關(guān)聯(lián)數(shù)據(jù)進行重組、整合、分析,而且需要圖書館內(nèi)部的智能檢索服務(wù)、推送服務(wù)、導(dǎo)航服務(wù)等技術(shù)的支持,這一切都離不開專業(yè)的技術(shù)團隊。這一團隊不僅要解決關(guān)聯(lián)數(shù)據(jù)的嵌入、一站式服務(wù)的開展等問題,還要把握圖書館發(fā)展現(xiàn)狀及未來的發(fā)展趨勢,創(chuàng)新圖書館的服務(wù)方式。
在圖書館知識服務(wù)開展過程中要對多種媒體資源進行分析、處理及整合,以尋求讀者真正需求的知識信息;還要將這些信息合理、有序地推送到讀者面前,處理讀者咨詢過程中出現(xiàn)的各種問題,這些過程都需要具備較高的計算機操作能力、良好的溝通能力及圖書情報知識的高素質(zhì)館員的參與。毋庸置疑,團隊的力量比單人力量更為強大,決策更為明智,高素質(zhì)的館員團隊是圖書館知識服務(wù)的主角。
[1] 陸覺民,馬國棟,鄭宇.基于數(shù)據(jù)挖掘技術(shù)的圖書館流通數(shù)據(jù)的關(guān)聯(lián)分析[J].現(xiàn)代情報,2009(9):108-110.
[2] 馬國棟.基于WEKA的高校圖書館流通數(shù)據(jù)的關(guān)聯(lián)分析[J].圖書館工作與研究,2010(12):42-45.
[3] 徐華.關(guān)聯(lián)數(shù)據(jù)在國外圖書館中的應(yīng)用及其借鑒意義[J].圖書館學(xué)研究,2011(16):87-89.
[4] 孫鴻燕.圖書館關(guān)聯(lián)數(shù)據(jù)的綜合管理及其實現(xiàn)[J].圖書館學(xué)研究,2011(23):51-54.
[5]劉志勇.關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘在圖書館藏書建設(shè)中的應(yīng)用研究[J].電子設(shè)計工程,2011(21):62-64.
[6] 朱俊波,等.圖書館元數(shù)據(jù)拓展和關(guān)聯(lián)著錄方法研究[J].情報雜志,2011(8):109-112.
[7] 李琳.關(guān)聯(lián)數(shù)據(jù)在圖書館界的應(yīng)用與挑戰(zhàn)[J].圖書與情報,2011(4):58-61.