●羅 錚,周群英(嘉興職業(yè)技術學院 圖書館,浙江 嘉興 314036)
2006年,被譽為互聯網之父的Tim Berners-Lee在《關聯數據構建筆記》等一系列文章中分析了Web的發(fā)展和演化,提出發(fā)展數據網絡的思想,而數據網絡的核心和關鍵則是關聯數據(Linkeddata)。[1]自關聯數據的概念提出以來,得到了廣泛認同和快速發(fā)展,并受到圖書館、政府部門、企業(yè)等多方面的重視和關注。關聯數據對于我國圖書情報界來說尚屬于較新穎的研究領域;筆者通過檢索發(fā)現,我國尚未有關于公共圖書館應用關聯數據的研究文獻。那么何謂關聯數據?一般比較認同維基百科給出的定義:關聯數據是語義網的主題之一,描述了通過可鏈接的URI方式來發(fā)布、分享、連接Web中各類資源的方法。[2]我國學者劉煒先生認為,關聯數據強調建立已有信息的語義標注和實現數據之間的關聯,具有框架簡潔、標準化、自助化、去中心化、低成本的特點。[3]關聯數據的基本原理是用一種可利用分布數據集及其自主內容格式,基于標準的知識表示與檢索協議、可逐步擴展的機制來實現可動態(tài)關聯的知識對象網絡,并支持在此基礎上的知識組織和知識發(fā)現。因此,關聯數據對于公共圖書館的知識組織將起到一定的作用。
圖書館擁有大量的結構化數據,國外圖書館界對于關聯數據的應用已引起了足夠重視并進行大力推廣,比較典型的是美國國會圖書館和瑞典國家圖書館。美國國會圖書館以簡單知識組織系統(SKOS)格式將國會標題表(LCSH)全部關聯數據化,并且提供LCSH詞表的下載,成為關聯數據應用的成功范例,推動了關聯數據在全世界的實用。美國國會圖書館除了將權威文檔LCSH發(fā)布為關聯數據外,還要創(chuàng)建不同資源之間的關聯(如LCSH與瑞典聯合目錄LIBRIS進行關聯)。另外,美國國會圖書館的其他詞表,如:國會圖書館分類法、人名規(guī)范文檔等,都可以轉化為以RDF表示的關聯數據,這就為圖書館數據的發(fā)布提供了很好的條件。可以認為,美國國會圖書館已經看到了使用關聯數據的潛在好處,如降低服務器的負載,其做法可以作為國際上其他圖書館的實踐范例。瑞典國家圖書館早在 2008年便將瑞典聯合目錄(LIBRIS)發(fā)布為關聯數據,為大學圖書館和公共圖書館、博物館和檔案館提供在線編目服務。LIBRIS是世界上第一個被整體發(fā)布為關聯數據的聯合目錄,主要由瑞典國家圖書館負責管理,開放其200多個成員館的大約650萬條書目記錄、20萬條規(guī)范文檔記錄。瑞典國家圖書館已經開始創(chuàng)建從聯合目錄到維基百科(DBpedia)的鏈接,為圖書館界開展關聯數據的發(fā)布及應用提供了寶貴的經驗和思路。
關聯數據不但減輕了Web網絡中整合分布式異構數據源的復雜性,同時也推動了圖書館對關聯數據的新應用。關聯數據對于圖書館在Web上發(fā)布書目數據和規(guī)范數據具有重要意義,與網絡時代的圖書情報工作關系非常密切,是互聯網發(fā)展到語義網時代,對網上資源和數字對象進行“編目”和“規(guī)范控制”的基礎性技術,是圖書館進行信息資源發(fā)布和建設的核心技術之一。如上文所述,目前國際上已經有一些圖書館開始采用和發(fā)布關聯數據,如瑞典國家圖書館、美國國會圖書館等。在新信息化環(huán)境下,增強公共圖書館的社會服務能力和服務水平顯得尤為迫切。知識發(fā)現對于公共圖書館服務非常重要,關聯數據為公共圖書館的知識發(fā)現服務提供了良好的途徑。關聯數據創(chuàng)造了把公共圖書館的知識和外部世界相互連接起來的機會,可以增強和擴展公共圖書館的知識發(fā)現平臺,改善公共圖書館的服務面貌,從而提升其社會價值。我國公共圖書館界也應該重視這一技術,及早投入一定的資源和人力進行研究開發(fā)和應用推廣,使公共圖書館大量的權威數據在互聯網上占據一席之地。
公共圖書館歷來就是學術研究的重要陣地之一。特別是近幾年來在公共圖書館設立碩士、博士學位授權點,科研成果不斷增多,開展的學術交流活動也不斷增加。公共圖書館越來越多地參與出版和學術交流過程中不同階段的活動。例如,聯絡館員幫助研究者發(fā)現他們研究成果的引文影響力;同樣,圖書館員也開發(fā)和利用機構倉儲系統來幫助機構保存、管理和再利用那些已經出版的和沒有出版的研究資料。目前,已經有一些機構倉儲軟件開始支持語義服務和關聯數據,通過為倉儲內的資源提供統一的標識以及資源之間的關系,實現對語義數據的存儲和語義服務。另外,類似于其他公共圖書館資源集合,機構倉儲也需要考慮系統的互操作性,關聯數據將會在應用系統的互操作性方面提供更好的支持。在學術研究過程中,用戶希望可以看到研究成果被引用的情況和再利用的情況,希望能夠通過研究出版物找到原始文獻、原始數據以及發(fā)現更多的作者。如果借助于關聯數據,公共圖書館可以幫助用戶發(fā)現更多關于作者的信息以及他們如何得到資助的信息,允許用戶下載原始的研究數據。
美國國會圖書館以簡單知識組織系統格式將國會標題表關聯數據化;瑞典聯合目錄使用的詞匯表包含了元數據、簡單知識組織和書目本體等,這一點對于我們具有較大的啟發(fā):我國公共圖書館界也可以利用關聯數據更好地實現知識單元的組織。國外的一些圖書館常常通過實施資源發(fā)現服務來擴展其目錄檢索界面,瀏覽動態(tài)更新的結果,展示更多的館藏信息。關聯數據可以為擴展公共圖書館的書目信息提供結構化的數據基礎,為用戶提供新的知識訪問服務;關聯數據允許公共圖書館關聯到更廣泛的信息資源,不僅可以幫助用戶判斷是否是所需要的圖書、期刊資源,還可以幫助用戶獲取圖書館以外的信息。公共圖書館還可以將自己的資源發(fā)布為關聯數據,使用戶再鏈接返回到圖書館。關聯數據為公共圖書館提供了知識資源之間的鏈接,使發(fā)現和共享網絡中不同類型的知識資源成為可能。關聯數據在數據層建立了鏈接機制,數據的結構信息被很好地進行描述,并通過URI來確保機器能夠自動鏈接各種數據,為信息聚合的智能化和自動化提供了基礎。公共圖書館可利用關聯數據源中的關聯關系,實現有序地組織、集成和關聯知識單元,進行知識內容的關聯和深層展示,實現多類型知識單元的整合和集成,為用戶提供多層次的知識關聯集成服務。
在現代信息網絡飛速發(fā)展的時代,公共圖書館迫切需要拓展和豐富信息服務的手段和方式,增強自身的競爭力,而知識集成和資源發(fā)現已成為圖書館領域的關鍵問題之一。公共圖書館應該加快提高資源發(fā)現內容和傳遞服務質量的步伐,以幫助用戶實現資源發(fā)現的相關性和便捷性;而關聯數據正是更好地實現資源發(fā)現的途徑之一。關聯數據創(chuàng)造了把公共圖書館的資源和外部世界相互連接起來的機會,可以增強和擴展公共圖書館的資源發(fā)現平臺,以及支持公共圖書館在學術交流環(huán)境下作為創(chuàng)建者和出版者的作用。在關聯數據云圖中,有許多關聯資源可以作為公共圖書館的資源庫和知識庫,可以利用云圖中的關聯開放數據進行公共圖書館資源的擴展和關聯,為用戶提供更豐富、更有意義的檢索結果。公共圖書館不僅只是利用現有的關聯數據,還可以將一些特色數據發(fā)布成關聯數據,增加用戶返回圖書館的途徑。這樣,公共圖書館不但可以擴展其關聯數據,而且增強自身的社會價值。
隨著國際上圖書館將自身關聯數據發(fā)布在Web網上的實踐,越來越多的圖書館也展開了發(fā)布關聯數據的嘗試。但是,問題也隨之出現:關聯數據網絡中的數據并不是一成不變的,新的數據會不斷加入,過時的數據需要修改或刪除,數據之間的鏈接也隨之變化。一旦某個數據源有所變動,數據源之間的關聯可能會產生斷鏈,這會引起關聯數據的應用隨之也發(fā)生錯誤,進而導致關聯數據失效。目前的一般做法是忽略這些問題,當具體的應用發(fā)現斷鏈時再解決。雖然當前的網絡結構允許一定數量死鏈接的存在,但過多的死鏈接將使客戶端發(fā)出大量的無效HTTP請求,從而影響數據網絡的效率。為了降低應用層對斷鏈的處理,公共圖書館對數據源應該保證關聯關系的有效性。同樣,公共圖書館對關聯數據源也應提供監(jiān)測和修正機制,以維護數據參照的完整性。
公共圖書館服務的用戶范圍很廣,類型多樣。如何改善服務質量、使不同的用戶滿意顯得特別重要。從用戶的角度看,關聯數據的最大好處是可以提供多個分布式異構數據源的整合關聯的訪問。關聯數據瀏覽器允許不同的用戶在不同數據源之間進行瀏覽,不過目前在關聯數據的導航和檢索結果顯示方面還不盡人意,需要進一步完善。例如,關聯數據瀏覽器的導航控制應該為用戶提供實體之間的前進和后退功能,關聯數據瀏覽器需要從傳統以文件為中心轉向以實體為中心的瀏覽視圖,改變?yōu)橛脩籼峁梅盏慕嵌群徒裹c。另外,用戶不僅需要查看實體之間的鏈接,還需要方便地分析公共圖書館的數據源。因此,公共圖書館利用關聯數據時應改善用戶界面,提高其交互性能。
[1]伯納斯·李.關聯數據開啟互聯網新紀元[EB/OL]. [2011 互06 互16].http://www.chinaelections.org/NewsInfo.asp?NewsID=169269.
[2]Wikipedia,Linked data [EB/OL]. [2011 互06 互16].http://en.wikipedia.org/wiki/linked_data.
[3]劉煒.關聯數據的意義與實現[EB/OL].[2011-06-16].http://202.114.9.60/dl6/pdf/24pdf.