(國家圖書館 北京 100081)
OPAC是Online Public Access Catalogue的簡稱,國內(nèi)通行的譯法為聯(lián)機公共檢索目錄。OPAC是用戶從圖書館獲取信息的最基本、最通用的途徑,所提供的服務(wù)與功能是全面衡量一個圖書館服務(wù)水平的重要指標。其定義包含幾種要素:一、OPAC的實質(zhì)是書目數(shù)據(jù)的匯集,因此,書目數(shù)據(jù)是OPAC存在的基礎(chǔ);二、OPAC以信息檢索為最基本功能,這一功能的實現(xiàn)決定了OPAC存在的價值;三、OPAC的建設(shè)主體是圖書館,受體為有信息需求的社會公眾,兩者決定了OPAC的發(fā)展方向;四、OPAC的服務(wù)是基于網(wǎng)絡(luò)提供的,因此,OPAC與網(wǎng)絡(luò)的緊密結(jié)合成為它的主要特點之一。
基于OPAC的資源整合是對OPAC系統(tǒng)中的各類資源對象、功能結(jié)構(gòu)以及其間的相互關(guān)系進行融合、類聚,以數(shù)據(jù)為核心,形成一個向全文、目次、文摘、書評、音頻、視頻等各種信息資源擴展的整體的、立體化的、全方位的資源體系?!?〕
整合的目的在于:將各種異構(gòu)資源的數(shù)據(jù)結(jié)構(gòu)、組織方式、檢索方式都隱蔽起來,消除資源來源的差異性,以統(tǒng)一的檢索界面和顯示格式為用戶提供檢索,幫助用戶發(fā)現(xiàn)資源,從而降低檢索難度;消除元數(shù)據(jù)的存儲冗余,加強信息資源的過濾,減少信息污染,提高檢索的準確度,實現(xiàn)對各類資源的優(yōu)化整合;提供統(tǒng)一的集成化數(shù)字資源架構(gòu),提高圖書館管理效率。
知識的發(fā)現(xiàn)與獲取是圖書館用戶最根本的需求,為用戶提供知識服務(wù)是圖書館信息服務(wù)的最終目標,因此,整合的基本原則是通過建立動態(tài)的、有機的關(guān)聯(lián)將獨立的個體轉(zhuǎn)化為一個相互依存的整體,最終構(gòu)建立體的知識網(wǎng)絡(luò)。
OPAC整合的內(nèi)容按照不同的整合方式可分為兩類:一是整合不同來源信息資源。這是對信息資源進行的橫向整合,實質(zhì)是將異構(gòu)系統(tǒng)進行橫向集成,匯集不同平臺上的異構(gòu)數(shù)據(jù)庫,以便讓用戶通過OPAC就可以檢索到自己需要的信息資源,而不論其存在于何處,從而實現(xiàn)信息資源的普遍存取。二是整合不同類型信息資源。這是對信息資源進行的縱向整合,實質(zhì)是通過書目數(shù)據(jù)的整合形成一個向多種類型相關(guān)資源的延伸,達到通過OPAC檢索到書目信息、全文文獻、文摘、書評以及各種音視頻等多媒體的各種相關(guān)資源的目的。
(1)整合書目數(shù)據(jù)與數(shù)字化全文。近年來,國內(nèi)外進行了大量的印本文獻數(shù)字化工作,其中有些項目是由國家圖書館主持,或是多個機構(gòu)跨地區(qū)合作。文獻數(shù)字化是圖書館數(shù)字資源的重要來源,有利于用戶對文獻的利用,但數(shù)字化造成文獻出現(xiàn)了多種載體形式,不對書目數(shù)據(jù)與數(shù)字化全文進行關(guān)聯(lián)將影響圖書館資源的利用率。整合書目數(shù)據(jù)與數(shù)字化全文一般通過建立兩者之間的鏈接關(guān)系實現(xiàn)。國家圖書館制作的數(shù)字化資源存放地點比較固定,其更新、管理、利用都由圖書館統(tǒng)一控制,因此,比較適合通過在書目數(shù)據(jù)中添加856字段的靜態(tài)鏈接技術(shù)實現(xiàn)兩者的關(guān)聯(lián);其他機構(gòu)制作的數(shù)字化資源由于經(jīng)常會有圖書館不可控的數(shù)據(jù)變動,因此,可以考慮通過OpenURL技術(shù)建立動態(tài)鏈接實現(xiàn)兩者關(guān)聯(lián)。
(2)整合圖書書目數(shù)據(jù)與目次數(shù)據(jù)。目次對揭示文獻內(nèi)容、展示文獻結(jié)構(gòu)具有重要的作用,有助于促進目錄查找功能的完善,在全文數(shù)據(jù)庫中還能夠提供閱讀的便利性。因此,對目次的建設(shè)受到數(shù)字資源建設(shè)者的重視。
對目次數(shù)據(jù)的整合可以采取三種方式:一是在書目數(shù)據(jù)中增加目次的信息,這種方式的優(yōu)點是目次信息與書目數(shù)據(jù)關(guān)系密切,方便使用,但不利于對目次數(shù)據(jù)的深度挖掘。二是建設(shè)獨立的目次數(shù)據(jù)庫,這種方式的優(yōu)點是可以對目次數(shù)據(jù)庫進行挖掘、分析,以形成其他的增值產(chǎn)品,為用戶提供更多的知識服務(wù),缺點在于受原數(shù)據(jù)庫數(shù)據(jù)的格式等限制,導(dǎo)出后的數(shù)據(jù)需要投入人力進行清洗。三是通過網(wǎng)絡(luò)采集技術(shù)對網(wǎng)絡(luò)上一些免費的目次信息進行抓取,這種方式可以使圖書館更快更多地為用戶提供目次信息,但網(wǎng)絡(luò)上的這些信息制作簡單,沒有進行質(zhì)量控制,缺乏規(guī)范格式,正確性、完整性往往得不到保證。
(3)整合期刊的書目數(shù)據(jù)、篇名數(shù)據(jù)、數(shù)字化論文全文。對于連續(xù)性資源,篇名級數(shù)據(jù)具有重要的利用價值。在傳統(tǒng)編目中,由于MARC格式平面化的結(jié)構(gòu)及編目系統(tǒng)對記錄長度的限定等因素無法實現(xiàn)對期刊論文內(nèi)容的揭示,影響了書目數(shù)據(jù)功能的實現(xiàn),以O(shè)PAC的期刊書目數(shù)據(jù)為基礎(chǔ)整合期刊論文及數(shù)字化全文,一方面可以完善館藏書目數(shù)據(jù)的功能,另一方面可以按照期刊的結(jié)構(gòu)進行論文的整合,有利于對論文的整序,同時方便對期刊進行系統(tǒng)化的研究。
信息資源來源眾多,不同的機構(gòu)開發(fā)的數(shù)字資源在內(nèi)容、技術(shù)和形式上都有各自的特點,不同的編碼結(jié)構(gòu)和表達方式造就了不同的描述和組織標準,進而導(dǎo)致了檢索途徑和方法的差異,對信息資源進行有序整合相當困難,需要進行深入的研究。
(1)其他圖書館的OPAC。圖書館書目數(shù)據(jù)的發(fā)布、管理、利用都基于OPAC系統(tǒng),OPAC匯集了各個圖書館所有的館藏資源,因此,基于OPAC最基礎(chǔ)的整合是對多個圖書館的書目數(shù)據(jù)進行整合。
整合多個圖書館的OPAC的途徑主要有兩個:一個途徑是通過Z39.50協(xié)議這一國際通用的信息檢索標準協(xié)議實現(xiàn)與網(wǎng)絡(luò)系統(tǒng)數(shù)據(jù)庫應(yīng)用程序之間的通訊,從而實現(xiàn)與其他圖書館在OPAC異構(gòu)平臺上的互檢。Z39.50協(xié)議具有良好的互操作性和強大的功能,采用基于Z39.50的檢索軟件可以同時對多個含有Z39.50服務(wù)器的異構(gòu)平臺數(shù)據(jù)庫進行檢索,實現(xiàn)異構(gòu)圖書館自動化系統(tǒng)之間的開放互聯(lián)。另一個途徑是通過合作共建的形式聯(lián)合各圖書館共同建設(shè)一個統(tǒng)一的OPAC,實現(xiàn)對書目數(shù)據(jù)的統(tǒng)一檢索。這種方式有利于減少圖書館人力物力的消耗,提高書目數(shù)據(jù)的質(zhì)量,歷來是圖書館界進行資源建設(shè)的重要方式。
(2)圖書館外購數(shù)據(jù)庫。圖書館的資源除館藏文獻外,外購的數(shù)據(jù)庫占有很大比重。但是,每個數(shù)據(jù)庫都有各自的數(shù)據(jù)結(jié)構(gòu)、檢索界面、檢索方式、顯示風格,檢索式構(gòu)造規(guī)則、檢索算符、檢索字段等都不盡相同,用戶想找到需要的資源就必須在各個數(shù)據(jù)庫中重復(fù)檢索,在一個圖書館內(nèi),用戶耗費大量的時間和精力也無法保證查準率與檢全率,這一狀況將導(dǎo)致圖書館用戶的流失。因此,應(yīng)通過整合OPAC與外購數(shù)據(jù)庫的資源幫助圖書館用戶簡化檢索過程,實現(xiàn)一站式資源獲取。
(3)出版及發(fā)行機構(gòu)制作的元數(shù)據(jù)。出版社是正式出版物最權(quán)威的信息來源,也就理所當然地成為圖書館獲取書目信息的主要渠道之一。如:美國國會圖書館憑借其國家圖書館的地位,與出版者等積極合作,由出版者向其提供相關(guān)信息。圖書館與出版機構(gòu)一般都有順暢的溝通渠道和良好的工作聯(lián)系,因此,從出版社或供書商處受繳或購買出版物的同時獲取書目數(shù)據(jù)具有可行性。但是,出版機構(gòu)與圖書館界的通用元數(shù)據(jù)標準有差異,需制定互操作的規(guī)則,才能達到整合的目的。
(4)搜索引擎。近年來,搜索引擎獲得了快速的發(fā)展,成為信息獲取、傳播的重要渠道,具有良好的宣傳推廣作用,能較好地滿足用戶廣泛的信息需求。因此,圖書館應(yīng)充分利用這一宣傳渠道,對本館的資源進行推廣,提高社會公眾的認知度。與搜索引擎進行的整合可以通過兩個途徑實現(xiàn):一個途徑是在OPAC中整合各搜索引擎的檢索入口,使用戶在OPAC中不但能檢索圖書館的館藏資源,還能檢索網(wǎng)絡(luò)資源,不但能補充圖書館的書目數(shù)據(jù)的信息,還能為用戶提供更廣泛的檢索入口。第二個途徑是在搜索引擎中嵌入圖書館OPAC的檢索入口,為搜索引擎龐大的用戶群提供館藏資源的信息。
(5)網(wǎng)絡(luò)資源。網(wǎng)絡(luò)資源是圖書館進行數(shù)字資源整合的重要組成部分,Web2.0的發(fā)展也使得公眾編目逐漸成為圖書館數(shù)據(jù)建設(shè)的一種方式。網(wǎng)絡(luò)上的書目信息主要來源于在線讀書網(wǎng)站、原創(chuàng)文學(xué)門戶、社會編目網(wǎng)站、知識性百科等網(wǎng)站。整合網(wǎng)絡(luò)上的信息資源可以采取兩種方法:一是借助搜索引擎的功能,在OPAC上提供對網(wǎng)絡(luò)信息的搜索功能。這是一種比較簡便易行的方法,但是,由于各種搜索引擎排序方式的不同,對同一檢索需求會返回不同的檢索結(jié)果,用戶在檢索時需要查詢多個搜索引擎,極大降低了檢索效率。二是利用網(wǎng)頁爬蟲將網(wǎng)絡(luò)上的信息資源抓取到本地。包括抓取網(wǎng)絡(luò)上提供的免費書目數(shù)據(jù)或采集網(wǎng)絡(luò)免費的電子圖書全文。但是,由于網(wǎng)頁往往沒有統(tǒng)一的制作標準,抓取的數(shù)據(jù)需經(jīng)過后期技術(shù)處理,必須以大量的校對工作來保證數(shù)據(jù)的準確性。
Web技術(shù)一直在不斷發(fā)展,在Web2.0還在蓬勃發(fā)展時,Web3.0的概念就被提出來。Growthroute Ventures公司創(chuàng)始人Greg Boutin認為:如果說Web2.0意味著 Youtube和維基百科等UGC和社交網(wǎng)絡(luò),那么Web3.0則意味著開放和結(jié)構(gòu)化數(shù)據(jù),讓網(wǎng)絡(luò)更加“聰明”。通過為信息添加能夠被計算機所理解的語義,從而使整個互聯(lián)網(wǎng)成為一個通用的信息交換媒介。OPAC的發(fā)展方向必然是吸收 Web3.0理念的OPAC3.0,即以館藏資源的語義化為核心的OPAC。
結(jié)合OPAC的發(fā)展方向,基于OPAC進行資源整合有如下三個途徑:深入挖掘書目關(guān)系,實現(xiàn)作品層面的文獻整合;加強對語義網(wǎng)的研究,實現(xiàn)語義層面的內(nèi)容整合;利用可視化技術(shù),實現(xiàn)表現(xiàn)層面的資源整合。
3.1.1 書目關(guān)系概述及存在問題
由于網(wǎng)絡(luò)時代數(shù)字資源數(shù)量的迅速增長,很多圖書館越來越傾向于對書目數(shù)據(jù)進行簡編。但是,只有書目數(shù)據(jù)能夠為數(shù)據(jù)分析提供充足的信息,才能實現(xiàn)對知識的深入挖掘與組織。OPAC系統(tǒng)是以書目數(shù)據(jù)為核心的,因此,基于OPAC進行數(shù)字資源的整合仍然要重視書目數(shù)據(jù)的作用,通過對書目關(guān)系的揭示和挖掘?qū)⒏鞣N類型、各種來源、相互獨立的信息資源整合到一起,從而真正實現(xiàn)基于OPAC的全方位的資源整合。
圖書館界認為,書目關(guān)系主要包括以下幾種〔2〕:
(1)等同關(guān)系(equivalence relation):如復(fù)本、摹真本、重印本、影印本、縮微復(fù)制品及其他復(fù)制品。
(2)衍生關(guān)系(derivative relation):如不同版本、修訂本、譯本、改寫本等。包括作品的其他版本、改寫或改編作品、體裁發(fā)生改變的作品、基于原作品的文體或內(nèi)容產(chǎn)生的新作品。
(3)描述關(guān)系(descriptive relation):指原作品與其描述、評論、評估作品間的關(guān)系,還包括注釋本、案例、文學(xué)評論等。
(4)整體/部分關(guān)系(whole/part relation):如主文獻與其析出文獻、作品合集與選集、期刊與其中文章、附屬叢編與主叢編之間的關(guān)系。
(5)附屬關(guān)系(accompanying relation):指書目文獻與其附件之間的關(guān)系。
(6)連續(xù)關(guān)系(sequential relation):即UNIMARC中的年代關(guān)系。
(7)共有特性關(guān)系(shared characteristic relationships):目錄中兩個實體雖不相關(guān),但卻共有某些特性。
上述關(guān)系有些是顯性的,如:附屬關(guān)系,通過對單個文獻的客觀描述即可揭示;有些是隱性的,如:共有特性關(guān)系,需要通過對書目數(shù)據(jù)中各種信息的抽取、分析建立書目關(guān)系。
數(shù)字時代,文獻的形式有了飛速的發(fā)展,由單一媒體形式向多類型、集成化媒體形式轉(zhuǎn)化。從信息存儲與發(fā)布的形式來說,由通過傳統(tǒng)出版渠道發(fā)行印刷本、磁盤、光盤等發(fā)展為借助網(wǎng)絡(luò)、衛(wèi)星、通信等渠道向電腦、移動終端、手機、數(shù)字電視等新媒體終端發(fā)布;從傳遞與表現(xiàn)信息的媒介來說,從文字、圖形等傳統(tǒng)媒介向數(shù)字、文本、聲音、圖形、音頻、視頻、圖片、動畫、三維立體等多種媒介發(fā)展,呈現(xiàn)發(fā)布渠道越來越多樣、表現(xiàn)力越來越強、新舊媒體互相融合的特點。如:通過數(shù)字化,紙質(zhì)書有了數(shù)字版本;通過計算機程序,紙質(zhì)書變成文字、圖片、音頻、視頻、動畫、交互式地圖、互動式游戲的集合體;印本圖書不再是所有作品的最原始版本,一本正式出版的印本圖書的前身可能是在博客上以連載形式發(fā)布的原創(chuàng)小說,也可能是一個網(wǎng)絡(luò)游戲;一本圖書的其他版本不但包括原有的修訂本、改寫本,還有不同人播講的音頻版本、不同網(wǎng)站發(fā)布的數(shù)字版本等。數(shù)字時代日新月異的變化使書目關(guān)系變得更加復(fù)雜。
多年以來,文獻編目一直是針對手頭文獻的,主要對文獻層面的書目關(guān)系進行揭示,沒有從文獻內(nèi)容出發(fā)對書目關(guān)系進行深入挖掘,缺乏對于復(fù)雜書目關(guān)系的描述。這一現(xiàn)狀無法滿足數(shù)字時代文獻的變化與用戶需求的變化。
3.1.2 解決途徑
1997年,國際圖聯(lián)發(fā)布了《書目記錄的功能需求》(FRBR)的最終報告〔3〕,對處于變革時期的圖書館編目起了重要的影響作用。
FRBR應(yīng)用了“實體-關(guān)系”模型來構(gòu)建概念框架,以識別并清晰定義書目記錄中用戶所關(guān)心的實體、每個實體的屬性、實體間的各類關(guān)系。其中,第一組實體代表知識或藝術(shù)創(chuàng)作產(chǎn)品中用戶關(guān)心的不同方面。定義為作品(獨有的知識或藝術(shù)的創(chuàng)作)和內(nèi)容表達(一部作品的知識或藝術(shù)的實現(xiàn))的實體反映知識或藝術(shù)內(nèi)容。定義為載體表現(xiàn)(一部作品的內(nèi)容表達的物理體現(xiàn))和單件(一種載體表現(xiàn)的單一樣本)的實體則反映物理形式。
FRBR的重要性在于,它提出了一個重要的概念——作品,并通過“實體-關(guān)系”模型的構(gòu)建將書目關(guān)系由平面關(guān)系轉(zhuǎn)為具有等級結(jié)構(gòu)的立體關(guān)系。作品概念的確定將基于實體文獻進行文獻組織的傳統(tǒng)理念轉(zhuǎn)變?yōu)榛趦?nèi)容進行文獻組織,在作品這一抽象概念下,匯集多種媒體、多種內(nèi)容、多種形式的文獻。FRBR將書目記錄按照作品、內(nèi)容表達、載體表現(xiàn)、單件四個實體層次進行定義,四個實體間具有等級關(guān)系,通過這種等級的確定,前文所述的七種書目關(guān)系不再是文獻之間的平面關(guān)系,而是以作品為核心組織在一起的多層關(guān)系。
將FRBR應(yīng)用于OPAC的整合可以有兩個實現(xiàn)途徑:
其一,按照FRBR的框架對編目規(guī)則進行修訂,按照作品、內(nèi)容表達、載體表現(xiàn)、單件制作不同層次的書目數(shù)據(jù)。這一方法的優(yōu)點在于:高層記錄的建立有利于對作品層與內(nèi)容層的揭示;編目規(guī)則結(jié)構(gòu)嚴謹,有利于編制高質(zhì)量的高層記錄;書目數(shù)據(jù)之間的關(guān)系明確,有利于對書目數(shù)據(jù)進行再挖掘,形成更深層次的知識產(chǎn)品;將OPAC的數(shù)據(jù)層建成具有完整體系的立體架構(gòu),將有力地支持OPAC的知識檢索。這一方法的缺點在于:將實體間的關(guān)系固定在書目數(shù)據(jù)中,缺乏動態(tài)性,無法滿足隨數(shù)據(jù)更新而更新的需要;隨著下層記錄的增加,需要不斷調(diào)整高層記錄,維護量大;通過制作書目數(shù)據(jù)構(gòu)建文獻的體系容易帶來封閉性,不利于與其他類型元數(shù)據(jù)的整合。
其二,不改變編目規(guī)則,通過設(shè)置一定的規(guī)則在檢索層實現(xiàn)實體間關(guān)系的揭示,簡單的、淺層的關(guān)系可以通過檢索點之間的關(guān)聯(lián)關(guān)系揭示,復(fù)雜的、深層的關(guān)系可以通過構(gòu)建一定的知識組織工具來實現(xiàn)。這一方法的優(yōu)點在于:具有良好的動態(tài)性,可以按照讀者的信息需求對檢索結(jié)果進行實時的聚合;不需要更改編目規(guī)則,也不需要對已建的書目數(shù)據(jù)進行轉(zhuǎn)換,大大降低了工作量;不會導(dǎo)致書目數(shù)據(jù)變得更為復(fù)雜,因此,對書目數(shù)據(jù)的共享、交換不會產(chǎn)生影響。這一方法的缺點在于:書目數(shù)據(jù)所揭示的信息必須非常詳盡才能支持系統(tǒng)的實時聚合;對復(fù)雜關(guān)系的揭示需要知識組織工具的支持,對工具的開發(fā)需要投入大量的人力、物力、時間,且隨著信息資源的發(fā)展需要不斷更新。
傳統(tǒng)的OPAC只匯集了書目數(shù)據(jù),但隨著信息技術(shù)的發(fā)展,利用OPAC整合的資源出現(xiàn)類型多樣化的特點,在面對海量信息時,個性化、精細化知識服務(wù)要求對不同類型的數(shù)據(jù)進行解析、對自然語言進行分析,因此,需加強對語義關(guān)系的揭示。應(yīng)該看到,語義化是圖書館OPAC的發(fā)展方向,但是,目前圖書館基于OPAC進行數(shù)字資源的整合方式主要集中在利用書目數(shù)據(jù)上,對于語義工具的研究還處在初級階段。因此,在OPAC的發(fā)展過程中,必須充分重視語義的揭示與表達在信息組織中的作用,深入研究基于語義的資源整合。
基于語義對內(nèi)容進行整合應(yīng)重點研究以下幾種技術(shù):
(1)語義互操作。由于不同主體對現(xiàn)實世界有不同的理解和不同的表達方式,不同領(lǐng)域會遵循不同的規(guī)則,使用不同的術(shù)語和詞表。命名方式、數(shù)據(jù)結(jié)構(gòu)、句法結(jié)構(gòu)、表達粒度(語法)等等的不同,必然會產(chǎn)生語義不一致的問題。解決語義異構(gòu)是數(shù)字圖書館實現(xiàn)知識服務(wù)的關(guān)鍵問題。語義互操作能夠有效解決信息的語義沖突,邏輯地屏蔽分類的差異性、定義的差異性、表達形式的差異性而帶來的信息數(shù)據(jù)的語義不一致性,從而保證系統(tǒng)交互過程中信息的準確性,以及語義的完整性和最小的損失,達到彼此之間最大限度地獲取有用的信息。
語義互操作在OPAC中的應(yīng)用主要針對資源集成和服務(wù)集成。目前最系統(tǒng)的方法是對資源和服務(wù)的語義進行開放封裝,在語義的層次上達成一致的理解。資源集成是在元數(shù)據(jù)體系和本體的基礎(chǔ)上實現(xiàn)的,高度自動化的服務(wù)發(fā)現(xiàn)和調(diào)用機制提供了底層架構(gòu)和技術(shù)支持,從而實現(xiàn)服務(wù)層次的語義互操作。
(2)語義檢索。對資源進行整合的目的在于為用戶提供高效的檢索,傳統(tǒng)的信息檢索是基于關(guān)鍵詞匹配實現(xiàn)的,語義差異、數(shù)據(jù)異構(gòu)、缺乏關(guān)聯(lián)都是傳統(tǒng)信息檢索的弊病,語義檢索借助本體提供的領(lǐng)域知識和對邏輯推理的支持,根據(jù)語義相似度對資源進行聚合,從而實現(xiàn)語義檢索。語義檢索從語義理解的角度分析信息對象與檢索者的檢索請求,力圖真正理解并挖掘檢索者的信息請求。因此,基于語義的信息檢索是OPAC知識檢索的基本模式。語義檢索的實現(xiàn)能夠改進檢索功能,按照文獻類型設(shè)置智能化檢索點,為用戶提供精細化檢索,通過檢索詞提示、熱詞推薦、相關(guān)主題推薦、相關(guān)借閱推薦等智能推薦功能實現(xiàn)信息的智能化導(dǎo)航。
(3)關(guān)聯(lián)數(shù)據(jù)。關(guān)聯(lián)數(shù)據(jù)(linked data)是語義網(wǎng)的一個具體應(yīng)用,其概念由Tim Berners-Lee于2006年首次提出,關(guān)聯(lián)數(shù)據(jù)提出的目的是構(gòu)建一個計算機能理解的具有結(jié)構(gòu)化和富含語義的數(shù)據(jù)網(wǎng)絡(luò),其原理是用一種輕型的、可利用分布數(shù)據(jù)集及其自主內(nèi)容格式、基于標準的知識表示與檢索協(xié)議、可逐步擴展的機制來實現(xiàn)可動態(tài)關(guān)聯(lián)的知識對象網(wǎng)絡(luò),并支持在此基礎(chǔ)上的知識組織和知識發(fā)現(xiàn)?!?〕
關(guān)聯(lián)數(shù)據(jù)在圖書館資源整合中所起的作用包括:關(guān)聯(lián)數(shù)據(jù)具有的數(shù)據(jù)整合與重用的功能可以幫助圖書館關(guān)聯(lián)多種異構(gòu)的數(shù)據(jù)源,豐富書目信息;其開放性將極大地提高圖書館書目數(shù)據(jù)、規(guī)范數(shù)據(jù)等智力產(chǎn)品的利用率、認知度,從而使更多的人使用圖書館的服務(wù);以標準的數(shù)據(jù)格式發(fā)布圖書館制作的各種數(shù)據(jù)將有利于實現(xiàn)基于語義的智能檢索,提高檢索的查準率和查全率,更好地發(fā)揮圖書館書目檢索系統(tǒng)的功能。
可視化技術(shù)是當今信息情報研究領(lǐng)域的熱點問題之一??梢暬菍⒏鞣N抽象信息及其關(guān)聯(lián)關(guān)系轉(zhuǎn)化為有意義和可理解的視覺表達形式,通過圖形、視覺、聯(lián)想等揭示信息的模式、區(qū)別、聯(lián)系與趨勢。特別是在瀏覽、研究大規(guī)模數(shù)據(jù)時,可視化的形式有助于發(fā)現(xiàn)隱藏在信息內(nèi)部的特征、規(guī)律、關(guān)聯(lián)。
可視化技術(shù)主要可應(yīng)用于:
(1)檢索結(jié)果的可視化??梢暬故镜姆秶ㄖR檢索的過程及結(jié)果。目的在于幫助用戶獲取信息。除幫助人們克服閱讀、認知或理解障礙外,還可提供豐富的用戶體驗,提高OPAC對用戶的吸引力,增加圖書館書目服務(wù)的黏度。如通過色彩、關(guān)系圖、時間軸等可視化技術(shù)幫助用戶概括、理解信息,揭示信息間關(guān)系;通過檢索結(jié)果的分面化顯示為用戶實現(xiàn)海量信息資源中的精確導(dǎo)航;以標簽云圖提供信息的推薦;以三維圖像模擬行為,增加用戶利用信息的興趣;通過嵌入地圖信息提供文獻收藏館的位置,為用戶提供更多的信息等等。
(2)分析結(jié)果的可視化。除了傳輸知識的目的外,可視化還有一個重要的作用,即對信息分析結(jié)果的展示、校準及評價提供支持。如:以圖表的形式提供文獻的出版、發(fā)表、引用、借閱等行為,研究學(xué)科熱點的發(fā)展趨勢;結(jié)合可視化技術(shù)及引文分析法,建立科學(xué)文獻間的學(xué)科聯(lián)系,進行科學(xué)文獻結(jié)構(gòu)和科學(xué)結(jié)構(gòu)的研究,揭示科學(xué)發(fā)展史及其規(guī)律,評價科研成果,研究情報用戶的構(gòu)成及行為等。
(3)知識組織工具的可視化。分類法、主題詞表等知識組織工具是圖書館的專業(yè)工具,沒有受過專業(yè)訓(xùn)練的用戶很難使用,但知識組織工具構(gòu)建了嚴密的知識體系,對知識的導(dǎo)航有著重要的作用,因此,應(yīng)使用更易為用戶接受的方式提供服務(wù)。提供知識組織工具的可視化顯示有助于幫助用戶查找所需資源、揭示知識體系構(gòu)成。
信息技術(shù)的發(fā)展為OPAC帶來了挑戰(zhàn)與機遇,用戶需求、資源特點的快速變化使得OPAC的發(fā)展面臨重重困難。在建設(shè)OPAC的過程中,應(yīng)充分重視用戶集體智慧的作用,如:對用戶行為進行分析,用于資源建設(shè)、信息推薦、系統(tǒng)改進,利用Web2.0的技術(shù)進行資源建設(shè)與信息組織等等,從而將OPAC發(fā)展成為規(guī)范化的、語義化的、開放化的信息整合平臺。
1.陳妍.基于0PAC的圖書信息資源整合研究與實現(xiàn).南開大學(xué)碩士論文,2010
2.高紅.編目思想史.北京:北京圖書館出版社,2008:261-262
3.書目記錄的功能需求(最終報告).〔2012-12-24〕.www.ifla.org/files/assets/cataloguing/frbr/frbr-zh.pdf
4.沈志宏,張曉林.關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述.現(xiàn)代圖書情報技術(shù),2010(11):1-9