雷拯
關鍵詞:RDA;著錄編目;關聯(lián)數(shù)據(jù);機構知識庫
摘 要:RDA標準與關聯(lián)數(shù)據(jù)技術為圖書館機構知識庫的建設提供了新方向,文章簡要介紹了RDA和關聯(lián)數(shù)據(jù)技術的概念與特點,從數(shù)據(jù)層、分析層和應用層構建了基于RDA和關聯(lián)數(shù)據(jù)的圖書館機構知識庫模型,最后從服務、資源與機構三個角度提出了基于RDA和關聯(lián)數(shù)據(jù)的圖書館機構知識庫構建策略,以期為圖書館知識服務效能提升提供一些參考。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2021)02-0095-03
1 RDA和關聯(lián)數(shù)據(jù)技術的概念與特點
伴隨大數(shù)據(jù)時代的到來,圖書館尤其是高校圖書館越來越重視機構知識庫的建設。目前,學界對機構知識庫并沒有統(tǒng)一的定義,有學者認為機構知識庫是一個機構建立的,以網(wǎng)絡為依托,以收集、整理、保存、檢索、提供利用為目的,以本機構成員在工作過程中所創(chuàng)建的各種數(shù)字化產(chǎn)品為內(nèi)容的知識庫[1]。
1.1 RDA的概念與特點
資源描述與檢索(Resource Description and Access,RDA)是專為數(shù)字環(huán)境設計的用于資源描述和檢索的新標準[2]。RDA標準具有兼容性、規(guī)范性和簡潔性等特點,能夠更清晰地揭示標題所表示的內(nèi)容。表1呈現(xiàn)了RDA著錄的內(nèi)容分析,從表1可知,RDA規(guī)則對資源著錄、資源識別、資源內(nèi)容、檢索等進行了詳細的規(guī)范,圖書館可以依據(jù)RDA對知識庫資源進行分類及著錄。
表1 RDA著錄內(nèi)容分析
著錄標題內(nèi)容分析資源著錄通用規(guī)則著錄的目的、范圍、標準、必備元素數(shù)據(jù)識別對常見的資源數(shù)據(jù)進行規(guī)范性的元素標注特殊資源的著錄各資源載體的類型、數(shù)量、大小和材質(zhì)等各類型資源的內(nèi)容數(shù)據(jù)資源的類型、內(nèi)容范圍、描述對象、內(nèi)容摘要、涵蓋的信息等資源獲取與檢索獲取與檢索限制等方面的著錄與資源相關的其他對象按照實體分別指出內(nèi)容表達、個人介紹等信息相關資源資源和實體之間的關系
1.2 關聯(lián)數(shù)據(jù)的概念和特點
關聯(lián)數(shù)據(jù)是指在網(wǎng)絡上發(fā)布、共享、連接各類數(shù)據(jù)、信息和知識的一種方式,它克服了本體的領域局限性,實現(xiàn)了數(shù)據(jù)之間開放的無縫互聯(lián)[3]。一般來說,關聯(lián)數(shù)據(jù)包括數(shù)據(jù)挖掘、數(shù)據(jù)分析和數(shù)據(jù)整合三個方面。通過關聯(lián)數(shù)據(jù)技術,圖書館能夠挖掘數(shù)據(jù)中隱藏的價值,同時強化數(shù)據(jù)之間的聯(lián)系。可以說,關聯(lián)數(shù)據(jù)打破了傳統(tǒng)的數(shù)據(jù)分布和服務方式,呈現(xiàn)出開放性、互聯(lián)性的特點,可以為圖書館機構知識庫構建提供保障。
2 基于RDA和關聯(lián)數(shù)據(jù)的圖書館機構知識庫構建目標
在機構知識庫構建過程中,圖書館不僅要對數(shù)據(jù)進行收集和整合,還要考慮知識庫與外部知識庫的關聯(lián)。筆者將基于RDA和關聯(lián)數(shù)據(jù)的圖書館機構知識庫構建細化為以下三個方面。
2.1 資源收集方面
在大數(shù)據(jù)環(huán)境下,高?;蛑R機構內(nèi)的任何個體與組織都可以成為數(shù)據(jù)的生產(chǎn)者,大量的科研成果與科研數(shù)據(jù)產(chǎn)生并被納入圖書館原生資源庫中,這些原生化資源的格式、類型、結構各不相同,呈現(xiàn)出紛亂繁雜的狀態(tài)[4]。無序的數(shù)據(jù)不僅占用了大量的存儲空間,而且難以發(fā)揮其應有的價值,因此,構建圖書館機構知識庫的第一個目標就是要實現(xiàn)數(shù)據(jù)資源的全面收集和有效整合,使大量不規(guī)則數(shù)據(jù)轉(zhuǎn)化為標準化數(shù)據(jù)。
2.2 資源關聯(lián)方面
在機構知識庫建設過程中,圖書館不僅要收集數(shù)據(jù),還要通過數(shù)據(jù)關聯(lián)技術對數(shù)據(jù)進行分析與整合,加強數(shù)據(jù)之間的關聯(lián),為用戶提供更有價值的數(shù)據(jù)資源。一方面,知識庫可以根據(jù)主題或?qū)W科對數(shù)據(jù)進行分類,打破固有的結構框架,實現(xiàn)數(shù)據(jù)重組;另一方面,圖書館要加強與機構外知識庫的關聯(lián),以豐富資源類型和資源數(shù)量??傊?,圖書館應加大數(shù)據(jù)資源的挖掘和整合力度,為資源編目與用戶檢索信息提供便利。
2.3 資源編目方面
RDA規(guī)范了知識庫資源編目的規(guī)則,圖書館要根據(jù)這一規(guī)則完成資源的編目和著錄工作。圖書館在對數(shù)據(jù)資源進行收集和關聯(lián)之后,需要對其進行語義化、可視化處理,最終以標準合格的狀態(tài)呈現(xiàn)給用戶[5],科學規(guī)范的資源編目能夠使資源的檢索與推送更加精準,從而助力科研機構與高校師生的科研、教學與學習。
3 基于RDA與關聯(lián)數(shù)據(jù)的圖書館機構知識庫構建模型
筆者認為,基于RDA與關聯(lián)數(shù)據(jù)構建的機構知識庫服務模型可以分為數(shù)據(jù)層、分析層與應用層三個層級。其中,數(shù)據(jù)層是基礎,分析層是支撐,應用層是為用戶提供有效服務的最重要的組成部分,三個層級相互作用、相互影響,共同保障機構知識庫的高效服務。
3.1 數(shù)據(jù)層
數(shù)據(jù)層是構建基于RDA和關聯(lián)數(shù)據(jù)的圖書館機構知識庫的基礎層級,這一層級不僅包括本機構的數(shù)據(jù),也包括與合作機構交換的輸入型數(shù)據(jù),為了保證知識數(shù)據(jù)的數(shù)量和質(zhì)量,知識庫必須對這些資源進行類型與格式的歸類,然后依照RDA標準進行語義描述和分類存儲。一般來說,知識數(shù)據(jù)的存儲包括自存儲、強制性存儲與簽訂協(xié)議代存儲三種方式,知識庫核心資源分別以三種方式進行保存,擴展資源主要采用自存儲和強制性存儲的方式保存,關聯(lián)形成的重要資源則單獨以自存儲的方式保存[6]。
3.2 分析層
分析層是指圖書館應用數(shù)據(jù)挖掘、分析、整合與關聯(lián)技術,將關聯(lián)成果進行鏈接。通過對機構知識庫資源的語義描述與RDF排序,資源可以呈現(xiàn)出最優(yōu)的聚合狀態(tài),再應用RDA建立起各資源間的鏈接,就構成了更全面細致的知識圖譜[7]。相同題名或相同主題的資源則可以重組為機構知識庫整體,與其他機構知識庫和外部資源數(shù)據(jù)集進行關聯(lián),形成更加符合用戶需求的信息供給體系。
3.3 應用層
圖書館機構知識庫模型的最高一層為應用層,應用層不僅是讀者交流的平臺,也是讀者獲取資源的重要一環(huán)。應用層包括知識服務、語義檢索與個性化服務三項內(nèi)容,這三項內(nèi)容都是建立在數(shù)據(jù)充分關聯(lián)的基礎上的[8]。應用層也是面向用戶開展定向資源推送與個性化服務的基礎,良好的資源獲取體驗可以增強讀者對機構知識庫的認同感。
4 基于RDA和關聯(lián)數(shù)據(jù)的圖書館機構知識庫構建策略
結合上文所述,筆者認為,影響圖書館機構知識構建的要素主要有三個:服務、資源、機構。因此,筆者從這三個角度提出圖書館機構知識庫的構建策略:從服務角度看,圖書館要關注用戶需求;從資源角度看,圖書館要加大數(shù)據(jù)挖掘和關聯(lián)力度;從機構角度看,圖書館要注重機構間的合作,形成協(xié)同效應。
4.1 服務角度:關注用戶需求
圖書館建設機構知識庫的最終目的是提升用戶體驗,為用戶提供更加準確和系統(tǒng)化的知識服務,因此,圖書館要關注用戶需求,以滿足用戶需求為出發(fā)點和落腳點。筆者認為,圖書館要結合用戶需求進行資源建設,同時建立動態(tài)反饋機制了解用戶需求的變化,在此基礎上利用網(wǎng)絡平臺為用戶提供全天候、個性化的高質(zhì)量知識服務。
4.2 資源角度:加大數(shù)據(jù)挖掘和關聯(lián)力度
數(shù)據(jù)資源是構建圖書館機構知識庫的重中之重,也是最核心的要素??蒲腥藛T是圖書館機構知識庫的主要服務對象,他們對知識資源的專業(yè)性、全面性及時效性有非常高的要求?;ヂ?lián)網(wǎng)環(huán)境下,基于RDA標準和關聯(lián)數(shù)據(jù)的機構知識庫構建要加大數(shù)據(jù)挖掘與關聯(lián)力度。一方面,圖書館應注意數(shù)據(jù)挖掘的規(guī)范化,保證知識資源的質(zhì)量;另一方面,圖書館還要對這一工作進行硬性的指標性的規(guī)定,以保證工作流程的規(guī)范。在數(shù)據(jù)挖掘和關聯(lián)過程中,如遇到元數(shù)據(jù)描述雜亂、學術研究成果參差不齊等不合格的情況,圖書館必須要返回上一個流程進行重新校對、更正[9]。
4.3 機構角度:注重機構間的合作
大數(shù)據(jù)環(huán)境下,任何一家圖書館都不可能擁有某一學科所有的文獻資源,因此,在構建機構知識庫過程中,圖書館要注重與其他機構的合作,如公共圖書館可以與高校圖書館、科研院所等開展合作。一些高校圖書館已相繼與科研機構合作,加入機構知識庫行列,如清華大學、香港大學等高校與其他學術機構或知識機構形成合作關系,在資源上互通有無,在技術上相互借鑒,在人才上加強交流。機構間的合作不僅有利于節(jié)約資源購置經(jīng)費,而且可以促進信息的橫向流通,從而為科研人員提供更及時、全面的知識服務。
5 結語
綜上所述,大數(shù)據(jù)技術與信息技術的飛速發(fā)展對圖書館知識服務提出了更高的要求,也推動了圖書館知識服務形式與內(nèi)容的轉(zhuǎn)型升級?;赗DA與數(shù)據(jù)關聯(lián)技術的機構知識庫集中了人員、資源以及技術優(yōu)勢,拓寬了圖書館服務范圍,提升了圖書館服務的有效性,可以為科研人員提供更加準確、高效的知識服務。
參考文獻:
[1] 康桂英,明道福,吳曉兵.大數(shù)據(jù)時代信息資源檢索與分析[M].北京:北京理工大學出版社,2019:348.
[2] 芭芭拉·B·蒂利特,張鈺羚.RDA與中國:編目的國際化[J].中國圖書館學報,2012(6):14-21.
[3] 歐石燕,胡珊,張帥.本體與關聯(lián)數(shù)據(jù)驅(qū)動的圖書館信息資源語義整合方法及其測評[J].圖書情報工作,2014(2):5-13.
[5] 周俊燁.基于關聯(lián)數(shù)據(jù)的圖書館、檔案館和博物館數(shù)字資源整合模式構建[J].圖書館,2019(1):70-75.
[6] 李麗博.基于RDA的圖書館圖書編目規(guī)范控制研究[J].河南圖書館學刊,2018(10):119-120,128.
[7] 李薇,王恒軍,王爽,等.論基于RDA技術的圖書館館藏數(shù)字資源知識組織[J].中國中醫(yī)藥圖書情報雜志,2018(4):18-21.
[8] 陳婷婷.圖書館關聯(lián)開放數(shù)據(jù)消費研究[J].情報探索,2018(8):97-102.
[9] 魏來,寧子晨.基于RDA的圖書館書目數(shù)據(jù)與機構知識庫數(shù)據(jù)關聯(lián)研究[J].圖書館工作與研究,2018(7):43-49.
(編校:周雪芹)