李迎迎 孫玉琦
(1. 淮陰師范學(xué)院經(jīng)濟(jì)與管理學(xué)院,淮安 223001;2. 中國(guó)科學(xué)院武漢文獻(xiàn)情報(bào)中心,武漢 430071;3. 中國(guó)科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 100190)
76.7萬(wàn)處不可移動(dòng)文物、1.08億件/套國(guó)有可移動(dòng)文物,星散在廣闊中華大地上、綿延于歲月長(zhǎng)河中,這些不可再生、不可替代的寶貴資源,正為億萬(wàn)中華兒女注入強(qiáng)大的精神動(dòng)力[1]。由于文物資源種類(lèi)繁多、浩如煙海,如何有計(jì)劃、有組織、有目的地對(duì)文物資源進(jìn)行保護(hù)、管理、組織和利用是亟待解決的問(wèn)題。
文物資源具有唯一性、不可再生性、不可共享性,而文物信息資源是文物實(shí)體的數(shù)字化資源,包括文物的基礎(chǔ)數(shù)據(jù)信息、圖片、三維模型等,因此文物的信息資源是無(wú)限的、可再生的、可共享的[2],而且文物信息資源的開(kāi)發(fā)利用在一定程度上可以替代文物實(shí)體,應(yīng)用于文物的科學(xué)研究、知識(shí)共享、鑒賞等諸多方面。館藏文物的信息化不僅是對(duì)文物的一種保護(hù),同樣更加有利于文物信息資源的傳播,讓用戶(hù)突破時(shí)空限制,瀏覽、檢索、獲取文物知識(shí),有利于我國(guó)傳統(tǒng)文化的傳播與共享。目前,已有多種數(shù)字化信息技術(shù)在文博事業(yè)中得到廣泛應(yīng)用[3],使得文物數(shù)字化保護(hù)、開(kāi)發(fā)、組織、應(yīng)用成為文博工作新的增長(zhǎng)點(diǎn)。可視化技術(shù)是在已有多種數(shù)字化信息技術(shù)的基礎(chǔ)上,將館藏文物資源進(jìn)行信息組織形成的數(shù)據(jù)、信息和知識(shí)進(jìn)行再度提煉,形成從數(shù)據(jù)到知識(shí)的用戶(hù)可交互的可視化環(huán)境。可視化技術(shù)在館藏文物資源信息組織和服務(wù)中可以實(shí)現(xiàn)館藏文物的信息實(shí)體虛擬化、信息資源數(shù)字化、信息傳遞網(wǎng)絡(luò)化、信息利用共享化、信息提供智能化、信息展示多樣化,同時(shí)滿(mǎn)足用戶(hù)多維館藏文物知識(shí)需求。
館藏文物是文物類(lèi)型中所占比重較大的一種類(lèi)型,大多數(shù)可移動(dòng)文物都屬于館藏文物的類(lèi)型[4],因此,本文以館藏文物資源為研究對(duì)象,不僅包括館藏文物的數(shù)字資源,同時(shí)還包括館藏文物的真實(shí)信息,在此基礎(chǔ)上著重探究館藏文物資源信息組織與服務(wù)的路徑,繼而研究館藏文物信息轉(zhuǎn)化為館藏文物可視化知識(shí)的全過(guò)程。
在信息資源組織方法方面,包括資源的聚類(lèi)、單一維度聚合、深度聚合、多維度聚合,以及多維度聚合的融合等。信息資源組織的工具也多種多樣,包括主題詞表、元數(shù)據(jù)、本體、關(guān)聯(lián)數(shù)據(jù)、超網(wǎng)絡(luò)、主題圖、知識(shí)地圖等。目前,國(guó)內(nèi)外在館藏文物資源信息組織方面,主要是利用元數(shù)據(jù)和本體技術(shù)進(jìn)行組織,其次也有基于關(guān)聯(lián)數(shù)據(jù)的研究,而且國(guó)內(nèi)外的一些文博單位都設(shè)計(jì)了屬于自己博物館的專(zhuān)門(mén)元數(shù)據(jù),同時(shí)也有CIDOC-CRM本體可供借鑒和利用。如Stasinopoulou等[5]提出了基于本體的文物領(lǐng)域的元數(shù)據(jù)集成與融合,基于EAD和DC元數(shù)據(jù),實(shí)現(xiàn)元數(shù)據(jù)到CIDOC-CRM本體模型的映射。Kakali等[6]同樣利用CIDOC-CRM本體實(shí)現(xiàn)了DC主題詞表與CIDOC的映射。De Boer等[7]將關(guān)聯(lián)數(shù)據(jù)引入文物領(lǐng)域,實(shí)現(xiàn)元數(shù)據(jù)和主題詞向關(guān)聯(lián)數(shù)據(jù)的轉(zhuǎn)化。值得一提的是,Rinaldi等[8]提出了開(kāi)發(fā)促進(jìn)包容和跨文化對(duì)話(huà)的創(chuàng)新服務(wù)來(lái)改進(jìn)文化遺產(chǎn)體驗(yàn)的設(shè)計(jì),以促進(jìn)跨文化交流和知識(shí)共享,而文物知識(shí)可視化則是較好的一種形式。高勁松等[9]提出了通過(guò)借助關(guān)聯(lián)數(shù)據(jù)相關(guān)技術(shù)、利用SPARQL以及HTML對(duì)館藏文物資源知識(shí)進(jìn)行訪(fǎng)問(wèn)和查詢(xún)。王超英[10]提出了基于本體的文物知識(shí)庫(kù)構(gòu)建方法,并對(duì)其涉及的關(guān)鍵技術(shù)進(jìn)行了研究,構(gòu)建了知識(shí)庫(kù)擴(kuò)充推理的框架和知識(shí)庫(kù)擴(kuò)展檢索的模型,形成了滿(mǎn)足用戶(hù)需求的文物知識(shí)庫(kù)。
目前,可視化技術(shù)在文博領(lǐng)域的應(yīng)用研究相對(duì)較少。Ch'ng等[11]提出了數(shù)字化時(shí)代遺產(chǎn)的可視化問(wèn)題,包括文本、內(nèi)容、空間等信息,闡述了遺產(chǎn)數(shù)字化的重要性。宏觀(guān)來(lái)講,文博領(lǐng)域的可視化研究與國(guó)家政策掛鉤,研究學(xué)者理應(yīng)積極響應(yīng)國(guó)家宏觀(guān)政策,加大對(duì)文物資源信息可視化的研究;微觀(guān)來(lái)講,本文所講的可視化技術(shù)在文博領(lǐng)域信息資源組織和服務(wù)中體現(xiàn)較強(qiáng)優(yōu)勢(shì),不僅實(shí)現(xiàn)館藏文物知識(shí)節(jié)點(diǎn)的可視化,同時(shí)將館藏文物知識(shí)關(guān)聯(lián)進(jìn)行可視化,實(shí)現(xiàn)從館藏文物數(shù)據(jù)到館藏文物知識(shí)的完整轉(zhuǎn)化,形成用戶(hù)可交互的可視化環(huán)境。整體而言,可視化技術(shù)從文物的角度講,一定程度上提高了文物的利用價(jià)值,同時(shí)對(duì)文物的數(shù)字化保存、組織、共享及傳承具有重要的實(shí)踐應(yīng)用價(jià)值。從用戶(hù)的角度來(lái)講,不僅使用戶(hù)在獲取文物資源的過(guò)程中突破時(shí)空限制,同時(shí)通過(guò)可視化技術(shù)在資源檢索過(guò)程中,額外獲取文物知識(shí)。從文物組織管理機(jī)構(gòu)角度來(lái)講,可視化技術(shù)給組織管理人員提供了系統(tǒng)的方法思路,提出了文物資源信息組織和服務(wù)的管理方式,便于對(duì)資源的合理組織與整合。
可視化技術(shù)在館藏文物資源信息組織與服務(wù)中應(yīng)用的過(guò)程就是將館藏文物信息轉(zhuǎn)化為可視化知識(shí)的過(guò)程,從整體上可以分為信息準(zhǔn)備、信息組織以及信息應(yīng)用三大階段,以及信息獲取、信息預(yù)處理、元數(shù)據(jù)加工、本體組織、可視化表達(dá)五大環(huán)節(jié),最終傳遞給用戶(hù)可視化文物知識(shí)的完整過(guò)程,上級(jí)環(huán)節(jié)為下級(jí)環(huán)節(jié)奠定良好的基礎(chǔ)和鋪墊,并保證下級(jí)環(huán)節(jié)的完成和實(shí)現(xiàn),具體過(guò)程如圖1所示。
圖1 館藏文物資源信息組織與服務(wù)過(guò)程示意圖
(1)待組織館藏文物信息資源。信息準(zhǔn)備階段又細(xì)分為信息獲取和信息預(yù)處理兩個(gè)環(huán)節(jié),經(jīng)過(guò)信息獲取和信息預(yù)處理之后的館藏文物資源才能進(jìn)行有效的信息分析,繼而形成待組織的館藏文物信息資源。待組織館藏文物信息資源是進(jìn)行館藏文物信息資源組織的基礎(chǔ),根據(jù)可視化技術(shù)的需求,確保信息資源的純凈,避免信息垃圾的產(chǎn)生,提高信息組織的效率,為用戶(hù)提供更好的服務(wù)體驗(yàn)。本研究中所獲取的第一手館藏文物信息資源即待組織館藏文物信息資源,主要包括公共數(shù)字博物館、高校數(shù)字博物館以及研究院所數(shù)字博物館等機(jī)構(gòu)獲取的館藏文物實(shí)體數(shù)字化后的信息,繼而將這些內(nèi)容進(jìn)行簡(jiǎn)單預(yù)處理之后形成的文物信息資源。由于文物信息的龐大、文物資源的異構(gòu)及不定時(shí)更新等特點(diǎn),使得待組織館藏文物信息資源的獲取及預(yù)處理存在較大困難和挑戰(zhàn),因此本文在實(shí)證研究環(huán)節(jié)只收集某一類(lèi)特色館藏文物資源進(jìn)行研究。
(2)新生館藏文物知識(shí)資源。信息組織階段又細(xì)分為元數(shù)據(jù)加工和本體組織兩個(gè)環(huán)節(jié),本研究中針對(duì)館藏文物信息資源所使用的工具特指元數(shù)據(jù)和本體,經(jīng)過(guò)信息組織后的館藏文物信息資源形成新生館藏文物知識(shí)資源,在此基礎(chǔ)上進(jìn)行可視化表達(dá)。待組織館藏文物信息資源不能滿(mǎn)足用戶(hù)知識(shí)資源的需求,也不能供用戶(hù)檢索、查詢(xún)和使用,必須經(jīng)過(guò)一定的知識(shí)節(jié)點(diǎn)架構(gòu)和知識(shí)關(guān)聯(lián)架構(gòu),也就是元數(shù)據(jù)加工和知識(shí)組織環(huán)節(jié),從而形成信息與知識(shí)間的關(guān)聯(lián)與映射。本研究中的元數(shù)據(jù)加工,主要是基于館藏文物核心元數(shù)據(jù)標(biāo)準(zhǔn)對(duì)待組織館藏文物信息資源進(jìn)行基礎(chǔ)描述,形成結(jié)構(gòu)化的信息,這些結(jié)構(gòu)化的信息資源已具備形成知識(shí)資源的雛形[12]。本體組織環(huán)節(jié),主要是利用本體技術(shù)對(duì)經(jīng)過(guò)元數(shù)據(jù)加工的信息資源的基本定義和關(guān)系形成概念化的明確說(shuō)明,使其產(chǎn)生知識(shí)關(guān)聯(lián),形成知識(shí)庫(kù)。新生知識(shí)資源主要就是經(jīng)過(guò)元數(shù)據(jù)加工以及本體組織環(huán)節(jié)形成的,不再是單純的數(shù)字資源,已經(jīng)具備供用戶(hù)進(jìn)行知識(shí)獲取的部分功能和特性,但必須通過(guò)下一環(huán)節(jié)將新生知識(shí)資源展示出來(lái)。
(3)再生館藏文物知識(shí)資源。信息應(yīng)用階段主要是將信息和用戶(hù)連接起來(lái)的中介和橋梁,通過(guò)可視化表達(dá)形成再生館藏文物知識(shí)資源,使得館藏文物信息以可視化知識(shí)地圖的形式呈現(xiàn)在用戶(hù)面前,便于用戶(hù)對(duì)文物知識(shí)的檢索、共享及利用。再生館藏文物知識(shí)資源是借助于由待組織館藏文物信息資源形成的新生館藏文物知識(shí)資源的知識(shí)庫(kù),將其進(jìn)行可視化地圖展示,通過(guò)知識(shí)之間的關(guān)聯(lián)模型構(gòu)建館藏文物知識(shí)網(wǎng)絡(luò),在此基礎(chǔ)上,實(shí)現(xiàn)館藏文物信息資源的知識(shí)推薦[13]。在本階段主要利用的是知識(shí)地圖這一關(guān)鍵技術(shù),借助于元數(shù)據(jù)和本體所呈現(xiàn)的新生館藏文物知識(shí)資源之間的關(guān)系以及鏈接,經(jīng)過(guò)必要的歸納、演繹、推理形成再生知識(shí)資源,利用概念知識(shí)地圖、空間知識(shí)地圖等進(jìn)行館藏文物信息資源的可視化。
可視化技術(shù)在館藏文物資源信息組織與服務(wù)中的應(yīng)用是館藏文物資源信息組織在新環(huán)境下的產(chǎn)物,是對(duì)傳統(tǒng)資源信息組織的改進(jìn)和發(fā)展,同時(shí)遵循信息資源組織的一般原則和規(guī)律,由于館藏文物信息資源的特殊性、異構(gòu)性等特點(diǎn),形成了可視化技術(shù)在館藏文物資源信息組織與服務(wù)的一些新特征,它的最終目標(biāo)是為可視化技術(shù)在館藏文物資源信息組織與服務(wù)提供一般的解決方案。
可視化技術(shù)在館藏文物資源信息組織與服務(wù)中的應(yīng)用路徑(見(jiàn)圖2),是在此前館藏文物資源信息組織與服務(wù)過(guò)程基礎(chǔ)上進(jìn)行模塊化設(shè)計(jì),根據(jù)館藏文物資源的特征,融合相關(guān)技術(shù)方法,最終形成可視化文物知識(shí)的過(guò)程。
圖2 可視化技術(shù)在館藏文物資源信息組織與服務(wù)中應(yīng)用的路徑結(jié)構(gòu)圖
①信息準(zhǔn)備階段,包括信息獲取和信息預(yù)處理兩個(gè)模塊,涉及信息獲取技術(shù)和信息預(yù)處理技術(shù)兩大支撐技術(shù)。這一階段處于框架的最底層,是對(duì)館藏文物資源進(jìn)行信息組織的信息準(zhǔn)備階段。②信息組織階段,包括元數(shù)據(jù)加工和本體組織兩個(gè)模塊,本研究中主要應(yīng)用元數(shù)據(jù)技術(shù)和本體技術(shù)兩大支撐技術(shù),完成對(duì)館藏文物信息資源知識(shí)節(jié)點(diǎn)的描述和關(guān)聯(lián)知識(shí)發(fā)現(xiàn)等目標(biāo),是可視化技術(shù)在館藏文物資源信息組織與服務(wù)中應(yīng)用的最重要的階段。③信息應(yīng)用階段,包括館藏文物資源信息可視化表達(dá)這一重要模塊,本研究中主要應(yīng)用知識(shí)地圖這一支撐技術(shù),這一階段完成了對(duì)館藏文物資源信息可視化,是將信息和知識(shí)與用戶(hù)鏈接起來(lái)進(jìn)行交互的橋梁。這三個(gè)階段、五個(gè)模塊、五大支撐技術(shù)相互串聯(lián)、逐級(jí)遞進(jìn),貫穿于館藏文物資源信息組織與服務(wù)的整體過(guò)程,共同實(shí)現(xiàn)了館藏文物資源信息的可視化呈現(xiàn)功能。
信息獲取模塊處于框架的最底層,它的主要目的是收集館藏文物數(shù)據(jù)和信息,包括數(shù)字化的文本數(shù)據(jù)、知識(shí)數(shù)據(jù)以及圖片等信息,是可視化技術(shù)在館藏文物資源信息組織與服務(wù)的基礎(chǔ)保障,也是將館藏文物信息加入整個(gè)過(guò)程的入口。針對(duì)不同類(lèi)型的數(shù)據(jù),采用具有針對(duì)性的信息獲取技術(shù),是該模塊實(shí)現(xiàn)收集數(shù)據(jù)功能的基本途徑。由于館藏文物類(lèi)型多樣,收集的信息數(shù)據(jù)量也較大,本文主要通過(guò)數(shù)字博物館已有的半結(jié)構(gòu)化的館藏文物數(shù)據(jù)和信息進(jìn)行收集,通過(guò)數(shù)字博物館的藏品數(shù)據(jù)庫(kù),收集館藏文物已有的相關(guān)信息。
本研究中館藏文物信息獲取主要從國(guó)家數(shù)字博物館、省級(jí)數(shù)字博物館、市級(jí)數(shù)字博物館以及高校數(shù)字博物館中獲取。目前我國(guó)的23個(gè)省、4個(gè)直轄市、2個(gè)特別行政區(qū)、5個(gè)自治區(qū)已基本擁有自己的數(shù)字博物館。除此之外,獲取途徑還包括一些特殊的文博單位,例如故宮博物院、南京博物院以及敦煌研究院。值得一提的是,高校作為教育機(jī)構(gòu),一般沒(méi)有數(shù)字博物館,但很多高校有自己的實(shí)體博物館,并在向文物實(shí)體的數(shù)字化方向轉(zhuǎn)變。
信息預(yù)處理模塊主要是針對(duì)收集的館藏文物信息和數(shù)據(jù)進(jìn)行基本的預(yù)處理,經(jīng)過(guò)預(yù)處理之后的館藏文物信息就可以進(jìn)入信息組織階段。這一模塊是形成待組織館藏文物信息資源的重要階段,主要是通過(guò)信息分類(lèi)、信息過(guò)濾、信息抽取等信息預(yù)處理技術(shù)完成,為下一步做好充分的準(zhǔn)備。信息預(yù)處理主要是針對(duì)目標(biāo)數(shù)據(jù)集中的信息數(shù)據(jù)結(jié)構(gòu)不一致、無(wú)用信息、信息缺失等問(wèn)題,采用相應(yīng)的信息預(yù)處理技術(shù)進(jìn)行處理,從而形成所需的館藏文物資源信息。
3.2.1 信息分類(lèi)
信息分類(lèi)主要是利用已有的分類(lèi)標(biāo)準(zhǔn)對(duì)館藏文物信息資源進(jìn)行大致分類(lèi),否則收集的數(shù)據(jù)將是雜亂、無(wú)法進(jìn)行處理的,再將館藏文物根據(jù)不同的屬性劃分到不同的類(lèi)別中。如陳端志[14]在《博物館學(xué)通論》中,將博物館藏品分為歷史、藝術(shù)、考古三大類(lèi)。曾昭燏等[15]在《博物館》中,針對(duì)博物館藏品,按歷史、藝術(shù)、科學(xué)、工藝四大類(lèi)進(jìn)行分類(lèi)。何直剛[16]根據(jù)藏品的基本屬性,分為六大類(lèi),即政治經(jīng)濟(jì)(附法律、軍事)、文化藝術(shù)、禮儀宗教、生產(chǎn)工具、生活用具、其他(人類(lèi)、動(dòng)物骨架、化石等)。除此之外,還有很多的分類(lèi)標(biāo)準(zhǔn),但目前館藏文物分類(lèi)體系維度單一、粒度粗糙、類(lèi)目設(shè)置不嚴(yán)謹(jǐn)?shù)葐?wèn)題普遍存在[17]。本文在參考已有館藏文物分類(lèi)標(biāo)準(zhǔn)的基礎(chǔ)上,根據(jù)國(guó)家文物局發(fā)布的《館藏文物登錄規(guī)范》[18]將館藏文物分為35類(lèi),所收集的館藏文物信息首先依據(jù)這35類(lèi)進(jìn)行大致劃分,通過(guò)初步的信息分類(lèi),為后續(xù)信息處理做好準(zhǔn)備。
3.2.2 信息過(guò)濾
信息過(guò)濾是在完成信息分類(lèi)后的下一步驟,主要是完成對(duì)不必要的信息和不需要的信息進(jìn)行刪除、清洗等操作。一般情況下,由于文物的特殊性,很多資料無(wú)從查找,文物屬性字段的內(nèi)容有些是缺失的,而不必要信息存在的可能性不大。
3.2.3 信息抽取
由于信息的分散性、信息來(lái)源的異構(gòu)性等特點(diǎn)的存在,館藏文物信息抽取主要為元數(shù)據(jù)加工奠定基礎(chǔ),根據(jù)元數(shù)據(jù)加工的標(biāo)準(zhǔn)和要求,解決信息數(shù)據(jù)結(jié)構(gòu)不一致的情況,從非結(jié)構(gòu)化的文本中抽取相關(guān)信息,能夠在元數(shù)據(jù)加工階段快速找到和瀏覽有用信息。同時(shí)對(duì)不符合條件和要求的屬性?xún)?nèi)容進(jìn)行部分修改,以保持信息結(jié)構(gòu)的基本一致性。
經(jīng)過(guò)信息準(zhǔn)備階段獲取處理的信息已經(jīng)成為待組織的館藏文物信息資源,接下來(lái)需要進(jìn)入元數(shù)據(jù)加工模塊。此處所提的元數(shù)據(jù)加工主要是針對(duì)館藏文物信息資源知識(shí)節(jié)點(diǎn)進(jìn)行表示,是本體組織模塊的前提和基礎(chǔ),元數(shù)據(jù)加工模塊和本體組織模塊又共同構(gòu)成館藏文物信息資源組織的信息組織階段,也是可視化技術(shù)在館藏文物資源信息組織與服務(wù)中應(yīng)用的最核心階段。
元數(shù)據(jù)加工模塊的關(guān)鍵支撐技術(shù)是元數(shù)據(jù)技術(shù),本模塊通過(guò)建立館藏文物信息資源元數(shù)據(jù)標(biāo)準(zhǔn)從而描述館藏文物知識(shí)地圖的節(jié)點(diǎn)知識(shí),以形成館藏文物節(jié)點(diǎn)知識(shí)體系的模塊。元數(shù)據(jù)主要是描述館藏文物信息資源的微觀(guān)結(jié)構(gòu),如文物名稱(chēng)、文物類(lèi)型、館藏機(jī)構(gòu)等,元數(shù)據(jù)在進(jìn)行館藏文物信息資源描述的同時(shí),不僅可以對(duì)館藏文物進(jìn)行知識(shí)發(fā)現(xiàn),同時(shí)也是實(shí)現(xiàn)語(yǔ)義組織的基礎(chǔ),具有描述、標(biāo)識(shí)、查找以及獲取等功能。其中,元數(shù)據(jù)的描述功能是最基本也是最根本的功能,在元數(shù)據(jù)描述的基礎(chǔ)上再借助本體實(shí)現(xiàn)語(yǔ)義層面的互聯(lián)。
由于元數(shù)據(jù)標(biāo)準(zhǔn)的不一致,不同文物館藏單位所采用的文物元數(shù)據(jù)標(biāo)準(zhǔn)不一致,在無(wú)法統(tǒng)一館藏文物元數(shù)據(jù)標(biāo)準(zhǔn)的情況下,就會(huì)涉及元數(shù)據(jù)互操作的問(wèn)題[19]。由于不同元數(shù)據(jù)標(biāo)準(zhǔn)的差異性,使得元數(shù)據(jù)標(biāo)準(zhǔn)之間不能彼此兼容,就降低了元數(shù)據(jù)之間的互操作,需要通過(guò)元數(shù)據(jù)的映射來(lái)解決元數(shù)據(jù)互操作的問(wèn)題。
經(jīng)過(guò)元數(shù)據(jù)加工模塊處理之后的數(shù)據(jù)知識(shí)是單個(gè)的知識(shí)節(jié)點(diǎn),本體組織模塊的主要目的是發(fā)現(xiàn)知識(shí)之間的關(guān)聯(lián),通過(guò)知識(shí)關(guān)聯(lián)使館藏文物信息資源貫穿在一起,形成結(jié)構(gòu)化的知識(shí)體系。本體組織模塊是元數(shù)據(jù)加工模塊和可視化表達(dá)模塊的中介,雜亂的知識(shí)節(jié)點(diǎn)很難以可視化的形式進(jìn)行表達(dá),通過(guò)知識(shí)關(guān)聯(lián)將知識(shí)節(jié)點(diǎn)聯(lián)系在一起,再以可視化的方式進(jìn)行表達(dá),本體組織模塊在信息組織階段占有舉足輕重的地位和作用。
本體組織模塊的主要支撐技術(shù)是本體技術(shù),本體具有概念化(conceptualization)、明確性(explicit)、形式化(formal)、共享性(share)等特點(diǎn)[20],非常符合本研究的需要,館藏文物資源信息組織的關(guān)鍵也在于實(shí)現(xiàn)具有共享特征的館藏文物知識(shí)的規(guī)范化說(shuō)明,這與本體的定義不謀而合[21]。本研究通過(guò)構(gòu)建館藏文物本體,實(shí)現(xiàn)館藏文物知識(shí)的關(guān)聯(lián)化,從中發(fā)現(xiàn)館藏文物的關(guān)聯(lián)知識(shí),同時(shí)也為可視化表達(dá)奠定基礎(chǔ)。本研究采用知識(shí)地圖作為可視化表達(dá)的主要技術(shù),而館藏文物知識(shí)地圖的構(gòu)建也主要通過(guò)館藏文物本體來(lái)實(shí)現(xiàn),因此本體技術(shù)也使得元數(shù)據(jù)與知識(shí)地圖之間產(chǎn)生了關(guān)聯(lián),對(duì)館藏文物資源信息組織的研究起到極大的促進(jìn)作用。
可視化表達(dá)模塊是館藏文物資源信息組織與服務(wù)的最后一個(gè)模塊,是本研究所要實(shí)現(xiàn)的最終目標(biāo),主要是通過(guò)知識(shí)節(jié)點(diǎn)表示、知識(shí)關(guān)聯(lián)表示并進(jìn)行可視化輸出來(lái)完成,本模塊形成了再生館藏文物知識(shí)資源??梢暬磉_(dá)模塊是將數(shù)據(jù)與用戶(hù)進(jìn)行連接的橋梁,通過(guò)知識(shí)服務(wù)的形式達(dá)到館藏文物信息資源知識(shí)共享、知識(shí)利用、知識(shí)創(chuàng)新等,是可視化技術(shù)在館藏文物資源信息組織與服務(wù)的最終階段,只有通過(guò)可視化表達(dá)模塊,經(jīng)過(guò)以上四大模塊處理后的信息才能轉(zhuǎn)化為知識(shí)供用戶(hù)使用并進(jìn)行知識(shí)發(fā)現(xiàn)。
本文中可視化表達(dá)模塊的支撐技術(shù)是知識(shí)地圖技術(shù),知識(shí)地圖的輸出結(jié)果主要是經(jīng)過(guò)整合之后的知識(shí)內(nèi)容,并且以可視化的形式描述知識(shí)資源,知識(shí)地圖不僅可以鏈接知識(shí)內(nèi)容,也可以鏈接知識(shí)線(xiàn)索便于知識(shí)發(fā)現(xiàn)。本研究中館藏文物知識(shí)通過(guò)知識(shí)地圖這種可視化技術(shù)可以將雜亂的館藏文物信息和知識(shí)形象生動(dòng)地呈現(xiàn)在用戶(hù)面前,包括知識(shí)節(jié)點(diǎn)的表示、知識(shí)關(guān)聯(lián)的表示,用戶(hù)可以通過(guò)館藏文物知識(shí)地圖準(zhǔn)確地找到所需知識(shí),為館藏文物知識(shí)提供一種高效的知識(shí)導(dǎo)航工具。
(1)信息準(zhǔn)備階段。青銅器是世界文明的一種象征,而中國(guó)的青銅器在世界青銅器中享有非常高的聲譽(yù)。中國(guó)發(fā)展史上著名的青銅器時(shí)代包括夏、商、西周、春秋及戰(zhàn)國(guó)早期,延續(xù)時(shí)間1 600余年,中國(guó)青銅器制作精美,極具藝術(shù)價(jià)值,代表著中國(guó)四千多年青銅發(fā)展的高超技術(shù)與文化。青銅器文物作為中國(guó)文物的典型代表,具有十分重要的研究意義和學(xué)術(shù)價(jià)值。因此,本文以青銅器為例進(jìn)行實(shí)證研究。
本研究主要通過(guò)各個(gè)數(shù)字博物館搜集典型的青銅器類(lèi)館藏文物的信息,在此基礎(chǔ)上對(duì)信息進(jìn)行一定的分類(lèi)、過(guò)濾和抽取,最終收集到后母戊鼎、三羊銅罍、曾侯乙編鐘、大禾人面紋方鼎、東漢銅車(chē)馬、伏鳥(niǎo)雙尾青銅虎、鈴首曲柄青銅短劍等31個(gè)青銅器文物的一些基本信息。
(2)信息組織階段。通過(guò)設(shè)計(jì)青銅器類(lèi)館藏文物的元數(shù)據(jù)以及本體構(gòu)建實(shí)現(xiàn)館藏文物信息資源組織的前期階段,應(yīng)用統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)對(duì)館藏文物進(jìn)行著錄,能夠?qū)Σ煌瑏?lái)源、不同內(nèi)容的館藏文物進(jìn)行有效揭示,同時(shí)還可以實(shí)現(xiàn)信息資源的整合。但元數(shù)據(jù)標(biāo)準(zhǔn)僅是對(duì)文物實(shí)體個(gè)體的描述,并沒(méi)有建立起這一個(gè)領(lǐng)域的文物之間的關(guān)系,因此需要在元數(shù)據(jù)的基礎(chǔ)上對(duì)青銅類(lèi)館藏文物進(jìn)行本體的設(shè)計(jì)與開(kāi)發(fā),以建立青銅類(lèi)館藏文物之間的知識(shí)關(guān)聯(lián)。本研究主要利用本體編輯工具Protégé實(shí)現(xiàn),結(jié)合文物元數(shù)據(jù)信息,基于CIDOCCRM本體構(gòu)建青銅器本體(見(jiàn)圖3)。
圖3 青銅器本體(部分)
(3)信息應(yīng)用階段。在信息應(yīng)用階段,本研究主要選用The Brain知識(shí)地圖工具對(duì)館藏文物信息資源進(jìn)行知識(shí)可視化。The Brain可以無(wú)限制展現(xiàn)知識(shí)之間的關(guān)聯(lián),在一級(jí)類(lèi)目下可以有多個(gè)子類(lèi)目,甚至還可以存在跳躍類(lèi)目。例如,在本研究中,根據(jù)每一個(gè)青銅器所收集的信息著錄元數(shù)據(jù)后,該青銅器的數(shù)字圖像以及所有元數(shù)據(jù)著錄信息都可以以知識(shí)元素的方式呈現(xiàn),便于用戶(hù)對(duì)青銅器文物知識(shí)的精確查詢(xún),同時(shí)還可以知識(shí)地圖可視化的形式呈現(xiàn)出來(lái),便于用戶(hù)通過(guò)視覺(jué)表征發(fā)現(xiàn)新知識(shí),有助于對(duì)知識(shí)的再創(chuàng)造。除此之外,還可以以知識(shí)地圖可視化的形式展示其不同層級(jí)上位類(lèi)的實(shí)例及其知識(shí)關(guān)聯(lián),并以網(wǎng)狀結(jié)構(gòu)進(jìn)行呈現(xiàn),而非單純的線(xiàn)性結(jié)構(gòu)。因此,既可以呈現(xiàn)青銅器的各個(gè)類(lèi)型以及各個(gè)青銅器類(lèi)型之間的關(guān)聯(lián),也可以呈現(xiàn)青銅器類(lèi)型與青銅器知識(shí)節(jié)點(diǎn)之間的關(guān)聯(lián),還可以看出青銅器知識(shí)節(jié)點(diǎn)與知識(shí)節(jié)點(diǎn)之間的關(guān)聯(lián),這就將所有的青銅器類(lèi)型貫穿在一個(gè)網(wǎng)絡(luò)中,用戶(hù)可以一目了然,極大地增加了用戶(hù)檢索查詢(xún)的便利性,縮短了用戶(hù)的檢索時(shí)間,提高了效率,充分體現(xiàn)了可視化技術(shù)在館藏文物資源信息組織與服務(wù)中應(yīng)用的作用和價(jià)值。
本文基于信息資源組織的一般過(guò)程,結(jié)合館藏文物的資源特點(diǎn),并從知識(shí)可視化的角度,在借鑒前人研究的基礎(chǔ)上,構(gòu)建可視化技術(shù)在館藏文物資源信息組織與服務(wù)中應(yīng)用的框架,并分析該框架的功能,從數(shù)字化和可視化的角度對(duì)館藏文物信息資源組織進(jìn)行了探索性的嘗試。由于館藏文物信息資源的多樣性和異構(gòu)性,基于可視化技術(shù)的館藏文物信息資源的組織與服務(wù)工作還需融入新技術(shù)與新理念,將智能化技術(shù)與服務(wù)融入館藏文物信息資源組織中,以期為整個(gè)文博事業(yè)的發(fā)展提供一定的借鑒,促進(jìn)館藏文物知識(shí)的創(chuàng)新及再利用,實(shí)現(xiàn)館藏文物的文化知識(shí)傳承。