面向數(shù)字人文的典籍圖像深度揭示與利用*

2022-10-10 05:51:40錢智勇陳濤張志美徐宇紅何書

大學(xué)圖書館學(xué)報(bào) 2022年5期

□錢智勇陳濤張志美徐宇紅何書

“典籍”最早是指記載先祖法度或國(guó)家法則的重要文獻(xiàn)，后被用作各種書籍的統(tǒng)稱[1]。典籍中的圖像又稱插圖，在寫本時(shí)期，典籍中包含了大量的插圖。南宋鄭樵《通志·圖譜略·索象篇》記載：“古之學(xué)者為學(xué)有要，置圖于左，置書于右，索象于圖，索理于書?！笨梢钥闯龉糯鷮W(xué)者治學(xué)過(guò)程中圖像與文字不可分割的關(guān)系。圖書館、博物館、檔案館等典藏機(jī)構(gòu)收藏大量典籍圖像載體，包括書影、印譜、地圖、卷軸、樂(lè)譜、手稿、檔案圖像等類型[2]，這些典籍圖像是寶貴的文化遺產(chǎn)，圖像數(shù)字化建設(shè)是數(shù)字人文基礎(chǔ)設(shè)施的重要內(nèi)容。利用國(guó)際圖像互操作框架(International Image Interoperability Framework，IIIF)與關(guān)聯(lián)數(shù)據(jù)描述框架可實(shí)現(xiàn)對(duì)典籍圖像深度揭示和語(yǔ)義關(guān)聯(lián)，使典籍圖像在數(shù)字人文中發(fā)揮重要價(jià)值與作用：(1)“以圖證史”作用。通過(guò)對(duì)典籍圖像高清圖呈現(xiàn)和內(nèi)容深度揭示，增強(qiáng)了圖像還原史實(shí)、以圖證史的文獻(xiàn)考證價(jià)值[3]。(2)“圖像敘事”作用。在碎片化閱讀時(shí)代，“圖像正以前所未有的力量從文化的每個(gè)層面向我們壓來(lái)”[4]，典籍中的圖像與文字通過(guò)互注、互文、互釋、互讀等方式實(shí)現(xiàn)文本敘事功能，為讀者呈現(xiàn)圖文同現(xiàn)的敘事效果。(3)增強(qiáng)典籍多媒介傳播作用。文學(xué)圖像化改變了文學(xué)傳播的場(chǎng)域、傳播方式及傳播理念，圖像與文本的深度關(guān)聯(lián)，可以互相帶動(dòng)彼此在異域文化的深入傳播，并可啟發(fā)不同民族的讀者對(duì)典籍作品的深層認(rèn)知[5]。

1 國(guó)內(nèi)外相關(guān)研究

基于元數(shù)據(jù)規(guī)范組織典籍圖像，揭示圖像的特征、主題、分類、創(chuàng)作者、館藏、版本等內(nèi)容，但讀者難以快速檢索典籍圖像內(nèi)容及其所蘊(yùn)含的背景知識(shí)，典籍與圖像分離，成為信息孤島，難以廣泛傳播與利用，因此需要對(duì)典籍圖像內(nèi)容進(jìn)行細(xì)粒度知識(shí)組織。近年，學(xué)者圍繞數(shù)字圖像內(nèi)容組織與利用進(jìn)行了許多研究。在國(guó)內(nèi)，曾子明等提出面向數(shù)字人文的圖像語(yǔ)義描述模型[6]。張永娟等依據(jù)IIIF整合印譜圖像資源，輔助知識(shí)發(fā)現(xiàn)[7]。王曉光等構(gòu)建敦煌壁畫主題詞表、敦煌石窟本體及相關(guān)數(shù)據(jù)模型[8]。陳濤等通過(guò)IIIF與人工智能相結(jié)合，構(gòu)建沉浸式交互平臺(tái)，實(shí)現(xiàn)圖像資源標(biāo)注與發(fā)布[9]。楊佳瑩等通過(guò)報(bào)紙廣告本體模型，準(zhǔn)確揭示廣告圖像文本信息[10]。在國(guó)外，鄧斯特(Dunst A)等人研究圖形敘事語(yǔ)料庫(kù)，采用XML注釋標(biāo)題和全文示例[11]。斯托克(Stork L)等人通過(guò)全文轉(zhuǎn)錄和實(shí)體提取，直接標(biāo)記和注釋手寫檔案中的圖像文檔內(nèi)容[12]。程學(xué)芳(Cheng X F)等人構(gòu)建多層語(yǔ)義描述框架，描述圖像的內(nèi)涵語(yǔ)義信息[13]。亞勒米蘇·阿布加茲(Abgaz Y)等人提出一種利用人工智能技術(shù)挖掘文化遺產(chǎn)數(shù)字圖像中人文信息的方法[14]。

以上相關(guān)研究表明，在標(biāo)注模型構(gòu)建、古籍自動(dòng)識(shí)別、實(shí)體提取、圖像互操作、本體、關(guān)聯(lián)數(shù)據(jù)與人工智能應(yīng)用結(jié)合等方面，已經(jīng)取得了許多研究成果和技術(shù)工具，可以實(shí)現(xiàn)圖像元數(shù)據(jù)聚合、國(guó)際圖像互操作、圖像關(guān)聯(lián)數(shù)據(jù)與本體詞表開(kāi)放數(shù)據(jù)服務(wù)。在典籍圖像中的古籍文本內(nèi)容深層標(biāo)注、圖像認(rèn)知計(jì)算、語(yǔ)義檢索、數(shù)字人文深度應(yīng)用等方面尚有進(jìn)一步拓展研究的空間。本文參考已有研究方法與技術(shù)，依據(jù)圖像元數(shù)據(jù)規(guī)范、資源描述框架和國(guó)際圖像互操作標(biāo)準(zhǔn)，研究典籍圖像深度揭示與利用的實(shí)現(xiàn)路徑與方法，構(gòu)建面向數(shù)字人文的典籍圖像數(shù)字化和深度語(yǔ)義標(biāo)注的模型架構(gòu)，并以《爾雅音圖》為例進(jìn)行文本圖像的數(shù)字掃描、文本識(shí)別，通過(guò)《爾雅》多語(yǔ)語(yǔ)義詞表與《爾雅》圖像語(yǔ)義關(guān)聯(lián)，深度揭示《爾雅》詞匯和圖像中的背景知識(shí)，進(jìn)一步探究《爾雅》圖像的以圖證史、圖像敘事、多媒介傳播等數(shù)字人文應(yīng)用場(chǎng)景。

2 典籍圖像深度揭示的相關(guān)標(biāo)準(zhǔn)規(guī)范

典籍圖像深度揭示是以圖像元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范、資源描述框架理論、國(guó)際圖像互操作框架為依據(jù)，實(shí)現(xiàn)基于圖像內(nèi)容的細(xì)粒度語(yǔ)義標(biāo)注、檢索、發(fā)現(xiàn)和開(kāi)放共享服務(wù)。

2.1 圖像元數(shù)據(jù)標(biāo)準(zhǔn)

圖像元數(shù)據(jù)標(biāo)準(zhǔn)是描述和限定圖像數(shù)據(jù)對(duì)象所需要的一系列原則的集合[15]。都柏林元數(shù)據(jù)標(biāo)準(zhǔn)(以下簡(jiǎn)稱DC)對(duì)圖像內(nèi)容描述的核心元素包括題名、主題、描述、來(lái)源、關(guān)聯(lián)和范圍。已有的圖像元數(shù)據(jù)標(biāo)準(zhǔn)主要有描述藝術(shù)品、建筑物等類目的元數(shù)據(jù)標(biāo)準(zhǔn)(以下簡(jiǎn)稱CDWA)、描述視覺(jué)及圖像資料類目的元數(shù)據(jù)(以下簡(jiǎn)稱VRA Core)、數(shù)字圖書館圖像元數(shù)據(jù)標(biāo)準(zhǔn)(以下簡(jiǎn)稱CDL)、描述靜態(tài)數(shù)字圖像的元數(shù)據(jù)標(biāo)準(zhǔn)(以下簡(jiǎn)稱TMI)等[16]?，F(xiàn)有標(biāo)準(zhǔn)主要關(guān)注整體圖像的不同屬性和圖像集合之間的同質(zhì)性，對(duì)圖像的外部特征進(jìn)行詳細(xì)描述，在對(duì)圖像內(nèi)容進(jìn)行描述時(shí)，不同元數(shù)據(jù)集的元素之間可以建立映射關(guān)系，表1展示了DC核心元素與CDWA、VRA Core描述圖像內(nèi)容的元素映射。通過(guò)不同元數(shù)據(jù)標(biāo)準(zhǔn)之間的元素映射，再結(jié)合資源描述框架以及國(guó)際圖像互操作標(biāo)準(zhǔn)，可以對(duì)圖像數(shù)字對(duì)象的內(nèi)容特征進(jìn)行語(yǔ)義描述，多維度實(shí)現(xiàn)典籍圖像深度揭示與內(nèi)容檢索。

表1 描述圖像內(nèi)容的DC核心元素與CDWA、VRA Core映射表

2.2 資源描述框架

資源描述框架(以下簡(jiǎn)稱RDF)是國(guó)際語(yǔ)義網(wǎng)聯(lián)盟(以下簡(jiǎn)稱W3C)推出的用于對(duì)結(jié)構(gòu)化元數(shù)據(jù)進(jìn)行編碼、交換與再利用的基礎(chǔ)架構(gòu)，它提供一致化描述領(lǐng)域資源的機(jī)制，并允許不同的使用者根據(jù)需要擴(kuò)展元數(shù)據(jù)，編制人機(jī)可讀的領(lǐng)域詞匯表，此外還提供結(jié)構(gòu)化的相互兼容機(jī)制，為基于XML的各種不同元數(shù)據(jù)提供相互利用與轉(zhuǎn)換的平臺(tái)[17]。RDF提供了圖像資源對(duì)象描述的開(kāi)放數(shù)據(jù)模型，該模型由資源、屬性、聲明組成，每個(gè)資源都被賦予一個(gè)URI，讀者既可獲取資源本身，又可獲取資源對(duì)象的內(nèi)容描述。屬性是指資源對(duì)象之間的關(guān)系。聲明明確了資源對(duì)象的屬性，RDF使用圖形化方式書寫相同聲明。如果許多RDF文檔使用不同的元數(shù)據(jù)標(biāo)準(zhǔn)標(biāo)識(shí)了相同的圖像資源，通過(guò)聚合工具自動(dòng)收集關(guān)于該資源的元數(shù)據(jù)并將所有開(kāi)放數(shù)據(jù)融合起來(lái)，開(kāi)放數(shù)據(jù)詞匯表可以通過(guò)數(shù)據(jù)接口被獲取并緩存到本地服務(wù)器中，以便快速訪問(wèn)，這為數(shù)字人文提供了盡可能廣泛的圖像數(shù)據(jù)及其屬性關(guān)聯(lián)。

2.3 國(guó)際圖像互操作框架

國(guó)際圖像互操作框架(IIIF)是由英國(guó)國(guó)家圖書館、牛津大學(xué)圖書館、哈佛大學(xué)等29個(gè)著名館藏機(jī)構(gòu)協(xié)作制定的一組支持館藏?cái)?shù)字圖像資源互操作的框架標(biāo)準(zhǔn)，提供操作與訪問(wèn)圖像資源的統(tǒng)一標(biāo)準(zhǔn)與方法，對(duì)典籍圖像資源進(jìn)行統(tǒng)一的在線組織、展示、檢索與應(yīng)用，以促進(jìn)全球圖像資源的互操作與開(kāi)放獲取[18]。IIIF框架通過(guò)定義一組通用的應(yīng)用程序接口(API)規(guī)范實(shí)現(xiàn)圖像資源互操作性與可獲取性。IIIF提供的應(yīng)用接口包括：圖像API(Image API)、呈現(xiàn)API(Presentation API)、檢索API(Search API) 與授權(quán)API(Authentication API)[19]。圖像API提供了圖像處理的方法[20]，呈現(xiàn)API提供了用于構(gòu)造圖像和圖像相關(guān)資源集合的數(shù)據(jù)模型[21]。檢索API通過(guò)擴(kuò)展的標(biāo)準(zhǔn)參數(shù)檢索圖像元數(shù)據(jù)[22]。授權(quán)API通過(guò)注冊(cè)驗(yàn)證，對(duì)圖像資源進(jìn)行權(quán)限控制[23]。IIIF還開(kāi)發(fā)了資源發(fā)現(xiàn)應(yīng)用程序[24]和具有圖像策展功能的應(yīng)用程序接口[25]。關(guān)聯(lián)數(shù)據(jù)和IIIF資源之間的雙向關(guān)系豐富了數(shù)據(jù)集的語(yǔ)義，這些規(guī)范和標(biāo)準(zhǔn)為典籍圖像的深度揭示提供了技術(shù)支撐。

3 典籍圖像深度揭示與利用模型架構(gòu)

典籍圖像深度揭示與利用模型的構(gòu)建目標(biāo)是以圖像元數(shù)據(jù)、資源描述框架和國(guó)際圖像互操作標(biāo)準(zhǔn)為基礎(chǔ)，對(duì)典籍圖像進(jìn)行數(shù)字化和內(nèi)容深度標(biāo)注，實(shí)現(xiàn)圖像與內(nèi)外部文獻(xiàn)實(shí)體的語(yǔ)義關(guān)聯(lián)，提高典籍圖像的可理解性，促進(jìn)典籍?dāng)?shù)字人文應(yīng)用。圖1展示的模型框架由典籍圖像數(shù)字化組織與存儲(chǔ)、圖像深度標(biāo)注與語(yǔ)義關(guān)聯(lián)、數(shù)字人文應(yīng)用研究等三個(gè)相互關(guān)聯(lián)的模塊組成。

圖1 典籍圖像深度揭示與利用模型架構(gòu)

3.1 典籍圖像數(shù)字化

紙媒典籍?dāng)?shù)字化是采用高清掃描儀等數(shù)字設(shè)備，對(duì)選定的典籍文本、圖像進(jìn)行掃描并轉(zhuǎn)化為能被計(jì)算機(jī)識(shí)別的數(shù)字符號(hào)，再通過(guò)圖像OCR識(shí)別、元數(shù)據(jù)組織等方式建成典籍全文和圖像數(shù)據(jù)庫(kù)。

第一步，掃描典籍文本。將文獻(xiàn)或圖片資料按原貌逐頁(yè)掃描并存儲(chǔ)為圖像文件。掃描圖像后，可能存在圖像傾斜、文字不清晰、版心不正等問(wèn)題，需要進(jìn)行圖像編輯校正、二值化處理，圖像二值化處理可以較為真實(shí)模擬還原典籍的原始形態(tài)，保證文獻(xiàn)的真實(shí)性，并可有效提高OCR識(shí)別率[26]。在IIIF圖像API中，每個(gè)掃描的圖像都被設(shè)置唯一的圖像URI標(biāo)識(shí)，圖像API基于標(biāo)準(zhǔn)HTTP請(qǐng)求返回圖像的Web服務(wù)，對(duì)圖像平移和縮放只需在HTTP請(qǐng)求的URI中提供區(qū)域坐標(biāo)和大小參數(shù)，IIIF服務(wù)器即可轉(zhuǎn)換原始圖像。

第二步，OCR識(shí)別。對(duì)掃描處理后的典籍圖像進(jìn)行文本識(shí)別，實(shí)現(xiàn)機(jī)器可閱讀的全文生成，是數(shù)字人文的基礎(chǔ)工作，利用OCR技術(shù)可以進(jìn)行各種印刷字體圖文版面的識(shí)別。難點(diǎn)在于如何準(zhǔn)確識(shí)別典籍中的手寫字、異體字等各種變體，為了提高OCR識(shí)別的準(zhǔn)確率，可將OCR技術(shù)與深度學(xué)習(xí)相結(jié)合，通過(guò)特征映射讓深度卷積神經(jīng)網(wǎng)絡(luò)(以下簡(jiǎn)稱Deep CNN)去學(xué)習(xí)古文字的整體或偏旁的各種變體的一致性特征，然后將訓(xùn)練好的Deep CNN用于識(shí)別模型未見(jiàn)過(guò)的其他變體[27]。典籍全文生成可采用OCR機(jī)器識(shí)別和眾包方式的手工輸入有效交互的方法進(jìn)行，添加OCR的眾包工具有助于準(zhǔn)確識(shí)別異體字[28]。

第三步，元數(shù)據(jù)組織。參考國(guó)外圖像元數(shù)據(jù)標(biāo)準(zhǔn)和國(guó)家圖書館元數(shù)據(jù)規(guī)范[29]，結(jié)合特定館藏的描述需求，映射和復(fù)用典籍圖像核心元素和著錄規(guī)則，據(jù)此進(jìn)行圖像元數(shù)據(jù)標(biāo)注。揭示圖像內(nèi)容的核心元素包括：對(duì)象主題、對(duì)象分類、創(chuàng)作朝代、創(chuàng)作地點(diǎn)、相關(guān)典籍記載、風(fēng)格、文化、語(yǔ)種、責(zé)任者相關(guān)描述等。IIIF呈現(xiàn)API定義了描述圖像的標(biāo)準(zhǔn)模型，提供添加元數(shù)據(jù)的功能，可將任何圖像或區(qū)域描述為一個(gè)有序的集合，包含清單、序列、畫布、內(nèi)容的基本結(jié)構(gòu)。不同館藏通過(guò)IIIF圖像服務(wù)器發(fā)布出來(lái)的圖像可利用發(fā)布URI接口進(jìn)行重新組織和圖像互操作。

3.2 典籍圖像深度標(biāo)注與語(yǔ)義關(guān)聯(lián)

深度標(biāo)注是通過(guò)元數(shù)據(jù)集對(duì)特定典籍圖像進(jìn)行基于內(nèi)容的細(xì)粒度知識(shí)標(biāo)引，來(lái)提高圖像的可理解性。語(yǔ)義關(guān)聯(lián)是通過(guò)IIIF與資源描述框架對(duì)典籍圖像進(jìn)行內(nèi)部和外部詞表的語(yǔ)義關(guān)聯(lián)，以揭示圖像的語(yǔ)義知識(shí)，并將圖像與其他數(shù)字資源進(jìn)行整合。根據(jù)典籍圖像的存儲(chǔ)異構(gòu)性、格式多樣性、內(nèi)容離散性等特點(diǎn)，我們提出深度揭示典籍圖像的實(shí)現(xiàn)路徑：以構(gòu)建典籍多語(yǔ)語(yǔ)義詞表為基礎(chǔ)，嵌入語(yǔ)義標(biāo)注工具集，對(duì)典籍文獻(xiàn)進(jìn)行深度語(yǔ)義標(biāo)注與多維度關(guān)聯(lián)，并與相關(guān)資源進(jìn)行整合。典籍多語(yǔ)語(yǔ)義詞表是對(duì)多語(yǔ)種典籍文獻(xiàn)中音、形、義相同或相似的字詞進(jìn)行集中揭示的詞匯表，整個(gè)圖像和子圖像標(biāo)注都可以使用詞表中的控制詞匯術(shù)語(yǔ)進(jìn)行語(yǔ)義索引。通過(guò)元數(shù)據(jù)標(biāo)注與關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)換、存儲(chǔ)與發(fā)布，完成典籍多語(yǔ)語(yǔ)義詞表的構(gòu)建，再結(jié)合外部領(lǐng)域詞表對(duì)典籍圖像文本進(jìn)行基于內(nèi)容的深度語(yǔ)義標(biāo)注。常用語(yǔ)義標(biāo)注工具有：CULTURA、CTEXT、TEXTGRID、MARKUS等文本標(biāo)注系統(tǒng)，提供自動(dòng)和手動(dòng)分詞標(biāo)注功能，還包括搜索功能和外部參考功能。我們依據(jù)IIIF和本體規(guī)范設(shè)計(jì)了典籍圖像深度標(biāo)注的層級(jí)結(jié)構(gòu)，如圖2所示，分為場(chǎng)景標(biāo)注、內(nèi)容標(biāo)注、語(yǔ)義標(biāo)注三個(gè)層次。

圖2 典籍圖像深度標(biāo)注層次

第一層場(chǎng)景標(biāo)注。根據(jù)圖像場(chǎng)景，標(biāo)注不同場(chǎng)景中的圖像。采用矩形、圓形、多邊形、自由標(biāo)注等工具進(jìn)行圖像輪廓及其特征標(biāo)注，并按主題對(duì)圖像場(chǎng)景進(jìn)行有序排列。第二層內(nèi)容標(biāo)注。對(duì)典籍、句子、詞匯及其句法關(guān)系等內(nèi)容進(jìn)行標(biāo)注。其中，句法關(guān)系包括典籍作品篇章之間的關(guān)系、句子結(jié)構(gòu)關(guān)系以及詞匯關(guān)系等。第三層語(yǔ)義標(biāo)注。對(duì)典籍實(shí)體概念的語(yǔ)義及其關(guān)系進(jìn)行深度標(biāo)注。典籍中的實(shí)體概念包括“人”“動(dòng)物”“地點(diǎn)”“時(shí)間”等概念類。“關(guān)系”包括概念層次關(guān)系和非層次關(guān)系。對(duì)典籍中的實(shí)體概念進(jìn)行語(yǔ)義標(biāo)注和屬性關(guān)聯(lián),可依據(jù)典籍多語(yǔ)語(yǔ)義詞表和相關(guān)本體詞表，利用自動(dòng)或手動(dòng)標(biāo)注工具，進(jìn)行基于自然語(yǔ)言處理的命名實(shí)體識(shí)別、標(biāo)注與抽取。實(shí)體之間概念層次關(guān)系可采用基于模板的方法半自動(dòng)標(biāo)注與提??；概念之間非層次關(guān)系主要指動(dòng)作，可通過(guò)基于監(jiān)督學(xué)習(xí)模型的方法，自動(dòng)抽取實(shí)體關(guān)聯(lián)的動(dòng)詞，實(shí)現(xiàn)典籍實(shí)體對(duì)象之間的語(yǔ)義關(guān)聯(lián)。

典籍圖像的深度揭示可以利用IIIF呈現(xiàn)API所定義的數(shù)據(jù)模型，實(shí)現(xiàn)典籍圖像資源與資源組織、標(biāo)注等操作相分離。它提供了用于構(gòu)造圖像和圖像相關(guān)資源集合的數(shù)據(jù)模型，以及通過(guò)清單文件在IIIF感知應(yīng)用程序之間進(jìn)行數(shù)據(jù)交換的方法。IIIF呈現(xiàn)API中的資源包括集合、清單、序列、畫布、注釋、注釋列表、范圍、層和內(nèi)容等。為了在呈現(xiàn)API中使用關(guān)聯(lián)數(shù)據(jù)控制的詞匯表，可以采用IIIF規(guī)范中定義的附加類型Annotation，將關(guān)聯(lián)數(shù)據(jù)分類中的概念連接到典籍圖像資源，可以將受控詞匯表中的主要資源主題URI插入IIIF畫布上的注釋資源中。通過(guò)IIIF檢索API可實(shí)現(xiàn)圖像標(biāo)注層面的檢索，還可利用IIIF發(fā)現(xiàn)API定義的基本資源列表、資源變更列表中記錄的圖像URI發(fā)布與變更信息，實(shí)現(xiàn)跨庫(kù)與跨條目檢索。

3.3 典籍圖像數(shù)字人文應(yīng)用

對(duì)典籍圖像數(shù)字化、深度標(biāo)注及語(yǔ)義關(guān)聯(lián)，再結(jié)合深度學(xué)習(xí)、文本挖掘、時(shí)空分析和社會(huì)網(wǎng)絡(luò)分析等技術(shù)，可實(shí)現(xiàn)典籍圖像以圖證史、圖像敘事、多媒介傳播等數(shù)字人文應(yīng)用。

首先，通過(guò)圖像比對(duì)、文獻(xiàn)考證等實(shí)現(xiàn)“以圖證史”。古籍中的圖像包括各種手繪插圖、印本木版插圖等紀(jì)實(shí)性原創(chuàng)圖畫，反映了古代社會(huì)歷史事件、人物形態(tài)、服飾、器具、宗教、建筑、音樂(lè)、動(dòng)物、植物以及山川河流等自然地理面貌。經(jīng)過(guò)高清掃描的典籍圖像真實(shí)還原了各個(gè)朝代社會(huì)發(fā)展形態(tài)以及人類衣食住行等物質(zhì)生活方式，經(jīng)過(guò)文本識(shí)別和內(nèi)容深度標(biāo)注，與不同館藏的同類圖像建立語(yǔ)義關(guān)聯(lián)，再結(jié)合機(jī)器學(xué)習(xí)進(jìn)行圖像特征識(shí)別，與出土文物及相關(guān)典籍進(jìn)行圖文比對(duì)和考證，可以實(shí)現(xiàn)以圖證史的數(shù)字人文研究。借助典籍圖像語(yǔ)義標(biāo)注平臺(tái)，人文學(xué)者在解讀古籍文字和圖像時(shí)可以參考和使用各種典籍?dāng)?shù)據(jù)庫(kù)資源，進(jìn)行分詞、標(biāo)注和聚類分析，輔助圖文考證的研究。將漢字和圖畫可視化為知識(shí)圖譜，可以激發(fā)學(xué)者探索考證新觀點(diǎn)以及公眾對(duì)典籍學(xué)習(xí)的興趣與認(rèn)知。

其次，通過(guò)場(chǎng)景標(biāo)注、主題索引等實(shí)現(xiàn)“圖像敘事”功能。在文學(xué)圖像化語(yǔ)境下，典籍圖像高清呈現(xiàn)與瀏覽改變了傳統(tǒng)文字的呈現(xiàn)形式，典籍呈現(xiàn)可以向圖文并茂甚至以圖為主的多媒體形式轉(zhuǎn)變，圖像和文字以互讀、互文、互釋等方式呈現(xiàn)圖像敘事功能。通過(guò)元數(shù)據(jù)映射建立基于故事的圖像索引系統(tǒng)，識(shí)別圖像中每個(gè)實(shí)體對(duì)象，分離并提取目標(biāo)元素及屬性，每一個(gè)元素都對(duì)應(yīng)一個(gè)語(yǔ)義概念。IIIF是描述圖像故事的基礎(chǔ)，提供了不同標(biāo)記區(qū)域之間的坐標(biāo)、形狀、顏色和重疊關(guān)系，可描述圖像中的主題和內(nèi)容，圖像資源的語(yǔ)義對(duì)象通過(guò)分類和互連被組織成圖結(jié)構(gòu)，每個(gè)故事或事件是通過(guò)圖像中的元素而不是自由文本來(lái)表現(xiàn)的，圖像中的設(shè)置和實(shí)體的變化隨時(shí)間和空間演變，這有助于讀者理解圖像，標(biāo)注的數(shù)據(jù)集使圖像通過(guò)深度學(xué)習(xí)可理解，領(lǐng)域詞匯和本體可以對(duì)標(biāo)注輸出進(jìn)行標(biāo)準(zhǔn)化。

最后，利用多種媒介實(shí)現(xiàn)典籍圖像在世界的傳播。文學(xué)圖像化改變了典籍文獻(xiàn)傳播的場(chǎng)域、方式與觀念。利用IIIF與RDF將分散在世界不同館藏的典籍圖像進(jìn)行組織、重構(gòu)和基于主題內(nèi)容的深度揭示，可開(kāi)發(fā)各種應(yīng)用API，如策展API可以將畫布中的圖像進(jìn)行任意形狀的裁剪切割，并添加元數(shù)據(jù)，還可從IIIF圖像典藏機(jī)構(gòu)收集相關(guān)主題的圖像，利用機(jī)器識(shí)別圖像并自動(dòng)添加標(biāo)簽，將圖像數(shù)據(jù)或文本文件按主題聚合在一起。IIIF發(fā)現(xiàn)API可以利用資源變更列表，對(duì)不同機(jī)構(gòu)、數(shù)據(jù)庫(kù)進(jìn)行多維檢索，分布在世界各地的典籍圖像資源在多種平臺(tái)上以多種格式被獲取和分享，再利用流媒體、網(wǎng)站、搜索引擎、微信公眾號(hào)、微博、頭條、推特、抖音等多媒介發(fā)布與傳播。讀者與創(chuàng)作者通過(guò)手機(jī)等移動(dòng)設(shè)備，利用沉浸式交互網(wǎng)絡(luò)平臺(tái)隨時(shí)進(jìn)行交流互動(dòng)、解讀欣賞典籍圖像、通過(guò)眾包參與圖像標(biāo)注與研究，促進(jìn)典籍的世界傳播與利用。

4 案例研究：《爾雅音圖》深度揭示與利用

本文選擇《爾雅音圖》作為典籍圖像深度揭示與利用案例，《爾雅》是我國(guó)古代最早的訓(xùn)詁名物的語(yǔ)言專著，匯釋了戰(zhàn)國(guó)秦漢間的語(yǔ)言文字材料，漢代被列入《五經(jīng)》，是古代儒生誦經(jīng)的必讀工具書[30]，歷代《爾雅》注本以郭璞《爾雅注》最具代表性，郭璞在《爾雅注序》中稱所作“別為《音》、《圖》，用祛未寤?！盵31]據(jù)《隋書·經(jīng)籍志》記載，郭璞注本有《爾雅音》二卷，《爾雅圖贊》二卷，當(dāng)時(shí)尚傳于世，可惜后來(lái)亡佚，僅散見(jiàn)于前代舊籍[32]。傳世《爾雅音圖》是清代兩淮都轉(zhuǎn)運(yùn)監(jiān)使曾燠于清嘉慶六年(1801年)據(jù)影宋本刊刻，全書有圖有注，注后有讀音，保留了大量古代語(yǔ)言資料，對(duì)音韻、語(yǔ)音及藝術(shù)研究均有重要參考價(jià)值。本文以浙江人民美術(shù)出版社影印出版的《爾雅音圖》[33](該書影印清嘉慶六年曾氏刻本)為底本進(jìn)行數(shù)字化、深度標(biāo)注與數(shù)字人文應(yīng)用的例證研究。

4.1 《爾雅音圖》數(shù)字化

《爾雅音圖》的數(shù)字化過(guò)程包括書稿掃描及圖像處理、文字OCR識(shí)別、元數(shù)據(jù)映射組織。

首先完成書稿掃描與圖像處理。將《爾雅音圖》中的圖像、文字、讀音、注釋等內(nèi)容按原貌逐頁(yè)精確掃描處理并存貯為圖像文件。選擇掃描精度，掃描分辨率一般控制在300-600dpi，掃描方式包括黑白掃描、灰度掃描和彩色掃描方式，保存格式按存儲(chǔ)大小依次為：tif 、gif、jpeg、jpg、png。圖像掃描處理過(guò)程：導(dǎo)入圖片→校正處理→二值化處理→圖像抹白處理。其中二值化處理可提高圖像的壓縮比率，縮小文獻(xiàn)的存儲(chǔ)空間，提高OCR識(shí)別率。圖像抹白處理可清除二值化處理后的圖片可能會(huì)產(chǎn)生的黑色區(qū)域。

其次對(duì)掃描后的圖像文字進(jìn)行OCR識(shí)別。例如識(shí)別釋詁中的第一句：“初哉首基肈兆祖元胎俶音叔落權(quán)輿始也”。先對(duì)其進(jìn)行矩形框選，點(diǎn)擊自動(dòng)OCR，調(diào)用外部OCR接口，可將OCR的結(jié)果顯示在JOCR部分，再進(jìn)行人工審核后，保存JOCR，完成自動(dòng)文字識(shí)別(見(jiàn)圖3)。系統(tǒng)可調(diào)用百度OCR、書同文OCR、漢王OCR等自動(dòng)OCR接口，可識(shí)別豎版古籍的常用漢字及其符號(hào)，對(duì)于部分異體字的識(shí)別可利用機(jī)器深度學(xué)習(xí)結(jié)合眾包方式標(biāo)注完成。將識(shí)別結(jié)果保存JOCR，為內(nèi)容標(biāo)注和語(yǔ)義關(guān)聯(lián)做好準(zhǔn)備。

圖3 自動(dòng)OCR識(shí)別與JOCR保存

最后，元數(shù)據(jù)組織是進(jìn)行圖像核心元素映射與書目數(shù)據(jù)轉(zhuǎn)化。通過(guò)映射DC、CDWA、VRA Core等元數(shù)據(jù)集：題目(DC:Title)|創(chuàng)建者(DC:Creator)|主題(DC:Subject) |分類(CDWA:Classification) |描述(VRA Core:Classification) |關(guān)聯(lián)(CDWA:Related works) |格式(DC:Format)|分類(CDWA:Classification)日期(DC:Date)|資源類型(VRA Core:Work type)|權(quán)限(CDWA:Copyright)|。創(chuàng)建《爾雅》圖像元數(shù)據(jù)核心元素集，依此進(jìn)行《爾雅音圖》實(shí)體對(duì)象標(biāo)注。再將標(biāo)注數(shù)據(jù)轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)的RDF 格式圖數(shù)據(jù)，存儲(chǔ)在三元組數(shù)據(jù)庫(kù)中，通過(guò) SPARQL進(jìn)行查詢與存取。

4.2 《爾雅音圖》深度標(biāo)注與語(yǔ)義關(guān)聯(lián)

《爾雅音圖》的深度標(biāo)注工具采用自主研發(fā)的多維圖像智慧系統(tǒng)，該系統(tǒng)是基于IIIF與RDF的沉浸式交互操作平臺(tái)(http://www.usources.cn/sas/ )，包括藏品檢索、藏品中心、集合中心、圖像標(biāo)注、圖像管理、SPARQL EDITOR和藏品賞析等7個(gè)模塊。藏品按照IIIF框架進(jìn)行組織，每個(gè)藏品有一個(gè)Manifest清單文件，系統(tǒng)核心功能是圖像標(biāo)注。我們依據(jù)典籍圖像深度標(biāo)注層次模型(見(jiàn)圖2)，利用系統(tǒng)圖像標(biāo)注模塊，進(jìn)行《爾雅音圖》的圖像標(biāo)注和語(yǔ)義關(guān)聯(lián)。

第一層，圖像輪廓標(biāo)注。《爾雅音圖》中的實(shí)體圖像包括人、鳥、魚、獸、畜、草、木、工具、建筑、天、地、山、水等名物實(shí)體，這些實(shí)體大多帶有背景環(huán)境，有不同的場(chǎng)景，因此先要根據(jù)圖像的不同場(chǎng)景進(jìn)行圖像實(shí)體的輪廓標(biāo)注，標(biāo)注輪廓的工具共有5種：點(diǎn)標(biāo)、矩形標(biāo)注、圓形標(biāo)注、多邊形標(biāo)注、自由標(biāo)注?！稜栄拧凡鍒D的實(shí)體標(biāo)注使用較多的是矩形標(biāo)注和自由標(biāo)注。一般在標(biāo)注輪廓較復(fù)雜、具有整體性內(nèi)涵以及都是文字的圖像時(shí)，使用矩形標(biāo)注；而在對(duì)人、動(dòng)物等輪廓較為清晰的圖像進(jìn)行標(biāo)注時(shí)，一般使用自由標(biāo)注，如圖4所示。利用圖形標(biāo)注工具，我們完成了《爾雅音圖》中630余幅圖像場(chǎng)景的輪廓標(biāo)注。

圖4 圖像輪廓標(biāo)注

第二層，實(shí)體對(duì)象標(biāo)注。《爾雅音圖》中的實(shí)體分類依據(jù)《爾雅》19大類：釋詁、釋言、釋訓(xùn)、釋親、釋宮、釋器、釋樂(lè)、釋天、釋地、釋丘、釋山、釋水、釋草、釋木、釋蟲、釋魚、釋鳥、釋獸、釋畜。例如標(biāo)注一種被稱作 “駂”(別名“烏驄”)的馬的實(shí)體圖像，首先選用多邊形標(biāo)注工具將圖像中的馬的實(shí)體標(biāo)出來(lái)(圖5左)，實(shí)體框選出來(lái)后，在彈出的標(biāo)注窗口(圖5右)上面輸入框中標(biāo)注《爾雅》圖像上的文字注解“驪白雜毛駂”，以及《爾雅譯注》中對(duì)這種被稱作“駂”的馬的形象特征描述，在輸入框下面的“tag”中填入實(shí)體在《爾雅》中所隸屬的分類“釋畜”“馬屬”。這樣就完成了圖像實(shí)體的標(biāo)注。

圖5 實(shí)體對(duì)象標(biāo)注

第三層，深度語(yǔ)義標(biāo)注。通過(guò)構(gòu)建領(lǐng)域詞表可以實(shí)現(xiàn)圖像深度語(yǔ)義揭示與關(guān)聯(lián)。我們以上海古籍出版社《爾雅譯注》[34](該書是上海古籍出版社邀請(qǐng)名家歷經(jīng)十年完成的簡(jiǎn)體中文《十三經(jīng)譯注》之一，可幫助讀者最大程度讀通和理解原著)，參考相關(guān)詞表構(gòu)建了《爾雅》多語(yǔ)語(yǔ)義詞表，內(nèi)容結(jié)構(gòu)由訓(xùn)釋詞語(yǔ)、被訓(xùn)釋詞語(yǔ)、例證3部分組成，語(yǔ)種包括中文、英文、日文和韓文。設(shè)計(jì)了以“詞表”“典籍”“句子”“分類”“人”為實(shí)體類的《爾雅》詞匯知識(shí)本體，實(shí)體屬性關(guān)系包括： belongsTo(屬于分類)、SubClassOf(子類關(guān)系)、dc:source(句子來(lái)源)、name(作者姓名)、address(作者籍貫)、dynasty(作者朝代)等等。通過(guò)屬性實(shí)現(xiàn)了《爾雅》詞語(yǔ)釋義的語(yǔ)義關(guān)聯(lián)。根據(jù)中文釋義，進(jìn)行詞匯釋義的多語(yǔ)翻譯和標(biāo)注，完成了3584個(gè)被訓(xùn)釋詞語(yǔ)和2219個(gè)訓(xùn)釋詞語(yǔ)的英、日、韓語(yǔ)的釋義翻譯。最后通過(guò)對(duì)《爾雅》詞表關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)換、存儲(chǔ)與發(fā)布，實(shí)現(xiàn)了語(yǔ)義關(guān)聯(lián)檢索和開(kāi)放鏈接服務(wù)，為《爾雅音圖》語(yǔ)義關(guān)聯(lián)做好了準(zhǔn)備。

當(dāng)完成詞表構(gòu)建與發(fā)布之后，就可對(duì)《爾雅音圖》進(jìn)行內(nèi)部詞表標(biāo)注與關(guān)聯(lián)，進(jìn)入標(biāo)注中心，點(diǎn)擊語(yǔ)義標(biāo)注按鈕，會(huì)出現(xiàn)輸入關(guān)聯(lián)信息的標(biāo)注界面，首先輸入系統(tǒng)內(nèi)置的關(guān)系屬性URI(http://www.w3.org/2000/01/rdfschema#seeAlso)；其次，輸入關(guān)系對(duì)象URI，需要關(guān)聯(lián)到《爾雅》多語(yǔ)語(yǔ)義詞表中的訓(xùn)釋詞，打開(kāi)詞表搜索平臺(tái)(網(wǎng)址：http://dh.usources.cn:8080/sooopa)檢索訓(xùn)釋詞語(yǔ)“駂”，得到詞表中“駂”的釋義與關(guān)聯(lián)的語(yǔ)義信息網(wǎng)址，在關(guān)系對(duì)象一欄輸入鏈接關(guān)聯(lián)的網(wǎng)址。進(jìn)行對(duì)象描述時(shí)，參照《爾雅譯注》中文釋義，這樣就實(shí)現(xiàn)了《爾雅音圖》第286頁(yè)圖像“驪白雜毛駂”與《爾雅》詞表內(nèi)容的深度語(yǔ)義關(guān)聯(lián)(見(jiàn)圖6)。

圖6 圖像語(yǔ)義關(guān)聯(lián)

利用《爾雅》多語(yǔ)語(yǔ)義詞表關(guān)聯(lián)，檢索圖像“駂”時(shí)，就可以獲得該詞在詞表中關(guān)聯(lián)的這種馬的中、英、日、韓文釋義，別稱，讀音，所屬類別以及郭璞《爾雅注》原句“今之烏驄?！毙蠒m《爾雅疏》原句“毛色黑白而復(fù)有雜毛相錯(cuò)者名為駂。”《詩(shī)經(jīng)·鄭風(fēng)·大叔于田》例句“叔于田，乘乘鴇。兩服齊首，兩驂如手?！薄睹?shī)故訓(xùn)傳》注釋句“驪白雜毛曰鴇?！?陸德明《經(jīng)典釋文》注句 “鴇，依字作駂?！钡戎R(shí)圖譜內(nèi)容(見(jiàn)圖7)。

圖7 《爾雅》詞表中“駂”知識(shí)圖譜與CBDB中《爾雅疏》作者邢昺關(guān)聯(lián)

語(yǔ)義詞表實(shí)現(xiàn)了對(duì)典籍圖像的深度揭示，再通過(guò)關(guān)聯(lián)外部詞表和其他相關(guān)資源，讀者可獲取更多相關(guān)的背景知識(shí)，探究作者與典籍知識(shí)發(fā)現(xiàn)。《爾雅音圖》與外部詞表進(jìn)行關(guān)聯(lián)，可通過(guò)SPARQL聯(lián)邦檢索獲取外部數(shù)據(jù)API實(shí)現(xiàn),例如需要了解《爾雅》注疏者的更多背景資料信息時(shí)，可以檢索并關(guān)聯(lián)中國(guó)歷代人物傳記資料庫(kù)(CBDB)，CBDB API支持人物ID和人名兩種查詢方式，我們通過(guò)人名查詢《爾雅疏》作者邢昺，CBDB可顯示與邢昺的所處朝代、籍貫、科舉、同僚、合著者、學(xué)生、家人及其他相關(guān)的人物和作品等背景知識(shí)。通過(guò)在《爾雅》詞表里面加入一條三元組owl:same As 關(guān)聯(lián)到CBDB的邢昺知識(shí)圖譜。圖7不但顯示了古代一種被稱作“駂”的馬的相關(guān)注釋、注者、作品、分類、注疏原句、例句及注疏等典籍知識(shí)圖譜，還關(guān)聯(lián)到CBDB，顯示與注疏者邢昺有關(guān)的人、時(shí)、地、作品等更多背景信息，再進(jìn)一步關(guān)聯(lián)其他典籍中相關(guān)馬的高清圖像及文本信息，為典籍考證和圖像敘事等數(shù)字人文應(yīng)用提供了幫助。

4.3 《爾雅音圖》數(shù)字人文應(yīng)用場(chǎng)景

通過(guò)對(duì)《爾雅音圖》的深度揭示，實(shí)現(xiàn)了《爾雅》圖文互釋、語(yǔ)義標(biāo)注和關(guān)聯(lián)檢索功能，為數(shù)字人文應(yīng)用提供了可以眾包參與的交互操作平臺(tái)，可實(shí)現(xiàn)“以圖證史”“圖像敘事”“多媒介傳播”的數(shù)字人文應(yīng)用場(chǎng)景。

首先，“以圖證史”應(yīng)用。利用圖像互操作平臺(tái)，將《爾雅音圖》中的插圖及文字與相關(guān)典籍圖像、出土文物圖像等相互比對(duì)，對(duì)考證典籍出處、版本、作者、古代社會(huì)生活、經(jīng)濟(jì)、軍事、典章制度、自然環(huán)境等具有重要價(jià)值。例如，有學(xué)者在對(duì)《爾雅》插圖研究時(shí)，通過(guò)高清圖的呈現(xiàn)發(fā)現(xiàn)《爾雅》“釋天—講武圖”中犬的形象和《事林廣記》插圖中犬的形象非常相似，都有腦袋偏長(zhǎng)、身上有條紋、尾巴上卷、頸上佩戴鈴鐺等特點(diǎn)，在出土元墓壁畫中的犬也有同樣形態(tài)(見(jiàn)圖8)，據(jù)此作為《爾雅》圖像有元代淵源的佐證[35]?！稜栄乓魣D》中的“釋草”“釋木”還可以和《唐本草》《本草圖經(jīng)》等醫(yī)藥典籍進(jìn)行比對(duì)，再結(jié)合文本分析，從時(shí)空地多維度考證古代植物特征及其出處?！稜栄乓魣D》中神話人物、動(dòng)物圖像與《山海經(jīng)》進(jìn)行比對(duì)，考證神話傳說(shuō)的歷史地理出處。

圖8 《爾雅音圖》與元墓壁畫中的犬

其次，圖像敘事應(yīng)用。人類最早的圖像符號(hào)象形文字就具有敘事屬性，國(guó)外學(xué)者將圖像敘事定義為“視覺(jué)或繪畫表現(xiàn)的文本表現(xiàn)”[36]?！稜栄乓魣D》中包含了大量反映先秦時(shí)期人類生活、自然生態(tài)和社會(huì)文化等多方面的寫實(shí)插圖，有宮廷建筑、常用器具、工具、樂(lè)器、天地四方、物產(chǎn)人物、天象、山川、河流、動(dòng)物、植物等實(shí)體圖像630余幅，并配有注釋文字，對(duì)這些珍貴的插圖與文字記載，按主題進(jìn)行深度揭示，建立《爾雅》圖像敘事模型，通過(guò)圖像場(chǎng)景分層、實(shí)體對(duì)象標(biāo)注、情感詞語(yǔ)標(biāo)注和實(shí)體關(guān)系抽取，建立圖像及其背景的文本關(guān)聯(lián)，描述圖文混搭的敘事情節(jié)，再通過(guò)主題關(guān)聯(lián)《詩(shī)經(jīng)》《尚書》《楚辭》《周易》《論語(yǔ)》等相關(guān)典籍文獻(xiàn)和插圖，給讀者提供豐富的圖像知識(shí)及其背景故事情節(jié)，在碎片化閱讀時(shí)代，激發(fā)讀者閱讀典籍的欲望、圖像審美和主體參與的探究精神。

最后，典籍多媒介傳播。隨著語(yǔ)義網(wǎng)絡(luò)和動(dòng)態(tài)云計(jì)算的普及，讀者通過(guò)多媒介快速訪問(wèn)、傳播藏品圖像，為《爾雅音圖》創(chuàng)建推特訂閱和RSS訂閱，以吸引更多讀者參與，通過(guò)語(yǔ)義網(wǎng)聚合引擎和IIIF圖像互操作標(biāo)準(zhǔn)，將中國(guó)典籍與世界各國(guó)典藏資源庫(kù)進(jìn)行關(guān)聯(lián)和互操作，將翻譯、解釋、比較、分析等工作流程進(jìn)行眾包，創(chuàng)建作者索引和搜索系統(tǒng)，記錄和展示讀者對(duì)藏品的操作與相關(guān)爭(zhēng)論，設(shè)計(jì)移動(dòng)APP，使用移動(dòng)設(shè)備標(biāo)注圖像，編輯與呈現(xiàn)《爾雅》圖像敘事情節(jié)，利用沉浸式多媒介交互平臺(tái)，創(chuàng)作者、讀者、人文學(xué)者、留學(xué)生等都可以通過(guò)網(wǎng)絡(luò)進(jìn)行交流互動(dòng)。還可以利用虛擬現(xiàn)實(shí)技術(shù)，創(chuàng)設(shè)古代自然和人文環(huán)境，讓人身臨其境，學(xué)習(xí)和體驗(yàn)古代社會(huì)生活，突破語(yǔ)言和文化的障礙，促進(jìn)典籍圖像在世界范圍的數(shù)字人文推廣、傳播與利用。

5 結(jié)論與展望

典籍圖像在數(shù)字人文中具有以圖證史、圖像敘事和多媒介傳播等作用，國(guó)際圖像互操作框架(IIIF)和資源描述框架(RDF)促進(jìn)了典籍圖像藏品的共享與利用。本文結(jié)合IIIF與RDF，參考圖像元數(shù)據(jù)標(biāo)準(zhǔn)，構(gòu)建包括圖像數(shù)字化、深度語(yǔ)義標(biāo)注和數(shù)字人文應(yīng)用的典籍圖像深度揭示與利用的模型架構(gòu)，實(shí)現(xiàn)了圖像掃描、OCR識(shí)別與元數(shù)據(jù)組織的圖像數(shù)字化過(guò)程，提出了典籍圖像深度標(biāo)注的三個(gè)層次：(1)利用IIIF呈現(xiàn)API實(shí)現(xiàn)圖像的場(chǎng)景標(biāo)注；(2)通過(guò)映射圖像元數(shù)據(jù)核心元素進(jìn)行典籍實(shí)體內(nèi)容標(biāo)注；(3)通過(guò)構(gòu)建典籍多語(yǔ)語(yǔ)義詞表實(shí)現(xiàn)典籍實(shí)體概念的深度標(biāo)注與語(yǔ)義關(guān)聯(lián)。例證采用經(jīng)典辭書《爾雅》的手繪插圖版《爾雅音圖》，利用自主研發(fā)的基于沉浸式多維圖像智慧互操作平臺(tái)進(jìn)行《爾雅》圖像的數(shù)字化，通過(guò)構(gòu)建多語(yǔ)語(yǔ)義詞表，實(shí)現(xiàn)對(duì)《爾雅》圖像實(shí)體對(duì)象的深度語(yǔ)義關(guān)聯(lián)，擴(kuò)展了對(duì)《爾雅》注者、作品等信息的關(guān)聯(lián)。最后探究了《爾雅音圖》的數(shù)字人文應(yīng)用場(chǎng)景，包括圖文互證、圖像敘事和多媒介傳播。未來(lái)將利用眾包工具深度標(biāo)注更多不同版本的典籍圖像，通過(guò)領(lǐng)域多語(yǔ)語(yǔ)義詞表建立與世界不同館藏典籍圖像、文本的關(guān)聯(lián)；同時(shí)開(kāi)發(fā)基于IIIF的移動(dòng)式多媒介典籍傳播平臺(tái)，使分布在世界各地的讀者、學(xué)者利用移動(dòng)設(shè)備眾包參與典籍閱讀、解釋、標(biāo)注、分析、發(fā)現(xiàn)和研究，典籍文獻(xiàn)在公眾賞析、解讀、研究和討論的過(guò)程中獲得新的生命力，真正使書寫在古籍里的文字和圖像活起來(lái)，在典籍圖像多媒介傳播與利用的過(guò)程中，實(shí)現(xiàn)中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化與創(chuàng)新性發(fā)展[37]。