• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向數(shù)字人文的典籍圖像深度揭示與利用*

      2022-10-10 05:51:40錢智勇陳濤張志美徐宇紅何書
      關(guān)鍵詞:爾雅詞表典籍

      □錢智勇 陳濤 張志美 徐宇紅 何書

      “典籍”最早是指記載先祖法度或國(guó)家法則的重要文獻(xiàn),后被用作各種書籍的統(tǒng)稱[1]。典籍中的圖像又稱插圖,在寫本時(shí)期,典籍中包含了大量的插圖。南宋鄭樵 《通志·圖譜略·索象篇》記載:“古之學(xué)者為學(xué)有要,置圖于左,置書于右,索象于圖,索理于書?!笨梢钥闯龉糯鷮W(xué)者治學(xué)過(guò)程中圖像與文字不可分割的關(guān)系。圖書館、博物館、檔案館等典藏機(jī)構(gòu)收藏大量典籍圖像載體,包括書影、印譜、地圖、卷軸、樂(lè)譜、手稿、檔案圖像等類型[2],這些典籍圖像是寶貴的文化遺產(chǎn),圖像數(shù)字化建設(shè)是數(shù)字人文基礎(chǔ)設(shè)施的重要內(nèi)容。利用國(guó)際圖像互操作框架(International Image Interoperability Framework,IIIF)與關(guān)聯(lián)數(shù)據(jù)描述框架可實(shí)現(xiàn)對(duì)典籍圖像深度揭示和語(yǔ)義關(guān)聯(lián),使典籍圖像在數(shù)字人文中發(fā)揮重要價(jià)值與作用:(1)“以圖證史”作用。通過(guò)對(duì)典籍圖像高清圖呈現(xiàn)和內(nèi)容深度揭示,增強(qiáng)了圖像還原史實(shí)、以圖證史的文獻(xiàn)考證價(jià)值[3]。(2)“圖像敘事”作用。在碎片化閱讀時(shí)代,“圖像正以前所未有的力量從文化的每個(gè)層面向我們壓來(lái)”[4],典籍中的圖像與文字通過(guò)互注、互文、互釋、互讀等方式實(shí)現(xiàn)文本敘事功能,為讀者呈現(xiàn)圖文同現(xiàn)的敘事效果。(3)增強(qiáng)典籍多媒介傳播作用。文學(xué)圖像化改變了文學(xué)傳播的場(chǎng)域、傳播方式及傳播理念,圖像與文本的深度關(guān)聯(lián),可以互相帶動(dòng)彼此在異域文化的深入傳播,并可啟發(fā)不同民族的讀者對(duì)典籍作品的深層認(rèn)知[5]。

      1 國(guó)內(nèi)外相關(guān)研究

      基于元數(shù)據(jù)規(guī)范組織典籍圖像,揭示圖像的特征、主題、分類、創(chuàng)作者、館藏、版本等內(nèi)容,但讀者難以快速檢索典籍圖像內(nèi)容及其所蘊(yùn)含的背景知識(shí),典籍與圖像分離,成為信息孤島,難以廣泛傳播與利用,因此需要對(duì)典籍圖像內(nèi)容進(jìn)行細(xì)粒度知識(shí)組織。近年,學(xué)者圍繞數(shù)字圖像內(nèi)容組織與利用進(jìn)行了許多研究。在國(guó)內(nèi),曾子明等提出面向數(shù)字人文的圖像語(yǔ)義描述模型[6]。張永娟等依據(jù)IIIF整合印譜圖像資源,輔助知識(shí)發(fā)現(xiàn)[7]。王曉光等構(gòu)建敦煌壁畫主題詞表、敦煌石窟本體及相關(guān)數(shù)據(jù)模型[8]。陳濤等通過(guò)IIIF與人工智能相結(jié)合,構(gòu)建沉浸式交互平臺(tái),實(shí)現(xiàn)圖像資源標(biāo)注與發(fā)布[9]。楊佳瑩等通過(guò)報(bào)紙廣告本體模型,準(zhǔn)確揭示廣告圖像文本信息[10]。在國(guó)外,鄧斯特(Dunst A)等人研究圖形敘事語(yǔ)料庫(kù),采用XML注釋標(biāo)題和全文示例[11]。斯托克(Stork L)等人通過(guò)全文轉(zhuǎn)錄和實(shí)體提取,直接標(biāo)記和注釋手寫檔案中的圖像文檔內(nèi)容[12]。程學(xué)芳(Cheng X F)等人構(gòu)建多層語(yǔ)義描述框架,描述圖像的內(nèi)涵語(yǔ)義信息[13]。亞勒米蘇·阿布加茲(Abgaz Y)等人提出一種利用人工智能技術(shù)挖掘文化遺產(chǎn)數(shù)字圖像中人文信息的方法[14]。

      以上相關(guān)研究表明,在標(biāo)注模型構(gòu)建、古籍自動(dòng)識(shí)別、實(shí)體提取、圖像互操作、本體、關(guān)聯(lián)數(shù)據(jù)與人工智能應(yīng)用結(jié)合等方面,已經(jīng)取得了許多研究成果和技術(shù)工具,可以實(shí)現(xiàn)圖像元數(shù)據(jù)聚合、國(guó)際圖像互操作、圖像關(guān)聯(lián)數(shù)據(jù)與本體詞表開(kāi)放數(shù)據(jù)服務(wù)。在典籍圖像中的古籍文本內(nèi)容深層標(biāo)注、圖像認(rèn)知計(jì)算、語(yǔ)義檢索、數(shù)字人文深度應(yīng)用等方面尚有進(jìn)一步拓展研究的空間。本文參考已有研究方法與技術(shù),依據(jù)圖像元數(shù)據(jù)規(guī)范、資源描述框架和國(guó)際圖像互操作標(biāo)準(zhǔn),研究典籍圖像深度揭示與利用的實(shí)現(xiàn)路徑與方法,構(gòu)建面向數(shù)字人文的典籍圖像數(shù)字化和深度語(yǔ)義標(biāo)注的模型架構(gòu),并以《爾雅音圖》為例進(jìn)行文本圖像的數(shù)字掃描、文本識(shí)別,通過(guò)《爾雅》多語(yǔ)語(yǔ)義詞表與《爾雅》圖像語(yǔ)義關(guān)聯(lián),深度揭示《爾雅》詞匯和圖像中的背景知識(shí),進(jìn)一步探究《爾雅》圖像的以圖證史、圖像敘事、多媒介傳播等數(shù)字人文應(yīng)用場(chǎng)景。

      2 典籍圖像深度揭示的相關(guān)標(biāo)準(zhǔn)規(guī)范

      典籍圖像深度揭示是以圖像元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范、資源描述框架理論、國(guó)際圖像互操作框架為依據(jù),實(shí)現(xiàn)基于圖像內(nèi)容的細(xì)粒度語(yǔ)義標(biāo)注、檢索、發(fā)現(xiàn)和開(kāi)放共享服務(wù)。

      2.1 圖像元數(shù)據(jù)標(biāo)準(zhǔn)

      圖像元數(shù)據(jù)標(biāo)準(zhǔn)是描述和限定圖像數(shù)據(jù)對(duì)象所需要的一系列原則的集合[15]。都柏林元數(shù)據(jù)標(biāo)準(zhǔn)(以下簡(jiǎn)稱DC)對(duì)圖像內(nèi)容描述的核心元素包括題名、主題、描述、來(lái)源、關(guān)聯(lián)和范圍。已有的圖像元數(shù)據(jù)標(biāo)準(zhǔn)主要有描述藝術(shù)品、建筑物等類目的元數(shù)據(jù)標(biāo)準(zhǔn)(以下簡(jiǎn)稱CDWA)、描述視覺(jué)及圖像資料類目的元數(shù)據(jù)(以下簡(jiǎn)稱VRA Core)、數(shù)字圖書館圖像元數(shù)據(jù)標(biāo)準(zhǔn)(以下簡(jiǎn)稱CDL)、描述靜態(tài)數(shù)字圖像的元數(shù)據(jù)標(biāo)準(zhǔn)(以下簡(jiǎn)稱TMI)等[16]?,F(xiàn)有標(biāo)準(zhǔn)主要關(guān)注整體圖像的不同屬性和圖像集合之間的同質(zhì)性,對(duì)圖像的外部特征進(jìn)行詳細(xì)描述,在對(duì)圖像內(nèi)容進(jìn)行描述時(shí),不同元數(shù)據(jù)集的元素之間可以建立映射關(guān)系,表1展示了DC核心元素與CDWA、VRA Core描述圖像內(nèi)容的元素映射。通過(guò)不同元數(shù)據(jù)標(biāo)準(zhǔn)之間的元素映射,再結(jié)合資源描述框架以及國(guó)際圖像互操作標(biāo)準(zhǔn),可以對(duì)圖像數(shù)字對(duì)象的內(nèi)容特征進(jìn)行語(yǔ)義描述,多維度實(shí)現(xiàn)典籍圖像深度揭示與內(nèi)容檢索。

      表1 描述圖像內(nèi)容的DC核心元素與CDWA、VRA Core映射表

      2.2 資源描述框架

      資源描述框架(以下簡(jiǎn)稱RDF)是國(guó)際語(yǔ)義網(wǎng)聯(lián)盟(以下簡(jiǎn)稱W3C)推出的用于對(duì)結(jié)構(gòu)化元數(shù)據(jù)進(jìn)行編碼、交換與再利用的基礎(chǔ)架構(gòu),它提供一致化描述領(lǐng)域資源的機(jī)制,并允許不同的使用者根據(jù)需要擴(kuò)展元數(shù)據(jù),編制人機(jī)可讀的領(lǐng)域詞匯表,此外還提供結(jié)構(gòu)化的相互兼容機(jī)制,為基于XML的各種不同元數(shù)據(jù)提供相互利用與轉(zhuǎn)換的平臺(tái)[17]。RDF提供了圖像資源對(duì)象描述的開(kāi)放數(shù)據(jù)模型,該模型由資源、屬性、聲明組成,每個(gè)資源都被賦予一個(gè)URI,讀者既可獲取資源本身,又可獲取資源對(duì)象的內(nèi)容描述。屬性是指資源對(duì)象之間的關(guān)系。聲明明確了資源對(duì)象的屬性,RDF使用圖形化方式書寫相同聲明。如果許多RDF文檔使用不同的元數(shù)據(jù)標(biāo)準(zhǔn)標(biāo)識(shí)了相同的圖像資源,通過(guò)聚合工具自動(dòng)收集關(guān)于該資源的元數(shù)據(jù)并將所有開(kāi)放數(shù)據(jù)融合起來(lái),開(kāi)放數(shù)據(jù)詞匯表可以通過(guò)數(shù)據(jù)接口被獲取并緩存到本地服務(wù)器中,以便快速訪問(wèn),這為數(shù)字人文提供了盡可能廣泛的圖像數(shù)據(jù)及其屬性關(guān)聯(lián)。

      2.3 國(guó)際圖像互操作框架

      國(guó)際圖像互操作框架(IIIF)是由英國(guó)國(guó)家圖書館、牛津大學(xué)圖書館、哈佛大學(xué)等29個(gè)著名館藏機(jī)構(gòu)協(xié)作制定的一組支持館藏?cái)?shù)字圖像資源互操作的框架標(biāo)準(zhǔn),提供操作與訪問(wèn)圖像資源的統(tǒng)一標(biāo)準(zhǔn)與方法,對(duì)典籍圖像資源進(jìn)行統(tǒng)一的在線組織、展示、檢索與應(yīng)用,以促進(jìn)全球圖像資源的互操作與開(kāi)放獲取[18]。IIIF框架通過(guò)定義一組通用的應(yīng)用程序接口(API)規(guī)范實(shí)現(xiàn)圖像資源互操作性與可獲取性。IIIF提供的應(yīng)用接口包括:圖像API(Image API)、呈現(xiàn)API(Presentation API)、檢索API(Search API) 與授權(quán)API(Authentication API)[19]。圖像API提供了圖像處理的方法[20],呈現(xiàn)API提供了用于構(gòu)造圖像和圖像相關(guān)資源集合的數(shù)據(jù)模型[21]。檢索API通過(guò)擴(kuò)展的標(biāo)準(zhǔn)參數(shù)檢索圖像元數(shù)據(jù)[22]。授權(quán)API通過(guò)注冊(cè)驗(yàn)證,對(duì)圖像資源進(jìn)行權(quán)限控制[23]。IIIF還開(kāi)發(fā)了資源發(fā)現(xiàn)應(yīng)用程序[24]和具有圖像策展功能的應(yīng)用程序接口[25]。關(guān)聯(lián)數(shù)據(jù)和IIIF資源之間的雙向關(guān)系豐富了數(shù)據(jù)集的語(yǔ)義,這些規(guī)范和標(biāo)準(zhǔn)為典籍圖像的深度揭示提供了技術(shù)支撐。

      3 典籍圖像深度揭示與利用模型架構(gòu)

      典籍圖像深度揭示與利用模型的構(gòu)建目標(biāo)是以圖像元數(shù)據(jù)、資源描述框架和國(guó)際圖像互操作標(biāo)準(zhǔn)為基礎(chǔ),對(duì)典籍圖像進(jìn)行數(shù)字化和內(nèi)容深度標(biāo)注,實(shí)現(xiàn)圖像與內(nèi)外部文獻(xiàn)實(shí)體的語(yǔ)義關(guān)聯(lián),提高典籍圖像的可理解性,促進(jìn)典籍?dāng)?shù)字人文應(yīng)用。圖1展示的模型框架由典籍圖像數(shù)字化組織與存儲(chǔ)、圖像深度標(biāo)注與語(yǔ)義關(guān)聯(lián)、數(shù)字人文應(yīng)用研究等三個(gè)相互關(guān)聯(lián)的模塊組成。

      圖1 典籍圖像深度揭示與利用模型架構(gòu)

      3.1 典籍圖像數(shù)字化

      紙媒典籍?dāng)?shù)字化是采用高清掃描儀等數(shù)字設(shè)備,對(duì)選定的典籍文本、圖像進(jìn)行掃描并轉(zhuǎn)化為能被計(jì)算機(jī)識(shí)別的數(shù)字符號(hào),再通過(guò)圖像OCR識(shí)別、元數(shù)據(jù)組織等方式建成典籍全文和圖像數(shù)據(jù)庫(kù)。

      第一步,掃描典籍文本。將文獻(xiàn)或圖片資料按原貌逐頁(yè)掃描并存儲(chǔ)為圖像文件。掃描圖像后,可能存在圖像傾斜、文字不清晰、版心不正等問(wèn)題,需要進(jìn)行圖像編輯校正、二值化處理,圖像二值化處理可以較為真實(shí)模擬還原典籍的原始形態(tài),保證文獻(xiàn)的真實(shí)性,并可有效提高OCR識(shí)別率[26]。在IIIF圖像API中,每個(gè)掃描的圖像都被設(shè)置唯一的圖像URI標(biāo)識(shí),圖像API基于標(biāo)準(zhǔn)HTTP請(qǐng)求返回圖像的Web服務(wù),對(duì)圖像平移和縮放只需在HTTP請(qǐng)求的URI中提供區(qū)域坐標(biāo)和大小參數(shù),IIIF服務(wù)器即可轉(zhuǎn)換原始圖像。

      第二步,OCR識(shí)別。對(duì)掃描處理后的典籍圖像進(jìn)行文本識(shí)別,實(shí)現(xiàn)機(jī)器可閱讀的全文生成,是數(shù)字人文的基礎(chǔ)工作,利用OCR技術(shù)可以進(jìn)行各種印刷字體圖文版面的識(shí)別。難點(diǎn)在于如何準(zhǔn)確識(shí)別典籍中的手寫字、異體字等各種變體,為了提高OCR識(shí)別的準(zhǔn)確率,可將OCR技術(shù)與深度學(xué)習(xí)相結(jié)合,通過(guò)特征映射讓深度卷積神經(jīng)網(wǎng)絡(luò)(以下簡(jiǎn)稱Deep CNN)去學(xué)習(xí)古文字的整體或偏旁的各種變體的一致性特征,然后將訓(xùn)練好的Deep CNN用于識(shí)別模型未見(jiàn)過(guò)的其他變體[27]。典籍全文生成可采用OCR機(jī)器識(shí)別和眾包方式的手工輸入有效交互的方法進(jìn)行,添加OCR的眾包工具有助于準(zhǔn)確識(shí)別異體字[28]。

      第三步,元數(shù)據(jù)組織。參考國(guó)外圖像元數(shù)據(jù)標(biāo)準(zhǔn)和國(guó)家圖書館元數(shù)據(jù)規(guī)范[29],結(jié)合特定館藏的描述需求,映射和復(fù)用典籍圖像核心元素和著錄規(guī)則,據(jù)此進(jìn)行圖像元數(shù)據(jù)標(biāo)注。揭示圖像內(nèi)容的核心元素包括:對(duì)象主題、對(duì)象分類、創(chuàng)作朝代、創(chuàng)作地點(diǎn)、相關(guān)典籍記載、風(fēng)格、文化、語(yǔ)種、責(zé)任者相關(guān)描述等。IIIF呈現(xiàn)API定義了描述圖像的標(biāo)準(zhǔn)模型,提供添加元數(shù)據(jù)的功能,可將任何圖像或區(qū)域描述為一個(gè)有序的集合,包含清單、序列、畫布、內(nèi)容的基本結(jié)構(gòu)。不同館藏通過(guò)IIIF圖像服務(wù)器發(fā)布出來(lái)的圖像可利用發(fā)布URI接口進(jìn)行重新組織和圖像互操作。

      3.2 典籍圖像深度標(biāo)注與語(yǔ)義關(guān)聯(lián)

      深度標(biāo)注是通過(guò)元數(shù)據(jù)集對(duì)特定典籍圖像進(jìn)行基于內(nèi)容的細(xì)粒度知識(shí)標(biāo)引,來(lái)提高圖像的可理解性。語(yǔ)義關(guān)聯(lián)是通過(guò)IIIF與資源描述框架對(duì)典籍圖像進(jìn)行內(nèi)部和外部詞表的語(yǔ)義關(guān)聯(lián),以揭示圖像的語(yǔ)義知識(shí),并將圖像與其他數(shù)字資源進(jìn)行整合。根據(jù)典籍圖像的存儲(chǔ)異構(gòu)性、格式多樣性、內(nèi)容離散性等特點(diǎn),我們提出深度揭示典籍圖像的實(shí)現(xiàn)路徑:以構(gòu)建典籍多語(yǔ)語(yǔ)義詞表為基礎(chǔ),嵌入語(yǔ)義標(biāo)注工具集,對(duì)典籍文獻(xiàn)進(jìn)行深度語(yǔ)義標(biāo)注與多維度關(guān)聯(lián),并與相關(guān)資源進(jìn)行整合。典籍多語(yǔ)語(yǔ)義詞表是對(duì)多語(yǔ)種典籍文獻(xiàn)中音、形、義相同或相似的字詞進(jìn)行集中揭示的詞匯表,整個(gè)圖像和子圖像標(biāo)注都可以使用詞表中的控制詞匯術(shù)語(yǔ)進(jìn)行語(yǔ)義索引。通過(guò)元數(shù)據(jù)標(biāo)注與關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)換、存儲(chǔ)與發(fā)布,完成典籍多語(yǔ)語(yǔ)義詞表的構(gòu)建,再結(jié)合外部領(lǐng)域詞表對(duì)典籍圖像文本進(jìn)行基于內(nèi)容的深度語(yǔ)義標(biāo)注。常用語(yǔ)義標(biāo)注工具有:CULTURA、CTEXT、TEXTGRID、MARKUS等文本標(biāo)注系統(tǒng),提供自動(dòng)和手動(dòng)分詞標(biāo)注功能,還包括搜索功能和外部參考功能。我們依據(jù)IIIF和本體規(guī)范設(shè)計(jì)了典籍圖像深度標(biāo)注的層級(jí)結(jié)構(gòu),如圖2所示,分為場(chǎng)景標(biāo)注、內(nèi)容標(biāo)注、語(yǔ)義標(biāo)注三個(gè)層次。

      圖2 典籍圖像深度標(biāo)注層次

      第一層場(chǎng)景標(biāo)注。根據(jù)圖像場(chǎng)景,標(biāo)注不同場(chǎng)景中的圖像。采用矩形、圓形、多邊形、自由標(biāo)注等工具進(jìn)行圖像輪廓及其特征標(biāo)注,并按主題對(duì)圖像場(chǎng)景進(jìn)行有序排列。第二層內(nèi)容標(biāo)注。對(duì)典籍、句子、詞匯及其句法關(guān)系等內(nèi)容進(jìn)行標(biāo)注。其中,句法關(guān)系包括典籍作品篇章之間的關(guān)系、句子結(jié)構(gòu)關(guān)系以及詞匯關(guān)系等。第三層語(yǔ)義標(biāo)注。對(duì)典籍實(shí)體概念的語(yǔ)義及其關(guān)系進(jìn)行深度標(biāo)注。典籍中的實(shí)體概念包括“人”“動(dòng)物”“地點(diǎn)”“時(shí)間”等概念類。“關(guān)系”包括概念層次關(guān)系和非層次關(guān)系。對(duì)典籍中的實(shí)體概念進(jìn)行語(yǔ)義標(biāo)注和屬性關(guān)聯(lián),可依據(jù)典籍多語(yǔ)語(yǔ)義詞表和相關(guān)本體詞表,利用自動(dòng)或手動(dòng)標(biāo)注工具,進(jìn)行基于自然語(yǔ)言處理的命名實(shí)體識(shí)別、標(biāo)注與抽取。實(shí)體之間概念層次關(guān)系可采用基于模板的方法半自動(dòng)標(biāo)注與提??;概念之間非層次關(guān)系主要指動(dòng)作,可通過(guò)基于監(jiān)督學(xué)習(xí)模型的方法,自動(dòng)抽取實(shí)體關(guān)聯(lián)的動(dòng)詞,實(shí)現(xiàn)典籍實(shí)體對(duì)象之間的語(yǔ)義關(guān)聯(lián)。

      典籍圖像的深度揭示可以利用IIIF呈現(xiàn)API所定義的數(shù)據(jù)模型,實(shí)現(xiàn)典籍圖像資源與資源組織、標(biāo)注等操作相分離。它提供了用于構(gòu)造圖像和圖像相關(guān)資源集合的數(shù)據(jù)模型,以及通過(guò)清單文件在IIIF感知應(yīng)用程序之間進(jìn)行數(shù)據(jù)交換的方法。IIIF呈現(xiàn)API中的資源包括集合、清單、序列、畫布、注釋、注釋列表、范圍、層和內(nèi)容等。為了在呈現(xiàn)API中使用關(guān)聯(lián)數(shù)據(jù)控制的詞匯表,可以采用IIIF規(guī)范中定義的附加類型Annotation,將關(guān)聯(lián)數(shù)據(jù)分類中的概念連接到典籍圖像資源,可以將受控詞匯表中的主要資源主題URI插入IIIF畫布上的注釋資源中。通過(guò)IIIF檢索API可實(shí)現(xiàn)圖像標(biāo)注層面的檢索,還可利用IIIF發(fā)現(xiàn)API定義的基本資源列表、資源變更列表中記錄的圖像URI發(fā)布與變更信息,實(shí)現(xiàn)跨庫(kù)與跨條目檢索。

      3.3 典籍圖像數(shù)字人文應(yīng)用

      對(duì)典籍圖像數(shù)字化、深度標(biāo)注及語(yǔ)義關(guān)聯(lián),再結(jié)合深度學(xué)習(xí)、文本挖掘、時(shí)空分析和社會(huì)網(wǎng)絡(luò)分析等技術(shù),可實(shí)現(xiàn)典籍圖像以圖證史、圖像敘事、多媒介傳播等數(shù)字人文應(yīng)用。

      首先,通過(guò)圖像比對(duì)、文獻(xiàn)考證等實(shí)現(xiàn)“以圖證史”。古籍中的圖像包括各種手繪插圖、印本木版插圖等紀(jì)實(shí)性原創(chuàng)圖畫,反映了古代社會(huì)歷史事件、人物形態(tài)、服飾、器具、宗教、建筑、音樂(lè)、動(dòng)物、植物以及山川河流等自然地理面貌。經(jīng)過(guò)高清掃描的典籍圖像真實(shí)還原了各個(gè)朝代社會(huì)發(fā)展形態(tài)以及人類衣食住行等物質(zhì)生活方式,經(jīng)過(guò)文本識(shí)別和內(nèi)容深度標(biāo)注,與不同館藏的同類圖像建立語(yǔ)義關(guān)聯(lián),再結(jié)合機(jī)器學(xué)習(xí)進(jìn)行圖像特征識(shí)別,與出土文物及相關(guān)典籍進(jìn)行圖文比對(duì)和考證,可以實(shí)現(xiàn)以圖證史的數(shù)字人文研究。借助典籍圖像語(yǔ)義標(biāo)注平臺(tái),人文學(xué)者在解讀古籍文字和圖像時(shí)可以參考和使用各種典籍?dāng)?shù)據(jù)庫(kù)資源,進(jìn)行分詞、標(biāo)注和聚類分析,輔助圖文考證的研究。將漢字和圖畫可視化為知識(shí)圖譜,可以激發(fā)學(xué)者探索考證新觀點(diǎn)以及公眾對(duì)典籍學(xué)習(xí)的興趣與認(rèn)知。

      其次,通過(guò)場(chǎng)景標(biāo)注、主題索引等實(shí)現(xiàn)“圖像敘事”功能。在文學(xué)圖像化語(yǔ)境下,典籍圖像高清呈現(xiàn)與瀏覽改變了傳統(tǒng)文字的呈現(xiàn)形式,典籍呈現(xiàn)可以向圖文并茂甚至以圖為主的多媒體形式轉(zhuǎn)變,圖像和文字以互讀、互文、互釋等方式呈現(xiàn)圖像敘事功能。通過(guò)元數(shù)據(jù)映射建立基于故事的圖像索引系統(tǒng),識(shí)別圖像中每個(gè)實(shí)體對(duì)象,分離并提取目標(biāo)元素及屬性,每一個(gè)元素都對(duì)應(yīng)一個(gè)語(yǔ)義概念。IIIF是描述圖像故事的基礎(chǔ),提供了不同標(biāo)記區(qū)域之間的坐標(biāo)、形狀、顏色和重疊關(guān)系,可描述圖像中的主題和內(nèi)容,圖像資源的語(yǔ)義對(duì)象通過(guò)分類和互連被組織成圖結(jié)構(gòu),每個(gè)故事或事件是通過(guò)圖像中的元素而不是自由文本來(lái)表現(xiàn)的,圖像中的設(shè)置和實(shí)體的變化隨時(shí)間和空間演變,這有助于讀者理解圖像,標(biāo)注的數(shù)據(jù)集使圖像通過(guò)深度學(xué)習(xí)可理解,領(lǐng)域詞匯和本體可以對(duì)標(biāo)注輸出進(jìn)行標(biāo)準(zhǔn)化。

      最后,利用多種媒介實(shí)現(xiàn)典籍圖像在世界的傳播。文學(xué)圖像化改變了典籍文獻(xiàn)傳播的場(chǎng)域、方式與觀念。利用IIIF與RDF將分散在世界不同館藏的典籍圖像進(jìn)行組織、重構(gòu)和基于主題內(nèi)容的深度揭示,可開(kāi)發(fā)各種應(yīng)用API,如策展API可以將畫布中的圖像進(jìn)行任意形狀的裁剪切割,并添加元數(shù)據(jù),還可從IIIF圖像典藏機(jī)構(gòu)收集相關(guān)主題的圖像,利用機(jī)器識(shí)別圖像并自動(dòng)添加標(biāo)簽,將圖像數(shù)據(jù)或文本文件按主題聚合在一起。IIIF發(fā)現(xiàn)API可以利用資源變更列表,對(duì)不同機(jī)構(gòu)、數(shù)據(jù)庫(kù)進(jìn)行多維檢索,分布在世界各地的典籍圖像資源在多種平臺(tái)上以多種格式被獲取和分享,再利用流媒體、網(wǎng)站、搜索引擎、微信公眾號(hào)、微博、頭條、推特、抖音等多媒介發(fā)布與傳播。讀者與創(chuàng)作者通過(guò)手機(jī)等移動(dòng)設(shè)備,利用沉浸式交互網(wǎng)絡(luò)平臺(tái)隨時(shí)進(jìn)行交流互動(dòng)、解讀欣賞典籍圖像、通過(guò)眾包參與圖像標(biāo)注與研究,促進(jìn)典籍的世界傳播與利用。

      4 案例研究:《爾雅音圖》深度揭示與利用

      本文選擇《爾雅音圖》作為典籍圖像深度揭示與利用案例,《爾雅》是我國(guó)古代最早的訓(xùn)詁名物的語(yǔ)言專著,匯釋了戰(zhàn)國(guó)秦漢間的語(yǔ)言文字材料,漢代被列入《五經(jīng)》,是古代儒生誦經(jīng)的必讀工具書[30],歷代《爾雅》注本以郭璞《爾雅注》最具代表性,郭璞在《爾雅注序》中稱所作“別為《音》、《圖》,用祛未寤?!盵31]據(jù)《隋書·經(jīng)籍志》記載,郭璞注本有《爾雅音》二卷,《爾雅圖贊》二卷,當(dāng)時(shí)尚傳于世,可惜后來(lái)亡佚,僅散見(jiàn)于前代舊籍[32]。傳世《爾雅音圖》是清代兩淮都轉(zhuǎn)運(yùn)監(jiān)使曾燠于清嘉慶六年(1801年)據(jù)影宋本刊刻,全書有圖有注,注后有讀音,保留了大量古代語(yǔ)言資料,對(duì)音韻、語(yǔ)音及藝術(shù)研究均有重要參考價(jià)值。本文以浙江人民美術(shù)出版社影印出版的《爾雅音圖》[33](該書影印清嘉慶六年曾氏刻本)為底本進(jìn)行數(shù)字化、深度標(biāo)注與數(shù)字人文應(yīng)用的例證研究。

      4.1 《爾雅音圖》數(shù)字化

      《爾雅音圖》的數(shù)字化過(guò)程包括書稿掃描及圖像處理、文字OCR識(shí)別、元數(shù)據(jù)映射組織。

      首先完成書稿掃描與圖像處理。將《爾雅音圖》中的圖像、文字、讀音、注釋等內(nèi)容按原貌逐頁(yè)精確掃描處理并存貯為圖像文件。選擇掃描精度,掃描分辨率一般控制在300-600dpi,掃描方式包括黑白掃描、灰度掃描和彩色掃描方式,保存格式按存儲(chǔ)大小依次為:tif 、gif、jpeg、jpg、png。圖像掃描處理過(guò)程:導(dǎo)入圖片→校正處理→二值化處理→圖像抹白處理。其中二值化處理可提高圖像的壓縮比率,縮小文獻(xiàn)的存儲(chǔ)空間,提高OCR識(shí)別率。圖像抹白處理可清除二值化處理后的圖片可能會(huì)產(chǎn)生的黑色區(qū)域。

      其次對(duì)掃描后的圖像文字進(jìn)行OCR識(shí)別。例如識(shí)別釋詁中的第一句:“初哉首基肈兆祖元胎俶音叔落權(quán)輿始也”。先對(duì)其進(jìn)行矩形框選,點(diǎn)擊自動(dòng)OCR,調(diào)用外部OCR接口,可將OCR的結(jié)果顯示在JOCR部分,再進(jìn)行人工審核后,保存JOCR,完成自動(dòng)文字識(shí)別(見(jiàn)圖3)。系統(tǒng)可調(diào)用百度OCR、書同文OCR、漢王OCR等自動(dòng)OCR接口,可識(shí)別豎版古籍的常用漢字及其符號(hào),對(duì)于部分異體字的識(shí)別可利用機(jī)器深度學(xué)習(xí)結(jié)合眾包方式標(biāo)注完成。將識(shí)別結(jié)果保存JOCR,為內(nèi)容標(biāo)注和語(yǔ)義關(guān)聯(lián)做好準(zhǔn)備。

      圖3 自動(dòng)OCR識(shí)別與JOCR保存

      最后,元數(shù)據(jù)組織是進(jìn)行圖像核心元素映射與書目數(shù)據(jù)轉(zhuǎn)化。通過(guò)映射DC、CDWA、VRA Core等元數(shù)據(jù)集:題目(DC:Title)|創(chuàng)建者(DC:Creator)|主題(DC:Subject) |分類(CDWA:Classification) |描述(VRA Core:Classification) |關(guān)聯(lián)(CDWA:Related works) |格式(DC:Format)|分類(CDWA:Classification)日期(DC:Date)|資源類型(VRA Core:Work type)|權(quán)限(CDWA:Copyright)|。創(chuàng)建《爾雅》圖像元數(shù)據(jù)核心元素集,依此進(jìn)行《爾雅音圖》實(shí)體對(duì)象標(biāo)注。再將標(biāo)注數(shù)據(jù)轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)的RDF 格式圖數(shù)據(jù),存儲(chǔ)在三元組數(shù)據(jù)庫(kù)中,通過(guò) SPARQL進(jìn)行查詢與存取。

      4.2 《爾雅音圖》深度標(biāo)注與語(yǔ)義關(guān)聯(lián)

      《爾雅音圖》的深度標(biāo)注工具采用自主研發(fā)的多維圖像智慧系統(tǒng),該系統(tǒng)是基于IIIF與RDF的沉浸式交互操作平臺(tái)(http://www.usources.cn/sas/ ),包括藏品檢索、藏品中心、集合中心、圖像標(biāo)注、圖像管理、SPARQL EDITOR和藏品賞析等7個(gè)模塊。藏品按照IIIF框架進(jìn)行組織,每個(gè)藏品有一個(gè)Manifest清單文件,系統(tǒng)核心功能是圖像標(biāo)注。我們依據(jù)典籍圖像深度標(biāo)注層次模型(見(jiàn)圖2),利用系統(tǒng)圖像標(biāo)注模塊,進(jìn)行《爾雅音圖》的圖像標(biāo)注和語(yǔ)義關(guān)聯(lián)。

      第一層,圖像輪廓標(biāo)注。《爾雅音圖》中的實(shí)體圖像包括人、鳥、魚、獸、畜、草、木、工具、建筑、天、地、山、水等名物實(shí)體,這些實(shí)體大多帶有背景環(huán)境,有不同的場(chǎng)景,因此先要根據(jù)圖像的不同場(chǎng)景進(jìn)行圖像實(shí)體的輪廓標(biāo)注,標(biāo)注輪廓的工具共有5種:點(diǎn)標(biāo)、矩形標(biāo)注、圓形標(biāo)注、多邊形標(biāo)注、自由標(biāo)注?!稜栄拧凡鍒D的實(shí)體標(biāo)注使用較多的是矩形標(biāo)注和自由標(biāo)注。一般在標(biāo)注輪廓較復(fù)雜、具有整體性內(nèi)涵以及都是文字的圖像時(shí),使用矩形標(biāo)注;而在對(duì)人、動(dòng)物等輪廓較為清晰的圖像進(jìn)行標(biāo)注時(shí),一般使用自由標(biāo)注,如圖4所示。利用圖形標(biāo)注工具,我們完成了《爾雅音圖》中630余幅圖像場(chǎng)景的輪廓標(biāo)注。

      圖4 圖像輪廓標(biāo)注

      第二層,實(shí)體對(duì)象標(biāo)注。《爾雅音圖》中的實(shí)體分類依據(jù)《爾雅》19大類:釋詁、釋言、釋訓(xùn)、釋親、釋宮、釋器、釋樂(lè)、釋天、釋地、釋丘、釋山、釋水、釋草、釋木、釋蟲、釋魚、釋鳥、釋獸、釋畜。例如標(biāo)注一種被稱作 “駂”(別名“烏驄”)的馬的實(shí)體圖像,首先選用多邊形標(biāo)注工具將圖像中的馬的實(shí)體標(biāo)出來(lái)(圖5左),實(shí)體框選出來(lái)后,在彈出的標(biāo)注窗口(圖5右)上面輸入框中標(biāo)注《爾雅》圖像上的文字注解“驪白雜毛駂”,以及《爾雅譯注》中對(duì)這種被稱作“駂”的馬的形象特征描述,在輸入框下面的“tag”中填入實(shí)體在《爾雅》中所隸屬的分類“釋畜”“馬屬”。這樣就完成了圖像實(shí)體的標(biāo)注。

      圖5 實(shí)體對(duì)象標(biāo)注

      第三層,深度語(yǔ)義標(biāo)注。通過(guò)構(gòu)建領(lǐng)域詞表可以實(shí)現(xiàn)圖像深度語(yǔ)義揭示與關(guān)聯(lián)。我們以上海古籍出版社《爾雅譯注》[34](該書是上海古籍出版社邀請(qǐng)名家歷經(jīng)十年完成的簡(jiǎn)體中文《十三經(jīng)譯注》之一,可幫助讀者最大程度讀通和理解原著),參考相關(guān)詞表構(gòu)建了《爾雅》多語(yǔ)語(yǔ)義詞表,內(nèi)容結(jié)構(gòu)由訓(xùn)釋詞語(yǔ)、被訓(xùn)釋詞語(yǔ)、例證3部分組成,語(yǔ)種包括中文、英文、日文和韓文。設(shè)計(jì)了以“詞表”“典籍”“句子”“分類”“人”為實(shí)體類的《爾雅》詞匯知識(shí)本體,實(shí)體屬性關(guān)系包括: belongsTo(屬于分類)、SubClassOf(子類關(guān)系)、dc:source(句子來(lái)源)、name(作者姓名)、address(作者籍貫)、dynasty(作者朝代)等等。通過(guò)屬性實(shí)現(xiàn)了《爾雅》詞語(yǔ)釋義的語(yǔ)義關(guān)聯(lián)。根據(jù)中文釋義,進(jìn)行詞匯釋義的多語(yǔ)翻譯和標(biāo)注,完成了3584個(gè)被訓(xùn)釋詞語(yǔ)和2219個(gè)訓(xùn)釋詞語(yǔ)的英、日、韓語(yǔ)的釋義翻譯。最后通過(guò)對(duì)《爾雅》詞表關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)換、存儲(chǔ)與發(fā)布,實(shí)現(xiàn)了語(yǔ)義關(guān)聯(lián)檢索和開(kāi)放鏈接服務(wù),為《爾雅音圖》語(yǔ)義關(guān)聯(lián)做好了準(zhǔn)備。

      當(dāng)完成詞表構(gòu)建與發(fā)布之后,就可對(duì)《爾雅音圖》進(jìn)行內(nèi)部詞表標(biāo)注與關(guān)聯(lián),進(jìn)入標(biāo)注中心,點(diǎn)擊語(yǔ)義標(biāo)注按鈕,會(huì)出現(xiàn)輸入關(guān)聯(lián)信息的標(biāo)注界面,首先輸入系統(tǒng)內(nèi)置的關(guān)系屬性URI(http://www.w3.org/2000/01/rdfschema#seeAlso);其次,輸入關(guān)系對(duì)象URI,需要關(guān)聯(lián)到《爾雅》多語(yǔ)語(yǔ)義詞表中的訓(xùn)釋詞,打開(kāi)詞表搜索平臺(tái)(網(wǎng)址:http://dh.usources.cn:8080/sooopa)檢索訓(xùn)釋詞語(yǔ)“駂”,得到詞表中“駂”的釋義與關(guān)聯(lián)的語(yǔ)義信息網(wǎng)址,在關(guān)系對(duì)象一欄輸入鏈接關(guān)聯(lián)的網(wǎng)址。進(jìn)行對(duì)象描述時(shí),參照《爾雅譯注》中文釋義,這樣就實(shí)現(xiàn)了《爾雅音圖》第286頁(yè)圖像“驪白雜毛駂”與《爾雅》詞表內(nèi)容的深度語(yǔ)義關(guān)聯(lián)(見(jiàn)圖6)。

      圖6 圖像語(yǔ)義關(guān)聯(lián)

      利用《爾雅》多語(yǔ)語(yǔ)義詞表關(guān)聯(lián),檢索圖像“駂”時(shí),就可以獲得該詞在詞表中關(guān)聯(lián)的這種馬的中、英、日、韓文釋義,別稱,讀音,所屬類別以及郭璞《爾雅注》原句“今之烏驄?!毙蠒m《爾雅疏》原句“毛色黑白而復(fù)有雜毛相錯(cuò)者名為駂。”《詩(shī)經(jīng)·鄭風(fēng)·大叔于田》例句“叔于田,乘乘鴇。兩服齊首,兩驂如手?!薄睹?shī)故訓(xùn)傳》注釋句“驪白雜毛曰鴇?!?陸德明《經(jīng)典釋文》注句 “鴇,依字作駂?!钡戎R(shí)圖譜內(nèi)容(見(jiàn)圖7)。

      圖7 《爾雅》詞表中“駂”知識(shí)圖譜與CBDB中《爾雅疏》作者邢昺關(guān)聯(lián)

      語(yǔ)義詞表實(shí)現(xiàn)了對(duì)典籍圖像的深度揭示,再通過(guò)關(guān)聯(lián)外部詞表和其他相關(guān)資源,讀者可獲取更多相關(guān)的背景知識(shí),探究作者與典籍知識(shí)發(fā)現(xiàn)。《爾雅音圖》與外部詞表進(jìn)行關(guān)聯(lián),可通過(guò)SPARQL聯(lián)邦檢索獲取外部數(shù)據(jù)API實(shí)現(xiàn),例如需要了解《爾雅》注疏者的更多背景資料信息時(shí),可以檢索并關(guān)聯(lián)中國(guó)歷代人物傳記資料庫(kù)(CBDB),CBDB API支持人物ID和人名兩種查詢方式,我們通過(guò)人名查詢《爾雅疏》作者邢昺,CBDB可顯示與邢昺的所處朝代、籍貫、科舉、同僚、合著者、學(xué)生、家人及其他相關(guān)的人物和作品等背景知識(shí)。通過(guò)在《爾雅》詞表里面加入一條三元組owl:same As 關(guān)聯(lián)到CBDB的邢昺知識(shí)圖譜。圖7不但顯示了古代一種被稱作“駂”的馬的相關(guān)注釋、注者、作品、分類、注疏原句、例句及注疏等典籍知識(shí)圖譜,還關(guān)聯(lián)到CBDB,顯示與注疏者邢昺有關(guān)的人、時(shí)、地、作品等更多背景信息,再進(jìn)一步關(guān)聯(lián)其他典籍中相關(guān)馬的高清圖像及文本信息,為典籍考證和圖像敘事等數(shù)字人文應(yīng)用提供了幫助。

      4.3 《爾雅音圖》數(shù)字人文應(yīng)用場(chǎng)景

      通過(guò)對(duì)《爾雅音圖》的深度揭示,實(shí)現(xiàn)了《爾雅》圖文互釋、語(yǔ)義標(biāo)注和關(guān)聯(lián)檢索功能,為數(shù)字人文應(yīng)用提供了可以眾包參與的交互操作平臺(tái),可實(shí)現(xiàn)“以圖證史”“圖像敘事”“多媒介傳播”的數(shù)字人文應(yīng)用場(chǎng)景。

      首先,“以圖證史”應(yīng)用。利用圖像互操作平臺(tái),將《爾雅音圖》中的插圖及文字與相關(guān)典籍圖像、出土文物圖像等相互比對(duì),對(duì)考證典籍出處、版本、作者、古代社會(huì)生活、經(jīng)濟(jì)、軍事、典章制度、自然環(huán)境等具有重要價(jià)值。例如,有學(xué)者在對(duì)《爾雅》插圖研究時(shí),通過(guò)高清圖的呈現(xiàn)發(fā)現(xiàn)《爾雅》“釋天—講武圖”中犬的形象和《事林廣記》插圖中犬的形象非常相似,都有腦袋偏長(zhǎng)、身上有條紋、尾巴上卷、頸上佩戴鈴鐺等特點(diǎn),在出土元墓壁畫中的犬也有同樣形態(tài)(見(jiàn)圖8),據(jù)此作為《爾雅》圖像有元代淵源的佐證[35]?!稜栄乓魣D》中的“釋草”“釋木”還可以和《唐本草》《本草圖經(jīng)》等醫(yī)藥典籍進(jìn)行比對(duì),再結(jié)合文本分析,從時(shí)空地多維度考證古代植物特征及其出處?!稜栄乓魣D》中神話人物、動(dòng)物圖像與《山海經(jīng)》進(jìn)行比對(duì),考證神話傳說(shuō)的歷史地理出處。

      圖8 《爾雅音圖》與元墓壁畫中的犬

      其次,圖像敘事應(yīng)用。人類最早的圖像符號(hào)象形文字就具有敘事屬性,國(guó)外學(xué)者將圖像敘事定義為“視覺(jué)或繪畫表現(xiàn)的文本表現(xiàn)”[36]?!稜栄乓魣D》中包含了大量反映先秦時(shí)期人類生活、自然生態(tài)和社會(huì)文化等多方面的寫實(shí)插圖,有宮廷建筑、常用器具、工具、樂(lè)器、天地四方、物產(chǎn)人物、天象、山川、河流、動(dòng)物、植物等實(shí)體圖像630余幅,并配有注釋文字,對(duì)這些珍貴的插圖與文字記載,按主題進(jìn)行深度揭示,建立《爾雅》圖像敘事模型,通過(guò)圖像場(chǎng)景分層、實(shí)體對(duì)象標(biāo)注、情感詞語(yǔ)標(biāo)注和實(shí)體關(guān)系抽取,建立圖像及其背景的文本關(guān)聯(lián),描述圖文混搭的敘事情節(jié),再通過(guò)主題關(guān)聯(lián)《詩(shī)經(jīng)》《尚書》《楚辭》《周易》《論語(yǔ)》等相關(guān)典籍文獻(xiàn)和插圖,給讀者提供豐富的圖像知識(shí)及其背景故事情節(jié),在碎片化閱讀時(shí)代,激發(fā)讀者閱讀典籍的欲望、圖像審美和主體參與的探究精神。

      最后,典籍多媒介傳播。隨著語(yǔ)義網(wǎng)絡(luò)和動(dòng)態(tài)云計(jì)算的普及,讀者通過(guò)多媒介快速訪問(wèn)、傳播藏品圖像,為《爾雅音圖》創(chuàng)建推特訂閱和RSS訂閱,以吸引更多讀者參與,通過(guò)語(yǔ)義網(wǎng)聚合引擎和IIIF圖像互操作標(biāo)準(zhǔn),將中國(guó)典籍與世界各國(guó)典藏資源庫(kù)進(jìn)行關(guān)聯(lián)和互操作,將翻譯、解釋、比較、分析等工作流程進(jìn)行眾包,創(chuàng)建作者索引和搜索系統(tǒng),記錄和展示讀者對(duì)藏品的操作與相關(guān)爭(zhēng)論,設(shè)計(jì)移動(dòng)APP,使用移動(dòng)設(shè)備標(biāo)注圖像,編輯與呈現(xiàn)《爾雅》圖像敘事情節(jié),利用沉浸式多媒介交互平臺(tái),創(chuàng)作者、讀者、人文學(xué)者、留學(xué)生等都可以通過(guò)網(wǎng)絡(luò)進(jìn)行交流互動(dòng)。還可以利用虛擬現(xiàn)實(shí)技術(shù),創(chuàng)設(shè)古代自然和人文環(huán)境,讓人身臨其境,學(xué)習(xí)和體驗(yàn)古代社會(huì)生活,突破語(yǔ)言和文化的障礙,促進(jìn)典籍圖像在世界范圍的數(shù)字人文推廣、傳播與利用。

      5 結(jié)論與展望

      典籍圖像在數(shù)字人文中具有以圖證史、圖像敘事和多媒介傳播等作用,國(guó)際圖像互操作框架(IIIF)和資源描述框架(RDF)促進(jìn)了典籍圖像藏品的共享與利用。本文結(jié)合IIIF與RDF,參考圖像元數(shù)據(jù)標(biāo)準(zhǔn),構(gòu)建包括圖像數(shù)字化、深度語(yǔ)義標(biāo)注和數(shù)字人文應(yīng)用的典籍圖像深度揭示與利用的模型架構(gòu),實(shí)現(xiàn)了圖像掃描、OCR識(shí)別與元數(shù)據(jù)組織的圖像數(shù)字化過(guò)程,提出了典籍圖像深度標(biāo)注的三個(gè)層次:(1)利用IIIF呈現(xiàn)API實(shí)現(xiàn)圖像的場(chǎng)景標(biāo)注;(2)通過(guò)映射圖像元數(shù)據(jù)核心元素進(jìn)行典籍實(shí)體內(nèi)容標(biāo)注;(3)通過(guò)構(gòu)建典籍多語(yǔ)語(yǔ)義詞表實(shí)現(xiàn)典籍實(shí)體概念的深度標(biāo)注與語(yǔ)義關(guān)聯(lián)。例證采用經(jīng)典辭書《爾雅》的手繪插圖版《爾雅音圖》,利用自主研發(fā)的基于沉浸式多維圖像智慧互操作平臺(tái)進(jìn)行《爾雅》圖像的數(shù)字化,通過(guò)構(gòu)建多語(yǔ)語(yǔ)義詞表,實(shí)現(xiàn)對(duì)《爾雅》圖像實(shí)體對(duì)象的深度語(yǔ)義關(guān)聯(lián),擴(kuò)展了對(duì)《爾雅》注者、作品等信息的關(guān)聯(lián)。最后探究了《爾雅音圖》的數(shù)字人文應(yīng)用場(chǎng)景,包括圖文互證、圖像敘事和多媒介傳播。未來(lái)將利用眾包工具深度標(biāo)注更多不同版本的典籍圖像,通過(guò)領(lǐng)域多語(yǔ)語(yǔ)義詞表建立與世界不同館藏典籍圖像、文本的關(guān)聯(lián);同時(shí)開(kāi)發(fā)基于IIIF的移動(dòng)式多媒介典籍傳播平臺(tái),使分布在世界各地的讀者、學(xué)者利用移動(dòng)設(shè)備眾包參與典籍閱讀、解釋、標(biāo)注、分析、發(fā)現(xiàn)和研究,典籍文獻(xiàn)在公眾賞析、解讀、研究和討論的過(guò)程中獲得新的生命力,真正使書寫在古籍里的文字和圖像活起來(lái),在典籍圖像多媒介傳播與利用的過(guò)程中,實(shí)現(xiàn)中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化與創(chuàng)新性發(fā)展[37]。

      猜你喜歡
      爾雅詞表典籍
      《典籍里的中國(guó)》為什么火?
      金橋(2021年4期)2021-05-21 08:19:24
      A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會(huì)項(xiàng)目名稱漢英對(duì)照詞表
      《爾雅注疏》點(diǎn)校零識(shí)
      天一閣文叢(2018年0期)2018-11-29 07:48:28
      在詩(shī)詞典籍中賞春日盛景
      丁子峻溫文俊士爾雅男神
      作家爾雅《同塵》研討會(huì)順利舉行
      敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
      典籍翻譯模式的構(gòu)建與啟發(fā)
      先秦典籍中的男嬖形象探微
      《爾雅》研究史的立體化構(gòu)建——朱祖延先生雅學(xué)研究管窺
      广西| 贵阳市| 信宜市| 辛集市| 凤翔县| 芜湖市| 丹阳市| 两当县| 盱眙县| 长岭县| 东宁县| 海阳市| 郑州市| 招远市| 南召县| 钟祥市| 沛县| 兴海县| 琼海市| 比如县| 江阴市| 广汉市| 昭通市| 当阳市| 分宜县| 龙江县| 容城县| 石城县| 石柱| 休宁县| 综艺| 天气| 辽源市| 泾川县| 介休市| 如东县| 崇阳县| 扶余县| 博白县| 皮山县| 洱源县|