• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      人文信息資源語(yǔ)義描述、語(yǔ)義組織研究與實(shí)踐述評(píng)*

      2019-08-06 08:59:56歐石燕
      圖書館論壇 2019年8期
      關(guān)鍵詞:詞表本體關(guān)聯(lián)

      左 丹,歐石燕

      0 引言

      數(shù)字人文(Digital Humanities)是在數(shù)字技術(shù)支撐下開展人文研究而形成的交叉研究領(lǐng)域,其研究與實(shí)踐的重點(diǎn)之一在于使用數(shù)字技術(shù)對(duì)數(shù)字化或原生的數(shù)字人文信息資源進(jìn)行采集、描述、組織與分析。人文信息資源具有復(fù)雜性和多樣性,如何將其轉(zhuǎn)化為計(jì)算機(jī)可讀、可處理、可理解、可利用的優(yōu)質(zhì)數(shù)字資源,是在數(shù)字人文研究中需要解決的重要問題。傳統(tǒng)數(shù)字人文研究多建立在實(shí)體資源數(shù)字化的基礎(chǔ)上,并通過(guò)為數(shù)字資源添加簡(jiǎn)單元數(shù)據(jù)來(lái)完成資源的描述與組織工作,但該方式僅能揭示資源粗粒度的淺層外部特征,無(wú)法有效解決數(shù)據(jù)格式異構(gòu)、實(shí)體名稱歧義、實(shí)體間關(guān)系描述等問題,不利于資源的深度分析與有效利用。利用本體、關(guān)聯(lián)數(shù)據(jù)等語(yǔ)義網(wǎng)技術(shù),能夠?qū)崿F(xiàn)對(duì)人文信息資源的語(yǔ)義描述與組織,從而為語(yǔ)義檢索、語(yǔ)義關(guān)聯(lián)、信息可視化、知識(shí)發(fā)現(xiàn)等知識(shí)服務(wù)提供支持。近年圖書情報(bào)、計(jì)算機(jī)和人文領(lǐng)域的學(xué)者們開始嘗試將語(yǔ)義網(wǎng)技術(shù)應(yīng)用到人文信息資源描述與組織工作之中,并涌現(xiàn)了一批成功的研究實(shí)踐項(xiàng)目。在此背景下,本文對(duì)國(guó)內(nèi)外人文信息資源語(yǔ)義描述、組織、發(fā)布、服務(wù)工作進(jìn)行梳理總結(jié),以期為數(shù)字人文研究與實(shí)踐提供參考。

      1 人文信息資源語(yǔ)義描述

      人文信息資源的語(yǔ)義描述是關(guān)聯(lián)數(shù)據(jù)發(fā)布與知識(shí)服務(wù)的基礎(chǔ),本體是有效的語(yǔ)義描述技術(shù)解決方案。在已有研究與實(shí)踐中,人文信息資源的語(yǔ)義描述主要聚焦于文化遺產(chǎn)、歷史地理、文學(xué)藝術(shù)等領(lǐng)域,本節(jié)將逐一進(jìn)行總結(jié)評(píng)價(jià)。

      1.1 文化遺產(chǎn)資源語(yǔ)義描述

      當(dāng)前文化遺產(chǎn)資源數(shù)字化工作得到以博物館為主的文化機(jī)構(gòu)的重視,基于本體的數(shù)字文化遺產(chǎn)語(yǔ)義描述逐漸成為關(guān)注焦點(diǎn),出現(xiàn)了大量領(lǐng)域本體模型,較具代表性的有國(guó)際文獻(xiàn)工作委員會(huì)之概念參考模型(CIDOC CRM)、ABC 本體、藝術(shù)品描述類目(CDWA)。這三個(gè)模型雖都面向文化遺產(chǎn)領(lǐng)域,但在內(nèi)容設(shè)計(jì)與實(shí)際應(yīng)用上各有特點(diǎn)。

      CIDOC CRM 模型是一個(gè)文化遺產(chǎn)領(lǐng)域的基礎(chǔ)性本體,由國(guó)際博物館協(xié)會(huì)下的文獻(xiàn)工作委員會(huì)(ICOM-CIDOC)開發(fā)設(shè)計(jì),首次發(fā)布于1999年并持續(xù)更新至今。2006年該模型成為ISO 推薦標(biāo)準(zhǔn)后得到廣泛應(yīng)用,成為文化遺產(chǎn)資源語(yǔ)義描述的主流選擇。CIDOC CRM 模型最新版包含99 個(gè)類和188 個(gè)屬性,為文化遺產(chǎn)資源中各類顯性或隱性概念及其關(guān)系提供了可映射且可擴(kuò)展的形式化描述規(guī)范[1]。ABC 本體是在美英澳國(guó)際合作項(xiàng)目Harmony 中開發(fā)設(shè)計(jì)的一個(gè)為實(shí)現(xiàn)跨領(lǐng)域資源整合的框架模型,有14 個(gè)類和20 個(gè)屬性[2]。ABC 本體與CIDOC CRM 模型的目標(biāo)都是為了促進(jìn)文化遺產(chǎn)資源的集成、共享與互操作,二者具有重疊性,因此Harmony 項(xiàng)目后期轉(zhuǎn)而開始研究ABC 本體與CIDOC CRM 模型的合并問題,ABC 本體逐漸停止使用。CDWA 是由藝術(shù)信息任務(wù)組(ATIF)設(shè)計(jì)的一個(gè)用于描述藝術(shù)品、建筑等數(shù)字文化遺產(chǎn)資源的元數(shù)據(jù)規(guī)范,包含540 個(gè)元素,其中有13 個(gè)核心元素,是描述一個(gè)資源對(duì)象所需的最少元素[3]。嚴(yán)格來(lái)說(shuō),CDWA 并不是真正意義上的本體模型,但提供了詳細(xì)的元素定義,經(jīng)常被用來(lái)規(guī)范化描述數(shù)字文化遺產(chǎn)資源。在上述三個(gè)語(yǔ)義描述模型中,CIDOC CRM 模型提供了詳盡的類與屬性定義,具有強(qiáng)大的描述能力,可用來(lái)揭示資源對(duì)象內(nèi)部深層次的細(xì)節(jié)語(yǔ)義信息,但它也被認(rèn)為過(guò)于復(fù)雜,較深的類層次和抽象的類定義降低了模型的易用性和可理解性[4]。模型中時(shí)間特性的語(yǔ)義信息開始得到關(guān)注,通過(guò)設(shè)置時(shí)間相關(guān)的類與屬性,揭示資源對(duì)象在某一時(shí)間點(diǎn)的狀態(tài)、某段時(shí)刻內(nèi)的狀態(tài)變化等動(dòng)態(tài)語(yǔ)義信息,如CIDOCCRM模型中的“時(shí)空集合(Spacetime Volume)”類、ABC 本體中的“時(shí)間性(Temporality)”類。此外,模型間的映射問題引起了設(shè)計(jì)者的重視,如CDWA 與MARC 元數(shù)據(jù)規(guī)范、DC 元數(shù)據(jù)規(guī)范、CIDOC CRM 模型等均建立了映射關(guān)系,這反映了學(xué)界對(duì)于實(shí)現(xiàn)資源集成與共享的共同訴求。

      近年CIDOC CRM 模型已被許多國(guó)際機(jī)構(gòu)與項(xiàng)目團(tuán)隊(duì)認(rèn)可和使用。在這些項(xiàng)目實(shí)踐中,有的采用CIDOC CRM 模型描述文化機(jī)構(gòu)館藏資源的創(chuàng)建者、類型、尺寸等元數(shù)據(jù)信息,如俄羅斯國(guó)家博物館[5]、波蘭數(shù)字圖書館聯(lián)盟[6];有的將CIDOC CRM 模型用于集成多個(gè)不同來(lái)源的文化遺產(chǎn)資源數(shù)據(jù)集,如歐盟項(xiàng)目SCULPTEUR 描述和集成了五個(gè)歐洲藝術(shù)機(jī)構(gòu)繪畫藏品相關(guān)的人物、繪畫技術(shù)、風(fēng)格等信息[7],CLAROS 項(xiàng)目整合了多個(gè)關(guān)于古希臘、古羅馬古典藝術(shù)的數(shù)據(jù)庫(kù)資源[8],芬蘭語(yǔ)義計(jì)算研究小組(SeCo)項(xiàng)目WW1LOD 集成并描述了多個(gè)一戰(zhàn)相關(guān)數(shù)據(jù)集所提供的戰(zhàn)爭(zhēng)事件、參與人物、時(shí)間、地點(diǎn)等信息[9]。此外,一些人文信息資源管理平臺(tái)將CIDOC CRM 模型作為資源描述規(guī)范推薦其用戶使用,如 ResearchSpace、Arches、WISSKI。也有一些項(xiàng)目在借鑒CIDOC CRM 模型的基礎(chǔ)上開發(fā)設(shè)計(jì)自己的語(yǔ)義描述模型。比如,歐洲數(shù)字圖書館項(xiàng)目Europeana 設(shè)計(jì)的EDM 模型復(fù)用CIDOC CRM 模型的部分類與屬性,描述了數(shù)字文化資源對(duì)象相關(guān)的事件、物理實(shí)體、人物等情境信息[10];斯洛文尼亞國(guó)家級(jí)項(xiàng)目Ethnomuse 綜合CIDOC CRM 模型與FRBR 模型,設(shè)計(jì)了一個(gè)靈活可擴(kuò)展的數(shù)據(jù)模型,并用其描述了斯洛文尼亞民族歌舞多媒體資源相關(guān)的生產(chǎn)事件、表演者等信息[11]。這些案例均反映出CIDOC CRM 模型的可用性與適用性,其或?qū)⒊蔀槲磥?lái)一段時(shí)間內(nèi)文化遺產(chǎn)資源語(yǔ)義描述的最佳選擇。

      國(guó)內(nèi)尚缺乏應(yīng)用CIDOC CRM 模型的大型項(xiàng)目實(shí)踐,僅有學(xué)者展開小范圍的研究探索。孫傳明[12]使用該模型描述民俗舞蹈的舞蹈類型、呈現(xiàn)形式、傳承人等信息。郝挺雷[13]基于該模型描述中國(guó)傳統(tǒng)節(jié)日相關(guān)的民俗活動(dòng)、行為主體、物品等信息。董坤[14]在對(duì)該模型進(jìn)行擴(kuò)展的基礎(chǔ)上,描述非遺項(xiàng)目的流傳地域、時(shí)間、事件、參與者等信息。這一現(xiàn)狀主要緣于國(guó)內(nèi)重要文化遺產(chǎn)收藏機(jī)構(gòu)博物館在語(yǔ)義網(wǎng)領(lǐng)域的缺位、資源描述與組織未深入到語(yǔ)義內(nèi)容層面、CIDOC CRM 模型與中文歷史資源的適配等問題的存在。由此,跨領(lǐng)域機(jī)構(gòu)合作、描述規(guī)范標(biāo)準(zhǔn)統(tǒng)一、中文語(yǔ)義模型構(gòu)建、國(guó)際主流模型映射等應(yīng)引起關(guān)注。

      1.2 歷史地理資源語(yǔ)義描述

      早期的歷史地理領(lǐng)域研究與實(shí)踐多著眼于靜態(tài)單一的歷史信息或地理信息的語(yǔ)義描述。近年來(lái),學(xué)者們開始關(guān)注歷史變更下的地理位置遷移問題,將時(shí)間維度的歷史信息與空間維度的地理信息相結(jié)合,衍生出了人文歷史地理信息的時(shí)空語(yǔ)義描述模型。

      1.2.1 單一歷史或地理信息的語(yǔ)義描述

      在歷史領(lǐng)域,一些學(xué)者針對(duì)某一歷史年代或歷史事件設(shè)計(jì)專門語(yǔ)義描述模型,如肖懷志等[15]的歷史年代本體、董慧等[16]的國(guó)共合作事件本體。這些模型提供了歷史紀(jì)年法下的時(shí)間實(shí)體同義異名問題,以及歷史事件中人物、時(shí)間、地點(diǎn)等實(shí)體對(duì)象間關(guān)系的描述方案。在地理領(lǐng)域,學(xué)者們重點(diǎn)關(guān)注地理名稱或位置信息的語(yǔ)義描述,如GeoNames 本體提供了現(xiàn)代地理名稱、行政歸屬、區(qū)域位置等地理特征信息的描述方案[17]。單一歷史或地理信息本體模型通常僅面向資源對(duì)象某一特定方面(如歷史年代、地理名稱)的語(yǔ)義信息,無(wú)法獨(dú)立完成歷史地理資源的宏觀語(yǔ)義描述,需要對(duì)其進(jìn)行擴(kuò)展。這些模型未實(shí)現(xiàn)時(shí)間與空間信息的關(guān)聯(lián)融合,人文信息資源中地理名稱變化、地理位置變遷等語(yǔ)義描述問題也沒有得到解決,實(shí)體概念歧義現(xiàn)象依舊存在。對(duì)于上述問題,一些學(xué)者開始嘗試從時(shí)間視角動(dòng)態(tài)地描述地理名稱與地理空間的歷史演變,出現(xiàn)了時(shí)空維度下的歷史地理信息語(yǔ)義描述模型。

      1.2.2 時(shí)空維度下的歷史地理信息語(yǔ)義描述

      聯(lián)合國(guó)糧農(nóng)組織地緣政治本體[18]、芬蘭時(shí)空本體(SAPO)[19]、上海圖書館歷史地理數(shù)據(jù)時(shí)空本體[20]等模型都提供了動(dòng)態(tài)歷史地理信息的描述方案。在上述語(yǔ)義描述模型中,地緣政治本體通過(guò)設(shè)置屬性“是…的繼任(isSuccessorOf)”“是…的前任(isPredecessorOf)”“自…生效 (validSince)”“直到…有效(validUntil)”,實(shí)現(xiàn)對(duì)聯(lián)合國(guó)糧農(nóng)組織成員國(guó)地理特征變化的簡(jiǎn)單描述,與之類似的還有意大利 Geolat (Geography for Latin Literature)項(xiàng)目中的GO!本體[21]。芬蘭時(shí)空本體和上海圖書館歷史地理數(shù)據(jù)時(shí)空本體則針對(duì)這一問題設(shè)計(jì)了更為復(fù)雜的描述方案,其共同點(diǎn)在于通過(guò)設(shè)置時(shí)間類與屬性(如時(shí)間段、年號(hào)紀(jì)年)為資源對(duì)象增添時(shí)間維度信息,通過(guò)設(shè)置地理類與屬性(如邊界、地名)為資源對(duì)象增添空間維度信息,通過(guò)設(shè)置關(guān)聯(lián)關(guān)系(如時(shí)空區(qū)域STR、變更事件)將兩個(gè)維度的信息相互關(guān)聯(lián)。但與芬蘭時(shí)空本體相比,上海圖書館歷史地理數(shù)據(jù)時(shí)空本體中“事件”類的定義揭示了地理要素與事件、時(shí)間要素之間的語(yǔ)義關(guān)系,對(duì)人文信息資源內(nèi)容信息的描述更具系統(tǒng)性和可擴(kuò)展性,“年號(hào)紀(jì)年”類的設(shè)置更符合中國(guó)歷史特點(diǎn),對(duì)于中文人文信息資源的語(yǔ)義描述具有更強(qiáng)的適用性。

      歷史地理資源語(yǔ)義描述由單一、靜態(tài)向多維、動(dòng)態(tài)的轉(zhuǎn)變反映出當(dāng)前人文信息資源描述與組織工作趨于語(yǔ)義化、細(xì)粒度、內(nèi)容性的發(fā)展態(tài)勢(shì),學(xué)者們將更加關(guān)注人文信息資源內(nèi)部蘊(yùn)含的多種元素(如事件、人物、地點(diǎn))及元素間關(guān)系的語(yǔ)義揭示,這有利于人文信息資源效用價(jià)值的充分挖掘與利用。但當(dāng)描述資源某一特定內(nèi)容信息時(shí),已有的專門本體模型依舊是有效的,可以被借鑒參考或直接復(fù)用。

      1.3 文學(xué)藝術(shù)資源語(yǔ)義描述

      小說(shuō)、詩(shī)歌、漫畫等文學(xué)作品和繪畫、音樂、舞蹈等藝術(shù)作品也是人文信息資源的重要組成部分。文學(xué)作品通常以圖書的形態(tài)存在,圖書館領(lǐng)域使用書目元數(shù)據(jù)方案對(duì)其進(jìn)行語(yǔ)義描述;藝術(shù)作品表現(xiàn)形態(tài)特殊,學(xué)者們多針對(duì)特定類別展開建模工作。

      1.3.1 文學(xué)作品的語(yǔ)義描述

      DC、FRBR、BIBFRAME 是當(dāng)前較成熟的面向書目元數(shù)據(jù)的元數(shù)據(jù)方案或模型,文學(xué)作品的語(yǔ)義描述多在參考這些模型的基礎(chǔ)上進(jìn)行,區(qū)別在于描述的粒度與深度不同。

      以圖書館為主的文化機(jī)構(gòu)使用這些模型描述館藏資源,如美國(guó)國(guó)會(huì)圖書館[22]、上海圖書館[23];Senan Kiryakos[24]、Eetu Makela[25]等則對(duì)這些模型的層級(jí)進(jìn)行簡(jiǎn)化改進(jìn)以描述日本漫畫、芬蘭小說(shuō)等特定資源對(duì)象。在描述過(guò)程中,研究者們開始關(guān)注不同類型的文學(xué)作品所特有的信息內(nèi)容,如日本漫畫的卷期連載關(guān)系、小說(shuō)的類型流派與故事角色、家譜中的家族遷徙變化[26]。這些應(yīng)用實(shí)踐描述了更細(xì)粒度的文學(xué)作品信息,但仍屬于書目元數(shù)據(jù)層面,作品內(nèi)部的內(nèi)容語(yǔ)義信息未得到揭示。

      有學(xué)者以更深層次的文學(xué)作品內(nèi)容語(yǔ)義信息作為描述對(duì)象,較具代表性的項(xiàng)目有意大利國(guó)家級(jí)項(xiàng)目數(shù)字但丁百科全書(DanteSources)[27]、芬蘭語(yǔ)義計(jì)算研究小組人物傳記平臺(tái)(BioSampo)[28]。這些項(xiàng)目通常從某一特定研究角度出發(fā)對(duì)文學(xué)作品展開語(yǔ)義描述,如DanteSources 描述了詩(shī)人但丁在其作品中的引用信息①,BioSampo 重點(diǎn)關(guān)注傳記類文學(xué)作品中的人物生平信息,并設(shè)計(jì)了傳記概念參考模型(BioCRM)[29]描述傳記中涉及的人物、時(shí)間、地點(diǎn)、事件間的語(yǔ)義關(guān)系。

      通常來(lái)說(shuō),細(xì)粒度、深層次的語(yǔ)義描述能夠揭示更豐富的信息內(nèi)容,因而受到了學(xué)者們的推崇,但由此帶來(lái)的高難度、大工作量使得這并不適用于所有的資源描述研究與實(shí)踐,因此應(yīng)當(dāng)根據(jù)研究目的選擇適當(dāng)?shù)拿枋龇绞?。?duì)于大體量的數(shù)據(jù)集合,書目信息層面的語(yǔ)義描述更便于資源的集成與共享,對(duì)于單一類別的小范圍資源對(duì)象,內(nèi)容層面的語(yǔ)義描述能夠揭示資源內(nèi)部蘊(yùn)含的知識(shí)信息,更適合深度規(guī)律探尋與知識(shí)發(fā)現(xiàn)。

      1.3.2 藝術(shù)作品的語(yǔ)義描述

      擁有復(fù)雜表現(xiàn)形態(tài)的藝術(shù)作品增加了語(yǔ)義描述的難度。繪畫、雕塑等實(shí)體藝術(shù)作品多被作為文化遺產(chǎn)資源進(jìn)行描述,CIDOC CRM 模型等文化遺產(chǎn)領(lǐng)域本體模型在這個(gè)過(guò)程中被使用,創(chuàng)作者、尺寸材質(zhì)、主題類別等基本特征語(yǔ)義信息得以被揭示。近年來(lái),實(shí)體藝術(shù)作品的內(nèi)容語(yǔ)義信息也開始得到關(guān)注,如徐雷等[30]構(gòu)建的敘事型圖像語(yǔ)義標(biāo)注模型即提供了壁畫、油畫中所講述的故事情節(jié)內(nèi)容的描述方案。

      音樂、戲劇等藝術(shù)門類擁有動(dòng)態(tài)的表演形式,領(lǐng)域?qū)S行暂^強(qiáng),現(xiàn)有的通用模型無(wú)法準(zhǔn)確表現(xiàn)其藝術(shù)特征,需要制定專門語(yǔ)義描述模型,目前代表性模型有音樂本體(Music Ontology)[31]、演奏音樂本體(Performed Music Ontology)[32]、民俗舞蹈本體[12]、戲劇本體[33]。這些本體模型實(shí)質(zhì)上都源于BIBFRAME 和CIDOCCRM 等已有領(lǐng)域通用模型,但增加了能夠反映其領(lǐng)域特色的類與屬性,如演出事件、傳承人、戲劇行當(dāng)。此外,音調(diào)本體(KeyOntology)、樂器分類詞表(Instrument Taxonomy)、音頻信號(hào)特征本體(Features Ontology)等專業(yè)詞表或本體也被參考或引用[31]。

      藝術(shù)作品語(yǔ)義描述的重點(diǎn)是揭示資源對(duì)象所獨(dú)有的藝術(shù)特征信息,因而種類繁雜的藝術(shù)領(lǐng)域尚未有通用的語(yǔ)義描述模型出現(xiàn)。但BIBFRAME、CIDOC CRM 等已得到廣泛應(yīng)用的成熟模型為其提供了框架基礎(chǔ),可參考擴(kuò)展或部分復(fù)用,CDWA等領(lǐng)域詞表規(guī)范檔提供了規(guī)范化的元素定義,可進(jìn)行映射或直接使用,這種語(yǔ)義描述方式有利于增強(qiáng)人文信息資源的集成與共享。

      2 人文信息資源關(guān)聯(lián)數(shù)據(jù)集

      本體提供了資源對(duì)象的描述規(guī)范,解決了人文信息資源的語(yǔ)義描述問題,將雜亂的原始人文資源轉(zhuǎn)換為結(jié)構(gòu)化的RDF 數(shù)據(jù),實(shí)現(xiàn)了從“數(shù)據(jù)”到“知識(shí)”的轉(zhuǎn)變。而將語(yǔ)義化后的知識(shí)信息以關(guān)聯(lián)數(shù)據(jù)的形式發(fā)布在互聯(lián)網(wǎng)上,能夠使其更大程度地被共享與重用。當(dāng)前的人文領(lǐng)域關(guān)聯(lián)數(shù)據(jù)集可分為詞表數(shù)據(jù)集與實(shí)例數(shù)據(jù)集兩大類。

      2.1 人文詞表關(guān)聯(lián)數(shù)據(jù)集

      人名表、地名表等詞表、規(guī)范檔為人文信息資源的語(yǔ)義描述提供了統(tǒng)一的詞匯規(guī)范。有學(xué)者通過(guò)或?qū)⒁延性~表進(jìn)行RDF 格式轉(zhuǎn)換,或直接以RDF 格式新建詞表的方式發(fā)布詞表關(guān)聯(lián)數(shù)據(jù)集,并支持用戶使用瀏覽器瀏覽、通過(guò)SPARQL端點(diǎn)查詢和多格式數(shù)據(jù)集下載。

      原始詞表的內(nèi)容質(zhì)量以及詞表的本體映射是基于格式轉(zhuǎn)換的關(guān)聯(lián)數(shù)據(jù)發(fā)布方式的關(guān)注重點(diǎn),蓋蒂詞匯表項(xiàng)目(Getty Vocabulary Program)是其中較具代表性的項(xiàng)目實(shí)踐。早在1970年代后期,美國(guó)蓋蒂研究所就開始了人文領(lǐng)域詞表的構(gòu)建工作,先后發(fā)布《藝術(shù) & 建筑敘詞表》(AAT)、《藝術(shù)家聯(lián)合名錄》(ULAN)、《地理名稱敘詞表》(TGN)、《文化對(duì)象名稱規(guī)范檔》(CONA)、圖像規(guī)范檔(IA)等詞表資源,并保持更新至今。這些詞表提供藝術(shù)、建筑、古地理等人文術(shù)語(yǔ)詞匯的規(guī)范化定義。蓋蒂詞匯表項(xiàng)目下的關(guān)聯(lián)開放數(shù)據(jù)小組致力于將這些詞表轉(zhuǎn)換為關(guān)聯(lián)數(shù)據(jù)的形式公開發(fā)布,并復(fù)用SKOS、DC、FOAF 等11 個(gè)已有模型中的類與屬性實(shí)現(xiàn)術(shù)語(yǔ)詞匯的語(yǔ)義映射[34]。其中,SKOS(Simple Knowledge Organization System)是一個(gè)用于描述敘詞表、分類詞表、主題標(biāo)引系統(tǒng)等結(jié)構(gòu)化控制詞表的語(yǔ)義模型,被廣泛應(yīng)用于詞表資源的RDF 語(yǔ)義化表示之中。資源的集成與共享問題同樣得到了蓋蒂詞匯表項(xiàng)目的重視,項(xiàng)目成員將所屬詞表與Europeana、Wikidata 等外部資源進(jìn)行了關(guān)聯(lián),并與CIDOC CRM、CDWA等模型或規(guī)范進(jìn)行了映射。

      對(duì)直接使用語(yǔ)義網(wǎng)技術(shù)新建RDF 數(shù)據(jù)集的發(fā)布方式,資源的內(nèi)容質(zhì)量以及所能提供的用戶服務(wù)是關(guān)注的重點(diǎn),由美國(guó)國(guó)家人文基金會(huì)資助的項(xiàng)目Pleiades 是其中較具代表性的項(xiàng)目實(shí)踐。該項(xiàng)目旨在在互聯(lián)網(wǎng)上出版古代地名的權(quán)威信息,提供3.5 萬(wàn)余條古希臘、古羅馬、古代近東、拜占庭等古代地區(qū)的地名、地理位置信息,并將其映射到現(xiàn)代地圖之上,為人文歷史地理研究提供了珍貴的資料參考[35]。在用戶服務(wù)方面,Pleiades 支持從地理名稱、Pleiades ID、URL 地址三個(gè)途徑檢索與瀏覽數(shù)據(jù)集,并使用現(xiàn)代地圖實(shí)現(xiàn)了地理位置的可視化展示。

      在國(guó)內(nèi),上海圖書館于其開放數(shù)據(jù)平臺(tái)上發(fā)布了人名規(guī)范庫(kù)、華人姓氏表、中國(guó)歷史紀(jì)年表、地理名詞表等人文詞表關(guān)聯(lián)數(shù)據(jù)集,這些數(shù)據(jù)集涵蓋了人文信息資源中所涉及的人、地、時(shí)、事、物五類要素,為中文人文信息資源語(yǔ)義描述提供了基礎(chǔ)知識(shí)庫(kù)支持[36]。

      2.2 人文實(shí)例關(guān)聯(lián)數(shù)據(jù)集

      有學(xué)者或機(jī)構(gòu)集成多個(gè)不同來(lái)源的人文信息資源發(fā)布為關(guān)聯(lián)數(shù)據(jù)以供共享和使用,數(shù)據(jù)集的內(nèi)容質(zhì)量以及所提供的用戶服務(wù)是應(yīng)關(guān)注的重點(diǎn)。沿用前文的領(lǐng)域劃分,本節(jié)從文化遺產(chǎn)、歷史地理、文學(xué)藝術(shù)三方面出發(fā)逐一進(jìn)行介紹。

      在文化遺產(chǎn)領(lǐng)域,以博物館為代表的文化遺產(chǎn)保護(hù)機(jī)構(gòu)將其館藏資源發(fā)布為關(guān)聯(lián)數(shù)據(jù),其中具代表性的有大英博物館[37]、瑞典博物館[38]、西班牙博物館[39]等,這些資源也被部分集成到Europeana 數(shù)字圖書館中。Europeana 是由歐盟各國(guó)博物館、美術(shù)館、圖書館等文化機(jī)構(gòu)共同參與的大型數(shù)字圖書館項(xiàng)目,旨在促進(jìn)歐洲數(shù)字文化遺產(chǎn)資源的傳播與共享。項(xiàng)目設(shè)計(jì)了EDM(Europeana Data Model)模型,實(shí)現(xiàn) 3,500 多所歐洲文化機(jī)構(gòu)館藏資源元數(shù)據(jù)的集成與關(guān)聯(lián),該模型參考OAI-ORE 規(guī)范、CIDOC CRM 模型、SKOS 語(yǔ)言等已有數(shù)據(jù)描述規(guī)范,使用“聚合(ore:Aggregation)”類表示文化遺產(chǎn)對(duì)象及其數(shù)字表示的集合(如圖書、繪畫、電影),使用“非信息資源(sem:NonInformation Resource)”類表示文化遺產(chǎn)對(duì)象相關(guān)的元數(shù)據(jù)信息(如創(chuàng)建者、當(dāng)前位置、主題),用戶可通過(guò)Web 服務(wù)接口(RESTful API)獲取并使用這些數(shù)據(jù)集[40]。文化遺產(chǎn)領(lǐng)域的關(guān)聯(lián)數(shù)據(jù)集多以門戶網(wǎng)站的形式面向用戶開放,提供基本的瀏覽與檢索功能,使得這些資源得以被研究者或感興趣的普通用戶所使用。

      在歷史地理領(lǐng)域,芬蘭語(yǔ)義計(jì)算研究小組構(gòu)建的WarSampo 平臺(tái)基于CIDOC CRM 模型集成了芬蘭二戰(zhàn)死亡記錄、部隊(duì)日志、戰(zhàn)時(shí)地圖以及相關(guān)的照片、電影、雜志文章等資源,用戶可瀏覽與檢索芬蘭二戰(zhàn)中人物、軍隊(duì)、事件、地點(diǎn)信息,為二戰(zhàn)史研究提供了豐富的參考資料[41]。倫敦國(guó)王學(xué)院e-Research 中心的項(xiàng)目SPQR 采用Europeana EDM 元數(shù)據(jù)模型集成了6.8 萬(wàn)余件古希臘、古羅馬碑文、銘文資源,但僅支持關(guān)聯(lián)數(shù)據(jù)集的下載與SPARQL 查詢[42]。此外,在歷史地理領(lǐng)域,基于時(shí)間軸、地圖的信息可視化也是用戶服務(wù)的研究方向之一。

      在文學(xué)藝術(shù)領(lǐng)域,有相當(dāng)數(shù)量的音視頻類媒體數(shù)據(jù)被發(fā)布為關(guān)聯(lián)數(shù)據(jù),其中較具代表性的項(xiàng)目有英國(guó)倫敦大學(xué)瑪麗皇后數(shù)字音樂中心的DBTune[43]、英國(guó)BBC 廣播電臺(tái)的BBC Music和BBC Programmes[44]等。這些項(xiàng)目集成來(lái)自多個(gè)數(shù)據(jù)集的音樂、電視電臺(tái)資源,實(shí)現(xiàn)了異構(gòu)資源的語(yǔ)義集成,共同使用音樂本體(Music Ontology)、FRBR 等已有成熟本體模型進(jìn)行語(yǔ)義描述,并與GeoNames、DBPedia 等外部關(guān)聯(lián)數(shù)據(jù)集相鏈接,起到了語(yǔ)義豐富與語(yǔ)義增強(qiáng)的效果。

      在國(guó)內(nèi),上海圖書館將中國(guó)家譜、名人手稿、盛宣懷檔案、中文古籍等館藏資源發(fā)布為關(guān)聯(lián)數(shù)據(jù),并開放數(shù)據(jù)消費(fèi)接口、開發(fā)面向用戶的門戶平臺(tái),提供多角度檢索、時(shí)空關(guān)系可視化等知識(shí)服務(wù)。這是國(guó)內(nèi)較早將語(yǔ)義網(wǎng)技術(shù)應(yīng)用到人文研究的代表性實(shí)踐,為中文人文信息資源描述與組織做出了示范。

      當(dāng)前人文領(lǐng)域關(guān)聯(lián)數(shù)據(jù)集大都提供了數(shù)據(jù)獲取接口或下載通道,也支持在線瀏覽與SPARQL查詢。但對(duì)于普通用戶來(lái)說(shuō),快速理解RDF 數(shù)據(jù)和使用SPARQL 查詢并非易事,因此,有研究者在對(duì)人文信息資源進(jìn)行語(yǔ)義描述與組織的基礎(chǔ)上開發(fā)了面向用戶的知識(shí)服務(wù)平臺(tái),提供自然語(yǔ)言檢索、可視化瀏覽等功能,人文信息資源的價(jià)值得到充分利用與發(fā)揮,這應(yīng)引起未來(lái)數(shù)字人文研究與實(shí)踐的關(guān)注與重視。

      3 基于語(yǔ)義信息的人文資源知識(shí)服務(wù)

      關(guān)聯(lián)數(shù)據(jù)集的發(fā)布促進(jìn)了人文信息資源的集成與共享,對(duì)擁有豐富人文資源的圖書館、博物館等文化機(jī)構(gòu)來(lái)說(shuō),如何為用戶提供高質(zhì)量的信息服務(wù)與知識(shí)服務(wù)是資源組織工作的最終目的。本節(jié)從用戶服務(wù)角度出發(fā),介紹當(dāng)前在人文信息資源語(yǔ)義描述與語(yǔ)義組織的基礎(chǔ)上所提供的知識(shí)服務(wù)方式,包括語(yǔ)義檢索、語(yǔ)義關(guān)聯(lián)、語(yǔ)義可視化、知識(shí)發(fā)現(xiàn),并結(jié)合國(guó)內(nèi)外代表性項(xiàng)目實(shí)踐進(jìn)行展示。

      3.1 語(yǔ)義檢索

      語(yǔ)義化后的人文信息資源以機(jī)器可讀可理解的RDF 三元組形式表示,SPARQL 查詢提供了針對(duì)這些數(shù)據(jù)集的查詢與獲取機(jī)制,是實(shí)現(xiàn)語(yǔ)義檢索的技術(shù)手段。但這種方式要求用戶了解底層RDF 數(shù)據(jù)結(jié)構(gòu)并熟練掌握SPARQL 語(yǔ)言,易用性較低。對(duì)于該問題,一些項(xiàng)目通過(guò)基于頁(yè)面導(dǎo)航的分面檢索,或基于自然語(yǔ)言提問的關(guān)鍵詞檢索支持普通用戶瀏覽或查詢。而當(dāng)用戶使用自然語(yǔ)言檢索時(shí),語(yǔ)義描述模型又能幫助計(jì)算機(jī)檢索系統(tǒng)更好地理解檢索詞的語(yǔ)義含義,發(fā)現(xiàn)與之相關(guān)聯(lián)的其他概念實(shí)體,從而提升用戶的檢索體驗(yàn)。

      另一方面,本體模型揭示了人文信息資源內(nèi)部概念實(shí)體及其之間的關(guān)系,能夠進(jìn)行更細(xì)粒度的人文信息資源內(nèi)容語(yǔ)義描述,從而實(shí)現(xiàn)多維度、深層次的語(yǔ)義檢索,意大利數(shù)字但丁百科全書(DanteSources)是較具代表性的項(xiàng)目。該項(xiàng)目在對(duì)詩(shī)人但丁在其作品中的引用信息進(jìn)行語(yǔ)義描述的基礎(chǔ)上,支持用戶從但丁作品、被引作品、被引作者、引用類型、引文主題五個(gè)維度出發(fā)探索但丁作品集中的參考引用情況,所有檢索結(jié)果以可視化圖表的形式呈現(xiàn)。圖1為一個(gè)被引作者維度的語(yǔ)義檢索實(shí)例,檢索結(jié)果以柱狀圖的形式展示。經(jīng)觀察可發(fā)現(xiàn),但丁作品Convivio 中共有274 處引用了亞里士多德的言論或著作,是所有但丁作品中對(duì)亞里士多德引用次數(shù)最多的一部[45]。

      圖1 語(yǔ)義檢索案例:Dante Sources

      3.2 語(yǔ)義關(guān)聯(lián)

      語(yǔ)義關(guān)聯(lián)具體體現(xiàn)在內(nèi)部和外部?jī)蓚€(gè)層面。

      從內(nèi)部層面來(lái)說(shuō),使用本體模型進(jìn)行語(yǔ)義描述揭示了人文信息資源內(nèi)部概念實(shí)體間的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)了資源內(nèi)部的語(yǔ)義關(guān)聯(lián),用戶可從某一實(shí)體出發(fā)瀏覽與之相關(guān)的其他實(shí)體對(duì)象。荷蘭聲音視覺研究所的DIVE 項(xiàng)目是其中較具代表性的應(yīng)用實(shí)踐。該項(xiàng)目通過(guò)對(duì)荷蘭新聞廣播視頻、新聞稿件中所提及的事件及事件相關(guān)的其他實(shí)體進(jìn)行語(yǔ)義描述,可為用戶提供以事件為中心的資源瀏覽——用戶能夠從某一新聞事件出發(fā)瀏覽相關(guān)的資源對(duì)象(指荷蘭新聞廣播視頻)及與該事件相關(guān)的人物、地點(diǎn)和其他事件[46]。

      從外部層面來(lái)說(shuō),使用RDF 鏈接連接來(lái)自不同數(shù)據(jù)源的數(shù)據(jù),能夠起到語(yǔ)義集成與語(yǔ)義豐富的作用,實(shí)現(xiàn)了人文信息資源外部的語(yǔ)義關(guān)聯(lián),其中較具代表性的是芬蘭語(yǔ)義計(jì)算研究小組的Hipla.fi 項(xiàng)目。該項(xiàng)目通過(guò)建立多個(gè)分布式SPARQL 查詢的方式集成蓋蒂地理名稱敘詞表(TGN)、1939-1944 芬蘭自治區(qū)②、古歷史地圖③等7 個(gè)不同來(lái)源的芬蘭古代歷史地理信息,并實(shí)現(xiàn)古地圖與現(xiàn)代地圖的映射[47]?;诖?,當(dāng)用戶查找某一古地名時(shí),Hipla.fi 支持用戶一次性完成跨數(shù)據(jù)集的地名檢索,并提供可用的古地圖及現(xiàn)代地圖視圖瀏覽。

      3.3 語(yǔ)義信息可視化

      可視化技術(shù)能夠更直觀、形象地傳達(dá)人文信息資源中的語(yǔ)義信息,幫助用戶理解和挖掘其中蘊(yùn)含的內(nèi)在規(guī)律。當(dāng)前的人文信息資源語(yǔ)義可視化主要包括基于地圖的空間位置可視化、基于時(shí)間軸的時(shí)間序列可視化、基于網(wǎng)狀圖的社會(huì)關(guān)系可視化。

      3.3.1 時(shí)空語(yǔ)義信息可視化

      當(dāng)使用語(yǔ)義描述模型揭示人文信息資源中的空間信息時(shí),可以實(shí)現(xiàn)基于地圖資料的地理位置可視化;當(dāng)揭示人文信息資源中的時(shí)間信息時(shí),可以實(shí)現(xiàn)基于時(shí)間軸的時(shí)間序列可視化。當(dāng)前的數(shù)字人文項(xiàng)目實(shí)踐多將時(shí)間與空間信息相結(jié)合,提供時(shí)空視角下的可視化服務(wù),其中較具代表性的是華東師范大學(xué)的數(shù)字方志集成平臺(tái)項(xiàng)目,該平臺(tái)提供了中文數(shù)字方志資源的時(shí)空檢索功能[48]。圖2為“方志所屬朝代是清代”的檢索結(jié)果,圖右側(cè)為朝代選擇欄,下側(cè)為時(shí)間軸視角的方志年代分布情況,中間為地圖視角的方志位置分布情況。

      圖2 語(yǔ)義可視化案例:數(shù)字方志集成平臺(tái)

      3.3.2 社會(huì)關(guān)系可視化

      當(dāng)使用語(yǔ)義描述模型揭示人文信息資源中人物的社交關(guān)系信息時(shí),能夠以網(wǎng)狀圖的形式展現(xiàn)某一人物的社交網(wǎng)絡(luò)或多個(gè)人物間的社會(huì)關(guān)系,網(wǎng)狀圖中的節(jié)點(diǎn)代表某一人物,節(jié)點(diǎn)間的連線代表人物關(guān)系。譬如,芬蘭語(yǔ)義計(jì)算研究小組所構(gòu)建的文化遺產(chǎn)資源平臺(tái)CultureSampo 支持人物、機(jī)構(gòu)間近50 種社會(huì)關(guān)系的可視化展示,包括親屬關(guān)系(parent-of)、雇用關(guān)系(patron-of)、教學(xué)關(guān)系(teacher-of)等[49]。圖3為人物“拿破侖一世”的社會(huì)網(wǎng)絡(luò)關(guān)系圖。

      圖3 語(yǔ)義可視化案例:CultureSampo

      3.4 知識(shí)發(fā)現(xiàn)

      通過(guò)設(shè)計(jì)標(biāo)準(zhǔn)查詢模版引導(dǎo)用戶構(gòu)建多維度、多條件的檢索策略,并以某種有序方式對(duì)檢索結(jié)果進(jìn)行再組織,能夠從不同角度探索發(fā)現(xiàn)人文信息資源內(nèi)的新知識(shí)。譬如,芬蘭CultureSampo平臺(tái)中的“檢索與組織”功能以“TELL ME ABOUTWHICH…”的形式引導(dǎo)用戶建立查詢式,檢索結(jié)果以列表、地圖、時(shí)間線三種形式呈現(xiàn)[49]。在該功能支持下,用戶可從任意感興趣的主題出發(fā)探索數(shù)據(jù)集中的資源對(duì)象。圖4為一個(gè)知識(shí)發(fā)現(xiàn)案例,構(gòu)建查詢式“TELL ME ABOUT WHICH”檢索平臺(tái)內(nèi)的全部資源對(duì)象,檢索結(jié)果返回所有描繪胡須的圖片,并以時(shí)間軸序列順序排列,觀察可發(fā)現(xiàn)歷史上胡須樣式的演變狀況。

      4 結(jié)語(yǔ)

      當(dāng)前數(shù)字人文研究與實(shí)踐開始逐步采用本體、關(guān)聯(lián)數(shù)據(jù)技術(shù)對(duì)人文信息資源進(jìn)行語(yǔ)義描述和結(jié)構(gòu)化發(fā)布,并在此基礎(chǔ)上提供語(yǔ)義檢索、語(yǔ)義關(guān)聯(lián)、可視化展示、知識(shí)發(fā)現(xiàn)等深層次的知識(shí)服務(wù)。本研究調(diào)查發(fā)現(xiàn),目前國(guó)內(nèi)外數(shù)字人文研究與實(shí)踐具有三大特點(diǎn)。

      (1) 在語(yǔ)義描述方面,CIDOC CRM 和BIBFRAME等通用模型得到了廣泛應(yīng)用,也出現(xiàn)了音樂本體(如Music Ontology)、時(shí)空歷史地理本體(如上海圖書館歷史地理數(shù)據(jù)時(shí)空本體)等特色本體模型。描述重點(diǎn)逐漸從資源的淺層外部特征轉(zhuǎn)向語(yǔ)義層面的內(nèi)容特征,人文信息資源內(nèi)部人、事、地、時(shí)、物等實(shí)體對(duì)象的語(yǔ)義信息得以被揭示,描述粒度愈加細(xì)化。但相較于國(guó)外的諸多成功項(xiàng)目與實(shí)踐,國(guó)內(nèi)還主要停留在理論研究層面,具體的實(shí)踐工作較少,尚未出現(xiàn)一個(gè)較為成熟的中文人文信息資源語(yǔ)義描述規(guī)范。

      圖4 知識(shí)發(fā)現(xiàn)案例:Culture Sampo

      (2)在語(yǔ)義發(fā)布方面,關(guān)聯(lián)數(shù)據(jù)從技術(shù)上解決了語(yǔ)義化人文信息資源的發(fā)布、共享與訪問問題,使得分散、異構(gòu)的人文資源被整合、集成與關(guān)聯(lián),并通過(guò)與外部資源的鏈接實(shí)現(xiàn)語(yǔ)義擴(kuò)展與增強(qiáng)。詞表關(guān)聯(lián)數(shù)據(jù)集為語(yǔ)義描述提供了規(guī)范化的術(shù)語(yǔ)詞匯定義,實(shí)例關(guān)聯(lián)數(shù)據(jù)集為人文研究提供了豐富的資料參考,但這一過(guò)程尚面臨著復(fù)雜人文資源的數(shù)據(jù)處理以及大規(guī)模數(shù)據(jù)的自動(dòng)處理兩大問題。人文信息資源具有復(fù)雜性,文本、圖片、音視頻等多樣的數(shù)據(jù)類型需要不同的處理方式,音樂、舞蹈、戲劇等特殊形態(tài)的人文資源需要專業(yè)的處理技術(shù)。而大數(shù)據(jù)量的人文信息資源使得從零開始手工建立RDF 數(shù)據(jù)集成為一件十分困難的事情,因此自動(dòng)或半自動(dòng)地生成RDF數(shù)據(jù)成為各實(shí)踐項(xiàng)目的主流選擇。但這其中又涉及了中文文本處理、命名實(shí)體識(shí)別、數(shù)據(jù)實(shí)時(shí)更新、可持續(xù)化工作等問題。

      (3)在語(yǔ)義服務(wù)方面,語(yǔ)義網(wǎng)技術(shù)使得人文信息資源從信息服務(wù)轉(zhuǎn)向知識(shí)服務(wù)成為可能。當(dāng)前的人文關(guān)聯(lián)數(shù)據(jù)集主要通過(guò)SPARQL 端點(diǎn)或API接口實(shí)現(xiàn)資源的查詢與訪問,但對(duì)于普通用戶來(lái)說(shuō),理解RDF 數(shù)據(jù)和使用SPARQL 查詢并非易事。部分項(xiàng)目實(shí)踐開發(fā)了面向用戶的門戶平臺(tái),提供基礎(chǔ)的資源瀏覽與檢索功能。在此基礎(chǔ)上,有項(xiàng)目實(shí)踐探索了語(yǔ)義檢索、語(yǔ)義關(guān)聯(lián)、語(yǔ)義可視化、知識(shí)發(fā)現(xiàn)等更深層次的知識(shí)服務(wù)方式,可為未來(lái)的人文信息資源知識(shí)服務(wù)提供思路參考。

      針對(duì)數(shù)字人文研究與實(shí)踐中存在的問題,結(jié)合已有項(xiàng)目的成功經(jīng)驗(yàn),提出如下建議:

      (1)面對(duì)復(fù)雜的人文信息資源,不同的資源類型采取不同的處理方式。從資源的載體形態(tài)來(lái)看,可使用OCR 光學(xué)識(shí)別技術(shù)實(shí)現(xiàn)紙質(zhì)資源的數(shù)字化轉(zhuǎn)換、使用三維成像技術(shù)實(shí)現(xiàn)實(shí)體物件的虛擬化、使用運(yùn)動(dòng)捕捉技術(shù)實(shí)現(xiàn)動(dòng)態(tài)人文資源的收集與存儲(chǔ)、使用圖像及音視頻處理技術(shù)實(shí)現(xiàn)多媒體資源的解析。從資源的數(shù)據(jù)結(jié)構(gòu)來(lái)看,對(duì)于無(wú)結(jié)構(gòu)的原始數(shù)據(jù),使用本體模型進(jìn)行語(yǔ)義描述將其轉(zhuǎn)換為智慧數(shù)據(jù);對(duì)于半結(jié)構(gòu)化的待清洗數(shù)據(jù),使用實(shí)體識(shí)別等語(yǔ)義分析及語(yǔ)義標(biāo)注工具將其轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù);對(duì)于結(jié)構(gòu)化的數(shù)據(jù),使用詞表等知識(shí)組織系統(tǒng)以及鏈接外部資源實(shí)現(xiàn)資源的深度語(yǔ)義挖掘與語(yǔ)義增強(qiáng)[50]。

      (2)充分利用已有資源和軟件工具。數(shù)字人文研究者可利用的資源包括特色人文數(shù)據(jù)庫(kù),各類成熟本體、詞表、規(guī)范檔,以及公開發(fā)布的高質(zhì)量開放關(guān)聯(lián)數(shù)據(jù)集,可利用的軟件工具包括可視化工具、RDF 格式轉(zhuǎn)換工具、命名實(shí)體識(shí)別工具等。宋代學(xué)術(shù)語(yǔ)義網(wǎng)絡(luò)項(xiàng)目在此方面做出了良好示范。該項(xiàng)目通過(guò)抽取開放資源“中國(guó)歷代人物傳記資料庫(kù)”(CBDB)中提供的宋代人物學(xué)術(shù)傳承和親屬關(guān)系信息,使用本體模型將其轉(zhuǎn)換為RDF格式數(shù)據(jù),接著利用可視化工具Rel Finder 構(gòu)建宋代人物關(guān)系知識(shí)圖譜,實(shí)現(xiàn)了歷史人物間關(guān)系的探索與發(fā)現(xiàn)[51]。

      (3)加強(qiáng)跨領(lǐng)域人員及機(jī)構(gòu)間的合作。數(shù)字人文研究應(yīng)由來(lái)自人文、計(jì)算機(jī)、圖書情報(bào)等多個(gè)領(lǐng)域的研究人員合作進(jìn)行,這更符合數(shù)字人文的跨學(xué)科特性,也有利于參與者各自發(fā)揮所長(zhǎng)、提升研究質(zhì)量。

      (4)進(jìn)行數(shù)字人文基礎(chǔ)設(shè)施建設(shè)。數(shù)字人文基礎(chǔ)設(shè)施為數(shù)字人文研究提供數(shù)據(jù)、文獻(xiàn)、軟件工具、學(xué)術(shù)交流與出版等一系列公用設(shè)施及相關(guān)服務(wù)[52]。這一方面有利于人文資源的共建共享;另一方面通過(guò)制定平臺(tái)統(tǒng)一的規(guī)范標(biāo)準(zhǔn),也有利于異構(gòu)人文資源的語(yǔ)義互操作。

      注釋

      ①在但丁的作品Convivio 中,“Asthe Philosopher saysat the beginning of the First Philosophy”一句引自亞里士多德的《形而上學(xué)》。

      ②全稱為“Finnish Municipalities 1939-1944”,由芬蘭國(guó)家檔案館提供,包括612 個(gè)1939-1944年間芬蘭自治地信息。

      ③全稱為“Historical Senate atlas”,由芬蘭國(guó)家檔案館提供,包括404 張芬蘭古代地圖。

      猜你喜歡
      詞表本體關(guān)聯(lián)
      Abstracts and Key Words
      A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會(huì)項(xiàng)目名稱漢英對(duì)照詞表
      對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      奇趣搭配
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      Care about the virtue moral education
      卷宗(2013年6期)2013-10-21 21:07:52
      國(guó)外敘詞表的應(yīng)用與發(fā)展趨勢(shì)探討*
      衡山县| 永平县| 红安县| 郧西县| 合水县| 义乌市| 宜川县| 鄢陵县| 海伦市| 贵溪市| 西林县| 钟祥市| 海晏县| 营口市| 桐梓县| 五寨县| 安福县| 钟祥市| 古蔺县| 仁怀市| 铜梁县| 仪陇县| 井陉县| 建昌县| 莒南县| 应用必备| 琼结县| 赫章县| 平定县| 龙川县| 新泰市| 通许县| 秀山| 乐至县| 禹城市| 上饶市| 霍邱县| 新营市| 自治县| 谷城县| 阳信县|