顏艷萍
(云南省圖書館,云南 昆明650031)
隨著大數(shù)據(jù)、人工智能等現(xiàn)代信息技術(shù)的飛速發(fā)展,數(shù)字技術(shù)同人文社科這兩大領(lǐng)域彼此間的交融和滲透,催生出一個(gè)全新的領(lǐng)域,即數(shù)字人文。其憑借特有的跨學(xué)科、跨領(lǐng)域的特點(diǎn),深刻地影響著歷史、文學(xué)、計(jì)算機(jī)科學(xué)等學(xué)科的演進(jìn),也為古籍資料的重新整合、梳理及使用創(chuàng)造了條件,使其擁有更先進(jìn)的探究方法、工具和平臺(tái)。
古籍是中華民族文化遺產(chǎn)的重要瑰寶,受自然環(huán)境與人為因素的影響,古籍原本流失嚴(yán)重,現(xiàn)存古籍破損情況嚴(yán)重。據(jù)不完全統(tǒng)計(jì),我國(guó)現(xiàn)存古籍超過(guò)五千萬(wàn)冊(cè),其中有三成多損毀嚴(yán)重,急需得到搶救性保護(hù)。[1]“古籍?dāng)?shù)字化,是指利用現(xiàn)代信息技術(shù)對(duì)古籍文獻(xiàn)進(jìn)行加工處理,使其轉(zhuǎn)換成計(jì)算機(jī)能夠辨認(rèn)的數(shù)字信息,構(gòu)建古籍文獻(xiàn)書目數(shù)據(jù)庫(kù)及古籍全文數(shù)據(jù)庫(kù),全面呈現(xiàn)古籍信息資源的一項(xiàng)系統(tǒng)工作?!盵2]它使古籍文獻(xiàn)的文化價(jià)值和社會(huì)服務(wù)功能得到充分體現(xiàn)。可是大部分古籍?dāng)?shù)字化產(chǎn)品僅僅是原件的替代品,文獻(xiàn)檢索基本只能達(dá)到基于字符匹配的全文檢索層次,不能對(duì)古籍文獻(xiàn)進(jìn)行深度挖掘利用,利用率較低。近年來(lái),數(shù)字人文逐漸興起,給古籍?dāng)?shù)字化深度發(fā)展提供了全新的理論根據(jù)和實(shí)際操作方法,使古籍的文本挖掘、語(yǔ)義分析、智能標(biāo)點(diǎn)、文本可視化、語(yǔ)料庫(kù)建設(shè)等成為可能。
數(shù)字人文是將現(xiàn)代計(jì)算機(jī)及互聯(lián)網(wǎng)科技深度運(yùn)用到傳統(tǒng)人文學(xué)科的探究和教學(xué)當(dāng)中的全新領(lǐng)域。它將現(xiàn)代計(jì)算機(jī)及通信技術(shù)運(yùn)用到文獻(xiàn)學(xué)、統(tǒng)計(jì)學(xué)、歷史學(xué)、藝術(shù)學(xué)等傳統(tǒng)人文學(xué)科中,為人文學(xué)科研究提供了新的研究方法與范式。其主要目標(biāo)是促成現(xiàn)代信息技術(shù)同人文科學(xué)之間的滲透和交融,進(jìn)而轉(zhuǎn)變知識(shí)的獲取、注釋、對(duì)比、取樣、闡述及呈現(xiàn)形式,實(shí)現(xiàn)人文研究的升級(jí)和創(chuàng)新發(fā)展。
利用數(shù)字技術(shù)輔助和促進(jìn)人文研究,在西方國(guó)家已然成為一種潮流。以“digital humanities”為名的科研組織、交流圈等在全世界已經(jīng)達(dá)到185個(gè)以上,其中有八成以上均處于歐美境內(nèi)。在我國(guó),相關(guān)方面的研究也正在興起,一是陸續(xù)組建了相關(guān)組織,如北京大學(xué)數(shù)字人文小組(2016年成立)、南京大學(xué)數(shù)字人文研究中心(2017 年成立)等;二是國(guó)家社科基金重大項(xiàng)目對(duì)數(shù)據(jù)庫(kù)建設(shè)的關(guān)注度逐漸提高,單在2017 年此類項(xiàng)目所占的比例便已達(dá)到10%左右;三是開展數(shù)字人文相關(guān)學(xué)術(shù)活動(dòng),一種是舉辦學(xué)術(shù)會(huì)議,如2014 年6 月上海圖書館舉辦的“數(shù)字人文與語(yǔ)義技術(shù)”學(xué)術(shù)會(huì)議,2015 年12 月的“北、清、臺(tái)數(shù)字人文新動(dòng)向——中國(guó)歷代人物傳記資料數(shù)據(jù)庫(kù)CBDB 暨Digging into Data 工作坊”學(xué)術(shù)會(huì)議,2016年5月的“北京大學(xué)數(shù)字人文論壇”(首屆),2016 年5 月的“數(shù)字人文與清史研究”學(xué)術(shù)會(huì)議,2017年5月的“北京大學(xué)數(shù)字人文論壇”(第二屆),2017年7月的南京大學(xué)“數(shù)字人文:大數(shù)據(jù)時(shí)代學(xué)術(shù)前沿與探索”學(xué)術(shù)會(huì)議等;另一種是開設(shè)工作坊,如2016 年南京大學(xué)歷史學(xué)院王濤副教授開設(shè)的“數(shù)字工具與世界史研究”課程,2017 年3 月哈佛大學(xué)訪問(wèn)學(xué)者徐力恒博士在北京大學(xué)開設(shè)的“數(shù)字人文研究技能與方法”讀書會(huì),2017年4月北京大學(xué)圖書館數(shù)字人文工作坊等。[3]
數(shù)字人文涉及的范疇極廣,而古籍?dāng)?shù)字化作為古籍整理系列工程之一,同樣涵蓋了文獻(xiàn)學(xué)、歷史學(xué)、計(jì)算機(jī)技術(shù)等學(xué)科。其跨學(xué)科的特點(diǎn)可以借鑒數(shù)字人文研究的方法。
我國(guó)從上世紀(jì)80年代開始進(jìn)行古籍?dāng)?shù)字化建設(shè),在發(fā)展過(guò)程中,國(guó)家推出了有關(guān)的政策法規(guī),古籍索引數(shù)據(jù)庫(kù)、古籍全文數(shù)據(jù)庫(kù)、古籍書目數(shù)據(jù)庫(kù)等產(chǎn)品相繼誕生,積累了一定經(jīng)驗(yàn)。[4]
3.1.1 政策支持
2007 年1 月,國(guó)家發(fā)布了《國(guó)務(wù)院辦公廳關(guān)于進(jìn)一步加強(qiáng)古籍保護(hù)工作的意見》,啟動(dòng)了“中華古籍保護(hù)計(jì)劃”。中央對(duì)古籍保護(hù)工作做出了詳細(xì)指示,包括確定操作流程和規(guī)范,構(gòu)建相關(guān)數(shù)據(jù)庫(kù);重新配置已有資源,開發(fā)對(duì)公眾開放的古籍網(wǎng)站,為公眾提供古籍資源,實(shí)現(xiàn)古籍價(jià)值最大化。[5]
2017 年國(guó)家相關(guān)部委發(fā)布的《“十三五”時(shí)期全國(guó)古籍保護(hù)工作規(guī)劃》提出,采取激勵(lì)措施,推動(dòng)廣大古籍收藏單位加快古籍?dāng)?shù)字化步伐,發(fā)揮國(guó)家和省級(jí)珍貴古籍?dāng)?shù)字化工作的帶頭作用,以互聯(lián)網(wǎng)、大數(shù)據(jù)等新技術(shù)為依托,優(yōu)先對(duì)特色館藏和古籍善本開展數(shù)字化,加速建設(shè)“中華古籍?dāng)?shù)字資源庫(kù)”及相應(yīng)的信息數(shù)據(jù)管理平臺(tái),按照邊建設(shè)、邊服務(wù)的原則,及時(shí)對(duì)外公布古籍影像資源,促進(jìn)資源共享。[6]
3.1.2 技術(shù)支持
計(jì)算機(jī)和信息技術(shù)的介入,能夠在保護(hù)古籍原貌的基礎(chǔ)上,對(duì)古籍內(nèi)容進(jìn)行數(shù)字存儲(chǔ)、傳輸,以提升古籍的利用率,促進(jìn)古籍文獻(xiàn)在更大范圍內(nèi)傳播。
2012年8月,國(guó)家古籍保護(hù)中心對(duì)珍貴古籍展開了數(shù)字化試點(diǎn)工作,編制了《古籍?dāng)?shù)字化工作手冊(cè)》(試用本)作為工作標(biāo)準(zhǔn)。該手冊(cè)明確了古籍?dāng)?shù)字化的具體范疇、規(guī)范性引用文件、術(shù)語(yǔ)定義、操作程序、加工準(zhǔn)備、元數(shù)據(jù)著錄、圖像數(shù)字化以及數(shù)據(jù)的命名、提交、檢驗(yàn)、接受、發(fā)布、使用等,是整項(xiàng)工作的重要依據(jù)。[7]
3.1.3 用戶需求
古籍文獻(xiàn)有著特殊的歷史背景,屬于不可再生資源,具有重要的史料研究?jī)r(jià)值。從古籍保護(hù)的角度出發(fā),基本上每一家圖書館均對(duì)古籍的查閱對(duì)象、方式等設(shè)定了限制規(guī)定,重視收藏而忽視利用的情況十分常見,這在很大程度上給古籍資源的開發(fā)利用帶來(lái)了阻礙,古籍的保護(hù)和利用這對(duì)矛盾也由此凸顯。古籍?dāng)?shù)字化一方面實(shí)現(xiàn)了對(duì)古籍原件的保護(hù),另一方面為古籍文獻(xiàn)的開發(fā)利用提供了便捷服務(wù)。
云南省圖書館根據(jù)國(guó)家關(guān)于建設(shè)古籍?dāng)?shù)字資源庫(kù)的要求,積極進(jìn)行古籍?dāng)?shù)字化實(shí)踐。以國(guó)家古籍保護(hù)中心編制的《古籍?dāng)?shù)字化工作手冊(cè)》(試用本)為依據(jù),對(duì)館藏珍貴古籍進(jìn)行數(shù)字化處理,建設(shè)古籍?dāng)?shù)據(jù)庫(kù)并進(jìn)行發(fā)布。從設(shè)備選取、元數(shù)據(jù)著錄、圖像采集、加工到最后對(duì)外發(fā)布,各個(gè)步驟、各項(xiàng)操作均進(jìn)行了充分調(diào)研。2014年以來(lái),已將館藏2000 余部4600 余冊(cè)地方文獻(xiàn),636 部2589冊(cè)館藏善本古籍,1522 種6157 頁(yè)拓片進(jìn)行數(shù)字化加工。這些文獻(xiàn)中有不少被收錄到《國(guó)家珍貴古籍名錄》,是云南省圖書館館藏中最具地方特色的古籍。
按照邊建設(shè)、邊服務(wù)的原則,云南省圖書館分批對(duì)這些古籍?dāng)?shù)據(jù)進(jìn)行發(fā)布。于2017 年2 月28日、2018年9月28日、2019年11月12日,先后三次參加國(guó)家圖書館“中華古籍?dāng)?shù)字資源庫(kù)”聯(lián)合在線發(fā)布活動(dòng),對(duì)外公布古籍?dāng)?shù)字資源480部、2103冊(cè),并通過(guò)云南省圖書館官方網(wǎng)站“云南古籍?dāng)?shù)字圖書館”平臺(tái)免費(fèi)為社會(huì)公眾提供服務(wù)。
“云南古籍?dāng)?shù)字圖書館”是云南省圖書館自建的古籍?dāng)?shù)據(jù)庫(kù),經(jīng)過(guò)對(duì)文本的完整掃描,建立圖像資源庫(kù),并對(duì)有關(guān)項(xiàng)目進(jìn)行元數(shù)據(jù)著錄,最終建成以元數(shù)據(jù)為基礎(chǔ)的全文數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)在B/S 模式下運(yùn)行,改善了多客戶端的缺陷,將系統(tǒng)功能實(shí)現(xiàn)的核心部分集中于服務(wù)器端,精簡(jiǎn)了系統(tǒng)運(yùn)作流程。其最突出的優(yōu)勢(shì)在于,用戶免受空間限制,且無(wú)需安裝專門的程序,只需一臺(tái)可以聯(lián)網(wǎng)的電腦便能進(jìn)行操作。用戶只需進(jìn)行注冊(cè)即可進(jìn)行全文瀏覽。檢索項(xiàng)設(shè)置全面、簡(jiǎn)潔,用戶可通過(guò)索書號(hào)、題名、責(zé)任者、版本等字段進(jìn)行文獻(xiàn)檢索,并具有智能查詢同類古籍、生僻字顯示及檢索等功能。在閱覽界面,可對(duì)圖像進(jìn)行縮放、翻頁(yè)、目錄、指定頁(yè)面跳轉(zhuǎn)、評(píng)論、批注等。在首頁(yè)設(shè)計(jì)有古籍布局圖,且處于動(dòng)態(tài)完善中,按照歷朝歷代的先后順序,呈現(xiàn)各個(gè)時(shí)期在線古籍的數(shù)量情況,使數(shù)據(jù)庫(kù)呈現(xiàn)出可視化。[8]后臺(tái)管理方面,具有統(tǒng)計(jì)管理(包括用戶總量統(tǒng)計(jì)、書籍總量統(tǒng)計(jì)、新聞統(tǒng)計(jì)、PV瀏覽量統(tǒng)計(jì))、后臺(tái)角色管理(注冊(cè)用戶、VIP用戶、系統(tǒng)管理員、測(cè)試員、編目員、圖書管理員)、瀏覽記錄管理、收藏記錄管理、圖片上傳管理、書籍管理、操作記錄管理等強(qiáng)大功能。所有完成數(shù)字化的古籍都附注相應(yīng)的編目信息,具體包含:題名項(xiàng)、責(zé)任者項(xiàng)、索書號(hào)、四部分類、版本項(xiàng)、存卷次、冊(cè)數(shù)、館藏單位。用戶不僅能取得所需古籍的完整數(shù)字影像,還能夠使用相應(yīng)的編目成果,幫助其開展相關(guān)研究。
3.3.1 工作缺乏宏觀統(tǒng)籌
長(zhǎng)期以來(lái),各單位都是根據(jù)自身發(fā)展需要來(lái)開展古籍?dāng)?shù)字化工作,缺乏國(guó)家層面的宏觀統(tǒng)籌,導(dǎo)致項(xiàng)目重復(fù)建設(shè),一些珍貴古籍還未進(jìn)行數(shù)字化,沒有在資源共享和建設(shè)方面形成有效的合力。另外,還缺乏統(tǒng)一的資源發(fā)布平臺(tái),大多數(shù)資源僅僅通過(guò)局域網(wǎng)傳播,在使用便捷性上有待提高。
3.3.2 建設(shè)標(biāo)準(zhǔn)不統(tǒng)一
因?yàn)閿?shù)字化建設(shè)的主體眾多,且沒有制定全國(guó)性的古籍?dāng)?shù)字化標(biāo)準(zhǔn),現(xiàn)有的標(biāo)準(zhǔn)內(nèi)容又不夠全面、缺少細(xì)節(jié)規(guī)范,各單位在古籍?dāng)?shù)字化的加工工序、底本選取原則、影像采集、數(shù)據(jù)格式、元數(shù)據(jù)制作、古籍著錄、古籍標(biāo)引、檢索語(yǔ)言等技術(shù)參數(shù)上存在差異,開發(fā)出的古籍?dāng)?shù)字化產(chǎn)品質(zhì)量不統(tǒng)一,這給古籍資源整合和數(shù)據(jù)兼容帶來(lái)了障礙。
3.3.3 數(shù)字資源利用率低
知識(shí)、信息共享是古籍文獻(xiàn)資源數(shù)字化開發(fā)的一大重要目的。數(shù)據(jù)庫(kù)的建設(shè)在古籍文獻(xiàn)資源分享知識(shí)、信息方面優(yōu)于紙質(zhì)文獻(xiàn),云南省圖書館古籍文獻(xiàn)資源雖然實(shí)現(xiàn)了數(shù)據(jù)庫(kù)資源的建設(shè),但由于無(wú)法實(shí)現(xiàn)跨庫(kù)檢索,所以存在從知識(shí)、信息層面進(jìn)行檢索難以全面系統(tǒng)等問(wèn)題,直接影響到古籍文獻(xiàn)資源的共享。
現(xiàn)階段已建成的古籍?dāng)?shù)據(jù)庫(kù),其功能通常限于對(duì)古籍的數(shù)字化轉(zhuǎn)換、保存和簡(jiǎn)單檢索,只是對(duì)古籍進(jìn)行了淺層次的描述和揭示,并沒有從資源組織或便于用戶使用的角度對(duì)文獻(xiàn)進(jìn)行深入挖掘。提供給用戶的服務(wù)通常只是以關(guān)鍵詞為基礎(chǔ)的全文檢索或是以主題為基礎(chǔ)的文本瀏覽,尚不能進(jìn)行統(tǒng)計(jì)分析等操作,用戶無(wú)法按照自身的需求去重組資源,也無(wú)法深入發(fā)掘其知識(shí)內(nèi)涵,導(dǎo)致了較高開發(fā)投入和較低利用率之間的不平衡。
3.3.4 數(shù)字資源建設(shè)經(jīng)費(fèi)不足
數(shù)字化目標(biāo)的達(dá)成,離不開資金支持。據(jù)相關(guān)估算,若將國(guó)內(nèi)剩余的40 萬(wàn)個(gè)版本的古籍全部完成數(shù)字化處理,總支出將達(dá)到60 億元。而國(guó)家古籍保護(hù)中心各個(gè)年度可以劃撥的古籍?dāng)?shù)字化專用款項(xiàng)僅1000萬(wàn)元,很多地方圖書館,可以使用的資金更是少之又少。[9]
云南省圖書館每年由政府劃撥50萬(wàn)元作為古籍保護(hù)專項(xiàng)經(jīng)費(fèi),用于古籍普查、古籍修復(fù)、古籍?dāng)?shù)字化等內(nèi)容,但古籍?dāng)?shù)字化開支較大,經(jīng)費(fèi)并沒有單獨(dú)分開,而是和古籍保護(hù)經(jīng)費(fèi)捆綁在一起。這對(duì)于云南省圖書館20 萬(wàn)冊(cè)古籍藏量來(lái)說(shuō),無(wú)疑是杯水車薪。因?yàn)榻?jīng)費(fèi)缺乏,給古籍?dāng)?shù)字化規(guī)劃帶來(lái)了困難,阻礙了古籍?dāng)?shù)字化進(jìn)程。
應(yīng)在數(shù)字人文的大框架下進(jìn)一步加強(qiáng)標(biāo)準(zhǔn)化建設(shè),加快古籍?dāng)?shù)字化相關(guān)標(biāo)準(zhǔn)的研制,整合現(xiàn)有標(biāo)準(zhǔn),在保證古籍?dāng)?shù)字資源格式統(tǒng)一、數(shù)據(jù)規(guī)范、長(zhǎng)期可讀、便于共享的準(zhǔn)則下,逐漸建成相應(yīng)的標(biāo)準(zhǔn)體系,保證數(shù)字資源質(zhì)量。
圖書館依托現(xiàn)有的資源、技術(shù)和存儲(chǔ)優(yōu)勢(shì),可牽頭主導(dǎo)并參與建設(shè)的數(shù)字人文項(xiàng)目,從現(xiàn)在的古籍?dāng)?shù)字化建設(shè)進(jìn)入到開展古籍?dāng)?shù)字人文項(xiàng)目研究和實(shí)踐,形成從古籍?dāng)?shù)字化資源到數(shù)據(jù)化加工,再到智慧化呈現(xiàn)的遞進(jìn)式發(fā)展。應(yīng)在充分調(diào)研學(xué)者研究需求的基礎(chǔ)上,建立基于特色資源的數(shù)據(jù)平臺(tái),聯(lián)合各領(lǐng)域人文學(xué)者和信息技術(shù)人員,提高研究與建設(shè)效率,促進(jìn)學(xué)術(shù)交流與技術(shù)進(jìn)步。開展特色資源建設(shè)中的數(shù)字人文應(yīng)用項(xiàng)目是對(duì)特色資源的開發(fā)與共享,需要與不同國(guó)家、不同地區(qū)、不同機(jī)構(gòu)的研究團(tuán)隊(duì)合作,以實(shí)現(xiàn)資源的多樣性、開放性和兼容性。如人物傳記類數(shù)字人文項(xiàng)目,不僅僅是數(shù)據(jù)規(guī)模巨大,并且對(duì)數(shù)據(jù)的處理以及發(fā)布使用模式也應(yīng)當(dāng)是結(jié)構(gòu)化的、帶地理方位信息的,這就要求圖書館認(rèn)識(shí)到協(xié)作的重要性。
具體用來(lái)發(fā)布、共享及鏈接相關(guān)的數(shù)字資源,使以知識(shí)為基礎(chǔ)的邏輯關(guān)聯(lián)和以語(yǔ)義為基礎(chǔ)的信息檢索成為可能。關(guān)聯(lián)數(shù)據(jù)主要采用資源描述框架(RDF)和統(tǒng)一資源標(biāo)識(shí)(URI)進(jìn)行資源描述與書目數(shù)據(jù)發(fā)布,通過(guò)這些技術(shù),可以對(duì)已經(jīng)抽取出來(lái)的知識(shí)進(jìn)行知識(shí)表示、知識(shí)訪問(wèn)和知識(shí)推理,形成可視化的知識(shí)圖譜。將難以理解的數(shù)據(jù)空間轉(zhuǎn)化成具體的視覺空間,有助于用戶利用自身的視覺識(shí)別數(shù)據(jù)空間當(dāng)中隱藏的知識(shí)。進(jìn)而在網(wǎng)絡(luò)上發(fā)布資源、整合資源,使以語(yǔ)義為基礎(chǔ)的信息檢索得以實(shí)現(xiàn)。將現(xiàn)有的古籍?dāng)?shù)字資源展開深層次的組織,發(fā)掘數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián)性,對(duì)相應(yīng)的目錄數(shù)據(jù)進(jìn)行知識(shí)組織和關(guān)聯(lián)化發(fā)布,以提高文獻(xiàn)資源的查全率與查準(zhǔn)率。在分散于書籍和文本中的人物、時(shí)間、地點(diǎn)等之間建立聯(lián)系,構(gòu)建覆蓋全面的知識(shí)網(wǎng),使資源得到更加有效的利用,盡可能滿足用戶的訴求。如上海圖書館的《華人家譜總目:上海圖書館家譜知識(shí)服務(wù)平臺(tái)》數(shù)字人文項(xiàng)目,就是利用數(shù)據(jù)關(guān)聯(lián)技術(shù)建立并發(fā)布家譜關(guān)聯(lián)數(shù)據(jù),數(shù)據(jù)之間能夠進(jìn)行交叉比對(duì),將原本孤立的宗族分支聯(lián)系起來(lái)。在紙本家譜上沒關(guān)聯(lián)的孤立的家譜,通過(guò)數(shù)字化技術(shù),有望建立數(shù)據(jù)關(guān)聯(lián)。[10]
GIS即地理信息系統(tǒng),它將事物的空間數(shù)據(jù)和屬性數(shù)據(jù)結(jié)合在一起,用于采集、加工、保存、組織、查閱及顯示空間數(shù)據(jù),為其他諸多學(xué)科的研究提供了一種基于空間方位的地理模型分析方法,可以把位置屬性融入到外部相關(guān)屬性中,然后利用地圖使信息清楚地展現(xiàn)在用戶面前,為傳統(tǒng)的古籍信息分析方法提供全新的視角和成果展現(xiàn)方式。該技術(shù)使古籍?dāng)?shù)字化有了新的突破,創(chuàng)新了檢索模式和檢索入口,它把地圖特有的可視化效果和位置解析功能同數(shù)字資源相結(jié)合,形成了兼具時(shí)間和空間特性的直觀檢索集,這是對(duì)傳統(tǒng)檢索模式的豐富和改進(jìn)。[11]
GIS 技術(shù)在古籍?dāng)?shù)字化領(lǐng)域運(yùn)用的成功事例很多,較有代表性的是《中國(guó)歷代人物傳記資料庫(kù)(CBDB)》,它是由哈佛大學(xué)費(fèi)正清中國(guó)研究中心、中國(guó)臺(tái)灣“中央研究院”歷史語(yǔ)言研究所、北京大學(xué)中國(guó)古代研究中心及中文在線聯(lián)合推出的記錄我國(guó)古典數(shù)據(jù)的數(shù)字人文資源平臺(tái)。資料庫(kù)將分布于歷史資料中的與人物有關(guān)的非結(jié)構(gòu)化文本數(shù)據(jù)展開結(jié)構(gòu)化標(biāo)引,如把人名、時(shí)間、地點(diǎn)、職官、入仕方式、著作、社會(huì)關(guān)系等重要信息的標(biāo)引轉(zhuǎn)換成結(jié)構(gòu)化的信息,并進(jìn)行著錄,構(gòu)建出相應(yīng)的大數(shù)據(jù)集。研究者可以輕而易舉地獲取數(shù)據(jù)并開展地理空間、社會(huì)網(wǎng)絡(luò)、群體特征等方面的探究。[12]
云南省圖書館開發(fā)的“云南古籍?dāng)?shù)字圖書館”平臺(tái)首頁(yè)的古籍分布動(dòng)態(tài)圖,引入了GIS 檢索技術(shù),為讀者提供了時(shí)空檢索,顯示了各歷史時(shí)期云南古籍上線數(shù)量,使檢索結(jié)果清晰直觀。
為適應(yīng)更多人群的閱讀需求,提高古籍文獻(xiàn)數(shù)字資源的利用效率,圖書館可運(yùn)用多種創(chuàng)意元素,根據(jù)古籍文獻(xiàn)數(shù)字資源的類型和特點(diǎn),通過(guò)微博、微信、QQ、直播、公益廣告等新媒體工具,以及開展游戲式互動(dòng)活動(dòng)等讀者喜愛的方式來(lái)宣傳、推廣古籍文獻(xiàn)數(shù)字資源,增強(qiáng)用戶體驗(yàn)效果,提高他們利用資源的積極性、主動(dòng)性,進(jìn)一步帶動(dòng)古籍文獻(xiàn)的閱讀推廣,讓更多的用戶了解古籍文獻(xiàn)資源的文化魅力。[13]
數(shù)字人文的興起,對(duì)圖書館古籍?dāng)?shù)字化產(chǎn)生了極大的影響,使當(dāng)前的古籍?dāng)?shù)字化工作暴露出了原有模式的不足。其借助數(shù)字人文理論與技術(shù)研究成果,為古籍文獻(xiàn)深度開發(fā)與利用提供了新的方法、模式與技術(shù)手段。圖書館作為古籍存藏主要機(jī)構(gòu),應(yīng)將數(shù)字人文思想融入到古籍保護(hù)中,參考較為成功的模式,同有關(guān)組織展開協(xié)作,全方位地整合現(xiàn)有古籍?dāng)?shù)字資源,使古籍?dāng)?shù)字化向?qū)I(yè)化、精細(xì)化和智慧化發(fā)展。