摘 要:隨著用戶對古籍資源需求的日益?zhèn)€性化和多樣化,古籍智慧化建設(shè)和服務(wù)成為趨勢。文章在調(diào)研古籍智慧化知識組織和服務(wù)演變的基礎(chǔ)上,詳述深圳圖書館“古籍細顆粒度標(biāo)簽與標(biāo)引”項目實踐。借助知識圖譜技術(shù)、NLP語義模型和古籍知識標(biāo)簽標(biāo)引,研究古籍細顆粒度建設(shè)的智慧化加工框架和智慧化服務(wù)方式,旨在實現(xiàn)從傳統(tǒng)古籍文獻實體服務(wù)向基于深度挖掘古籍知識、構(gòu)建知識實體間關(guān)聯(lián)并以知識圖譜形式展現(xiàn)的綜合性服務(wù)模式的轉(zhuǎn)型,將古籍知識獲取方式擴展到集文獻查閱、循證研究、智能問答、趣味互動為一體的、適應(yīng)不同需求場景的智慧化服務(wù)。
關(guān)鍵詞:公共圖書館;古籍智慧化;細顆粒度;知識組織;知識服務(wù)
中圖分類號:G258.2 文獻標(biāo)識碼:A
Research on Fine-Grained Development of Ancient Books in Public Libraries: A Case Study of Shenzhen Library
Abstract With the growing personalized and diverse demands for ancient book resources, the intelligent development and services for ancient books have become a trend. Based on the investigation of the evolution of intelligent knowledge organization and services for ancient books, this paper details the practice of Shenzhen Library's \"Fine-Grained Labeling and Indexing of Ancient Books\" project. Utilizing knowledge graph technology, NLP semantic models, and knowledge tagging and indexing of ancient books, this study explores the intelligent processing framework and service methods under fine-grained development. The goal is to transition from traditional document-based services for ancient books to a comprehensive service model that deeply mines ancient book knowledge, constructs associations between knowledge entities, and presents them in the form of knowledge graphs. This expands the ways of accessing ancient book knowledge to include literature review, evidence-based research, intelligent Qamp;A, and interactive engagement, catering to various demand scenarios.
Key words public library; intelligent development of ancient books; fine-grained; knowledge organization; knowledge services
1 引言
古籍是中華文化傳承的重要載體,記錄了古代社會的政治、經(jīng)濟、文化、科技等方面的信息,蘊含著我國五千年文明的菁華。在新時代背景下,重視古籍的價值和作用,通過智慧化技術(shù)和手段對古籍內(nèi)容進行組織和揭示、創(chuàng)新服務(wù)方式,可以讓更多人了解古籍資源庫中蘊含的豐富內(nèi)容與深厚底蘊。
我國歷來重視運用現(xiàn)代科技手段加強古籍典藏的保護修復(fù)和綜合利用。2022年4月11日,中共中央辦公廳、國務(wù)院辦公廳印發(fā)《關(guān)于推進新時代古籍工作的意見》,強調(diào)要“發(fā)揮科技保護支撐作用,推動古籍保護關(guān)鍵技術(shù)突破和修復(fù)設(shè)備研發(fā)”[1],對各類古籍收藏機構(gòu)積極應(yīng)用現(xiàn)代技術(shù)手段、全面提升古籍保護工作的質(zhì)量水平提出了更高要求。
隨著社會發(fā)展和讀者文化水平的提高,以及學(xué)術(shù)研究的深入發(fā)展,讀者對于古籍資源的需求也更為個性化和多樣化。例如,讀者希望能通過更加精細的檢索方式獲取自己需要的古籍資源,這就要求對古籍中的知識點進行精細化標(biāo)引、分析、挖掘和整理等。傳統(tǒng)的以圖像化的形式建設(shè)古籍?dāng)?shù)據(jù)庫的方式已經(jīng)不能滿足社會的需要。因而,開展古籍智慧化建設(shè)與服務(wù)更顯迫切,其中古籍細顆粒度建設(shè)作為關(guān)鍵路徑,通過全文數(shù)字化及精準(zhǔn)實體信息標(biāo)引,實現(xiàn)了古籍內(nèi)容的全面深度挖掘與知識揭示,極大豐富了古籍信息的表達維度與服務(wù)形態(tài),有效促進了優(yōu)秀傳統(tǒng)文化的廣泛傳播與傳承,對古籍資源的保護與宣傳具有深遠的意義。本研究基于古籍細顆粒度建設(shè)現(xiàn)狀,以深圳圖書館“古籍細顆粒度標(biāo)簽與標(biāo)引”項目實踐為例,探索古籍細顆粒度建設(shè)的流程、成果可視化呈現(xiàn)和服務(wù)方式,探討如何從傳統(tǒng)紙本為中心轉(zhuǎn)向文本化、標(biāo)簽標(biāo)引與圖譜化并重的古籍深度揭示;將單純以古籍研究為主的服務(wù),擴展至古籍內(nèi)容查閱、古籍循證研究、古籍欣賞和中華優(yōu)秀傳統(tǒng)文化傳播為一體的,適應(yīng)于多個場景的智慧化服務(wù)。
2 古籍智慧化知識組織和服務(wù)的演進
古籍?dāng)?shù)字化建設(shè)是古籍智慧化知識組織和服務(wù)的數(shù)據(jù)來源和基礎(chǔ)。早在20世紀80年代,國內(nèi)外就開始了古籍?dāng)?shù)字化研究,其關(guān)注重點在于“將傳統(tǒng)古籍文本轉(zhuǎn)化為數(shù)字化文本形式”[2]。如中國國家圖書館、首都圖書館、南京圖書館、天津圖書館、日本公書文館、美國國會圖書館、德國巴伐利亞州立圖書館等圖書館都相繼開展了古籍?dāng)?shù)字化實踐,將其館藏中的珍貴古籍進行了全文數(shù)字化。古籍?dāng)?shù)字化改變了傳統(tǒng)利用古籍的方式,減少了古籍原件使用頻次,促進了古籍的保護。
隨著計算機技術(shù)的發(fā)展,古籍?dāng)?shù)字資源一體化檢索、全文閱覽等古籍?dāng)?shù)字化成果的利用和服務(wù)逐步鋪開。如中國國家圖書館(國家古籍保護中心)聯(lián)合36家古籍收藏單位建設(shè)的“中華古籍資源庫”[3]、上海圖書館的“中文古籍聯(lián)合目錄及循證平臺”[4]、安徽大學(xué)唐宸副教授主持研發(fā)的“全球漢籍影像開放集成系統(tǒng)”[5]、日本的“日本所藏中文古籍?dāng)?shù)據(jù)庫”[6],等等。這些平臺的建立實現(xiàn)了散存于各館的古籍聯(lián)合查詢,部分平臺還提供古籍?dāng)?shù)字化全文在線閱覽,打破了古籍使用空間、時間上的局限性,為學(xué)者提供了極大的幫助。但古籍?dāng)?shù)字化平臺還處于簡單古籍目錄和古籍圖像提供,對古籍內(nèi)容的深度挖掘不足,無法提供深層次的內(nèi)容服務(wù),不能滿足學(xué)者的深入研究需求。
隨著大數(shù)據(jù)、人工智能等技術(shù)的發(fā)展,古籍內(nèi)容的深度挖掘與知識發(fā)現(xiàn)、古籍?dāng)?shù)字化整理與保護等成為可能。古籍?dāng)?shù)字化利用的焦點也逐步聚焦于古籍智慧化知識組織與服務(wù)。美國哈佛大學(xué)《中國歷代人物傳記資料庫》[7],對古籍中約50萬人物傳記資料的知識內(nèi)容進行重組,生成已知人物籍貫地理分布圖等可視化產(chǎn)品。同時提供開放的API" (Application Programming Interface,應(yīng)用程序編程接口),用戶可以根據(jù)需求,生成人物可視化關(guān)系網(wǎng)。德國馬克斯·普朗克科學(xué)史研究所從2 000余種數(shù)字化地方志名錄中提取和可視化區(qū)域信息,有助于用戶研究“方志物”在歷史構(gòu)建中的作用。鄧璐薌等人[8]以華東師范大學(xué)“ECNU-DHAI”平臺為例,探討古籍智慧化建設(shè)中存在的海量異構(gòu)數(shù)據(jù)、重復(fù)建設(shè)、標(biāo)準(zhǔn)缺位等問題,介紹平臺古籍自動識別、古籍內(nèi)容深度著錄和分包核對等功能。上海圖書館上線“盛宣懷檔案知識庫”分包項目[9],探索眾籌分包模式在古籍智慧化建設(shè)中的積極作用。
與此同時,國內(nèi)也開始探索和實踐古籍細顆粒度建設(shè)。盧克治[10]以中醫(yī)古籍文獻為研究對象,通過BERT+BILSTM+CRF模型對中醫(yī)古籍實體自動識別進行研究,以PCNN+ATT方法實現(xiàn)古籍知識實體自動提取和實體關(guān)系構(gòu)建。徐雷等人[11]從Science IE軟件、圖文識別劃分、細顆粒度文本的識別抽取三方面總結(jié)古籍文獻智能數(shù)字化處理面臨的挑戰(zhàn)。吳夢成等人[12]基于古漢語預(yù)訓(xùn)語言模型SikuRoBERTA,對先秦典籍中植物知識深入挖掘,以知識圖譜的組織模式呈現(xiàn),實現(xiàn)植物實體及其關(guān)聯(lián)知識的聚合與可視化呈現(xiàn)。
以上這些研究和實踐成果均為古籍智慧化知識組織和服務(wù)的發(fā)展提供了可供參考的思路。
3 深圳圖書館開展古籍細顆粒度建設(shè)的實踐探索
3.1 建設(shè)背景
隨著古籍智慧化知識組織和服務(wù)的進展,僅僅提供古籍全文閱覽的方式無法完全滿足讀者的使用需求,多維度、可視化和互動強的古籍服務(wù)方式亟待研究和探索。通過古籍細顆粒度建設(shè),實現(xiàn)古籍內(nèi)容知識的智慧化組織,通過可視化呈現(xiàn)形式,將智慧化服務(wù)推廣到移動端,為讀者帶來空間與時間結(jié)合、虛擬與實物結(jié)合、單一古籍和無限的知識相關(guān)聯(lián)的全新古籍知識服務(wù)體驗;古籍知識內(nèi)容實體抽取,運用虛擬現(xiàn)實技術(shù)、增強現(xiàn)實技術(shù)等,實現(xiàn)古籍的創(chuàng)新性展現(xiàn),從而提升古籍服務(wù)的易得性,提高讀者使用效率和使用體驗。
古籍智慧化知識組織與服務(wù)即利用語義模型等技術(shù)對古籍知識內(nèi)容進行深層次挖掘、組織,形成結(jié)構(gòu)化的古籍知識組織形式,助力館員學(xué)習(xí)古籍知識,同時借助智慧化技術(shù)輔助開展古籍整理、研究工作,提高工作效率,提升研究深度。如利用智慧化識別工具,形成異體字、避諱字字庫,加之人工智能算法工具對古籍版本進行鑒定、對古籍內(nèi)容進行分析、結(jié)合知識圖譜等知識組織方式獲取專業(yè)知識。
鑒于此,深圳圖書館在多年古籍?dāng)?shù)字化建設(shè)和服務(wù)成效的基礎(chǔ)上,以館藏古籍和深圳地方志為對象,通過開展“古籍細顆粒度標(biāo)簽與標(biāo)引”項目,利用OCR(Optical Character Recognition,光學(xué)字符識別)技術(shù)、計算機視覺技術(shù)、NLP(Natural Language Processing,自然語言處理)語義模型等人工智能技術(shù),針對古籍文獻資源特點,構(gòu)建知識抽取模型,對文本類資源實現(xiàn)篇章級、段落級的標(biāo)引,以及主題詞、關(guān)鍵詞級的標(biāo)引;通過標(biāo)引對知識資源重新組織,構(gòu)建專業(yè)領(lǐng)域知識圖譜應(yīng)用;項目涵蓋細顆粒度數(shù)據(jù)生產(chǎn)服務(wù)、細顆粒度結(jié)構(gòu)化數(shù)據(jù)資產(chǎn)管理平臺建設(shè)、面向讀者的細顆粒度數(shù)據(jù)發(fā)布應(yīng)用,形成全流程建設(shè)的完整體系,從而一站式滿足古籍智慧化知識組織與服務(wù)需求。
3.2 建設(shè)目標(biāo)
從深圳圖書館已完成全文數(shù)字化的館藏古籍資源中選取建設(shè)對象進行數(shù)字化加工,完成標(biāo)簽標(biāo)引數(shù)據(jù)。對標(biāo)引數(shù)據(jù)進行聚類分析,分析出人與人、人與機構(gòu)、機構(gòu)與地理、人與事件、事件與機構(gòu)等實體關(guān)系,構(gòu)建實體關(guān)系資源庫,在此基礎(chǔ)上完成知識圖譜建設(shè),實現(xiàn)和提供關(guān)聯(lián)數(shù)據(jù)發(fā)布、知識圖譜可視化服務(wù)功能。
開發(fā)整體資源的服務(wù)平臺,實現(xiàn)并提供基于知識網(wǎng)絡(luò)的信息服務(wù),包括搜索、瀏覽、發(fā)現(xiàn)、智能問答、智能推薦等功能。為實現(xiàn)專題資源展示、知識圖譜呈現(xiàn)與交互,需要提供跨平臺的移動端資源服務(wù),完成所有知識成果在深圳圖書館的門戶網(wǎng)站、微信、終端設(shè)備、數(shù)據(jù)庫系統(tǒng)等應(yīng)用環(huán)境的本地化部署、遷移及集成,同時支持未來將資源接入大型第三方平臺。
3.3 建設(shè)實踐
3.3.1 建設(shè)框架
深圳圖書館“古籍細顆粒度標(biāo)簽與標(biāo)引”項目從基礎(chǔ)、加工、構(gòu)建、輸出四個層次進行了建設(shè)框架搭建(見圖1),各層次遞進式開展,通過層次間的協(xié)同動作,實現(xiàn)古籍細顆粒度建設(shè)及古籍智慧化知識組織和服務(wù)。其中基礎(chǔ)層利用語義網(wǎng)、大數(shù)據(jù)、知識圖譜、計算機視覺技術(shù)、NLP語義模型等關(guān)鍵技術(shù),同時兼顧建設(shè)系統(tǒng)安全、運營;加工層對選定的已完成全文數(shù)字化的30種古籍共136 081張古籍圖片開展數(shù)據(jù)標(biāo)識、數(shù)據(jù)聚類,抽取實體,形成主題、專題知識聚類;構(gòu)建層以古籍知識實體關(guān)系為基礎(chǔ),通過知識融合,將零散的古籍知識實體整合為系統(tǒng)化的知識圖譜,實現(xiàn)古籍知識的直觀展示和創(chuàng)新應(yīng)用;輸出層開展數(shù)據(jù)檢測,提供包括可視化在內(nèi)的呈現(xiàn)形式,實現(xiàn)古籍知識數(shù)據(jù)聯(lián)合發(fā)布。
3.3.2 元數(shù)據(jù)加工
元數(shù)據(jù)加工以數(shù)字化古籍圖片為基礎(chǔ),開展OCR識別、校對識別結(jié)果、生成對象數(shù)據(jù)等流程。
(1)OCR文字識別。OCR識別,是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。針對標(biāo)準(zhǔn)化建設(shè)后的古籍?dāng)?shù)字資源,依照原篇目版式排列順序,以內(nèi)容引題、標(biāo)題、副標(biāo)題、正文等順序識別后輸出全文,并可提供古籍原樣版式(繁體豎排)、繁體橫排、簡體橫排等多種版式輸出,滿足不同使用者對閱讀版式的不同需求。
(2)校對識別結(jié)果。因古籍印刷、保存狀態(tài)、異體字及OCR識別字庫量等原因,OCR識別存在一定程度的錯誤率,需要進行識別結(jié)果的校對。深圳圖書館以人工校對、人工智能學(xué)習(xí)、內(nèi)容補充等方式對識別結(jié)果進行校對,其OCR識別準(zhǔn)確率已經(jīng)達到98%。其中,人工校對邀請文獻學(xué)、古文字學(xué)領(lǐng)域?qū)<遥蝗斯ぶ悄軐W(xué)習(xí)則通過積累字形,匯集成OCR識別“易錯字字典”,并引用其他權(quán)威版本進行補充。
(3)生成對象數(shù)據(jù)。經(jīng)過人工校對后的OCR文本與元數(shù)據(jù)逐一對應(yīng)生成相應(yīng)的對象數(shù)據(jù),每條對象數(shù)據(jù)形成7級數(shù)據(jù)存儲目錄,如圖2所示。
3.3.3 資源著錄
對已選定的30種古籍文獻進行細顆粒度著錄。每種古籍生成一個唯一的記錄標(biāo)識號,相當(dāng)于為每種古籍賦予一張獨立的“身份證”。以古籍中書衣、封面(內(nèi)封)、牌記、序、凡例、目錄、正文卷目、插圖、跋、簽條、夾紙、???、附錄、封底等每個獨立結(jié)構(gòu)作為著錄單元,每個著錄單元形成一條數(shù)據(jù)。同時,對每條數(shù)據(jù)從文獻內(nèi)容出發(fā),以人物、機構(gòu)、地理名稱、事件或其他具有標(biāo)目意義的關(guān)鍵詞進行細顆粒度標(biāo)引,生成相應(yīng)的著錄顆粒。
3.3.4 古籍知識實體抽取
通過對館藏古籍資源的知識提取,基于知識圖譜技術(shù)對公共文化領(lǐng)域知識進行表達。通過對古籍文獻資源的內(nèi)容分析,進行實體抽取、關(guān)系抽取、屬性抽取、事件抽取。實體包括人物、事件、地點、日期、機構(gòu)等。
以館藏清嘉慶十四年(1809年)鄱陽胡氏重刻宋淳熙本《文選六十卷文選考異十卷》中《兩都賦》部分為例,進行古籍文獻資源的關(guān)鍵實體提取工作。共提取出關(guān)鍵實體31個,其中人物實體18個,時間實體4個,職務(wù)實體6個,地名實體3個。
3.3.5 知識圖譜建設(shè)
以抽取的古籍知識實體為基礎(chǔ),對目標(biāo)古籍開展知識圖譜建模,是古籍智慧化建設(shè)的重要步驟。知識圖譜建模具有語義定義客觀、擴展性強、使用方便等特點。
(1)知識圖譜的模式
知識圖譜建??蛇x擇自頂向下或自底向上的途徑,也可結(jié)合使用。自頂向下是指構(gòu)建知識圖譜時首先定義數(shù)據(jù)模型,可從其他高質(zhì)量的數(shù)據(jù)源中提取信息,或通過領(lǐng)域?qū)<胰斯ぞ幹啤W缘紫蛏蟿t相反,從實體層開始,借助于實體對齊和實體鏈接等技術(shù)手段,對現(xiàn)有實體進行歸納組織,形成底層概念,再逐步形成上層概念。深圳圖書館古籍資源知識圖譜模型建設(shè)結(jié)合了以上兩種模式,自頂向下建立《新安縣志》《金匱要略》等古籍的知識圖譜,自下而上構(gòu)建古籍資源的知識聚類(見圖3)。
(2)知識實體關(guān)聯(lián)
從知識圖譜展現(xiàn)的實體關(guān)系出發(fā),提供關(guān)聯(lián)性的知識挖掘和知識展示,是古籍細顆粒度建設(shè)的關(guān)鍵一環(huán)。知識圖譜的知識關(guān)聯(lián)性有助于形成富含語義、互聯(lián)互通的知識網(wǎng)絡(luò)。
以清嘉慶版《新安縣志》為例,以新安縣為關(guān)鍵詞,析出相應(yīng)實體關(guān)系,開展實體關(guān)聯(lián),生成知識圖譜,將新安縣的輿地、經(jīng)政、人物、藝文等情況清晰展現(xiàn)出來(見圖4)。
3.4 建設(shè)成果
深圳圖書館古籍細顆粒度建設(shè),充分轉(zhuǎn)化建設(shè)成果,開發(fā)了多個智慧化平臺,實現(xiàn)智慧化管理與服務(wù)。
3.4.1 智慧化服務(wù)平臺:深圳圖書館古籍?dāng)?shù)字平臺
深圳圖書館在館藏古籍細顆粒度建設(shè)成果的基礎(chǔ)上,選取入選《國家珍貴古籍名錄》《廣東省珍貴古籍名錄》的古籍,清同治八年(1869年)嶺南葄古堂刻本《二十四史》,館藏醫(yī)家古籍,方志類古籍共計30種古籍搭建古籍?dāng)?shù)字平臺。該平臺以“古籍深圳”做切入點,構(gòu)建模塊化書籍佳賞、原文篇章閱讀、(書目、全文)檢索等版塊欄目,通過數(shù)字化技術(shù),以精美的界面、優(yōu)雅的交互式體驗使用戶身臨其境,沉浸式地了解古籍文化,并提供篇章目錄、導(dǎo)航指引閱讀。其特點在于:以模塊化揭示和視覺交互式設(shè)計,豐富讀者的視覺體驗;古籍圖片和文本化內(nèi)容對照閱讀,降低讀者閱讀古籍文獻的難度;構(gòu)建古籍知識圖譜,提供智慧化搜索和可視化解答,深化讀者使用層次。
3.4.2 智慧化管理平臺:深圳圖書館細顆粒度數(shù)據(jù)管理平臺
深圳圖書館細顆粒度數(shù)據(jù)管理平臺,是采用RDF格式和XML語法,以數(shù)據(jù)層、分析層、應(yīng)用層三層數(shù)據(jù)庫架構(gòu),實現(xiàn)原始數(shù)據(jù)、元數(shù)據(jù)、對象數(shù)據(jù)、關(guān)鍵詞等管理,基于細顆粒度標(biāo)簽標(biāo)引的實體內(nèi)容,對知識進行模式化構(gòu)建,通過知識圖譜的技術(shù)實現(xiàn)對資源進行精細化揭示以及資源的知識化、專題化服務(wù)。
平臺通過批量數(shù)據(jù)導(dǎo)入、數(shù)據(jù)分類管理、標(biāo)注數(shù)據(jù)管理、數(shù)據(jù)導(dǎo)出標(biāo)準(zhǔn)等步驟,實現(xiàn)多結(jié)構(gòu)數(shù)據(jù)管理;基于知識關(guān)聯(lián)及關(guān)鍵詞,對對象數(shù)據(jù)進行細顆粒度標(biāo)引,實現(xiàn)關(guān)鍵幀、關(guān)鍵段落、關(guān)鍵實體的準(zhǔn)確標(biāo)引,并對段落進行切割、對幀和對實體進行提取,實現(xiàn)可視化數(shù)據(jù)編輯;通過對細顆粒度標(biāo)引出的實體進行人機結(jié)合,實現(xiàn)實體的分類管理、屬性管理和關(guān)系管理。
3.4.3 智慧化展示平臺:“方志里的深圳”小程序
“方志里的深圳”小程序基于嘉慶版《新安縣志》內(nèi)容進行智慧化開發(fā),用生動、系統(tǒng)的知識圖譜與豐富、趣味的互動界面,展現(xiàn)古代深圳源流沿革、山水地理、官制學(xué)制、風(fēng)俗物產(chǎn)、名人掌故、古跡藝文等知識。
“方志里的深圳”小程序大量運用可視化技術(shù),將文言文轉(zhuǎn)化,輔之手繪彩圖、表格、時間軸實現(xiàn)古籍知識直觀、生動的圖像化呈現(xiàn),如職官數(shù)據(jù)可視化統(tǒng)計,通過地圖展示舊志記載的明清新安文官武職的籍貫、任期、出身等。對舊志數(shù)據(jù)的細顆粒度加工和標(biāo)簽標(biāo)引,標(biāo)記原文中大量的人物、事件、物品等實體數(shù)據(jù),通過實體—關(guān)系—實體進行智慧鏈接,構(gòu)建知識圖譜,從而智慧化呈現(xiàn)實物的本體屬性和相互關(guān)系,實現(xiàn)智慧化的鏈接與知識發(fā)現(xiàn)。如“鹽丁”“鹽場”“鹽課”“鹽官”通過圖譜直觀鏈接,構(gòu)建多組知識關(guān)系,并支持進一步擴展至《新安縣志·藝文志》中與“鹽”相關(guān)的詩文。此外,“方志里的深圳”小程序設(shè)計了以明代知縣周希曜為形象的智慧問答機器人,支持通過關(guān)鍵詞定位跳轉(zhuǎn)至感興趣的內(nèi)容;還部分支持類似ChatGPT的交互方式,即可以使用NLP進行提問和回答。
4 存在的問題及應(yīng)對之策
4.1 存在的問題
深圳圖書館古籍智慧化建設(shè)實踐是有益的探索,促進了新時期古籍工作的提升、古籍內(nèi)容的深度揭示,以及古籍的保護、傳播和使用,但還存著理論、人才、建設(shè)廣度等方面的問題。
4.1.1 缺少標(biāo)準(zhǔn)化理論指導(dǎo)
古籍細顆粒度建設(shè)是適應(yīng)新時代需求應(yīng)運而生的新作為,通過古籍知識資源的標(biāo)引、標(biāo)簽,實體關(guān)系的鏈接,知識圖譜的搭建,為讀者提供更為直觀的利用方式,同時開放共享理念的引入,促進了學(xué)術(shù)交流和知識共享,也推動了古籍的普及和傳播。但不可否認的是,古籍細顆粒度建設(shè)還處于起步和探索階段,僅有中國國家圖書館發(fā)布的《智慧圖書館知識資源數(shù)據(jù)建設(shè)指南》可作為建設(shè)依據(jù),尚未形成一套全面而系統(tǒng)的標(biāo)準(zhǔn)化理論體系,在頂層體系設(shè)計、建設(shè)流程和實踐上都很難實現(xiàn)標(biāo)準(zhǔn)化。
4.1.2 專業(yè)人才匱乏
專業(yè)人才的匱乏,制約了公共圖書館古籍智慧化建設(shè)。古籍智慧化建設(shè)需要信息技術(shù)和古籍研究雙重背景的復(fù)合型人才,但目前公共圖書館的相關(guān)人才儲備體系無法支撐。以深圳圖書館為例,其目前從事古籍研究和修復(fù)工作的館員共2名,缺少深入了解智慧圖書館建設(shè)方法,熟練使用新技術(shù)新應(yīng)用的館員,使得“古籍細顆粒度標(biāo)簽標(biāo)引”項目技術(shù)部分只能依靠外部技術(shù)供應(yīng)商,增加了溝通成本。
4.1.3 建設(shè)廣度不足
一方面,單個圖書館建設(shè)廣度不足。深圳圖書館較早開展古籍智慧建設(shè)探索,對30種館藏古籍開展建設(shè),但建設(shè)數(shù)量僅為館藏古籍總量的10%。另一方面,公共圖書館界建設(shè)廣度不足。自2021年以來,深圳圖書館、甘肅省圖書館、四川省圖書館、成都圖書館等10余家公共圖書館已經(jīng)陸續(xù)啟動了古籍細顆粒度建設(shè)。然而,這一舉措在全國眾多公共圖書館中仍屬于少數(shù)先行者,整體覆蓋面和參與度都不足。建設(shè)廣度不足,限制了古籍資源的全面揭示與高效利用,導(dǎo)致古籍知識無法實現(xiàn)廣泛的共融與共享,制約了古籍資源的有效傳播與利用,也不利于學(xué)術(shù)研究和文化傳承。
4.2 提升公共圖書館古籍智慧化建設(shè)的對策
4.2.1 加強理論研究,完善標(biāo)準(zhǔn)體系
公共圖書館應(yīng)積極主動爭取主管部門支持,從決策層上推動古籍智慧化標(biāo)準(zhǔn)體系建設(shè)。同時,聯(lián)合高校圖書館、高校信息管理院系、建設(shè)服務(wù)商等,共同開展古籍智慧化的理論研究,促進古籍智慧化標(biāo)準(zhǔn)體系的建設(shè)。公共圖書館還需要開展古籍智慧化建設(shè)項目研究,加強對古籍智慧化建設(shè)理論、標(biāo)準(zhǔn)體系、建設(shè)成果和智慧化服務(wù)形式等的交流與探討。
4.2.2 加強人才培養(yǎng),提升建設(shè)水平
首先,加強人才培養(yǎng)。針對工作中出現(xiàn)的問題,對員工開展針對性培訓(xùn),如知識圖譜技術(shù)、NLP語義模型等相關(guān)的知識技術(shù)培訓(xùn)。其次,建設(shè)專家團隊。古籍智慧化建設(shè)是一個全新領(lǐng)域,公共圖書館應(yīng)邀請古典文獻學(xué)、古籍版本學(xué)、古文字、計算機技術(shù)、人工智能等領(lǐng)域?qū)<?,組成專家團隊,隨時為古籍智慧化建設(shè)提供智力和技術(shù)支持。最后,構(gòu)建社會合作機制。公共圖書館在古籍智慧化建設(shè)中,應(yīng)充分利用社會資源,加強與社會機構(gòu)的合作,實現(xiàn)共建、共贏,形成古籍智慧化建設(shè)的良性生態(tài)。
4.2.3 加強建設(shè)推廣,促進資源共享
從單個建設(shè)單位而言,應(yīng)在遵循統(tǒng)一規(guī)劃、系統(tǒng)開發(fā)的原則下,對其館藏古籍展開全面智慧化建設(shè);從公共圖書館界而言,應(yīng)積極推廣古籍智慧化建設(shè),讓更多公共圖書館依據(jù)統(tǒng)一的建設(shè)標(biāo)準(zhǔn)開展建設(shè),最終實現(xiàn)古籍文獻全面智慧化建設(shè)和古籍知識統(tǒng)一服務(wù)。
5 結(jié)語
2021年文化和旅游部公布的《“十四五”公共文化服務(wù)體系建設(shè)規(guī)劃》提出“建設(shè)全國智慧圖書館體系建設(shè)項目”。古籍細顆粒度建設(shè)是當(dāng)前公共圖書館古籍智慧化建設(shè)的重要內(nèi)容,有利于促進古籍內(nèi)容的深度揭示以及古籍保護、傳播和利用。深圳圖書館以館藏古籍為對象,以古籍“細顆度”為內(nèi)容,通過數(shù)據(jù)加工、古籍知識實體抽取、知識圖譜建設(shè)等多個層級開展實踐探索。期望其實踐能為促進公共圖書館古籍智慧化建設(shè)、古籍?dāng)?shù)字資源便捷使用和開放共享提供參考。
參考文獻:
[1] 中共中央辦公廳 國務(wù)院辦公廳印發(fā)《關(guān)于推進新時代古籍工作的意見》[EB/OL].(2022-04-11)[2023-12-17].http://www.gov.cn/zhengce/2022-04/11/content_5684555.htm.
[2] 李世鈺,張向先,沈旺,等.古籍?dāng)?shù)字化國內(nèi)外研究現(xiàn)狀分析與路徑構(gòu)建研究[J].現(xiàn)代情報,2023,43(11):4-20.
[3] 中國國家圖書館.中華古籍資源庫[DB/OL].[2023-12-17].http://read.nlc.cn/thematDataSearch/toGujiIndex.
[4] 上海圖書館.中文古籍聯(lián)合目錄及循證平臺[DB/OL].[2023-12-17].https://gj.library.sh.cn/index.
[5] 唐宸.全球漢籍影像開放集成系統(tǒng)[DB/OL].[2023-12-17].https://library.suda.edu.cn/62/1c/c4858a549404/page.htm.
[6] 日本所藏中文古籍?dāng)?shù)據(jù)庫[DB/OL].[2023-12-17].http://kanji.zinbun.kyoto-u.ac.jp/kanseki?Query.
[7] Harvard Library.Chinese Rare Books[EB/OL].[2023-12-17].https://curiosity.lib.harvard.edu/chinese-rare-book.
[8] 鄧璐薌,許鑫.數(shù)字人文人工智能平臺的設(shè)計與實現(xiàn):以ECNU-DHAI平臺為例[J].圖書館雜志,2021,40(3):78-85.
[9] 上海圖書館.盛宣懷檔案知識庫[DB/OL].[2023-12-17].https://sd.library.sh.cn/sd/home/index.
[10] 盧克治.基于中醫(yī)古籍的知識圖譜構(gòu)建與應(yīng)用[D].北京:北京交通大學(xué),2020:78-79.
[11] 徐雷,葉均玲.科學(xué)交流語義框架模型構(gòu)建研究[J].現(xiàn)代情報,2022,42(11):40-52.
[12] 吳夢成,林立濤,齊月,等.數(shù)字人文視域下先秦典籍植物知識挖掘與組織研究[J].圖書情報工作,2023,67(12):103-113.
作者簡介:章良,碩士,深圳圖書館館員,研究方向為特色文獻建設(shè)和閱讀推廣。
收稿日期:2024-04-09編校:王曉琳 王伊藝