摘 要:數(shù)字人文為我國名人文獻的研究提供了新方法和新思路,地理信息系統(tǒng)和可視化等技術(shù)手段也助力了名人文獻的知識化服務(wù)。文章在探討數(shù)字人文視野下名人文獻場景構(gòu)建策略的基礎(chǔ)上,以宋慶齡書信為例,從數(shù)據(jù)清洗、書信知識圖譜框架設(shè)計及宋慶齡書信場景化應(yīng)用實踐等方面進行了深入的剖析和闡釋,為名人文獻的數(shù)字人文研究提供方法支撐,使得名人文獻的信息和價值被充分挖掘,從而拓展其傳播深度和廣度。
關(guān)鍵詞:數(shù)字人文;名人文獻;知識圖譜;宋慶齡書信
Research on the Construction of Digital Humanities Scene for Celebrity Literature: A Case Study of Soong Ching-ling's Letters
Abstract Digital humanities offer new methods and perspectives for studying celebrity literature in China. Technologies such as GIS and visualization tools further enhance the knowledge-based services of celebrity literature. This article explores strategies for constructing scenes of celebrity literature from a digital humanities perspective, using Soong Ching-ling's letters as a case study. It provides an in-depth analysis of data cleaning, the design of a knowledge graph framework for the letters, and the practical application of scene construction. This study offers methodological support for digital humanities research on celebrity literature, facilitating the thorough exploration of their information and value, thereby expanding their depth and breadth of dissemination.
Key words digital humanities; celebrity literature; knowledge graph; Soong Ching Ling's letters
1 引言
名人文獻作為傳承文明、傳播思想、積淀文化的載體,是寶貴的文化遺產(chǎn)和文獻資源,有著很高的學術(shù)研究價值和參考價值[1]。名人文獻資源是較為重要的一類特藏資源和珍貴史料,蘊含大量有待開發(fā)和利用的信息資源[2]。加大對名人文獻資源的開發(fā)利用力度,深入挖掘名人文獻資源,有助于推動文化事業(yè)發(fā)展。近年來,學界積極開展名人文獻數(shù)字資源建設(shè)的探索,如宋慶齡文獻數(shù)據(jù)中心[3]、沈從文專題數(shù)據(jù)庫[1]、賀龍?zhí)厣墨I數(shù)據(jù)庫[4]、周恩來研究專題數(shù)據(jù)庫[5]、蔣介石資料數(shù)據(jù)庫[6],等等。目前,對名人文獻的開發(fā)利用多以數(shù)字化為主,這也是名人文獻整理過程中必不可少的組成部分,而對于名人文獻的深度價值挖掘(如事件抽取、命名實體標注、社會網(wǎng)絡(luò)分析等)與可視化知識服務(wù)的研究尚處于起步階段。
數(shù)字人文(Digital Humanities, DH),源于人文計算(Humanities Computing)[7],通過將數(shù)據(jù)挖掘、可視化技術(shù)、開放關(guān)聯(lián)等數(shù)字技術(shù)融入學術(shù)研究,深刻影響人文學科研究的范式[8],引發(fā)社會各界的廣泛關(guān)注與探索,日益成為一個新興的研究領(lǐng)域[9]。數(shù)字人文作為一個跨學科領(lǐng)域[7],它的出現(xiàn)深刻地影響著人文學術(shù)的研究過程與內(nèi)容,并自然而然地與以知識組織為主要功能的圖書館相遇[10],被認為是圖書館重要的發(fā)展趨勢之一[11]。此外,數(shù)字人文在提高資源的生動性、場景化服務(wù)以及用戶體驗等方面都發(fā)揮著重要作用。因此,數(shù)字人文技術(shù)的發(fā)展,為我國名人文獻的知識化研究提供了新方法和新思路,也是名人文獻資源知識發(fā)現(xiàn)研究的趨勢。
宋慶齡是中華人民共和國名譽主席,也是一位愛國主義、民主主義、國際主義和共產(chǎn)主義的偉大戰(zhàn)士,被譽為“國之瑰寶”[12]和二十世紀的偉大女性[13-14]?!坝肋h和黨在一起”[15],不僅是宋慶齡一生秉持的堅定信念,也是她光輝一生的真實寫照。宋慶齡在革命的一生中,寫出了大量文章,發(fā)表過不少著名的宣言和聲明,這些都是中國革命史上的重要文獻。宋慶齡的書信,表現(xiàn)了她同海內(nèi)外各方面人士、親屬和故舊的交往,大體上涵蓋了她一生各個重要歷史時期的工作和生活,是留給我們的重要歷史文獻和寶貴的精神財富,對學習和研究宋慶齡的思想和品德,研究中國近現(xiàn)代史,都具有重要的意義[16]。學界對宋慶齡書信的研究大多通過書信內(nèi)容研究其政治思想的演變[17]或革命友誼[18]等。讓書信講述歷史,對我們了解中國人民偉大的革命事業(yè)的前進路程,有很大的幫助。
本文旨在拋磚引玉,以宋慶齡書信為例,從數(shù)字人文視角出發(fā),探討名人文獻數(shù)字人文場景的構(gòu)建,嘗試利用地理信息系統(tǒng)(Geographic Information System, GIS)、知識圖譜等技術(shù)整合名人文獻資源,一方面可以為相關(guān)領(lǐng)域的學者提供已有研究成果的客觀佐證,直觀且形象地呈現(xiàn)宋慶齡書信所蘊藏的深層次知識,提升名人文獻的知識發(fā)現(xiàn)深度與價值呈現(xiàn)維度,為名人文獻的數(shù)字人文研究提供方法支撐;另一方面,可以推動名人文獻資源建設(shè)從數(shù)字化向語義化轉(zhuǎn)變,從而促進相關(guān)數(shù)字資源的深度開發(fā)利用。
2 相關(guān)研究及數(shù)字人文項目調(diào)研
2.1 相關(guān)研究
國內(nèi)利用數(shù)字人文對人文特藏資源進行研究起步比較晚,主要集中在GIS、可視化、文本挖掘以及關(guān)聯(lián)數(shù)據(jù)等領(lǐng)域[19]。劉寧靜等人以學術(shù)名人為核心,構(gòu)建學術(shù)名人描述框架模型和學術(shù)名人與其他實體關(guān)系模型,對以李政道為代表的學術(shù)名人特色資源從知識顆粒的角度進行有效的組織和展示[20]。牛力等人梳理數(shù)字記憶視角下學術(shù)名人知識庫的基本屬性和構(gòu)建要求,據(jù)此形成“融合、建構(gòu)與服務(wù)”的學術(shù)名人知識庫建設(shè)路徑,并以學術(shù)名人吳寶康先生的知識庫建設(shè)為案例進行應(yīng)用闡釋[21]。孫鳴蕾等人以中國作家?guī)斓淖骷覚n案為例,闡述構(gòu)建名人檔案知識圖譜的方法,使名人檔案的利用價值得到進一步提升[22]。上述研究多以學術(shù)名人的數(shù)字資源對象為核心,實現(xiàn)對學術(shù)名人的數(shù)字資源組織及利用。
此外,國內(nèi)對名人文獻的研究,除了上述以學術(shù)名人的數(shù)字資源對象為主外,還側(cè)重于部分人物的資源內(nèi)容挖掘,如宋雪雁等人以王世杰日記為例開發(fā)名人日記數(shù)字化資源,形成人物關(guān)系、地域熱點、情感傾向等可視化圖譜,探索具有可行性的日記資源內(nèi)容挖掘方法[2]。宋雪雁等人還以人物關(guān)系挖掘為切入點,發(fā)現(xiàn)和提煉《譚延闿日記》中蘊含的知識,形成能夠呈現(xiàn)日記人物同現(xiàn)關(guān)系的可視化圖譜,將非結(jié)構(gòu)化的日記文本以更加清晰直觀的方式進行展示[23]。李惠等人基于曾國藩個人書信集數(shù)據(jù)構(gòu)建古代書信網(wǎng)絡(luò)模型,探索個人書信集里的群體人際關(guān)系[24]。國外的書信研究大多數(shù)聚焦于知名學者的個人書信網(wǎng)絡(luò)[25-26],分析特定學者的學術(shù)思想交流情況。以上研究多以單個人物的文本內(nèi)容挖掘為主,探索其蘊含的深層知識并進行可視化呈現(xiàn)。
2.2 數(shù)字人文項目調(diào)研及其可借鑒之處
2.2.1 項目調(diào)研
隨著數(shù)字人文技術(shù)的發(fā)展,各科研院校及圖書館開展了數(shù)量眾多的數(shù)字人文項目。在調(diào)研眾多數(shù)字人文項目的基礎(chǔ)上,筆者最終選取了8個案例,分別是:上海圖書館的盛宣懷檔案知識庫、中國家譜知識服務(wù)平臺、香港中文大學的盛宣懷檔案、浙江大學的智慧古籍平臺、上海博物館的董其昌書畫藝術(shù)展、中南民族大學的唐宋文學編年地圖、中國人民大學高遷古村數(shù)字記憶網(wǎng)站、華東師范大學數(shù)字方志集成平臺。對上述數(shù)字人文項目進行分析,收集不同故事性應(yīng)用場景設(shè)計、主要技術(shù)及特色功能點,并歸納總結(jié)出可借鑒之處,能夠為宋慶齡相關(guān)文獻的故事性應(yīng)用場景構(gòu)建打下基礎(chǔ)。
2.2.2 可借鑒之處
(1)時間與人物關(guān)系可視化相結(jié)合
除了文本分析之外,時空分析、社會關(guān)系分析也是數(shù)字人文研究通常采用的方法,成為許多數(shù)字人文平臺提供的基本功能[27]。上海圖書館的盛宣懷檔案知識庫可以通過時間、地點、主題、人物、數(shù)量,查詢信函、電報收發(fā)關(guān)系圖;香港中文大學的盛宣懷檔案以年為單位,將每年的盛宣懷檔案涉及的人物以圖譜的形式進行展示。因此,可以按照書信的寫信時間,對宋慶齡往來書信進行可視化展示。
(2)時空檢索
現(xiàn)代歷史地理學為人文研究貢獻了多維時空框架下的數(shù)據(jù)、技術(shù)、平臺與方法。歷史地理數(shù)據(jù)及其相關(guān)技術(shù)、平臺和方法的利用,已成為數(shù)字人文中不容忽視的要素和不可或缺的一部分[28]。華東師范大學數(shù)字方志集成平臺上的時空檢索,可查看并檢索不同朝代方志的地區(qū)分布情況,方志越多的地區(qū),地圖中的圓點就越大。因此,可以對宋慶齡的書信進行時空呈現(xiàn)及檢索。
3 名人文獻的數(shù)字人文場景構(gòu)建策略
宋慶齡文獻數(shù)據(jù)中心的建設(shè),為后續(xù)知識組織及知識發(fā)現(xiàn)提供了資源保障。宋慶齡文獻數(shù)據(jù)中心是由上海宋慶齡研究會、上海圖書館、上海市孫中山宋慶齡文物管理委員會三家單位合作,共同建設(shè)的上?!八氖贰睂W習成果展示平臺和上海圖書館紅色資源揭示展示的試點平臺,也是一個集文獻、圖片、音視頻等多種資源類型的平臺。如何提高資源的開發(fā)利用效率和知識服務(wù)水平?針對這一問題,項目組以場景構(gòu)建為抓手,從數(shù)據(jù)賦能、知識賦能、工具賦能三個方面入手,探討數(shù)字人文視野下名人文獻場景的構(gòu)建策略,以期充分挖掘宋慶齡書信中的知識關(guān)聯(lián),促進名人文獻資源的深度開發(fā)利用。
3.1 數(shù)據(jù)賦能
數(shù)據(jù)是數(shù)字人文研究的基石,也是知識服務(wù)的基礎(chǔ)。數(shù)字人文對數(shù)據(jù)的精細度、顆粒度及結(jié)構(gòu)化程度提出了更高要求,從文獻外部特征的組織揭示向文獻內(nèi)容的深度加工挖掘轉(zhuǎn)變,通過更加細顆粒度的數(shù)據(jù)化建設(shè)搭建不同類型數(shù)據(jù)之間的空間聯(lián)系。宋慶齡文獻數(shù)據(jù)中心在建設(shè)之初,為了對史料進行精細化的加工,充分挖掘其內(nèi)在價值,在參考一系列國家及行業(yè)標準的基礎(chǔ)上,制定了詳細的元數(shù)據(jù)規(guī)則。以宋慶齡書信為例,除了基礎(chǔ)元數(shù)據(jù)項外,還對寫信人、收信人、寫信時間、寫信地點、文中人名、文中事件組織等進行著錄。元數(shù)據(jù)著錄完善,為人、地、時、事的實體化奠定了堅實基礎(chǔ),也為知識關(guān)聯(lián)創(chuàng)造了條件。
3.2 知識賦能
數(shù)字人文通過知識關(guān)聯(lián),可實現(xiàn)資源的整合以及知識的廣度拓展和延伸。因此,在宋慶齡文獻數(shù)據(jù)中心的基礎(chǔ)上,充分利用網(wǎng)絡(luò)資源為場景提供更多的知識服務(wù)成為項目組考慮的重點之一。關(guān)聯(lián)數(shù)據(jù)可以將各種數(shù)據(jù)源無縫關(guān)聯(lián),形成一個廣泛的知識網(wǎng)絡(luò),目前,上海圖書館已使用關(guān)聯(lián)數(shù)據(jù)對館藏書目文獻進行組織和發(fā)布。以宋慶齡為核心的知識關(guān)聯(lián)思路如圖1所示。
其中文獻資源庫方面,主要基于宋慶齡文獻數(shù)據(jù)中心、全國報刊索引數(shù)據(jù)庫。例如,宋慶齡文獻數(shù)據(jù)中心收錄的資源中,宋慶齡與國際友人如艾黎、愛潑斯坦、斯諾、馬海德等的相關(guān)文獻占了一定的比重,尤其是書信;在全國報刊索引數(shù)據(jù)庫中,以艾黎、馬海德、斯諾、史沫特萊、愛潑斯坦等國際友人的名字為檢索詞進行檢索,發(fā)現(xiàn)相關(guān)的文獻資源比較豐富。此外,宋慶齡往來書信中涉及的人物、機構(gòu)、地點、事件等,也通過上海圖書館基礎(chǔ)知識庫進行關(guān)聯(lián),實現(xiàn)資源的整合,以知識賦能場景,進一步豐富以宋慶齡為核心的知識化服務(wù)。
3.3 工具賦能
數(shù)字人文具有很強的工具屬性,借助可視化、GIS等工具,可以提升場景服務(wù)及用戶體驗??梢暬跀?shù)字人文領(lǐng)域的重要性不言自明,甚至可以說數(shù)字人文就等同于對人文語料的可視化[29]。目前,古籍文本閱讀可視化、檔案及文物可視化以及名人日記可視化等都受到了數(shù)字人文學者的關(guān)注。而以GIS技術(shù)為核心的數(shù)字人文注重地理空間和人地關(guān)系;歷史地理數(shù)據(jù)及其相關(guān)技術(shù)、平臺和方法的利用,也成為數(shù)字人文中不容忽視的要素和不可或缺的部分。
因此,以知識圖譜的形式對宋慶齡的來往書信進行可視化展示,側(cè)重揭示書信中的社會網(wǎng)絡(luò)關(guān)系,對其書信網(wǎng)進行更加直觀的視覺呈現(xiàn);同時,宋慶齡往來書信主要涉及人(寫信人和收信人)、地(寫信地點)、時(寫信時間)、事(文中事件),與在數(shù)字人文領(lǐng)域應(yīng)用非常廣泛的GIS技術(shù)吻合。因此,依托宋慶齡文獻數(shù)據(jù)中心豐富的資源,從人物、時間、地點、事件等多維要素出發(fā),在敘事視域下豐富和完善宋慶齡書信集內(nèi)容,探索挖掘名人文獻價值的新路徑。在此基礎(chǔ)上,還可以對宋慶齡的事業(yè)網(wǎng)(如宋慶齡的婦女兒童事業(yè))和其足跡進行場景構(gòu)建及可視化嘗試和探索。
4 名人文獻的數(shù)字人文場景構(gòu)建實踐
4.1 數(shù)據(jù)來源
1981年,宋慶齡逝世后,上海有關(guān)部門在上海宋慶齡故居中整理出孫中山、宋慶齡與各界往來函電共計1 100多封,除當時即移交中央檔案館保管的部分外,仍存有1 000多封,其中以致宋慶齡的函電居多[30]。宋慶齡一生與中外友人和親人有大量的書信往來,她的書信大多是親自執(zhí)筆或用打字機書就的英文信,是留給我們的重要歷史文獻和寶貴的精神財富。但是由于社會環(huán)境和保護同志以及其他種種原因,宋慶齡的大批信件或散失或銷毀。多年來,宋慶齡基金會和中國福利會等有關(guān)部門又向國內(nèi)外人士征集了許多書信,但這些書信也僅僅是她一生幾十萬件書信中極小的一部分[16],已在有關(guān)部門主持下進行翻譯和編輯出版。
宋慶齡文獻數(shù)據(jù)中心平臺上收錄的函電(信函、電報類文獻)數(shù)據(jù)共2 024篇,剔除部分非宋慶齡的函電后將近2 000篇,時間跨度從1909年宋慶齡少女時代至1981年逝世為止,是她長達72年的生活記錄。這些書信記錄了她與國內(nèi)外政要、親朋故舊的交往情況,從側(cè)面反映其政治觀點、人生經(jīng)歷、思想情感等,作為中國近現(xiàn)代史的寶貴文獻傳之于世,有著重大的補史和證史作用[31]。這些書信大部分來源于已出版的《宋慶齡書信集》《宋慶齡書信集(續(xù)編)》《孫中山宋慶齡文獻與研究》《鄧廣殷、孫君蓮及鄧勤藏宋慶齡書信集》等圖書,且被宋慶齡文獻數(shù)據(jù)中心收錄并提供原始圖像,確保了數(shù)據(jù)的原始真實且可靠。為了驗證技術(shù)路線的可行性,項目組選取部分數(shù)據(jù)進行試驗。
4.2 數(shù)據(jù)清洗
由于書信中對人物的記載伴隨著大量的姓氏、職位、別稱、身份等指代稱謂,為了從書信中準確提取有利用價值的實體要素數(shù)據(jù)并進行可視化分析,需要對數(shù)據(jù)進行清洗。本研究人工識別和提取宋慶齡往來書信中的人物實體要素,為了確保人物數(shù)據(jù)便于加工著錄,針對人物稱謂不統(tǒng)一、不規(guī)范的情況,制定人物實體著錄細則,并結(jié)合書信文獻、人物傳記等有關(guān)資料,對指代稱謂進行查找和統(tǒng)一替換。以宋慶齡為例,寫信時常用的落款有宋慶齡、羅莎蒙德·宋、孫夫人、孫宋慶齡、SCL、孫逸仙夫人、孫中山夫人等,數(shù)據(jù)清洗時將這些寫信落款統(tǒng)一聚合為宋慶齡;由于宋慶齡往來書信中,有部分書信是發(fā)給某某夫婦(如致愛潑斯坦夫婦)的,在人物實體提取時,需將夫婦分開處理,并為其添加親屬關(guān)系;還有部分書信,收信人為某人物親屬或家屬(如致陳賡親屬)等泛稱,在著錄人物的親屬關(guān)系時,新增一個人物節(jié)點,節(jié)點名稱為人物親屬,專門用于勾連這些指代不明確的親屬關(guān)系。
此外,宋慶齡部分書信是寫給某個機構(gòu)或機構(gòu)中的小團體的,如中國福利基金會全體工作人員、中共中國福利基金會支部,收信人則統(tǒng)一以機構(gòu)名為主,即中國福利基金會,并著錄機構(gòu)實體。同時,由于書信涉及寫信時間和寫信地點,寫信地點統(tǒng)一處理為市級行政區(qū)劃。
4.3 書信知識圖譜框架設(shè)計
近年來,知識組織領(lǐng)域的研究熱點之一是知識圖譜。知識圖譜在人文領(lǐng)域的研究中也得到了應(yīng)用,是名人文獻資源高效利用及細粒度呈現(xiàn)并實現(xiàn)語義關(guān)聯(lián)的有效途徑,為名人文獻資源知識發(fā)現(xiàn)提供了可能。知識圖譜作為以結(jié)構(gòu)化三元組形式存儲現(xiàn)實世界中實體以及實體間關(guān)系的知識庫[32],通過可視化手段,顯示知識內(nèi)部結(jié)構(gòu)與發(fā)展進程,其中圖的結(jié)點代表實體或者概念,而圖的邊代表實體/概念之間的各種語義關(guān)系。項目組在比較各種知識圖譜存儲的優(yōu)缺點后,采用圖數(shù)據(jù)庫Neo4j對書信知識圖譜進行存儲。
4.3.1 書信知識圖譜實體類型
在宋慶齡文獻數(shù)據(jù)中心建設(shè)過程中,為了對史料進行精細化加工,元數(shù)據(jù)方案采用多層級結(jié)構(gòu),即資源層、劃到層、篇層以及文中附圖(或子圖)。宋慶齡書信均以函電篇為單位進行加工,同一封書信刊載在不同的圖書上時,為了保證數(shù)據(jù)的完整性,將作為不同的函電篇進行加工。
項目組在全國報刊索引數(shù)據(jù)庫框架構(gòu)建的基礎(chǔ)上,借鑒上海圖書館人名規(guī)范庫本體及手稿檔案本體中與書信相關(guān)的實體、實體屬性以及實體關(guān)系,最終完成書信知識圖譜框架設(shè)計。書信知識圖譜的核心是寫信人收信人對應(yīng)的人物、涉及的部分機構(gòu)、寫信地點對應(yīng)的地名信息以及刊載書信的不同文獻資源(如圖書、報紙、期刊等),由于文獻資源涉及連續(xù)出版物,因此還包括不同文獻資源的劃到信息。為了解決同一信件對應(yīng)多個函電篇的問題,項目組在設(shè)計書信知識圖譜的框架時,既要包括書信的外在屬性,又要包括書信本身的隱含知識。因此,將信件分為內(nèi)容層和篇層,內(nèi)容層主要是信件本身,即寫信人、收信人、寫信時間、寫信地點,篇層即為函電篇,可看作內(nèi)容層的不同版本。
在宋慶齡文獻數(shù)據(jù)中心函電元數(shù)據(jù)框架元素的基礎(chǔ)上,從概念上將書信知識圖譜歸為信件(Letter)、人物(Person)、機構(gòu)(Organization)、地名(Place)、資源(Resource)、資源劃到(Item)、函電篇(Pian),其中資源(Resource)對應(yīng)的子類有報紙(Newspaper)、期刊(Periodical)、圖書(Books),資源劃到對應(yīng)的子類有報紙劃到(Newspaper_Item)、期刊劃到(Periodical_Item)、圖書劃到(Books_Item)。書信知識圖譜的實體類型如表1所示。
4.3.2 書信知識圖譜實體關(guān)系類型
實體關(guān)系(entity relation)是指某一時間段內(nèi)實體之間存在的關(guān)系[33]。書信知識圖譜實體之間存在多種關(guān)系,主要有信件與人物、信件與機構(gòu)、信件與地名、人物與人物、人物與機構(gòu)、信件與函電篇、信件與資源劃到、資源劃到與資源、資源劃到與機構(gòu)之間的關(guān)系。由于信件分為內(nèi)容層和篇層,一個函電篇可看作信件內(nèi)容的一個版本,當某個信件刊載于不同的資源劃到時,那么該信件就有多個版本,對應(yīng)多個相關(guān)的函電篇。信件與人物和機構(gòu)的關(guān)系主要是信件都有寫信人(機構(gòu))及收信人(機構(gòu)),信件與地名主要是寫信地點的關(guān)系,人物與人物、人物與機構(gòu)主要是收發(fā)信關(guān)系,信件與資源劃到主要是刊載于的關(guān)系,資源劃到與資源之間主要是資源劃到是資源的單件的關(guān)系,資源劃到與機構(gòu)也存在關(guān)系,即機構(gòu)是資源劃到的出版方(見表2)。
4.3.3 書信知識圖譜實現(xiàn)
以宋慶齡與周恩來之間的書信往來為例,對書信框架進行詳細解讀。宋慶齡與周恩來的往來書信主要集中在1950年,這些書信大部分收錄在《宋慶齡書信集》(1999年出版)下冊,宋慶齡書信集的上冊及下冊的出版機構(gòu)均為人民出版社,這些數(shù)據(jù)在圖數(shù)據(jù)庫中的呈現(xiàn)如圖2所示。
書信知識圖譜是對宋慶齡書信進行深層次開發(fā)利用的一次嘗試,大大增強了書信的知識服務(wù)功能。宋慶齡與周恩來的往來書信集中在中華人民共和國成立初期反映了一段重要史實。中華人民共和國成立之初,遭到了西方國家的多重封鎖,在當時惡劣的國際形勢下,將我國的正面形象及時傳播到世界各國,顯得十分迫切與重要。由于宋慶齡在國內(nèi)外享有崇高威望,抗戰(zhàn)時期有著豐富的國際傳播實踐,是最適合擔此重任的特殊人選。1950年10月,周恩來代表黨中央正式向宋慶齡提出,由她創(chuàng)辦對外宣傳刊物,打破西方霸權(quán)主義的封鎖,向全世界介紹我國真實的情況。在宋慶齡和中國福利會的努力下,1952年1月,《中國建設(shè)》創(chuàng)刊號公開發(fā)行。作為當時唯一能夠進入美國的期刊,《中國建設(shè)》可以說是“講好中國故事”的先聲。
4.4 書信知識圖譜應(yīng)用
在對宋慶齡書信進行數(shù)據(jù)清洗處理,并完成了書信知識圖譜框架設(shè)計的基礎(chǔ)上,借助可視化技術(shù)手段,從時間、空間以及人際關(guān)系等維度進行可視化的知識服務(wù),從而促進名人文獻資源的知識服務(wù)和價值挖掘。
按照書信知識圖譜的框架設(shè)計,將實體嵌入特定的時空或場景,從特定角度對宋慶齡往來書信進行知識服務(wù),實現(xiàn)時間、空間及人際關(guān)系的概覽。時間維度以時間軸為基線,將寫信時間與實體進行融合并串聯(lián);空間維度則采用“時間-空間”雙重基線,不僅能展示不同寫信時段內(nèi)宋慶齡書信的地區(qū)分布,還能夠?qū)⑺螒c齡在不同寫信時間段內(nèi)位于同一地點的書信進行聚合,形成名人文獻的追溯。此外,書信網(wǎng)絡(luò)能夠呈現(xiàn)與宋慶齡有書信往來的人物,如周恩來、鄧穎超等黨和國家的卓越領(lǐng)導人,以及斯諾、馬海德、艾黎、愛潑斯坦等國際友人,這一關(guān)系網(wǎng)絡(luò)基本包括了以宋慶齡為中心的,她與國內(nèi)外政要、親朋故舊的交往情況。通過知識圖譜可以了解宋慶齡的書信往來,增強文化傳播。
目前,宋慶齡文獻數(shù)據(jù)中心已實現(xiàn)對其往來書信的檢索和全文瀏覽服務(wù)。用戶可以在文獻類型中選擇函電,進行檢索、瀏覽PDF。在此基礎(chǔ)上,為了更好地服務(wù)用戶,項目組選擇可視化工具vis.js將Neo4j圖數(shù)據(jù)庫中的數(shù)據(jù)可視化。此外,在可視化表達中,時間和空間也是兩個重要的維度,采用CSS3實現(xiàn)時間軸的可視化,采用高德地圖開放的應(yīng)用程序接口(Application Program Interface,API)實現(xiàn)時空分析及呈現(xiàn)。
4.4.1 宋慶齡書信可視化
為了驗證技術(shù)路線的可行性,項目組先選取100余封書信,并按照上述書信知識圖譜的框架進行數(shù)據(jù)梳理,從而對書信進行可視化呈現(xiàn)和時空檢索。宋慶齡書信可視化呈現(xiàn)的頁面設(shè)計包括三部分:人物關(guān)系圖譜、時間軸、人物/機構(gòu)簡介,如圖3所示。默認中心人物是宋慶齡,時間軸上顯示宋慶齡每年的發(fā)信數(shù)量,人物關(guān)系圖譜上節(jié)點的大小可根據(jù)發(fā)信量的多少進行調(diào)整,發(fā)信量越多的節(jié)點越大。此外,可以按寫信時間進行過濾,查看一段時間內(nèi)跟宋慶齡有書信往來的人物/機構(gòu),如圖4所示。
點擊兩個人物實體中間的邊,可以查看兩者之間所有的書信。例如,點擊宋慶齡發(fā)信給蔣介石這條邊,可查看宋慶齡發(fā)給蔣介石的所有信件,如圖5所示。在圖5上,單擊某個信件實體,可顯示與其相關(guān)的屬性字段;雙擊某個信件實體,則跳轉(zhuǎn)至新頁面,以單個信件為核心,展示與其相關(guān)的實體,如圖6所示,額外顯示出該信件實體刊載于的資源劃到實體。點擊資源劃到實體,以圖6為例,資源劃到實體為《宋慶齡選集》(1992年版)上卷,可跳轉(zhuǎn)至PDF瀏覽頁面,查看該篇書信的全文內(nèi)容。
4.4.2 宋慶齡書信時空檢索
由于宋慶齡書信的時間跨度長達72年,如果按年進行時空呈現(xiàn)和檢索的話,每年的數(shù)據(jù)量較少,效果可能不甚理想。因此,項目組考慮按時間段進行處理,時間段劃分參考《中國圖書館分類法》通用復分表中的中國時代表[34]。以寫信地點是國內(nèi)的城市為例,對宋慶齡各時段書信的地區(qū)分布進行可視化展示,默認顯示全部時段的書信分布。頁面分為兩部分:時空地圖、檢索結(jié)果顯示區(qū)。為了更直觀地顯示出每個地區(qū)書信分布情況,項目組采用三維地圖,并按書信量的多少,將寫信地點以柱狀圖的形式在時空地圖上進行呈現(xiàn)。
鼠標放至時空地圖上的某個地點,就可以顯示這個地點寫的所有書信數(shù)量;點擊這個地點,則可對寫信地點為該地點的書信進行檢索,并將檢索結(jié)果以篇名列表的形式顯示在時空地圖下方;左上角的寫信時段,勾選后也可以按寫信時段進行檢索。在檢索結(jié)果顯示區(qū),點擊某個信件標題,則調(diào)用宋慶齡書信可視化場景的單個信件相關(guān)圖譜展示頁面,即彈出類似圖6的頁面,可以查看該信件實體的相關(guān)知識圖譜。此外,點擊資源劃到實體即可跳轉(zhuǎn)至PDF瀏覽頁面,查看該篇書信的全文內(nèi)容。由于宋慶齡部分書信的寫信地點在莫斯科、東京等,項目組后續(xù)考慮將時空地圖進行切換,以便更完整地展示宋慶齡書信的地區(qū)分布。
5 結(jié)語
盡管數(shù)字人文在國內(nèi)的研究還處于起步階段,但是已經(jīng)為圖書館服務(wù)模式的創(chuàng)新提供了新的思路和方法,GIS和可視化等技術(shù)手段也能有效助力名人文獻資源的揭示和知識化服務(wù),從而更好地服務(wù)讀者。本研究從數(shù)字人文視角對名人文獻進行知識關(guān)聯(lián)化的探索,通過對書信知識圖譜模型的構(gòu)建及應(yīng)用,為相關(guān)人文學者提供數(shù)據(jù)基礎(chǔ)和方法支撐,兩個場景的前臺展示也驗證了技術(shù)路線的可行性。同時,知識圖譜化的宋慶齡書信展示頁面以實體為紐帶,實現(xiàn)了宋慶齡相關(guān)文獻的廣泛匯聚和深度融合,形成立體化知識網(wǎng)絡(luò)并予以呈現(xiàn),大大增強了書信知識服務(wù)功能。此外,可視化技術(shù)又為名人文獻資源的展示帶來了新的體驗,拓展其傳播深度和廣度。
本研究對名人文獻的數(shù)字人文場景構(gòu)建尚處于起步階段,仍存在不足之處。其中場景涵蓋的數(shù)據(jù)量有限,尚不能達到規(guī)?;瘧?yīng)用;GIS技術(shù)目前主要用于書信的時空呈現(xiàn)和檢索,后續(xù)可考慮深入書信內(nèi)容進行分析。接下來擬建立線上平臺,吸引更多的學者參與,通過線上互動,使名人文獻的信息和價值被充分挖掘。名人文獻資源知識發(fā)現(xiàn)研究也將煥發(fā)生機,推動文化遺產(chǎn)“活起來、亮起來、傳起來”。
參考文獻:
[1] 張筠.名人專題數(shù)據(jù)庫建設(shè)的理論與實踐探索:以沈從文專題數(shù)據(jù)庫建設(shè)為例[J].吉首大學學報(社會科學版),2012,33(1): 150-152.
[2] 宋雪雁,崔浩男,梁穎,等.數(shù)字人文視角下名人日記資源知識發(fā)現(xiàn)研究:以王世杰日記為例[J].情報理論與實踐,2021,44(6): 105-111.
[3] 宋慶齡文獻數(shù)據(jù)中心[DB/OL].[2022-07-11].http://www.sclrd.net.cn/index.html.
[4] 袁子英.紅色資源數(shù)據(jù)庫建設(shè)研究:以籌建賀龍圖書館為例[J].圖書館學研究,2012(14):46-48.
[5] 周恩來研究專題數(shù)據(jù)庫[DB/OL].[2022-07-11].https://lib.hytc.edu.cn/info/1062/1467.htm.
[6] 趙曉紅,周維煦.人物數(shù)據(jù)庫建設(shè)新模式探索:以蔣介石資料數(shù)據(jù)庫為例[J].浙江檔案,2016(6):15-17.
[7] 劉煒,葉鷹.數(shù)字人文的技術(shù)體系與理論結(jié)構(gòu)探討[J].中國圖書館報,2017,43(5):32-41.
[8] UNSWORTH J.What is Humanities Computing and What is not?[J].Jahrbuch für Computerphilologie,2002,4:71-83.
[9] 王曉光.“數(shù)字人文”的產(chǎn)生、發(fā)展與前沿[C]//全國高校社會科學科研管理研究會.方法創(chuàng)新與哲學社會科學發(fā)展.武漢:武漢大學出版社,2010:207-221.
[10] SULA C A.Digital humanities and libraries:a conceptual model[J].Journal of Library Administration,2013,53(1):10-26.
[11] 杜宗明.數(shù)字人文環(huán)境下的圖書館角色定位與實踐路徑[J].農(nóng)業(yè)圖書情報學刊,2017,29(10):103-106.
[12] 鄧穎超.向宋慶齡同志致崇高的敬禮![N].人民日報,1981-5-29(1).
[13] 愛潑斯坦.宋慶齡:二十世紀的偉大女性[M].北京:人民出版社,1992.
[14] 盛永華.20世紀的偉大女性:宋慶齡[M].廣州:廣東人民出版社,2006.
[15] 宋慶齡.永遠和黨在一起[M].上海:上海人民出版社,1983.
[16] 宋慶齡基金會,中國福利會.宋慶齡書信集[M].北京:人民出版社,1999:1.
[17] 凌霄.淺析宋慶齡20世紀20—30年代政治思想的演變:基于1925—1932年宋慶齡致楊杏佛書信的考察[J].蘇區(qū)研究,2017(5):88-96.
[18] 陳孜穎.革命的情誼——宋慶齡致魯迅書信考辨[J].紹興魯迅研究,2022(1):215-221.
[19] 張毅,李欣.面向數(shù)字人文的特藏資源揭示研究:以方志數(shù)據(jù)庫建設(shè)為例[J].圖書館,2019(6):100-105.
[20] 劉寧靜,劉音,王莫言,等.數(shù)字人文視角下學術(shù)名人知識模型構(gòu)建研究:以李政道數(shù)字資源中心為例[J].圖書情報工作,2019,63(23):113-121.
[21] 牛力,高晨翔,劉力超,等.層次與空間:數(shù)字記憶視角下名人檔案的價值挖掘研究[J].檔案學研究,2021(5):138-144.
[22] 孫鳴蕾,房小可,陳忻.數(shù)字人文視角下名人檔案知識圖譜構(gòu)建研究:以作家檔案為例[J].山西檔案,2020(6):79-88.
[23] 宋雪雁,鐘文敏.數(shù)字人文視角下《譚延闿日記》人物關(guān)系挖掘及可視化研究[J].情報科學,2022,40(6):25-35.
[24] 李惠,侯君明,陳濤,等.星漢窈渺——書信網(wǎng)絡(luò)中蘊藏的人際關(guān)系挖掘[J].圖書館雜志,2020,39(5):86-92,80.
[25] Darwin Correspondence Project[EB/OL].[2022-09-02].http://www.darwinproject.ac.uk/.
[26] The Newton Project[EB/OL].[2022-03-01].http://www.newtonproject.ox.ac.uk.
[27] 劉煒,謝蓉,張磊,等.面向人文研究的國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)[J].中國圖書館學報,2016,42(5):29-39.
[28] 夏翠娟.中國歷史地理數(shù)據(jù)在圖書館數(shù)字人文項目中的開放應(yīng)用研究[J].中國圖書館學報,2017,43(2):40-53.
[29] 王軍.從人文計算到可視化——數(shù)字人文的發(fā)展脈絡(luò)梳理[EB/OL].(2020-05-10)[2023-07-10].https://m.sohu.com/a/394279713_786014.
[30] 秦量.上海孫中山宋慶齡文物圖錄[M].上海:上海辭書出版社,2005:64.
[31] 葉建華.心靈的鏡子 寶貴的遺產(chǎn)——《宋慶齡書信集》評介[J].今日中國(中文版),2001(5):10-11.
[32] 曾蕾,譚旭.數(shù)據(jù)的語義增強——解讀圖檔博支持數(shù)字人文的新動向[J].數(shù)字人文研究,2021,1(1):65-86.
[33] 歐陽劍,梁珠芳,任樹懷.大規(guī)模中國歷代存世典籍知識圖譜構(gòu)建研究[J].圖書情報工作,2021,65(5):126-135.
[34] 國家圖書館《中國圖書館分類法》編輯委員會.中國圖書館分類法:第五版[M].北京:國家圖書館出版社,2010.
作者簡介:王靜,通訊作者,上海圖書館館員,研究方向為知識組織與知識發(fā)現(xiàn)、數(shù)字人文;朱蓓琳,上海圖書館館員,研究方向為知識組織與知識挖掘;姜鵬,上海圖書館,工程師,研究方向為中圖分類、數(shù)字人文。
收稿日期:2024-03-18本文責編:王曉琳
本文系上海圖書館青年揚帆計劃專項“名人文獻的數(shù)字人文場景構(gòu)建——以宋慶齡為例”的研究成果之一,榮獲2023年中國數(shù)字人文年會(CDH2023)優(yōu)秀論文。