林睿凡,周洪偉,劉亮亮,謝 琪
(1.中國(guó)中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所,北京 100700;2.上海對(duì)外經(jīng)貿(mào)大學(xué)統(tǒng)計(jì)與信息學(xué)院,上海 200000;3.中國(guó)中醫(yī)科學(xué)院學(xué)術(shù)管理處,北京 100700)
中醫(yī)藥學(xué)是中國(guó)古代科學(xué)的瑰寶,中醫(yī)文獻(xiàn)是中醫(yī)藥學(xué)傳承的載體。現(xiàn)存中醫(yī)藥文獻(xiàn)約一萬(wàn)三千種,其中的經(jīng)典醫(yī)籍流傳甚廣。讀書(shū)須從目錄問(wèn)途,版本源流研究是古代文獻(xiàn)整理中不可或缺的重要工作,具有讀書(shū)治學(xué)、古籍整理、管理編目、收藏與流通等四方面重要意義[1]。錢鍾書(shū)提出,版本選擇作為古籍研究的起始步驟看似細(xì)枝末節(jié),但實(shí)際上由于不同版本的內(nèi)容差異巨大,最終所選版本對(duì)于研究結(jié)果也有至關(guān)重要的影響[2]?!秱摗烦蓵?shū)后由于古代印刷技術(shù)所限,主要以抄本傳世,歷經(jīng)歷代學(xué)者、收藏家和醫(yī)家不斷傳抄、整理和刊行,演變?yōu)椴煌姹尽!秱摗窔v經(jīng)長(zhǎng)久時(shí)間的流傳,其版本包括唐本、金匱玉函經(jīng)、高繼沖本、宋本、敦煌殘卷及安政本等眾多版本[3]。這些版本在歷史上不同時(shí)期經(jīng)由不同之手傳承,版本之間內(nèi)容的差異,來(lái)源的不同,藏于不同書(shū)閣,甚至存在書(shū)名的多次變更,存世的先后順序均值得進(jìn)一步匯總整理。也正是由于版本信息之混雜,在學(xué)習(xí)《傷寒論》時(shí),版本選擇是學(xué)者們面臨的首要挑戰(zhàn),因此直觀而有效地展示傷寒論版本流傳知識(shí)很有必要。
近年來(lái)伴隨古籍?dāng)?shù)字化飛速發(fā)展,有學(xué)者開(kāi)始嘗試探索構(gòu)建中國(guó)歷代存世典籍知識(shí)圖譜,拓展古籍知識(shí)服務(wù)內(nèi)涵[4]。通過(guò)建立《傷寒論》版本的本體和知識(shí)圖譜,追本溯源,通過(guò)知識(shí)圖譜和本體共同搭建的框架,展示《傷寒論》版本流傳的路徑,可以為《傷寒論》版本研究提供重要的參考。
本體捕獲特定領(lǐng)域的知識(shí)模型,允許描述概念以及概念之間的關(guān)系。因此本體可以看作在決策過(guò)程中起重要作用的元數(shù)據(jù)。通過(guò)構(gòu)建本體不但可以完成概念分類,避免歧義的產(chǎn)生,還可以通過(guò)概念關(guān)系實(shí)現(xiàn)對(duì)于真實(shí)世界的描述。知識(shí)圖譜由于概念之間關(guān)系被準(zhǔn)確定義,因此可以明確顯示推理過(guò)程,從而為推薦系統(tǒng)帶來(lái)解釋性?!秱摗钒姹玖鱾髑闆r基于本體方法通過(guò)知識(shí)圖譜的形式展示,能夠還原版本之間概念與概念的關(guān)系,展示版本流傳的原貌以及版本基本信息。因此,本研究基于本體方法構(gòu)建《傷寒論》版本知識(shí)圖譜,以期滿足用戶對(duì)中醫(yī)古籍目錄知識(shí)表達(dá)和知識(shí)呈現(xiàn)的最新需求。
以主題“傷寒論”and主題“版本”作為檢索詞,檢索PubMed、SinoMed、中國(guó)學(xué)術(shù)期刊全文數(shù)據(jù)庫(kù)(CNKI)、萬(wàn)方數(shù)據(jù)庫(kù)(WanFang)、重慶維普數(shù)據(jù)庫(kù)(VIP),檢索日期截止至2022年4月。
明確闡述《傷寒論》流傳情況的文獻(xiàn)予以納入。
《傷寒論》闡釋類著作不納入研究范疇;闡述《金匱要略》版本流傳情況的文獻(xiàn)不納入研究;對(duì)于同一版本的流傳情況闡述相悖者,取論述最充分者予以納入。
參考已出版的中醫(yī)古籍書(shū)目《中國(guó)中醫(yī)古籍總目》[5]《宋以前醫(yī)籍考》[6]《中國(guó)醫(yī)籍考》[7]《中國(guó)醫(yī)籍通考》[8]《中國(guó)醫(yī)籍大辭典》[9]《中國(guó)醫(yī)籍補(bǔ)考》[10]等補(bǔ)充版本信息。
參考《GB/T 3792.7-2008古籍著錄規(guī)則》[11]《中醫(yī)古籍整理規(guī)范》[12]《圖書(shū)館·情報(bào)與文獻(xiàn)學(xué)名詞》[13]《中國(guó)古籍版本學(xué)》[14],對(duì)其未收錄的概念遵循原文語(yǔ)料闡述進(jìn)行提取。提取原則包括合理性和準(zhǔn)確性,其中合理性為“與權(quán)威文獻(xiàn)所歸納概念相比較后,提出能夠真實(shí)反映《傷寒論》流傳知識(shí)的復(fù)合實(shí)體”; 準(zhǔn)確性為“所收錄的版本概念 應(yīng)保證用詞準(zhǔn)確且無(wú)歧義,是中醫(yī)古籍領(lǐng)域所認(rèn)可的常用概念”。
參考學(xué)者經(jīng)驗(yàn),直接復(fù)用現(xiàn)有古籍版本概念關(guān)系[15-16]。獲得“組成”“包含”“校注”“底本”“傳本”等已明確定義的概念關(guān)系,用于支持《傷寒論》版本概念關(guān)系的構(gòu)建。本體的來(lái)源包括3個(gè),分別為復(fù)用現(xiàn)有本體;收集整理包括字典、國(guó)標(biāo)以及國(guó)際標(biāo)準(zhǔn)等在內(nèi)的權(quán)威文獻(xiàn)的古籍術(shù)語(yǔ);對(duì)已發(fā)表文獻(xiàn)提出的術(shù)語(yǔ)進(jìn)行進(jìn)一步概括,用于《傷寒論》版本概念及概念關(guān)系的描述。
其余未給出準(zhǔn)確定義的概念關(guān)系通過(guò)歸納、分析現(xiàn)有文獻(xiàn)概括出相應(yīng)含義。以“離析為”舉例說(shuō)明。關(guān)系“離析為”的定義域和值域所包括的體量差別較大,或者說(shuō)經(jīng)離析后,一本書(shū)籍拆分為兩本不同的書(shū)籍。例如《金匱玉函經(jīng)》和《雜病》經(jīng)由《張仲景方》離析而來(lái)。依據(jù)為經(jīng)錢超塵教授考證《張仲景方》離析為八種二十六卷[17],《金匱玉函經(jīng)》和《雜病》僅占其中兩卷,因此《張仲景方》所載內(nèi)容十分豐富,只是其他內(nèi)容目前未見(jiàn)或已將亡軼。經(jīng)與《圖書(shū)館·情報(bào)與文獻(xiàn)學(xué)名詞》的概念關(guān)系“析出文獻(xiàn)”進(jìn)行比對(duì)后可將“離析為”概念關(guān)系定義為“文獻(xiàn)從整本(套)文獻(xiàn)中析出,形成具有獨(dú)立著者、獨(dú)立篇名的著作”。
《傷寒論》概念關(guān)系獲取的提取原則主要包括以下三點(diǎn)。①定義準(zhǔn)確:概念關(guān)系的獲取需要在明確關(guān)系定義的基礎(chǔ)上完成,所以定義概念關(guān)系的用詞選擇既要能夠反映概念之間聯(lián)系的本質(zhì),也要符合漢語(yǔ)語(yǔ)義和古籍流傳的用詞規(guī)范,不給讀者造成歧義。②用詞簡(jiǎn)潔:基于現(xiàn)有古籍版本學(xué)的專業(yè)術(shù)語(yǔ),概況和提取中醫(yī)版本的概念關(guān)系,一方面便于專業(yè)人員對(duì)概念關(guān)系理解,同時(shí)也避免了用詞冗余繁瑣的問(wèn)題。③使用范圍明確:通過(guò)限定概念關(guān)系的定義域和值域劃定概念關(guān)系的使用場(chǎng)景。
通過(guò)查閱文獻(xiàn),考查復(fù)用現(xiàn)有版本本體的可能性;參考《中醫(yī)古籍整理規(guī)范》[12]《書(shū)目記錄的功能需求》[18](FRBR)等定義《傷寒論》版本類和類的等級(jí)體系;采用Neo4j構(gòu)建工具進(jìn)行儲(chǔ)存;形成《傷寒論》版本知識(shí)本體。
基于本體將對(duì)實(shí)例進(jìn)行抽取,共獲得133個(gè)三元組。將“位置戳”和“地點(diǎn)戳”的概念引入,主要用于解決四元組的知識(shí)表示問(wèn)題。例如,華希閑于 1763 年購(gòu)買《千金翼方》。三元組表示為:
P1=(《千金翼方》,購(gòu)買人,華希閑)
(《千金翼方》,收購(gòu)時(shí)間,1763)
此句子將會(huì)以上述嵌套關(guān)系出現(xiàn)。同樣還包括以下幾種情況:《太平圣惠和劑局方》于公元 992 年收錄淳化本《傷寒論》、 2005 年《傷寒論》南宋閩刻本收錄《海外回歸中醫(yī)古籍善本集萃》、《傷寒雜病論》 收錄于《脈經(jīng)》的七八卷等。不論是古籍還是現(xiàn)代文獻(xiàn)常見(jiàn)時(shí)間、地點(diǎn)等多元關(guān)系,采用打標(biāo)簽的形式標(biāo)注《傷寒論》版本知識(shí)圖譜能夠解決上述多元關(guān)系表示困難的問(wèn)題。因此提出“成書(shū)時(shí)間”“發(fā)行時(shí)間”等屬性標(biāo)簽,能夠幫助版本知識(shí)圖譜更加高效推斷古籍的相關(guān)知識(shí)。
獲得21個(gè)概念,見(jiàn)表1。
表1 《傷寒論》版本概念
獲得關(guān)系共16種,含有4種屬性關(guān)系,其種類和相應(yīng)定義見(jiàn)表2。
表2 《傷寒論》版本的概念關(guān)系及定義
獲得《傷寒論》版本類和類的等級(jí)體系,如圖1所示,其中:
圖1 《傷寒論》版本類和類的等級(jí)體系
①版本類[15-16]。版本是古籍內(nèi)容的載體,是內(nèi)容的物理體現(xiàn),可理解為“同書(shū)異本”。其分類包括刻本等。
②人物類[15-16]。人物類別通過(guò)不同方式與版本相關(guān)聯(lián),例如對(duì)經(jīng)書(shū)字句的注解為注疏者,因此可將“注疏者”劃分至人物類。
③團(tuán)體類[18]。團(tuán)體即是機(jī)構(gòu),由于《書(shū)目記錄的功能需求》已明確給出術(shù)語(yǔ)“團(tuán)體”,因此將其采納。主要表示為不同版本所產(chǎn)生的機(jī)構(gòu),例如“收藏機(jī)構(gòu)”可劃分為“團(tuán)體類”。
④作品類[18]。將古籍作品內(nèi)容進(jìn)行概況,獲得其所屬的具體類別。用于概況文獻(xiàn)主體。例如《崇文總目》六十六卷按四部分四十五類,因此屬于為書(shū)目類別,故將書(shū)目凝練為“作品類”。
⑤流傳版本類[12,15-16]。古籍經(jīng)由底本流傳為傳本,因此底本為工作基礎(chǔ),傳本形成不同流傳體系,因此底本和傳本是時(shí)間先后的體現(xiàn),故劃分至流傳版本類。
底本以及傳本是針對(duì)古籍版本傳承先后順序的定義,包括刻本、抄本等多種存在形式,通過(guò)將版本進(jìn)行分類能夠作為判斷內(nèi)容準(zhǔn)確性的依據(jù);將責(zé)任者按照作者、收藏人、進(jìn)獻(xiàn)人等不同類別進(jìn)行分類,可以反映不同版本的是以怎樣的方式進(jìn)行流傳的,能夠作為判斷內(nèi)容完整的依據(jù);團(tuán)體類別下包括收藏機(jī)構(gòu)、翻刻機(jī)構(gòu)和重印機(jī)構(gòu),根據(jù)上述機(jī)構(gòu)不同職能分型可以明晰版本的處理情況。
《傷寒論》版本的流傳通過(guò)底本和傳本之間的順承關(guān)系體現(xiàn),根據(jù)流傳關(guān)系的定義可以區(qū)分底本和傳本之間的差異程度,例如“流傳為”是古籍本身以相對(duì)完整的形式流傳。而“??睘椤敝荚诒A艄偶?雖然對(duì)于原文有所改動(dòng)通過(guò)謬誤或訂正,并將原本正確的內(nèi)容予以保留,前后所關(guān)聯(lián)的底本和傳本有差異,且經(jīng)過(guò)詳細(xì)校勘,因此更有可能貼近古籍原貌,詳見(jiàn)圖2。
《傷寒論》版本知識(shí)圖譜包括133個(gè)實(shí)體關(guān)系對(duì),相較于傳統(tǒng)的三元組增加時(shí)間戳、位置戳和地點(diǎn)戳的概念。通過(guò)增加此類概念可解決時(shí)間,位置和地點(diǎn)類多元關(guān)系的表示問(wèn)題。將“成書(shū)時(shí)間”“發(fā)行時(shí)間”等屬性添加到三元組中能夠便于計(jì)算機(jī)推測(cè)圖譜中書(shū)籍的大致成書(shū)時(shí)間,見(jiàn)表3、圖3。
圖3 《傷寒論》版本知識(shí)圖譜示例
表3 《傷寒論》版本知識(shí)圖譜部分實(shí)體關(guān)系對(duì)比
中醫(yī)古籍是信息時(shí)代中醫(yī)學(xué)傳播的重要載體,梳理古籍的流傳情況對(duì)于今后中醫(yī)應(yīng)用有著十分重要的意義。但由于技術(shù)所限,自張仲景完成底本后便以各種形式流傳于世,且多未經(jīng)系統(tǒng)整理[19]。1954年中央文化委員會(huì)在《關(guān)于改進(jìn)中醫(yī)工作問(wèn)題給中央的報(bào)告》提出“整理出版中醫(yī)古籍,包括編輯和翻印古典和近代醫(yī)書(shū)”,其后《傷寒論》納入古籍整理工作的一部分。時(shí)至今日,本體和知識(shí)圖譜技術(shù)作為知識(shí)表示的一種新技術(shù)有利古籍版本的相關(guān)知識(shí)的呈現(xiàn),借助于上述兩種技術(shù)能夠?qū)ⅰ秱摗妨鱾髑闆r概括為本體,具體知識(shí)通過(guò)概念關(guān)系相關(guān)聯(lián),以圖譜的形式呈現(xiàn),不僅能夠充分展示《傷寒論》流傳情況,為選本提供參考建議,還能實(shí)現(xiàn)其他古籍版本流傳信息的自動(dòng)獲取,簡(jiǎn)化人工整理工作,梳理其他古籍版本的流傳情況。
本體的主要功能在于概括客觀世界,并通過(guò)概念關(guān)系將概念相關(guān)聯(lián),用于刻畫(huà)某一領(lǐng)域相關(guān)知識(shí)。而客觀世界除了靜態(tài)知識(shí)外還包括各種動(dòng)態(tài)事件,因此即使是同一領(lǐng)域,知識(shí)可歸屬于靜態(tài),也有可能呈現(xiàn)動(dòng)態(tài)性,那么描述不同情態(tài)下的知識(shí)所使用的本體也不盡相同。例如當(dāng)本體的作用為構(gòu)建古籍版本數(shù)據(jù)庫(kù)時(shí)屬于靜態(tài)本體,其核心為描述單一古籍的基本情況,就包括明確刻畫(huà)古籍的出版時(shí)間、版本編號(hào),相關(guān)作者的姓名、籍貫等[20],因此構(gòu)建靜態(tài)本體的重點(diǎn)在于囊括概念類別。版本流傳著重體現(xiàn)古籍衍變情況,因此其中也會(huì)涉及部分古籍知識(shí),核心術(shù)語(yǔ)包括作者、古籍和內(nèi)容表達(dá)。版本流傳圍繞同種古籍進(jìn)行,也就是說(shuō)主要強(qiáng)調(diào)古籍流傳過(guò)程中的時(shí)間屬性和同種版本變化情況,相比于靜態(tài)描述古籍的性質(zhì)和內(nèi)容,版本流傳本體著重強(qiáng)調(diào)動(dòng)態(tài),因此僅使用“版本”“人物”“時(shí)間”等概念描述版本并不能完全概括不同版本古籍的流傳情況,所以應(yīng)該在服務(wù)于構(gòu)建版本流傳知識(shí)圖譜的基礎(chǔ)上,提出新的本體模型。
時(shí)間戳作為遞歸事件網(wǎng)絡(luò)的一種序列標(biāo)簽,可以與其他概念關(guān)系相關(guān)聯(lián),將時(shí)間明確地合并到實(shí)體關(guān)系中。這種序列標(biāo)簽通常能夠解決常用復(fù)雜句式中的狀語(yǔ)圖譜化的問(wèn)題。通過(guò)添加序列標(biāo)簽的形式一方面能夠以簡(jiǎn)潔明了的方式展示更多的原文信息,減少失真,另一方面也能夠作為知識(shí)圖譜推理的依據(jù),結(jié)合時(shí)間相關(guān)屬如“成書(shū)時(shí)間”“發(fā)行時(shí)間”等屬性,以推測(cè)成書(shū)時(shí)間缺失的古籍的大致誕生時(shí)間。基于“時(shí)間戳”同時(shí)提出“位置戳”“地點(diǎn)戳”等表示方式,用于解決多元關(guān)系的表示方法問(wèn)題。