周冉冉,李伊然,羅亞敏,宋慧榮,李 冉,葛 飛,陶曉華
北京中醫(yī)藥大學,北京100029
中醫(yī)古籍是中醫(yī)藥傳承與創(chuàng)新的根基。近年來,隨著臨床對中醫(yī)古籍整理需求的轉(zhuǎn)變與提升,在中醫(yī)古籍整理中融入現(xiàn)代信息技術所形成的智能化中醫(yī)古籍知識服務方法方興未艾。本團隊基于國家重點研發(fā)計劃項目“基于知識元理論與臨床需求深度融合的中醫(yī)古籍整理及專題文獻研究”,在傳統(tǒng)中醫(yī)古籍整理基礎之上,首創(chuàng)“病脈證并治”知識元標引體系,融合現(xiàn)代信息技術,對600種中醫(yī)古籍實施深度標引并建立中醫(yī)古籍數(shù)據(jù)庫。本文即對《傷寒論》進行線上“病脈證并治”知識元標引,提供實踐示例,梳理標引疑難要點,并探討可行的解決方法,進一步完善“病脈證并治”知識元標引體系。
知識元是表達一個完整概念時,不可再分解的最小知識單位,由多個字、詞、詞組或短語等語義成分相互關聯(lián)構(gòu)成,在內(nèi)容上表達相對完整的知識,在形式上多以短語或句子為主,具有相對獨立性、知識表達完整性、語義單元最小粒度性等特征[1-2]。
《傷寒論》“病脈證并治”臨床診療模式源自“觀其脈證,知犯何逆,隨證治之的”辨治觀。從“病-脈-證”出發(fā),不僅強調(diào)中醫(yī)臨證診治全過程,而且體現(xiàn)臨床診療決策的復雜性、整體性與動態(tài)性。項目團隊首倡“病脈證并治”知識元理論標引,應用知識體、知識元、語義成分、語義類型、語義關聯(lián)等一系列賦予古籍原文內(nèi)涵的新概念,其中“病脈證并治”標引模板涵蓋“病名、病因、病位、病程、鑒別診斷、脈位、主脈、兼脈、死脈、辨證、病機、治則、治法、方劑、藥物、劑量、炮制、加減法、煎法、制法、服法、中病反應、欲解時、針灸、其他治法、治案、預后、宜忌、誤治、釋義、其他”等31個知識元數(shù)據(jù)。
標引是根據(jù)文獻特征,賦予某種檢索標識的過程[3]。自由標引是指標引人員在遵循相應標引原則的前提下,未借用特定的詞表而自行設定標引詞進行自由標引,其中尊重古籍原文為標引的重要原則。中醫(yī)古籍種類繁多、內(nèi)容廣雜,特定的中醫(yī)古籍敘詞表難以形成統(tǒng)一規(guī)范,使得標引人員更加依賴對古籍原文和標引原則的理解,自主擬用確切措詞直接表達所要分析的主題概念,因此知識元標引基本屬于自由標引[4-5]?!安∶}證并治”知識元標引以仲景“觀其脈證,知犯何逆,隨證治之”為準則,以上述“病名”“脈象”“辨證”等知識元為基本單位進行標引,現(xiàn)以《傷寒論》標引為例簡述其流程:標引人員登錄中醫(yī)古籍“病脈證并治”知識元標引系統(tǒng),上傳已??钡摹秱摗冯娮游谋荆瑒澏夸?,選中知識體原文進入“病脈證并治”標引模板,對知識體原文進行結(jié)構(gòu)層次分析,對知識元在模板內(nèi)選用相應的屬性要素進行標注,再抽取出各種屬性類型的語義成分,最后將該知識體內(nèi)抽取的各種語義進行相互關聯(lián),并進行知識體關聯(lián),建立知識元語義網(wǎng)絡。見圖1。
圖1 中醫(yī)古籍“病脈證并治”知識元標引
3.1 《傷寒論》標引文本錄入《傷寒論》版本眾多,筆者對8種古傳版本進行考證,選定錢超塵、郝萬山先生整理的宋版《傷寒論》來校勘電子文本[6-7],將其上傳至中醫(yī)古籍“病脈證并治”知識元標引系統(tǒng)(http://114.255.40.130:60080/metaservice2/),按照紙質(zhì)版篇章劃分書體結(jié)構(gòu)目錄[8],通過“病脈證并治”標引模板進行線上自由標引。標引系統(tǒng)包括書體結(jié)構(gòu)、標引模板、知識體、知識元、語義成分、語義類型、語義關聯(lián)類型、知識體關聯(lián)類型等。見表1。
表1 中醫(yī)古籍“病脈證并治”知識元標引系統(tǒng)
3.2 標引實踐示例《傷寒論·辨太陽病脈證并治中第六》第38條云:“太陽中風,脈浮緊,發(fā)熱惡寒,身疼痛,不汗出而煩躁者,大青龍湯主之。若脈微弱,汗出惡風者,不可服之。服之則厥逆,筋惕肉瞤,此為逆也。大青龍湯方。八。
麻黃(六兩,去節(jié))桂枝(二兩,去皮)甘草(二兩,炙)杏仁(四十枚,去皮尖)生姜(三兩,切)大棗(十枚,擘)石膏(如雞子大,碎)
上七味,以水九升,先煮麻黃,減二升,去上沫,內(nèi)諸藥,煮取三升,去滓,溫服一升,取微似汗。汗出多者,溫粉粉之。一服汗者,停后服。若復服,汗多亡陽遂虛,惡風煩躁,不得眠也。”
此條知識體原文講述太陽傷寒兼里熱證“病脈證并治”的辨證論治診療過程,因此選用標引系統(tǒng)“病脈證并治”模板進行標引。筆者分別抽取出“病名”“主脈”“辨證”“方劑”“藥物”“煎服法”“中病反應”等知識元進行標注,如“病名:太陽病”“病因:太陽中風”“主脈:脈浮緊”“主脈:脈微弱”“辨證:發(fā)熱惡寒,身疼痛,不汗出而煩躁者”“辨證:汗出惡風”“辨證:厥逆,筋惕肉瞤”“辨證:汗多惡風煩躁,不得眠”“病機:亡陽遂虛”“方劑:大青龍湯”等?!蓖瑫r,對抽取的知識元進行語義提取,如“辨證”知識元提取出“發(fā)熱”“惡寒”“身疼痛”“不汗出而煩躁”4個“證候表現(xiàn)”語義?!八幬铩敝R元可直接選用語義關聯(lián)類型“藥制量關系(藥物<->炮制<->劑量)”對知識元內(nèi)不同的藥物、炮制、劑量逐一標引。然后,將不同屬性類型的語義成分按照相對應的類型進行語義關聯(lián),如“藥制量關系”:麻黃(藥物)<->去節(jié)(炮制)<->六兩(劑量)。“辨治關系”:發(fā)熱;惡寒;身疼痛;不汗出而煩躁(證候表現(xiàn))<->浮緊(脈象)<->太陽中風(病因病機)<->大青龍湯(方劑)<->汗出多者,溫粉粉之(服法)<->取微似汗(療效)。見圖2。
圖2 “病脈證并治”知識元標引《傷寒論》第38條
3.3 標引疑難要點
3.3.1 知識體命名《傷寒論》論述了六經(jīng)病正治、誤治、傳變等各種臨證狀況,并記載各經(jīng)病證經(jīng)過誤治、傳變可轉(zhuǎn)歸為壞病或他經(jīng)病證。復雜多變的病證使得對知識體條文命名的難度增加,現(xiàn)以太陽病篇為例進行研討。太陽病本證條文,即以“太陽病”“傷寒”“中風”命名,如第12條命名為“太陽中風”。太陽病變證、壞證條文,可選用主證來命名,如第152條命名為“結(jié)胸證”。條文內(nèi)未論及病證名稱,而方證內(nèi)容較為詳盡,可根據(jù)本書目錄、原文或上下文內(nèi)容提取病證名稱,如第149條命名為“痞”。條文明確提出病名者,則以之命名,如167條命名為“臟結(jié)”。84-88條以“xxx家”為首,根據(jù)具體語境將其標為“xxx家”,如84條命名為“淋家”。此外,當知識體條文中出現(xiàn)多種病證名時,選用一個可精確地概括本則知識體內(nèi)容的名稱作“病名”知識元內(nèi)容,其他的病證名各自提取為該知識元內(nèi)相應屬性的語義。
3.3.2 脈象標引脈象反應人體內(nèi)氣血陰陽的盛衰,有助于判斷疾病及其發(fā)展、預后。《傷寒論》脈理精微,言及脈診條文有150余條,且仲景于篇名“病脈證并治”內(nèi)將“脈”置于“證”之前,可見臨床脈診至關重要,故“病脈證并治”標引模板設有“主脈”“兼脈”“脈位”和“死脈”知識元按鈕,但仲景條文內(nèi)有多脈相兼者,而主脈與兼脈不易區(qū)別,如《辨痙濕暍脈證第四》云:“太陽中暍者……其脈弦細芤遲”“弦細芤遲”四種脈象可同作主脈,然“弦”作主脈,“細”“芤”“遲”視作兼脈亦可。
《傷寒論》言及陰陽脈者有二十余條,其中“辨脈法第一”開篇即言:“凡脈大、浮、數(shù)、動、滑,此名陽也;脈沉、澀、弱、弦、微,此名陰也”,對常見脈象進行陰陽分類。筆者認為陰陽脈有多種含義:第一,“寸部為陽尺為陰”,如第3條“脈陰陽俱緊”、第6條“脈陰陽俱浮”標引為“主脈”知識元,再分別抽取“脈位”和“脈象”的語義即可;第二,指浮取和沉取兩種指法,如第100條“陽脈澀,陰脈弦”,抽取出“陽脈澀”和“陰脈弦”兩個“脈象”語義即可;第三,陰陽脈有時即指“浮取和沉取”,又隱言病證的病機,如第12條“陽浮而陰弱,陽浮者熱自發(fā),陰弱者汗自出”,此處應當提取“陽浮而陰弱”為“脈象”語義和“陽浮”“陰弱”兩個“病因病機”語義。此外,標引描述脈象的條文較為特殊,如第178條描述鑒別結(jié)脈和代脈及其預后,筆者抽取“脈按之來緩,時一止復來者”為“辨證”知識元,再提取“按之來緩”“時一止復來”兩個“證候表現(xiàn)”語義。總而言之,《傷寒論》的脈診復雜多變,需要根據(jù)具體條文內(nèi)容來標引脈診內(nèi)容。
3.3.3 知識元多重屬性“病脈證并治”標引模板內(nèi)不同屬性“知識元”分界模糊,使得知識體內(nèi)相同原文可選用多個知識元按鈕進行標引,如“不可發(fā)汗”“不可下”“不可攻”等既可標為“宜忌”,又可標為“治則(法)”,筆者認為兩種知識元均須標出,以提高檢索準確率。此外,“病因”與“誤治”知識元亦可屬性重疊,根據(jù)出現(xiàn)于知識體主體內(nèi)容先后時機的不同,抽取為“病因”或“誤治”知識元。如第34條葛根黃芩黃連湯證原文中的“太陽病,桂枝證,醫(yī)反下之”,既是導致葛根黃芩黃連湯的病因,又是桂枝湯證的誤治,此處應當標引為“病因”知識元。
3.3.4 語義提取規(guī)范知識元提取語義應簡而不失其意,全而不失其真,尊重古籍原文及本意?!秱摗酚浭隽瞬煌课缓统潭鹊摹昂钩觥弊C侯表現(xiàn),如第8條“額上汗出”、136條“頭微汗出”、191條“手足濈然汗出”,須提取原文為“證候表現(xiàn)”語義成分即可,但第20條“遂漏不止”則應提取“漏汗”為語義成分。仲景描述癥狀多次使用連詞“而”,前后有因果關系,應整體提取。如149條“心下滿而硬痛”,應提取為“心下滿而硬痛”,不可提取為“心下滿”和“心下硬痛”;又如第355條“心下滿而煩”,應提取為“心下滿而煩”,不可提取為“心下滿”和“心煩”。由此可知,標引時要堅持尊重古籍原文和理解條文語境。
3.3.5 語義關聯(lián)上文已述兩個證候表現(xiàn)有共同之處時可用省文,兩個病證之間亦是如此,但進行語義關聯(lián)時不得省略,如第386條“霍亂,頭痛發(fā)熱,身疼痛,熱多欲飲水者,五苓散主之;寒多不用水者,理中丸主之”。此條知識體講述了兩個獨立的霍亂病證治過程,故應創(chuàng)建兩個“辨治”語義關聯(lián),“霍亂”“頭痛”“發(fā)熱”和“身疼痛”四個語義“證候表現(xiàn)”應分別關聯(lián)其中:第一,霍亂(病證)<->寒多;不用水(病因病機)<->頭痛;發(fā)熱;身疼痛;(證候表現(xiàn))<->理中丸(方劑);第二,霍亂(病證)<->熱多;不用水(病因病機)<->頭痛;發(fā)熱;身疼痛(證候表現(xiàn))<->五苓散(方劑)。
秉承尊重古籍原文和理解條文語境的基本標引原則,基于“病脈證并治”知識元理論選用古籍標引系統(tǒng)“病脈證并治”模板進行線上自由標引《傷寒論》,呈現(xiàn)原文實踐標引,注重語義提取簡而不失其意、全而不失其真,并就標引過程中遇到的疑難點進行探討、提供解決思路,不斷完善中醫(yī)古籍“病脈證并治”知識元標引系統(tǒng),為后續(xù)600種中醫(yī)古籍標引提供示范。