王 健,任劍鋒,劉竺華,陳國寧
(1.山西中醫(yī)學(xué)院,山西太原030024; 2.山西中醫(yī)學(xué)院附屬醫(yī)院,山西太原030024)
名老中醫(yī)脾胃系統(tǒng)常見病醫(yī)案數(shù)據(jù)挖掘技術(shù)的研究
Study on date mining techniques of common medical cases about distinguished TCM doctor′s experience in spleen and stomach system
王 健1,任劍鋒1,劉竺華2,陳國寧1
(1.山西中醫(yī)學(xué)院,山西太原030024; 2.山西中醫(yī)學(xué)院附屬醫(yī)院,山西太原030024)
目的:以中醫(yī)臨床診療信息采集系統(tǒng)為技術(shù)平臺,獲取名老中醫(yī)治療脾胃系統(tǒng)常見病臨床診療數(shù)據(jù),以數(shù)據(jù)挖掘分析平臺為工具,構(gòu)建名老中醫(yī)經(jīng)驗(yàn)傳承研究的方法學(xué)。方法:以名老中醫(yī)脾胃病臨床病案為原始資料,運(yùn)用結(jié)構(gòu)化臨床診療信息采集系統(tǒng),全面、動態(tài)地采集臨床信息,人機(jī)結(jié)合,以人為主,總結(jié)名老中醫(yī)藥專家治療脾胃系統(tǒng)常見病的臨床診療經(jīng)驗(yàn)。結(jié)果:采集127位名老中醫(yī)、1 457例患者的臨床診療數(shù)據(jù),建立結(jié)構(gòu)化名老中醫(yī)脾胃病病例數(shù)據(jù)倉庫,形成了3個病種名老中醫(yī)專家經(jīng)驗(yàn)總結(jié)報告。結(jié)論:確定了名老中醫(yī)經(jīng)驗(yàn)傳承研究的方法,即利用結(jié)構(gòu)化臨床診療信息采集系統(tǒng)對臨床病歷數(shù)據(jù)化,利用數(shù)據(jù)挖掘分析平臺進(jìn)行分析挖掘,形成知識庫,在臨床上進(jìn)行應(yīng)用驗(yàn)證,將證明有效的經(jīng)驗(yàn)形成治療方案及治療理論來指導(dǎo)臨床,并進(jìn)一步在臨床上推廣。
名老中醫(yī);醫(yī)案;數(shù)據(jù)挖掘;經(jīng)驗(yàn)傳承;方法學(xué)
本項(xiàng)目以三種脾胃系統(tǒng)常見疾?。ㄎ竿?、泄瀉、腹痛)作為對象進(jìn)行研究,建立脾胃病醫(yī)案數(shù)據(jù)庫,運(yùn)用數(shù)據(jù)挖掘技術(shù)對醫(yī)案數(shù)據(jù)進(jìn)行處理分析,挖掘其內(nèi)涵,探索名老中醫(yī)臨證規(guī)律。期望本項(xiàng)目的研究能為數(shù)據(jù)挖掘技術(shù)在中醫(yī)藥信息領(lǐng)域的應(yīng)用提供方法學(xué)參考,并對名老中醫(yī)臨床經(jīng)驗(yàn)的繼承起到積極的推動作用。
1.1 數(shù)據(jù)采集
為了獲得可靠的結(jié)果,對所收錄醫(yī)家、時間、內(nèi)容等進(jìn)行了嚴(yán)格控制。
1.1.1 醫(yī)家 為了保證數(shù)據(jù)質(zhì)量,醫(yī)案全部選自經(jīng)驗(yàn)豐富的中醫(yī)專家醫(yī)案,醫(yī)家的出生年代限制在20世紀(jì)30年代。為了避免醫(yī)家醫(yī)案數(shù)量選擇的不均衡導(dǎo)致挖掘結(jié)果的偏差,數(shù)據(jù)庫中單個醫(yī)家的醫(yī)案控制在10例以內(nèi)。
1.1.2 時間 全部為現(xiàn)代醫(yī)案,所選醫(yī)案來自中國知網(wǎng)公開發(fā)表的期刊文獻(xiàn),發(fā)表時間為1982年-2012年。
1.1.3 內(nèi)容 由于本課題旨在對醫(yī)案中的?。Y-證-方-藥-效等方面進(jìn)行數(shù)據(jù)挖掘[1],收集的醫(yī)案必須包括以上6項(xiàng)內(nèi)容。病案遵循中醫(yī)傳統(tǒng)辨證論治的模式,癥狀除主癥之外,必須有兩個以上的次要癥狀。證型必須含有病性和病位兩部分,所選醫(yī)案全部是單純中草藥內(nèi)服治療。經(jīng)過篩選,本課題所采集醫(yī)案總數(shù)為1 457例,其中胃痛536例、泄瀉504例、腹痛417例,涉及醫(yī)家127位。
可以看出,隨機(jī)森林算法的分類性能依然優(yōu)于樸素貝葉斯算法,無論準(zhǔn)確率(ACC)還是召回率(recall)都接近95%,精確率(pre)也接近97%,說明利用敏感API作為鑒別特征,基于隨機(jī)森林分類算法能達(dá)到很好的分類效果。
1.2 建立結(jié)構(gòu)化數(shù)據(jù)庫
本課題利用中國中醫(yī)科學(xué)院建立的“個體化中醫(yī)臨床診療信息采集系統(tǒng)”為技術(shù)平臺,建立中醫(yī)脾胃系統(tǒng)3個常見?。ㄎ竿?、泄瀉、腹痛)的多維關(guān)系數(shù)據(jù)庫。
1.2.1 數(shù)據(jù)采集模板的制作 按照“數(shù)據(jù)的結(jié)構(gòu)表格”格式和內(nèi)容建立模板,調(diào)查表中的各項(xiàng)內(nèi)容在錄入時均可自行選擇,包括病史采集、中藥處方、中西醫(yī)診斷、治則治法等界面。
1.2.2 數(shù)據(jù)的錄入和質(zhì)量保障 由經(jīng)過培訓(xùn)的專業(yè)人員錄入病歷,課題組質(zhì)控人員進(jìn)行審核,保證病案的臨床信息全部結(jié)構(gòu)化,如:主癥、舌脈、辨證要點(diǎn)、中醫(yī)診斷(包括中醫(yī)疾病診斷和中醫(yī)證候診斷)、治法、主方、藥物、劑量[2]。數(shù)據(jù)錄入完成后,形成數(shù)據(jù)庫,即可進(jìn)行數(shù)據(jù)的分析挖掘。
1.3 數(shù)據(jù)預(yù)處理
將數(shù)據(jù)導(dǎo)入數(shù)據(jù)倉庫前,需進(jìn)行數(shù)據(jù)的預(yù)處理。由于數(shù)據(jù)來源于多中心,對于中醫(yī)病名、中醫(yī)證候、治法等描述上存在表述上的差異,故需對上述數(shù)據(jù)采用人機(jī)結(jié)合的方式進(jìn)行數(shù)據(jù)預(yù)處理。預(yù)處理主要采用“人機(jī)結(jié)合”的方式進(jìn)行,利用數(shù)據(jù)抽提轉(zhuǎn)化加載工具(ETL)完成數(shù)據(jù)的規(guī)范化整理,將錄入的欠規(guī)范的信息轉(zhuǎn)化為規(guī)范的結(jié)構(gòu)化信息,方可進(jìn)行數(shù)據(jù)挖掘。
對于中醫(yī)病名、中醫(yī)證候、治法的整理,按照國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)執(zhí)行,如專業(yè)術(shù)語可參照《中醫(yī)臨床診療術(shù)語·疾病部分》(GB/T16751.1-1997)、《中醫(yī)臨床診療術(shù)語·證候部分》(GB/T16751.2-1997)《中醫(yī)臨床診療術(shù)語·治法部分》(GB/T16751.3-1997)[3]、《中國中醫(yī)藥主題詞表》[4]進(jìn)行規(guī)范。遇到復(fù)合證型或涉及兩個或多臟腑的,盡量予以拆分,如氣滯血瘀,分成“氣滯”“血瘀”;治法分割成以最小術(shù)語單元進(jìn)行,如行氣止痛,分成“行氣”“止痛”。
1.4 數(shù)據(jù)挖掘方法
本課題利用中國中醫(yī)科學(xué)院“中醫(yī)藥防治重大疾病臨床個體化診療評價體系的研究”建立的“中醫(yī)臨床多維關(guān)系查詢系統(tǒng)”來完成胃痛、泄瀉、腹痛3個病種的“?。Y-證-方-藥-效”關(guān)系分析,聯(lián)合應(yīng)用WEKA,Business Objects等數(shù)據(jù)挖掘方法。治法之間、藥物之間的關(guān)系運(yùn)用復(fù)雜網(wǎng)絡(luò)的無尺度網(wǎng)絡(luò)(Scale-free network)方法進(jìn)行分析[5]。
1.5 數(shù)據(jù)分析
經(jīng)過數(shù)據(jù)錄入、審核、預(yù)處理和整理后,形成用于數(shù)據(jù)分析的數(shù)據(jù)倉庫(datawarehouse),即可實(shí)現(xiàn)數(shù)據(jù)分析[6]。
1.5.1 病-證關(guān)系分析 根據(jù)每一種疾病的癥狀、體征、理化檢查及其權(quán)重,癥狀指標(biāo)對證候診斷結(jié)果的相關(guān)度、貢獻(xiàn)度,判別各類證候的核心癥狀群,即“病-證”關(guān)系。
1.5.2 分析“方-證”“方-病”及“藥-癥”的關(guān)系 通過對“方-證”“方-病”及“藥-癥”內(nèi)涵的相關(guān)性分析,體會老中醫(yī)對于同一種疾病常有自己不同的診療思路和用藥特點(diǎn),發(fā)現(xiàn)臨床適應(yīng)病證及相應(yīng)的方證相關(guān)信息。
1.5.3 對常用治法及其核心用藥進(jìn)行研究 采用無尺度網(wǎng)絡(luò)分析方法,根據(jù)治法出現(xiàn)的頻次及該治法與藥物相互聯(lián)系的關(guān)聯(lián)度,分析上述3種疾病的臨床常用治法。
以泄瀉為例進(jìn)行闡述。
2.1 常見證候分布
對504例泄瀉患者數(shù)據(jù)分析,常見證候?yàn)槠⑻摑褡琛⑵⒛I陽虛、肝脾不和、脾胃虛弱、脾胃濕熱、中氣下陷、脾胃虛寒、脾胃陰虛、氣滯血瘀等證候。
2.2 常用治法分析
治療泄瀉的治法依次為健脾化濕、溫腎健脾、抑肝扶脾、健脾益氣、清熱化濕、健脾理氣、固澀止瀉、溫中健脾、補(bǔ)中益氣、升清降濁、消食導(dǎo)滯、益胃養(yǎng)陰、活血化瘀等。
2.3 常用中藥分布
常用中藥有白術(shù)、甘草、茯苓、黨參、陳皮、木香、白芍、山藥、黃連、砂仁、薏苡仁、山楂、神曲、麥芽、炮姜、防風(fēng)、訶子、黃芪、扁豆、蒼術(shù)、干姜、升麻、枳殼、桔梗等。
2.4 主要治法及藥物的無尺度網(wǎng)絡(luò)圖分析
結(jié)果見圖1、圖2。
圖1 泄瀉常用治法無尺度網(wǎng)絡(luò)圖
圖2 泄瀉常用藥物無尺度網(wǎng)絡(luò)圖
從圖1可以看出,健脾與祛濕出現(xiàn)的頻度為98和94,理氣出現(xiàn)的頻度為90。
從圖2可以看出,504例泄瀉患者以炒白術(shù)、黨參、薏苡仁、炒白芍、防風(fēng)、太子參等藥物為核心藥物,與臨床實(shí)際用藥基本符合。
本研究是以名老中醫(yī)的病案為基礎(chǔ),利用結(jié)構(gòu)化臨床診療信息采集系統(tǒng)對臨床病歷數(shù)據(jù)化,利用數(shù)據(jù)挖掘分析平臺進(jìn)行分析挖掘,建立脾胃系統(tǒng)常見病臨床信息數(shù)據(jù)庫,做到了真實(shí)再現(xiàn)老中醫(yī)治療脾胃系統(tǒng)常見病的學(xué)術(shù)思想和臨床經(jīng)驗(yàn)。結(jié)合WEKA、Business Objects、復(fù)雜網(wǎng)絡(luò)的無尺度網(wǎng)絡(luò)方法等數(shù)據(jù)處理方法,將傳統(tǒng)中醫(yī)臨床實(shí)踐與先進(jìn)的方法學(xué)有機(jī)地結(jié)合,遵循“人機(jī)結(jié)合”的觀點(diǎn),多學(xué)科交融,從多角度、多層次展現(xiàn)老中醫(yī)治療脾胃系統(tǒng)常見病的治法及用藥規(guī)律[1]。由于該方法的運(yùn)用是與中醫(yī)學(xué)自身的研究特點(diǎn)和規(guī)律相結(jié)合的,故研究的結(jié)果能與傳統(tǒng)的觀點(diǎn)相吻合,以期進(jìn)一步在臨床、科研上推廣應(yīng)用。
本課題以脾胃系統(tǒng)3個常見疾病為例,運(yùn)用數(shù)據(jù)挖掘和數(shù)理統(tǒng)計分析相結(jié)合進(jìn)行研究,為尋求老中醫(yī)經(jīng)驗(yàn)傳承方法提供了經(jīng)驗(yàn)。但同時也感到由于技術(shù)和方法的限制,如隱含知識發(fā)現(xiàn)不夠,療效評價數(shù)據(jù)信息不夠等。因此需要在該方法學(xué)基礎(chǔ)上進(jìn)一步優(yōu)化采集內(nèi)容,圍繞與研究密切相關(guān)的信息深入研究,開展后續(xù)驗(yàn)證性研究[6]。
[1]張潤順,王映輝,姚乃禮,等.名老中醫(yī)電子病歷中病史動態(tài)結(jié)構(gòu)化數(shù)據(jù)錄入規(guī)范[J].中國中醫(yī)藥信息雜志,2007,14(2):100-101.
[2]張潤順,王映輝,周雪忠,等.名老中醫(yī)經(jīng)驗(yàn)要素研究及智能挖掘平臺功能設(shè)計[J].世界科學(xué)技術(shù):中醫(yī)藥現(xiàn)代化,2008,10(1):46-52,63.
[3]王映輝,姜在湯,閏英杰,等.基于信息和數(shù)據(jù)挖掘技術(shù)的名老中醫(yī)臨床診療經(jīng)驗(yàn)研究思路[J].世界科學(xué)技術(shù):中醫(yī)藥現(xiàn)代化,2005,7(1):98-105.
[4]吳蘭成.中國中醫(yī)藥主題詞表[M].北京:中醫(yī)古籍出版社,1996.
[5]王映輝,周雪忠,張潤順,等.利用復(fù)雜網(wǎng)絡(luò)與點(diǎn)式互信息法分析挖掘名老中醫(yī)用藥經(jīng)驗(yàn)研究[J].數(shù)據(jù)庫技術(shù)與應(yīng)用,2011,6(4):76-80.
[6]周霞繼,王映輝,劉保延,等.基于臨床病歷數(shù)據(jù)化的名老中醫(yī)經(jīng)驗(yàn)傳承方法學(xué)研究[J].中國中醫(yī)藥圖書情報雜志,2014,38(4):4-9.
(編輯:翟春濤)
R249
A
1671-0258(2015)01-0037-03
山西省科技攻關(guān)項(xiàng)目(20120313026-1)
王健,副教授,副主任醫(yī)師,醫(yī)學(xué)博士,碩士研究生導(dǎo)師,E-mail:syl7899@163.com