汪濤 朋湯義 盧思陽
關(guān)鍵詞:共?。还膊√攸c(diǎn);頻繁項(xiàng)集;數(shù)據(jù)挖掘
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2023)03-0066-03
共?。╩ultimorbidity) 是指患者在同一時間同時或相繼患有2 種或2 種以上疾病,即一個患者符合一種以上綜合征的診斷標(biāo)準(zhǔn)而有多個診斷,這些診斷涉及患者的全部癥狀、體征和病程[1]。共病已成為的公共衛(wèi)生問題,未來幾十年醫(yī)療行業(yè)將要面臨的最大挑戰(zhàn)。共病之間既可以相互關(guān)聯(lián),相互伴隨,也可以是不相關(guān)的平行關(guān)系[2],隨著人均預(yù)期壽命的持續(xù)延長,如何正確地認(rèn)識和控制共病是目前健康管理的關(guān)鍵問題。通過對共病規(guī)律探究,可以全面了解患者的共病特點(diǎn),有利于制定合理的臨床診療方案,同時可以為此類人群疾病管理提供參考。
1 資料與方法
1.1 資料來源
選取2020年1月1日-2020年12月31日在某院住院病案首頁疾病診斷數(shù)>1且年齡≥60的病例為研究對象,收集病案首頁主要診斷、主要診斷編碼、其他診斷、其他診斷編碼、年齡、性別等數(shù)據(jù)。其余予以剔除,共18811 例。其中共病患者人數(shù)為17528,占比93.18%。
1.2 研究方法
診斷編碼按照國際疾病分類法第10版( ICD-10)標(biāo)化;年齡按照組距10進(jìn)行分組,增加“共病數(shù)量”字段。運(yùn)用SPSS的頻數(shù)分析、列聯(lián)表卡方檢驗(yàn)分析共病病種的分布及不同特征的差異性,運(yùn)用SPSS Mod?erler軟件關(guān)聯(lián)規(guī)則中Apriori算法,計(jì)算規(guī)則的支持度、置信度,從頻繁項(xiàng)集中發(fā)現(xiàn)疾病共存、伴隨的特點(diǎn)。
1.3 關(guān)聯(lián)規(guī)則算法中的數(shù)據(jù)準(zhǔn)備
規(guī)則需要達(dá)到一定支持度,根據(jù)病案首頁的診斷ICD10 的編碼依從屬性關(guān)系,細(xì)目都?xì)w類亞目,如S82.01(開發(fā)性髕骨骨折)取編碼為S82.0(髕骨骨折); 導(dǎo)出的病案首頁診斷的二維表經(jīng)過數(shù)據(jù)轉(zhuǎn)換為事務(wù)性表格,同一個病人為一個事務(wù)ID,所患疾病為屬性字段,符合關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘的數(shù)據(jù)要求。
2 結(jié)果
2.1 一般情況
2020年齡大于等于60,住院患者共18811例,共病患者數(shù)量為17528例,院患者的93.18%,整體年齡中位數(shù)年齡71 歲,平均值為72.35,標(biāo)準(zhǔn)差8.31;60歲~69 歲占比43.77%,數(shù)量為7672,70~79 歲占比35.67%,數(shù)量為6253,80~89 歲占比17.10% 數(shù)量2998,90歲以上占比3.45%數(shù)量605,呈現(xiàn)偏態(tài)分布。性別上,男性占比52.00%,數(shù)量9115,女性占比48.00% 數(shù)量8413。共病個數(shù)情況,2 至4 占比39.05%,5至7占比35.48%,8及以上占比25.47% 。
根據(jù)共病患者出院診斷,構(gòu)建共病前10病種的頻率分布表,順位最高的出院診斷包含2型糖尿病,頻數(shù)為3291個,頻率為16.31%,前十位頻率分布表。
2.2 不同特征人群共病差異分析
從男女作為分組條件,共病發(fā)生率別為92.78% 和93.61%,通過列聯(lián)表卡方檢驗(yàn),卡方值為5.088,P>0.01,檢驗(yàn)水準(zhǔn)為0.01,兩樣本差異無統(tǒng)計(jì)學(xué)意義,即認(rèn)為住院患者共病率在性別上無差異。
從年齡段作為分組條件,共計(jì)分成四段,發(fā)生率見下表,形成了多獨(dú)立的樣本R*C列聯(lián)表資料,通過多列聯(lián)表的卡方檢驗(yàn),卡方值為148.464,P<0.01,檢驗(yàn)水準(zhǔn)為0.01,兩樣本差異有統(tǒng)計(jì)學(xué)意義,即認(rèn)為住院患者共病率在年齡分組上有顯著差異,可以看出隨著年齡增加共病發(fā)生率增加。
2.3 共病患者疾病組合關(guān)聯(lián)規(guī)則分析
每個病人為一個事務(wù)或項(xiàng)集,同一病人一種患病為此事務(wù)的一個項(xiàng),T是一個項(xiàng)集也是一個事務(wù),不同的事務(wù)一起組成了事務(wù)集D,它構(gòu)成了關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的事務(wù)數(shù)據(jù)庫。A、B均為項(xiàng)集的子集且均不為空集,且A交B為空,支持度(support)為:
支持度是指項(xiàng)集出現(xiàn)的次數(shù)在集合總數(shù)中出現(xiàn)的概率,數(shù)值越大,該疾病組合出現(xiàn)的頻率越高;置信度是指后項(xiàng)出現(xiàn)的次數(shù)在包含前項(xiàng)的集合中的占比,數(shù)值越大,在前項(xiàng)所代表疾病出現(xiàn)的情況下后項(xiàng)所代表的疾病出現(xiàn)的概率更高,B伴隨A發(fā)生的情況頻率大。
采用SPSS MODEL 14.1中Apriori節(jié)點(diǎn)模型,對病案首頁疾病診斷事務(wù)型數(shù)據(jù)庫,進(jìn)行關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘,各頻繁項(xiàng)集結(jié)果如下:
患病2種及以上的,按照支持度排序?yàn)椋?/p>
患病2種及以上的,按照置信度排序?yàn)椋?/p>
3 討論
3.1 共病患者疾病發(fā)生的特點(diǎn)
老齡患者共病現(xiàn)象普遍存在,研究結(jié)果顯示共病患者占同期住院患者的93.18%,共病數(shù)量的描述統(tǒng)計(jì)平均值為5.34,標(biāo)準(zhǔn)差為2.10,大部分患者集中在5個左右,可見患者共病數(shù)量比較高。
在年齡方面,年齡與共病發(fā)生率有密切相關(guān)性,不同年齡段之間的差異有統(tǒng)計(jì)學(xué)意義,隨著患者的年齡增加,患者的共病發(fā)生率逐漸增大;同時不同性別共病住院患者的發(fā)生率并無顯著差異。
從共病患者病種的頻率分布進(jìn)行分析,發(fā)現(xiàn)前十位的從多到少依次為2型糖尿病、高血壓病3級(極高危)、腔隙性腦梗死、冠狀動脈粥樣硬化性心臟病、腦梗死、前列腺增生、腰椎間盤突出、甲狀腺結(jié)節(jié)、肝囊腫、脂肪肝??梢娦难苎h(huán)系統(tǒng)疾病、腦病都是排序靠前的。同時腰椎間盤突出也排名靠前,這與數(shù)據(jù)來源于中醫(yī)院有關(guān),此病是中醫(yī)治療的特色病種;甲狀腺結(jié)節(jié)出現(xiàn)在順位第8,此病是醫(yī)院的特色病種,該院超聲引導(dǎo)下甲狀腺結(jié)節(jié)的手術(shù)也全身處于領(lǐng)先位置。
3.2 共病患者的疾病共存、伴隨特點(diǎn)
由于頻繁項(xiàng)目集中包含的項(xiàng)目同時發(fā)生的可能性很高,因此可以從頻繁項(xiàng)目集中了解項(xiàng)目之間的關(guān)系[3],依據(jù)一定的支持度與置信度,可以計(jì)算出疾病ICD10的頻繁項(xiàng)集;從上述關(guān)聯(lián)規(guī)則支持度結(jié)果看,高血壓、糖尿病、腦梗死三類疾病同時發(fā)生的比率最高,其次是高血壓、糖尿病、冠心病,順位第三、四組合的是高血壓、腦梗死、冠心病。都是相關(guān)性較高心腦血管疾病,與相關(guān)研究中慢性非傳染性疾病是人健康的最大威脅,主要包括腦梗死、慢性缺血性心臟病、原發(fā)性高血壓[4]。
從置信度來看,具體的疾病集合置信度都較高的有(前項(xiàng):冠心??;后項(xiàng):心絞痛,其他類型)、(前項(xiàng):冠心?。缓箜?xiàng):心絞痛,其他類型、高血壓)、(前項(xiàng):高血壓;后項(xiàng):腎終末期疾病、糖尿?。?、(前項(xiàng):高血壓;后項(xiàng):腦梗死、冠心病、糖尿病)、(前項(xiàng):高血壓;后項(xiàng):腎終末期疾病、貧血)。老年冠心病患者一般都有心絞痛的發(fā)生;高血壓是冠心病發(fā)生、發(fā)展的獨(dú)立危險因素,有70%冠心病患者合并高血壓。高血壓會促使動脈硬化惡化,增加心血管事件發(fā)生風(fēng)險;而冠心病又會加重高血壓病情,兩種疾病相互促進(jìn),形成惡性循環(huán)[5-7]。有文獻(xiàn)報(bào)道高血壓患者血壓升高加速了動脈粥樣硬化的發(fā)展,從而使急性腦梗死的發(fā)生率明顯增加[8],目前公認(rèn)的急性腦梗死危險因素有年齡、吸煙、高血壓、糖尿病等。
通過共病特點(diǎn)分析,可以臨床醫(yī)師診斷與治療提供參考,同時為社會疾病預(yù)防提供指導(dǎo)。本研究也存在一定的局限性,標(biāo)本量主要來自某一醫(yī)院,尚未覆蓋一定的地域,待進(jìn)一步驗(yàn)證。