陳余興 王貴
(海南西部中心醫(yī)院,海南 儋州 571700 )
隨著老年人口在人口結(jié)構(gòu)中的比例不斷增加及醫(yī)療技術(shù)的進步,老年骨科行手術(shù)治療的患者也在不斷增多〔1,2〕。低蛋白血癥是骨科術(shù)后的常見并發(fā)癥,具體指血清總白蛋白低于60 g/ml或白蛋白低于35 g/ml〔3,4〕。低蛋白血癥也是影響免疫功能的重要原因,及早地糾正低蛋白血癥可降低并發(fā)癥的發(fā)生率,特別是高齡老人應尤其予以重視〔5〕。骨科手術(shù)往往創(chuàng)傷較大、術(shù)中出血多、手術(shù)時間長及需要復合麻醉,而高齡老年患者身體耐受能力差,更容易導致骨科術(shù)后并發(fā)癥發(fā)生〔6〕。因此,本研究針對高齡老年骨科患者術(shù)后低蛋白血癥為研究對象,用數(shù)據(jù)挖掘方法對高齡骨科手術(shù)患者的臨床資料進行回顧性分析,分析這類人群術(shù)后低蛋白血癥的風險因素,建立高齡骨科患者術(shù)后低蛋白血癥的風險預測模型,以期為高齡骨科患者術(shù)后低蛋白血癥的預防和治療提供依據(jù)。
1.1數(shù)據(jù)來源 數(shù)據(jù)來自海南省儋州中心醫(yī)院信息管理系統(tǒng),出院日期為2015年3月1日至2020年3月31日的80歲及以上高齡骨科患者住院病歷信息。提取內(nèi)容主要為5個部分,包括一般信息、診斷信息、檢驗結(jié)果、檢查結(jié)果、病例中明確記錄的術(shù)后并發(fā)癥。
1.2納入排除標準 納入標準:①因骨科疾病在海南省儋州中心醫(yī)院住院的患者;②患者年齡≥80歲;③行手術(shù)治療。排除標準:①臨床資料不全影響判斷者;②轉(zhuǎn)科患者。
1.3數(shù)據(jù)采集 根據(jù)海南省儋州中心醫(yī)院住院病人電子病歷首頁查詢系統(tǒng)查詢符合納入排除標準的病歷的病案號,制定名單列表,然后由醫(yī)院信息系統(tǒng)(HIS)中導出列表上病人的電子病歷,同時由HIS中導出患者的檢驗記錄,心電圖、B超、胸片、CT、磁共振成像(MRI)等檢查結(jié)果及部分病歷在病案室手工采集。將收集到的各項數(shù)據(jù)輸入Excel表,建立基礎(chǔ)數(shù)據(jù)庫。
1.4數(shù)據(jù)預處理 數(shù)據(jù)規(guī)約:對檢查檢驗指標的連續(xù)型特征統(tǒng)一單位,并按術(shù)前術(shù)后劃分,并取極值,離散型特征進行類別規(guī)范。時間由“小時、天、周、月、年”統(tǒng)一為“天”;紅細胞計數(shù)術(shù)前最小值(min)為3.16,紅細胞計數(shù)術(shù)前最大值(max)為3.83;血紅蛋白min為92,血紅蛋白max為113。麻醉名稱由“腰麻、神經(jīng)阻滯、局麻、腰硬聯(lián)合、硬膜外、臂叢、全麻、硬外、連硬外”整理歸為“椎管內(nèi)麻醉、腰從麻醉、局麻、頸叢麻醉、神經(jīng)阻滯、臂叢麻醉、全麻”7類。異常值和缺失值處理:首先,部分缺失值經(jīng)醫(yī)學專家確認后在原數(shù)據(jù)補全。無法補全者根據(jù)不同數(shù)據(jù)類型按照以下規(guī)定補全:①錄入導致的異常值修正或用缺失值替代;②連續(xù)變量由于不符合正態(tài)分布,偏度較大,用中位數(shù)插補;③離散變量用眾數(shù)插補相應的缺失值〔7〕。標準化:①連續(xù)特征采用z-score標準化方法轉(zhuǎn)換,經(jīng)轉(zhuǎn)換后的數(shù)據(jù)滿足均值為0標準差為1;②離散特征做one-hot變換,實現(xiàn)離散特征的標準化。
1.5術(shù)后低蛋白血癥的判定規(guī)則 ①根據(jù)病歷信息中病程記錄、會診記錄、出院記錄的診斷信息確定術(shù)后并發(fā)癥的低蛋白血癥。②根據(jù)術(shù)后的檢驗結(jié)果的最低值進行判定(術(shù)后血清總蛋白低于60 g/L或白蛋白低于35 g/L〔3〕,術(shù)前正常)。
2.1數(shù)據(jù)提取結(jié)果的一般信息 根據(jù)納入排除標準,共提取患者病案號498例,經(jīng)篩查發(fā)現(xiàn)數(shù)據(jù)中有重復出現(xiàn)的病案號20例,均為二次住院手術(shù),二次住院時間均超過半年,經(jīng)討論決定作為新的病歷來研究。因此原數(shù)據(jù)新增20例,共518例。數(shù)據(jù)嚴重缺失影響判斷病歷2例,最終剩余516例。提取出病歷特征共357種,剔除缺失比例大于30%的特征不予分析,剔除無法分析的特征(如:病案號,既往史等),共剩余128個特征。其中最早出院時間為2003年7月18日,最晚出院時間為2020年3月29日。患者年齡最大97歲,最小80歲,平均83.99歲,男性173例,女性343例。全部患者的術(shù)后低蛋白血癥發(fā)生率為36.6%(189例)。
2.2單因素分析結(jié)果 單因素分析將有統(tǒng)計學意義的特征作為下一步建模的特征。全部128個特征,有統(tǒng)計學意義的共63個連續(xù)型特征和3個離散型特征(椎管內(nèi)麻醉、致傷因素、是否使用中藥),見表1。
表1 單因素分析結(jié)果
續(xù)表1 單因素分析結(jié)果
2.3模型構(gòu)建結(jié)果 將年齡、傷后至入院時間、術(shù)中出血量、術(shù)中輸血量、術(shù)中輸液量、術(shù)后輸血量、術(shù)后引流量、血磷min、血磷max、凝血酶原時間INR min、凝血酶原時間max、纖維蛋白原定量max等多個因素納入多元預測模型。利用網(wǎng)格搜索(GridSearch)方法進行參數(shù)尋優(yōu),并使用k-折交叉驗證對模型評估。對比模型擬合及預測效果,選擇最佳模型作為最終的風險模型。研究中使用了決策樹(Decision Tree)、邏輯回歸(Logistic Regression)、隨機森林(Random Forest)、ExtraTreesClassifier、AdaBoost、GradientBoostDecisionTree、SVM等7種目前流行的機器學習模型。其中以隨機森林模型為最佳,訓練集的10折交叉驗證AUC值高達87.7%。按特征重要對模型特征排序,系數(shù)越大代表特征對模型的影響越大:白蛋白定量min(0.6)、椎管內(nèi)麻醉(0.5)、肌酸激酶同工酶min(0.5)、術(shù)后引流量(0.4)、術(shù)中出血量(0.4)、直接膽紅素max(0.4)、血清總蛋白max(0.4)、術(shù)后輸血量(0.3)、血清總蛋白min(0.3)、血鈉min(0.3)、總膽紅素min(0.3)、總膽紅素max(0.2)、肌酸激酶min(0.2)、高密度脂蛋白min(0.2),表明它們是老年骨科患者術(shù)后發(fā)生低蛋白血癥的獨立危險因素。
2.4模型驗證及ROC曲線 模型ROC曲線見圖1。
圖1 模型ROC曲線
通過對7種機器學習模型的對比,最終選定最佳模型為隨機森林,模型的ROC曲線為0.891 638,10折交叉驗證后的ROC曲線為0.790 397,通過結(jié)果可以看出模型有較好的預測能力。
在本研究中,通過對術(shù)后發(fā)生低蛋白血癥的高齡老年骨科手術(shù)患者臨床資料進行分析及建模,發(fā)現(xiàn)了20種可能導致患者術(shù)后發(fā)生低蛋白血癥的預測因素。本研究發(fā)現(xiàn)高齡老年骨科手術(shù)患者發(fā)生低蛋白血癥的發(fā)生率明顯高于李秋萍等〔8〕在363例65歲以上老年外科大手術(shù)患者研究中的15.2%,可能與其診斷標準定為白蛋白<25 g/L,而本研究的診斷標準為白蛋白<35 g/L有關(guān)。此外,本研究為80以上高齡老年患者,術(shù)前衰弱及營養(yǎng)狀況、生理儲備能力均不及65歲以上人群。沈妍交〔9〕通過對衰弱指數(shù)在老年髖部骨折圍術(shù)期風險評估的應用研究發(fā)現(xiàn),行手術(shù)治療的髖部骨折患者中,衰弱患者的術(shù)后低蛋白血癥發(fā)生率明顯高于非衰弱患者。所以年齡段的不同也是本研究術(shù)后低蛋白血癥發(fā)生率高的重要原因。但在本研究中并未發(fā)現(xiàn)年齡是80歲以上老年骨科手術(shù)的風險因素,可能與患者間年齡差距較小相關(guān)。本研究患者年齡主要集中于80~86歲,約占患者總數(shù)的78%,所以年齡對術(shù)后的影響不能較好體現(xiàn)。
3.1文獻報道的可能原因及機制 目前骨科術(shù)后低蛋白血癥的主要原因及機制主要有:①術(shù)后應激:術(shù)后應激造成機體處于一種分解激素高于合成激素的高代謝水平,進而引起蛋白質(zhì)大量消耗,導致低蛋白血癥,即內(nèi)分泌代謝反應〔10〕;②急性炎癥:急性炎癥時形成的內(nèi)皮間隙與大量炎性介質(zhì)所導致的微血管白蛋白滲漏相匹配,使內(nèi)皮細胞連接間隙開放,白蛋白無須依賴能量即可通過內(nèi)皮間隙,即炎癥反應,加速術(shù)后低蛋白血癥的發(fā)生〔11〕;③術(shù)中失血:白蛋白隨術(shù)中失血及術(shù)后胸腔積液的丟失而減少。本研究中術(shù)后引流量及術(shù)后輸血量同樣是手術(shù)造成患者血液流失的直接和間接指標,印證了手術(shù)失血是術(shù)后低蛋白血癥的風險因素;④術(shù)中及術(shù)后輸液:術(shù)中、術(shù)后因病情需要輸注大量液體而造成的稀釋性低蛋白血癥,與本研究結(jié)論一致。其中內(nèi)分泌反應所致的高分解代謝及炎癥反應引起的微血管白蛋白滲漏是術(shù)后低蛋白血癥發(fā)生的主要機制。⑤衰弱:衰弱的老年患者處于易損性增加、內(nèi)環(huán)境紊亂、營養(yǎng)不良導致基礎(chǔ)蛋白較低的特異性狀態(tài),是術(shù)后并發(fā)癥的獨立風險因素〔12,13〕。⑥術(shù)前白蛋白:術(shù)前白蛋白水平體現(xiàn)了患者的營養(yǎng)狀況及代謝能力,營養(yǎng)不良患者在應激狀態(tài)下增加蛋白的分解以保證機體能量的平衡〔14〕。所以術(shù)前蛋白水平較低者,術(shù)后更容易出現(xiàn)低蛋白血癥。術(shù)后血清白蛋白水平下降幅度與術(shù)前白蛋白水平呈明顯正相關(guān)。郭志金等〔15〕通過對200例患者進行回歸分析發(fā)現(xiàn),術(shù)前低蛋白患者術(shù)后低蛋白血癥的發(fā)生是正?;颊叩?6.163倍。本研究的最高風險因素為術(shù)前白蛋白定量min及血清白蛋白max,體現(xiàn)了患者術(shù)前白蛋白的最低狀態(tài)。
3.2本研究新發(fā)現(xiàn)的風險因素 本研究通過建模分析發(fā)現(xiàn)以下風險因素:①椎管內(nèi)麻醉:麻醉方式的不同,一定程度上反映了手術(shù)的難度與創(chuàng)傷的大小。椎管內(nèi)麻醉是骨科的常見麻醉方式,但與局麻、頸叢麻醉、臂叢等麻醉相比,所行手術(shù)創(chuàng)傷一般較大。此外,有研究ASA麻醉分級越高,表示病情越嚴重,風險越高〔16〕。同時,這也意味著術(shù)中出血量、輸液量、術(shù)后引流等相關(guān)風險因素的增加,使椎管內(nèi)麻醉成為高齡老年患者術(shù)后低蛋白血癥的風險因素。②肌酸激酶min:肌酸激酶主要存在于骨骼肌、心肌、平滑肌的細胞質(zhì)和線粒體中,是一個與細胞內(nèi)能量運轉(zhuǎn)、肌肉收縮、ATP再生有直接關(guān)系的重要激酶,肌酸激酶水平較高反映了患者的創(chuàng)傷情況。對于骨折的患者來說,骨折及其伴隨的軟組織損傷,是術(shù)前肌酸激酶水平高的主要原因〔17〕。此類患者與勞損退變性骨科手術(shù)患者相比較,術(shù)前身體經(jīng)受了初次打擊,大大增加了低蛋白血癥的常見風險因素。③總膽紅素及直接膽紅素:白蛋白作為游離膽紅素變成結(jié)合膽紅素的重要載體,直接參與膽紅素完成肝腸循環(huán)〔18〕。對于術(shù)前膽紅素水平較高的患者,筆者考慮是由于創(chuàng)傷骨折患者應激造成患者蛋白血合成功能下降,導致膽紅素代謝降低所致〔19〕。綜上所述,高齡老年骨科手術(shù)患者的術(shù)前白蛋白水平對患者術(shù)后的預后有十分重要的參考意義〔20〕。
3.3本研究的不足 本研究的局限在于病例來源于一所醫(yī)院,樣本量較小,還需樣本量更大的資料進行進一步論證。其次,在文本型數(shù)據(jù)提取與標準化過程中還存在一些問題,例如:術(shù)中出血量、傷后至入院時間等,在自然語言識別過程中難以完全通過自動語義識別方式完成數(shù)據(jù)標準化工作,尚需要專業(yè)人員通過人工識別方式進行質(zhì)量控制。