陳潮金, 饒靜怡, 葉欣妍, 余文潔, 段 博, 李 璠, 楊基榮, 黑子清
1.中山大學附屬第三醫(yī)院 麻醉科,廣東 廣州 510630;2.中山大學 醫(yī)學院,廣東 深圳 518107
急性腎損傷(acute kidney injury,AKI)是術后常見并發(fā)癥之一[1],其發(fā)生率隨著年齡的增長逐漸增加,年齡>65歲的患者發(fā)生率達10.5%[2]。AKI進展迅速,發(fā)展為終末期腎病患者總病死率可達40%~70%[3]。隨著年齡增加,腎結構及功能發(fā)生退行性變,儲備功能下降;對圍術期腎損傷因素的敏感性增加,極易發(fā)生術后AKI并向慢性腎病轉化,影響遠期預后[4]。早期識別和干預術后AKI高?;颊吣艽龠M老年患者的圍術期安全及快速康復。然而,如何準確預測術后AKI,仍然是老年圍術期器官功能保護領域的主要難點。開發(fā)操作簡單、易于推廣的術后AKI預測模型,對于推動圍術期老年脆弱腎功能保護具有重要的臨床意義和迫切的臨床需求。
隨著大數據、人工智能等技術在醫(yī)學領域的廣泛應用,機器學習(machine learning,ML)技術已用于多個??剖中g術后AKI的風險因素分析和預測模型構建,包括:全膝關節(jié)置換術[5],腎癌患者腎切除術[6],成人肝移植術[7],心臟手術[8]和主動脈弓置換術[9]等。ML算法建立在對大量數據內在聯(lián)系的探索之上,通過訓練集建立預測模型,并利用測試集進行驗證,充分保證預測模型的有效性。然而,由于ML模型內部機制難以理解,ML的黑箱算法無法在臨床上得到有效的利用[10]。由Lundberg等[11]開發(fā)的SHapley Additive exPlanations(SHAP)方法是一種基于游戲的評估貢獻程度的方法,其中,個體特征在預測任務中充當參與者,SHAP值有助于在特征之間公平地分配預測性能[12]。這種方法使ML的黑箱算法在總體及單個樣本層面上均能夠得到解釋。既往研究建立的AKI預測模型缺少對老年患者術后AKI的獨立預測[13-14],且關于SHAP方法對相關AKI預測模型進行解釋的報道較少見。本研究將立足于術后AKI高發(fā)的老年人群,基于可解釋的ML技術開發(fā)老年患者行全身麻醉非心臟術后AKI預測模型,為圍術期決策提供理論支持?,F(xiàn)報道如下。
1.1 研究對象 回顧性分析自2015年10月至2021年10月在中山大學附屬第三醫(yī)院擇期行全身麻醉非心臟手術、年齡≥65歲的9 512例患者的臨床資料,根據排除標準,最終納入5 780例患者為研究對象。排除標準:(1)腎切除病史;(2)腎移植術后;(3)先天性單腎;(4)終末期腎病需行連續(xù)性腎替代治療;(5)術后血清肌酐值缺失;(6)急診手術;(7)美國麻醉醫(yī)師協(xié)會(American society of anesthesiologists,ASA)分級Ⅳ級及以上;(8)術前7 d造影劑暴露。通過我院圍術期專病數據庫收集患者術前、術中及術后的臨床資料,包括人口統(tǒng)計學數據、術前指標、術中資料、預后數據等。本研究經醫(yī)院倫理委員會批準。
1.2 終點事件 終點事件為術后7 d內發(fā)生AKI。根據改善全球腎病預后組織標準[15],采用血清肌酐定義:血清肌酐在術后48 h內絕對值增加>26.4 μmol/L,或7 d內增加達1.5倍基礎肌酐值。
1.3 數據收集 共選擇43個變量納入分析。其中,術前資料包括:(1)人口統(tǒng)計學特征:性別、年齡、體質量、身高;(2)術前指標:抽煙、糖尿病、外周血管疾病、腦血管疾病、高血壓、慢性阻塞性肺疾病、近期心肌梗死(術前1個月內)、腦卒中病史、既往和/或近期心臟手術、近期造影劑暴露(術前7 d內)、紐約心臟協(xié)會心功能分級、術前最后1次血紅蛋白濃度、血清白蛋白、尿酸水平、血小板計數、血鈣濃度、血鉀濃度、血鈉濃度、血糖濃度、谷草轉氨酶、谷丙轉氨酶、血清肌酐、尿素氮、高密度脂蛋白、低密度脂蛋白水平,以及術前口服藥物使用情況等。術中資料包括:手術時間、術中低血壓、血管活性藥物使用情況、利尿劑使用情況、血制品輸注量、輸注液體類型、液體量、抗生素使用情況等。預后資料包括實際住院時間、總住院費用和住院期間心跳驟停發(fā)生情況。其中,術中低血壓定義為平均血壓(mean blood pressure,MBP)<60 mmHg(1 mmHg=0.133 kPa)或MBP下降>20%基礎值,且持續(xù)時間>30 min[16]。
對于缺失比例<10%的指標,使用鏈方程算法計算模式變量和連續(xù)變量[17]。為了最小化特征高維帶來的潛在過度影響,只選擇在單變量檢驗中具有統(tǒng)計學意義(P<0.05)的特征,進行最小的絕對收縮,并利用LASSO回歸方法進行特征選取。最后,利用套索回歸后的非零坐標特征建立預測模型。
1.4 模型構建與評估 研究隊列按照8∶2的比例隨機分為訓練集和測試集。應用LASSO回歸篩選訓練集中有意義的變量納入模型構建。本研究采用決策樹(decision tree,DT)、隨機森林(random forest,RF)、邏輯回歸(logistic regression,LR)、高斯樸素貝葉斯(gaussian naive bayes,GNB)、自適應增強(adaptive discriminator augmentation,ADA)、梯度提升機(gradient boosting machine,GBM)、輕度梯度提升機(light gradient boosting machine,LGBM)和多層神經網絡模型(multilayer perceptron neural network,MLP)共8種機器學習算法進行建模。計算受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC)、敏感度、特異度、準確性及F1分數進行模型評估,選出最優(yōu)預測模型。為進一步驗證模型的有效性,本研究選取了Wu等[13]構建的預測模型在同一數據庫中進行比較。
2.1 基線特征比較 5 780例患者中,789例被診斷為術后AKI,發(fā)生率為13.65%(789/5 780),設為AKI組;另4 991例設為非AKI組。一般資料方面,與非AKI組比較,AKI組的患者年齡更大,男性患者更多,身高更高,體質量更大,ASA分級Ⅲ級比例更高,且血紅蛋白濃度、血小板計數、血鈣濃度、血鈉濃度、血清白蛋白、高密度脂蛋白、低密度脂蛋白水平更低,血糖濃度、谷草轉氨酶、血清肌酐、尿素氮更高,兩組比較,差異有統(tǒng)計學意義(P<0.05)。見表1。麻醉手術因素方面,與非AKI組比較,AKI組患者手術時間更長,術中低血壓事件發(fā)生率更高,術中膠體補液量、紅細胞、白蛋白、血漿、冷沉淀和5%碳酸氫鈉量輸注量更多,術中多巴胺、多巴酚丁胺、去甲腎上腺素、腎上腺素、間羥胺等血管活性藥物使用更多,甘露醇使用更多,抗病毒藥物、抗真菌藥物、氨基糖甙類抗生素使用更多,兩組比較,差異均有統(tǒng)計學意義(P<0.05)。見表2。
表1 AKI患者與非AKI患者的一般資料比較/M(Q1,Q3)
表2 AKI患者與非AKI患者術中資料比較/例(百分率/%)
2.2 預后情況比較 患者預后情況中,AKI組患者的實際住院天數長于非AKI組,總住院費用及住院期間心跳驟停發(fā)生率均高于非AKI組,差異均有統(tǒng)計學意義(P<0.05)。見表3。
表3 AKI患者與非AKI患者術后預后比較/M(Q1,Q3)
2.3 特征變量篩選及模型構建 單因素分析后共有33個顯著變量,LASSO回歸分析選擇了12個特征,包括手術時長、白蛋白、血清肌酐、鈉離子、血糖、年齡、膠體、體質量、血紅蛋白、術中輸注紅細胞、谷草轉氨酶和血小板?;谏鲜?2個特征構建8個ML模型。其中,GBM模型具有最大的AUC值0.77,準確性為0.71,敏感度為0.67,特異度為0.71。因此,本研究最終選擇了GBM模型進行下一步的分析和應用。見表4、圖1。
圖1 所有機器學習模型ROC曲線圖
表4 所有機器學習模型預測效能/均值(95%可信區(qū)間)
2.4 預測效能橫向比較 將GBM模型與Wu等[13]
開發(fā)的AKI預測模型進行比較,結果顯示,對照模型預測老年術后AKI的AUC為0.70,通過delong-test發(fā)現(xiàn)兩者存在統(tǒng)計學差異(P<0.001),表明本研究構建的GBM模型的預測效能更優(yōu)。見表5、圖2。
圖2 GBM模型與Nomogram模型ROC曲線圖
表5 GBM模型與Nomogram模型的預測性能比較/均值(95%可信區(qū)間)
2.5 最優(yōu)模型解釋與可視化 SHAP結果顯示,貢獻度前5的特征分別為手術時長、術前白蛋白、血清肌酐、血糖及血清鈉離子濃度(圖3)。較長的手術時長、較低的血清白蛋白水平、較高的血清肌酐、較高的血糖和較低的血鈉濃度與較高的SHAP值相關,術后AKI的發(fā)生率更高(圖4)。
圖3 全局SHAP解釋特征重要性
圖4 SHAP特征重要性
AKI在術后達到超過10%的發(fā)病率,為各年齡段患者的術后恢復造成了極大的困擾,其中,老年患者較多,約較其他年齡段的患者高出3%左右。術后AKI在所有手術中發(fā)病率大約為11%,而其中非心臟手術占到了7.5%,說明非心臟手術后AKI的發(fā)生率占所有手術的比例較高。因此,構建針對非心臟手術后的老年患者術后AKI的預測模型具有較高的臨床價值。本研究納入的5 780例接受全身麻醉非心臟手術的老年患者中,AKI的發(fā)生率為13.65%(789/5 780),且合并術后AKI可導致患者心跳驟停發(fā)生率更高、住院時間更長、住院總費用更高。本研究通過LASSO回歸篩選了12個廣泛使用的臨床特征,包括手術時長、白蛋白、血清肌酐、鈉離子、血糖、年齡、膠體、體質量、血紅蛋白、術中輸注紅細胞、谷草轉氨酶和血小板,進而構建了一種基于GBM算法的可解釋的機器學習模型,在預測老年患者非心臟手術后AKI的發(fā)生上達到了中等準確度(AUC=0.77),且預測效能優(yōu)于其他研究報道的AKI預測模型,可為圍術期決策提供理論支持。
SHAP值表明,在非心臟手術后老年患者發(fā)生術后AKI的12個特征中,排在前5位的分別是手術時長、血清白蛋白、血清肌酐、血糖濃度、血鈉濃度。其中,手術時長是最重要的特征,這與既往研究[18]結果不一致。其不常見于預測模型的構建,可能對后續(xù)的研究有啟發(fā)作用。隨著手術時長的增加,患者術中麻醉藥物用量及手術創(chuàng)傷程度增加,術后AKI的風險也隨之增加。第二大影響因素為術前血清白蛋白濃度。當白蛋白水平過低時,機體免疫力降低,術后容易發(fā)生感染等并發(fā)癥,故低白蛋白血癥是術后AKI的獨立危險因素。排在第3位的是術前血清肌酐水平。在本研究中排除了術前患有腎疾病的患者,但術前肌酐較高水平的患者可能存在潛在的腎損傷,因此,更容易發(fā)生術后AKI。排在第4位的是術前高血糖。術前高血糖說明患者腎有著更大的葡萄糖重吸收負擔,因此,術前長期高血糖患者術后AKI的風險也較高。排在第5位的影響因素為血鈉濃度,低鈉血癥通常是由于鈉離子丟失過多,常見于腎皮質不全、糖尿病等疾病,也預示著該患者存在潛在腎損傷,圍術期易誘發(fā)AKI。
本研究圍繞高齡患者全身麻醉非心臟手術后AKI的預測,構建了8個機器學習模型,并通過與其他團隊所開發(fā)預測模型的橫向比較,進一步體現(xiàn)出所采用模型的優(yōu)越性。另外,傳統(tǒng)機器學習可以處理海量、高維的復雜數據,但無法獲知預測結果與各個特征變量之間的量效關系,本研究借助SHapley法著重解決了這個問題,通過把每例患者的預測過程可視化來使醫(yī)師和患者更清楚地了解主要的危險因素,進而實施個性化的二級預防措施。
本研究存在一定局限性。首先,本研究對象大多來自中山大學附屬第三醫(yī)院,作為廣州市內三甲醫(yī)院其收治疑難重癥患者較多,住院期間AKI發(fā)生率能否代表華南地區(qū)乃至全國綜合醫(yī)院的平均水平需進一步驗證。其次,在本研究的模型中,可以看出AKI可由多種危險因素導致致病率的升高,不同的地域、患者的家庭生活水平等都可能對結果產生一定的影響,因此,本研究結果仍需要引進外部數據進行驗證。
綜上所述,GBM模型預測非心臟手術老年患者術后AKI發(fā)生風險的效能最優(yōu),可為圍術期麻醉決策提供參考。