韓俊杰,武迪,陳志勝,肖揚(yáng),森干*
1.830017 新疆維吾爾自治區(qū)烏魯木齊市,新疆醫(yī)科大學(xué)醫(yī)學(xué)工程技術(shù)學(xué)院
2.830017 新疆維吾爾自治區(qū)烏魯木齊市,新疆醫(yī)科大學(xué)公共衛(wèi)生學(xué)院
3.835099 新疆維吾爾自治區(qū)伊犁哈薩克自治州伊寧市,伊犁州疾病預(yù)防控制中心
糖尿病腎?。╠iabetic nephropathy,DN)是2 型糖尿?。╠iabetes mellitus type 2,T2DM)患者重要的并發(fā)癥之一。根據(jù)國(guó)際糖尿病聯(lián)合會(huì)預(yù)測(cè),到2030 年世界糖尿病患病率將增至10.2%(約5.78 億人),到2045年將增至10.9%(約7 億人)[1],其中30%~40%的糖尿病患者可發(fā)展為DN[2]。由于DN 代謝紊亂較復(fù)雜,可能會(huì)造成患者腎臟損傷或者功能喪失[3],從而給患者的生活和經(jīng)濟(jì)帶來(lái)極大的困擾。因此,對(duì)DN 進(jìn)行早期篩查,對(duì)高?;颊叩姆乐尉哂兄卮笠饬x[4-5],也是全球公共衛(wèi)生事業(yè)的重要目標(biāo)。
對(duì)T2DM 患者進(jìn)行適當(dāng)?shù)母深A(yù)可以有效地減少或延遲DN 的發(fā)病,尤其是在DN 發(fā)病初期進(jìn)行干預(yù)可獲得較好的療效。因此本研究基于醫(yī)療數(shù)據(jù)采用多種預(yù)處理的方法清洗數(shù)據(jù),采用LASSO 回歸分析DN 可能發(fā)生的篩選特征變量,采用多因素Logistic 回歸分析構(gòu)建列線圖預(yù)測(cè)模型,篩選出DN 的危險(xiǎn)因素,進(jìn)行DN 的風(fēng)險(xiǎn)預(yù)測(cè)。采用受試者工作特征(ROC)曲線下面積(AUC)、Hosmer-Lemeshow 校準(zhǔn)曲線和決策曲線分析(DCA)對(duì)預(yù)測(cè)結(jié)果和臨床實(shí)用性進(jìn)行驗(yàn)證,從而為DN 的早期診斷和防治提供參考依據(jù)。
收集2016 年1 月—2021 年6 月在新疆醫(yī)科大學(xué)第一附屬醫(yī)院住院的5 810 例T2DM 患者的住院資料并進(jìn)行回顧性分析。納入標(biāo)準(zhǔn):(1)確診為T(mén)2DM 患者;(2)年齡≥18 歲;(3)可以自主溝通,并且無(wú)任何精神和心理障礙;(4)自愿簽署知情同意書(shū)。排除標(biāo)準(zhǔn):(1)數(shù)據(jù)及資料不完整;(2)1 型糖尿病、妊娠期糖尿病及其他特殊類型糖尿?。唬?)因泌尿系統(tǒng)感染、急性腎損傷或有腎臟腫瘤等其他原因所致的腎臟損傷;(4)有惡性腫瘤、精神疾病或嚴(yán)重的腎臟或肝功能障礙。本研究已獲新疆醫(yī)科大學(xué)第一附屬醫(yī)院倫理委員會(huì)批準(zhǔn)(批號(hào):K202108-24)。
T2DM 依據(jù)《中國(guó)2 型糖尿病防治指南(2010 年版)》[6]中的診斷標(biāo)準(zhǔn);DN 診斷標(biāo)準(zhǔn)為3~6 個(gè)月內(nèi)復(fù)查尿白蛋白,3 次結(jié)果中至少2 次達(dá)到或超過(guò)臨界值,且排除感染等其他影響因素。根據(jù)是否并發(fā)DN 將患者分為DN 組(481 例)和非DN 組(5 329 例)。
一般資料包括年齡、性別、BMI、是否高血壓、舒張壓(DBP)、收縮壓(SBP)和糖尿病病程等。患者禁食8~12 h,于次日清晨空腹取3 mL 肘部靜脈血,以3 000 r/min(離心半徑22 cm)離心10 min,留取血清,采用美國(guó)BECKMANDxC800 全自動(dòng)生化分析儀,對(duì)患者白細(xì)胞計(jì)數(shù)(WBC)、血清肌酐(Scr)、總膽固醇(TC)、三酰甘油(TG)、低密度脂蛋白膽固醇(LDL-C)、高密度脂蛋白膽固醇(HDL-C)、載脂蛋白A1(ApoA1)、載脂蛋白B(ApoB)、24 h 尿微量總蛋白(Up)、定性尿蛋白(Upn)和糖化血紅蛋白(HbA1c)等進(jìn)行測(cè)量。
Upn 標(biāo)準(zhǔn):-表示陰性(尿蛋白<0.1 g/L),+表示尿蛋白為0.2~0.9 g/L,++表示尿蛋白1.0~2.0 g/L,+++表示尿蛋白>2.0 g/L。
采用SPSS 26.0 和R 4.1.3 軟件對(duì)收集的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。符合正態(tài)分布的計(jì)量資料以(±s)表示,兩組間比較采用兩獨(dú)立樣本t 檢驗(yàn);不符合正態(tài)分布的計(jì)量資料以M(QR)表示,兩組間比較采用秩和檢驗(yàn);計(jì)數(shù)資料以相對(duì)數(shù)表示,兩組間比較采用χ2檢驗(yàn)。將符合標(biāo)準(zhǔn)的481 例DN 患者和非DN 患者依據(jù)性別、年齡(±2 歲)進(jìn)行1∶1 病例對(duì)照匹配。將匹配后的962例患者根據(jù)2∶1 比例隨機(jī)分為訓(xùn)練組(n=641)和驗(yàn)證組(n=321)。以DN 作為結(jié)局變量,通過(guò)LASSO 回歸篩選出獨(dú)立危險(xiǎn)因素,并結(jié)合多因素Logistic 回歸分析探討和構(gòu)建列線圖(Nomogram)預(yù)測(cè)模型。采用AUC驗(yàn)證預(yù)測(cè)模型預(yù)測(cè)效果,ROC 曲線是真實(shí)結(jié)果與模型預(yù)測(cè)結(jié)果進(jìn)行比較,以定義真陽(yáng)性率與假陽(yáng)性率的函數(shù)[7]。AUC 范圍為0.5~1.0,越接近1.0,說(shuō)明模型的真實(shí)性越高;通過(guò)Hosmer-Lemeshow 校準(zhǔn)曲線檢驗(yàn)擬合優(yōu)度[8];DCA 用來(lái)評(píng)估臨床有效性[9]。以P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
5 810 例T2DM 患者中男3 671 例(63.2%)、女2 139 例(36.8%),年齡(57.2±12.1)歲。非DN 組和DN 組患者性別、年齡、BMI、糖尿病病程、WBC、TC、TG、LDL-C、Scr、高 血 壓、SBP、DBP、HbA1c、ApoB、Up、Upn 比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05);兩組患者HDL-C、ApoA1 比較,差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),見(jiàn)表1。
表1 非DN 組和DN 組患者一般資料比較Table 1 Comparison of general information between the non-DN group and DN group
使用LASSO 回歸分析,對(duì)18 個(gè)變量進(jìn)行非零系數(shù)預(yù)測(cè)變量的篩選(圖1)。在λ 最小值(λ=0.005)和最小值的1 SE(λ=0.035)處分別繪制垂直線,最終選取最小10 倍交叉驗(yàn)證誤差1 SE 為最優(yōu)值,并篩選出5個(gè)非零系數(shù)的預(yù)測(cè)變量,包括糖尿病病程、TC、Scr、高血壓、Upn。
圖1 使用LASSO 回歸模型篩選預(yù)測(cè)變量Figure 1 LASSO regression model used to screen the predictor variables
2.3.1 多因素Logistic 回歸分析:以T2DM 患者是否并發(fā)DN(賦值:否=0,是=1)為因變量,以LASSO 回歸篩選出的5 個(gè)變量糖尿病病程(賦值:實(shí)測(cè)值)、TC(賦值:實(shí)測(cè)值)、Scr(賦值:實(shí)測(cè)值)、高血壓(賦值:否=0,是=1)、Upn(賦值:-=0,+=1,++=2,+++=3)作為自變量構(gòu)建條件多因素Logistic 回歸預(yù)測(cè)模型,結(jié)果顯示,5 個(gè)變量均是T2DM 患者并發(fā)DN 的危險(xiǎn)因素(P<0.05),其中高血壓患者發(fā)生DN 的風(fēng)險(xiǎn)是無(wú)高血壓患者的2.174 倍(95%CI=1.517~3.137,P<0.001),見(jiàn)表2。
表2 T2DM 患者并發(fā)DN 風(fēng)險(xiǎn)的多因素Logistic 回歸分析Table 2 Multivariate Logistic regression analysis used to analyze the influencing factors of DN in T2DM patients
2.3.2 列線圖繪制:結(jié)合分析結(jié)果繪制列線圖(圖2),將各變量的分?jǐn)?shù)相加得到總分。通過(guò)總分向下繪制一條垂直線可以標(biāo)出T2DM 患者并發(fā)DN 風(fēng)險(xiǎn)的估計(jì)概率。以糖尿病病程的中位數(shù)(M=10年)、TC的中位數(shù)(M=4.14 mmol/L)、Scr 的中位數(shù)(M=74 μmol/L)、Upn(++)且患有高血壓為例,總分為128 分,T2DM 患者并發(fā)DN 的風(fēng)險(xiǎn)為85%。
圖2 T2DM 患者并發(fā)DN 風(fēng)險(xiǎn)的預(yù)測(cè)列線圖Figure 2 Nomogram for predicting the risk of DN in patients with T2DM
通過(guò)ROC 曲線對(duì)T2DM 患者并發(fā)DN 風(fēng)險(xiǎn)的模型進(jìn)行區(qū)分度評(píng)估,結(jié)果顯示,訓(xùn)練組的AUC 為0.866(95%CI=0.839~0.894)(圖3A),驗(yàn)證組的AUC 為0.849(95%CI=0.804~0.889)(圖3B)。同時(shí),校準(zhǔn)度通過(guò)Hosmer-Lemeshow 擬合優(yōu)度檢驗(yàn)進(jìn)行評(píng)估,結(jié)果顯示訓(xùn)練組最大偏移量(Emax)為0.050,最小偏移量(Eavg)為0.024(P=0.748)(圖4A);驗(yàn)證組Emax 為0.030,Eavg 為0.014(P=0.986)(圖4B),兩組均通過(guò)校準(zhǔn)度檢驗(yàn)。
圖3 列線圖預(yù)測(cè)模型預(yù)測(cè)DN 風(fēng)險(xiǎn)的ROC 曲線Figure 3 ROC curve of the nomogram prediction model to predict the risk of DN
圖4 預(yù)測(cè)模型的Hosmer-Lemeshow 校準(zhǔn)曲線Figure 4 Hosmer-Lemeshow calibration curve of the prediction model
采用DCA 評(píng)價(jià)預(yù)測(cè)模型在臨床上的有效性(圖5),結(jié)果顯示,在當(dāng)前研究中若患者或醫(yī)師的閾值概率介于0.15~0.95,則對(duì)所有患者采取干預(yù)措施相比,采用此列線圖對(duì)DN 的風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)更有利。假定選擇預(yù)測(cè)概率為60%(高風(fēng)險(xiǎn)閾值為0.6)診斷為DN 并進(jìn)行治療的患者,那么每100 例使用本列線圖預(yù)測(cè)模型的患者,大約有50 例(凈收益為0.5)能從中獲益并且不損傷其他人的利益。
圖5 預(yù)測(cè)模型的DCA 分析Figure 5 DCA analysis of the prediction model
本研究通過(guò)LASSO 回歸、多因素Logistic 回歸,篩選T2DM 患者并發(fā)DN 的風(fēng)險(xiǎn)因素,建立預(yù)測(cè)模型。篩選出5 個(gè)預(yù)測(cè)變量包括糖尿病病程、TC、Scr、高血壓和Upn。其次,基于篩選出的獨(dú)立風(fēng)險(xiǎn)因素構(gòu)建列線圖預(yù)測(cè)模型,并利用AUC、校準(zhǔn)曲線Hosmer-Lemeshow和DCA 分析對(duì)預(yù)測(cè)模型的區(qū)分度、準(zhǔn)確度和臨床有效性進(jìn)行驗(yàn)證。結(jié)果顯示5 個(gè)變量均是T2DM 患者并發(fā)DN 風(fēng)險(xiǎn)的影響因素,預(yù)測(cè)模型有良好的區(qū)分能力,同時(shí)該模型預(yù)測(cè)概率與實(shí)際概率基本一致,具有較好的校準(zhǔn)度。此外,校準(zhǔn)曲線在訓(xùn)練組和驗(yàn)證組中均顯示了良好的校正能力。凈效益具有可比性。綜上可以看出預(yù)測(cè)模型在訓(xùn)練組和驗(yàn)證組均有具有較強(qiáng)的區(qū)分度和預(yù)測(cè)能力。
本研究采用LASSO 回歸分析方法篩選獨(dú)立風(fēng)險(xiǎn)因素,不論因變量的類型如何都可以進(jìn)行建模預(yù)測(cè),通過(guò)對(duì)所有變量的系數(shù)進(jìn)行回歸懲罰,使相對(duì)不重要的自變量系數(shù)變?yōu)榱?,從而提高模型的穩(wěn)定性。通過(guò)將Logistic 回歸形式進(jìn)行轉(zhuǎn)化,使用列線圖對(duì)臨床預(yù)測(cè)模型可視化[9-11],使用者可以直接從圖中讀取模型預(yù)測(cè)結(jié)局的概率值[12],目前也有大量研究使用機(jī)器學(xué)習(xí)算法改進(jìn)和訓(xùn)練Nomogram 預(yù)測(cè)模型,并將其用于乳腺癌[13]、結(jié)腸癌[14-15]等疾病的生存預(yù)測(cè)。
對(duì)預(yù)測(cè)模型的驗(yàn)證使用AUC 和DCA。本研究的預(yù)測(cè)模型訓(xùn)練組DN 發(fā)生風(fēng)險(xiǎn)的AUC 為0.866(95%CI=0.839~0.894),預(yù)測(cè)模型驗(yàn)證組DN 發(fā)生風(fēng)險(xiǎn) 的AUC 為0.849(95%CI=0.804~0.889)。XI 等[16]構(gòu)建的DN 風(fēng)險(xiǎn)預(yù)測(cè)模型共納入10 個(gè)指標(biāo),其中包括性別、年齡、高血壓、Scr、糖尿病病程、BMI 以及尿氮水平等,其AUC 為0.813(95%CI=0.778~0.848)。本研究排除性別、年齡指標(biāo)外納入的指標(biāo)與其相似,但效能相對(duì)較優(yōu)。相比SHI 等[17]構(gòu)建的預(yù)測(cè)模型(AUC=0.807,95%CI=0.784~0.830)也具有較好的效能。此外,本研究基于實(shí)驗(yàn)室檢測(cè)變量的結(jié)果與侯新月等[18](AUC=0.852,95%CI=0.822~0.882)和HUI 等[19](AUC=0.862,95%CI=0.834~0.890)構(gòu)建的預(yù)測(cè)模型結(jié)果相似。校準(zhǔn)曲線Hosmer-Lemeshow 模型擬合良好(訓(xùn)練組P=0.748;驗(yàn)證組P=0.986)。DCA 顯示當(dāng)患者的閾值概率為0.15~0.95 時(shí),使用列線圖預(yù)測(cè)模型預(yù)測(cè)DN更有益。
該預(yù)測(cè)模型提示,對(duì)于糖尿病病程較長(zhǎng)的T2DM 患者,應(yīng)盡早采取降壓、降脂、低鹽飲食和改善腎臟功能等措施降低發(fā)生DN 的風(fēng)險(xiǎn)。有研究表明,糖尿病病程與DN 的發(fā)生、發(fā)展有著密切的關(guān)系,10 年以上的T2DM 患者會(huì)逐漸發(fā)展為大量蛋白尿[20-21],發(fā)生DN的風(fēng)險(xiǎn)更高。本研究發(fā)現(xiàn),是否患有高血壓是T2DM 患者并發(fā)DN 的風(fēng)險(xiǎn)因素,這與BASHIR 等[22]的研究結(jié)果相似。田蓉等[23]發(fā)現(xiàn)DN 組的SBP 明顯高于無(wú)DN 組。原因是當(dāng)血壓升高時(shí),機(jī)體腎血流灌注量增加,損害微血管內(nèi)皮細(xì)胞并進(jìn)一步加快腎臟微血管病變進(jìn)程,使T2DM 患者腎臟嚴(yán)重受損,DN 發(fā)生風(fēng)險(xiǎn)顯著增大[24-25]。有研究發(fā)現(xiàn)研究組的尿蛋白和尿微量白蛋白均顯著高于健康組與對(duì)照組[26]。根據(jù)相關(guān)臨床研究顯示,當(dāng)其腎臟功能嚴(yán)重?fù)p害后,其大分子蛋白會(huì)滲入尿液,導(dǎo)致尿蛋白過(guò)高[27-28]。本研究結(jié)果也顯示Upn 是T2DM 患者并發(fā)DN 的風(fēng)險(xiǎn)因素。根據(jù)《中國(guó)2 型糖尿病防治指南(2010 年版)》[6],在常規(guī)控糖基礎(chǔ)上應(yīng)行血壓控制可延緩DN 進(jìn)展。結(jié)合以上結(jié)果可以發(fā)現(xiàn),高血壓可以加速DN 的尿蛋白析出,這提示T2DM 合并高血壓患者,把血壓控制在125/75 mmHg(1 mmHg=0.133 kPa)左右可以延緩DN 的發(fā)生和發(fā)展。
有研究發(fā)現(xiàn)TC 在腎病發(fā)生、發(fā)展以及預(yù)后的過(guò)程中都起著非常重要的作用[29]。本研究發(fā)現(xiàn)TC 與DN 發(fā)生風(fēng)險(xiǎn)呈正相關(guān),其OR 值為1.260(95%CI=1.109~1.439)。周玉萍等[30]發(fā)現(xiàn)糖尿病腎損害不斷加重,Scr、TC 水平逐漸上升,差異有統(tǒng)計(jì)學(xué)意義(P<0.01)。這是由于TC 等會(huì)改變腎小球基底膜磷酸酯成分或改變機(jī)體糖代謝而增加腎小球基底膜的通透性,造成腎臟損傷。Scr 與DN 的發(fā)生密切相關(guān)[31-32],同時(shí)也是評(píng)估腎臟功能以及診斷DN 的關(guān)鍵指標(biāo),本研究也發(fā)現(xiàn)Scr 與DN 發(fā)生風(fēng)險(xiǎn)呈正相關(guān),OR 值為1.008(95%CI=1.004~1.013)。有研究提示腎小球?yàn)V過(guò)功能出現(xiàn)嚴(yán)重?fù)p傷時(shí)Scr 水平將會(huì)升高[33]。
本研究存在一些不足之處。首先,在風(fēng)險(xiǎn)因素的分析上,預(yù)測(cè)模型未能考慮到T2DM 患者的日常生活環(huán)境和飲食習(xí)慣等潛在因素,這可能導(dǎo)致某些信息的偏倚或者患者的選擇偏倚,研究結(jié)果與真實(shí)結(jié)果可能產(chǎn)生偏差。其次,本研究是回顧性橫斷面單中心研究,未利用外部驗(yàn)證對(duì)模型的預(yù)測(cè)效能進(jìn)行進(jìn)一步評(píng)估。在后續(xù)研究中將會(huì)借助數(shù)據(jù)庫(kù)的樣本數(shù)據(jù)對(duì)該列線圖進(jìn)行外部驗(yàn)證,同時(shí)將對(duì)不同地區(qū)、多中心的大樣本數(shù)據(jù)進(jìn)一步驗(yàn)證,以提升該模型的預(yù)測(cè)精度和通用性。
綜上所述,本研究發(fā)現(xiàn)糖尿病病程、TC、Scr、高血壓、Upn 是T2DM 患者并發(fā)DN 的風(fēng)險(xiǎn)因素,建立了T2DM患者發(fā)生DN 風(fēng)險(xiǎn)的預(yù)測(cè)模型,其具有良好的預(yù)測(cè)能力和臨床實(shí)用性,可為臨床醫(yī)生及早有效地診斷提供決策依據(jù)。治療DN 的關(guān)鍵在于控制糖尿病的進(jìn)展,通過(guò)低鹽飲食、降壓、降脂、戒煙、戒酒和定期的醫(yī)學(xué)檢查等,預(yù)防腎臟的進(jìn)一步損傷,以防止或減少DN 的發(fā)生。
作者貢獻(xiàn):韓俊杰提出研究思路和設(shè)計(jì)方案,負(fù)責(zé)論文起草;武迪負(fù)責(zé)數(shù)據(jù)整理、清洗、統(tǒng)計(jì)學(xué)分析及臨床預(yù)測(cè)模型的構(gòu)建;陳志勝負(fù)責(zé)數(shù)據(jù)采集;肖揚(yáng)提出對(duì)變量篩選的方法,負(fù)責(zé)數(shù)據(jù)預(yù)處理及論文修改;森干負(fù)責(zé)研究構(gòu)思與設(shè)計(jì),負(fù)責(zé)調(diào)查對(duì)象的選取,對(duì)論文負(fù)責(zé);所有作者閱讀并修訂了最終稿件。
本文無(wú)利益沖突。