王 妤, 褚嘉棟, 孫 娜, 韓 嬙, 沈月平,周 磊, 朱新平, 3, 張曉斌, 楊 勇
[1. 蘇州大學(xué)蘇州醫(yī)學(xué)院公共衛(wèi)生學(xué)院 流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系, 江蘇 蘇州, 215213;2. 江蘇智慧智能軟件科技有限公司, 江蘇 泰州, 225300;3. 智慧智能軟件科技(湖南)有限公司, 湖南 湘潭, 411100;4. 江蘇省蘇州市廣濟(jì)醫(yī)院/蘇州大學(xué)附屬?gòu)V濟(jì)醫(yī)院, 江蘇 蘇州, 215137]
圍產(chǎn)期抑郁癥(PND)是指婦女在懷孕、分娩及產(chǎn)后康復(fù)期間產(chǎn)生抑郁情緒并達(dá)到一定嚴(yán)重程度[1]。研究[2]表明,低中等收入水平國(guó)家的孕產(chǎn)婦PND患病率高達(dá)48.5%, 遠(yuǎn)高于高等收入水平國(guó)家。中國(guó)孕產(chǎn)婦的PND總體患病率為16.3%(產(chǎn)前抑郁癥為19.7%, 產(chǎn)后抑郁癥為14.8%),且近10年呈明顯上升趨勢(shì)[3]。若未及時(shí)治療, PND可能引起不良妊娠結(jié)局、低體質(zhì)量?jī)骸⒛笅腙P(guān)系不佳或親情缺失、自殺或殺嬰等不良后果[4]。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,基于機(jī)器學(xué)習(xí)(ML)算法的人工智能(AI)模型越來(lái)越多地被用于疾病的診斷、分型及預(yù)后預(yù)測(cè)等方面[5-6]。基于ML算法,聯(lián)合多個(gè)臨床量表以及人口學(xué)特征、環(huán)境因素構(gòu)建診斷模型,并開(kāi)發(fā)界面友好、易于操作的輔助數(shù)字醫(yī)療APP或小程序,不僅無(wú)創(chuàng)、成本低廉,而且有利于推廣,但目前僅有少量研究[7-8]構(gòu)建并評(píng)估了基于量表開(kāi)發(fā)的孕產(chǎn)婦抑郁診斷模型。本研究對(duì)產(chǎn)前抑郁和產(chǎn)后抑郁診斷算法進(jìn)行探索與驗(yàn)證,以期明確診斷孕產(chǎn)婦抑郁的最優(yōu)算法。
本研究中的研究對(duì)象資料均來(lái)源于蘇州市臨床診療專(zhuān)項(xiàng)研究數(shù)據(jù)庫(kù),共納入符合條件的孕產(chǎn)婦5 814例,其中產(chǎn)前研究對(duì)象4 665例、產(chǎn)后研究對(duì)象1 149例。本研究經(jīng)蘇州市廣濟(jì)醫(yī)院倫理委員會(huì)審核批準(zhǔn),倫理批件號(hào)為蘇廣倫審2016-010。
1.2.1 資料收集: ① 人口學(xué)變量。收集研究對(duì)象的人口學(xué)特征資料,包括年齡、是否獨(dú)生子女(DSYN)、教育水平(JYSP)、婚姻狀況(HYZT)、家族精神病史(qrmh)、婆媳關(guān)系(PXMYD)、是否首次妊娠(HRCS)、居住條件(JZTJ)、向孩子發(fā)脾氣的沖動(dòng)(EPDS11)。② 量表維度變量。本研究調(diào)查量表包括艾森克個(gè)性量表(EPQ)、社會(huì)支持量表(SSRS)、特質(zhì)應(yīng)對(duì)方式量表(TCSQ)、睡眠質(zhì)量量表(PSQI)、輕躁狂癥評(píng)估量表(HCL-32)、心理障礙問(wèn)卷(MDQ)、廣泛性焦慮問(wèn)卷(GAD)、患者健康問(wèn)卷抑郁量表(PHQ-9)。將各量表分別分解為不同的維度變量進(jìn)行分析,最終共得到19個(gè)量表維度變量,可從不同角度評(píng)估孕產(chǎn)婦的心理健康狀況,見(jiàn)表1。
表1 各調(diào)查量表的維度變量名稱(chēng)及評(píng)分說(shuō)明
1.2.2 結(jié)局判定: 第5版《精神疾病診斷與統(tǒng)計(jì)手冊(cè)》(DSM-5)推薦將9條目患者健康問(wèn)卷抑郁量表(PHQ-9)[9]作為臨床抑郁篩查及抑郁嚴(yán)重程度評(píng)估的首選工具。PHQ-9具有良好的內(nèi)部一致性,Conbach′s α系數(shù)為0.8~0.9[10]。本研究根據(jù)PHQ-9評(píng)分判定孕產(chǎn)婦抑郁結(jié)局, PHQ-9評(píng)分≥10分為抑郁陽(yáng)性, <10分為抑郁陰性。
1.2.3 數(shù)據(jù)預(yù)處理: 由于實(shí)際人群的抑郁陽(yáng)性率較低(10%~15%),模型擬合過(guò)程中容易產(chǎn)生靈敏度較低的現(xiàn)象。鑒于此,本研究采用傾向性評(píng)分匹配法,以年齡作為匹配變量,對(duì)病例組進(jìn)行1∶1匹配,產(chǎn)前研究對(duì)象成功匹配201對(duì),產(chǎn)后研究對(duì)象成功匹配52對(duì)。在此基礎(chǔ)上構(gòu)建模型,可更準(zhǔn)確地篩選較優(yōu)的算法。
1.2.5 模型構(gòu)建及算法篩選: 本研究基于5種ML算法即Logistic回歸模型、隨機(jī)森林(RF)、支持向量機(jī)(SVM)、極限梯度提升樹(shù)(XGBoost)和反向傳播(BP)神經(jīng)網(wǎng)絡(luò)[11],分別納入全部變量及特征選擇變量集構(gòu)建產(chǎn)前抑郁、產(chǎn)后抑郁預(yù)測(cè)模型。繪制受試者工作特征(ROC)曲線(xiàn)評(píng)估模型性能,采用5折交叉驗(yàn)證方法計(jì)算評(píng)價(jià)指標(biāo),指標(biāo)包括靈敏度、特異度和曲線(xiàn)下面積(AUC)。此外,基于5種算法對(duì)所有變量進(jìn)行變量重要性排序。所有分析采用SAS 9.4軟件和R 4.3.0軟件進(jìn)行分析。
產(chǎn)前研究對(duì)象中,抑郁陽(yáng)性者在JYSP、qrmh、HRCS、PXMYD、EPDS11方面與抑郁陰性者比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05); 產(chǎn)后研究對(duì)象中,抑郁陽(yáng)性者在DSYN、EPDS11方面與抑郁陰性者比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05), 見(jiàn)表2。
表2 抑郁陰性或抑郁陽(yáng)性的產(chǎn)前、產(chǎn)后研究對(duì)象的人口學(xué)特征比較[n(%)]
產(chǎn)前研究對(duì)象中,抑郁陽(yáng)性者的17個(gè)量表維度變量(除NHCL32、PSQI_15外)與抑郁陰性者比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05); 產(chǎn)后研究對(duì)象中,抑郁陽(yáng)性者的15個(gè)量表維度變量(除NHCL32、NPSQI13、PSQI_15、NMDQ外)與抑郁陰性者比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05), 見(jiàn)表3。
表3 抑郁陰性或抑郁陽(yáng)性的產(chǎn)前、產(chǎn)后研究對(duì)象的各量表維度變量比較
2.2.1 特征變量選擇結(jié)果: 在產(chǎn)前研究對(duì)象中,單因素分析得到22個(gè)差異有統(tǒng)計(jì)學(xué)意義的變量,量表維度變量間的相關(guān)性分析發(fā)現(xiàn)epq_n與TCSQ_NC呈高度相關(guān),兩者中保留epq_n, 故最終得到21個(gè)特征選擇變量。在產(chǎn)后研究對(duì)象中,單因素分析得到17個(gè)差異有統(tǒng)計(jì)學(xué)意義的變量,量表維度變量間的相關(guān)性分析發(fā)現(xiàn)epq_n與TCSQ_NC呈高度相關(guān),兩者中保留epq_n, 故最終得到16個(gè)特征選擇變量。
2.2.2 預(yù)測(cè)模型評(píng)價(jià)結(jié)果: 納入不同變量的情況下,產(chǎn)前預(yù)測(cè)模型、產(chǎn)后預(yù)測(cè)模型5折交叉驗(yàn)證的靈敏度、特異度、AUC均在0.600~0.900范圍內(nèi); RF算法在產(chǎn)前預(yù)測(cè)模型(納入所有變量時(shí),AUC為0.834; 納入特征選擇變量集時(shí),AUC為0.849)和產(chǎn)后預(yù)測(cè)模型(納入所有變量時(shí),AUC為0.873; 納入特征選擇變量集時(shí),AUC為0.864)中均為最優(yōu)算法; 相較于納入所有變量構(gòu)建的診斷模型,大部分算法基于特征選擇變量集構(gòu)建的診斷模型性能明顯提升,但仍有個(gè)別算法提升不明顯甚至下降,見(jiàn)表4、圖1。
A: 產(chǎn)前預(yù)測(cè)模型(all: 納入所有變量; sig: 納入特征選擇變量集); B: 產(chǎn)后預(yù)測(cè)模型(all: 納入所有變量; sig: 納入特征選擇變量集)。圖1 納入不同變量情況下基于5種算法的產(chǎn)前、產(chǎn)后預(yù)測(cè)模型的ROC曲線(xiàn)
表4 以PHQ_9評(píng)分為分界標(biāo)準(zhǔn)的產(chǎn)前、產(chǎn)后預(yù)測(cè)模型的5折交叉驗(yàn)證結(jié)果
基于5種ML算法,分別對(duì)產(chǎn)前、產(chǎn)后研究對(duì)象進(jìn)行變量重要性排序(將27項(xiàng)特征變量按照重要性分?jǐn)?shù)從大到小排列),見(jiàn)圖2。以RF算法為例: 產(chǎn)前研究對(duì)象中,重要性排序前5名的變量分別是epq_n、PSQI_14、qrmh、TCSQ_NC、NGAD; 產(chǎn)后研究對(duì)象中,重要性排序前5名的變量分別是NGAD、TCSQ_NC、epq_n、NPSQI513、NPSQI1617。
圖2 產(chǎn)前、產(chǎn)后研究對(duì)象基于5種算法的變量重要性排序
孕產(chǎn)婦的心理健康一直是臨床中備受關(guān)注的話(huà)題,但目前國(guó)內(nèi)外尚無(wú)特異性的生物學(xué)指標(biāo),且由于精神專(zhuān)科醫(yī)師的缺乏及相應(yīng)訪(fǎng)談評(píng)估技術(shù)的限制, PND患者很難在首診的產(chǎn)科及社區(qū)及時(shí)獲得評(píng)估與確診。一項(xiàng)綜述[12]指出, 30%~70%的PND病例未被發(fā)現(xiàn),且僅15%的病例接受了適當(dāng)治療,故及時(shí)篩查并發(fā)現(xiàn)PND仍然是醫(yī)療保健工作的重要挑戰(zhàn)之一。目前,基于ML算法構(gòu)建孕產(chǎn)婦抑郁診斷預(yù)測(cè)模型仍然是一個(gè)相對(duì)不成熟的領(lǐng)域。MATSUO S等[13]基于Logistic回歸和另4種ML算法構(gòu)建預(yù)測(cè)模型,但預(yù)測(cè)變量?jī)H選用了基本的臨床信息。鐘雨婷等[8]開(kāi)發(fā)了一種基于A(yíng)ndroid平臺(tái)的產(chǎn)后抑郁心理護(hù)理干預(yù)系統(tǒng),該系統(tǒng)僅應(yīng)用了愛(ài)丁堡產(chǎn)后抑郁自評(píng)量表,而單一的量表難以反映和解釋疾病的全部變異性,故仍需進(jìn)一步研究。
本研究基于5種ML算法構(gòu)建產(chǎn)前模型、產(chǎn)后模型,預(yù)測(cè)性能均良好,其中RF算法表現(xiàn)最優(yōu)。一方面說(shuō)明,基于不同ML算法構(gòu)建的PND診斷模型均預(yù)測(cè)性能比較穩(wěn)定,且本研究模型的預(yù)測(cè)效能相較于其他研究[14]明顯提升; 另一方面說(shuō)明, RF算法對(duì)數(shù)據(jù)的擬合情況更好,對(duì)存在多種危險(xiǎn)因素疾病患者的預(yù)后預(yù)測(cè)具有獨(dú)特優(yōu)勢(shì)。本研究發(fā)現(xiàn),對(duì)于大部分模型而言,納入特征選擇變量集的預(yù)測(cè)性能相較于納入全部變量時(shí)明顯提高。由此提示,用于ML算法的特征需要具備良好的差異性及較低的特征間相關(guān)性,這在提升性能的同時(shí)還能兼顧臨床可解釋性。值得注意的是,在產(chǎn)后研究對(duì)象中,表現(xiàn)最優(yōu)的RF算法納入特征選擇變量集所構(gòu)建的預(yù)測(cè)模型性能略差于納入所有變量的預(yù)測(cè)模型。由此提示, RF算法對(duì)于特征選擇相對(duì)不敏感[15], 且產(chǎn)后抑郁預(yù)測(cè)模型仍需盡可能多地納入特征信息。
本研究篩選出的特征選擇變量集與既往研究結(jié)論基本一致,例如低社會(huì)經(jīng)濟(jì)地位、經(jīng)濟(jì)壓力[16]、人際關(guān)系、感知支持[17]與PND相關(guān)。本研究中,變量重要性排序結(jié)果顯示(以RF算法為例),排序前5名的重要變量首先均是單因素分析中差異有統(tǒng)計(jì)學(xué)意義的變量,其次在既往研究中均被視為重要的預(yù)測(cè)因素。epq_n反映情緒穩(wěn)定狀態(tài),TCSQ_NC反映應(yīng)對(duì)問(wèn)題時(shí)情緒波動(dòng),NGAD反映焦慮情緒變化趨勢(shì),這3個(gè)變量均與情緒狀態(tài)有關(guān)。張雪蓮等[18]發(fā)現(xiàn),情緒調(diào)節(jié)能力與抑郁水平顯著相關(guān),情緒調(diào)節(jié)能力低者更傾向于消極應(yīng)對(duì),更容易出現(xiàn)焦慮、抑郁等負(fù)向情緒。PSQI_14、NPSQI513、NPSQI1617均與睡眠狀態(tài)有關(guān)。李洋等[19]研究發(fā)現(xiàn),孕期抑郁情緒與睡眠異常等因素有關(guān)。Qrmh反映親人的精神疾病史,一項(xiàng)綜述[20]發(fā)現(xiàn)家族精神疾病史對(duì)于早期識(shí)別PND高風(fēng)險(xiǎn)婦女至關(guān)重要。
綜上所述,基于5種ML算法構(gòu)建的預(yù)測(cè)模型均可有效預(yù)測(cè)孕產(chǎn)婦PND風(fēng)險(xiǎn),其中以RF算法的表現(xiàn)最優(yōu),這為開(kāi)發(fā)快速篩查和診斷PND的輔助工具提供了參考依據(jù)。但本研究尚存在一定局限性: ① 本研究以PHQ-9評(píng)分作為有無(wú)PND的分界標(biāo)準(zhǔn),然而臨床中診斷PND的金標(biāo)準(zhǔn)是經(jīng)過(guò)專(zhuān)業(yè)訓(xùn)練并取得精神專(zhuān)科醫(yī)師執(zhí)照的臨床醫(yī)生的訪(fǎng)談評(píng)估結(jié)論; ② 受樣本量和時(shí)間的限制,本研究未進(jìn)行外部驗(yàn)證。本研究團(tuán)隊(duì)將在后續(xù)實(shí)際臨床試驗(yàn)中引入精神障礙臨床定式結(jié)構(gòu)化訪(fǎng)談(SCID)、簡(jiǎn)明國(guó)際神經(jīng)精神障礙訪(fǎng)談檢查(MINI)等診斷量表并結(jié)合臨床診斷作為金標(biāo)準(zhǔn),進(jìn)一步篩選合適的量表和相應(yīng)的臨床變量。