徐寒瑩,徐鵬,張影,張冬梅,崔雅斌,王?。?/p>
(1. 長春中醫(yī)藥大學中醫(yī)學院 長春 130117;2. 長春中醫(yī)藥大學附屬醫(yī)院腦病中心 長春 130021)
卒中作為一種急性腦血管病,具有高發(fā)病率、高復發(fā)率、高致殘率、高死亡率的特點。在中國,卒中是造成我國成年人致死、致殘的主要原因。據(jù)統(tǒng)計我國卒中的死亡率是歐美國家的4-5倍,甚至遠高于日本、印度等鄰近的亞洲國家[1]。2017年我國有約196 萬人死于腦卒中,首次卒中后1年內復發(fā)率高達17.1%[2]。卒中反復發(fā)作可加劇神經(jīng)功能缺損癥狀及并發(fā)癥,使治療更具難度。復發(fā)卒中是卒中患者死亡風險加倍的獨立因素,同樣也是我國殘疾調整生命年(Disability-adjusted life years,DALY)水平居高不下的重要原因[3,4]。一項薈萃分析表明,卒中復發(fā)的累計風險在首次卒中后30天、1年、5年、10年時分別為3.1%、11.1%、26.4%、39.2%[5]。因此,建立科學精準的風險評估工具,盡早識別卒中復發(fā)風險因素對于快速調整可控因素,在卒中復發(fā)的防控過程中具有重要意義。早在20 世紀90年代,國外學者已著手建立簡易評估工具用于卒中的二級預防風險評估,并在推廣應用過程中不斷改良,現(xiàn)已形成較為成熟的卒中復發(fā)風險評估體系。近年來,我國諸多研究團隊也聚焦于卒中復發(fā)風險評估工具的研究,致力于創(chuàng)建適合國人的復發(fā)風險預測工具為卒中二級預防提供保障。本文即對我國現(xiàn)階段卒中復發(fā)風險預測工具的開發(fā)與應用進行概述。
目前對于復發(fā)風險預測工具的構建手段主要劃分為2 類,即傳統(tǒng)建模方法和機器學習算法。傳統(tǒng)建模方式是根據(jù)單因素、多因素回歸分析疾病的復發(fā)概率,建立數(shù)學公式以實現(xiàn)預測,此類方法應用廣泛,操作簡便。機器學習算法得益于計算機技術的快速發(fā)展,是人工智能的重要分支,是近年來國內外研究者勇于嘗試的新興技術。下文即圍繞2類建模手段展開詳細論述。
風險預測模型的實質是探求研究因素與疾病產(chǎn)生的因果關系及關系的強弱程度。疾病的產(chǎn)生可為單因素獨立作用或多因素聯(lián)合作用的結果?;貧w分析以數(shù)據(jù)為基礎,通過數(shù)學模型形式表現(xiàn)因果關系,也是風險預測的常用統(tǒng)計方法。目前,較為經(jīng)典的風險預測建模方法主要為Cox 比例風險回歸和Logistic回歸分析。Logictic 回歸模型主要探討事件概率與自變量的關系。Cox 回歸模型以生存結局和生存時間為因變量,可同時分析多因素對生存時間的影響。安雅臣等[6]構建了可預測3年內復發(fā)風險的Cox 回歸模型及個體預后指數(shù)方程,結果顯示AUC 值為0.817,并計算約登指數(shù)最大值為0.483,確定其對應的預后指數(shù)(1.248)作為截斷點(即最佳陽性判別點),即預后指數(shù)≥1.248時3年內復發(fā)的可能性大。于瑩等[7]建立了缺血性卒中患者阿司匹林治療后復發(fā)風險的Logistic回歸模型,AUC值為0.7529,預測準確率為71.36%,提示模型具有較好的預測性能。
伴隨科技的迅猛發(fā)展,人工智能(Artificial Intelligence,AI)得以快速崛起。機器學習(Machine Learning,ML)作為AI 的前沿研究領域和重要分支同樣取得了突破性的進展。ML 是計算機通過反復的“訓練”(模型學習)數(shù)據(jù)內規(guī)律性的信息,從而獲得新的經(jīng)驗和知識,不斷優(yōu)化自身性能的新方法。ML 的基礎在于數(shù)據(jù)樣本,關鍵環(huán)節(jié)在于模型訓練,數(shù)據(jù)體量的擴充和較好的數(shù)據(jù)質量可以提升模型的品質,這樣的特質也使得ML 在大數(shù)據(jù)的分析與處理等方面具有顯著優(yōu)勢。近年來,ML 與醫(yī)療、公共衛(wèi)生事業(yè)的聯(lián)系日趨密切,由ML 衍生出的各類新型算法在臨床數(shù)據(jù)的挖掘、疾病預測、診斷和治療等方面發(fā)揮著不容忽視的作用,是實現(xiàn)未來智慧醫(yī)療的核心技術,為形成科學化醫(yī)療決策提供有力支持。研究者們也將ML應用于卒中的風險預測,常見類型包括決策樹模型、人工神經(jīng)網(wǎng)絡模型、支持向量機模型(Support vector machines,SVM)等。劉澤文等[8]對657 名卒中患者(按9:1比例劃分訓練集與測試集)建立支持向量機模型以預測5年卒中復發(fā)風險,結果顯示模型AUC 值為0.836。潘思行等[9]基于神經(jīng)網(wǎng)絡與支持向量機建立了客觀化舌象和形體特征的輔助中醫(yī)體質識別模型,結果顯示融合了舌象和形體特征的2種機器學習模型一定程度上可提高中醫(yī)體質辨識的準確性。由此可見,機器學習算法在中醫(yī)藥領域有較好的應用價值,為日后建立具有中醫(yī)特色的卒中風險預測工具提供技術保障。
傳統(tǒng)的復發(fā)預測工具通過納入患者入院時的信息與指標進行模擬整合與風險分層,進而評估復發(fā)風險,未能考慮基線及隨訪期間風險因素的變化,在預測精確度上略顯不足。ML 可通過數(shù)據(jù)集快速、準確的識別風險因素,并可應對數(shù)量大、高維度、非結構性的復雜數(shù)據(jù)。相較于傳統(tǒng)預測模型,ML 可靈活處理數(shù)據(jù)缺失值,挖掘潛在風險因素,有較強的的抗干擾能力,可進一步提高了預測模型的準確率。陳思玎等[10]對10645 名缺血性卒中患者分別構建了機器學習模型XGBoost和Logistic回歸模型對患者卒中后3個月死亡結局展開預測,兩者AUC 分別為0.8539、0.8278,前者顯示出較好的預測效能,與此同時,在運算時間成本和預測精準度等方面也更具優(yōu)勢。譚英等[11]對589 名缺血性卒中患者分別構建了BP 神經(jīng)網(wǎng)絡模型和Logistic 回歸模型進行復發(fā)風險預測,兩者AUC 值分別為0.787、0.729,提示前者的預測效能更佳。ML在近年來獲得了巨大發(fā)展,并逐漸參與卒中決策制定過程。卒中病因的復雜性及ML 對大數(shù)據(jù)的良好處理能力使得研究者們對運用ML 進行卒中的風險預測產(chǎn)生興趣,但結合目前國內外的研究現(xiàn)狀、相關文獻發(fā)表數(shù)量、文獻質量評價結果可知,現(xiàn)階段國內外研究者構建的卒中預測模型仍多應用傳統(tǒng)建模方法,ML在疾病預測領域的發(fā)展仍處于初級階段,尚未實現(xiàn)廣泛推廣,目前多數(shù)研究僅采用內部驗證方法,鮮少經(jīng)過外部驗證,而針對于ML 的超參數(shù)情況的調整流程也尚未形成標準化的指南或程序報告[12,13]。由此可見,在AL 背景下衍生的新型建模方式仍需要研究者們進一步探索與挖掘,在未來可更好的應用于卒中風險預測的實踐中。
卒中復發(fā)風險預測工具是早期識別卒中復發(fā)高危人群、明確預防重點的有效措施。我國目前應用的復發(fā)預測工具均為國外研究團隊所建立,但此類工具并不完全適用于在中國人群。近年來,國內研究者也致力于對傳統(tǒng)預測工具的改良與創(chuàng)新,使其更好的適用于國內人群,下文即簡要介紹我國對國內外卒中復發(fā)預測工具的應用現(xiàn)狀。
國外學者對于復發(fā)預測工具的研究與開發(fā)早于國內。《中國缺血性腦卒中風險評估量表使用專家共識2016》中推薦使用ABCD2 評分或ABCD3-I 評分對短暫性腦缺血發(fā)作(TIA)患者進行卒中風險評估,應用Essen 量表(ESRS)或卒中預測工具-Ⅱ(SPI-Ⅱ)評估缺血性卒中患者長期復發(fā)風險[14],而以上工具均為西方國家以歐美人群為研究目標所構建。ABCD 評分系統(tǒng)主要用于TIA 后的卒中風險評估,通過不斷完善風險參數(shù)實現(xiàn)階段性衍化。ABCD2 因操作便捷且對接診醫(yī)師無神經(jīng)??浦R要求等特點,在臨床上使用更為廣泛。美國心臟協(xié)會(AHA)指南建議使用ABCD2 對TIA 后短期復發(fā)的高危人群進行風險識別。ABCD3-I 在ABCD2 的基礎上增加了DWI 和頸動脈成像2 個指標,因此預測效果更佳[15]。ESRS 的建立基于阿司匹林與氯吡格雷比較用于缺血事件高危患者試驗(CAPRIE)[16],可以合理預測卒中及心血管事件復發(fā)的長期風險,并在歐美人群中進行了效度驗證[15,17]。ERSR 中缺少反映顱內血管狹窄程度的預測指標,而國內缺血性卒中患者的顱內血管狹窄和大動脈粥樣硬化更為多見,因此ERSR 在我國的預測效能低于歐美國家。孟霞等[18]研究表明,ESRS 對大卒中復發(fā)/聯(lián)合血管事件的預測效能最高,其次是小卒中,對TIA的預測效能最低。SPI-Ⅱ與ESRS 在中國人群中對卒中復發(fā)的風險預測能力基本一致[19]。近年來,國內學者將以上工具在中國人群中進行驗證及橫向比較,結果顯示在中國人群中的預測效能尚有不足。
我國對于卒中風險預測工具的建設與開發(fā)起步較晚。且相較于初發(fā)預測工具,對復發(fā)預測工具的研究尤為薄弱,然而因卒中復發(fā)引起高致殘率、死亡率不容忽視。近年來隨著對于卒中復發(fā)危險因素的不斷深入探索,國內研究者逐步開展了一系列科學研究,構建風險預測模型,應用于卒中復發(fā)高危人群的早期識別與防控。
2.2.1 基于經(jīng)典預測模型優(yōu)化的卒中復發(fā)風險預測工具
卒中二級預防對于降低卒中復發(fā)風險、致殘率、致死率有重要意義。復發(fā)風險預測工具可盡早識別風險因素,提高醫(yī)生與患者的防范意識,強化二級預防效果。目前國內的復發(fā)預測工具多基于小樣本量、隨訪時間較短、地域局限的研究,建模方法相對傳統(tǒng),未能在大范圍內得以推廣。許多學者以國外經(jīng)典復發(fā)模型為基礎,結合國內卒中流行病特征進行改良,并在小范圍內得以驗證。Ling 等[20]選取高血壓病史>15年、糖尿病史>10年、缺血性卒中或TIA 既往史、大動脈粥樣硬化亞型作為危險因素,構建了改良ESRS評分,并應用改良ESRS 與原始ESRS 分別對773 名缺血性卒中患者進行評估,結果顯示兩者AUC 值分別為0.70、0.58,改良ESRS 顯示出較好的預測效能且在靈敏度與特異性等方面也優(yōu)于原始ESRS。此外,將現(xiàn)有復發(fā)預測工具聯(lián)合新的亞臨床指標在一定程度上也可提高預測效能,研究者們也積極尋找更有利的獨立復發(fā)預測因子。魏衡等[21]研究表明超敏-C 反應蛋白與ABCD2 評分聯(lián)合能提高對腦梗死的預測價值。Liu等[22]研究發(fā)現(xiàn),miR-122rs17669基因型是卒中復發(fā)風險的重要預測因子,攜帶rs17669 多態(tài)性CC 基因型的患者與TT/CT 基因型相比,缺血性卒中復發(fā)風險增加88%。李菁晶等[23]研究發(fā)現(xiàn)DWI 所示多發(fā)皮層、皮層下和(或)深部白質病變、多發(fā)顱內外動脈狹窄可能是小卒中1年后卒中復發(fā)的獨立預測因子。
2.2.2 基于中醫(yī)理論開發(fā)的卒中復發(fā)風險預測工具
中醫(yī)“治未病”理論中未病先防、既病防變、病后防復的內容與現(xiàn)代醫(yī)學倡導的三級預防理念聯(lián)系密切。目前國內所建立的中醫(yī)相關卒中復發(fā)預測工具主要圍繞中醫(yī)證候要素和中醫(yī)體質辨識兩個角度展開。證候是中醫(yī)學理論研究的核心內容,是對患者生理、病理狀態(tài)的概括,其外在表現(xiàn)為具象的癥狀、體征。體質是在先天與后天共同作用下形成的形態(tài)結構、生理功能與心理狀態(tài)方面長期的、相對穩(wěn)定的固有特質[24]。體質影響著疾病的易感程度與轉歸?!吨嗅t(yī)體質分類與判定》行業(yè)標準的頒布及《中醫(yī)體質量表》的制定,為中醫(yī)體質辨識及基于體質的疾病預防和管理提供了有效依據(jù),數(shù)據(jù)挖掘技術的快速發(fā)展也為研究者建立中醫(yī)特色相關的風險預測模型提供了重要技術支撐。張靜等[25]對1780 例復發(fā)缺血性中風患者進行Logistic 回歸分析后發(fā)現(xiàn)風痰阻絡、氣虛血瘀、痰熱腑實、痰蒙清竅、痰熱內閉證候類型表現(xiàn)可能是缺血性中風復發(fā)的危險因素,缺血性中風復發(fā)人群顯示出特定的中醫(yī)證候特征。王桂倩等[26]融合常規(guī)復發(fā)風險因素與體質信息建立了基于體質的缺血性中風復發(fā)風險模型,并與西醫(yī)危險因素的復發(fā)風險模型進行對比,兩者AUC 值分別為0.766、0.718,前者顯示出較好的預測效能。我國現(xiàn)階段對于中醫(yī)特色相關的復發(fā)預測工具研究較為匱乏,應充分發(fā)揮中醫(yī)藥優(yōu)勢與專長,將現(xiàn)代風險因素與中醫(yī)證候要素、患者體質狀態(tài)相結合,構建具有中醫(yī)特色的復發(fā)風險預測工具,同時開展中醫(yī)健康教育,推廣中醫(yī)特色康復診療技術,使中醫(yī)藥在卒中疾病全周期發(fā)揮作用。
本文應用對比的方式針對我國現(xiàn)階段卒中復發(fā)預測工具的開發(fā)技術與國內外預測工具的應用現(xiàn)狀分別展開分析,對于現(xiàn)下應用的主要建模方式進行分類概述,并從建模原理、數(shù)據(jù)處理、模型效能、精準度、發(fā)展現(xiàn)狀等角度將傳統(tǒng)建模方法與機器學習模型進行對比,展開詳細論述。通過本研究可知,我國目前對于卒中復發(fā)預測工具的研究仍處于初級階段,所應用的卒中復發(fā)預測工具多為發(fā)達國家建立,而此類模型在國內人群中預測效果存在局限,因此構建適合國人的復發(fā)預測工具是未來卒中預警與防控領域研究的重難點。
本文通過分析我國現(xiàn)階段的風險預測現(xiàn)狀,總結得出3個目前我國卒中風險預測研究領域面臨的瓶頸問題并提出建議:
3.2.1 加強國外模型在國內人群的適應性與預測能力
國內研究者根據(jù)我國卒中流行病學特征,在經(jīng)典模型基礎上加入新型預測參數(shù)以增強模型的預測效能,但此類工具的開發(fā)多基于小樣本量、小范圍、隨訪時間短的隊列研究,且以回顧性的病歷資料研究居多,前瞻性研究較少,多數(shù)研究無法代表大范圍內卒中患者復發(fā)的整體特征,因此亟需構建基于大型臨床研究,符合中國人群卒中流行特征的復發(fā)預測工具,更好的指導臨床實踐。
3.2.2 溯源與挖掘傳統(tǒng)中醫(yī)理論中蘊含的“治未病”思想構建中醫(yī)特色風險預測工具
中醫(yī)“治未病”思想在慢性病防控管理方面具有豐富的理論與實踐經(jīng)驗,《中國防治慢性病中長期規(guī)劃(2017-2025)》中明確提出要發(fā)揮中醫(yī)藥在慢性病防治中的優(yōu)勢與作用。但目前以“證候特征”“體質辨識”為核心的中醫(yī)健康狀態(tài)辨識體系在卒中、冠心病等慢性病的風險評估能力與預測精確程度仍有待提高,缺少高級別循證證據(jù),尚未形成完備的卒中防控與評價體系,這也使得具有中醫(yī)特色的卒中發(fā)病、復發(fā)防控服務模式的推廣進程緩慢,難以落地。對于中醫(yī)特色風險評估工具未來的建設與發(fā)展,需依托大規(guī)模人群流調、回顧性研究、隊列研究、隨機對照研究,建立在以“證候”為核心的卒中風險識別技術的基礎上,并可逐步開展中醫(yī)相關的卒中防控干預技術與推廣模式評價研究,形成標準化指南,建設中醫(yī)防控示范基地,構建中醫(yī)卒中發(fā)病與復發(fā)預警防治體系。
3.2.3 推動新型建模技術及數(shù)據(jù)處理手段與卒中復發(fā)風險預測相融合
準確性與科學性是評價預測工具優(yōu)劣程度的重要指標。充足樣本數(shù)量、風險因素細化程度、科學的建模方法是提高預測工具準確性與科學性的重要手段。近年來,國內研究團隊對于機器學習算法的大膽的應用與嘗試也使得新型建模技術在我國卒中風險預測領域獲得了巨大發(fā)展。目前,各級醫(yī)院的醫(yī)療數(shù)據(jù)存儲水平參差不齊,多樣的數(shù)據(jù)形式使得增加了數(shù)據(jù)共享的難度。在未來的研究過程中,可引入混雜處理、因果推斷、縱向數(shù)據(jù)處理及分析(重復測量方差分析、分層模型、廣義線性模型、混合效應模型、生存分析等)、高維數(shù)據(jù)分析(稀疏約束、分組最小角回歸算法等)及合成分析等方法以適應大數(shù)據(jù)時代大體量、復雜醫(yī)療數(shù)據(jù)資料的特點,為建立個體精準化卒中風險預測模型提供技術保障,形成科學、實用的卒中二級預防決策提供可靠依據(jù)。
我國人口占世界人口總量的1/5,是世界范圍內卒中負擔最重的國家。近年來我國社會經(jīng)濟快速發(fā)展,我國卒中危險因素流行特征上雖與發(fā)達國家有相似之處,但仍具相對獨立性。與西方發(fā)達國家相比,中國人群的顱內動脈硬化疾病更多,不同程度的顱內動脈硬化及狹窄也會增加卒中的復發(fā)率[27]。此外,我國作為一個人口龐大、幅員遼闊的多民族國家,卒中風險因民族、南北地域、城鄉(xiāng)、收入水平不同而具有顯著差異。研究表明,我國卒中患病率最高與最低省區(qū)之間差異可超過8 倍[28]。與發(fā)達國家不同,我國的國民收入水平多以中等收入為主,而收入水平很可能是影響卒中復發(fā)的一個更重要指標[29]。我國目前應用的預測工具均建立在發(fā)達國家開展的長期、大規(guī)模研究為基礎,并不完全適用于中國人群。在日后的發(fā)展中,研究者們應著手運用科學合理的建模技術,融合更高級的循證證據(jù)以建立適合國人的卒中復發(fā)風險預測工具,同時充分發(fā)揮中醫(yī)藥在人體狀態(tài)中的評估預警作用,進一步完善卒中防控體系,保障卒中風險篩查工作有序高效運行,以便于實行精準、有效的卒中二級預防,從而進一步遏制卒中的流行上升趨勢。