楊珊珊 李新毅 周立業(yè) 梁瑞峰 羅天娥 曲成毅 余紅梅△
阿爾茨海默病(Alzheimer's disease,AD)是老年期癡呆的一個(gè)主要類型。目前一般認(rèn)為輕度認(rèn)知損害(mild cognitive impairment,MCI)是一個(gè)有輕度認(rèn)知缺損但沒(méi)有癡呆的疾病分類單元,是介于正常老化和癡呆之間的一種中間過(guò)渡狀態(tài);而AD的發(fā)生和發(fā)展將呈現(xiàn)進(jìn)行性加重和不可逆性特點(diǎn)。
以往的MCI轉(zhuǎn)歸研究多采用經(jīng)典的統(tǒng)計(jì)學(xué)方法,如logistic回歸、Cox回歸等,這些方法不能同時(shí)分析疾病各發(fā)展階段的影響因素和動(dòng)態(tài)評(píng)價(jià)轉(zhuǎn)歸。多狀態(tài)Markov模型作為處理隨訪資料的有效工具,可同時(shí)考慮所有的狀態(tài)、結(jié)局、狀態(tài)間轉(zhuǎn)移的時(shí)間信息以及可能的影響因素,對(duì)隨機(jī)過(guò)程進(jìn)行連續(xù)性動(dòng)態(tài)研究,動(dòng)態(tài)地評(píng)價(jià)疾病進(jìn)展,是目前為止研究疾病不同轉(zhuǎn)歸的最佳模型〔1〕。本文將多狀態(tài)Markov模型應(yīng)用于MCI轉(zhuǎn)歸研究,分析MCI患者不同認(rèn)知狀態(tài)變化的影響因素及其轉(zhuǎn)歸規(guī)律,為今后類似研究提供方法學(xué)借鑒,拓寬多狀態(tài)Markov模型在醫(yī)學(xué)領(lǐng)域的應(yīng)用范圍。
采用分層整群隨機(jī)抽樣方法,調(diào)查太原市65歲以上社區(qū)老年人6 192人,其中認(rèn)知正常老化者5 592人,MCI患者600人。之后每6個(gè)月對(duì)這600名MCI患者進(jìn)行一次隨訪,每次隨訪內(nèi)容包括社會(huì)人口學(xué)指標(biāo)、生活方式、健康狀況及認(rèn)知水平等〔2〕。至2009年4月已完成4次隨訪,期間因死亡、搬遷、外出、拒絕參加觀察等原因失訪人數(shù)72,失訪率12%。600例MCI患者中,男性174例,女性426例,年齡范圍為65~90歲,平均年齡為(69.71±6.59)歲。
原理與方法
1. 基本概念〔1,3〕
(1)暫態(tài)(transient state):指從此狀態(tài)可發(fā)生狀態(tài)的改變,轉(zhuǎn)移到其他狀態(tài)。
(2)吸收態(tài)(absorbing state):指從其他狀態(tài)轉(zhuǎn)移到此狀態(tài)后,不能再發(fā)生狀態(tài)的轉(zhuǎn)移。
(3)轉(zhuǎn)移強(qiáng)度(transition intensity):描述狀態(tài)間的瞬時(shí)轉(zhuǎn)移危險(xiǎn),即在t時(shí)刻前處于狀態(tài)i的個(gè)體,將在很短的時(shí)間區(qū)間內(nèi)轉(zhuǎn)移到狀態(tài)j的概率。
(4)轉(zhuǎn)移概率(transition probability):給出在時(shí)刻s處在狀態(tài)i的個(gè)體,將在后來(lái)的時(shí)刻t處在狀態(tài)j的可能性。
(5)逗留時(shí)間(sojourn time):指病人處于某狀態(tài)的時(shí)間長(zhǎng)短。
(6)馬爾可夫(Markov)性:又稱“無(wú)后效性”,指從現(xiàn)狀態(tài)轉(zhuǎn)移到下一狀態(tài)僅僅取決于目前狀態(tài),而與過(guò)去的各狀態(tài)無(wú)關(guān)。
(7)狀態(tài)結(jié)構(gòu)(state structure):明確狀態(tài)及哪些狀態(tài)間的轉(zhuǎn)移是可能的。
2.多狀態(tài)Markov模型
(1)模型簡(jiǎn)介
Markov過(guò)程是以俄國(guó)數(shù)學(xué)家Markov AA命名的一種非參數(shù)離散型時(shí)間序列分析方法,主要用以模擬隨時(shí)間發(fā)生的具有Markov性的隨機(jī)事件。多狀態(tài)Markov模型建立之初,被用來(lái)描述和預(yù)測(cè)煤氣的分子在一個(gè)密閉容器中的狀態(tài)〔4〕。隨后在近代物理、生物學(xué)、管理科學(xué)、信息處理與數(shù)字計(jì)算方法等方面都有重要應(yīng)用,最早應(yīng)用于醫(yī)學(xué)領(lǐng)域是在20世紀(jì)70年代,主要用于模擬慢性疾病的發(fā)展過(guò)程,20世紀(jì)80年代后國(guó)外已有大量的應(yīng)用。截至目前,多狀態(tài)Markov模型是探討慢性病不同發(fā)展階段影響因素及轉(zhuǎn)歸規(guī)律較有效的統(tǒng)計(jì)方法。
齊次Markov過(guò)程假定所有轉(zhuǎn)移危險(xiǎn)在時(shí)間上是恒定的,即狀態(tài)間的轉(zhuǎn)移強(qiáng)度是常量。由于齊次Markov模型的轉(zhuǎn)移強(qiáng)度恒定,轉(zhuǎn)移概率是轉(zhuǎn)移強(qiáng)度的顯式函數(shù),參數(shù)估計(jì)與統(tǒng)計(jì)推斷相對(duì)比較容易,應(yīng)用比較廣泛。
(2)參數(shù)估計(jì)和假設(shè)檢驗(yàn)
設(shè)有N個(gè)個(gè)體,mi為第i個(gè)個(gè)體參加觀察的次數(shù),在tj和tj+1觀察時(shí)刻所處的疾病狀態(tài)分別為r和s,qrs為轉(zhuǎn)移強(qiáng)度矩陣中的元素;q(0)rs表示狀態(tài)r轉(zhuǎn)移到狀態(tài)s的基線轉(zhuǎn)移強(qiáng)度;z(t)表示狀態(tài)r轉(zhuǎn)移到狀態(tài)s這個(gè)階段所對(duì)應(yīng)的協(xié)變量向量;βrs表示協(xié)變量所對(duì)應(yīng)的回歸系數(shù)。則多狀態(tài)Markov模型可表示為:
某次觀察對(duì)似然函數(shù)的貢獻(xiàn)為:
則整個(gè)似然函數(shù)為每個(gè)個(gè)體每次觀察對(duì)似然函數(shù)貢獻(xiàn)的乘積,即
采用Quasi-Newton迭代法可獲得模型參數(shù)的極大似然估計(jì)值,同時(shí)通過(guò)構(gòu)造信息矩陣可獲得這些參數(shù)標(biāo)準(zhǔn)誤的漸近估計(jì)值〔5〕。
1.多狀態(tài)Markov模型的構(gòu)建
假定MCI進(jìn)程中,從現(xiàn)狀態(tài)轉(zhuǎn)移到下一狀態(tài)僅僅取決于目前狀態(tài),而不直接受以前各狀態(tài)的影響,即具有Markov的“無(wú)后效性”特征,因此選用多狀態(tài)Markov模型描述MCI轉(zhuǎn)歸規(guī)律。本文通過(guò)智商(intelligence quotient,IQ)變化反映MCI認(rèn)知功能的變化趨勢(shì),結(jié)合MCI的轉(zhuǎn)歸存在異質(zhì)性,MCI大部分發(fā)展為AD,小部分穩(wěn)定或好轉(zhuǎn)。特確定一個(gè)四狀態(tài)模型,即:狀態(tài)1(認(rèn)知穩(wěn)定):與基線智商相比較,變動(dòng)范圍不超過(guò)±1倍標(biāo)準(zhǔn)差;狀態(tài)2(認(rèn)知輕度惡化):與基線智商相比較,降低高于1倍標(biāo)準(zhǔn)差,但小于2倍標(biāo)準(zhǔn)差;狀態(tài)3(認(rèn)知好轉(zhuǎn)):與基線智商相比較,升高大于1倍標(biāo)準(zhǔn)差;狀態(tài)4(認(rèn)知重度惡化):與基線智商相比較,降低高于2倍標(biāo)準(zhǔn)差。
假設(shè)MCI轉(zhuǎn)歸中,相鄰狀態(tài)間可以相互轉(zhuǎn)化,但認(rèn)知好轉(zhuǎn)和惡化之間不能相互轉(zhuǎn)化,認(rèn)知功能發(fā)展成為重度惡化后將不再可逆,即將狀態(tài)1~3作為暫態(tài),狀態(tài)4作為吸收態(tài)。由此構(gòu)造的多狀態(tài)結(jié)構(gòu)圖見(jiàn)圖1。
根據(jù)轉(zhuǎn)移強(qiáng)度矩陣各行之和等于0,及對(duì)角線的轉(zhuǎn)移強(qiáng)度等于該行中其他轉(zhuǎn)移強(qiáng)度之和的相反數(shù),該模型的轉(zhuǎn)移強(qiáng)度矩陣Q如下,共有6個(gè)待估轉(zhuǎn)移強(qiáng)度:q12、q13、q14、q21、q24和 q31。
圖1 MCI患者認(rèn)知變化狀態(tài)結(jié)構(gòu)圖
2.多狀態(tài)Markov模型的擬合結(jié)果
采用R軟件中的msm package進(jìn)行多狀態(tài)Markov模型分析〔6〕。依據(jù)各觀察時(shí)刻所處的狀態(tài),得出各狀態(tài)相互轉(zhuǎn)移出現(xiàn)的頻數(shù),見(jiàn)表1。
表1 各狀態(tài)轉(zhuǎn)移頻數(shù)
根據(jù)各狀態(tài)相互轉(zhuǎn)移頻數(shù),經(jīng)過(guò)多次迭代計(jì)算,最后設(shè)定初始轉(zhuǎn)移強(qiáng)度矩陣為:
(1)影響因素、轉(zhuǎn)移強(qiáng)度和轉(zhuǎn)移概率
多因素分析結(jié)果、轉(zhuǎn)移強(qiáng)度和轉(zhuǎn)移概率估計(jì)見(jiàn)文獻(xiàn)〔2〕。
(2)逗留時(shí)間
本文計(jì)算了從基線到追蹤觀察2年各狀態(tài)總逗留時(shí)間。平均而言,每個(gè)MCI病人認(rèn)知功能穩(wěn)定時(shí)間大約為6.4年,處于輕度惡化的時(shí)間約為3.6年,好轉(zhuǎn)時(shí)間約為5.2年。
(3)轉(zhuǎn)歸預(yù)測(cè)
將吸收態(tài)(狀態(tài)4)作為生存分析的終點(diǎn),狀態(tài)1、狀態(tài)2和狀態(tài)3分別作為起點(diǎn),可得到三條生存曲線,圖2和圖3分別為2年和5年內(nèi)所對(duì)應(yīng)生存曲線。其橫軸為時(shí)間,縱軸為期望生存率(expected probability of survival)。
圖2 生存曲線(2年)
(4)擬合優(yōu)度評(píng)價(jià)
圖3 生存曲線(5年)
圖4分別給出了每個(gè)狀態(tài)實(shí)際頻數(shù)和理論頻數(shù)百分比曲線,其橫軸為時(shí)間,縱軸為實(shí)際頻數(shù)百分比和理論頻數(shù)百分比,通過(guò)觀察兩條曲線的吻合程度,我們可以對(duì)多狀態(tài)模型擬合優(yōu)度進(jìn)行初步評(píng)價(jià)。本文有5次觀察時(shí)間資料,時(shí)間間隔是6個(gè)月,模型擬合開(kāi)始部分較差,之后趨于重疊,模型擬合較好。
圖4 模型評(píng)價(jià)圖
1.多狀態(tài)Markov模型的特點(diǎn)
生存分析己在醫(yī)學(xué)研究中得到廣泛應(yīng)用,傳統(tǒng)的生存分析可稱為兩狀態(tài)模型(two state model),因?yàn)橹豢捎^察到兩個(gè)狀態(tài)和一個(gè)時(shí)間間隔。因此,它屬于單過(guò)程的生存分析。許多疾病,尤其是慢性病的發(fā)展通常具有多階段、多狀態(tài)的特點(diǎn),這些階段或者狀態(tài)可以依照一定的專業(yè)知識(shí)劃分,從而可以分析影響疾病轉(zhuǎn)歸的因素在不同階段的作用強(qiáng)度或方式,為疾病防治提供理論依據(jù)。本文以MCI轉(zhuǎn)歸為例,說(shuō)明了多狀態(tài)模型的應(yīng)用,基本方法同樣可以用來(lái)分析其他慢性病、腫瘤以及其他具有階段性變化的疾病進(jìn)程。
多狀態(tài)Markov模型種類繁多,在實(shí)際應(yīng)用中,應(yīng)根據(jù)專業(yè)依據(jù)選擇模型種類和轉(zhuǎn)移模式。在此基礎(chǔ)上盡量使模型簡(jiǎn)約,如規(guī)定不能進(jìn)行逆轉(zhuǎn),各狀態(tài)只能漸進(jìn),則處理起來(lái)就比較方便。如在癌癥和某些嚴(yán)重的慢性病治療或隨訪觀察過(guò)程中,其病情逐漸加重、產(chǎn)生并發(fā)癥并最終導(dǎo)致死亡。據(jù)此可以進(jìn)行模型簡(jiǎn)化。
盡管多狀態(tài)Markov模型在分析隨訪資料時(shí)具有許多優(yōu)點(diǎn),但也有一些局限性。首先Markov模型建立在一定假定條件之上,它假定疾病的發(fā)展僅僅取決于目前狀態(tài),而與過(guò)去的各狀態(tài)無(wú)關(guān)。在臨床實(shí)際中,疾病的轉(zhuǎn)歸可能還會(huì)與一些重要的既往史有關(guān),所以我們應(yīng)根據(jù)臨床意義合理選擇多狀態(tài)的類型。其次,由于狀態(tài)劃分和建模的多樣性,實(shí)際工作中者很難編制相應(yīng)的計(jì)算程序,這在一定程度上限制了其推廣使用。理論方面還存在一些問(wèn)題,如擬合優(yōu)度檢驗(yàn),左刪失、右刪失及區(qū)間刪失均存在情況下的參數(shù)估計(jì)〔7〕。
2.多狀態(tài)Markov模型應(yīng)用注意事項(xiàng)
(1)模型中的狀態(tài)必須能夠代表疾病進(jìn)展過(guò)程中的典型階段或重要事件,這些狀態(tài)間必須互不相容,以確保模型中患者在任何時(shí)點(diǎn)只處于一種狀態(tài)??梢杂幸粋€(gè)吸收態(tài),也可以有一個(gè)以上的吸收態(tài),在慢性病研究中一般將“死亡”作為吸收態(tài),也可以根據(jù)吸收態(tài)的不可逆性,將病情比較嚴(yán)重、幾乎不可逆轉(zhuǎn)的某種狀態(tài)作為吸收態(tài)。在多狀態(tài)Markov模型中,狀態(tài)的多少、狀態(tài)之間是否可逆、哪種狀態(tài)作為吸收態(tài),隨研究目的不同而不同,應(yīng)根據(jù)專業(yè)知識(shí)確定轉(zhuǎn)移模式。
(2)Markov模型在較長(zhǎng)時(shí)間后,逐漸趨向穩(wěn)定,而與初始狀態(tài)無(wú)關(guān)。尤其是進(jìn)行預(yù)測(cè)時(shí),要求觀察的時(shí)間序列要足夠長(zhǎng)。
(3)應(yīng)盡量有準(zhǔn)確的觀察開(kāi)始時(shí)間、進(jìn)入吸收態(tài)的時(shí)間或刪失時(shí)間,每個(gè)個(gè)體發(fā)生任何一次轉(zhuǎn)移的時(shí)間。若限于人、財(cái)、物等客觀條件,只能定期對(duì)病人進(jìn)行檢查,如每年1次,兩個(gè)相鄰的狀態(tài)時(shí)間點(diǎn)之間處于什么狀態(tài)判斷不清楚,即著名的時(shí)間間隔疏漏(time interval omission)問(wèn)題〔8〕。
1.Andersen PK,Perme MP.Inference for outcome probabilities in multistate models.Lifetime Data Analysis,2008,14:405-431.
2.楊珊珊,周立業(yè),梁瑞峰,等.多狀態(tài)Markov模型在社區(qū)老年人輕度認(rèn)知損害轉(zhuǎn)歸分析中的應(yīng)用.中華流行病學(xué)雜志,2011,32(1):25-28.
3.余紅梅.多狀態(tài)模型簡(jiǎn)介.中國(guó)衛(wèi)生統(tǒng)計(jì),2005,22(3):177-180.
4.易華云,劉愛(ài)忠,張琰.Markov模型在衛(wèi)生領(lǐng)域中應(yīng)用簡(jiǎn)介.循證醫(yī)學(xué),2008,8(3):172-176.
5.Meira-Machado L,U~na-álvarez J,Cadarso-Suárez C,et al.Multi-state models for the analysis of time-to-event data.Statistical Methods in Medical Research,2009,18:195-222.
6.Jackson C.Multi-state modeling with R:the msm package(version 0.9.1),2009.
7.傅承主,方積乾,柳青.疾病自然史的隨機(jī)模型.生物數(shù)學(xué)學(xué)報(bào),1996,22(5):133-138.
8.安小妹,凌莉.Markov模型在生命統(tǒng)計(jì)中的研究進(jìn)展.中國(guó)衛(wèi)生統(tǒng)計(jì),2007,24(4):436-439.