邢亞彬 馬愛霞
(中國藥科大學國際醫(yī)藥商學院 南京 211198)
伴隨著新醫(yī)改的實施,中國的公共衛(wèi)生事業(yè)和醫(yī)療技術(shù)水平在不斷地發(fā)展和進步,中國居民的健康水平也得到了極大的提高。同樣,測量人們健康水平的量表也在不斷地完善。當然,測量健康水平的量表有許多,但是,歐洲五維健康量表(EQ-5D)作為一種簡單、方便的量表在全世界范圍內(nèi)得到了廣泛的應用。
歐洲五維健康量表(EQ-5D)是一種多維的健康相關(guān)生存質(zhì)量的測量量表。而EQ-5D-3L是最初的EQ-5D版本,用來衡量和評價用戶的健康狀況。
EQ-5D量表[1]由問卷和效用值換算表兩部分組成。EQ-5D問卷可分為 EQ-5D 健康描述系統(tǒng)和 EQ-VAS 兩部分。EQ-5D健康描述系統(tǒng)包括5個維度:行動能力(Mobility)、自己照顧自己能力(Self-care)、日?;顒幽芰Γ║sual Activities)、疼痛或不舒服(Pain/Discomfort)、焦慮或抑郁(Anxiety/Depression)。EQ-5D-3L每個維度包含3個水平:沒有任何困難、有些困難、有極度困難。EQ-VAS是長20 cm的垂直視覺刻度尺。頂端為100分,代表“心目中最好的健康狀況”,底端為0分,代表“心目中最差的健康狀況”。效用值換算表是一個計算公式,可以根據(jù)受訪者在問卷中5維度、3水平上做出的選擇,計算出EQ-5D-3L指數(shù)得分,該得分代表了受訪者的健康狀況。EQ-5D-3L可測量243種可能的健康狀況組合。
EQ-5D-3L相比其它的健康量表雖然存在一定的優(yōu)勢,但也有很嚴重的天花板效應(ceiling effect)[2]。所以,我們應盡量避免設(shè)計上的極端反應,增加每個維度水平上的量程分布,使得EQ-5D能夠更可靠地區(qū)別對待不同層次的健康。根據(jù)此原理,EuroQol 的研究人員在EQ-5D-3L問卷的基礎(chǔ)上設(shè)計了EQ-5D-5L問卷。
同EQ-5D-3L一樣,EQ-5D-5L也是由問卷和效用值換算表兩部分組成。不同的是EQ-5D-5L每個維度又包含5個水平:沒有任何困難、有輕微困難、有中等困難、有嚴重困難、有極其嚴重困難。所以它可測量3 125種可能的健康狀況組合。實質(zhì)上,EQ-5D-5L是在EQ-5D-3L的基礎(chǔ)上每個維度再增加2個水平,這樣就能夠很好地提高它的靈敏度并降低EQ-5D-3L所帶來的天花板效應。
EQ-5D-3L與EQ-5D-5L都有5個維度,都有同樣的EQ-VAS視覺刻度尺,而且EQ-5D-5L每個維度的1、3、5水平與EQ-5D-3L的1、2、3水平基本類似,但并不完全相同。例如,在EQ-5D-5L中每個維度的3水平上都被改成了“有中等困難”。還有,EQ-5D-3L在行動能力這個維度的3水平上是“我臥病在床”,而EQ-5D-5L在這個維度上的5水平則是“我無法行走”。另外,EQ-5D-5L在每個維度增加的2水平上表述為“輕微困難”,在4水平上則表述為“嚴重困難”。在測量健康狀況的組合中,EQ-5D-3L可以測量243種健康狀態(tài),而EQ-5D-5L可以囊括3 125種健康狀況組合。
另外,使用數(shù)據(jù)庫檢索文獻發(fā)現(xiàn),使用EQ-5D來衡量的主要研究對象是患病人群,研究對象為健康人群的文獻數(shù)量很少,而國內(nèi)使用最新的EQ-5D-5L版本來衡量健康狀況的研究更是沒有涉及。但是,據(jù)文獻研究顯示,國外在使用EQ-5D-5L問卷測量健康人群或者患病人群的調(diào)研已普及開來。因此,為了推廣EQ-5D新版本在國內(nèi)的使用,本文根據(jù)調(diào)研數(shù)據(jù)率先分析論證了EQ-5D-3L和EQ-5D-5L的關(guān)系以及EQ-5D-5L所擁有的優(yōu)越性,從而能夠更好地促進EQ-5D-5L在國內(nèi)的應用,提高量表區(qū)分不同健康水平的能力。
本次調(diào)研的目的是為了驗證EQ-5D-5L較之EQ-5D-3L的優(yōu)越性,以提高其在國內(nèi)的使用,從而更好地區(qū)分不同的健康水平,改善中國居民的健康狀況。研究者設(shè)計了針對本次調(diào)研的開放性實驗問卷,并對324名受訪者進行問卷調(diào)查,每名受訪者首先回答一些自身基本情況的問題和EQ-5D-3L問卷,半小時之后填寫EQ-5D-5L問卷。
納入標準:①神志清醒、能清楚表達自己意見者。②對調(diào)查內(nèi)容知情,同意配合者。排除標準:①喪失視力的患者。②神志不清、癡呆、各種精神病患者及不愿意合作者。
根據(jù)調(diào)研數(shù)據(jù)的采集,采用Excel數(shù)據(jù)庫進行數(shù)據(jù)錄入,SPSS 18.0統(tǒng)計分析,描述EQ-VAS得分、EQ-5D健康維度分布、EQ-5D指數(shù)得分。利用EQ-5D指數(shù)得分可以對健康狀況進行衡量,計算Shannon指數(shù)和天花板效應評價兩個版本量表的信息性,根據(jù)EQ-5D-3L和EQ-5D-5L在各水平的重新分布來確定不同版本性能的差異,從而驗證EQ-5D-5L比EQ-5D-3L能夠更好地區(qū)分不同的健康水平。
2.3.1 EQ-5D指數(shù)的計算
1) EQ-5D-3L指數(shù)的計算。本次研究需要用到健康效用值。測量健康效用值有兩種方法,包括直接測量法和間接測量法。直接測量法是通過直觀的方法,直接從受試者得到其健康效用值;間接測量法是通過讓受試者填寫問卷,從受試者對各問題的選擇來得到其所對應的健康效用值。本次研究的健康效用值是通過相應人群的效用值轉(zhuǎn)換表由EQ-5D問卷中對5個問題的選擇情況得到的。但是,目前還沒有適合中國人群的效用值換算表,本次研究使用了世界公認的英國效用值換算表來獲得EQ-5D-3L指數(shù)得分。但是,經(jīng)過10多年的時間,總體人群對健康的偏好可能發(fā)生了改變,所以可能與當前人群對生存質(zhì)量的評價有些偏差。
2) EQ-5D-5L指數(shù)的計算。國際藥物經(jīng)濟學與結(jié)果研究協(xié)會第17屆國際會議于2012年6月2日在美國舉行,會議中探討了EQ-5D-5L的使用情況。根據(jù)會議的研究結(jié)果,可以依據(jù)4種模型計算得出EQ-5D-5L價值集,從而計算指數(shù)值,分別為線性回歸模型、非參數(shù)統(tǒng)計模型、logistic回歸模型、項目反應理論。根據(jù)之前的調(diào)查研究,利用非參數(shù)統(tǒng)計模型、logistic回歸模型這兩種方法能夠更好地降低EQ-5D-5L的天花板效應,另外考慮到簡便性的原因,研究人員最終選擇了非參數(shù)統(tǒng)計模型來計算EQ-5D-5L指數(shù)值。EQ-5D-5L指數(shù)的計算主要是獲得EQ-5D-3L和EQ-5D-5L之間的轉(zhuǎn)移概率矩陣,然后讓EQ-5D-3L的指數(shù)乘以每個效用權(quán)重然后再加和,即可得到其指數(shù)值。通過EQ-5D官方網(wǎng)站,目前我們可以計算約10個國家EQ-5D-5L的指數(shù)值,本文EQ-5D-5L指數(shù)值同樣使用評價較好的英國版本。
2.3.2 信息性
EQ-5D的信息性是指其辨別能力。天花板效應使得EQ-5D-3L問卷在兩個極端水平上的選擇數(shù)量增多,使其辨別力下降,而通過增加EQ-5D-3L的各維度水平的數(shù)量可以直接降低天花板效應。EQ-5D的信息性可以用Shannon指數(shù)(H’)和Shannon均勻度指數(shù)(J’)來評估。
根據(jù)其計算公式可知,H'max在EQ-5D-3L問卷中最大值為1.58,而在EQ-5D-5L問卷中最大值為2.32。所以H'max值的增加代表著問卷各維度水平數(shù)量的增加,其辨別能力也相應地增加。
表1描述了納入本次研究的受訪者的社會人口學變量。研究對象中男、女比例相當。接受調(diào)查的居民的平均年齡為43.62歲,方差為268.762。本次調(diào)查漢族占大多數(shù),婚姻狀況為已婚并共同生活的占67.6%,受教育程度為受中等教育的人數(shù)較多。從業(yè)狀況中,正式員工(128人,占39.5%)、離退休(69人,21.3%)、學生(55人,17.0%)。
在表2中,EQ-5D-3L在自我照顧能力這個維度上表現(xiàn)得最好,沒有一個居民在自我照顧上存在問題,在行動能力、日?;顒幽芰蓚€維度上也僅有較小比例的居民存在著問題(分別為4.3%和2.8%),但是,在疼痛或不舒服、焦慮或抑郁兩個維度上有較多的居民存在問題(分別為21.3%和13%)。在EQ-5D-5L問卷中,研究對象在健康五維度方面存在問題的比例高低依次為:疼痛或不舒服(36.7%)、焦慮或抑郁(25%)、行動能力(5.2%)、日?;顒幽芰Γ?.4%)、自己照顧自己能力(0.6%)。
研究分析可知,EQ-5D-3L問卷中所有的問題EQ-5D-5L都有涉及(3L-5L 可以記作1=1,2=3,3=5)。如果受試者在沒有問題和有中度問題或者有中度問題和有非常嚴重的問題上沒有分歧,那么我們可以說EQ-5D-3L和EQ-5D-5L展現(xiàn)出來的結(jié)果是一樣的。但是,也存在一些受試者覺得自己的健康狀況處于EQ-5D-3L問卷中的1水平和2水平或者是2水平和3水平之間,但是又不知道該怎樣選擇。這時候EQ-5D-3L就存在了一定的缺陷,問卷本身的測量健康狀況的靈敏度也就降低了。
受試者在回答兩個版本的EQ-5D時,具有重新分配的結(jié)果。重新分配是同一個受試者在回答EQ-5D-5L問卷和EQ-5D-3L問卷時會存在著細微的差異,這種差異也可能有著根本的不一致,所謂的不一致性是指在同一維度上不同水平之間存在著根本性的差異。例如:在回答EQ-5D-3L問卷的某一維度時,回答的是1水平,而在回答EQ-5D-5L問卷時回答的是3、4水平或者5水平,這種情況就稱之為不一致性。等同于EQ-5D-3L的1水平與EQ-5D-5L的1、2水平相對應,2水平與2、3、4水平相對應,3水平與4、5水平相對應。表3展現(xiàn)了本研究在兩個版本不同水平上受試者回答不一致的情況。
表1 本次受訪者的社會人口學變量描述
表2 受試者回答EQ-5D-3L和EQ-5D-5L問卷的重新分配
本研究數(shù)據(jù)顯示,受試者關(guān)于兩版本回答的平均不一致率為0.8%。相比其他國家,韓國研究人員關(guān)于癌癥病人的EQ-5D-3L和EQ-5D-5L對比結(jié)果顯示平均不一致率為3.5%[3];美國癌癥病人的平均不一致率為4.3%[2];波蘭健康人群的平均不一致率為3.0%[4]。本研究平均不一致率較低的原因可能是前后兩次量表測量間隔時間較短或受試人群都是健康人群的緣故。
表3 EQ-5D-3L和EQ-5D-5L的不一致率
通過表4關(guān)于兩個版本在“沒有任何問題”水平上的比例我們可以發(fā)現(xiàn),在行動能力、自己照顧自己能力、日?;顒幽芰@3個維度上,EQ-5D-3L和EQ-5D-5L在第一水平上基本上沒有差異,而在疼痛或不舒服和焦慮或抑郁這兩個維度上(分別為78.7%對63.3%、87.0%對75.0%),EQ-5D-3L和EQ-5D-5L存在著明顯的差異,這說明EQ-5D-3L的天花板效應在這兩個維度上明顯高于EQ-5D-5L。在全部健康(11111)狀態(tài)下,EQ-5D-5L的全部健康情況較EQ-5D-3L有明顯降低,這也說明EQ-5D-5L有著更好的區(qū)分能力。
表4 EQ-5D-3L和EQ-5D-5L在“沒有任何問題”水平上的比例
在上文中,我們提到EQ-5D的信息性可以用Shannon指數(shù)(H’)和Shannon均勻度指數(shù)(J’)來評估。表5展現(xiàn)了EQ-5D-3L和EQ-5D-5L的信息測試結(jié)果。EQ-5D-5L在所有水平上的Shannon指數(shù)全部大于EQ-5D-3L,這說明EQ-5D-5L具有更好的信息性。EQ-5D-5L的信息效用值(J’)在“自己照顧自己能力”以及“焦慮或抑郁”這兩個水平稍有提高,然而在其它水平上都有減小或者持平。
表5 EQ-5D-3L和EQ-5D-5L的Shannon指數(shù)和Shannon均勻性指數(shù)
本次研究得到居民的EQ-VAS的平均得分為86.41。表6表明了EQ-5D指數(shù)與年齡和VAS得分的關(guān)系,隨著年齡的增加,EQ-5D-3L和EQ-5D-5L指數(shù)有所下降,這表明伴隨著年齡的增大,人群的健康相關(guān)生存質(zhì)量也相應地下降。但是36~45歲的EQ-5D-3L和EQ-5D-5L指數(shù)大于26~35歲的,這說明36~45歲人群的健康狀況要好于26~35歲;相應地,隨著EQ-VAS得分的增加,EQ-5D-3L和EQ-5D-5L指數(shù)也在相應地增大,說明兩者均具有很好的相關(guān)關(guān)系。
表6 EQ-5D的指數(shù)(按照年齡與VAS得分)
通過上述關(guān)于健康人群EQ-5D-3L和EQ-5D-5L問卷的比較,EQ-5D-3L問卷的各水平大致分給相應的EQ-5D-5L的各水平,EQ-5D的兩個版本的平均不一致率為0.8%。與EQ-5D-3L相比,EQ-5D-5L受試者在回答“沒有任何困難”這個水平上數(shù)量有所下降,也就是EQ-5D-5L的靈敏度有所提高。在“疼痛或不舒服”和“焦慮或抑郁”這兩個維度上EQ-5D-3L存在很高的天花板效應,而在其它的維度上健康人群EQ-5D的兩個版本則表現(xiàn)出了相似的天花板效應。相比EQ-5D-3L的70.1%的完全健康狀態(tài),EQ-5D-5L下降到52.8%,EQ-5D-5L的全部健康(11111)情況有明顯降低,這說明EQ-5D-5L的辨別能力高于EQ-5D-3L,但是,他們的信息有效性基本上是一致的。而且通過計算EQ-5D指數(shù)與EQ-VAS的關(guān)系,能夠證明EQ-5D-5L和EQ-VAS有很好的相關(guān)性。
毫無疑問,EQ-5D-5L的Shannon指數(shù)高于EQ-5D-3L。EQ-5D-5L的Shannon指數(shù)的增大說明其能夠更好地描述不同的健康狀況。EQ-5D-5L的天花板效應依然存在,但是與EQ-5D-3L相比有所降低。本次研究是國內(nèi)第一次使用EQ-5D-5L量表來衡量用戶的健康狀況,相比以前的EQ-5D-3L,EQ-5D-5L具有更合理的健康區(qū)分能力。但是本文也存在著一些不足之處,比如受試人群都是健康人群;受試例數(shù)比較少;受試者的受教育程度、從業(yè)狀況存在一定的差異等。而且EQ-5D-5L依然存在一定的天花板效應,還需要我們繼續(xù)進行改善。
EQ-5D-5L的使用提高了不同健康水平的區(qū)分能力,能更好地跟蹤調(diào)查用戶的健康變化。與EQ-5D-3L相比,EQ-5D-5L有更好的辨別能力和較低的天花板效應。此外,EQ-5D-5L還表現(xiàn)出了良好的有效性。因此,綜合本文以上信息不難發(fā)現(xiàn),EQ-5D-5L比EQ-5D-3L更有優(yōu)越性,值得我們國內(nèi)工作者借鑒使用。
參考文獻
[1] 李明暉, 羅南. 歐洲五維健康量表(EQ-5D)中文版應用介紹[J]. 中國藥物經(jīng)濟學, 2009, 4(1): 49-57.
[2] Pickard AS, De Leon MC, Kohlmann T,et al. Psychometric comparison of the standard EQ-5D to a 5 level version in cancer patients[J]. Med Care, 2007, 45(3): 259-263.
[3] Kim SH, Kim HJ, Lee SI,et al. Comparing the psychometric properties of the EQ-5D-3L and EQ-5D-5L in cancer patients in Korea[J]. Qual Life Res, 2012, 21(6): 1065-1073.
[4] Herdman M, Gudex C, Lloyd A,et al. Development and preliminary testing of the new fi ve-level version of EQ-5D-5L[J]. Qual Life Res, 2011, 20(10): 1727-1736.