吳瑤瑤 程璐瑤 郭海健 徐金水 閔 捷△
【提 要】 目的 構(gòu)建糖尿病特異性生活質(zhì)量量表(DSQL)到歐洲五維健康效用量表(EQ-5D)映射模型,將DSQL得分轉(zhuǎn)換為健康效用值。方法 從江蘇省糖尿病并發(fā)癥監(jiān)測(cè)點(diǎn)上按糖尿病4種并發(fā)癥進(jìn)行抽樣調(diào)查,418例患者作為訓(xùn)練集,75例糖尿病患者作為驗(yàn)證集。使用普通最小二乘法(OLS)、Tobit回歸法和截尾最小絕對(duì)偏差法(CLAD)建立模型,調(diào)整R2、平均絕對(duì)誤差(MAE)和均方誤差(MSE)評(píng)價(jià)每個(gè)模型,用訓(xùn)練集進(jìn)行內(nèi)部十折交叉驗(yàn)證,用驗(yàn)證集進(jìn)行外部驗(yàn)證。結(jié)果 訓(xùn)練集平均年齡為62.07歲,糖尿病特異性生存質(zhì)量量表的平均得分為49.15分,EQ-5D效用值平均為0.9435。三種回歸方法中,CLAD法的預(yù)測(cè)效果最好,該模型由生理功能、心理精神、社會(huì)關(guān)系和治療影響以及生理功能和心理精神的交互作用組成。結(jié)論 當(dāng)有DSQL得分而無EQ-5D結(jié)果時(shí),可以運(yùn)用本文的映射模型獲得效用值,用于衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)和臨床研究。
糖尿病是由遺傳因素和環(huán)境因素共同作用導(dǎo)致的,已成為危害人民健康、影響生活質(zhì)量和加重生活負(fù)擔(dān)的慢性非傳染病之一[1]。成本-效用分析是慢性非傳染性疾病衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)常用方法,該方法既考慮了生存時(shí)間又考慮了生存質(zhì)量。糖尿病特異性生存質(zhì)量量表(diabetes specific quality of life scale,DSQL)是一種非基于健康偏好的量表,能夠全面評(píng)價(jià)糖尿病患者的生存質(zhì)量和疾病負(fù)擔(dān)[2],但該量表無法直接獲得反映生存質(zhì)量的健康效用值。而基于偏好的歐洲五維健康效用量表(EuroQol five-dimensional questionnaire,EQ-5D)因其結(jié)構(gòu)簡(jiǎn)單,容易理解和操作而得到廣泛應(yīng)用。多個(gè)國家已結(jié)合本國實(shí)際,研究出適合本國人群的效用值積分換算體系[3-4],但該量表是普適性的,與疾病的關(guān)聯(lián)性較低。
映射法本質(zhì)是回歸分析,描述兩個(gè)量表的數(shù)量關(guān)系。近年來,國內(nèi)外研究者建立了多種疾病特異性專屬量表向EQ-5D轉(zhuǎn)化的映射模型[5-10],但未見有糖尿病特異性生存質(zhì)量量表的映射研究。
因此,本文利用江蘇省糖尿病并發(fā)癥篩查的部分患者生存質(zhì)量調(diào)查信息,制定一種映射算法,幫助實(shí)現(xiàn)糖尿病特異性量表積分生成EQ-5D健康效用指數(shù),以便臨床工作者和經(jīng)濟(jì)學(xué)家在有DSQL而無EQ-5D時(shí)仍然能夠獲得患者的健康狀態(tài)和疾病負(fù)擔(dān),為進(jìn)一步制定有利于患者的政策提供依據(jù)。
1.研究對(duì)象
本次研究分別從江蘇省蘇南、蘇北地區(qū)糖尿病并發(fā)癥監(jiān)測(cè)點(diǎn)上按病種(無并發(fā)癥、糖尿病視網(wǎng)膜病變、糖尿病腎病、糖尿病周圍神經(jīng)病變以及糖尿病足)抽取患者,排除因各種原因不能理解量表內(nèi)容或者交流有問題的研究對(duì)象,共抽取9個(gè)監(jiān)測(cè)點(diǎn)519例患者,將前7個(gè)點(diǎn)444例患者作為訓(xùn)練集,用來建立映射模型;最后調(diào)查的2個(gè)監(jiān)測(cè)點(diǎn)75例患者作為驗(yàn)證集。所有研究對(duì)象知情同意并簽署知情同意書。為了保證問卷質(zhì)量,由接受統(tǒng)一培訓(xùn)的調(diào)查員對(duì)所有研究對(duì)象進(jìn)行一對(duì)一的面對(duì)面訪談,完成問卷內(nèi)容。
2.研究?jī)?nèi)容
調(diào)查問卷由三部分組成,分別為人口學(xué)特征、糖尿病特異性生活質(zhì)量量表和EQ-5D量表。糖尿病特異性生活質(zhì)量量表由四個(gè)維度組成,分別是生理功能、心理精神、社會(huì)關(guān)系和治療對(duì)患者的影響,共有27個(gè)條目,每個(gè)條目的分值是1~5分,其中生理功能12~60分,心理精神8~40分,社會(huì)關(guān)系4~20分,治療3~15分??偡种凳?7~135分,27分代表最好的健康狀態(tài),135分代表最差的健康狀態(tài)。
EQ-5D有兩種形式,分別是EQ-5D-5L和EQ-5D-3L[11]。本研究使用的EQ-5D-3L由五個(gè)問題和VAS得分組成,五個(gè)問題分別是活動(dòng)能力、自我護(hù)理、日常活動(dòng)、疼痛/不適和焦慮/抑郁。每個(gè)問題的答案有三個(gè)選項(xiàng),1代表沒有問題,2代表輕微問題,3代表嚴(yán)重問題,共包含243種健康狀態(tài),不同健康狀態(tài)對(duì)應(yīng)不同的健康效用值[12]。VAS得分在0~100分之間,100分代表研究對(duì)象認(rèn)為目前的身體狀態(tài)是想象的最好狀態(tài)。
3.數(shù)據(jù)分析
效用值的計(jì)算方法:根據(jù)2018年基于中國人口的效用值積分換算體系將EQ-5D的內(nèi)容換算成健康效用值,表達(dá)式為:U=1-(0.0766×M2+0.2668×M3+ 0.0441×S2+0.2912×S3+0.0370×U2+0.0538×U3+0.0274×P2+0.0409×P3+0.0359×A2+0.1771×A3),變量M、S、U、P、A分別代表量表中的5個(gè)問題。下標(biāo)i=2,3分別代表第二個(gè)選項(xiàng),第三個(gè)選項(xiàng)。最好的健康狀態(tài)是11111,其健康效用值為1。
模型的選擇:本次研究選擇3個(gè)常用的計(jì)量經(jīng)濟(jì)學(xué)模型,即普通最小二乘法(OLS)模型、Tobit模型和截尾最小絕對(duì)偏差模型(CLAD)。
OLS模型[13]是計(jì)量經(jīng)濟(jì)學(xué)中常用的一般線性回歸方法,其表達(dá)式為:
Yi=Xiβ+εi,εi~(0,σ2)
由于OLS模型預(yù)測(cè)值可能大于1,而健康效用值的測(cè)量存在上限為1的情況,即所謂“天花板效應(yīng)”,因此提出了Tobit模型,該模型[14]適用于一些存在“天花板效應(yīng)”的數(shù)據(jù),當(dāng)誤差項(xiàng)滿足正態(tài)性和方差齊性時(shí),模型的擬合效果更好。模型表達(dá)式為:
CLAD模型是解決天花板效應(yīng)的另一種方法,該方法是基于中位數(shù)回歸,原理是最小化絕對(duì)偏差的和,解決了Tobit模型要求誤差滿足正態(tài)性和方差齊性的局限性[13]。
本文在模型擬合過程中考慮不同的自變量?jī)?nèi)容,建立以下6個(gè)模型:
模型1:僅含DSQL總分
模型2:僅含DSQL各維度得分
模型3:DSQL各維度得分和模型2中有統(tǒng)計(jì)學(xué)意義變量的交互項(xiàng)
模型4:DSQL總分和社會(huì)人口學(xué)特征變量
模型5:DSQL各維度得分和社會(huì)人口學(xué)特征變量
模型6:DSQL各維度得分、模型2中有統(tǒng)計(jì)學(xué)意義變量的交互項(xiàng)和社會(huì)人口學(xué)特征變量
用三種回歸方法分別建立這6個(gè)模型,模型的評(píng)價(jià)指標(biāo)為調(diào)整R2、均方誤差(MSE)和平均絕對(duì)誤差(MAE)。為了實(shí)現(xiàn)模型之間的比較,采用OLS模型、Tobit模型和CLAD模型預(yù)測(cè)值與實(shí)際值的相關(guān)系數(shù)r計(jì)算R2[15]。模型初步比較后,選擇較優(yōu)模型進(jìn)行十折交叉驗(yàn)證(10-fold cross-validation)和外部驗(yàn)證,進(jìn)一步確定最優(yōu)模型和驗(yàn)證模型的穩(wěn)定性。
本研究采用EpiData 3.1軟件進(jìn)行數(shù)據(jù)雙錄入,運(yùn)用Stata 16.0處理數(shù)據(jù)和構(gòu)建模型,R 6.4進(jìn)行十折交叉驗(yàn)證。
1.一般人口學(xué)特征
本研究共收集519份調(diào)查問卷,,去除問卷內(nèi)容填寫不完整的26份,最終納入分析的為訓(xùn)練集418份和驗(yàn)證集75份。訓(xùn)練集中418名參與者的平均年齡為62.07(9.39)歲,以50~70歲人群為主;女性、農(nóng)村地區(qū)、已婚人群、低學(xué)歷者比例較高。驗(yàn)證集的平均年齡為66.02(10.30)歲,以城市地區(qū)人群為主。由兩個(gè)數(shù)據(jù)集的一般人口學(xué)特征比較可知,年齡、地區(qū)和教育水平差異有統(tǒng)計(jì)學(xué)意義,訓(xùn)練集和驗(yàn)證集的人口學(xué)特征不完全一致(表1)。
表1 一般人口學(xué)特征
2.效用值
訓(xùn)練集中418名參與者的效用值平均為0.9435(0.11),有180例(43.06%)達(dá)到最大的效用值1,糖尿病特異性生存質(zhì)量量表的平均得分為49.15分,生理功能維度、心理精神維度、社會(huì)關(guān)系維度和治療影響維度的平均得分分別為23.10(7.57)、15.35(4.05)、5.92(1.79)和4.78(1.69)。由圖1、圖2可知,EQ-5D-3L效用值分布呈現(xiàn)左偏態(tài),DSQL量表總分呈現(xiàn)右偏態(tài)。
圖1 EQ-5D-3L效用值分布
圖2 糖尿病生存質(zhì)量量表得分分布
3.模型的構(gòu)建
表2為DSQL映射到EQ-5D的三種回歸方法的回歸系數(shù)。應(yīng)用三種回歸方法共擬合18種模型,模型均有統(tǒng)計(jì)學(xué)意義(P<0.05)。生理功能維度在10個(gè)模型中均有統(tǒng)計(jì)學(xué)意義,心理精神維度在OLS回歸模型2、3、5和6有統(tǒng)計(jì)學(xué)意義,生理功能和心理精神的交互作用除在Tobit法模型中無統(tǒng)計(jì)學(xué)意義外,其他包含該交互項(xiàng)的模型均有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為生理功能和心理精神對(duì)效用值的大小有影響。模型4、5、6添加了性別和年齡人口學(xué)特征變量,性別在Tobit回歸的三個(gè)模型中均有統(tǒng)計(jì)學(xué)意義且回歸系數(shù)為負(fù),表明男性的效用值高于女性;年齡僅在Tobit模型4和CLAD模型5中有統(tǒng)計(jì)學(xué)意義。
表2 OLS、Tobit和CLAD三種回歸方法各種組合模型的回歸系數(shù)
4.模型評(píng)價(jià)指標(biāo)比較
表3列出了三種回歸方法18種模型評(píng)價(jià)指標(biāo)結(jié)果,總的來看模型3和模型6有較大的調(diào)整R2與較小的MSE和MAE。而模型3與模型6又以CLAD法最為理想,有最大的調(diào)整R2,MAE和MSE也比較小,因此考慮模型3和模型6的擬合效果較好。為了進(jìn)一步探討模型的穩(wěn)定性,對(duì)三種回歸方法的模型3和模型6做十折交叉驗(yàn)證。即每次將樣本分成10份,9份為訓(xùn)練集,一份為測(cè)試集,通過對(duì)測(cè)試集進(jìn)行預(yù)測(cè)計(jì)算MAE和MSE,結(jié)果CLAD法模型3的MAE為0.0379,MSE為0.0069,模型6的MAE為0.0394,MSE為0.0070(表4)。交叉驗(yàn)證的結(jié)果也表明CLAD法的效果較好,包含生理功能、心理精神、社會(huì)關(guān)系和治療影響以及生理功能和心理精神的交互作用模型3的擬合效果最好,以較小的MAE(0.0383)和MSE(0.0063)解釋了42.96%的變化。
表3 訓(xùn)練集各個(gè)模型評(píng)價(jià)指標(biāo)比較
表4 交叉驗(yàn)證結(jié)果比較
5.外部驗(yàn)證
選擇三種回歸方法(OLS、Tobit、CLAD)的模型3和模型6進(jìn)行外部驗(yàn)證的結(jié)果見表5。三種回歸方法中,CLAD法的MAE和MSE最小且在模型3和模型6中(0.0345 vs 0.0336;0.0038 vs 0.0330)差異均無統(tǒng)計(jì)學(xué)意義(P=0.8996,P=0.9723);綜合外部驗(yàn)證6個(gè)模型結(jié)果,CLAD模型3、6在預(yù)測(cè)值的均數(shù)、標(biāo)準(zhǔn)差、MAE、MAE都顯示較低的偏差。
表5 6個(gè)模型外部驗(yàn)證結(jié)果
本文選擇了映射研究常用的三種方法,即OLS、Tobit和CLAD方法,以調(diào)整R2與反應(yīng)總體預(yù)測(cè)能力的MSE和反映個(gè)體預(yù)測(cè)能力的MAE相結(jié)合確定最優(yōu)模型。結(jié)果顯示,CLAD法模型3的調(diào)整R2僅次于模型6,但模型3的結(jié)構(gòu)更簡(jiǎn)單。交叉驗(yàn)證與外部驗(yàn)證表明,CLAD法的模型3具有良好的穩(wěn)定性,說明包含生理功能、心理精神、社會(huì)關(guān)系和治療影響以及生理功能和心理精神的交互作用變量的模型3可認(rèn)為是最佳模型。一份系統(tǒng)評(píng)價(jià)報(bào)告顯示,從特定調(diào)查表到一般衛(wèi)生效用測(cè)量映射的R2通常在0.4到0.6之間[16],本研究CLAD模型3的調(diào)整R2為0.4296,也在這一范圍內(nèi)。雖然R2沒有很高,但與其他模型相比,也得出CLAD法的映射效果最好[17]。有研究表明,OLS模型優(yōu)于Tobit以及CLAD模型[18],但本研究并沒有得出這樣的結(jié)論,可能是由于本研究的天花板效應(yīng)較高,數(shù)據(jù)不滿足方差齊性,因此得出了CLAD法的模型擬合效果較好的結(jié)果。
本文在模型4~模型6中包含人口學(xué)特征變量時(shí)也曾考慮引入地區(qū)、教育水平與婚姻狀況,但發(fā)現(xiàn)對(duì)模型總變異的影響較小,因此最終只考慮了性別與年齡兩個(gè)基本變量。這與Siani的研究選取的變量一致,因?yàn)樾詣e和年齡是臨床上重要的預(yù)測(cè)因子[19]。年齡變量在所有回歸模型中,僅有兩個(gè)模型表明年齡變量在模型中有統(tǒng)計(jì)學(xué)意義,Abdin的研究中有一部分模型也探索出年齡與效用值的關(guān)系[8]。兩個(gè)較優(yōu)模型相比,性別和年齡變量會(huì)使調(diào)整R2增大0.0061,表明該變量對(duì)改善模型預(yù)測(cè)效果的作用不大,這也是選擇模型3的另一點(diǎn)考慮。
有研究表明,基于EQ-5D量表的映射會(huì)出現(xiàn)天花板效應(yīng)[20],有的會(huì)達(dá)到25%。本研究達(dá)43%,天花板效應(yīng)較強(qiáng)。偏高的主要原因是研究對(duì)象主要來源于社區(qū)人群,社區(qū)人群中大多數(shù)沒有并發(fā)癥或者并發(fā)癥處于穩(wěn)定狀態(tài),生活質(zhì)量較好。相反,針對(duì)住院病人的研究,其天花板效應(yīng)會(huì)相對(duì)減弱[10]。不同比例“天花板效應(yīng)”的映射模型可能會(huì)有所不同,這也是將來要進(jìn)行探索的。
本研究的局限性主要是訓(xùn)練集的樣本量不夠大,所得到的健康狀態(tài)相對(duì)較少,構(gòu)建的模型雖已進(jìn)行外部驗(yàn)證,但是用于外部驗(yàn)證的樣本量有限,模型的可推廣性有待進(jìn)一步驗(yàn)證。本研究CLAD法構(gòu)建的包含生理功能、心理精神、社會(huì)關(guān)系、治療影響以及生理功能和心理精神的交互作用的模型為較優(yōu)模型。該模型提供了糖尿病特異性量表轉(zhuǎn)化為EQ-5D效用量表的健康效用值,為臨床醫(yī)生和研究人員研究糖尿病相關(guān)疾病負(fù)擔(dān)和成本效益分析提供了依據(jù)。