孫 悅,楊智豪,張若鈺,王 沛
1復旦大學公共衛(wèi)生學院,上海 200032
2貴州醫(yī)科大學醫(yī)藥衛(wèi)生管理學院,貴陽 550025
2009年歐洲生命質(zhì)量學會的專家在歐洲生命質(zhì)量五維度量表(EuroQol Five-Dimensional Questionnaire,EQ- 5D)的基礎上專為兒童和青少年開發(fā)的未成年人版本(EuroQol Five-Dimensional Questionnaire-Youth Version,EQ- 5D-Y),可廣泛用于8~15歲兒童和青少年健康相關生命質(zhì)量(health-related quality of life,HRQOL)測量[1]。EQ- 5D-Y由五維度的健康狀態(tài)描述系統(tǒng)(行動能力,自我照顧,做經(jīng)常做的事,疼痛或不舒服和感到擔心、傷心或不高興)和視覺標尺(visual analogue scale,EQ VAS)組成,其維度標題、措辭和布局相對于EQ- 5D都做了修訂,以提高對兒童和青少年的友好性、適用性和可理解性。與EQ- 5D有兩個版本即3水平(three-level version,3L)EQ- 5D (EQ- 5D- 3L,3L)與5水平(five-level version,5L)EQ- 5D(EQ- 5D- 5L,5L)一樣,EQ- 5D-Y也有3水平EQ- 5D-Y(EQ- 5D-Y- 3L,Y- 3L)和5水平EQ- 5D-Y(EQ- 5D-Y- 5L,Y- 5L)兩個版本,但后者目前尚未最終定稿還只是屬于試驗版本。
相較于其他用于測量未成年人HRQOL的量表如KIDSCREEN- 27、PedsQL、CHU9D等[2- 5],EQ- 5D-Y具有幾個顯著優(yōu)點。首先,它保留了EQ- 5D結(jié)構(gòu)簡潔、便于操作等特點,對兒童和青少年的填寫負擔較小。其次,如果分別在兒童和青少年時期使用EQ- 5D-Y、在成年階段使用EQ- 5D進行HRQOL測量,可以有意義地追蹤從兒童期到青春期再到成年期HRQOL的變化。最后,EQ- 5D-Y作為效用值量表,可以將其定義的健康狀態(tài)轉(zhuǎn)化為健康效用值從而用于衛(wèi)生經(jīng)濟學評價,能夠為基于未成年人的醫(yī)療政策或治療方案的衛(wèi)生經(jīng)濟學研究提供參考信息。因此,近年來越來越多研究開始關注EQ- 5D-Y。本文對目前有關EQ- 5D-Y的文獻進行了系統(tǒng)性總結(jié),以闡明EQ- 5D-Y的研究現(xiàn)狀與發(fā)展趨勢。
文獻檢索策略在PubMed和Web of Science中以“EQ- 5D-Y、children/adolescents”為關鍵詞、在中國知網(wǎng)和萬方等數(shù)據(jù)庫中以“EQ- 5D-Y、兒童/青少年”為關鍵詞,搜集國內(nèi)外公開發(fā)表的關于EQ- 5D-Y量表的文獻,檢索時限為2021年4月前的所有文獻。
納入與排除標準納入標準:(1)正式發(fā)表的所有關于EQ- 5D-Y的中英文原創(chuàng)性文章;(2)關于EQ- 5D-Y測量屬性驗證和效用積分體系構(gòu)建的研究內(nèi)容。排除標準:(1)非中文或非英文文獻;(2)綜述、系統(tǒng)評價和指南等非一次文獻;(3)只提及EQ- 5D-Y,而沒有收集其數(shù)據(jù)并對其進行分析;(4)將EQ- 5D-Y作為輔助測量工具,著重論述其他工具測量屬性,或只運用了EQ VAS的文獻。
研究方法通過研究納入和排除標準對文章進行篩選與確定,采用比較分析法對納入的文章進行分析。按照研究內(nèi)容的不同進行初步分類,總結(jié)研究內(nèi)容的共性與不同,梳理出EQ- 5D-Y的研究現(xiàn)狀。
通過檢索并去除重復文獻后,得到95篇文獻,再根據(jù)上述的納入與排除標準,最終納入38篇文獻(37篇英文文獻,1篇中文文獻)(圖1)。對上述文獻進行整理歸類后,我們發(fā)現(xiàn)目前關于EQ- 5D-Y的研究內(nèi)容主要有4類:(1)Y- 3L與Y- 5L量表的開發(fā)[6- 7];(2)EQ- 5D-Y測量屬性的評估和驗證;(3)應用EQ- 5D-Y測量未成年人的HRQOL[8- 14];(4)關于EQ- 5D-Y效用積分體系構(gòu)建方面的研究。EQ- 5D-Y作為一種效用值量表,若想用于經(jīng)濟學評價,要解決的兩個核心問題就是驗證其測量屬性以及開發(fā)對應的效用積分體系,因此下面將基于這兩方面的研究加以敘述。
測量屬性HRQOL量表的測量屬性是指其標準化客觀性的特質(zhì),即準確且穩(wěn)定地測量HRQOL的基本特征,包括信度、效度、反應性和靈敏度[15]。
信度:是指測量HRQOL的可靠程度或可重復程度,其檢驗主要包括重測信度(重復測量HRQOL,兩次測量結(jié)果的一致性和穩(wěn)定性程度)、分半信度(量表各條目間的一致性)和克隆巴赫系數(shù)(Cronbach’s alpha,內(nèi)部一致性,大于0.7為可接受,大于0.8表示內(nèi)部一致性較好)。EQ- 5D-Y信度的驗證主要基于重測信度:其5個維度以Kappa系數(shù)(Kappa coefficient)或AC1系數(shù)(Gwet’s AC)判斷前后兩次測量結(jié)果的一致性程度,EQ VAS得分則采用組內(nèi)相關系數(shù)(ICC)。研究發(fā)現(xiàn)Y- 3L和Y- 5L均具有較好的信度(表1)。
圖1 文獻篩選流程和結(jié)果
效度:是指HRQOL測量工具準確客觀地反映HRQOL內(nèi)容的程度,主要包括內(nèi)容效度、結(jié)構(gòu)效度和表面效度等[16]。目前關于EQ- 5D-Y效度的研究主要是結(jié)構(gòu)效度的驗證,具體又包括聚合效度、區(qū)別效度和知組效度等。聚合效度是指不同測量工具測量同一HRQOL結(jié)果的相似程度,區(qū)別效度是指不同工具測量不同HRQOL維度的差異程度,以斯皮爾曼、皮爾森相關系數(shù)(Spearman/Pearson correlation coefficient)計算EQ- 5D-Y和其他測量兒童和青少年HRQOL的工具如KIDSCREEN- 27、PedsQL、CHU9D之間測量結(jié)果的相關程度;知組效度是指測量工具識別已知不同健康狀況人群HRQOL差異的能力,采用T檢驗或F檢驗比較兩類已知健康狀態(tài)不同人群的EQ- 5D-Y維度得分和EQ VAS得分的差別。研究結(jié)果表明Y- 3L和Y- 5L的效度較好(表1)。
反應性:是指測量工具捕捉HRQOL發(fā)生變化的能力和程度[36],EQ- 5D-Y反應性的驗證通常基于效應量(effect size,ES):ES<0.2,反應性弱;ES=0.2- 0.5,反應性中等;ES>0.5,反應性強。Scott等人[24]基于52例急重病患者、67例慢性病患者和105名普通學生,探究Y- 3L能否反應出3個月內(nèi)受訪者健康狀況的變化,研究得出ES=0.02~0.15(普通群體、慢性病患者),ES=0.36~0.43(急重病患者),Y- 3L測量普通人群/輕癥患者生命質(zhì)量的反應性弱,測量(嚴重)疾病人群生命質(zhì)量的反應性較強。Wong等[37]基于中國香港129例脊柱側(cè)彎兒童和青少年研究了Y- 3L和Y- 5L的反應性,探究Y- 3L和Y- 5L能否反應出3個月內(nèi)自我健康評估的變化以及反應程度的差異,兩者的ES值范圍分別為ESY- 3L=0.344~1.176,ESY- 5L=0.531~1.328,所以認為Y- 3L和Y- 5L在測量患有脊柱側(cè)彎的兒童和青少年HRQOL時具有相似的反應性。
靈敏度:是指測量工具區(qū)分不同HRQOL水平患者的能力,靈敏度越高,區(qū)分不同健康狀態(tài)患者的能力越強,天花板效應(多數(shù)應答停留在量表的頂端水平,因此無法區(qū)分它們)越弱[16],可以采用配對卡方檢驗計算天花板效應的差異。Wong等[27]以中國香港129例脊柱側(cè)彎患者為研究對象,采用配對卡方檢驗計算Y- 3L和Y- 5L天花板效應的差異,發(fā)現(xiàn)相比于Y- 3L,Y- 5L可降低各個維度的天花板效應(0.8~7.8%),但降低的比例與5L相對于3L所降低的比例(9.0~20.0%)[38- 40]相比要偏少。Wang等[41]基于中國262名在校學生的數(shù)據(jù)也發(fā)現(xiàn)相較于Y- 3L,Y- 5L降低的總的天花板效應(3.8%)幅度不大。
構(gòu)建EQ- 5D-Y效用積分體系的探索
EQ- 5D-Y效用積分體系的標準化研究方案:研究發(fā)現(xiàn)EQ- 5D-Y健康狀態(tài)的效用值不適宜使用EQ- 5D效用積分體系獲得,因而需要單獨開發(fā)EQ- 5D-Y效用積分體系[42- 43]。2020年,Juan等[44]代表歐洲生命質(zhì)量學會研究出Y- 3L效用積分體系構(gòu)建的標準化研究方案,方案建議讓普通成年人基于10歲兒童的立場,回答相關的健康偏好問題。研究方法具體分為兩個步驟:首先開展離散選擇實驗(discrete choice experiments,DCE),讓受訪者基于10歲兒童的立場,在10*15組(每組2個健康狀態(tài))EQ- 5D-Y健康狀態(tài)中選擇更偏好的那個健康狀態(tài);然后通過面對面訪談,采用時間權(quán)衡法(time trade-off,TTO),補充DCE結(jié)果。
各國探索各自的EQ- 5D-Y效用積分體系:目前加拿大、美國、斯洛文尼亞和日本已經(jīng)構(gòu)建了Y- 3L的效用積分體系(表2),其中斯洛文尼亞和日本是依據(jù)Y- 3L效用積分體系標準化研究方案。但是加拿大和美國沒有依據(jù)此方案,并且其研究結(jié)果存在一定問題:加拿大效用值的計算是基于EQ VAS值,不適宜用于轉(zhuǎn)換為健康效用值(EQ VAS值不是基于偏好得到);美國得出的結(jié)果缺乏表面效度等。
同時,中國、德國、印度尼西亞和澳大利亞等國家也正在依據(jù)標準化研究方案構(gòu)建各國的Y- 3L效用積分體系,這些研究或處于數(shù)據(jù)收集階段,或建模階段??梢灶A計的是,今后會有越來越多的Y- 3L效用積分體系在不同國家得到開發(fā)。
通過對國內(nèi)外文獻的歸納總結(jié),我們發(fā)現(xiàn)EQ- 5D-Y的可行性很高(如絕大多數(shù)研究都表明其各維度和VAS缺失值都很少等),顯示其繼承了成年人版本的優(yōu)點。不僅如此,EQ- 5D-Y對于測量兒童和青少年HRQOL也具有較好的信度和效度,但是部分重測信度的Kappa>系數(shù)在0.35~0.60之間[18- 19],即為中等水平以下的一致性。這可能是因為未成年人的認知水平還處于發(fā)展過程,能力相對成年人有限,對于問卷的回答在重測過程中更容易出現(xiàn)理解或記憶上的偏差。同時部分驗證聚合效度的研究中,Spearman相關系數(shù)也僅為0.25~0.50(即中、低相關性)[20- 21,23],這可能是由于兩點原因。首先還是因為未成年人的理解能力有限,可能會對聚合效度的測量結(jié)果造成更大的波動。其次,EQ- 5D-Y各維度與其他測量工具維度的相似程度可能有限,例如Wang等[41]的一項研究發(fā)現(xiàn)EQ- 5D-Y的“感到擔心、傷心或不高興”維度和KIDSCREEN- 10的“感到孤獨”維度的相關系數(shù)為0.440。雖然這兩個維度都是描述心理方面的狀況,但它們在內(nèi)涵上還是有不小的區(qū)別。
表2 Y- 3L效用積分體系構(gòu)建的研究現(xiàn)狀
續(xù)表2
關于EQ- 5D-Y反應性和靈敏度的研究目前還相對較少。從初步的研究結(jié)果來看,Y- 3L和Y- 5L可能具有相似的反應性;Y- 5L靈敏度可能比Y- 3L要好,但是這個優(yōu)勢和5L相對3L的優(yōu)勢相比,不甚明顯。比如相較于Y- 3L,Y- 5L降低了0.8%~7.8%的天花板效應[27],而5L相對于3L則可降低至9.0%~20.0%[38- 40]。這可能是因為兒童和青少年較難辨別Y- 3L“沒有困難”與Y- 5L“有一點困難”的細微差異,因此是否需要進一步推廣Y- 5L并構(gòu)建其效用積分體系尚需更多的經(jīng)驗證據(jù)。
在效用積分體系開發(fā)方面,很多研究已經(jīng)或正在基于Y- 3L效用積分體系的標準化構(gòu)建方案在不同國家或地區(qū)開發(fā)各自的效用積分體系。它們的開發(fā)不僅將有利于在當?shù)亻_展針對未成年人健康干預措施的衛(wèi)生經(jīng)濟學評價,而且基于標準化研究方法獲得的積分體系之間便于進行國際間的比較,這將有助于探索各國人群對于EQ- 5D-Y健康狀態(tài)的偏好是否以及存在何種差異。
EQ- 5D-Y的可行性很好,測量屬性包括信度和效度都較好,Y- 3L和Y- 5L反應性相似,Y- 5L的靈敏度稍好(相較于Y- 3L),但其測量屬性仍需要基于更多人群和疾病樣本的驗證。目前,各國依據(jù)Y- 3L效用積分體系的標準化研究方案,已經(jīng)或正在構(gòu)建各自的效用積分體系,將Y- 3L定義的健康狀態(tài)轉(zhuǎn)化為健康效用值從而用于衛(wèi)生經(jīng)濟學評價。本綜述全面總結(jié)了EQ- 5D-Y的測量屬性與效用積分體系的研究進展,以期為在我國推廣使用EQ- 5D-Y提供參考依據(jù)。