王一鷗 錢文偉 朱詩白 陳曦 李姍妮
(中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院北京協(xié)和醫(yī)院骨科,北京 100730)
人工膝關(guān)節(jié)置換術(shù)作為終末期膝關(guān)節(jié)病變的一種有效治療手段,至今已有超過五十年的歷史。隨著肥胖、人口老齡化等問題的加劇,以及人們對生活質(zhì)量需求的提高,全球范圍內(nèi)人工膝關(guān)節(jié)置換術(shù)的手術(shù)量逐年遞增。據(jù)統(tǒng)計我國2019年人工膝關(guān)節(jié)置換手術(shù)量已超過39 萬例,且仍保持著超過27%的年增長率[1]。面對手術(shù)量的迅速增長,手術(shù)療效的滿意度卻仍維持在81%~89%[2-4]。提高手術(shù)療效和患者術(shù)后滿意度首先需要合適的工具評價手術(shù)療效,本文將對人工膝關(guān)節(jié)置換術(shù)后療效評價工具進行探討。
假體生存分析包括假體生存時間、翻修率等指標(biāo),是人工關(guān)節(jié)置換手術(shù)發(fā)展早期階段最主要的評價指標(biāo),也是目前用于臨床研究和關(guān)節(jié)登記系統(tǒng)的重要結(jié)局指標(biāo)。隨著假體設(shè)計的革新、材料學(xué)的發(fā)展,手術(shù)技術(shù)的進步,文獻及國家關(guān)節(jié)登記系統(tǒng)報道的全膝關(guān)節(jié)假體15年生存率已經(jīng)超過93%[5],但術(shù)后滿意度并未獲得相應(yīng)的提升。說明假體生存分析的數(shù)據(jù)只評價了假體在位情況,但卻忽略了患者的疼痛緩解和功能改善情況。除此之外,翻修率等作為針對人群的遠(yuǎn)期療效指標(biāo),并不適用于評價接受關(guān)節(jié)置換手術(shù)個體不同時間節(jié)點的療效。
醫(yī)師評價工具的出現(xiàn)標(biāo)志著早期關(guān)注點從假體生存率到患者療效的轉(zhuǎn)變。因為需要由醫(yī)師進行測評,故這些指標(biāo)絕大多數(shù)都是具有明確標(biāo)準(zhǔn)的客觀指標(biāo),如關(guān)節(jié)活動度(range of motion,ROM)、穩(wěn)定度、關(guān)節(jié)畸形矯正程度等。這些指標(biāo)與衡量疼痛和功能的問題組合在一起,發(fā)展形成了1973 年的特種外科醫(yī)院評分(Hospital for Special Surgery score,HSS)[6]、1989 年的美國膝關(guān)節(jié)協(xié)會評分(Knee Society Score,KSS)[7]等醫(yī)師評價量表,是目前人工膝關(guān)節(jié)置換手術(shù)常用的療效評價工具[8]。
但Lingard 等[9]認(rèn)為KSS 量表存在內(nèi)容效度缺陷。即醫(yī)師評價工具均由醫(yī)師制定和評價,而患者未參與問卷條目的制定和篩選。由于醫(yī)師與患者對療效的認(rèn)識和關(guān)注點存在差異,致使評價的內(nèi)容具有很強的醫(yī)師主觀性,可能無法直接而準(zhǔn)確地反映患者真正的需求[10]。有研究顯示TKA術(shù)后ROM、HSS評分和KSS 評分結(jié)果與患者對療效的滿意度之間并不具有較強相關(guān)性[11-13]。
早期醫(yī)師評價工具編撰的過程中未對測量屬性引起足夠重視,導(dǎo)致部分工具不同程度上存在信度、效度和反應(yīng)度的不足,影響最終結(jié)果的準(zhǔn)確性。No?ble等[14]的研究發(fā)現(xiàn)KSS評分中醫(yī)師評價部分并不具有良好的內(nèi)部一致性。這意味著KSS 評分的總分不具有明確的意義,只適合以單獨問題的形式使用。Ghanem等[15]在研究中舉過一個例子:一位不伴疼痛、膝關(guān)節(jié)嚴(yán)重強直但對線良好的患者和一位伴有輕度疼痛、輕度內(nèi)翻但膝關(guān)節(jié)ROM 良好的患者可以獲得同樣的KSS總分,但二者日常生活的困難程度完全不同。另外傳統(tǒng)量表制定所針對的人群和當(dāng)今接受關(guān)節(jié)置換的人群已大為不同,更多病變和畸形輕、年輕活躍并且有更高功能需求的患者意味著傳統(tǒng)量表的內(nèi)容已不足以評價當(dāng)今接受關(guān)節(jié)置換患者的需求,顯示出嚴(yán)重的天花板效應(yīng)。
近些年來,越來越多的學(xué)者意識到醫(yī)師評價工具的這些弊端。2005~2019年間,在發(fā)表的涉及全膝關(guān)節(jié)置換術(shù)療效評價的文章中,使用KSS評分的文章占比從2005 年的55.2%下降至2019 年的35.4%[16,17]。同時,針對這些不足美國膝關(guān)節(jié)外科協(xié)會在2011 年編撰了更多基于患者自評的新KSS 評分[14]。對于單獨使用傳統(tǒng)醫(yī)師評價工具作為療效評價指標(biāo),研究者應(yīng)當(dāng)更加謹(jǐn)慎。
為了更精準(zhǔn)的評估患者功能情況,基于患者表現(xiàn)的功能評價工具逐漸得到發(fā)展。Dobson 等[18]將其定義為由評價者觀測到受試者完成,如步行、坐立、上下臺階等指定活動時的各項指標(biāo),通常是時間、數(shù)量和距離等客觀定量參數(shù)??梢钥醋麽t(yī)師評價工具中的特殊類型。常用的包括六分鐘步行試驗、坐立試驗等。
近年來,隨著傳感器、步態(tài)分析、人工智能等技術(shù)的發(fā)展,智能設(shè)備在功能評價中越來越得到重視。尤其是配備傳感器的3D 步態(tài)分析技術(shù),通過收集指定活動下的時空步態(tài)、運動學(xué)、動力學(xué)等參數(shù)定量評價患者的功能情況。相比于傳統(tǒng)工具測量,具有更高的靈敏度,可以識別更細(xì)微的功能改變。同時,得到的數(shù)據(jù)更為全面且?guī)缀鯖]有天花板效應(yīng)[19]。另外,對于患者而言,這些測量工具幾乎不存在語言和文化理解障礙。
與醫(yī)師評價工具相同,基于患者表現(xiàn)的功能評價工具的結(jié)果無法直接反映患者的滿意度,并且在內(nèi)容效度上的不足更為嚴(yán)重。首先,這些工具只有功能這個單一維度的評價,而沒有測量疼痛、生活質(zhì)量等其他與療效相關(guān)的重要維度。另外,由于時間和客觀條件等限制,測試的內(nèi)容通常只包含一個動作,而缺乏諸如下蹲、上下樓梯等其他在日常生活中重要的活動。另一方面是生態(tài)學(xué)效度的不足,患者在醫(yī)院里完成這些任務(wù)的表現(xiàn)與真實世界中的表現(xiàn)可能存在差異[20]。除此之外,在實踐過程中,完成測試通常相當(dāng)耗時且需要額外經(jīng)過培訓(xùn)的評價者在場,如使用步態(tài)分析等還需要額外的設(shè)備和場地,這些均限制了基于患者表現(xiàn)的評價工具的推廣和普及。
由于內(nèi)容效度和生態(tài)學(xué)效度的不足,以及人力物力的需求,基于患者表現(xiàn)的功能評價工具并不適用于廣泛單獨地應(yīng)用于膝關(guān)節(jié)置換術(shù)后患者療效的評價,但因其可以獲得直觀、精確、可靠的數(shù)據(jù),在探索人體和關(guān)節(jié)假體的運動學(xué)、假體磨損模式等研究中會扮演越來越重要的作用。
患者自評工具是指在沒有醫(yī)師等其他外部評價者干預(yù)的情況下,由患者直接自評的健康狀況,通常以量表的形式呈現(xiàn)。根據(jù)關(guān)注點的不同,可將患者自評量表分為反映患者整體健康狀況和生活質(zhì)量的通用型量表和關(guān)注患者特定疾病、癥狀、特殊解剖部位的特異性量表。
患者自評量表可以更加準(zhǔn)確地評價患者關(guān)注的因素,真正從患者的角度評價手術(shù)療效[21]。人工膝關(guān)節(jié)置換術(shù)作為一個擇期手術(shù),目的是通過減輕關(guān)節(jié)疼痛,改善關(guān)節(jié)長期功能,提高患者生活質(zhì)量[22]。疼痛、滿意度、生活質(zhì)量等這類主觀性指標(biāo),患者自評無疑是金標(biāo)準(zhǔn)。而對于功能等指標(biāo),也包含著主觀因素,相比于ROM和完成特定動作所需時間,患者認(rèn)為的困難程度更能直接地反映疾病對個體功能的影響以及術(shù)后的改善[23]。
其次,患者自評量表的結(jié)果完全由患者本人評價得到,可以最大程度地減少醫(yī)師等其他外部評價人員帶來的偏倚。醫(yī)師在評價時或多或少地會摻雜自己的理解、經(jīng)驗以及目的,導(dǎo)致不同醫(yī)師間的評價標(biāo)準(zhǔn)存在差異。另外,在整個術(shù)前到術(shù)后隨訪過程中,完全由患者本人評價可以最大程度的保持評價標(biāo)準(zhǔn)的一致性。除此之外,患者自評工具的使用不受時間和空間的限制,且隨著信息技術(shù)的發(fā)展,患者可以通過互聯(lián)網(wǎng)等方式完成量表的填寫,減少術(shù)后隨訪的人力物力成本。
對于患者自評量表,測量屬性尤為重要,其充分與否直接關(guān)系到量表能否反映患者的真實情況。2010 年由心理學(xué)、流行病學(xué)和臨床專家共同制定了COSMIN(Consensus-based Standards for the selection of health status Measurement Instruments)指南,將量表的測量屬性歸納為效度、信度和反應(yīng)度三個方面,具體包含9 個測量屬性,并制定了系統(tǒng)的評價方法[24],2018 年在此基礎(chǔ)上完善并更新了第2 版COSMIN 指南[25]。
近年來,陸續(xù)有學(xué)者將COSMIN指南系統(tǒng)評價應(yīng)用于人工全膝關(guān)節(jié)置換術(shù)的患者自評量表,Harris等發(fā)現(xiàn)牛津膝關(guān)節(jié)評分(Oxford Knee Score,OKS)和牛津膝關(guān)節(jié)評分-活動和社會參與量表(OKS-Activity and Participation Questionnaire,OKS-APQ)具有良好的測量屬性[26]。Gagnier等的研究顯示只有OKS,西安大略和麥克馬斯特大學(xué)骨關(guān)節(jié)炎指數(shù)(Western On?tario and McMaster Universities Arthritis Index,WOMAC)和骨關(guān)節(jié)炎或關(guān)節(jié)置換工作能力評價量表(Work,Osteoarthritis or joint-Replacement Question?naire,WORQ)具有相對較好的測量屬性[27]。我們利用第2 版COSMIN 對全膝關(guān)節(jié)置換術(shù)34 個患者自評量表系統(tǒng)進行評價,提示OKS,OKS-APQ,遺忘關(guān)節(jié)評分(Forgotten Joint Score,F(xiàn)JS),膝關(guān)節(jié)損傷和骨關(guān)節(jié)炎評分12條目縮減版問卷(12-item short forms Knee injury and Osteoarthritis Outcome Score,KOOS-12)和功能縮減版問卷(Knee injury and Osteoarthritis Outcome Score Physical function Short form,KOOS-PS),WOMAC全膝關(guān)節(jié)置換功能縮減版問卷(Western Ontario and McMaster Universities Arthritis Index-Total Knee Re?placement function short form,WOMAC-TKR),下肢功能量表(Lower Extremity Functional Scale,LEFS),患者膝關(guān)節(jié)假體表現(xiàn)評分(Patient's Knee Implant Perfor?mance,PKIP),加州大學(xué)洛杉磯分校活動量評分(Uni?versity of California Los Angeles activity score,UCLA),以及KOOS和WOMAC 中的疼痛、功能和生活質(zhì)量子量表具備基本充分的測量屬性[28]??傮w來說,只有少數(shù)患者自評量表具有可靠的測量屬性,因此量表的選擇更多應(yīng)基于測量屬性的證據(jù)。
同傳統(tǒng)醫(yī)師評價量表一樣,傳統(tǒng)患者自評量表也逐漸出現(xiàn)天花板效應(yīng)。早期的患者自評量表只包含疼痛和日常生活中基本的功能,而滿足日常生活功能需求已不能使所有患者滿意。因此,KOOS、OKS-APQ 和2011 版KSS 量表均在WOMAC、OKS、KSS 傳統(tǒng)量表的基礎(chǔ)上加入了更多娛樂和運動功能的評價內(nèi)容。2012年Behrend等[29]提出遺忘人工關(guān)節(jié)可以作為人工關(guān)節(jié)置換手術(shù)的終極目標(biāo)。研究者應(yīng)當(dāng)科學(xué)看待患者自評量表的天花板效應(yīng)。一方面,天花板效應(yīng)的出現(xiàn)使得量表無法發(fā)現(xiàn)患者進一步的改善,但另一方面,關(guān)節(jié)置換手術(shù)的目的是緩解疼痛和改善功能,對于設(shè)計科學(xué)的量表達到天花板分?jǐn)?shù)意味著患者實現(xiàn)了這個目的,量表的作用也應(yīng)當(dāng)是用于評價患者的健康狀況,而非檢測差異。因此,天花板效應(yīng)不應(yīng)作為量表選擇的絕對限制,而應(yīng)當(dāng)將獲得滿意的療效作為評價的終點。
KOOS 由Roos 等于1998 年編撰,旨在評價膝關(guān)節(jié)損傷和骨關(guān)節(jié)炎患者的癥狀和功能障礙情況。KOOS包括疼痛、其他癥狀、日常生活功能、運動和娛樂功能以及生活質(zhì)量5 個子量表的42 個條目[30]。KOOS 的優(yōu)勢在于:①除其他癥狀外的4 個子量表的信效度均得到高質(zhì)量研究驗證[31-33],因此量表的結(jié)果真實可信。②量表內(nèi)容全面,基本涵蓋了膝關(guān)節(jié)置換術(shù)患者關(guān)心的各方面問題。另外KOOS 包含了WOMAC 的所有條目,因此可以直接從KOOS 的結(jié)果中獲得WOMAC 的分?jǐn)?shù)。③Connelly 等的研究顯示KOOS各量表的得分和TKA患者術(shù)后滿意度相關(guān),并建立了基于療效滿意度可應(yīng)用個體評價的閾值[34]。KOOS的主要缺陷在于,繁多的內(nèi)容需要患者花費超過10 分鐘去完成,導(dǎo)致缺失值的增多和依從性的降低。為了解決這個問題,研究者利用項目反應(yīng)理論編撰了反映患者功能情況的7 條目功能縮減版(KOOS-PS)[35]、反映關(guān)節(jié)置換患者膝關(guān)節(jié)情況的7條目關(guān)節(jié)置換縮略版(KOOS,JR)[36]以及全面的12條目縮略版(KOOS-12)[31]。三者均利用人群數(shù)據(jù)和完善的心理統(tǒng)計學(xué)模型構(gòu)建而成,具備充分的測量屬性,尤其是2019 年利用現(xiàn)代測量理論研制的旨在替代KOOS的KOOS-12。但這些縮減版的適用范圍、條件以及是否可以完全替代原版量表,仍需要進一步的研究進行驗證。
FJS由Behrend 等于2012年編撰而成[29]。其開創(chuàng)性地將人工關(guān)節(jié)置換術(shù)的終極目標(biāo)以及量表的構(gòu)念定義為“遺忘人工關(guān)節(jié)”。相比于減輕關(guān)節(jié)疼痛和改善功能,遺忘人工關(guān)節(jié)、實現(xiàn)自然膝對療效提出了更高的要求。這一方面意味著FJS 的結(jié)果將更接近于患者對療效的滿意程度。近期有研究證實與WOMAC 評分相比,F(xiàn)JS 的結(jié)果與患者療效滿意度之間具有更高的相關(guān)性[37]。另一方面意味著FJS的結(jié)果具有更少的天花板效應(yīng)[38]。憑借其獨特的優(yōu)勢,近五年使用FJS的研究顯著增多,未來必將成為人工關(guān)節(jié)置換術(shù)后重要的療效評價工具之一。但FJS 的缺陷在于只能用于術(shù)后的評價,無法進行術(shù)前術(shù)后的對比。另外,由于遺忘人工關(guān)節(jié)這個構(gòu)念的獨特性,在使用過程中如何使患者理解,準(zhǔn)確完成量表值得研究者進一步思考。
部分傳統(tǒng)紙質(zhì)版的患者自評量表,因條目繁多導(dǎo)致患者依從性較差,同時不可避免的存在缺失值、錄入錯誤,需要更多的人力保障其完整性和準(zhǔn)確性。隨著基于條目反應(yīng)理論的計算機自適應(yīng)測試的普及[39]以及信息技術(shù)的發(fā)展,條目更少、更便捷的電子版量表將成為未來的發(fā)展趨勢。
患者自評量表的結(jié)果來源于患者,幾乎不受醫(yī)師等醫(yī)療提供方的影響,近年來研究者嘗試?yán)昧勘淼慕Y(jié)果輔助醫(yī)患共同決策、醫(yī)療服務(wù)評價及政策制定。英國的研究者利用國家關(guān)節(jié)登記系統(tǒng)中的術(shù)前術(shù)后牛津髖/膝關(guān)節(jié)評分?jǐn)?shù)據(jù),構(gòu)建了術(shù)前評分對術(shù)后改善程度的預(yù)測模型,從患者療效和衛(wèi)生經(jīng)濟學(xué)兩方面制定了基于術(shù)前牛津關(guān)節(jié)評分的轉(zhuǎn)診和手術(shù)閾值[40,41]。但有學(xué)者認(rèn)為這些量表研制的目的是評估療效,而預(yù)測療效、指導(dǎo)治療超過了其適用范圍,閾值的結(jié)果并不具有臨床意義[42]。因此,利用患者自評量表指導(dǎo)治療決策和衛(wèi)生政策制定方面仍需要進一步研究探索。
患者自評量表未來仍需要進一步解決以下兩方面問題:第一,量表的選擇應(yīng)基于其測量屬性的證據(jù),因此,需要系統(tǒng)評價和檢驗現(xiàn)有量表的測量屬性。明確性能良好的量表并形成共識,規(guī)范研究中使用的評價工具。第二,利用關(guān)節(jié)登記系統(tǒng)及數(shù)據(jù)庫全面收集不同人口學(xué)特征患者的患者自評量表數(shù)據(jù),根據(jù)患者對療效的滿意度計算最小臨床差異(minimal clinically important difference,MCID)等參數(shù),從而制定患者個體水平上量表的閾值。
提高人工膝關(guān)節(jié)置換患者術(shù)后滿意度首先需要選擇合適的評價工具,患者自評量表因其可以客觀反映療效,將會扮演愈加重要的作用。在臨床實踐和研究中,醫(yī)師或評價者應(yīng)根據(jù)患者的功能需求選擇具備充分測量屬性且沒有明顯天花板效應(yīng)的患者自評量表,才能使療效評價的結(jié)果更接近患者的滿意度。