蔡婷婷 丁元旗 黃青梅 吳傅蕾 孫琪 袁長(zhǎng)蓉
(復(fù)旦大學(xué)護(hù)理學(xué)院,上海 200032)
計(jì)算機(jī)自適應(yīng)測(cè)驗(yàn)(computer adaptive tests,CATs)是一種以項(xiàng)目反應(yīng)理論為指導(dǎo),可根據(jù)被試者能力的測(cè)試結(jié)果開(kāi)展個(gè)性化和精準(zhǔn)的測(cè)量方式,近年來(lái)在醫(yī)療領(lǐng)域得到了較多實(shí)踐,在慢性病患者的癥狀與功能等的測(cè)評(píng)及干預(yù)方面顯示了良好的應(yīng)用潛力[1]。癌癥本身及其相關(guān)治療會(huì)導(dǎo)致患者身體出現(xiàn)一系列的癥狀及功能改變,如疲乏、疼痛、惡心、嘔吐及身體功能下降等,且上述問(wèn)題呈現(xiàn)異質(zhì)性和多變性的特點(diǎn),亟需得到及時(shí)準(zhǔn)確的評(píng)估及干預(yù)。目前,已有研究將CATs用于癌癥患者中,并取得了良好效果,但尚未有相關(guān)綜述對(duì)上述研究進(jìn)行系統(tǒng)梳理[2-3]。本文介紹了CATs系統(tǒng)在癌癥患者中的構(gòu)建研究,并分析其在癥狀、功能的篩查及評(píng)估、生活質(zhì)量評(píng)估與臨床決策中的應(yīng)用,以期為促進(jìn)CATs在癌癥照護(hù)領(lǐng)域中的應(yīng)用實(shí)踐提供參考。
CATs的測(cè)試過(guò)程首先讓受試者對(duì)所給的測(cè)試項(xiàng)目進(jìn)行應(yīng)答,繼而根據(jù)受試者對(duì)前一個(gè)測(cè)試項(xiàng)目的應(yīng)答結(jié)果來(lái)判斷其能力水平,給出下一個(gè)合適的項(xiàng)目,重復(fù)上述過(guò)程直至滿足終止規(guī)則要求[4-5]。受試者的應(yīng)答與其自身能力水平和測(cè)試項(xiàng)目的特征有關(guān)??傮w上,CATs測(cè)試邏輯的建立主要包括項(xiàng)目反應(yīng)理論模型的選擇、項(xiàng)目庫(kù)構(gòu)建及項(xiàng)目質(zhì)量分析、選題策略制定及測(cè)試終止規(guī)則制定等流程。
1.1項(xiàng)目反應(yīng)理論模型選擇 項(xiàng)目反應(yīng)理論通過(guò)建立相應(yīng)的數(shù)學(xué)模型呈現(xiàn)受試者應(yīng)答、受試者能力水平(θ)及項(xiàng)目特性(難度參數(shù)a、區(qū)分度參數(shù)b和偶然因素參數(shù)c)三者之間的關(guān)系。根據(jù)項(xiàng)目計(jì)分方式及測(cè)試維度等特征,研究者開(kāi)發(fā)了不同類(lèi)型的項(xiàng)目反應(yīng)模型,如Rasch模型、logistic模型、Samejima等級(jí)反應(yīng)模型、Lord正態(tài)卵形曲線模型及部分記分模型等[2]。在選擇模型時(shí)可根據(jù)項(xiàng)目特性及模型與數(shù)據(jù)的擬合程度確定最佳模型。根據(jù)項(xiàng)目特性的參數(shù)估計(jì),項(xiàng)目反應(yīng)理論可分為二參數(shù)模型和三參數(shù)模型,前者僅估計(jì)項(xiàng)目特性的難度參數(shù)a和區(qū)分度參數(shù)b,后者在前者基礎(chǔ)上納入了項(xiàng)目的偶然因素參數(shù)c。當(dāng)項(xiàng)目可以根據(jù)推測(cè)、猜測(cè)和經(jīng)驗(yàn)等因素而準(zhǔn)確回答項(xiàng)目時(shí),選擇三參數(shù)模型相比于二參數(shù)模型能更精確地估計(jì)項(xiàng)目特性參數(shù)和被試能力參數(shù)[6]。目前,三參數(shù)模型較常用的是等級(jí)反應(yīng)模型(grade response model,GRM)。如在一項(xiàng)情緒智力CATs的研究[6]中提出,在GRM和拓廣分部評(píng)分模型(generalized partial credit model,GPCM)2種多級(jí)評(píng)分模型中,GRM模型的擬合效果更佳,而后者更適合有序步驟的題目。一項(xiàng)社交焦慮CATs的研究[7]中,研究者采用Likert型量表的多級(jí)評(píng)分模式,比較項(xiàng)目反應(yīng)理論模型與數(shù)據(jù)擬合程度,同樣指出GRM模型的擬合效果更適用于Likert型量表。Djaja等[2]將Rasch模型中的分部記分模型應(yīng)用于隊(duì)列研究基線調(diào)查表中,設(shè)計(jì)了用于監(jiān)測(cè)皮膚癌風(fēng)險(xiǎn)的CATs。該調(diào)查表包含8個(gè)維度和1個(gè)僅針對(duì)女性受試者的維度,共含46個(gè)項(xiàng)目,所有的項(xiàng)目都經(jīng)過(guò)分部記分模型檢驗(yàn),而該模型允許項(xiàng)目有不同數(shù)量的閾值和階梯難度,符合不同維度的項(xiàng)目數(shù)目存在差異的特點(diǎn)。因此,在選擇項(xiàng)目反應(yīng)理論模型時(shí),需要綜合考慮模型與項(xiàng)目參數(shù)估計(jì)和被試能力參數(shù)估計(jì)的擬合效果。
1.2CATs項(xiàng)目庫(kù)構(gòu)建及項(xiàng)目質(zhì)量分析 基于項(xiàng)目反應(yīng)理論模型可指導(dǎo)CATs所需項(xiàng)目庫(kù)的構(gòu)建。在CATs項(xiàng)目庫(kù)構(gòu)建后,根據(jù)所采用的項(xiàng)目反應(yīng)理論模型,需通過(guò)項(xiàng)目難度參數(shù)、項(xiàng)目區(qū)分參數(shù)及項(xiàng)目猜測(cè)參數(shù)等評(píng)估項(xiàng)目質(zhì)量,通過(guò)項(xiàng)目參數(shù)估計(jì)和被試能力參數(shù)估計(jì)進(jìn)行模型擬合,刪除與模型擬合不佳的項(xiàng)目,剩余項(xiàng)目繼續(xù)進(jìn)行項(xiàng)目和被試能力的參數(shù)估計(jì),進(jìn)而推斷出模型中未知參數(shù)的估計(jì)值,重復(fù)以上過(guò)程直至形成最終項(xiàng)目庫(kù)[7-9]。如Lai等[8]建立了一個(gè)評(píng)估癌癥患者疼痛的CATs題庫(kù),該研究納入癌癥患者完成61個(gè)與疼痛有關(guān)的項(xiàng)目,研究者通過(guò)因子分析和Rasch模型估計(jì)模型參數(shù),最終確定了由43個(gè)項(xiàng)目組成的 CATs題庫(kù),用于測(cè)量癌癥患者的疼痛水平。Dirven等[9]構(gòu)建了基于CATs的認(rèn)知功能項(xiàng)目庫(kù)(EORTC CAT-CF),該研究通過(guò)文獻(xiàn)研究納入了439個(gè)項(xiàng)目,通過(guò)概念操作化和預(yù)測(cè)試,實(shí)地測(cè)試收集數(shù)據(jù),并使用驗(yàn)證性因子分析和GPCM模型對(duì)項(xiàng)目進(jìn)行心理測(cè)量分析,最終確定了34個(gè)項(xiàng)目組成的項(xiàng)目庫(kù),用于不同類(lèi)型癌癥患者的認(rèn)知功能評(píng)估。Gamper等和Petersen等[10-11]開(kāi)發(fā)的EORTC CAT-EF項(xiàng)目庫(kù)則在文獻(xiàn)檢索、概念化操作與預(yù)測(cè)試后,納入奧地利、丹麥、意大利和英國(guó)的癌癥患者進(jìn)行實(shí)地測(cè)試產(chǎn)生了滿足因子分析和GPCM模型測(cè)量要求,由24個(gè)項(xiàng)目組成的CATs項(xiàng)目庫(kù)。
在完成CATs項(xiàng)目庫(kù)的構(gòu)建后需要對(duì)項(xiàng)目進(jìn)行篩選,通過(guò)對(duì)項(xiàng)目與模型的擬合度、項(xiàng)目的特性參數(shù)估計(jì)與被試的能力參數(shù)估計(jì)進(jìn)行篩選。如在一項(xiàng)開(kāi)發(fā)情緒智力CATs的研究[6]中,研究者采用GRM模型,通過(guò)探索性因子分析對(duì)原始77個(gè)項(xiàng)目進(jìn)行單維性檢驗(yàn)后刪除了5個(gè)項(xiàng)目,在局部獨(dú)立性檢驗(yàn)中刪除1個(gè)項(xiàng)目,并進(jìn)一步刪除區(qū)分度不佳的項(xiàng)目,最終形成包含67個(gè)項(xiàng)目的項(xiàng)目庫(kù)。Dirven等[9]開(kāi)發(fā)的認(rèn)知功能CATs項(xiàng)目庫(kù)中納入丹麥、波蘭、法國(guó)和英國(guó)的1 030例癌癥患者,使用因子分析方法和GPCM模型分析數(shù)據(jù)。結(jié)果顯示,34個(gè)項(xiàng)目通過(guò)項(xiàng)目反應(yīng)理論模型假設(shè),符合單維性、局部獨(dú)立性和單調(diào)性,但有18個(gè)項(xiàng)目在年齡、國(guó)家和工作方面具有項(xiàng)目功能差異,要注意可能存在的測(cè)量偏倚。
1.3選題策略 CATs的選題方法包括Fisher信息量選題、Kullback-leibler選題法和a分層選題法等,也有研究引入受試者項(xiàng)目作答時(shí)間用于選題策略的制定[10,12-14]。其中,Fisher信息量選題法是CATs較為常用的選題方法。如張龍飛等[6]在開(kāi)發(fā)情緒智力CATs時(shí),在GRM模型指導(dǎo)下,能力估計(jì)方法采用期望后驗(yàn)方法,將最大Fisher信息量法作為選題策略,從尚未作答的項(xiàng)目庫(kù)中選擇能夠反映被試者目前能力估計(jì)值信息量最大化的題目。結(jié)果顯示,受試者平均只需回答9.88個(gè)項(xiàng)目便可完成測(cè)試,所有項(xiàng)目均具有良好的心理測(cè)量特性。謝海群等[15]在構(gòu)建基于認(rèn)知障礙篩查量表的CATs時(shí),在Rasch模型指導(dǎo)下,對(duì)項(xiàng)目進(jìn)行項(xiàng)目反應(yīng)理論模型參數(shù)分析,以極大信息量法為選題策略。結(jié)果顯示,CAT-Cog的信效度達(dá)85%以上,敏感度為89.7%,特異度為88.0%。
1.4測(cè)試終止規(guī)則制定 CATs的測(cè)試終止規(guī)則包括定長(zhǎng)原則和不定長(zhǎng)原則[13]。其中,定長(zhǎng)原則可固定試題數(shù)量或測(cè)試時(shí)間,不定長(zhǎng)原則為當(dāng)被試者的能力估計(jì)的誤差達(dá)到事先制定的標(biāo)準(zhǔn)或測(cè)驗(yàn)的總信息量達(dá)到設(shè)置的數(shù)值時(shí)測(cè)試停止[13]。相比之下,不定長(zhǎng)原則在保證測(cè)量精確性下,能以更少的題目達(dá)到測(cè)試目的,但有時(shí)也可能因受試者的能力水平而產(chǎn)生測(cè)量差異[13-15],研究者在CATs的設(shè)計(jì)中可同時(shí)使用2種規(guī)則[16],如Djaja等[2]的CATs中設(shè)定了2條終止規(guī)則,第1條是停止CATs所需的最小測(cè)量標(biāo)準(zhǔn)誤差為0.47,第2條是根據(jù)對(duì)數(shù)據(jù)庫(kù)的模擬研究,每個(gè)受試者至少需要完成10個(gè)項(xiàng)目。張龍飛等[6]在其所開(kāi)發(fā)的CATs中設(shè)置進(jìn)行模擬時(shí)達(dá)到最小測(cè)量標(biāo)準(zhǔn)誤差<0.40時(shí)測(cè)試停止。在該研究中,受試者僅需回答總題量的13.43%即可完成測(cè)試,并且能力估計(jì)水平與完成全題庫(kù)的能力估計(jì)水平相關(guān)系數(shù)為0.92,顯示系統(tǒng)通過(guò)較少的題量即可達(dá)到與全題庫(kù)相似的測(cè)量精度,顯著減輕受試者測(cè)量負(fù)擔(dān)的同時(shí)實(shí)現(xiàn)了測(cè)量的個(gè)性化。因此,2種測(cè)試終止規(guī)則均可用于CATs的測(cè)試中,也可單獨(dú)使用其中一種,以實(shí)現(xiàn)高效測(cè)量。
2.1癥狀篩查及評(píng)估 目前較多研究以患者報(bào)告結(jié)局測(cè)量信息系統(tǒng)作為測(cè)量工具,將CATs與醫(yī)療系統(tǒng)的電子健康記錄系統(tǒng)等形式相結(jié)合,開(kāi)展癌癥患者的癥狀篩查與評(píng)估。該形式可快速準(zhǔn)確地篩查癌癥患者的癥狀,提高診療照護(hù)效率,實(shí)現(xiàn)醫(yī)療資源的有效分配。如Wagner等[17]將患者報(bào)告結(jié)局結(jié)果評(píng)估整合到電子健康記錄中,開(kāi)發(fā)了ePRO評(píng)估系統(tǒng),系統(tǒng)內(nèi)包含PROMIS CATs、社會(huì)心理及營(yíng)養(yǎng)評(píng)估共約40個(gè)項(xiàng)目,用于門(mén)診癌癥患者的癥狀篩查。在該研究中,共有636例婦科腫瘤門(mén)診的婦女完成了1 493項(xiàng)評(píng)估,證實(shí)了基于PROMIS CATs的ePRO系統(tǒng)在常見(jiàn)的癌癥相關(guān)癥狀的精確測(cè)量方面的可行性。Clover等[18]在比較癌癥患者抑郁癥的傳統(tǒng)測(cè)量方法和PROMIS測(cè)量方法的研究中,納入132例血液腫瘤門(mén)診患者分別完成了PROMIS抑郁癥計(jì)算機(jī)自適應(yīng)測(cè)試(PROMIS-D-CAT)和PROMIS抑郁癥簡(jiǎn)表(PROMIS depression short form,PROMIS-D-SF)及7項(xiàng)傳統(tǒng)測(cè)量工具的測(cè)量,以結(jié)構(gòu)化臨床訪談為金標(biāo)準(zhǔn),計(jì)算了相關(guān)性、曲線下面積和診斷準(zhǔn)確性統(tǒng)計(jì)。結(jié)果表明,被試者在 PROMIS-D-CAT 上平均作答5.71個(gè)項(xiàng)目,相較于PROMIS-D-SF和傳統(tǒng)測(cè)量方法可大大減少項(xiàng)目的數(shù)量。在輕度抑郁癥篩查上,PROMIS-D-CAT的敏感性?xún)?yōu)于大多數(shù)的傳統(tǒng)測(cè)量工具,在中度抑郁癥篩查上PROMIS措施的特異性>90%,提示 PROMIS-D-CAT作為抑郁癥的早期篩選工具可進(jìn)一步補(bǔ)充結(jié)構(gòu)化臨床訪談等的結(jié)果。
將CATs用于醫(yī)院癌癥癥狀篩查系統(tǒng)不僅可及時(shí)有效地對(duì)遠(yuǎn)程患者進(jìn)行癥狀篩查和評(píng)估,也有利于通過(guò)預(yù)警設(shè)置遠(yuǎn)程處理緊急事件,節(jié)省患者門(mén)診就醫(yī)的時(shí)間和醫(yī)療支出,同時(shí)提高患者對(duì)自我健康管理的意識(shí),加強(qiáng)患者與醫(yī)護(hù)人員的交流。Garcia等[19]在美國(guó)西北大學(xué)的羅伯特·H·盧里綜合癌癥中心腫瘤內(nèi)科開(kāi)發(fā)了Epic篩查系統(tǒng),實(shí)施ePRO篩查評(píng)估。將PROMIS焦慮、抑郁、疼痛困擾、疲乏和身體功能CATs及用于評(píng)估社會(huì)心理和營(yíng)養(yǎng)問(wèn)題及需求的支持性護(hù)理問(wèn)題集成至電子健康記錄中,對(duì)婦科腫瘤患者進(jìn)行篩查評(píng)估。PROMIS CATs 和支持性護(hù)理關(guān)注清單總計(jì)約40個(gè)項(xiàng)目,其中由CATs提供的項(xiàng)目為4~12個(gè),完成評(píng)估平均所需時(shí)間<10 min?;颊咴陂T(mén)診預(yù)約前72 h需接收通過(guò)Epic發(fā)出的評(píng)估測(cè)量鏈接。在完成測(cè)量后,系統(tǒng)將提醒其醫(yī)療團(tuán)隊(duì)在72h內(nèi)對(duì)測(cè)量結(jié)果進(jìn)行評(píng)估,如遇緊急情況,系統(tǒng)將提醒患者前往最近的急診科,并提示相關(guān)醫(yī)務(wù)人員[19]。Epic篩查系統(tǒng)在進(jìn)行篩查評(píng)估后的30d內(nèi),患者平均有13.11次與醫(yī)療服務(wù)交流,最常見(jiàn)的形式是門(mén)診,其次是通過(guò)移動(dòng)醫(yī)療信息與醫(yī)療團(tuán)隊(duì)交流。通過(guò)PROMIS CATs評(píng)分后觸發(fā)警報(bào)的患者參與門(mén)診、住院及線上咨詢(xún)等醫(yī)療服務(wù)的頻次明顯多于沒(méi)有觸發(fā)警報(bào)的患者。
PROMIS CATs與傳統(tǒng)筆—紙問(wèn)卷相比有利于實(shí)現(xiàn)因人施測(cè),每位受試者需要回答的題量根據(jù)受試者的能力水平差異而不同,總體上,PROMIS CATs更能節(jié)省時(shí)間和減少受試者回答負(fù)擔(dān),且具有較高的特異性和敏感性。如Kurisu等[20]開(kāi)發(fā)了CATs用于評(píng)估癌癥患者抑郁癥狀,并招募393例癌癥患者完成28個(gè)項(xiàng)目的CATs與患者健康問(wèn)卷(Patient health questionnaire-9,PHQ-9)。結(jié)果顯示,CATs量表評(píng)估得分與PHQ-9總分有顯著相關(guān)性,但CATs能使用較少項(xiàng)目達(dá)到了較高的測(cè)量精度。Baum等[21]采用PROMIS CATs和簡(jiǎn)明癥狀量表(Brief symptom inventory,BSI)評(píng)估癌癥患者的抑郁、焦慮和憤怒癥狀,該研究納入前列腺癌患者完成問(wèn)卷調(diào)查。結(jié)果顯示,PROMIS CATs的項(xiàng)目數(shù)量根據(jù)患者的回答而存在差異,但測(cè)量抑郁、焦慮與憤怒的平均項(xiàng)目數(shù)均<10,且與BSI對(duì)應(yīng)分量表的相關(guān)性均>0.60,具有高特異性和敏感性。
2.2功能篩查及評(píng)估 CATs在癌癥患者功能篩查及評(píng)估的應(yīng)用多集中于認(rèn)知功能及身體功能等方面的篩查評(píng)估,在敏感度和特異度方面表現(xiàn)較好。相較于傳統(tǒng)的筆—紙?jiān)囼?yàn),CATs在一定程度上降低了測(cè)試者的反應(yīng)負(fù)擔(dān)。如Lai等[22-23]開(kāi)發(fā)了由患兒家長(zhǎng)報(bào)告的兒科認(rèn)知功能項(xiàng)目庫(kù)(Pediatric perceived cognitive function,pedsPCF)及其CATs。對(duì)腦瘤患者及其父母的調(diào)查結(jié)果顯示,由患兒家長(zhǎng)報(bào)告的pedsPCF與腦瘤患兒腦結(jié)構(gòu)變化所顯示的腦損害有顯著關(guān)聯(lián),pedsPCF分?jǐn)?shù)對(duì)不同等級(jí)的白質(zhì)腦病患兒具有良好的鑒別能力。因此,CATs可作為腦瘤患兒認(rèn)知功能障礙的篩查工具,有助于及時(shí)有效開(kāi)展后續(xù)的綜合神經(jīng)認(rèn)知測(cè)試。在成人認(rèn)知功能篩查方面,謝海群等[15]構(gòu)建了基于認(rèn)知障礙篩查量表的CATs。該研究招募1 200例>60歲的老年人完成了認(rèn)知障礙篩查量表等成套神經(jīng)心理量表測(cè)試,根據(jù)認(rèn)知障礙篩查量表構(gòu)建項(xiàng)目庫(kù),基于項(xiàng)目反應(yīng)理論開(kāi)展項(xiàng)目的Rasch分析,對(duì)項(xiàng)目進(jìn)行難度分析篩選和整合,將形成的項(xiàng)目庫(kù)用于構(gòu)建認(rèn)知功能障礙篩查的CATs。研究結(jié)果顯示,該篩查系統(tǒng)的信效度理想,與傳統(tǒng)紙筆原測(cè)試的相關(guān)系數(shù)較高,為0.792~0.876。相比之下,CAT-Cog的平均使用題目數(shù)為6.58,測(cè)試項(xiàng)目數(shù)量減少35.6%,且鑒別認(rèn)知正常者與阿爾茨海默病患者的敏感度>80%,特異度>70%。Cheville等[24]基于CATs的急性期后護(hù)理活動(dòng)測(cè)量表(Activity measure for postacute care,AM-PAC-CAT)在晚期肺癌患者中通過(guò)電話形式進(jìn)行為期2年和每月1次的評(píng)估,分析了CATs在評(píng)估癌癥人群中隨時(shí)間推移的反應(yīng)性、最小重要差異和反應(yīng)負(fù)擔(dān)。結(jié)果顯示,AM-PAC-CAT可作為識(shí)別晚期肺癌患者功能衰退的篩查工具,受試者可在2min內(nèi)完成評(píng)估。因此,CATs在功能評(píng)估中具有優(yōu)勢(shì),尤其在開(kāi)展隨訪時(shí)較其他途徑更易于長(zhǎng)期維持。此外,在采用CATs進(jìn)行功能篩查后也可考慮以其他客觀生理指標(biāo)以更全面地分析功能的變化。
2.3生活質(zhì)量評(píng)估 CATs可用于癌癥患者的生活質(zhì)量評(píng)估,實(shí)現(xiàn)與健康生活質(zhì)量有關(guān)維度得分的直接比較,與傳統(tǒng)評(píng)估方式相比,用時(shí)更少且覆蓋范圍更廣,在縱向研究的生活質(zhì)量評(píng)估中更易實(shí)現(xiàn)健康數(shù)據(jù)的持續(xù)評(píng)估和管理。如Stachler等[25]對(duì)目前可用的頭頸部癌癥問(wèn)卷進(jìn)行評(píng)估,提出雖然這些測(cè)量工具可有效地測(cè)量頭頸癌患者與健康有關(guān)的生活質(zhì)量,但每種工具只能測(cè)量特定領(lǐng)域,且難以實(shí)現(xiàn)不同工具分值的直接比較。該團(tuán)隊(duì)將PROMIS CATs(抑郁、疲勞、身體功能、睡眠障礙、睡眠相關(guān)損害和消極認(rèn)知功能)與EORTC一般問(wèn)卷及EORTC頭頸癌問(wèn)卷(EORTC head and neck,H&N)等問(wèn)卷的結(jié)果進(jìn)行比較,結(jié)果顯示,PROMIS CATs與上述工具具有理想的相關(guān)性,患者完成PROMIS CATs僅用時(shí)6.2min。Ottenhof等[26]將基于FACE-Q皮膚癌量表的CATs用于評(píng)估皮膚癌患者的生活質(zhì)量,并且評(píng)估CATs與原FACE-Q皮膚癌量表的相關(guān)性,結(jié)果顯示,兩者分值高度相關(guān)(r=0.98~0.99),且患者完成CATs所需項(xiàng)目數(shù)由原始量表的41項(xiàng)減少至平均23項(xiàng),可減少50%以上的評(píng)估用時(shí)。
CATs與智能手機(jī)應(yīng)用程序等移動(dòng)平臺(tái)的結(jié)合可提高癌癥患者的依從性及測(cè)量的高效性。如在一項(xiàng)縱向隊(duì)列研究中,研究者使用了可評(píng)估甲狀腺癌患者生活質(zhì)量的CATs(computerized adaptive tests for Thyroid cancer,ThyCAT)[27]?;颊呖稍谑謾C(jī)應(yīng)用程序上使用ThyCAT 進(jìn)行生活質(zhì)量評(píng)估,只需用<2 min的時(shí)間即可完成評(píng)估,且ThyCAT與常用的測(cè)量工具得分具有較高的相關(guān)性。Lai等[28]采用PROMIS CATs和PROMIS簡(jiǎn)表分別對(duì)7~22歲的腦瘤患者的疲勞、身體功能、抑郁、焦慮和同伴關(guān)系進(jìn)行評(píng)估,采用Pearson相關(guān)系數(shù)、配對(duì)t檢驗(yàn)和Cohen′s d分別用于評(píng)估兩者分值之間的相關(guān)性。結(jié)果顯示,CATs和簡(jiǎn)表獲得的分?jǐn)?shù)高度相關(guān),且評(píng)估所用時(shí)間更少,在持續(xù)追蹤縱向生活質(zhì)量測(cè)評(píng)方面更具優(yōu)勢(shì)。此外,當(dāng)前歐洲癌癥研究與治療組織生活質(zhì)量小組已為EORTC QLQ-C30生活質(zhì)量問(wèn)卷的14個(gè)功能和癥狀領(lǐng)域開(kāi)發(fā)了CATs系統(tǒng),并通過(guò)了首次國(guó)際驗(yàn)證,將有助于優(yōu)化評(píng)估癌癥患者生活質(zhì)量的測(cè)量精度[29-30]。
2.4臨床決策 CATs有助于監(jiān)測(cè)癌癥患者的健康狀況和風(fēng)險(xiǎn)預(yù)測(cè),實(shí)現(xiàn)連續(xù)的健康指導(dǎo)及干預(yù)。如一項(xiàng)研究以PROMIS CATs為研究工具,評(píng)估接受激素治療的前列腺癌患者在基于網(wǎng)上干預(yù)前后的社會(huì)心理功能的變化[31]。該研究將192例男性前列腺癌癥患者隨機(jī)分配到認(rèn)知行為壓力管理干預(yù)組和健康促進(jìn)組,每周的小組會(huì)議都通過(guò)視頻會(huì)議進(jìn)行,利用PROMIS抑郁、焦慮、疲勞、疼痛困擾及身體功能CATs對(duì)患者的社會(huì)心理功能進(jìn)行為期10周的評(píng)估。其中,PROMIS CATs完成率>50%,顯示出PROMIS CATs可有效地識(shí)別受試者健康結(jié)局隨時(shí)間的變化,為及時(shí)臨床決策提供輔助支持。CATs除可用于電子患者報(bào)告結(jié)局中對(duì)癌癥患者實(shí)時(shí)監(jiān)測(cè)健康狀態(tài)外,也可用于癌癥相關(guān)風(fēng)險(xiǎn)的預(yù)測(cè),輔助臨床決策。如Djaja等[2]開(kāi)發(fā)了基于應(yīng)用程序的CATs,可用于皮膚癌風(fēng)險(xiǎn)預(yù)測(cè)。該研究使用Rasch模型校準(zhǔn)后的皮膚癌風(fēng)險(xiǎn)量表,比較非自適應(yīng)測(cè)試與CATs的測(cè)量精度和效率差異。結(jié)果顯示,與多媒體圖像相結(jié)合的CATs可提高患者參與皮膚癌風(fēng)險(xiǎn)評(píng)估的意識(shí),并有助于識(shí)別高危人群。Yang等[32]通過(guò)機(jī)器學(xué)習(xí)建立了基于皮膚癌風(fēng)險(xiǎn)量表CATs的模型,并開(kāi)發(fā)用于皮膚癌風(fēng)險(xiǎn)分類(lèi)的應(yīng)用程序,幫助患者在早期階段評(píng)估風(fēng)險(xiǎn)。該研究使用Rasch模型將30個(gè)項(xiàng)目進(jìn)行校準(zhǔn),計(jì)算了敏感性、特異性、受試者操作特征曲線和準(zhǔn)確性及精確性。結(jié)果顯示,將含有30個(gè)項(xiàng)目的皮膚癌預(yù)測(cè)模型與CATs模型相結(jié)合可用于皮膚癌分類(lèi),有助于在早期階段進(jìn)行皮膚癌風(fēng)險(xiǎn)自我評(píng)估,為臨床決策提供參考。
基于項(xiàng)目反應(yīng)理論的CATs在構(gòu)建時(shí),可根據(jù)項(xiàng)目庫(kù)的特征確定最佳理論模型及相應(yīng)測(cè)試邏輯。目前,國(guó)外關(guān)于CATs在癌癥患者應(yīng)用領(lǐng)域的研究持續(xù)增加,部分研究比較了CATs系統(tǒng)與傳統(tǒng)測(cè)量工具的差異,顯示出CATs系統(tǒng)在健康結(jié)局測(cè)評(píng)中的高效性、準(zhǔn)確性及便捷性,一些研究者將CATs系統(tǒng)與醫(yī)院電子健康系統(tǒng)等形式相結(jié)合,用于癌癥患者的癥狀及功能篩查和評(píng)估,或嵌入手機(jī)應(yīng)用程序,用于癌癥患者的隨訪或干預(yù),并將相關(guān)數(shù)據(jù)用于臨床輔助決策。相比之下,我國(guó)CATs的研究多集中于心理學(xué)和教育方面,在醫(yī)學(xué)領(lǐng)域尤其是癌癥患者方面的應(yīng)用研究尚少,有待深入探索。鑒于CATs能顯著減輕被試者的測(cè)量負(fù)擔(dān),實(shí)現(xiàn)個(gè)性化精準(zhǔn)測(cè)評(píng),后續(xù)研究可深入挖掘其在癌癥患者領(lǐng)域的應(yīng)用場(chǎng)景,以改善患者的生存質(zhì)量及健康結(jié)局。