柯美英,蔣玲麗,羅力,吳萍,王青,劉佳興,婁嬌,吳斌,朱俊,戴瑞明,周靖
(1.復(fù)旦大學(xué)公共衛(wèi)生學(xué)院,上海 200032;2.上海臨床檢驗(yàn)中心質(zhì)量管理部,上海 200126)
近年來(lái),我國(guó)已有很多地區(qū)開(kāi)展了實(shí)驗(yàn)室臨床檢驗(yàn)項(xiàng)目的質(zhì)量評(píng)價(jià)工作,并在一定程度上利用了室內(nèi)質(zhì)量控制(室內(nèi)質(zhì)控,IQC)和室間質(zhì)量評(píng)價(jià)(室間質(zhì)評(píng),EQA)的結(jié)果。同時(shí),也進(jìn)一步嘗試探討了利用EQA結(jié)果作為項(xiàng)目互認(rèn)和實(shí)驗(yàn)室質(zhì)量水平的評(píng)價(jià)辦法。西格瑪(σ)度量值可體現(xiàn)檢驗(yàn)過(guò)程中精密度和正確度與質(zhì)量目標(biāo)的關(guān)系[1],同時(shí)作為選取質(zhì)控規(guī)則、分析檢驗(yàn)性能的度量工具得到了廣泛的應(yīng)用[2]。然而,當(dāng)前西格瑪度量值的計(jì)算方法還存在一定的局限性,例如:測(cè)算數(shù)據(jù)來(lái)源不一致、偏倚估計(jì)未考慮濃度、靶值核定不確定性高等問(wèn)題。這些問(wèn)題均會(huì)導(dǎo)致基于西格瑪度量值的實(shí)驗(yàn)室質(zhì)量評(píng)價(jià)結(jié)果的有效性受到質(zhì)疑。隨著臨床檢驗(yàn)數(shù)據(jù)收集能力和數(shù)據(jù)處理能力的提高,我們認(rèn)為部分問(wèn)題可以得到有效的解決,并在一定程度上提高西格瑪度量值的準(zhǔn)確性和檢驗(yàn)效率。然而,如何科學(xué)應(yīng)對(duì),其思路和策略又是什么,亦待研究和討論。本文基于大數(shù)據(jù)背景,探討在臨床檢驗(yàn)評(píng)價(jià)中西格瑪度量值測(cè)算的新策略。
1.1西格瑪度量值測(cè)算數(shù)據(jù)來(lái)源不一致 目前對(duì)定量檢驗(yàn)項(xiàng)目結(jié)果進(jìn)行質(zhì)量評(píng)價(jià)時(shí),偏倚來(lái)源于EQA回報(bào)數(shù)據(jù),變異系數(shù)卻來(lái)源于IQC數(shù)據(jù)。測(cè)算數(shù)據(jù)如果是分開(kāi)評(píng)價(jià)實(shí)驗(yàn)室的精密度和正確度,那么無(wú)可厚非。但是如果是在計(jì)算西格瑪度量值或質(zhì)量目標(biāo)指數(shù)(QGI)等指標(biāo)時(shí),兩種不同來(lái)源的數(shù)據(jù)卻在同一個(gè)公式中進(jìn)行計(jì)算,顯然不合理,原因有2點(diǎn)。(1)在2種情境完全不同的質(zhì)量評(píng)價(jià)過(guò)程中,時(shí)間、儀器狀態(tài)、測(cè)試濃度、操作人員水平和重視程度均不相同。(2)實(shí)驗(yàn)室在不同時(shí)期,參與EQA活動(dòng)的人員以及設(shè)備等條件不一致。因此,采用2種來(lái)源完全不一致的數(shù)據(jù)在同一個(gè)公式中進(jìn)行計(jì)算,得到的統(tǒng)計(jì)結(jié)果不能代表儀器檢測(cè)的真實(shí)水平。
1.2偏倚的估計(jì)方法未充分考慮濃度差異性 目前偏倚的計(jì)算常用方法有2種,一種是用多次EQA結(jié)果的偏倚均值計(jì)算平均偏倚水平,但存在檢測(cè)水平在不同濃度上存在著顯著差異的問(wèn)題。偏倚測(cè)量的不確定度與質(zhì)控品的濃度檢測(cè)值是相關(guān)的[6]。對(duì)此,有學(xué)者提出利用多次EQA的結(jié)果進(jìn)行回歸分析,利用不同濃度上的偏倚曲線(xiàn)計(jì)算出對(duì)應(yīng)濃度的偏倚值的辦法[7]。這種方法得到了部分實(shí)驗(yàn)室的應(yīng)用。然而,計(jì)算方法的完善只能在一定程度上減少隨機(jī)誤差,卻不能徹底解決室間數(shù)據(jù)估計(jì)偏倚的誤差問(wèn)題。此外,EQA本身存在評(píng)價(jià)靶值設(shè)定和評(píng)價(jià)標(biāo)準(zhǔn)的問(wèn)題,影響著EQA結(jié)果的客觀性;同時(shí),由于實(shí)驗(yàn)室人員在儀器校準(zhǔn)和方法選擇等方面存在的問(wèn)題以及一些人為因素的影響,在某種程度上使EQA結(jié)果不能反映實(shí)驗(yàn)室的真實(shí)能力[8]。如果用其計(jì)算西格瑪值同樣也會(huì)出現(xiàn)上文所述的來(lái)源不一致問(wèn)題。
1.3靶值核定方法不確定性高 靶值核定的方法有多種,按照不確定性增加的順序分別為5種。(1)已知值。由特定的樣品配制配方(如制備、稀釋)確定的結(jié)果。(2)有證參考值,由定義法確定。(3)參考值。通過(guò)與一個(gè)可追溯到國(guó)家或國(guó)際標(biāo)準(zhǔn)的標(biāo)準(zhǔn)物質(zhì)/標(biāo)準(zhǔn)樣品或標(biāo)準(zhǔn)進(jìn)行分析,測(cè)量或?qū)Ρ葯z測(cè)物品所確定的值。(4)權(quán)威實(shí)驗(yàn)室的公議值。各專(zhuān)家實(shí)驗(yàn)室通常具有可證實(shí)的能力,所使用的方法也已經(jīng)過(guò)確認(rèn),具有較高的精密度和正確度,與通常使用的方法具有可比性。(5)參加實(shí)驗(yàn)室獲得公議值。需要應(yīng)用到某些特定的統(tǒng)計(jì)量并考慮極端結(jié)果的影響。大多數(shù)情況下,定性指標(biāo)采用預(yù)先確定的多數(shù)百分率的公議值;對(duì)于定量指標(biāo),采用適當(dāng)對(duì)比組的平均值,例如,通過(guò)加權(quán)平均或者算術(shù)變換的平均值,亦或中位數(shù)、眾數(shù)或者其他穩(wěn)健度量。
前3種方法作為確定性較高的方法,所依據(jù)的基礎(chǔ)均為“制備樣品”,其優(yōu)點(diǎn)是較為穩(wěn)定和準(zhǔn)確,但是存在很難獲取的問(wèn)題,原因在于3點(diǎn)。第一,樣本和儀器的匹配問(wèn)題。利用有證參考值法確定靶值時(shí),要求附有證書(shū)的參考物質(zhì)和特定儀器組或方法學(xué)的匹配使用。不同的儀器組之間的參考物質(zhì)不能混用。第二,基質(zhì)效應(yīng)問(wèn)題。樣本中分析物周?chē)乃蟹欠治鑫镔|(zhì)(基質(zhì))均會(huì)對(duì)檢測(cè)結(jié)果造成影響,甚至對(duì)不同儀器組檢測(cè)結(jié)果的影響方式也有所不同[2],而在真實(shí)的檢驗(yàn)場(chǎng)景中,測(cè)量患者樣品就不會(huì)出現(xiàn)這樣的情況。第三,制備的成本問(wèn)題。若用制備樣品進(jìn)行日常實(shí)驗(yàn)室的質(zhì)控工作,成本較高。后2種方法均是將實(shí)驗(yàn)室的檢測(cè)結(jié)果經(jīng)過(guò)統(tǒng)計(jì)學(xué)的處理后作為靶值,差別在于如果有“權(quán)威”實(shí)驗(yàn)室的存在,則采納專(zhuān)家實(shí)驗(yàn)室的結(jié)果,如果沒(méi)有“權(quán)威”實(shí)驗(yàn)室,那么只能將參加實(shí)驗(yàn)室的所有結(jié)果進(jìn)行統(tǒng)計(jì)學(xué)處理,這相當(dāng)于考慮采納了所有實(shí)驗(yàn)室的結(jié)果(除極端值以外),因此是不確定性最高的方法。然而,常規(guī)實(shí)驗(yàn)室EQA靶值的統(tǒng)計(jì)方法就是從參加EQA的實(shí)驗(yàn)室中獲得公議值,盡管不確定性較高但是可操作性強(qiáng)。
1.4業(yè)內(nèi)尚未形成一致、合理的性能規(guī)范 無(wú)論是臨床檢驗(yàn)IQC還是EQA,其目的都是識(shí)別和量化檢驗(yàn)性能的優(yōu)劣。性能規(guī)范[9]是臨床實(shí)驗(yàn)室為確保臨床醫(yī)生做出滿(mǎn)意的臨床決策所需達(dá)到的質(zhì)量水平。除非預(yù)先設(shè)定性能規(guī)范,否則對(duì)檢驗(yàn)醫(yī)學(xué)進(jìn)行質(zhì)量評(píng)價(jià)是沒(méi)有意義的[10]。為滿(mǎn)足臨床需求,當(dāng)前各種指南制定了不同的性能規(guī)范,包括:國(guó)家推薦性標(biāo)準(zhǔn)規(guī)范、衛(wèi)生行業(yè)標(biāo)準(zhǔn)規(guī)范或根據(jù)生物學(xué)變異導(dǎo)出的“最佳”、“適當(dāng)”和“最低”的質(zhì)量規(guī)范。但是以上3種規(guī)范均未考慮“濃度”對(duì)不精密度和不正確度的影響。當(dāng)前最簡(jiǎn)便的方法是根據(jù)已有的指南選取一個(gè)“相對(duì)符合”的性能規(guī)范,并用于判斷自身實(shí)驗(yàn)室的水平是否符合自身的預(yù)期。然而以管理者的思路將評(píng)價(jià)結(jié)果應(yīng)用到機(jī)構(gòu)間互認(rèn)情形中,就需要充分考慮生物學(xué)變異和當(dāng)前技術(shù)水平,制定合理的性能規(guī)范作為合格標(biāo)準(zhǔn)。
2.1室內(nèi)數(shù)據(jù)室間化管理策略 IQC作為常態(tài)化的實(shí)驗(yàn)室質(zhì)控管理工具,在日常的質(zhì)控中得到了更為廣泛的應(yīng)用,并已積累了更多的數(shù)據(jù)。針對(duì)檢驗(yàn)方法學(xué)和儀器組在合適質(zhì)控品的選擇上,靈活度也高于EQA。理論上在數(shù)據(jù)收集足夠充分和操作規(guī)范的情況下,IQC就是針對(duì)多個(gè)儀器組進(jìn)行多輪次的EQA。用IQC數(shù)據(jù)計(jì)算偏倚,進(jìn)而測(cè)算西格瑪?shù)冉y(tǒng)計(jì)量也是一種思路。早有研究者提出“IQC數(shù)據(jù)實(shí)驗(yàn)室間比對(duì)計(jì)劃”,即要求所有實(shí)驗(yàn)室檢測(cè)同一批號(hào)質(zhì)控物,并將每月原始的IQC數(shù)匯報(bào)給組織者。通過(guò)回報(bào)的結(jié)果,各實(shí)驗(yàn)室可得到自己實(shí)驗(yàn)室每個(gè)項(xiàng)目的不正確度和不精密度評(píng)價(jià)結(jié)果[11]。為此可采取“IQC數(shù)據(jù)室間化管理”的辦法,對(duì)通過(guò)常規(guī)信息渠道收集的IQC數(shù)據(jù)進(jìn)行剔除異常值、精細(xì)化分組、穩(wěn)健算法來(lái)計(jì)算靶值,作為IQC數(shù)據(jù)偏倚的估計(jì),以此解決數(shù)據(jù)來(lái)源不一致的問(wèn)題。
2.2采用多次IQC檢測(cè)值和靶值的差值以精確估計(jì)不同濃度的偏倚 1.2中最大的矛盾點(diǎn)在于用EQA的平均偏倚來(lái)估計(jì)質(zhì)控品各濃度水平下的偏倚,其解決思路和前文一致,將用質(zhì)控?cái)?shù)據(jù)偏倚的均值或偏倚曲線(xiàn)的方法,更換為直接用檢測(cè)值和靶值的差值來(lái)估計(jì)偏倚。那么與之而來(lái)的問(wèn)題即是靶值的核定方法。
2.3采用IQC數(shù)據(jù)核算靶值 為盡可能提升靶值結(jié)果的準(zhǔn)確性,有以下3個(gè)關(guān)鍵點(diǎn)。(1)增加獨(dú)立檢測(cè)結(jié)果數(shù)據(jù)量。根據(jù)大數(shù)定律及中心極限定理,參加IQC的實(shí)驗(yàn)室越多,實(shí)驗(yàn)檢測(cè)的頻次越高,獨(dú)立檢測(cè)數(shù)據(jù)積累的也就越多。那么通過(guò)樣本來(lái)估計(jì)總體情況的可靠性也就越高,所得到的樣本靶值也越靠近真實(shí)值。(2)使用獨(dú)立的第三方質(zhì)控品。各實(shí)驗(yàn)室之間必須采用統(tǒng)一的質(zhì)控品和質(zhì)控規(guī)則,并嚴(yán)格規(guī)范檢驗(yàn)的流程,盡可能減少隨機(jī)誤差的產(chǎn)生。(3)采用更加穩(wěn)健的統(tǒng)計(jì)方法。在去除極端值的情況下盡可能保留更多的樣本數(shù)據(jù)。根據(jù)上述原則采用IQC數(shù)據(jù)核算靶值是問(wèn)題1.3的解決思路。
2.4性能規(guī)范界定難決定了互認(rèn)策略制定難 關(guān)于建立檢驗(yàn)醫(yī)學(xué)分析質(zhì)量規(guī)范策略的議題,當(dāng)前國(guó)內(nèi)外公認(rèn)的性能規(guī)范設(shè)定模式是斯德哥爾摩等級(jí)結(jié)構(gòu),以及在此基礎(chǔ)上簡(jiǎn)化的3個(gè)水平:基于分析性能對(duì)臨床結(jié)果的影響而設(shè)定的性能規(guī)范、基于被測(cè)量的生物學(xué)變異組分而設(shè)定的性能規(guī)范和基于當(dāng)前技術(shù)水平而設(shè)定的性能規(guī)范[12]。性能規(guī)范的選擇會(huì)直接影響檢驗(yàn)結(jié)果的準(zhǔn)確性和可靠性。由于不同的用戶(hù)對(duì)性能規(guī)范的要求不同,可以根據(jù)實(shí)際用途對(duì)性能規(guī)范進(jìn)行調(diào)整。從這個(gè)角度看,互認(rèn)不單純是采取單一標(biāo)準(zhǔn)的問(wèn)題,要根據(jù)性能預(yù)期、應(yīng)用場(chǎng)景、儀器組、患者人群制定不同的互認(rèn)策略。盡管合格的標(biāo)準(zhǔn)很難界定,但定量項(xiàng)目精密度、偏倚和允許總誤差等指標(biāo)均是以數(shù)值形式表達(dá),給不同機(jī)構(gòu)之間的比較提供了條件。
綜上,前3個(gè)問(wèn)題最好的解決辦法即是,通過(guò)IQC數(shù)據(jù)測(cè)算靶值,進(jìn)而用靶值和檢測(cè)值差距的絕對(duì)值作為對(duì)偏倚的估計(jì),這樣既解決了在計(jì)算西格瑪度量值時(shí)數(shù)據(jù)來(lái)源不一致的問(wèn)題,同時(shí)也提高了靶值和偏倚估計(jì)的可信度。具體的操作方法如下:
第一步,細(xì)分臨床檢測(cè)項(xiàng)目組,將IQC數(shù)據(jù)按照項(xiàng)目、檢測(cè)方法學(xué)、儀器組、樣本批次、樣本濃度、質(zhì)控品進(jìn)行分組,形成一個(gè)個(gè)獨(dú)立的測(cè)量組,作為計(jì)算靶值的單位。
第二步,剔除極端值,按照拉依達(dá)準(zhǔn)則或狄克遜準(zhǔn)則剔除異常值,其目的是剔除某些機(jī)構(gòu)或者某些檢測(cè)值對(duì)整體均值的影響。
第三步,計(jì)算靶值,用穩(wěn)健算法計(jì)算靶值,采用穩(wěn)健算法的原因是為了能夠保留更多樣本量的同時(shí)避免極端值的影響,使靶值的估計(jì)更貼近真實(shí)水平。
第四步,估計(jì)偏倚,用檢測(cè)值和靶值的差值來(lái)估計(jì)某機(jī)構(gòu)的偏倚。
第五步,用IQC數(shù)據(jù)進(jìn)行變異系數(shù)、西格瑪值等指標(biāo)的測(cè)算。
相較于用EQA數(shù)據(jù)來(lái)估計(jì)偏倚的方法,所采用的IQC數(shù)據(jù)估計(jì)偏倚的辦法具有3點(diǎn)優(yōu)勢(shì)。(1)可保證測(cè)算所需數(shù)據(jù)來(lái)源的一致性。(2)可保證可信度更高。同期上海市臨床檢驗(yàn)中心累計(jì)室內(nèi)數(shù)據(jù)762.3萬(wàn)條,室間數(shù)據(jù)24.7萬(wàn)條。根據(jù)大數(shù)定律 (law of large numbers),檢測(cè)的次數(shù)越多,其結(jié)果趨近真實(shí)值的可能性也就越大。(3)偏倚的估計(jì)更為準(zhǔn)確。為驗(yàn)證多次EQA結(jié)果擬合偏倚曲線(xiàn)代入檢測(cè)值方法的合理性,用2019年室間數(shù)據(jù)檢測(cè)值和偏倚值的絕對(duì)值來(lái)進(jìn)行擬合,檢測(cè)回歸曲線(xiàn)是否有意義。結(jié)果顯示累計(jì)擬合了11 836條曲線(xiàn),其中只有3 235項(xiàng)是有意義的,占總數(shù)的27%,由此可見(jiàn)當(dāng)前常用的偏倚曲線(xiàn)方法其可信度并不高。
本方法雖然具有以上優(yōu)勢(shì),但是也存在一定的局限性,其中最為關(guān)鍵的一點(diǎn)就是對(duì)數(shù)據(jù)數(shù)量和質(zhì)量的要求都較高。只有足夠的數(shù)據(jù)積累才能更加準(zhǔn)確地估算靶值和偏倚值;其二,是對(duì)數(shù)據(jù)處理能力的要求較高。以上海為例,一年將近七百萬(wàn)的數(shù)據(jù)量,要進(jìn)行去極端值、穩(wěn)健算法、細(xì)化分組等操作,一般的數(shù)據(jù)軟件難以處理,因此要求更專(zhuān)業(yè)的數(shù)據(jù)處理手段。這也是多年來(lái)限制臨床質(zhì)控和評(píng)價(jià)方法發(fā)展的一大原因。
本文提出4個(gè)關(guān)鍵問(wèn)題,其中前3個(gè)已經(jīng)給出了應(yīng)對(duì)的思路和策略,并對(duì)結(jié)果進(jìn)行了優(yōu)勢(shì)和局限性的評(píng)價(jià),但是如何制定不同項(xiàng)目的性能規(guī)范,將質(zhì)量評(píng)價(jià)結(jié)果應(yīng)用到互認(rèn)環(huán)節(jié),尚未得出明確結(jié)論。有研究提出綜合考慮EQA和IQC結(jié)果作為項(xiàng)目結(jié)果互認(rèn)的依據(jù),李婷婷等[13]通過(guò)分析京津冀地區(qū)110家檢驗(yàn)結(jié)果互認(rèn)醫(yī)療機(jī)構(gòu)糖化血紅蛋白(HbA1c)的EQA和IQC結(jié)果,評(píng)價(jià)互認(rèn)實(shí)驗(yàn)室HbA1c檢測(cè)結(jié)果的可比性。王治國(guó)[14]認(rèn)為應(yīng)該充分利用實(shí)驗(yàn)室現(xiàn)有的IQC數(shù)據(jù)和EQA結(jié)果,積極開(kāi)展現(xiàn)場(chǎng)比對(duì)實(shí)驗(yàn)(正確度驗(yàn)證計(jì)劃、臨床新鮮標(biāo)本的比對(duì))等,只要不同醫(yī)療機(jī)構(gòu)之間某一生化檢驗(yàn)項(xiàng)目的不精密度、偏倚或總誤差(偏差)在其質(zhì)量規(guī)范之內(nèi),就認(rèn)為具有可比性,為醫(yī)療機(jī)構(gòu)之間檢驗(yàn)結(jié)果互認(rèn)提供了科學(xué)依據(jù)。我們更認(rèn)可這一觀點(diǎn),但是當(dāng)前的研究依舊沒(méi)有解決在多儀器組、多濃度的情況下如何綜合多條件考慮互認(rèn)場(chǎng)景的問(wèn)題,這也將成為后續(xù)的研究重點(diǎn)。