陳衛(wèi)中 張菊英
兩冠心病診斷試劑盒雙正態(tài)ROC曲線下面積及其等效性或非劣效性檢驗
陳衛(wèi)中1,2張菊英1△
目的探討在雙正態(tài)假定下,應用標準化差法進行定量資料ROC曲線下面積的估計及其等效性檢驗或非劣效性檢驗,比較兩氧化低密度脂蛋白試劑盒在診斷冠心病中的價值。方法 從ROC曲線的定義出發(fā),根據(jù)模型中參數(shù)的統(tǒng)計學意義,完成ROC曲線的構(gòu)建、曲線下面積的估計,并利用標準化差結(jié)合等效性檢驗、非劣效性檢驗原理,進行參數(shù)檢驗,或在Bootstrap基礎上利用可信區(qū)間法得到結(jié)論。結(jié)果 兩試劑盒均顯示氧化低密度脂蛋白在冠心病診斷中具有較高的準確性。從非劣效性檢驗的結(jié)果可以看出,CHN試劑盒在冠心病診斷上非劣于已經(jīng)投入臨床使用的SWZ試劑盒。結(jié)論 兩試劑盒具有較高的臨床推廣價值,且具有較高性價比的CHN試劑盒在國內(nèi)臨床市場有較好的前景。同時為類似問題的解決提供了方法學參考。
等效性檢驗 非劣性效檢驗 標準化差 ROC Bootstrap
1.四川大學華西公共衛(wèi)生學院衛(wèi)生統(tǒng)計學教研室(610041)
2.成都醫(yī)學院公共衛(wèi)生系
△通訊作者:陳菊英,E-mail:juying109@163.com
ROC(receiver operating characteristic,ROC)曲線是將診斷試驗結(jié)果劃分為若干臨界點,以每個臨界點對應的靈敏度為縱坐標,1-特異度為橫坐標作圖得到的曲線,是一種全面、準確評價診斷試驗的有效工具〔1〕,被認為是診斷試驗評價中的理想和經(jīng)典的方法〔2〕,其曲線下面積表征了診斷試驗的準確性。
隨著人們對診斷試驗的認識不斷深入,根據(jù)研究目的的不同,如某種新的診斷方法相較于目前常用的方法更微創(chuàng),更經(jīng)濟,操作更簡便,此時的研究目的就在于驗證該方法的準確性是否等于或非劣于標準方法,因此除傳統(tǒng)的差異性設計外,標準陽性對照(非金標準)試驗中的等效性或非劣效性設計也被廣泛地提出,在統(tǒng)計學檢驗就屬于等效或非劣效性檢驗的范疇。Obuchowski〔3〕和 Zhou〔4〕等已經(jīng)提出了針對 ROC 曲線下面積的非參數(shù)等效或非劣效性檢驗方法,本文在雙正態(tài)假定的基礎上,利用參數(shù)檢驗方法對兩冠心病診斷試劑盒進行了等效性和非劣效性檢驗。
1.對象 684名受試對象經(jīng)冠狀動脈造影術(shù)(CAG)確定的冠心病病人176例,正常人508例。分別使用兩個試劑盒CHN、SWZ測定血漿中氧化低密度脂蛋白(Oxidized LDL,OxLDL)。
2.方法
(1)雙正態(tài)ROC曲線下面積
設X、Y代表疾病人群的和對照人群的檢測變量,其分別來自兩個不同的正態(tài)總體,即:
設檢測變量取值越大越有可能成為病人,根據(jù)Bamber〔5〕ROC 曲線下面積 θ定義:θ=P(X>Y),則有θ=P(X-Y>0)。由于X、Y均來自正態(tài)分布,則X-Y的分布為:
由此,ROC曲線下面積可推導為:
其中TPF為敏感度,F(xiàn)PF為假陰性率,即1-特異度。
(2)ROC曲線下面積的等效或非劣效性檢驗
由雙正態(tài)ROC曲線下面積的推導不難發(fā)現(xiàn),進行兩檢測方法曲線下面積θ1和θ2在設定的等效臨界值Δ是否等效或非劣效時,可轉(zhuǎn)化為對標準化差λ進行假設檢驗即可,此時針對λ的等效臨界值ε〔6〕即為:ε=Φ-1(θ2+Δ)-Φ-1(θ2)。其中Δ為在一定范圍內(nèi)相等/等效的允許值,一般認為應從專業(yè)角度反復論證并結(jié)合成本效益加以估計,當Δ難以確定時,可使用Zhou〔4〕推薦的0.05。提出的檢驗假設分別為:
等效檢驗多采用Schuirmann〔8〕提出的雙向單側(cè)檢驗的方法(two one-sided tests,TOST),即分別對下限和上限做兩次單側(cè)檢驗,故假設實際為:
其中nA、nN分別為疾病組和對照組的例數(shù),SAi、SNi為疾病組的和對照組的樣本標準差為兩檢測方法疾病組和對照組的Pearson相關系數(shù)估計值,、為樣本均數(shù)。
(3)Bootstrap可信區(qū)間法
根據(jù)Bootstrap〔11〕的基本原理,以再抽樣方法估計標準化差的可信區(qū)間,并在此基礎上進行等效或非劣效性檢驗,其具體步驟為:
②按疾病狀態(tài)分組變量分層,用有放回的方法分別從病例組和對照組中抽取與各組例數(shù)相同的樣本,獲得用于計算標準化差的Bootstrap樣本;
④重復②、③,重復抽取B-1次,獲得B個Bootstrap樣本,一般來講B不小于2000;
(4)軟件實現(xiàn)
通過Rokit3.0,并結(jié)合PlotROC實現(xiàn)雙正態(tài)模型ROC曲線的構(gòu)建和參數(shù)估計。利用SAS 8.0完成兩曲線等效性或非劣效性檢驗,及Bootstrap基礎上的可信區(qū)間檢驗。
從表1可以看出兩試劑盒均顯示作為冠心病的診斷指標,氧化低密度脂蛋白ROC曲線下面積分別為0.9747和0.9910,并有統(tǒng)計學意義,說明診斷準確性較高,具有臨床診斷價值。其ROC曲線如圖1所示。
表1 兩試劑盒曲線下面積及其參數(shù)估計
由于本次試驗的目的在于證實CHN試劑盒的診斷準確性非劣于SWZ試劑盒,故只進行非劣效性檢驗,取Δ=0.05,則ε=0.8024。由表3可以看出,Z=3.8114大于Z0.05=1.645,故拒絕 H0,可以認為 CHN試劑盒的診斷準確性非劣于SWZ試劑盒。同時,Bootstrap可信區(qū)間也表明大于-ε=-0.8024,結(jié)論和非劣效性檢驗結(jié)果一致。
有研究表明〔10〕,雖然雙正態(tài)模型是以正態(tài)分布假定為基礎的,但實際應用中可適當放寬這樣的假定,即使資料服從指數(shù)分布、二項分布、Poisson分布、χ2分布、Gamma分布等,利用雙正態(tài)模型仍能得到較好地近似,尤其在樣本量較大或結(jié)合使用MLE法對兩個參數(shù)進行估計的情況下,具有較好的穩(wěn)健性。
圖1 兩試劑盒ROC曲線
表2 兩試劑盒統(tǒng)計描述
Liu等〔6〕通過模擬實驗認為,無論正態(tài)分布還是偏態(tài)分布(如指數(shù)分布),基于標準化差的等效性或非劣效性檢驗在控制假陰性的發(fā)生和檢驗效能方面均優(yōu)于非參數(shù)檢驗方法,表現(xiàn)出了較好的穩(wěn)健性,但若資料不服從雙正態(tài)假定時,利用在Bootstrap基礎上的標準化差區(qū)間法進行等效性或非劣效性檢驗更值得推薦。對于等級資料,雖然標準化差法的表現(xiàn)仍然優(yōu)于非參數(shù)法,但在ROC曲線下面積的等效性或非劣效性檢驗中,其II型錯誤的發(fā)生率仍然較大,因此對于等級資料ROC曲線下面積的等效性或非劣效性檢驗仍有待進一步研究。
表3 兩試劑盒曲線下面積等效性檢驗結(jié)果
從本次研究的兩個試劑盒來看,兩試劑盒均顯示作為冠心病的診斷指標,氧化低密度脂蛋白具有較高診斷準確性,兩試劑盒均具有臨床診斷推廣價值。從非劣效性檢驗的結(jié)果可以看出,具有較高性價比的CHN試劑盒在冠心病診斷上非劣于已經(jīng)投入臨床使用的SWZ試劑盒,在國內(nèi)臨床市場有較好的前景。
1.Gregory Mark.Receiver-operating characteristic(ROC)plots:fundamental evaluation tool in clinical medicine.Clin Chem,1993,39(4):561-567.
2.Copas JB,Corabitt P.Overestimation of the receiver operating characteristic curve for logistic regression.Biometrika,2002,89(2):315-331.
3.Obuchowski N.Testing for equivalence of diagnostic tests.American Journal of Radiology,1997,168:13-17.
4.Zhou XH,Obuchowski NA,McClish DK.Statistical methods in diagnostic medicine.Wiley:New York,2002,188-192.
5.Bamber D.The area above the ordinal dominance graph and thearea below the receiver operating characteristic graph.J.Math.Psychol,1975,12:387-415.
6.Liu JP,Ma MCh,Wu ChY,et al.Tests of equivalence and non-inferiority for diagnostic accuracy based on the paired area sunder ROC curves.Statist.Med,2006,25:1219-1238.
7.Green DM,Swets JA.Signal Detection theory and Psychophysics.New York:Wiley,1966.
8.Schuirmann DJ.A comparison of the two one-sided tests procedure and the power approach for assessing the equivalence of average bioavailability.J.Pharmacokin.Biopharm.,1987,15(6):657-680.
9.Serfling RJ.Approximation theorems of mathematical statistics.Wiley:New York,1978,19-21.
10.Harley J,Hajian-Tilaki Kl.A comparison of parametric and nonparametric approaches to ROC analysis of quantitative diagnostic tests.Med.Decis.Making,1997,17(1):96-102.
11.Efron B,Tibshirani RJ.An introduction to the bootstrap.Chapman &Hall:New York,1993,168-176.
12.劉勤,金丕煥,高爾生.Bootstrap方法及其醫(yī)學統(tǒng)計學應用.中華預防醫(yī)學雜志,1998,32(1):52-53.
Application of Equivalence or Non-Inferiority Test for Diagnostic Accuracy under the Bi-normal Distribution Based on the Areas of ROC in Two OxLDL Kits for Coronary Heart Disease Diagnostic
ChenWeizhong,ZhangJuying.DepartmentofHealthStatistics,SichuanUniversity(610041),Chendu
ObjectiveTo assess equivalence or non-inferiority in accuracy between two OxLDL kits for coronary heart disease diagnostic,plot ROC curves and compare the are as using equivalence or non-inferiority test.MethodsAccording to the theory of ROC and the statistical meaning of the parameters,the bi-normal model ROC curves were plotted,the areas under the curves were estimated and compared using the standardized difference approach and the standardized difference confidence interval based on bootstrap for assessing equivalence or non-inferiority in diagnostic accuracy.ResultsThe different kits show conformably that the OxLDL is suitable for Coronary Heart Disease diagnostic,the kit of CHN is non-inferior to the SWZ.ConclusionResults from the trial have shown that the accuracy of OxLDL for coronary heart disease diagnostic.At the same time,explore a right way to put forward equivalence or non-inferiority test using the standardized difference approach under the bi-normal distribution and confidence interval approach based on bootstrap,provide a theoretical reference for similar problems.
Equivalence test;Non-inferiority test;Standardized difference;ROC;Bootstrap