白國杰,李珂欣,劉文遠(yuǎn),蘭廣,郭紅,孫雅蘋,王煜,童衛(wèi)玲,張克宇
MRI已成為臨床可疑前列腺癌(prostate cancer, PCa)患者的重要檢測工具。MRI引導(dǎo)前列腺穿刺活檢可以提高有臨床意義的前列腺癌(clinically significant prostate cancer, csPCa)的檢測準(zhǔn)確性[1]。目前,前列腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(prostate imaging-reporting and data system,PI-RADS)是解釋前列腺M(fèi)RI不可或缺的一部分,其目的是對前列腺癌進(jìn)行風(fēng)險(xiǎn)分層,以指導(dǎo)組織學(xué)檢查以及臨床治療方法的選擇。自從2012年P(guān)I-RADS v1發(fā)表以來,2015年對其進(jìn)行了重大修訂(PI-RADS v2),但PI-RADS v2仍表現(xiàn)出一些局限性,比如觀察者間的一致性只有良好到中等,對移行帶(transition zone, TZ)前列腺癌的診斷準(zhǔn)確性不高。因此2019年對PI-RADS v2再次進(jìn)行了修訂(PI-RADS v2.1),旨在為MRI解釋提供更精確的定義,以減少觀察者之間的差異,提高診斷準(zhǔn)確性,特別是對于TZ病變[2]。Linhares Moreira[3]等學(xué)者研究顯示PI-RADS v2.1診斷性能沒有顯著提高,然而Wang等[4]學(xué)者的研究顯示PI-RADS v2.1在診斷csPCa的特異性顯著降低,Oerther等[5]學(xué)者研究則表明,PI-RADS v2.1在評估TZ病變方面特異性和準(zhǔn)確性明顯高于PI-RADS v2。因此,PI-RADS v2.1的診斷性能仍然存在不確定性。因此,本研究擬對文獻(xiàn)進(jìn)行Meta分析,評價(jià)PI-RADS v2.1和PI-RADS v2在檢測csPCa方面的診斷性能。
檢索中國知網(wǎng)(CNKI)、萬方數(shù)據(jù)庫、中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(CBM)、Medline、Embase、Web of Science、Cochrane Library數(shù)據(jù)庫,檢索時(shí)間從建庫至2022年4月16日。檢索詞為“PIRADS 2.1”或“PIRADSv 2.1”或“PI-RADS 2.1”或“PI-RADS v2.1”等,采用主題詞加自由詞對數(shù)據(jù)庫進(jìn)行文獻(xiàn)檢索,結(jié)合人工檢索,并對納入文獻(xiàn)的參考文獻(xiàn)進(jìn)行二次檢索。
由三位醫(yī)師進(jìn)行文獻(xiàn)檢索和初始標(biāo)題/摘要審查,然后由兩位醫(yī)師閱讀全文后以協(xié)商一致方式進(jìn)行文獻(xiàn)篩選,如仍不能達(dá)成一致,由經(jīng)驗(yàn)更豐富的兩位醫(yī)師共同加入,共四位醫(yī)師協(xié)商一致。不符合納入標(biāo)準(zhǔn)的研究,如與研究目標(biāo)相關(guān),仍保留供一般審查和參考。
納入標(biāo)準(zhǔn)分為主要標(biāo)準(zhǔn)和次要標(biāo)準(zhǔn)。主要標(biāo)準(zhǔn):(1)PI-RADS v2.1與PI-RADS v2診斷性能比較的相關(guān)研究;(2)PI-RADS v2.1與PI-RADS v2在前列腺癌診斷方面的敏感度(sensitivity,SEN)、特異性(specificity, SPE)、陽性預(yù)測值(positive predictive value, PPV)和陰性預(yù)測值(negative predictive value, NPV)的研究;(3)文獻(xiàn)構(gòu)建2×2列聯(lián)表,提供真陽性(true positive,TP)、假陽性(false positive, FP)、假陰性(false negative, FN)、真陰性(true negative, TN)數(shù)據(jù),或提供足夠的數(shù)據(jù)可以計(jì)算以上數(shù)據(jù)。次要標(biāo)準(zhǔn):(4)關(guān)于PI-RADS v2.1和PI-RADS v2的觀察者間一致性的研究;(5)提供PI-RADS v2.1和PI-RADS v2的PI-RADS有關(guān)類別csPCa比率。滿足主要納入標(biāo)準(zhǔn)(1)(2)(3),但不符合次要納入標(biāo)準(zhǔn)(4)和(5)的研究也被納入本研究。
排除標(biāo)準(zhǔn):(1)會議論文、病例報(bào)道、評論、綜述以及Meta分析;(2)不符合主要納入標(biāo)準(zhǔn)的研究;(3)樣本量小于30的研究。
數(shù)據(jù)提取與合成由四名醫(yī)師根據(jù)《Cochrane干預(yù)措施系統(tǒng)性評審手冊》和《系統(tǒng)評價(jià)與薈萃分析首選報(bào)告項(xiàng)目》(PRISMA)檢查表中的指南進(jìn)行。
數(shù)據(jù)提取根據(jù)預(yù)先設(shè)計(jì)的表格進(jìn)行數(shù)據(jù)提取,數(shù)據(jù)包括患者人口統(tǒng)計(jì)學(xué)、血清PSA、樣本量、MRI掃描儀強(qiáng)度、DWI最高b值、觀察者人數(shù)、前列腺分區(qū)和參考標(biāo)準(zhǔn)。PI-RADS v2.1和PIRADS v2的TP、FP、FN和TN計(jì)數(shù)直接或通過重新計(jì)算從每項(xiàng)研究中得出,構(gòu)建2×2列聯(lián)表。
由研究員根據(jù)QUADAS-2對納入的研究進(jìn)行質(zhì)量評價(jià),如仍不能達(dá)成一致,由經(jīng)驗(yàn)更豐富的醫(yī)師加入,協(xié)商一致。
使用STATA軟件(Stata/MP 17.0)和ReMan(Review Manager 5.4.1)進(jìn)行Meta分析。使用森林圖表示每項(xiàng)研究的PI-RADS v2.1與PI-RADS v2的敏感度、特異性,并對SEN、SPE、陽性似然比(positive likelihood ratio, PLR)、陰性似然比(negative likelihood ratio, NLR)、診斷比值比(diagnostic odds ratio, DOR)進(jìn)行合并,以綜合受試者工作特征曲線(summary receiver operator characteristic curve, SROC)表示。對三個(gè)協(xié)變量:腫瘤位置(移行帶)、閾值(閾值3與閾值4)、作者國籍(中國與外國)進(jìn)行亞組分析。
共檢索到文獻(xiàn)552篇,中文112篇、英語440篇,去除重復(fù)文獻(xiàn)后共236篇,通過閱讀標(biāo)題與摘要排除215篇(不相關(guān)文獻(xiàn)159篇,綜述29篇,評論10篇、會議論文6篇、學(xué)位論文11篇)。選擇21項(xiàng)研究進(jìn)行全文閱讀,其中6篇與研究內(nèi)容不相符被排除,3篇數(shù)據(jù)不完整被排除,最終共12項(xiàng)研究被納入Meta分析,文獻(xiàn)篩選流程見圖1。
圖1 文獻(xiàn)篩選流程圖Figure 1 Process of literature screening
12項(xiàng)研究共納入3 158例患者,3 243個(gè)病灶?;颊吣挲g41~86歲,血清PSA 0.5~129.3 ng/ml。
納入的12項(xiàng)研究,對PI-RADS v2.1與PI-RADS v2在csPCa診斷性能方面進(jìn)行了研究,其中6項(xiàng)關(guān)于TZ研究,1項(xiàng)研究外周帶(peripheral zone, PZ),2項(xiàng)研究PZ、TZ及總病變,3項(xiàng)研究沒有進(jìn)行分區(qū)。
所有研究均為回顧性研究,7項(xiàng)研究以PIRADS評分3~5分為陽性,1~2分為陰性;5項(xiàng)研究以PI-RADS評分4~5分為陽性,1~3分為陰性。所有研究都通過穿刺活檢或前列腺切除術(shù)組織學(xué)診斷,以病理結(jié)果作為診斷標(biāo)準(zhǔn),Gleason(GS)評分≥7和(或)體積≥0.5 cm3和(或)包膜外侵犯的病灶定義為csPCa。文獻(xiàn)特征見表1。
表1 納入Meta分析的12項(xiàng)研究的基本特征Table 1 Basic characteristics of 12 studies in the Meta-analysis
使用診斷準(zhǔn)確性研究質(zhì)量評估工具(QUADAS-2)對文獻(xiàn)進(jìn)行質(zhì)量評價(jià),見圖2。
圖2 QUADAS-2質(zhì)量評價(jià)Figure 2 QUADAS-2 assessment
2.3.1 整個(gè)腺體(包括PZ、TZ、ALL)診斷性能 對所有分區(qū)及整個(gè)腺體(包括PZ、TZ、ALL)共12項(xiàng)研究3 243處病變,所有納入單個(gè)研究PI-RADS v2與PI-RADS v2.1診斷準(zhǔn)確性的敏感度均較高,總體敏感度分別為0.93(0.80~0.96)和0.93(0.77~0.98);特異性均稍低,總體特異性分別為0.53(0.25~0.89)和0.61(0.24~0.91),納入的每個(gè)研究詳細(xì)敏感度、特異性,見圖3。PI-RADS v2的總體敏感度、總體陰性似然比與PI-RADS v2.1比較差異較小,PI-RADS v2的總體特異性、總體陽性似然比、總體診斷比值比比PI-RADS v2.1略低,見表2。與 PI-RADS v2相比,PI-RADS v2.1在所有分區(qū)及整個(gè)腺體檢測csPCa性能的SROC曲線下面積(area under curve, AUC)較大,見圖4A。
表2 PI-RADS v2.1 vs.PI-RADS v2對整個(gè)腺體及移形帶csPCa的診斷性能 (95%CI)Table 2 Diagnostic performance of PI-RADS v2.1 vs.PI-RADS v2 for the whole gland and transition zone csPCa (95%CI)
圖3 所有分區(qū)PI-RADS v2.1與PI-RADS v2診斷性能森林圖Figure 3 Forest maps of diagnostic performance of PI-RADS v2.1 and PI-RADS v2 for all zones
圖4 PI-RADS v2.1 vs.PI-RADS v2診斷性能SROC曲線Figure 4 SROC curves of diagnostic performance ofPI-RADSv2.1 vs.PIRADSv2
2.3.2 腫瘤部位(分區(qū))診斷性能亞組分析 (1)TZ區(qū)診斷性能:納入TZ研究共8項(xiàng)2 205處病變。PI-RADS檢測移形帶前列腺癌與整個(gè)腺體診斷性能基本相同,PI-RADS v2的總體敏感度、總體陰性似然比與PI-RADS v2.1差異較小,PI-RADS v2的總體特異性、總體陽性似然比、總體診斷比值比比PI-RADS v2.1略低,見表2。與PI-RADS v2相比,PI-RADS v2.1在檢測TZ區(qū)csPCa性能的SROC曲線下面積(AUC)較大,見圖4B。(2)PZ區(qū)診斷性能:納入PZ研究共3項(xiàng)1 513處病變,由于STATA軟件metandi命令要求至少4項(xiàng)研究才能合并分析,因此未能合并診斷性能指標(biāo)和也未繪制SROC曲線。
2.3.3 不同閾值(閾值為3vs.閾值為4)診斷性能亞組分析 共7項(xiàng)研究采用閾值3,采用閾值3時(shí),PI-RADS v2.1總體敏感度較PI-RADS v2沒有明顯提高;PI-RADS v2.1總體特異性較PI-RADS v2有所提高;共5項(xiàng)研究采用閾值4,采用閾值4時(shí)PI-RADS v2.1總體敏感度較PI-RADS v2沒有明顯提高;PI-RADS v2.1較PI-RADS v2總體特異性有所提高。無論是PI-RADS v2還是PI-RADS v2.1,采用閾值3時(shí),總體敏感度均較采用閾值4時(shí)稍高,采用閾值4時(shí),總體特異性均較采用閾值3明顯提高,見表3。PI-RADS v2.1結(jié)合4為閾值檢測csPCa性能的SROC曲線下面積(AUC)最大,見圖4C。
表3 不同閾值及不同作者國籍PI-RADSv2.1 vs.PI-RADS v2診斷性能的比較 (95%CI)Table 3 Diagnostic performance of PI-RADS v2.1 vs.PI-RADS v2 for different thresholds and different nationalities of the authors (95%CI)
2.3.4 不同國籍(中國vs.國外)診斷性能亞組分析 納入的中國研究共5項(xiàng),中國的研究PI-RADS v2與PI-RADS v2.1的總體敏感度相同;PI-RADS v2的總體特異性較PI-RADS v2.1有所提高;納入的國外研究共7項(xiàng),國外的研究PI-RADS v2.1的總體敏感度較PI-RADS v2沒有明顯提高,PI-RADS v2.1的總體特異性較PI-RADS v2有所提高。中國的研究PI-RADS v2和PI-RADS v2.1總體敏感度和國外的研究相同,總體特異性明顯高于國外研究,見表3。PI-RADS v2.1的中國研究在檢測csPCa性能的SROC曲線下面積(AUC)最大,見圖4D。
高?;颊咴谇傲邢倩顧z前進(jìn)行MRI檢查,以對其進(jìn)行風(fēng)險(xiǎn)分層,指導(dǎo)前列腺活檢。PI-RADS旨在標(biāo)準(zhǔn)化前列腺M(fèi)RI的成像參數(shù)、術(shù)語和報(bào)告[18]。PI-RADS v2雖然在臨床得到廣泛應(yīng)用,但仍有局限性,如DWI評分模糊、不同研究之間診斷準(zhǔn)確性存在差異等[19]。因此,在2019年引入了PI-RADS v2.1,在不改變PI-RADS v2總體目標(biāo)的情況下,通過微小的修改來改善這些局限性[2]。PI-RADS v2對T2加權(quán)成像(T2weightedimaging, T2WI)評分為2分的病變未進(jìn)行分類,PI-RADS v2.1的一個(gè)重要變化是T2WI對TZ評分為2分病變進(jìn)行分類評估,如果DWI評分≤3分,那么病變總評分為2分,如果DWI評分為≥4,那么病變總評分提升至3分。典型囊變的良性前列腺增生(benign prostatic hyperplasia, BPH)結(jié)節(jié)T2WI評分為1分,新分類的“非典型結(jié)節(jié)”T2WI評分為2分。
本研究結(jié)果表明,PI-RADS v2.1與PI-RADS v2檢測csPCa的敏感度(分別為0.92與0.93)都較高,從v2升級到v2.1版本總體敏感度并沒有明顯提高,但是在TZ中,敏感度稍微有所提高(0.92與0.93),但提高也并不明顯。因此,對于臨床懷疑前列腺癌的患者,MRI被推薦作為篩查的一線檢查手段[20]。然而其特異性都比較低,盡管PI-RADS v2.1的特異性(0.64)較PI-RADS v2(0.57)有所提高,但總體還是處于中等水平。這可能會影響患者主動(dòng)監(jiān)測的長期成本效益,因此MRI靶向活檢監(jiān)測被整合到主動(dòng)監(jiān)測方案中,以優(yōu)化診斷,改善監(jiān)測期間疾病狀態(tài)評估[21-22]。PI-RADS v2.1特異性有所提高,可能由于基于DWI序列的非典型結(jié)節(jié)由2分(PI-RADS v2)升級到了3分。由于DWI序列是腫瘤多參數(shù)MR成像的重要序列,有學(xué)者建議T2WI評分為3分、且DWI評分<4分的TZ病變可降至2分,這可能會提高PIRADS的特異性。
本研究結(jié)果與Lee等[23]學(xué)者的研究結(jié)果有些不同。Lee的Meta分析顯示PI-RADS v2.1比v2的特異性顯著降低,該分析納入了8項(xiàng)研究(本研究納入了其中7項(xiàng)研究,其中1項(xiàng)研究[4]沒有明確指出是關(guān)于csPCa的而被排除),并且Lee的研究只納入了英文文獻(xiàn),本研究納入了5篇中文文獻(xiàn),并且本研究采用Lee納入的8項(xiàng)研究進(jìn)行驗(yàn)證時(shí)得出結(jié)果與其結(jié)果一致,目前結(jié)果的差異可能是本研究納入了更多的研究,導(dǎo)致研究結(jié)果異質(zhì)性增大。本結(jié)果與Park等[24]學(xué)者的Meta分析結(jié)果基本一致。
此外,本研究還對閾值和作者國籍進(jìn)行了亞組分析。研究發(fā)現(xiàn)不管閾值為3還是4,PI-RADS v2.1與v2診斷csPCa的SEN、SPE、PLR、NLR、DOR差異均明顯;然而,不管PI-RADS v2.1還是v2在閾值取4時(shí),SPE、PLR、DOR都比閾值取3時(shí)有顯著提高。在不同國籍的亞組分析中也得到類似的結(jié)果,不管中國還是外國,PI-RADS v2.1與v2診斷csPCa的SEN、SPE、PLR、NLR、DOR差異不顯著;然而,不管PI-RADS v2.1還是v2在中國研究中,SPE、PLR、DOR都比外國的研究有顯著提高。這提示選取不同閾值可能會造成研究異質(zhì)性,同時(shí)中國的研究特異性明顯高于國外的,可能與國內(nèi)學(xué)者大多選取閾值為4有關(guān)。
本研究尚存在一定局限性:(1)各研究之間存在一定的異質(zhì)性,但在可接受范圍內(nèi);(2)不同研究的掃描參數(shù)不同可能會影響研究結(jié)果一致性;(3)納入的文獻(xiàn)相對較少,但我們已經(jīng)納入常見數(shù)據(jù)庫的所有相關(guān)文獻(xiàn),納入的12項(xiàng)研究的總體數(shù)量較少,關(guān)于PZ區(qū)研究少于4項(xiàng),而未能進(jìn)行亞組分析;(4)納入研究均為回顧性研究,這可能會引入發(fā)表偏倚。與2015年發(fā)布的PI-RADS v2相比,PI-RADS v2.1在2019年剛剛實(shí)施,相對較短的經(jīng)驗(yàn)也可能是研究結(jié)果中的混淆因素。
PI-RADS v2.1與PI-RADS v2比較,在診斷性能方面并沒有顯著提升,總體特異性仍為中等水平,這可能導(dǎo)致陰性活檢率增加,特別是對于PIRADS評分為3分的病變特異性較差,可以考慮通過調(diào)整閾值來提高總體診斷的特異性。
利益沖突聲明:
所有作者均聲明不存在利益沖突。