付芮,張成亮,沈云,陳大治,町田治彥,蔡磊
CT圖像重建算法是CT圖像生成的基礎(chǔ),與CT圖像質(zhì)量關(guān)系密切。目前,臨床上常用的圖像重建方式是自適應統(tǒng)計迭代重建(adaptive statistical iterative reconstruction veo,ASIR-V)。然而,高迭代水平在降低圖像噪聲的同時,會導致圖像過度平滑和蠟狀偽影,同時會降低圖像的分辨率[1-4]。近期,GE公司開發(fā)的基于深度學習的圖像重建(deep learning iterative reconstruction,DLIR)能夠有效地克服高權(quán)重迭代算法導致的過度平滑等問題,既能降低圖像噪聲,又能保持圖像紋理和較高的空間分辨率[5]。目前,對DLIR在降低圖像噪聲中的作用及相關(guān)臨床應用的研究相對比較多,而對其在圖像分辨率方面的作用的相關(guān)研究比較少,尤其是體模實驗。因此,本研究中使用JIS體模,通過主客觀指標的評估及測量,對比傳統(tǒng)的迭代重建算法(ASIR-V)與不同等級的DLIR對圖像質(zhì)量(圖像噪聲和分辨率)的影響,并探討DLIR在降低掃描劑量方面的可能性。
1.檢查方法
使用GE Revolution Apex對分辨率體模(JIS體模)進行掃描,JIS體模的外觀見圖1。掃描參數(shù):120 kV,0.5 s/r,探測器寬度80 mm,螺距0.992,層厚0.625 mm。分別采用常規(guī)劑量(A組)和低劑量(CTDI為mGy;B組)進行掃描,A組和B組的容積CT劑量指數(shù)(volume computed tomography dosimetry index,CTDIvol)分別為11.50和4.22 mGy。A組原始數(shù)據(jù)采用常規(guī)臨床掃描時設(shè)置的30%權(quán)重的ASIR-V進行圖像重建,B組采用濾波反投影(filtered back projection,FBP)、不同權(quán)重的迭代算法(30%-、60%-、90%-ASIR-V)及不同級別的DLIR(DLIR-L、DLIR-M、DLIR-H)共7種算法進行圖像重建。
圖1 JIS體模的外觀。
2.圖像質(zhì)量評價
將圖像傳輸至AW4.7工作站進行觀察,窗寬400 HU,窗位35 HU。
客觀評價:在JIS體模中的試管內(nèi)勾畫圓形ROI(面積135mm2),保證ROI在每層圖像及重建方式下形狀、大小和位置一致,測量各ROI內(nèi)的CT值及其SD(圖像噪聲),對每組圖像上每個ROI的數(shù)據(jù)均測量3次取平均值,并按照公式(1)計算圖像的SNR:
(1)
主觀評分:由3位具有5年工作經(jīng)驗的放射科醫(yī)師對每組圖像的噪聲和分辨率(空間分辨率/密度分辨率)采用五分法進行評價,意見不一致時經(jīng)協(xié)商討論得出一致性評分。圖像噪聲的評分標準:1分,太多噪聲;2分,超過接受程度的噪聲;3分,可以接受的噪聲;4 分,較少的噪聲;5分,非常少的噪聲。空間分辨率的主觀評價內(nèi)容包括圖像上各結(jié)構(gòu)的邊緣和清晰度,圖像密度分辨率的主觀評價包括圖像上各結(jié)構(gòu)形態(tài)、邊緣及與周圍的密度差,具體評分標準:1分,完全不能辨認;2分,圖像部分勉強辨認;3分,圖像勉強辨認;4分,圖像基本清晰;5分圖像非常清晰。圖像評分≥3分為滿足臨床診斷要求。
3.統(tǒng)計學分析
使用SPSS 26.0軟件進行統(tǒng)計學分析。采用單因素方差分析比較不同重建算法下測量的試管內(nèi)CT值、SD及SNR,進一步組間兩兩比較采用LSD檢驗。以P<0.05為差異具有統(tǒng)計學意義。主觀評分的一致性采用Fleiss Kappa檢驗,Kappa值<0.20為一致性差,0.21~0.40為一致性較差,0.41~060為一致性中等,0.61~0.80為一致性較好,0.81~1.00為一致性極好。
1.輻射劑量
A組常規(guī)劑量的CDTIvol值為11.5 mGy,B組低劑量的CDTIvol值為4.22 mGy,B組較A組下降了63.30%。
2.圖像質(zhì)量的客觀評價
A組常規(guī)劑量30%-ASIR-V算法和B組低劑量不同重建算法的重建圖像上體模試管內(nèi)CT值、SD及SNR測量結(jié)果詳見表1和圖2。A組常規(guī)劑量30%-ASIR-V算法和B組7種算法獲得的重建圖像上測得的CT值的差異無統(tǒng)計學意義(P>0.05);而SD和SNR的差異均有統(tǒng)計學意義(P<0.001)。對SD和SNR進一步進行組間兩兩比較,不同權(quán)重ASIR-V和不同級別DLIR算法測得的SD均明顯低于FBP算法,SNR高于FBP算法,差異均有統(tǒng)計學意義(P<0.05)。B組中,與30%權(quán)重(臨床掃描常用權(quán)重)ASIR-V相比,使用DLIR-L、DLIR-M和DLIR-H算法重建圖像的SD分別降低了15.39%、29.61%和45.11%;隨著ASIR-V權(quán)重或DLIR級別的升高,SD越低,SNR越高。在相同權(quán)重迭代算法(30%-ASIR-V)下,低劑量與常規(guī)劑量相比圖像的SD升高了68.33%,SNR降低了41.03%;但是,低劑量組采用DLIR-H進行圖像重建后,與常規(guī)劑量組30%-ASIR-V重建圖像相比,SD下降了7.61%。
表1 A、B組不同重建算法下試管內(nèi)定量參數(shù)測量結(jié)果
3.圖像質(zhì)量的主觀評價
三位放射科醫(yī)師對A組和B組不同算法重建圖像上圖像質(zhì)量的主觀評分結(jié)果詳見表2。三位醫(yī)師對A組及B組中FBP、不同權(quán)重迭代算法(30%-ASIR-V,60%-ASIR-V,90%-ASIR-V)及不同級別DLIR算法(DLIR-L、DLIR-M、DLIR-H)獲得的重建圖像上圖像噪聲和分辨率(圖像空間分辨率/密度分辨率部分)的主觀評分的一致性均較好(Kappa≥0.80,P<0.05)。圖像噪聲評分隨著ASIR-V的權(quán)重或DLIR級別的升高而降低,基本與客觀評價結(jié)果的變化趨勢類似;圖像分辨率評分隨著ASIR-V權(quán)重的升高而降低,但隨著DLIR級別的升高而升高(圖3~4)。與A組常規(guī)劑量的圖像質(zhì)量(噪聲和分辨率)相比,應用DLIR能夠達到常規(guī)劑量掃描的圖像質(zhì)量,尤其是應用高級別深度重建算法。
表2 A、B組不同重建算法下圖像噪聲、密度及空間分辨率的主觀評分
圖3 A組常規(guī)劑量30%-ASIR-V和B組低劑量不同重建算法獲得的JIS體模重建圖像。在相同算法(30%-ASIR-V)下體模內(nèi)各結(jié)構(gòu)的形態(tài)、邊緣及清晰度的顯示清晰度均低于常規(guī)劑量。體模內(nèi)各結(jié)構(gòu)的形態(tài)和邊緣在低劑量FBP圖像和不同權(quán)重ASIR-V重建圖像上均顯示欠清晰,而在DLIR-L、DLIR-M和DLIR-H圖像上顯示清晰。a)A組常規(guī)劑量30%-ASIR-V;b)B組FBP;c)B組30%-ASIR-V;d)B組60%-ASIR-V;e)B組90%-ASIR-V;f)B組DLIR-L;g)B組DLIR-M;h)、B組DLIR-H。
圖4 A組常規(guī)劑量30%-ASIR-V和B組低劑量不同重建算法獲得的體模重建圖像,在相同算法(30%-ASIR-V)下體模內(nèi)各結(jié)構(gòu)的形態(tài)、邊緣及清晰度的顯示清晰度均低于常規(guī)劑量。體模內(nèi)各結(jié)構(gòu)的形態(tài)和邊緣在低劑量FBP圖像和不同權(quán)重ASIR-V重建圖像上均顯示欠清晰,而在DLIR-L、DLIR-M和DLIR-H圖像上顯示清晰。a)A組常規(guī)劑量30%-ASIR-V;b)B組FBP;c)B組30%-ASIR-V;d)B組60%-ASIR-V;e)B組90%-ASIR-V;f)B組DLIR-L;g)B組DLIR-M;h)B組DLIR-H。
迭代重建算法是目前CT圖像的主要重建方法,通過改變權(quán)重達到不同程度的降噪效果,同時能提高圖像的對比度。但是一些學者發(fā)現(xiàn)高權(quán)重迭代重建算法會改變圖像的噪聲幅度和紋理特征,出現(xiàn)過度平滑現(xiàn)象[1-4]。本研究結(jié)果也表明隨著ASIR-V的權(quán)重增加,圖像的噪聲(SD)降低,SNR升高,但是圖像的空間分辨率和密度分辨率的主觀評分明顯下降,圖像的噪聲評分變差,因此使用高權(quán)重迭代算法獲得的圖像質(zhì)量可能妨礙對圖像的理解,限制了高權(quán)重迭代重建的使用和其在臨床應用中減少輻射劑量的潛力,所以在本院的臨床常規(guī)應用中設(shè)置的ASIR-V的權(quán)重為30%。
DLIR算法基于卷積神經(jīng)網(wǎng)絡,從數(shù)百萬個訓練參數(shù)中對低噪聲、高分辨率的高劑量濾波反投影圖像紋理進行比對合驗,直至輸出圖像與相同數(shù)據(jù)高劑量的圖像一致。杜煜等[6]在低輻射劑量條件下(CTDI從13.6 mGy降低60%至5.45 mGy)應用DLIR可以使圖像達到常規(guī)劑量的圖像質(zhì)量。Cheng等[7]在CTU掃描中發(fā)現(xiàn)深度學習算法可以明顯降低圖像噪聲,并在輻射劑量減少71%的情況下保持圖像質(zhì)量不變。Jiang等[8]研究證實使用DLIR進行超低劑量(接近胸片劑量)CT掃描可以獲得接近常規(guī)劑量胸部CT掃描的圖像質(zhì)量,較迭代重建算法顯著提高了對結(jié)節(jié)檢出率、結(jié)節(jié)測量準確性和結(jié)節(jié)惡性相關(guān)征象顯示。Li等[9]在進行低劑量條件下提高增強腹部CT圖像質(zhì)量的可行性研究時發(fā)現(xiàn)當輻射劑量降低57%,采用深度學習H檔進行圖像重建時圖像噪聲較低,病變細節(jié)顯示良好。
本研究從主客觀兩方面采用了多項指標來評估深度學習重建算法(DLIR)對圖像分辨率和噪聲的影響。從主客觀分析結(jié)果來看,隨著ASIR-V權(quán)重的增加,圖像的噪聲(SD)降低,SNR升高,但空間分辨率和密度分辨率的主觀評分明顯下降。臨床常規(guī)掃描權(quán)重30%-ASIR-V重建圖像的SD值為14.98±1.52,低劑量(CTDI從11.5 mGy減低63.30%至4.22 mGy)30%-ASIR-V重建圖像SD值為25.21±2.47,相比常規(guī)劑量圖像SD升高68.33%,從主觀評分結(jié)果看,在相同算法下輻射劑量降低,圖像噪聲增大,圖像分辨率降低。從客觀分析結(jié)果來看,同一劑量條件下,使用DLIR不同級別(L/M/H)進行重建,與30%-ASIR-V圖像相比,SD分別降低了15.39%、29.61%和45.11%,而SNR值逐漸升高;從主觀評分結(jié)果來看,DLIR圖像的分辨率隨著DLIR級別的升高而升高,以DLIR-H為最佳;而降噪能力隨著DLIR級別的升高而增加,DLIR-H圖像的SD為13.84±1.42,較臨床常規(guī)掃描時30%-ASIR-V重建圖像的SD下降了7.61%,而且圖像質(zhì)量(噪聲和分辨率)能達到常規(guī)劑量的圖像質(zhì)量,上述研究結(jié)果與文獻報道基本一致[6-12]。
本研究的局限性:本研究中低劑量掃描條件僅設(shè)置了一組,并未研究使用其它降低輻射劑量的方法時DLIR對圖像質(zhì)量的影響;其次,本研究對象為體模,未涉及對病變的顯示情況進行評估等內(nèi)容,而不同病種對圖像細節(jié)的要求可能有一定差異,故本研究結(jié)果在臨床驗證中還可能存在一些差異。
綜上所述,應用深度學習重建算法(DLIR)獲得的圖像,要比傳統(tǒng)的ASIR重建圖像更有優(yōu)勢,尤其是有利于低劑量掃描時在保證圖像分辨率的同時有效減低圖像噪聲,為低劑量掃描提供了更廣泛的應用場景。