劉敬霞
(1. 衡水市第四人民醫(yī)院,河北 衡水 053000;2.河北醫(yī)科大學(xué),河北 石家莊 050000)
據(jù)統(tǒng)計(jì)數(shù)據(jù)顯示,目前我國的肺癌發(fā)病率以每年26.9%的速度増長。然而肺癌并非完全無法治愈,若在患者形成肺部腫瘤階段診斷出來,則有可能降低肺癌發(fā)病率。但由于腫瘤組織初期時(shí),其特征很難通過PET/CT圖像顯示出來。當(dāng)前常用的PET/CT計(jì)算機(jī)輔助診斷方法有基于神經(jīng)網(wǎng)絡(luò)[1]、基于聚類分析和基于支持向量機(jī)[2]三種方法,這三種方法雖然可以一定程度上改善診斷性能,但與精確診斷的預(yù)期目標(biāo)還存在一定差距,為此,本研究提出基于隨機(jī)森林的肺部腫瘤PET/CT計(jì)算機(jī)輔助診斷新方法。該方法首先對(duì)肺部腫瘤PET/CT影像進(jìn)行預(yù)處理,提取PET/CT圖像中肺部腫瘤的病理特征,如紋理、形狀等,然后利用隨機(jī)森林算法判斷肺部腫瘤的良惡性,當(dāng)腫瘤為惡性時(shí),判斷其具體類別。通過仿真實(shí)驗(yàn)測(cè)試該方法的有效性,在相同的實(shí)驗(yàn)條件下,通過四種不同PET/CT計(jì)算機(jī)輔助診斷方法的診斷結(jié)果,對(duì)比其診斷性能。
PET/CT是一種將PET技術(shù)和CT集成為一體的新型影像設(shè)備,可最大限度滿足臨床各種疾病診療需求[3]。然而,現(xiàn)有的PET/CT設(shè)備也僅將診斷精度由30%提高到35%左右。因此,為提高PET/CT圖像的診斷準(zhǔn)確性,本研究設(shè)計(jì)了一種計(jì)算機(jī)輔助診斷方法。
原始的PET/CT圖像中肺部腫瘤的病變組織特征成像不是很清晰,因此,需要對(duì)原始PET/CT圖像的灰度化、平滑和分割三項(xiàng)內(nèi)容[4]進(jìn)行預(yù)處理。
2.1.1圖像灰度化 圖像灰度化是將彩色圖像轉(zhuǎn)換成像素值在0~255之間的圖像,即將其轉(zhuǎn)換成不同灰度程度的圖像,從而降低色彩對(duì)目標(biāo)腫瘤最終成像的干擾。目前圖像灰度化方法主要有四種:
分量法:
Gray=B;Gray=G;Gray=R
(1)
其中,Gray為轉(zhuǎn)換后的灰度圖像的灰度值。R、G、B為彩色圖的三個(gè)分量。
最大值法:
Gray=max(B+G+R)
(2)
平均值法:
Gray=(B+G+R)/3
(3)
加權(quán)平均法:
Gray= 0.11B+ 0.59G+ 0.3R
(4)
2.1.2圖像平滑 圖像平滑是去除圖像中的噪點(diǎn),提高清晰度。本研究選擇小波去噪的方法進(jìn)行圖像平滑處理,首先對(duì)圖像信號(hào)進(jìn)行小波分解,然后對(duì)分解結(jié)果進(jìn)行閾值量化,最后利用二維小波再次重新構(gòu)建圖像信號(hào),得到去噪后的圖像[5]。
2.1.3圖像分割 肺部腫瘤圖像分割是將圖像劃分為若干個(gè)小區(qū)域,從而得到精確的腫瘤輪廓圖,這是圖像特征提取前最關(guān)鍵的一步。目前,對(duì)圖像分割有基于EM算法、基于閾值以及基于邊緣檢測(cè)的圖像分割等[6]。本研究針對(duì)PET/CT圖像的特點(diǎn),采用基于平均密度投影和平移高斯模型的肺部腫瘤圖像分割新算法,算法基本流程見圖1。
圖1 PET/CT圖像分割基本流程Fig.1 Basic flow of PET/CT image segmentation
PET/CT圖像特征提取是肺部腫瘤診斷的關(guān)鍵,直接影響肺部腫瘤圖像分類器的分類性能。需要提取的PET/CT圖像特征包括灰度、形態(tài)特征和紋理等,具體過程見圖2。
圖2 PET/CT圖像特征Fig. 2 PET/CT images features
圖2中,各參數(shù)從不同角度描述了PET/CT圖像的特征,但這些參數(shù)的量綱并不一致,因此,要進(jìn)行特征歸一化處理將特征參數(shù)的取值范圍映射到預(yù)先設(shè)定的范圍內(nèi)。本研究使用高斯歸一化方法將特征參數(shù)的取值范圍映射到[-1,1]區(qū)間內(nèi)[7]。
隨機(jī)森林建立后,向其中輸入新的樣本,將該樣本特征與隨機(jī)森林中每棵決策樹所代表的類別特征進(jìn)行對(duì)比,判斷新樣本的類別,被選擇最多的類別即為該樣本的類別[8]。
建立決策樹在行采樣時(shí),采用有放回的方式,以避免出現(xiàn)過擬合現(xiàn)象。即采集的訓(xùn)練樣本中一部分是重復(fù)的,而列采樣需從M個(gè)特征中選擇前m個(gè)(m 圖3 隨機(jī)森林算法運(yùn)行流程Fig. 3 Random forests operation process 利用隨機(jī)森林算法進(jìn)行肺部腫瘤識(shí)別診斷,分為訓(xùn)練與應(yīng)用分類[10-11]兩個(gè)階段。訓(xùn)練過程如下: 輸入:樣本數(shù)為n,類別為M的肺部腫瘤PET/CT圖像訓(xùn)練集。 輸出:分類模型。 將肺部腫瘤PET/CT圖像訓(xùn)練樣本分為兩類:多數(shù)類Z1和少數(shù)類Z2。 For每個(gè)基分類器j=1:S。 Step1:從多數(shù)類Z1中抽出與Z2相同數(shù)量的樣本,并與Z2混合,形成新的樣本集; Step2:訓(xùn)練隨機(jī)森林; Step3:計(jì)算分類置信度; Step4:當(dāng)基分類器對(duì)任意樣本Zi正確分類時(shí),Pij=1;當(dāng)基分類器對(duì)任意樣本Zi錯(cuò)誤分類時(shí),Pij=-1。 end 根據(jù)分類器損失函數(shù),優(yōu)化求解,求出分類器權(quán)重w。 應(yīng)用分類過程如下: 輸入:待分類肺部腫瘤PET/CT圖像樣本。 輸出:肺部腫瘤PET/CT圖像樣本類別。 For每個(gè)待分類樣本。 Step1:利用訓(xùn)練好的S個(gè)分類器進(jìn)行種類識(shí)別[12],得到類別概率值; Step2:對(duì)得到的各個(gè)類別概率值進(jìn)行加權(quán)求和,選擇最大概率值所對(duì)應(yīng)的類作為待測(cè)樣本的所屬類別。 end 利用上述過程判斷肺部腫瘤良惡性。當(dāng)腫瘤為惡性時(shí)判讀屬于哪一類別,實(shí)現(xiàn)基于隨機(jī)森林的肺部腫瘤PET/CT計(jì)算機(jī)輔助診斷方法的設(shè)計(jì)。 從某醫(yī)院選出2014~2018年的68 956例肺部腫瘤患者,其中男性42 010例,女性26 946例。良性肺部腫瘤15 868例,其中男性占42.4%,女性占57.6%,有結(jié)構(gòu)瘤、纖維瘤等。惡性腫瘤53 000例,其中男性占65.2%,女性占34.8%,有鱗癌、腺癌、原位腺癌、大細(xì)胞癌、大細(xì)胞神經(jīng)內(nèi)分泌腫瘤、小細(xì)胞肺癌等。其余肺部疾病88例,包括肺結(jié)核40例、肺部感染48例。 除影像數(shù)據(jù)外,本研究使用軟件Matlab2012b搭建自編碼網(wǎng)絡(luò)模型。在前期準(zhǔn)備工作中,先對(duì)PET/CT圖像進(jìn)行灰度化、去除噪聲、圖像分割等預(yù)處理。 3.2.1灰度化圖像 以某肺部腫瘤PET/CT圖像為例,灰度化結(jié)果見圖4。 圖4 肺部腫瘤PET/CT圖像灰度化Fig. 4 Graying the lung tumor PET/CT image 3.2.2圖像去噪 將上述肺部腫瘤PET/CT進(jìn)行去噪處理,去噪結(jié)果見圖5。 圖5 肺部腫瘤PET/CT圖像去噪Fig. 5 Denoising the lung tumor PET/CT image 3.2.3圖像分割 將上述肺部腫瘤PET/CT圖像進(jìn)行圖像病變組織放大分割,結(jié)果見圖6。 圖6 肺部腫瘤PET/CT圖像分割Fig. 6 Segmentation of lung tumor PET/CT image 部分肺部腫瘤PET/CT圖像特征提取數(shù)據(jù)見表1。 表1 部分肺部腫瘤PET/CT圖像特征提取數(shù)據(jù)Table 1 Feature extraction data of partial lung tumor PET/CT image 3.4.1評(píng)價(jià)指標(biāo) ROC是描述真正率(TPR)和假正率(FPR)關(guān)系的曲線,ROC曲線越接近左上角的1點(diǎn),診斷準(zhǔn)確率越高,若越接近右下角的1點(diǎn),診斷準(zhǔn)確率越低;此外,與坐標(biāo)圖形邊界圍成的面積,即曲線下面積(AUC)越大,說明該方法的準(zhǔn)確性越高。 3.4.2診斷結(jié)果 ROC診斷結(jié)果見圖7。 圖7 ROCFig. 7 ROC 由圖7可知,代表本研究方法的A點(diǎn)最接近左上角的1點(diǎn),且其所占用的AUC為0.854,數(shù)值最大。其次為代表基于神經(jīng)網(wǎng)絡(luò)的輔助診斷方法的B點(diǎn),然后是代表基于支持向量機(jī)的輔助診斷的D點(diǎn),最后是代表基于聚類分析的輔助診斷方法的C點(diǎn),說明本研究方法的診斷結(jié)果更為精確。 肺部腫瘤的早期診斷可以提高其治愈率,但目前在早期診斷出肺部腫瘤的概率只有30%左右。針對(duì)該問題,本研究提出一種基于隨機(jī)森林的肺部腫瘤PET/CT圖像計(jì)算機(jī)輔助診斷方法,該方法經(jīng)ROC測(cè)試AUC達(dá)0.854,有效提高了診斷準(zhǔn)確性,達(dá)到了預(yù)期目標(biāo)。3 仿真實(shí)驗(yàn)分析
3.1 實(shí)驗(yàn)數(shù)據(jù)
3.2 圖像處理
3.3 圖像特征提取
3.4 評(píng)價(jià)指標(biāo)與診斷結(jié)果分析
4 結(jié)束語