楊翠紅,張璐雯,王子興,姜晶梅
(中國醫(yī)學(xué)科學(xué)院基礎(chǔ)醫(yī)學(xué)研究所 北京協(xié)和醫(yī)學(xué)院基礎(chǔ)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系,北京 100005)
肺癌是我國乃至世界上死亡率最高的惡性腫瘤,5年生存率不足20%[1-2]。肺癌高危人群的早期診斷、早期治療能提高患者預(yù)后,如Ⅰ期肺癌患者切除術(shù)后5年生存率達(dá)70%以上[3-6]。肺癌篩查是發(fā)現(xiàn)早期肺癌的重要手段,但其伴隨的極高假陽性率是一項(xiàng)重大挑戰(zhàn)[7]。肺癌篩查中的“假陽性”是指按照一定的標(biāo)準(zhǔn)判斷為陽性而事實(shí)上并非肺癌的情況[8-9]。美國國家肺癌篩檢試驗(yàn)對(duì)高危人群進(jìn)行低劑量CT篩查發(fā)現(xiàn),肺癌的死亡率降低了20%,但假陽性率高達(dá)96%[9]。這給篩查對(duì)象帶來身心負(fù)擔(dān)、過度診治等問題[10-12]。大規(guī)模篩查中醫(yī)師人數(shù)和精力相對(duì)有限,且影像圖像的噪聲和肺結(jié)節(jié)特征多樣性均會(huì)影響篩查效率,而20世紀(jì)中期興起的計(jì)算機(jī)輔助診斷則提高了檢測效率[13],但假陽性問題同樣不容忽視,如Silva等[14]在2 303例低劑量CT肺癌篩查數(shù)據(jù)庫基礎(chǔ)上,對(duì)磨玻璃樣結(jié)節(jié)進(jìn)行檢測,計(jì)算機(jī)輔助診斷的靈敏度為88.4%,但平均每4次掃描存在1個(gè)假陽性結(jié)節(jié)(假陽性結(jié)節(jié)數(shù)/篩查總?cè)藬?shù))。
在肺結(jié)節(jié)篩查過程中,通常用經(jīng)典的歐氏幾何來量化結(jié)節(jié)特征(如體積、直徑),這些指標(biāo)具有臨床可解讀性,然而對(duì)于隱匿復(fù)雜的結(jié)構(gòu)信息,歐式幾何則很難將其準(zhǔn)確量化,該部分信息常會(huì)被忽視;數(shù)學(xué)學(xué)科中的分形分析可有效捕捉這一復(fù)雜結(jié)構(gòu)信息。分形分析可為臨床醫(yī)師篩查或診斷肺部疾患提供豐富的圖像信息?,F(xiàn)就分形分析在肺部腫瘤和其他肺部病變中的應(yīng)用進(jìn)展予以綜述。
1.1幾何特性 “分形”的概念最早由Mandelbrot[15]于20世紀(jì)60年代提出,是對(duì)沒有特征長度(如圓的半徑可視為其特征長度)但具有一定意義的自相似圖形和結(jié)構(gòu)的總稱。分形理論是了解自然界不光滑、不規(guī)則的幾何形體的基本工具。分形有3個(gè)特性[16]:①自相似性,即在某種形式上,總體的任何一部分與總體相似;②尺度可變性,即尺寸縮放不影響分形特點(diǎn);③分形是不規(guī)則的,不能用傳統(tǒng)的幾何語言來描述,與歐式幾何的整數(shù)維度不同,分形可以是非整數(shù)維。
1.2主要參數(shù)
1.2.1分形維數(shù)(fractal dimension,F(xiàn)D) FD是分形分析中的重要參數(shù),用于描述具有分形填充研究空間的方式[16-17]。1919年Hausdorff給出FD理論層面的定義,而后有學(xué)者提出具有實(shí)際應(yīng)用價(jià)值的FD[17]。下文對(duì)經(jīng)典的盒維數(shù)的定義及常用算法進(jìn)行介紹。
設(shè)某集合是度量空間S上的有界子集,對(duì)每個(gè)r>0,用Nr表示覆蓋該集合的半徑為r>0的閉球的最少個(gè)數(shù),如果存在
(1)
則此極限值為該集合的盒維數(shù)。
在醫(yī)學(xué)圖像數(shù)據(jù)挖掘中,盒維數(shù)最經(jīng)典的計(jì)算方法是盒計(jì)數(shù)法(box-counting method,BCM),其他實(shí)用的校正BCM的方法——差分盒計(jì)數(shù)法(differential box-counting method,DBCM)、擴(kuò)展BCM、分段修正盒計(jì)數(shù)也在文獻(xiàn)中有所涉及[18-19]。在肺部圖像分析中,以BCM與DBCM最為常用[20-29]。
BCM假設(shè)用邊長為r的盒子覆蓋不規(guī)則形體,則
Nr=Kr-D
(2)
隨著r的變化,可以得到不同的盒子數(shù)Nr,對(duì)其進(jìn)行l(wèi)og轉(zhuǎn)換
logNr=logK-Dlogr
(3)
根據(jù)式(3),繪制得到以logr與logNr為x軸和y軸的散點(diǎn)圖,對(duì)其擬合回歸直線(圖1),回歸系數(shù)D為盒維數(shù),logK表示研究對(duì)象的面積或體積,更接近于一個(gè)簡單的歐式幾何意義[30]。
盒維數(shù)估計(jì)值=1.63
BCM原理和計(jì)算簡便,但信息提取能力有限,只能提取研究對(duì)象的幾何結(jié)構(gòu)信息。與BCM相比,DBCM可很好地量化粗糙表面,估計(jì)出的FD更精確[31]。
DBCM于1995年由Chaudhuri和Sarkar[19]提出,將圖像映射到以(x,y)為二維位置,以灰度值作為高度(z)的三維空間,得到
(4)
其中nr(i,j)=l-k+1,表示第(i,j)位置的盒子數(shù),l和k分別表示在(i,j)位置上的最大高度值和最小高度值分別落在第l和第k個(gè)小盒子;然后依據(jù)式(3)得到差分盒維數(shù)。DBCM利用了圖像的灰度級(jí),可以彌補(bǔ)BCM無法很好地提供粗糙表面這一缺陷。
另外,由于影像圖像的像素強(qiáng)度和位置不能以相同的比例縮放,使用符合強(qiáng)度標(biāo)度獨(dú)立性的方法計(jì)算FD更為合適,如傅立葉功率譜法[31]。
1.2.2空隙度 20世紀(jì)60年代后期Mandelbrot和Van Ness[32]提出空隙度,即具有相同F(xiàn)D的研究對(duì)象也可能具有顯著不同的外觀或紋理,為此,1983年Mandelbrot[33]引入空隙度來描述這一特征。
空隙度[22]用于描述物體或圖像中的空隙的分布和大小,與FD相對(duì)應(yīng)。其定義為:
(5)
M=KLD
(6)
其中M是分形集的質(zhì)量,E(M)是期望質(zhì)量。這一定義測量了實(shí)際質(zhì)量和預(yù)期質(zhì)量之間的差異??障抖饶芙o出易于解釋的圖形結(jié)果,可應(yīng)用于任何維度的數(shù)據(jù)[34]。
分形參數(shù)可用于度量肺部腫瘤以及其他肺部疾患的形態(tài)信息,且與診斷疾病的關(guān)鍵指標(biāo)有較好的相關(guān)性[26,35]。在肺部研究中,分形分析在肺部腫瘤、慢性阻塞性肺疾病、間質(zhì)性肺疾病中均有應(yīng)用,更多的是應(yīng)用于肺部腫瘤以及慢性阻塞性肺疾病的診斷,見表1、2。
表1 分形分析在肺部腫瘤圖像的應(yīng)用
表2 分形分析在其他肺部病變圖像的應(yīng)用
2.1肺部腫瘤 在肺部腫瘤中,小細(xì)胞癌惡化速度快、手術(shù)預(yù)后差,難以實(shí)現(xiàn)早期診斷和治療,且占比較小,因此非小細(xì)胞癌尤其是發(fā)病率相對(duì)較高的鱗癌和腺癌是分形分析研究的重點(diǎn)。
2.1.1提取感興趣區(qū)域(region of interest,ROI) 提取ROI是計(jì)算機(jī)輔助診斷的首要環(huán)節(jié),有研究者采用FD對(duì)圖像進(jìn)行增強(qiáng),F(xiàn)D的選擇多是基于DBCM獲得的盒維數(shù)[21,37]。將每個(gè)像素點(diǎn)轉(zhuǎn)化為FD值,使圖像增強(qiáng),不同組織結(jié)構(gòu)的邊緣更加清晰,從而達(dá)到更易提取ROI的目的;計(jì)算肺結(jié)節(jié)紋理特征的盒維數(shù)并結(jié)合最大類間方差法,設(shè)計(jì)出圖像分割判別條件從而提取ROI。Al-Kadi和Watson[21]應(yīng)用前者對(duì)分辨率為512×512 pixels的增強(qiáng)CT圖像進(jìn)行ROI的提取。羅曉華[37]則應(yīng)用最大類間方差法提取ROI,并對(duì)低對(duì)比度的圖像進(jìn)行加權(quán)分?jǐn)?shù)維灰度增強(qiáng),從而更易提取ROI。
2.1.2量化肺結(jié)節(jié)特征 肺結(jié)節(jié)的形態(tài)信息量化對(duì)計(jì)算機(jī)輔助診斷效果至關(guān)重要,常采用的特征分類包括幾何特征和紋理特征。FD可分別或同時(shí)量化這兩種特征,而后者在應(yīng)用于肺結(jié)節(jié)鑒別的研究中更為多見。聯(lián)合分析FD量化結(jié)節(jié)的幾何特征和紋理特征[24,35,38]可為結(jié)節(jié)的診斷提供更多信息。此外,根據(jù)不同設(shè)備成像的特點(diǎn),F(xiàn)D還可量化結(jié)節(jié)的內(nèi)部異質(zhì)性[20,36]。Miwa等[36]基于氟代脫氧葡萄糖(fluorodeoxyglucose,F(xiàn)DG)PET/CT鑒別非小細(xì)胞癌患者,F(xiàn)DG PET/CT可同時(shí)獲得肺部解剖和功能圖像,由于腫瘤細(xì)胞可濃聚FDG,惡性腫瘤在顯像上表現(xiàn)為FDG攝取增高的陽性病灶,因此除盒維數(shù)量化幾何特征外,還可通過量化FDG攝取的異質(zhì)性來反映結(jié)節(jié)內(nèi)部異質(zhì)性,聯(lián)合利用其量化兩方面特征的鑒別準(zhǔn)確度較僅量化幾何特征更高(分別為62.9%和94.4%)。
2.1.3肺結(jié)節(jié)性質(zhì)的鑒別與分期 FD的分析簡潔明了,多數(shù)研究比較良性、惡性結(jié)節(jié)的FD值的差異性,結(jié)果顯示惡性結(jié)節(jié)的FD值高于良性結(jié)節(jié)[20,22-24,38-39]。然而,雖然FD對(duì)圖像本身所產(chǎn)生的噪聲不敏感[21],但如果肺部腫瘤患者同時(shí)患有其他肺部疾病,則噪聲會(huì)對(duì)鑒別造成干擾。Matsuoka等[22]對(duì)周圍型孤立性肺小結(jié)節(jié)進(jìn)行鑒別,發(fā)現(xiàn)FD對(duì)含有肺氣腫結(jié)節(jié)鑒別的錯(cuò)誤率較高,在含有肺氣腫的結(jié)節(jié)中鑒別準(zhǔn)確度為63%,且誤診的結(jié)節(jié)中56.7%含有肺氣腫,而在沒有肺氣腫的結(jié)節(jié)中,鑒別準(zhǔn)確度為93%,且惡性結(jié)節(jié)FD值高于良性結(jié)節(jié)。提示在使用FD作為參考指標(biāo)進(jìn)行診斷時(shí),應(yīng)充分重視肺氣腫等其他肺部疾病對(duì)結(jié)果的影響。
一般來說,量化結(jié)節(jié)的幾何特征通常利用BCM得到二值圖像的盒維數(shù),而對(duì)于紋理特征通常采用DBCM得到灰度圖像的盒維數(shù)。研究者通常根據(jù)所利用圖像數(shù)據(jù)維度將FD分別表示為二維FD和三維FD。在肺結(jié)節(jié)良、惡性鑒別的研究中常將二維FD、三維FD聯(lián)合應(yīng)用[24,36,38],而腫瘤分期鑒別一般應(yīng)用三維FD進(jìn)行分析[21,35]。雖然三維FD較二維FD提供的結(jié)節(jié)信息更多,但不同類型結(jié)節(jié)具有不同的幾何和紋理特征,僅對(duì)其中一種特點(diǎn)進(jìn)行分析并不能區(qū)分多種類型的結(jié)節(jié),因此兩者應(yīng)用又各有優(yōu)勢。Kido等[38]基于薄層CT圖像結(jié)合二維FD和三維FD對(duì)不同類型結(jié)節(jié)(良性:錯(cuò)構(gòu)瘤、組織性肺炎、結(jié)核瘤;支氣管癌:腺癌、鱗狀細(xì)胞癌)進(jìn)行細(xì)致分類。在幾何特征方面,由于錯(cuò)構(gòu)瘤的輪廓較其他結(jié)節(jié)光滑,在大小為64×64 pixels ROI中,二維FD可識(shí)別出錯(cuò)構(gòu)瘤,其二維FD值在所有類型結(jié)節(jié)中最小;但二維FD無法區(qū)分除錯(cuò)構(gòu)瘤外的其他結(jié)節(jié),因此以三維FD量化大小為32×32 pixels ROI的紋理特征,結(jié)果顯示組織性肺炎三維FD值在所有類型結(jié)節(jié)中最大(P<0.000 1),腺癌的三維FD值大于鱗狀細(xì)胞癌(P<0.05),但三維FD不能區(qū)分錯(cuò)構(gòu)瘤與惡性腫瘤[38]。
不同階段肺癌的形態(tài)不同,F(xiàn)D也可作為鑒別肺癌分期的指標(biāo)進(jìn)行輔助診斷。如Al-Kadi和Watson等[21]利用FD對(duì)15例腫瘤面積>10 mm2的肺癌患者(晚期9例、早期6例)的肺癌分期進(jìn)行鑒別,結(jié)果顯示晚期(Ⅲ和Ⅳ期)惡性腫瘤的FD值高于早期惡性腫瘤,以1.913為閾值鑒別的準(zhǔn)確度為83.3%。
2.1.4影像組學(xué)指標(biāo)聯(lián)合應(yīng)用 FD雖然在區(qū)分不同類型結(jié)節(jié)以及不同階段惡性腫瘤方面均有良好的表現(xiàn),但僅是量化結(jié)節(jié)的幾何特征和紋理特征,而結(jié)節(jié)的復(fù)雜性遠(yuǎn)不僅表現(xiàn)為這兩種特征。因此,除二維FD、三維FD結(jié)合應(yīng)用外,研究者還考慮其他影像組學(xué)指標(biāo)[26,35-36],如結(jié)合灰度特征參數(shù)(平均密度值[35]、標(biāo)準(zhǔn)差[35]、方差[23])、其他分形參數(shù)(空隙度[21])等。然而,在以FD為主要參考指標(biāo)的研究中,研究者多僅關(guān)注FD,較少探討其與其他影像組學(xué)指標(biāo)的關(guān)系及聯(lián)合應(yīng)用的綜合效果。
2.2慢性阻塞性肺疾病 除應(yīng)用于肺部腫瘤外,分形分析也被用于其他肺部疾病。2018年中國肺健康研究計(jì)劃數(shù)據(jù)顯示,中國成人慢性阻塞性肺疾病總患病率為8.6%[28],而近年來分形分析也應(yīng)用于慢性阻塞性肺疾病。
肺部氣管、支氣管,形狀似“樹”,這種存在自相似性且復(fù)雜的形體很難用歐式幾何描述特征,而采用分形分析可以很好地了解肺部氣管支氣管的結(jié)構(gòu)和肺部疾患的嚴(yán)重程度[42]。一般侵襲性越強(qiáng)肺結(jié)節(jié)FD值越高,而在慢性阻塞性肺疾病的研究中,F(xiàn)D值與疾病嚴(yán)重程度呈負(fù)相關(guān)[25-26,43-45]。Hwang等[25]與Bodduluri等[26]通過分形分析探討慢性阻塞性肺疾病患者的生存情況,以盒維數(shù)量化組織結(jié)構(gòu)的復(fù)雜性,從而判斷慢性阻塞性肺疾病的嚴(yán)重程度,F(xiàn)D值較高提示肺實(shí)質(zhì)在三維空間中具有更大的空間填充特性,表明肺功能相對(duì)較好[25];Bodduluri等[26]通過FD度量氣道的形態(tài)復(fù)雜性,氣道分形維數(shù)(airway fractal dimension,AFD)較小表明氣道形態(tài)狹窄或氣道堵塞,則患者肺功能越差;AFD不僅能通過度量氣道狹窄程度反映肺功能,也是慢性阻塞性肺疾病預(yù)后的獨(dú)立預(yù)測因子,AFD越小患者的生存率較低,由于FD值與肺功能指標(biāo)具有相關(guān)性,臨床可接受性較強(qiáng)。氣道狹窄程度也可以通過肺部呼出氣溶膠的復(fù)雜程度來判斷,根據(jù)每個(gè)氣道結(jié)構(gòu)的特定氣溶膠指紋,Xi等[44]通過計(jì)算所構(gòu)建得到呼出氣溶膠圖像FD,揭示了FD值大小與呼吸道疾病嚴(yán)重程度的關(guān)系,即氣溶膠指紋的FD值越大,呼吸道疾病的嚴(yán)重程度越輕。
肺部結(jié)構(gòu)滿足分形特征,其圖像在不同放大倍數(shù)下也呈現(xiàn)自相似性[17,29,37],Baish和Jain[46]也討論了分形分析應(yīng)用于腫瘤研究的價(jià)值。分形分析在肺部疾患臨床診療中具有一定應(yīng)用潛力,但仍存在以下問題:①FD結(jié)果可能受組織學(xué)類型或炎癥條件的影響[20,27],需要深入探討分形分析在不同類型腫瘤的應(yīng)用;②在肺癌分期的鑒別中,CT切片越薄以及圖像分辨率越高則肺癌分期鑒別的準(zhǔn)確性越高,也使研究形態(tài)較小的早期腫瘤成為可能[21];③與其他指標(biāo)聯(lián)合應(yīng)用進(jìn)行鑒別的研究有待豐富;④二維圖像可能會(huì)丟失腫瘤的整體信息,且腫瘤較小時(shí),三維圖像的結(jié)果更平穩(wěn)[27],但三維圖像的分形分析方法在醫(yī)學(xué)影像圖像領(lǐng)域尚有待普及[17];⑤多數(shù)研究是通過BCM和DBCM獲得FD,雙毯法[39]和功率譜法[29]應(yīng)用較少,開發(fā)更適用于影像圖像的計(jì)算方法值得進(jìn)一步探索。分形分析能夠挖掘具有復(fù)雜結(jié)構(gòu)的肺結(jié)節(jié)圖像信息,現(xiàn)有研究提示可考慮將其參數(shù)納入肺癌篩檢的影像組學(xué)指標(biāo),以降低肺癌篩查的假陽性率,從而減少篩查對(duì)象過度診療等問題。