孫兆男,崔應(yīng)譜,林志勇,劉想,劉偉鵬,王祥鵬,張靖遠,張曉東,王霄英
臨床可用多種影像技術(shù)評估腎臟功能。MRI功能成像是主要研究方向,擴期加權(quán)成像(diffusion weighted imaging,DWI)[1]、動態(tài)增強掃描(dynamic contrast enhanced imaging,DCE)[2]、動脈自旋標(biāo)記成像(arterial spin labeling imaging,ASL)[3]和血氧水平依賴成像 (blood oxygenation level dependent,BOLD)[4]等都從不同角度反映腎臟功能。雖有很多高級功能成像技術(shù)可用于腎臟評估,但從臨床實用角度目前仍公認腎臟體積是反映腎臟慢性功能改變最重要影像學(xué)指標(biāo)。腎竇脂肪含量是預(yù)測心血管疾病患者發(fā)生不良事件危險因素之一[5],腎竇脂肪增多時可壓迫腎實質(zhì)、腎血管、淋巴管及釋放脂肪相關(guān)因子導(dǎo)致腎功能損害[6]。因此,準(zhǔn)確且可重復(fù)腎臟定量測量數(shù)據(jù)對于腎臟疾病及心血管系統(tǒng)疾病診斷、判斷病程發(fā)展變化有意義,定量測量腎實質(zhì)及腎竇體積是醫(yī)學(xué)影像報告應(yīng)完成的任務(wù)。
研究[7]通過離體豬腎臟實驗證實以醫(yī)生手工標(biāo)注CT圖像測量腎臟體積有很高準(zhǔn)確性,研究者手工勾畫腎臟輪廓得到腎臟體積與真實體積基本一致。但人工逐層勾畫腎臟輪廓在臨床實際工作中難以廣泛推廣使用,醫(yī)生通常在超聲、CT或MRI圖像上粗略測量腎臟大小及實質(zhì)厚度,測量結(jié)果一致性及重復(fù)性較差,對腎臟體積微小改變不敏感。而對腎竇體積及脂肪含量測定更是缺乏便捷通用方法。近年基于深度學(xué)習(xí)分割方法已被廣泛應(yīng)用于醫(yī)學(xué)圖像分割和目標(biāo)對象體積測量。Ronneberger等[8,9]提出U-Net網(wǎng)絡(luò)在醫(yī)學(xué)圖像分割上取得了顯著成績,對肝臟、前列腺及腎臟分割可達到專家標(biāo)注水平。
本研究目的是研發(fā)腹部CT圖像上正常腎臟腎實質(zhì)和腎竇自動分割模型,定量測量正常成人腎實質(zhì)、腎竇體積及三維徑線得到腎實質(zhì)、腎竇體積及三維徑線95%參考值范圍,進一步對正常成人年齡、性別、身高、體重與腎實質(zhì)和腎竇體積進行相關(guān)分析及多元線性回歸分析,為評價腎臟體積提供客觀數(shù)據(jù)支持。
本研究獲得了本院倫理審查委員會批準(zhǔn),按照本單位人工智能(artificial intelligence,AI)模型訓(xùn)練規(guī)范執(zhí)行研究方案。
根據(jù)本單位AI訓(xùn)練管理方法,首先定義研發(fā)腎臟分割A(yù)I模型用戶樣例(Use Case)。包括腎臟分割A(yù)I模型ID、臨床問題、場景描述、模型在實際工作中調(diào)用流程、模型輸入輸出數(shù)據(jù)結(jié)構(gòu)等。AI模型返回結(jié)果定義為雙側(cè)“腎實質(zhì)徑線和體積”和“腎竇徑線和體積”。
搜集2018年1月1日-2019年6月30日間由于非泌尿系統(tǒng)疾病而住院患者腹部增強CT圖像及電子病例,對于能夠獲得足夠住院臨床資料患者由兩位高年資影像醫(yī)生審查電病例及閱片,挑選合格病例。納入標(biāo)準(zhǔn):①既往無任何腎臟、心臟、免疫系統(tǒng)、內(nèi)分泌系統(tǒng)相關(guān)病史,無腎毒性藥物使用史等;②住院期間各項檢查結(jié)果均顯示腎功能正常;③年齡18歲以上;④CT掃描范圍包括全部左/右腎,重建了1mm薄層腎臟皮髓質(zhì)期圖像;⑤圖像清晰無偽影;⑥圖像中雙腎及腎竇大小、形態(tài)、位置、密度未見異常。排除標(biāo)準(zhǔn):①任何影像圖像見腎臟局灶性病變或者彌漫性病變者如腎臟變異(孤立腎、異位腎、重復(fù)腎、馬蹄腎)、腎臟術(shù)后及CT圖像見的梗阻性腎積水、腎結(jié)石、腎實質(zhì)鈣化、腎占位性病變等;②掃描范圍不足或期相不正確,或不能獲得薄層圖像;③圖像有偽影;④年齡<18歲;⑤根據(jù)臨床資料可提示有任何累及腎臟全身性疾病。
最終挑選365例“雙腎正?!辈±{入研究。搜集數(shù)據(jù)包括CT圖像、患者年齡、性別、身高、體重等。其中93例用于建模(訓(xùn)練集48例,測試集45例),用模型預(yù)測另外272例新數(shù)據(jù)用于模型效能評價,訓(xùn)練集中人工標(biāo)注93例和模型分割效果好的272例數(shù)據(jù)用于腎實質(zhì)及腎竇定量分析(圖1)。
數(shù)據(jù)標(biāo)注:首先將從PACS導(dǎo)出DICOM格式批量轉(zhuǎn)換為NIFTI(neuroimaging informatics technology initiative)格式。由1名影像科醫(yī)生指導(dǎo)3位有基礎(chǔ)醫(yī)學(xué)知識人員使用ITK-SNAP軟件標(biāo)注雙腎實質(zhì)及腎竇共93例,由1名影像醫(yī)生復(fù)核修改標(biāo)注,其中48例作為訓(xùn)練集,45例作為測試集。標(biāo)注規(guī)則(圖2):①調(diào)整窗寬300HU,窗位30HU; ②腎實質(zhì)標(biāo)注標(biāo)準(zhǔn)包括腎皮質(zhì)、腎髓質(zhì)、腎乳頭及腎柱。③腎竇標(biāo)注標(biāo)準(zhǔn):軸面圖像腎實質(zhì)內(nèi)緣連線為腎竇內(nèi)側(cè)邊界包括腎小盞、腎大盞、部分腎盂、血管、淋巴、神經(jīng)、脂肪。
圖1 研究對象納入流程
圖2 圖像標(biāo)注方法。 a~d)分別為雙腎軸面、雙腎冠狀面、右腎矢狀面、左腎矢狀面標(biāo)注情況;e)3D圖像。紅色label 1,左腎實質(zhì);綠色label 2,右腎實質(zhì);藍色label 3,左腎竇;黃色label 4,右腎竇。 圖3 腎實質(zhì)、腎竇分割模型示意圖 。皮髓質(zhì)期薄層CT單層圖像和人工標(biāo)注腎實質(zhì)及腎竇標(biāo)簽,輸出是模型分割腎實質(zhì)、腎竇結(jié)果。 圖4 最小體積包圍盒算法。得到長方體長、寬、高分別作為腎實質(zhì)長、寬、高。 圖5 a)模型預(yù)測結(jié)果;b)去除小連通域之后結(jié)果。 圖6 模型預(yù)測結(jié)果3D。a)模型預(yù)測效果欠佳舉例,腎竇位置預(yù)測錯誤;b)模型預(yù)測結(jié)果包含小連通域(左側(cè)腸管)。
模型訓(xùn)練:硬件設(shè)備為NVIDIA Tesla P100 16G,內(nèi)存256G,軟件環(huán)境包括Python3.6,Pytorch 0.4.1,Opencv,Numpy,SimpleITK。
采用Ronneberger等[8]提出U-Net算法。模型輸入是皮髓質(zhì)期薄層CT圖像和腎實質(zhì)及腎竇標(biāo)簽,輸出是模型分割腎實質(zhì)、腎竇結(jié)果(圖3)。在輸入模型前首先對圖像進行預(yù)處理,將皮髓質(zhì)期CT圖像從512×512壓縮為256×256,窗寬調(diào)整為300,窗位調(diào)整為30。開始訓(xùn)練時每次讀取到顯存中圖像數(shù)量(batch size)為10,學(xué)習(xí)率為0.0001,訓(xùn)練循環(huán)次數(shù)(EPOCH)為15次。
模型評價:客觀評價方法:測試集Dice值用于評估腎實質(zhì)、腎竇分割模型效果。
主觀評價方法:為評價該模型分割誤差是否達到臨床滿意,用訓(xùn)練好模型預(yù)測新272例數(shù)據(jù),由兩位影像醫(yī)生評價模型輸出分割結(jié)果逐一閱圖并統(tǒng)計腎實質(zhì)是否包全,是否包含其他結(jié)構(gòu)(肝、脾、腸管、膈肌),若包含是否與腎臟主體相連。
圖7 各測量值正態(tài)性檢驗結(jié)果(Q-Q圖)。a~p)分別為左腎實質(zhì)體積、左腎實質(zhì)左右徑、左腎實質(zhì)前后徑、左腎實質(zhì)上下徑、左腎竇體積、左腎竇左右徑、左腎竇前后徑、左腎竇上下徑、右腎實質(zhì)體積、右腎實質(zhì)左右徑、右腎實質(zhì)前后徑、右腎實質(zhì)上下徑、右腎竇體積、右腎竇左右徑、右腎竇前后徑、右腎竇上下徑正態(tài)性檢驗結(jié)果(Q-Q圖),所有點近似在一條直線附近,樣本數(shù)據(jù)近似于正態(tài)分布。
測量方法:基于272例圖像醫(yī)生評價結(jié)果,采用去除小連通域圖像處理方法,從而使脾、主動脈、左股骨、左坐骨、左恥骨、腸管、心包、左側(cè)腰大肌等小連通域去除,僅保留腎實質(zhì)和腎竇區(qū)域,從而進一步提高分割準(zhǔn)確性。運用最小體積包圍盒算法[10](圖4)測量雙側(cè)腎實質(zhì)和腎竇的三維徑線。采用去除小連通域方法處理圖像(圖5),根據(jù)保留像素數(shù)計算雙側(cè)腎實質(zhì)和腎竇體積。
統(tǒng)計方法:采用SPSS 24.0和MedCalc 15.8統(tǒng)計軟件。經(jīng)Q-Q圖[11]對所有測量值進行正態(tài)性檢驗求出95%參考值范圍。采用Pearson相關(guān)分析探討腎實質(zhì)體積、腎竇體積與年齡、身高、體重相關(guān)性,用Spearman相關(guān)分析探討腎實質(zhì)體積、腎竇體積與性別、側(cè)別相關(guān)性,進而采用多元線性回歸分析探討腎實質(zhì)體積和腎竇體積影響因素,P<0.05為差異有統(tǒng)計學(xué)意義。
客觀評價:測試集中分割右腎實質(zhì)DICE值為±0.01,分割左腎實質(zhì)DICE值為0.97±0.01,分割右腎竇DICE值為0.84±0.06,分割左腎竇DICE值為0.88±0.04。
主觀評價:模型預(yù)測272例分割結(jié)果,170例(62.5%)兩位專家均認為分割效果可直接用于精確計算體積達到人工標(biāo)注效果。1例腎竇位置預(yù)測錯誤(圖6a)。余101例(37.1%)腎實質(zhì)及腎竇分割結(jié)果好,但存在腎臟之外其他區(qū)域小連通域(圖6b)如脾、主動脈、左股骨、左坐骨、左恥骨、腸管、心包、左側(cè)腰大肌,認為采用去除圖像中小連通域方法可用于精確計算體積。
臨床資料:365例用于體積及徑線測量病例年齡范圍18~93歲。男178例,占48.8%,年齡55.79±13.74,身高(172.11±5.81)cm,體重(71.36±11.92)kg;女187例,占51.2%。年齡(52.87±14.41)歲,身高(160.53±4.74)cm,體重(58.90±10.06)kg。
圖8 腎實質(zhì)、腎竇體積及徑線測量結(jié)果接入臨床工作流程
腎實質(zhì)和腎竇體積及三維徑線測量結(jié)果(表1)。
經(jīng)檢驗所有測量值均近似服從正態(tài)分布(圖7),采用正態(tài)分布法統(tǒng)計95%參考值范圍。
表1 雙側(cè)腎實質(zhì)和腎竇各測量值95%參考值范圍
腎實質(zhì)體積和腎竇體積相關(guān)因素分析:相關(guān)性分析結(jié)果顯示身高、體重與腎實質(zhì)體積呈正相關(guān)(r=0.463、0.441,P=0.000、0.000),與年齡、性別、側(cè)別呈負相關(guān)(r=-0.283、-0.369、-0.110,P=0.000、0.000、0.003)。腎竇體積與年齡、身高、體重呈正相關(guān)(r=0.283、0.342、0.485,P=0.000、0.000、0.000),與性別、側(cè)別呈負相關(guān)(r=-0.397、-0.251,P=0.000、0.000)。
各潛在因素與腎實質(zhì)體積、腎竇體積多元線性回歸分析:將相關(guān)性分析中存在線性相關(guān)因素引入多元線性回歸方程,其回歸方程為腎實質(zhì)體積=0.654×身高-0.597×年齡+0.653×體重-6.321×側(cè)別-8.824×性別,回歸方程的R2為0.304(表2);腎竇體積=0.213×體重+0.168×年齡-4.162×側(cè)別-2.052×性別+0.122×身高,回歸方程的R2為0.389(表3)。
表2 潛在因素與腎實質(zhì)體積的多元線性回歸分析
表3 潛在因素與腎竇體積的多元線性回歸分析
完成腎臟體積及徑線自動測量后,通過結(jié)構(gòu)化報告系統(tǒng)將測量結(jié)果自動返回到報告中,包括雙側(cè)腎實質(zhì)、腎竇的三維徑線、體積,以及關(guān)鍵圖像,由醫(yī)生審核后自動呈現(xiàn)在報告界面中,實現(xiàn)CT圖像上腎臟定量測量的自動化(圖8)。
腎實質(zhì)體積測量對腎臟疾病診斷及腎功能評估有重要作用,既往多用來評價慢性腎臟疾病如腎動脈中重度狹窄時,腎實質(zhì)體積減小及腎小球濾過率減低[12];CKD患者分期不同腎實質(zhì)體積不同程度減小[13]。此時,在報告中定性地描述“腎臟萎縮、腎臟體積縮小”也是可接受的。但隨著認識水平提高越來越多醫(yī)療工作要求定量報告腎實質(zhì)體積如腎臟體積是判斷腎移植患者排斥反應(yīng)敏感而穩(wěn)定指標(biāo),發(fā)生排斥反應(yīng)時腎實質(zhì)體積增大,控制排斥反應(yīng)后腎實質(zhì)體積恢復(fù)[14],此時,準(zhǔn)確、定量報告腎臟體積是必要的。
近年來很多研究認為腎竇內(nèi)脂肪沉積量與肥胖及心血管系統(tǒng)疾病相關(guān),各種原因?qū)е履I積水會不同程度損傷腎臟功能,因此腎實質(zhì)和腎竇體積都是CT影像報告中需要提及指標(biāo),并且需要腎實質(zhì)及腎竇體積、三維經(jīng)線正常值范圍提供基線參考。目前臨床測量腎臟通用方法是B超或者CT、MR圖像上測量三維徑線,然后運用橢圓公式計算得到腎臟體積[14]。本研究中應(yīng)用模型采用自動分割及自動測量方法得到腎實質(zhì)及腎竇體積,經(jīng)兩位影像醫(yī)生評估后認為分割效果好,可代替醫(yī)生手工測量,這與既往研究結(jié)果是類似的。近來年,以U-Net為代表深度學(xué)習(xí)輔助診斷模型廣泛應(yīng)用于多種臟器分割如前列腺[15]等。在CT和MR圖像分割腎臟研究多有報告[16,17],結(jié)果均較準(zhǔn)確,證明這種方法是可行的。不同的是既往研究多關(guān)注是腎臟整體區(qū)域,而本研究將腎實質(zhì)和腎竇分別進行定量測量,由于腎實質(zhì)體積、腎竇體積分別具有不同疾病診斷意義,分別地準(zhǔn)確定量測量是有價值的。醫(yī)生測量徑線過程中需要調(diào)整測量層面及選擇合適測量位置,不同測量者測量三維徑線有一定差異性。因此,自動分割模型益處是顯而易見的,其準(zhǔn)確度高、一致性好,結(jié)果可自動返回到報告中,醫(yī)生不需要花費時間手工測量,僅需審核報告中模型返回結(jié)果即可。
從臨床實際操作角度自動分割軟件應(yīng)植入到工作流程中才能真正實現(xiàn)其價值。在本項目立項之初定義用例時設(shè)計將模型輸出結(jié)果自動地填寫到結(jié)構(gòu)化報告中完成定量測量全自動流程。結(jié)構(gòu)化報告可提高影像工作一致性和標(biāo)準(zhǔn)化,通過結(jié)構(gòu)化報告可向臨床醫(yī)生更準(zhǔn)確地傳遞診斷信息[18]。結(jié)構(gòu)化報告工具和AI工具是相互促進的。結(jié)構(gòu)化報告既可提供優(yōu)質(zhì)的、語義清晰結(jié)構(gòu)化數(shù)據(jù)用于訓(xùn)練AI模型,又提供了AI結(jié)果自動呈現(xiàn)在臨床工作中落地平臺;同時好AI工具可幫助填寫結(jié)構(gòu)化報告中內(nèi)容提高醫(yī)生工作效率和準(zhǔn)確性。以本研究為例,既往日常工作中CT影像報告腎臟均為定性描述(如腎臟大小正常、萎縮、腫大等),而接入AI模型后不僅可自動報告腎臟的三維徑線和體積,而且可對測量值與正常參考值進行比較做出定性診斷??梢灶A(yù)期隨著越來越多AI應(yīng)用與結(jié)構(gòu)化報告整合,醫(yī)學(xué)影像報告將很快從結(jié)構(gòu)化向智能化方向轉(zhuǎn)變。
本文局限性:第一,僅報告了無病變腎臟分割結(jié)果,腎臟有病變時(局灶性病變及彌漫性病變)已另外研發(fā)了專門適用分割模型,由于篇幅所限未予報告。第二,完成腎臟實質(zhì)分割后應(yīng)進一步行皮質(zhì)和髓質(zhì)分割,尚未納入研究中。第三,由于腎臟病變常常與腎血管、集合系統(tǒng)、腎周結(jié)構(gòu)是相關(guān)的,在后續(xù)工作中應(yīng)對腎臟及腎臟周圍結(jié)構(gòu)統(tǒng)一做出分割,在此基礎(chǔ)上不僅能做到定量測量,更可以嘗試研發(fā)疾病診斷AI工具。第四,正常成人腎臟體積參數(shù)范圍較寬,初步統(tǒng)計上限大約是下限的2倍,既往研究[19-21]由于樣本量、測量方法不同正常成人腎臟體積參數(shù)報道沒有統(tǒng)一標(biāo)準(zhǔn),其影響因素報道很不統(tǒng)一。本研究同樣缺乏大樣本、多中心正常人群作為研究對象,多元線性回歸分析中擬合方程R2結(jié)果偏低,分別為0.304和0.389,雖然回歸模型有統(tǒng)計學(xué)意義(P<0.05),但以此來說明正常人群腎臟體積參數(shù)范圍及影響因素存在一定局限性,且研究對象不是來自正常志愿者人群,而是來自就診患者,入選對象雖然嚴(yán)格按照“雙腎正常”納入標(biāo)準(zhǔn)挑選,但無法保證排除有影響正常測量值的隱匿性因素。但不可否認的是本研究研發(fā)了腎臟分割模型,從分割結(jié)果來看模型可有效分割CT圖像上腎實質(zhì)和腎竇并測量及徑線及體積,為日后大樣本、多中心正常人群腎臟體積參數(shù)測量及影響因素研究提供了一種高效、準(zhǔn)確的測量工具。
總之,U-Net可有效分割CT圖像上腎實質(zhì)和腎竇,并測量及徑線及體積,自動完成影像報告中雙腎大小定量評估。
志謝:感謝北京賽邁特銳醫(yī)學(xué)科技有限公司張穎靜、常穎、張燕在數(shù)據(jù)標(biāo)注工作貢獻,張雖雖在結(jié)構(gòu)化報告接入工作的貢獻。