呂明慧,周 帥,朱 強
(首都醫(yī)科大學(xué)附屬北京同仁醫(yī)院超聲診斷科,北京 100730)
2018年全球女性乳腺癌新發(fā)病例約208.88萬,占女性新發(fā)癌癥的24.2%[1]。中國乳腺癌世界人口標準化發(fā)病率約36.1/10萬,雖低于其他國家,但呈逐年增長趨勢,如能及時診斷并進行干預(yù),患者死亡率可低于其他惡性腫瘤[2-3]。不同于歐美女性多為脂肪型乳腺,中國女性乳腺以纖維結(jié)締組織含量較多的致密型腺體為主,超聲聲像圖中病變與腺體明顯不同。超聲是我國診斷及篩查乳腺癌的主要手段,但較依賴操作者經(jīng)驗,診斷結(jié)果差異較大。除須提高超聲醫(yī)師專業(yè)素質(zhì)及診斷能力外,還應(yīng)從技術(shù)角度尋找解決方案[4]。
計算機輔助診斷(computer-aided diagnosis, CAD)系統(tǒng)采用機器學(xué)習(xí)方法對醫(yī)學(xué)圖像進行識別和概率性判斷,是人工智能技術(shù)的一大分支[5]。通過模擬人腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),深度學(xué)習(xí)(deep learning, DL)將信息從低層傳至高層,提取圖像特征并分類,是當下極具應(yīng)用前景的機器學(xué)習(xí)方法之一[6]。基于DL的CAD系統(tǒng)在提高診斷準確率、減少漏診或誤診及減輕醫(yī)師工作負荷等方面均具有極大潛力和應(yīng)用價值。本文對乳腺CAD系統(tǒng)的背景及基于DL的乳腺超聲CAD系統(tǒng)研究進展進行綜述。
LEDLEY[7]于1966年首次提出CAD系統(tǒng)。隨著計算機技術(shù)及算法等方面的進步,直至20世紀八九十年代,相關(guān)研究才得以在醫(yī)學(xué)影像學(xué)領(lǐng)域縱深開展,并逐步成為影像科醫(yī)師的輔助工具,例如輔助分析肺CT、乳腺及前列腺MRI和甲狀腺超聲等[8-12]。1998年R2 Technology公司開發(fā)了乳腺CAD系統(tǒng),并通過了美國食品藥品管理局認證,基于鉬靶X線圖像進行診斷。隨后國外諸多相似乳腺CAD產(chǎn)品應(yīng)運而生,側(cè)重于檢測微鈣化及識別病變等。近年來,亞洲國家及擁有部分拉丁裔、亞裔人群的西方國家越來越重視乳腺超聲的應(yīng)用,乳腺超聲CAD系統(tǒng)的研發(fā)逐漸興起[13],其過程中所運用的核心算法也逐步從傳統(tǒng)機器學(xué)習(xí)算法過渡到更為智能的DL算法[4]。
傳統(tǒng)CAD系統(tǒng)處理步驟主要包括圖像預(yù)處理、選擇和定位ROI及提取ROI特征并分類,高度依賴人工選擇及分類器整合特征[14]。DL具備自動提取特征能力,能處理大量圖像,其應(yīng)用提高了CAD系統(tǒng)的魯棒性及泛化能力[15],代表算法為卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)。
2.1 DL DL的概念源自人工神經(jīng)網(wǎng)絡(luò)。人工智能研究的一大難點是計算機面對大量數(shù)據(jù)信息時如何能夠快速提取特征信息并加以處理。DL的本質(zhì)在于使機器在大量帶標簽樣本中學(xué)習(xí)最佳特征,尋找數(shù)據(jù)內(nèi)在規(guī)律,減少人工定義特征帶來的不準確性。
2.2 CNN基本結(jié)構(gòu)及技術(shù) CNN是包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),由輸入層、隱藏層及輸出層組成,可實現(xiàn)“端-端”模型訓(xùn)練,廣泛用于計算機視覺領(lǐng)域[16-17]。輸入層導(dǎo)入圖像;隱藏層包括卷積層、池化層(下采樣層)及全連接層,其中卷積層利用卷積核提取圖像特征,池化層對提取出的特征進行降維,以減少參數(shù)且在一定程度上保持特征尺度的不變,可提高模型的泛化能力及魯棒性;卷積層與池化層交替排列,層數(shù)不固定;全連接層可對輸出特征進行分類;輸出層輸出最終分類結(jié)果[18]。
學(xué)習(xí)模型在訓(xùn)練過程中易出現(xiàn)參數(shù)過擬合現(xiàn)象,可影響模型在測試數(shù)據(jù)集中的泛化性能,而數(shù)據(jù)增強、Dropout模塊(訓(xùn)練中按一定概率將神經(jīng)網(wǎng)絡(luò)單元暫時丟棄)及隨機下采樣可避免該現(xiàn)象[19-20]。訓(xùn)練CNN需要大量數(shù)據(jù)。即使加入增強數(shù)據(jù),醫(yī)學(xué)圖像的樣本量仍有所不足。遷移學(xué)習(xí)可將預(yù)訓(xùn)練模型用于另外任務(wù),從而減輕訓(xùn)練數(shù)據(jù)量對模型性能的影響[17,21]。基于DL搭建CAD模型時,采用遷移學(xué)習(xí)方法微調(diào)模型,可利用較小樣本量獲得性能較好的模型,有助于縮短訓(xùn)練時間。
2.3 研究及應(yīng)用現(xiàn)狀 通過設(shè)計不同CNN架構(gòu)或使用不同DL算法可提高模型的診斷效能。BYRA等[22]觀察882幅超聲聲像圖,利用經(jīng)過ImageNet預(yù)訓(xùn)練的VGG19 CNN模型將乳腺病變分為良性和惡性,提高了系統(tǒng)的診斷效能。YAP等[23]提出一種基于CNN模型自動檢測乳腺病變的超聲CAD系統(tǒng),并比較3種不同模型(基于補丁的LeNet、U-Net和基于遷移學(xué)習(xí)的FCN-AlexNet)的診斷效能,結(jié)果顯示基于遷移學(xué)習(xí)的FCN-AlexNet性能最佳。CAO等[24]利用乳腺數(shù)據(jù)集評估不同DL框架,發(fā)現(xiàn)SSD 300和DenseNet分別在檢測病變區(qū)域和分類任務(wù)中展現(xiàn)出最佳性能,表明高性能的CNN框架可提高檢測和分類乳腺病灶的效能。HUANG等[25]提出一種兩階段CNN模型,即ROI-CNN(用于識別ROI)和G-CNN(用于分類),對乳腺超聲聲像圖進行乳腺影像報告和數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system, BI-RADS)分類,針對BI-RADS 3類及4A、4B、4C及BI-RADS 5類乳腺病灶,其準確率分別為99.8%、94.0%、73.4%、92.2%及87.6%。SEUNG等[26]提出一種弱監(jiān)督和半監(jiān)督學(xué)習(xí)的系統(tǒng)算法,以少量強注釋數(shù)據(jù)及更多弱注釋數(shù)據(jù)進行模型訓(xùn)練,可有效避免過擬合。TANAKA等[27]結(jié)合2個CNN模型(VGG19和ResNet152)構(gòu)建出1個集成網(wǎng)絡(luò),微調(diào)后綜合評估針對病變的全部圖像,并對其進行分類,顯示出優(yōu)異的分類性能,敏感度為90.9%[95%CI(84.5,97.3)],特異度為87.0%[95%CI(79.5,94.5)],曲線下面積(area under curve, AUC)為0.95[95%CI(0.916,0.987)]。
乳腺超聲CAD系統(tǒng)具有一定臨床應(yīng)用價值。乳腺超聲CAD系統(tǒng)多側(cè)重于建立魯棒性及泛化能力較強的模型,以彌補聲像圖質(zhì)量良莠不齊且頗具主觀性的缺陷,具有極大潛力和發(fā)展前景。利用乳腺超聲聲像圖區(qū)分良惡性腫物,CNN模型的診斷效能與超聲醫(yī)師相同或更高(敏感度95.8%和58.3%~91.7%,特異度92.5%和60.4%~77.1%,準確率92.5%和65.8%~79.2%)[28]。CHOI等[29]指出,基于DL的乳腺超聲CAD系統(tǒng)可提高超聲醫(yī)師診斷乳腺癌的特異度、準確率及陽性預(yù)測值,且不降低其敏感度和陰性預(yù)測值。LEE等[30]發(fā)現(xiàn)CAD系統(tǒng)可顯著提高經(jīng)驗不足的超聲醫(yī)師的診斷水平。冀鴻濤等[31]構(gòu)建基于CNN的CAD模型,鑒別診斷乳腺良惡性結(jié)節(jié)的敏感度為84.1%,特異度為95.0%,準確率為91.2%。ZHOU等[32]發(fā)現(xiàn)通過DL模型可有效預(yù)測原發(fā)性乳腺癌腋窩淋巴結(jié)轉(zhuǎn)移風(fēng)險,其中性能最優(yōu)的CNN模型的AUC達0.89。HAN等[33]采用Google LeNet模型分析4 254個乳腺良性病變和3 154個惡性病變的聲像圖并進行分類,敏感度為86.0%,特異度為93.0%,準確率為91.0%,AUC>0.90。
2.4 面臨的挑戰(zhàn) DL雖在處理大數(shù)據(jù)等方面具有顯著優(yōu)勢,提高了CAD系統(tǒng)的性能,但仍面臨多重挑戰(zhàn);其運行的關(guān)鍵步驟是收集數(shù)據(jù),并評估其準確度、完整性及可信度等,數(shù)據(jù)量較大時易發(fā)生遺漏與錯誤。目前尚無影像學(xué)診斷相關(guān)數(shù)據(jù)庫及其統(tǒng)一使用標準或指南,且罕見疾病數(shù)據(jù)收集不足可能會產(chǎn)生類別不平衡等問題。常用于評估CAD系統(tǒng)性能的方法包括特異度、敏感度、準確率、受試者工作特性曲線、AUC、陽性預(yù)測值及陰性預(yù)測值等,為加以充分評估,往往需結(jié)合多種方法,但尚無統(tǒng)一標準。目前乳腺鉬靶X線CAD系統(tǒng)已商品化且被納入常規(guī)診療流程,其他大多僅用于教學(xué)與培訓(xùn);若以CAD系統(tǒng)進行診斷決策,影像科醫(yī)師如何正確解讀診斷結(jié)果仍是需要解決的問題。為此需臨床醫(yī)師與計算機專家緊密合作,于臨床應(yīng)用和技術(shù)領(lǐng)域等發(fā)現(xiàn)問題,并不斷改進。此外,乳腺超聲CAD系統(tǒng)面臨患者隱私泄漏及責(zé)任劃分等倫理問題,需通過加強隱私和數(shù)據(jù)保護、建立完善的法律法規(guī)和監(jiān)督體系等措施加以解決[34]。
基于DL的乳腺超聲CAD系統(tǒng)超越了傳統(tǒng)的技術(shù)系統(tǒng),可提高模型性能,在輔助診斷與鑒別診斷乳腺癌領(lǐng)域已取得業(yè)界的初步肯定,對縮小不同年資醫(yī)師之間、不同地區(qū)及級別醫(yī)院之間專業(yè)水平差異有一定價值。
目前乳腺超聲CAD系統(tǒng)僅通過分析超聲聲像圖得出診斷,尚不能整合病史、體格檢查、實驗室指標及隨訪信息等;將這些臨床信息匯總并導(dǎo)入CAD系統(tǒng),進而得出更全面、準確的診斷是未來的目標。建立中國女性乳腺多中心超聲聲像圖數(shù)據(jù)庫,為訓(xùn)練CAD模型提供病史詳細、病種豐富、圖像或視頻質(zhì)量規(guī)范的數(shù)據(jù)集,將可使CAD模型具有更好的魯棒性和泛化能力,為篩查及診斷乳腺癌提供更加可信的輔助工具。