,*, , ,
(1.暨南大學(xué)附屬第一醫(yī)院醫(yī)學(xué)影像中心,廣東 廣州 510630;2.廣東財經(jīng)大學(xué)信息學(xué)院,廣東 廣州 510630)
早期檢測和診斷乳腺癌對治療方案的選擇至關(guān)重要[1-3]。目前超聲已廣泛應(yīng)用于乳腺癌的臨床診斷和治療[4]。但聲像圖分辨率低,器官之間邊界模糊、噪聲較多,使判讀圖像難度較大;此外,乳腺圖像判讀的主觀性強,易致漏診或誤診[5-6]。研究利用人工智能和數(shù)字圖像處理等技術(shù),輔助臨床提高超聲診斷乳腺腫瘤的準確率、降低漏診率及誤診率具有重要意義[7-8]。常規(guī)醫(yī)學(xué)影像計算機輔助診斷(computer-assisted diagnosis, CAD)分為3步:①圖像預(yù)處理與邊緣檢測;②圖像特征提?。虎蹐D像分類,將量化的圖像特征數(shù)據(jù)作為輸入,通過構(gòu)造分類器識別圖像中的復(fù)雜模式,從而最終區(qū)分各種病變。目前常用的圖像分類方法為決策樹(decision tree, DT)、貝葉斯分類器(bayes classifier, BC)、神經(jīng)網(wǎng)絡(luò)(neural network, NN)及支持向量機(support vector machine, SVM)等。分類器是基于特定的樣本數(shù)據(jù)集訓(xùn)練而獲得,通??蛇_到預(yù)期效果;但對新的圖像樣本,分類器需重新訓(xùn)練,適應(yīng)性有限,且工作重復(fù)[9-10]。
新人工智能方法遷移學(xué)習(xí)運用自身已學(xué)習(xí)并存有的知識對相關(guān)領(lǐng)域內(nèi)的不同問題進行求解[11-12]。遷移學(xué)習(xí)能挖掘2個相互關(guān)聯(lián)但又彼此不同的圖像間的某些特征和變化,使標注數(shù)據(jù)和其他監(jiān)督信息可在相互關(guān)聯(lián)的圖像之間實現(xiàn)遷移和重復(fù)使用[13-14]。本研究采用遷移學(xué)習(xí)對乳腺腫瘤聲像圖進行分類,以期提高人工智能方法對超聲圖像的分類效率。
1.1 一般資料 選取2014年1月—2017年8月于我院接受手術(shù)治療并經(jīng)病理證實為乳腺腫瘤的447例(447個病灶)患者,均為女性,年齡15~90歲,平均(40.5±14.0)歲。根據(jù)病理結(jié)果將其分為2組,良性組315例,年齡15~85歲,平均(35.6±11.8)歲,病灶最大徑0.32~5.20 cm,平均(2.21±0.90)cm;惡性組132例,年齡29~90歲,平均(51.9±12.3)歲,病灶最大徑0.40~10.30 cm,平均(2.60±1.47)cm。本研究經(jīng)我院倫理委員會批準,所有患者均簽署知情同意書。
1.2 儀器與方法 采用Philips iU22、iU-Elite超聲診斷儀,高頻線陣探頭,頻率10~16 MHz。囑患者取仰臥位或側(cè)臥位,常規(guī)掃查雙側(cè)乳腺及腋窩,記錄病灶大小、形態(tài)、邊緣、內(nèi)部回聲、后方回聲、鈣化及縱橫比等特征。根據(jù)2013年美國放射學(xué)會的乳腺影像報告和數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system, BI-RADS)第2版標準進行分類,BI-RADS 2~3類為良性,4~6類為惡性。由2名超聲科主治醫(yī)師采用盲法完成,意見不同時經(jīng)討論達成一致。
1.3 圖像預(yù)處理 為減少原始聲像圖中病灶周圍組織對提取病灶邊緣的干擾,以手工方式選取ROI(圖1、2)。
1.4 邊緣檢測 對Roberts、Sobel、Prewitt、Log和Canny算子進行對比,選擇合適的邊緣檢測算子。圖3和圖4分別為1例良性和1例惡性乳腺腫瘤聲像圖邊緣提取結(jié)果對比,其中采用Roberts、Sobel和Prewitt算子對圖像的邊緣檢測效果不理想,Sobel與Prewitt算子的檢測效果相近,Log算子檢測效果一般,Canny算子的檢測效果較好,本研究最終選取Canny算子。
1.5 特征提取 采用主成分分析(principal component analysis, PCA)方法提取乳腺聲像圖中腫瘤紋理、邊緣鋒銳程度、腫瘤幾何形狀、腫瘤圖像亮度特征、回聲特性等特征[2]的所有變量,刪去重復(fù)和相互關(guān)聯(lián)的變量,建立兩兩不相關(guān)的新變量,使新變量盡可能少,保留反映乳腺腫瘤原有特征的信息。通過PCA方法分析,選擇的計算機定量分析特征指標包括腫瘤面積、堅固度、邊緣粗糙度、鄰域灰度差矩陣(neighborhood gray-tone difference matrix, NGTDM)粗糙度、腫塊后方與周圍區(qū)域回聲差異、水平方向高頻分量和垂直方向低頻分量的直方圖(horizontal high frequency and vertical low frequency components-histogram, HL-H)能量及縱橫比,分別對應(yīng)病灶大小、形態(tài)、邊緣、內(nèi)部回聲、后方回聲、鈣化及縱橫比等超聲指標。
1.6 主動遷移學(xué)習(xí)算法[15]采用Matlab 7.0軟件,Windows XP操作系統(tǒng)。隨機選取147例(惡性46例,良性101例)為訓(xùn)練集和300例(惡性101例,良性199例)為測試集。算法步驟:①設(shè)M為初始訓(xùn)練樣本數(shù),Q為從K個域中取的樣例集合,W為未標記樣本集,T為算法迭代次數(shù),N為每次迭代搜索到的樣例數(shù);②對每個域中的M個數(shù)據(jù)樣例進行隨機標記,進而形成初始訓(xùn)練集R;③在初始訓(xùn)練集R基礎(chǔ)上訓(xùn)練K個域的分類器;④從W中找出N個最少圖像特征損失的樣本進行標記,并記為X;⑤按照R←R∪(W*,X*)更新訓(xùn)練集R,從Q中移除W;⑥輸出K個域的分類器。
表1 惡性組與良性組超聲圖像特征定量分析比較(±s)
表1 惡性組與良性組超聲圖像特征定量分析比較(±s)
組別腫瘤面積(cm2)堅固度邊緣粗糙度惡性組(n=132)0.20±0.081 678 869.00±4 129 946.00114.79±74.95良性組(n=315)0.19±0.06578 283.50±619 759.6673.91±32.77t值1.1874.7128.243P值0.682<0.001<0.001組別NGTDM粗糙度腫塊后方與周圍區(qū)域回聲差異HL-H能量縱橫比惡性組(n=132)0.57±0.262.94±9.870.002±0.0010.004±0.002良性組(n=315)0.47±0.171.36±3.220.003±0.0010.006±0.002t值5.2022.5914.8406.593P值0.0010.0010.0410.874
圖1 乳腺腫瘤原始聲像圖 圖2 手工選取ROI
圖3 不同算子對良性乳腺腫瘤超聲圖像邊緣檢測效果對比 A.原始聲像圖; B.Roberts算子; C.Sobel算子; D.Prewitt算子; E.Log算子; F.Canny算子
1.7 統(tǒng)計學(xué)分析 采用SPSS 19.0統(tǒng)計分析軟件。對數(shù)據(jù)進行正態(tài)分析和方差齊性檢驗,計量資料以±s表示,計數(shù)資料以構(gòu)成比表示;采用兩獨立樣本t檢驗比較2組各項定量超聲指標的差異。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 聲像圖特征定量分析 惡性組與良性組堅固度、邊緣粗糙度、NGTDM粗糙度、腫瘤后方與周圍區(qū)域回聲差異及HL-H能量的差異均有統(tǒng)計學(xué)意義(P均<0.05);而腫瘤面積及縱橫比差異均無統(tǒng)計學(xué)意義(P均>0.05)。見表1。
2.2 超聲診斷效能 以病理結(jié)果為金標準,超聲診斷乳腺惡性腫瘤的敏感度為96.21%(127/132),特異度為66.35%(209/315),陽性預(yù)測值為54.51%(127/233),陰性預(yù)測值為97.66%(209/214),準確率為75.17%(336/447)。
2.3 主動遷移學(xué)習(xí)算法分類識別結(jié)果 以病理結(jié)果為金標準,測試集中,主動遷移學(xué)習(xí)算法診斷乳腺惡性腫瘤的敏感度為96.04%(97/101),特異度為98.49%(196/199),陽性預(yù)測值為97.00%(97/100),陰性預(yù)測值為98.00%(196/200),準確率為97.67%(293/300)。
圖像紋理、邊緣鋒銳程度、腫瘤幾何形狀、腫瘤圖像亮度、回聲特性等超聲特征有助于診斷乳腺癌,其中乳腺超聲聲像圖紋理特性、腫瘤幾何形狀及回聲特性是鑒別乳腺腫瘤良惡性的主要依據(jù)[16]。本研究對乳腺腫瘤超聲聲像圖的7個定量特征參數(shù)進行分析,其中乳腺惡性腫瘤的腫塊堅固度、邊緣粗糙度、NGTDM粗糙度均高于良性腫瘤,提示聲像圖中惡性腫瘤形態(tài)不規(guī)則、邊緣不光整、內(nèi)部回聲不均勻的可能性更高,且惡性腫瘤后方與周圍區(qū)域回聲差異更加明顯,與既往研究[17]結(jié)果一致。
Nascimento等[18]發(fā)現(xiàn)形態(tài)學(xué)特征用于病變分類比紋理特征更佳,且減少的特征集比全組的特征集表現(xiàn)更好。本研究在提取圖像特征時,集中選取乳腺腫瘤超聲診斷中的二維特征指標,剔除血流參數(shù)指標如腫塊血流信號分級和血流阻力指數(shù),結(jié)果顯示良惡性乳腺腫瘤之間,除腫瘤面積和縱橫比外,堅固度、邊緣粗糙度、NGTDM粗糙度、腫塊后方與周圍區(qū)域回聲差異及HL-H能量的差異均有統(tǒng)計學(xué)意義(P均<0.05),提示經(jīng)PCA方法選擇的7個定量超聲指標較為合理。
圖4 不同算子對惡性乳腺腫瘤超聲圖像邊緣檢測效果對比 A.原始聲像圖; B.Roberts算子; C.Sobel算子; D.Prewitt算子; E.Log算子; F.Canny算子
Zhang等[19]建立深度學(xué)習(xí)自動提取圖像特征數(shù)據(jù)的剪切波彈性學(xué)習(xí)架構(gòu),并對乳腺良惡性腫瘤進行鑒別,結(jié)果表明,采用深度學(xué)習(xí)提出的特征診斷乳腺惡性腫瘤的敏感度為88.6%,特異度為97.1%,準確率為93.4%,提示深度學(xué)習(xí)可能在乳腺癌的臨床計算機輔助診斷中具有潛在的應(yīng)用價值。但是,該研究對訓(xùn)練的計算需求較大,未進行數(shù)據(jù)增強,且未分析同一病灶的多幅圖像間的相關(guān)性和變化。主動遷移學(xué)習(xí)算法可對屬于同一個病灶的多個乳腺腫瘤的超聲圖像樣本數(shù)據(jù)進行集中自動標記,避免分別標記帶來的額外計算,從而提高分類效率。本研究采用主動遷移學(xué)習(xí)算法,能有效地在相似圖像之間進行信息共享和遷移,診斷乳腺惡性腫瘤的敏感度為96.04%,特異度98.49%,準確率97.67%,提示遷移學(xué)習(xí)方法識別良惡性乳腺腫瘤的聲像圖有較高的分類診斷效率。
綜上所述,主動遷移學(xué)習(xí)能有效識別良惡性乳腺腫瘤聲像圖,且準確率較高,有助于避免超聲科醫(yī)師判斷的模糊性和主觀性,從而使超聲診斷乳腺腫瘤更加準確、可靠。