李星宇,雷禹,黃曉旗,李建龍,閆軍
延安大學(xué)附屬醫(yī)院 影像科,陜西 延安 716000
肋骨骨折是胸部外傷后較為常見(jiàn)的損傷,通常采用保守治療,雖然死亡率相對(duì)較低,但多發(fā)肋骨骨折可能會(huì)造成嚴(yán)重并發(fā)癥,如肺挫傷、肺不張,甚至血?dú)庑氐萚1]。大多數(shù)學(xué)者認(rèn)為,肋骨骨折數(shù)量越多,患者越容易出現(xiàn)肺部并發(fā)癥,導(dǎo)致預(yù)后不良[2-3]。也有研究表明,中肋外側(cè)骨折可誘發(fā)更高的并發(fā)癥發(fā)生率,因此需要更密切的觀察[4]。X線(xiàn)與CT均是診斷肋骨骨折的常用檢查手段[5],MRI對(duì)細(xì)微肋骨骨折有較大意義,可用于輕度胸外傷患者的補(bǔ)充診斷[6]。但目前,CT已逐漸成為胸部外傷后首選的影像學(xué)檢查手段,尤其在醫(yī)學(xué)鑒定時(shí)顯得尤為重要[7]。隨著多層螺旋CT在臨床上的廣泛應(yīng)用,肋骨骨折的檢出率也越來(lái)越高[8]。
由于肋骨解剖形態(tài)的特性,診斷時(shí)需要逐肋、逐側(cè)觀察,此過(guò)程較為繁瑣。目前已有人工智能(Artificial Intelligence,AI)對(duì)肋骨骨折的診斷效能的報(bào)道,并利用CNN模型可在較短的時(shí)間內(nèi)自動(dòng)檢測(cè)并分類(lèi)肋骨骨折,達(dá)到放射科主治醫(yī)師的診斷水平[9]。同時(shí)研究表明,AI可以在不增加假陽(yáng)性率的基礎(chǔ)上,提高診斷的準(zhǔn)確性及敏感性,提升醫(yī)師的診斷效率[10-11]。但目前對(duì)于不同類(lèi)型的肋骨骨折診斷的準(zhǔn)確性及誤漏診原因尚鮮見(jiàn)報(bào)道。因此,探究人工智能軟件輔助影像科醫(yī)師是否可以在保證診斷準(zhǔn)確度的前提下提升工作效率具有重要意義。
本研究主要針對(duì)在不同類(lèi)型的肋骨骨折中AI的檢出率及靈敏度,以及在本研究中存在的誤漏診原因進(jìn)行分析,探究影像科醫(yī)師在使用AI進(jìn)行肋骨骨折診斷時(shí)應(yīng)注意的問(wèn)題;同時(shí),針對(duì)這些問(wèn)題以及敏感度較低的骨折進(jìn)行系統(tǒng)機(jī)器學(xué)習(xí)、訓(xùn)練,以?xún)?yōu)化算法,以期提高AI對(duì)肋骨骨折的檢出性能,減少AI對(duì)肋骨骨折的誤診率和漏診率。
回顧性分析本院2020年10—12月進(jìn)行CT檢查中明確為肋骨骨折患者77例的影像資料,其中男性49例,女性28例;年齡21~83歲,中位年齡52歲;合并胸腔積液17例,肺挫傷8例,肺不張7例,氣胸5例。納入標(biāo)準(zhǔn):① 有肋骨骨折的影像學(xué)特征;②CT掃描骨痂形成或骨折愈合。排除標(biāo)準(zhǔn):① 圖像中有明顯的呼吸及放射狀偽影,影響肋骨骨折的診斷;② 存在骨破壞或骨腫瘤病史;③ 先天胸廓發(fā)育不良或畸形。所有影像資料均來(lái)源于本院PACS系統(tǒng)。所有患者均對(duì)本研究知情同意,并簽署知情同意書(shū)。
使用聯(lián)影uCT-760 64排螺旋CT。掃描時(shí)患者取仰臥位,頭先進(jìn),深吸氣后屏氣,掃描范圍由肺尖至上腹部。掃描參數(shù):管電壓120 kV,自適應(yīng)動(dòng)態(tài)管電流,準(zhǔn)直寬度40 mm,螺距1.0875,掃描層厚5 mm。圖像重建1 mm薄層,層間距1 mm,矩陣512×512,骨算法重建。
使用人工智能軟件(uAI EasyTriage-Rib)進(jìn)行肋骨骨折的自動(dòng)檢測(cè)。將符合標(biāo)準(zhǔn)的CT圖像導(dǎo)入AI系統(tǒng)后,AI軟件可對(duì)其進(jìn)行圖像后處理和分析,輸出軟件預(yù)測(cè)出的肋骨骨折區(qū)域,并做標(biāo)記。肋骨骨折自動(dòng)檢測(cè)基于V-Net[12]完成,V-Net提供了3D卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),用于對(duì)骨折特征的提取及圖像的定位。該神經(jīng)網(wǎng)絡(luò)首先經(jīng)過(guò)圖像特征壓縮網(wǎng)絡(luò)路徑提取相應(yīng)特征,再經(jīng)1個(gè)與壓縮網(wǎng)絡(luò)對(duì)稱(chēng)的去壓縮網(wǎng)絡(luò)恢復(fù)到與輸入等尺寸的三維矩陣。由軟件研發(fā)公司開(kāi)發(fā)訓(xùn)練了此軟件。軟件處理結(jié)果界面中包括帶肋骨骨折標(biāo)記的橫軸位圖像、CPR圖像及VR圖像,以方便診斷醫(yī)師觀察AI檢測(cè)的肋骨骨折情況。軟件處理結(jié)果頁(yè)面包括帶有肋骨定位標(biāo)簽及骨折處標(biāo)記的橫軸位圖像,同時(shí)可在軟件中進(jìn)行多平面重建(Multiple Planar Reformation,MRP)及容積重建(Volume Rendering,VR)的后處理以多方位觀察AI檢測(cè)的肋骨骨折情況。同時(shí)軟件診斷肋骨骨折自動(dòng)表示骨折類(lèi)型,如錯(cuò)位性骨折、非錯(cuò)位性骨折及陳舊性骨折,并通過(guò)MPR及3D后處理技術(shù)幫助醫(yī)師識(shí)別骨折及判斷骨折性質(zhì)(圖1~2),其中陳舊性骨折定義為骨折處骨痂形成或骨折畸形愈合。
圖1 AI操作界面
圖2 AI軟件自動(dòng)識(shí)別并分析肋骨骨折部位及類(lèi)型
① 由兩名具有5年診斷經(jīng)驗(yàn)的影像科醫(yī)師甲、乙使用層厚為1 mm胸部CT軸位圖像并采用多種CT后處理技術(shù),如容積重建及多平面重建等進(jìn)行診斷;② uAI EasyTriage-Rib軟件自動(dòng)定位肋骨,識(shí)別骨折部位及骨折類(lèi)型,得出診斷結(jié)果;③ 醫(yī)師甲、乙使用uAI EasyTriage-Rib軟件對(duì)肋骨骨折進(jìn)行診斷;④ 以?xún)擅麖氖掠跋裨\斷工作15年以上的高年資影像科醫(yī)師聯(lián)合閱片的最終結(jié)果作為“金標(biāo)準(zhǔn)”,高年資醫(yī)師獨(dú)立確定閱片結(jié)果,出現(xiàn)分歧時(shí),商討一致確定。
分別采用兩種方法對(duì)診斷結(jié)果進(jìn)行分析,分別對(duì)比骨折的檢出率及骨折診斷的準(zhǔn)確性。在金標(biāo)準(zhǔn)判定為骨折的位置中,診斷結(jié)果也判斷為存在骨折(包括骨折類(lèi)型診斷錯(cuò)誤),則認(rèn)定為檢出;若診斷結(jié)果判定為無(wú)骨折,則認(rèn)定為未檢出。將3組診斷結(jié)果與金標(biāo)準(zhǔn)進(jìn)行對(duì)比,若骨折位置及性質(zhì)與金標(biāo)準(zhǔn)一致,則認(rèn)定為診斷正確;若骨折與金標(biāo)準(zhǔn)不一致,則認(rèn)定為診斷錯(cuò)誤。研究中診斷錯(cuò)誤包含兩種情況:①AI或醫(yī)師診斷為骨折而金標(biāo)準(zhǔn)未認(rèn)定為骨折;② 醫(yī)師和AI診斷骨折的性質(zhì)與金標(biāo)準(zhǔn)不符合。
應(yīng)用SPSS 24.0統(tǒng)計(jì)學(xué)軟件進(jìn)行數(shù)據(jù)分析,計(jì)算出兩種方法對(duì)肋骨骨折檢測(cè)的檢出率及假陰性率以及對(duì)肋骨骨折診斷的準(zhǔn)確度、靈敏度,并比較各組之間各指標(biāo)的差異。采用多重修正χ2檢驗(yàn)及Fisher確切概率法分別比較兩名醫(yī)師與AI單獨(dú)及醫(yī)師在使用AI后的診斷準(zhǔn)確性。采用配對(duì)t檢驗(yàn)對(duì)影像科醫(yī)師單獨(dú)診斷與使用uAI EasyTriage-Rib軟件閱片的診斷用時(shí)進(jìn)行比較。
根據(jù)兩名高年資影像科醫(yī)師商討一致后得出,77例患者共328根肋骨骨折,骨折434處,其中錯(cuò)位性骨折101處,非錯(cuò)位性骨折168處,陳舊性骨折165處。
uAI EasyTriage-Rib檢測(cè)正確的部位中,醫(yī)師甲獨(dú)立診斷時(shí)有30處檢測(cè)錯(cuò)誤,醫(yī)師乙有24處檢測(cè)錯(cuò)誤,見(jiàn)表1。在金標(biāo)準(zhǔn)檢出的骨折434處中,uAI EasyTriage-Rib檢出骨折423處,漏診11處,醫(yī)師甲獨(dú)立診斷時(shí)漏診44處,醫(yī)師乙漏診55處,見(jiàn)表2。
表1 uAI EasyTriage-Rib與影像科醫(yī)師診斷結(jié)果(例,n=434)
表2 uAI EasyTriage-Rib與影像科醫(yī)師對(duì)骨折的陽(yáng)性檢出情況(例,n=434)
uAI EasyTriage-Rib對(duì)非錯(cuò)位性骨折、陳舊性骨折的檢出率明顯高于醫(yī)師甲及醫(yī)師乙(P<0.05),但在對(duì)錯(cuò)位性骨折的診斷中,uAI EasyTriage-Rib與醫(yī)師甲及醫(yī)師乙的檢出率無(wú)明顯差異(P>0.05)。醫(yī)師使用 uAI EasyTriage-Rib對(duì)3種類(lèi)型骨折的檢出率與uAI EasyTriage-Rib單獨(dú)診斷相比無(wú)明顯差異(P>0.05),見(jiàn)表 3~4。
表3 uAI與影像醫(yī)師及uAI聯(lián)合影像醫(yī)師對(duì)不同類(lèi)型骨折的檢出情況(%)
表4 uAI與兩名影像醫(yī)師及uAI聯(lián)合醫(yī)師對(duì)骨折檢出率的差異分析
uAI EasyTriage-Rib對(duì)3種類(lèi)型骨折診斷的準(zhǔn)確度及敏感度明顯高于醫(yī)師甲及醫(yī)師乙(uAI與醫(yī)師甲準(zhǔn)確度比較,錯(cuò)位性χ2=12.320,P<0.001,非錯(cuò)位性χ2=11.390,P=0.001,陳舊性χ2=7.639,P=0.002;靈敏度比較,錯(cuò)位性χ2=13.713,P=0.001,非錯(cuò)位性χ2=12.789,P<0.001,陳舊性χ2=7.017,P=0.008。uAI與醫(yī)師乙準(zhǔn)確度比較,錯(cuò)位性χ2=13.902,P<0.001,非錯(cuò)位性χ2=4.260,P=0.039,陳舊性χ2=5.938,P=0.015;靈敏度比較,錯(cuò)位性χ2=15.572,P<0.001,非錯(cuò)位性χ2=11.172,P=0.001,陳舊性χ2=8.769,P=0.003);醫(yī)師甲及醫(yī)師乙使用uAI EasyTriage-Rib對(duì)3種類(lèi)型的骨折診斷準(zhǔn)確度明顯高于uAI EasyTriage-Rib單獨(dú)診斷(醫(yī)師甲使用uAI診斷vs.uAI單獨(dú)診斷的準(zhǔn)確度比較,錯(cuò)位性χ2=4.256,P=0.039,非錯(cuò)位性χ2=19.257,P<0.001,陳舊性χ2=31.381,P<0.001。醫(yī)師乙使用 uAI診斷vs.uAI單獨(dú)診斷的準(zhǔn)確度比較,錯(cuò)位性χ2=14.910,P<0.001,非錯(cuò)位性χ2=38.229,P<0.001,陳舊性χ2=13.541,P<0.001);uAI EasyTriage-Rib對(duì)錯(cuò)位性骨折診斷的靈敏度略低于醫(yī)師乙使用uAI EasyTriage-Rib診斷(95.8%vs.96.1%,χ2=14.736,P<0.001),對(duì)陳舊性骨折診斷的靈敏度高于兩位醫(yī)師使用uAI EasyTriage-Rib,差異具有統(tǒng)計(jì)學(xué)意義(uAI與醫(yī)師甲比較,χ2=32.728,P<0.001;uAI與醫(yī)師乙比較,χ2=14.149,P<0.001),見(jiàn)表 5。
表5 uAI與兩名影像醫(yī)師及uAI聯(lián)合醫(yī)師對(duì)不同類(lèi)型骨折的診斷效能(%)
比較金標(biāo)準(zhǔn)與uAI EasyTriage-Rib診斷結(jié)果,共有41處骨折存在診斷偏差,其中漏診11處,假陽(yáng)性9處,這兩者主要見(jiàn)于非錯(cuò)位性骨折;性質(zhì)診斷錯(cuò)誤21處,該情況主要存在于陳舊性骨折。uAI EasyTriage-Rib對(duì)錯(cuò)位性骨折、非錯(cuò)位性骨折及陳舊性骨折診斷的漏診率分別為3.96%、2.98%、1.21%,對(duì)所有骨折的總漏診率為2.53%(表6~7)。
表6 uAI EasyTriage-Rib骨折誤診和漏診情況(例)
表7 uAI EasyTriage-Rib與影像醫(yī)師及uAI聯(lián)合影像醫(yī)師對(duì)不同類(lèi)型骨折診斷的漏診率(%)
甲、乙兩位影像科醫(yī)師獨(dú)立閱片的診斷用時(shí)分別為(306.3±65.3)s、(301.4±55.9)s,甲、乙兩位醫(yī)師使用uAI EasyTriage-Rib閱片的診斷用時(shí)分別為(210.1±49.5)、(206.3±43.6)s,使用 uAI EasyTriage-Rib閱片的診斷平均用時(shí)顯著低于兩位影像科醫(yī)師單獨(dú)閱片(醫(yī)師甲單獨(dú)診斷與使用uAI診斷用時(shí)比較,t=21.591,P<0.001;醫(yī)師乙單獨(dú)診斷與使用uAI診斷用時(shí)比較,t=18.121,P<0.001)。
目前,隨著人們生活節(jié)奏的加快及出行方式的改變,胸部損傷也越來(lái)越常見(jiàn)。肋骨骨折作為胸部損傷中最常見(jiàn)的并發(fā)癥,發(fā)生率可高達(dá)40%~80%[13]。肋骨骨折是嚴(yán)重?fù)p傷的標(biāo)志,常伴有多發(fā)傷,且伴多發(fā)傷及連枷胸的患者通常結(jié)局更差[14]。而多根多處肋骨骨折往往合并了嚴(yán)重的胸腹聯(lián)合損傷,有研究表明,肋骨骨折的骨折根數(shù)可以作為肺部并發(fā)癥發(fā)生的獨(dú)立危險(xiǎn)因素[15];同時(shí),肋骨骨折的誤診、漏診是在日常工作中引起醫(yī)療糾紛的一個(gè)常見(jiàn)原因,因此,提高肋骨骨折的診斷準(zhǔn)確性及時(shí)效性具有重要意義。目前,針對(duì)醫(yī)學(xué)影像領(lǐng)域的AI已經(jīng)廣泛應(yīng)用于肺結(jié)節(jié)、新冠肺炎的檢出等[16-17]。AI可為影像科醫(yī)師提供更多的信息,以利于其診斷疾病。
AI軟件可以快速完成胸椎及肋骨的分割,并對(duì)肋骨骨折部位及性質(zhì)進(jìn)行自動(dòng)標(biāo)識(shí)。在對(duì)明顯的、易于診斷的錯(cuò)位性骨折中,醫(yī)師與AI診斷的檢出率無(wú)明顯差異,但在非錯(cuò)位性及陳舊性骨折中AI的檢出率明顯高于醫(yī)師,表明AI對(duì)難以診斷及易遺漏骨折的檢出更具意義,這與既往研究中認(rèn)為AI與醫(yī)師聯(lián)合閱片時(shí)骨折檢出率的優(yōu)勢(shì)主要表現(xiàn)在輕微骨折的檢出上相一致[18]。AI與人工聯(lián)合后較AI單獨(dú)診斷檢出率并沒(méi)有顯著提高,這可能因?yàn)锳I在單獨(dú)診斷時(shí)檢出率已經(jīng)達(dá)97%以上,AI中未檢出的骨折多為較難診斷的非錯(cuò)位性骨折,因此AI漏診后低年資醫(yī)師使用AI多數(shù)也未診斷出。
就診斷準(zhǔn)確性而言,AI在3種骨折類(lèi)型中的診斷準(zhǔn)確度均優(yōu)于影像科醫(yī)師單獨(dú)診斷,同時(shí),醫(yī)師在使用AI后對(duì)3種類(lèi)型骨折的診斷準(zhǔn)確度優(yōu)于AI單獨(dú)診斷,這與之前的一些報(bào)道相似[11,19]。醫(yī)師使用AI后對(duì)肋骨骨折診斷的準(zhǔn)確度較單獨(dú)AI明顯提高,可能是因?yàn)獒t(yī)師對(duì)AI的部分骨折類(lèi)型判斷錯(cuò)誤進(jìn)行了診斷結(jié)果的修正,減少了誤診的發(fā)生。盡管在3種骨折類(lèi)型中AI的診斷準(zhǔn)確度及靈敏度均高于影像科醫(yī)師,但陳舊性骨折的診斷準(zhǔn)確度及靈敏度略低于非錯(cuò)位性骨折及錯(cuò)位性骨折,這也與相關(guān)報(bào)道相似[20]。因此,需要對(duì)非錯(cuò)位性骨折及陳舊性骨折的征象進(jìn)行機(jī)器學(xué)習(xí)及驗(yàn)證。
本研究中,AI對(duì)骨折的漏診較少,其假陰性率明顯低于兩名醫(yī)師的診斷,AI大多為假陽(yáng)性及性質(zhì)判斷錯(cuò)誤,其中性質(zhì)判斷錯(cuò)誤占比較大,漏診大多為不完全性骨折。假陽(yáng)性情況最多的為將肋軟骨的不完全鈣化誤認(rèn)為非錯(cuò)位骨折;其次包括呼吸運(yùn)動(dòng)偽影、滋養(yǎng)孔影及引流管影。性質(zhì)診斷錯(cuò)誤大部分為陳舊性骨折,這可能是由于AI對(duì)于輕微的骨痂形成識(shí)別能力較弱,將其誤判為非錯(cuò)位性骨折。此外,也存在有輕微的錯(cuò)位性骨折被判定為非錯(cuò)位性骨折的情況。以上結(jié)果表明,AI還有繼續(xù)優(yōu)化的空間,可以進(jìn)一步進(jìn)行機(jī)器學(xué)習(xí)及驗(yàn)證,提升診斷的準(zhǔn)確性。醫(yī)師在使用AI輔助診斷時(shí),應(yīng)更注意以上提到的問(wèn)題,從而做出更準(zhǔn)確的判斷。在診斷用時(shí)的比較中,醫(yī)師使用AI閱片對(duì)肋骨骨折的診斷用時(shí)顯著短于自身單獨(dú)診斷用時(shí)。表明AI在保證醫(yī)師診斷準(zhǔn)確度的同時(shí),能夠提高對(duì)肋骨骨折的診斷效率。
綜上所述,AI可快速、直觀地識(shí)別肋骨骨折部位及類(lèi)型,較影像醫(yī)師獨(dú)立診斷具有更高的準(zhǔn)確度及靈敏度。AI與醫(yī)師的聯(lián)合診斷還明顯縮短了醫(yī)師的診斷時(shí)間,提高了醫(yī)師的診斷效率,具有較高的臨床應(yīng)用價(jià)值。