謝豆 鄭菲 陳濤 劉文軍
摘要:借助人工智能技術(shù)以及信息化遠(yuǎn)程醫(yī)療技術(shù),搭建基于人工智能的影像遠(yuǎn)程會(huì)診平臺(tái),成為提高醫(yī)學(xué)影像診療效率的一種有效手段。目前的新冠肺炎疫情檢測(cè)方法有臨床表現(xiàn)描述、病原學(xué)檢測(cè)、血清學(xué)檢測(cè),以及使用肺部影像進(jìn)行進(jìn)一步的輔助診斷。探索建立醫(yī)學(xué)影像遠(yuǎn)程診斷平臺(tái),并基于卷積神經(jīng)網(wǎng)絡(luò)VGG模型對(duì)X射線肺部影像進(jìn)行診斷,這種自動(dòng)化的方法能夠?qū)颊叩妮o助診斷起到一定的效果,從而減輕醫(yī)生的工作量。
關(guān)鍵詞:機(jī)器視覺;深度學(xué)習(xí);計(jì)算機(jī)輔助診斷;VGG16;新型冠狀病毒肺炎(COVID-19)
中圖分類號(hào): TP393? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)23-0137-03
Abstract: With the help of artificial intelligence technology and information telemedicine technology, the establishment of an artificial intelligence-based remote imaging consultation platform has become an effective means to improve the efficiency of medical imaging diagnosis and treatment. The current COVID-19 detection methods include description of clinical manifestations, pathogenic testing, serological testing, and the use of lung imaging for further auxiliary diagnosis. Explore the establishment of a medical imaging remote diagnosis platform, and diagnose X-ray lung images based on the convolutional neural network VGG model. This automated method can have a certain effect on the auxiliary diagnosis of patients, thereby reducing the workload of doctors.
Key words: machine vision; deep learning; computer aided diagnosis; VGG16; COVID-19
2019年底爆發(fā)至今的COVID-19肺炎是由SARS-CoV-2感染引起的一種嚴(yán)重急性呼吸綜合癥,伴有發(fā)燒、咳嗽、頭痛、肌痛,在某些情況下還有腸道癥狀。疫情蔓延全世界,爆發(fā)初期病例呈指數(shù)增長(zhǎng),它被世界衛(wèi)生組織(World Health Organization,縮寫WHO)稱為一種大流行病,每個(gè)國(guó)家都深受其害。面對(duì)COVID-19大流行,我國(guó)政府采取了科學(xué)、有力的防控措施,使得疫情在國(guó)內(nèi)得以有效控制,但仍有大量的境外疫情輸入威脅著人們的健康。
隨著我國(guó)對(duì)COVID-19肺炎的臨床表現(xiàn)、病理認(rèn)知的深入和診療經(jīng)驗(yàn)的積累,提早檢測(cè)出COVID-19患者,阻止病情擴(kuò)散成為控制疫情發(fā)展的關(guān)鍵。除了使用核酸檢測(cè)進(jìn)行是否患病的判斷并及時(shí)進(jìn)行相關(guān)人員的14天隔離,作為補(bǔ)充還可以使用肺部影像進(jìn)行輔助診斷。因?yàn)镃OVID-19以肺臟和免疫系統(tǒng)損害為主,當(dāng)成人肺內(nèi)病變?cè)诙唐趦?nèi)迅速發(fā)展、兒童影像學(xué)顯示雙側(cè)或多肺葉浸潤(rùn)、胸腔積液或短期內(nèi)病變加速,都是重型、危重型臨床預(yù)警指標(biāo)。由于需要篩查的人員數(shù)量眾多,需要進(jìn)行診斷的肺部影像基數(shù)大,放射科醫(yī)生數(shù)量有限,這不僅讓患者就診時(shí)間增加,也給醫(yī)院診療帶來(lái)了壓力。
當(dāng)前存在多項(xiàng)采用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)分類方法輔助COVID-19的診斷相關(guān)研究[1]。為了緩解醫(yī)患?jí)毫?,縮短肺部醫(yī)療影像就診時(shí)間,降低就診成本,本文將深度學(xué)習(xí)算法與計(jì)算機(jī)視覺相結(jié)合,對(duì)肺部醫(yī)療影像進(jìn)行處理,并將訓(xùn)練好的深度學(xué)習(xí)模型用于診斷用戶是否患病。模型還可靈活部署于各種遠(yuǎn)程診療應(yīng)用中,大大縮短了就診時(shí)間,可用于輔助醫(yī)生進(jìn)行前期篩查診斷,提高就醫(yī)效率。
1 預(yù)備知識(shí)
1.1 數(shù)據(jù)集
訓(xùn)練使用的數(shù)據(jù)集采用了X射線肺部影像。數(shù)據(jù)集為二分類數(shù)據(jù)集,一類為正常肺部影像4098張,用標(biāo)簽normal(正常)表示,另一類為COVID-19肺部影像4098張,用標(biāo)簽pneumonia(肺炎)表示??偟臄?shù)據(jù)集為8196張圖片,因?yàn)閮深悩颖镜臄?shù)量相同,因此大大降低了二分類中常出現(xiàn)的樣本不均衡問題發(fā)生降低性能的概率。與多分類比起來(lái),二分類的復(fù)雜程度更低,從而使單類的判斷確定性提高。
關(guān)于肺部影像除了X射線影像還有CT影像,如圖1所示分別給出了兩種圖像類型在正常和異常(確診)情況下的對(duì)比。圖1中的CT圖像數(shù)據(jù)集內(nèi)容由Yang等人提供[2],而本文選用X射線影像的原因在于X射線圖片更大更清晰,圖片上的無(wú)用信息少,不容易干擾模型學(xué)習(xí)。相比之下,CT影像常常出現(xiàn)設(shè)備信息干擾模型學(xué)習(xí)。此外,X光機(jī)更便宜、操作速度更快,檢測(cè)成本更加低廉。
1.2 數(shù)據(jù)預(yù)處理
卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)代表性的網(wǎng)絡(luò),能夠?qū)W習(xí)強(qiáng)大的表征空間,這是解決復(fù)雜學(xué)習(xí)任務(wù)所必需的。由于在訓(xùn)練過程中容易發(fā)生過擬合現(xiàn)象,因此需要適當(dāng)?shù)恼齽t化??紤]到現(xiàn)有數(shù)據(jù)集數(shù)量有限,對(duì)原有的數(shù)據(jù)集進(jìn)行圖像處理增加圖像數(shù)量繼續(xù)訓(xùn)練的技術(shù)稱為圖像增強(qiáng)。圖像增強(qiáng)是正則化中重要的一種形式,也是訓(xùn)練模型時(shí)常用的方式,它可以提高模型的魯棒性,同時(shí)最大限度地提高模型的精度,使模型更加貼合真實(shí)的使用場(chǎng)景。