燕婷 王于超 金中一
摘 要:心電圖是一種用來監(jiān)測心臟活動的標(biāo)準(zhǔn)測試。心電圖能夠體現(xiàn)心臟異常,包括心律失常,心律失常是心律異常的通稱。同一類型的心律失常在同一患者不同階段的心電信號存在一定差異,不同患者同一類型的心律失常心電信號差異會更大,這對人工判斷是一大挑戰(zhàn)。提出一種基于降噪自編碼的CNN與GRU結(jié)合的心電圖分類方法,從公共數(shù)據(jù)庫(MIT-BIH)中提取原始心電信號集中進(jìn)行實驗。該集合人為擴(kuò)大到平均5類心跳實例,并過濾掉高頻噪聲。該方法對室上(S)和心室搏動(V)的準(zhǔn)確率分別為99.49%、99.43%,靈敏度分別為90.55%、96.65%,精確率分別為91.04%、95.46%。結(jié)果表明,該模型與目前先進(jìn)水平在性能上有較大提高,具有良好的可擴(kuò)展性。
關(guān)鍵詞:心電圖信號;降噪自編碼;卷積神經(jīng)網(wǎng)絡(luò);門控循環(huán)單元
DOI: 10. 11907/rjdk.191995
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
中圖分類號:TP301
文獻(xiàn)標(biāo)識碼:A
文章編號:1672-7800(2020)004-0075-04
Denoising Autoencoder ECG Signal Classification Method Based on CNN and GRU
YAN Ting, WANG Yu-chao, JIN Zhong-yi
(College of Computer Science and Engineering , Slzandong University of Science and Tech.nology , Qingda0 2665 1 0 . Ch.ina )Abstract: An electrocardiogram is a standard test used to monitor cardiac activity. An electrocardiogram can reflect cardiac abnormali-ties including arrhythruia . which is a general term f'or heart thythm abnormalities. The same tvpe of arrhythmia has a certain dif'ferencein ECG signals at different stages of the same patient. The difference in ECG signals between the same type of arrhythmia in differentpatients is greater, "-hich is a big challenge for manual judgment. Therefore. this paper proposes a method of ECG classification basedon CNN and G RU based on denoising autoencoders. The experiment is carried out in the original ECG signal extracted from a public da-tabase(MIT-BIH). This set was artificially expanded to average the numher of instances of Category 5 heartbeats and filtered out highf'requency noise. The accuracy of the method f'or the supraventricular (S) and ventricular beat (V) was 99.49% . 99.43, the sensitivitywere 90.55% . 96.65% . respectively and the accuracy rate were 91.04% . 95.46%. The experiment showed that compared with the ad-vanced level. the model ' s the perforruance has heen greatly iruproved and has good scalability.Key Words : ECG classif'ication; denoising autoencoder; convolutional neural network; gated recurrent unit
O 引言
在心臟疾病的臨床診斷中,心律失?!袝r表現(xiàn)為心臟功能的嚴(yán)重改變,如果不及時有效治療,可能導(dǎo)致腦猝死或心臟猝死。因此,對心律失常的早期診斷、臨床分析和治療策略至關(guān)重要。心電圖(ECG)是一種無創(chuàng)的廉價技術(shù),常用來檢測心律異常,測量一段時間內(nèi)心臟的電活動。
心電圖分類醫(yī)學(xué)儀器促進(jìn)協(xié)會(AAMI)[2]標(biāo)準(zhǔn)定義5種類型:正常(N)、心室(v)、室上(S)、正常和心室融合(F)和未知搏動(0)?,F(xiàn)有的心拍分類方法主要是深度學(xué)習(xí)[3]方法,包括深度信念網(wǎng)絡(luò)(DBNs)[4-5]、白編碼器(DAE)[6-7]、卷積神經(jīng)網(wǎng)絡(luò)CNNs)[8-9]。深度學(xué)習(xí)在圖像分類[10]、目標(biāo)識別[11-12]、人臉識別等許多應(yīng)用中效果很好。對分割后的ECGs采用11層卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行處理[13],最大精度達(dá)到93.18%。一個深度殘差神經(jīng)元網(wǎng)絡(luò)[14-15]直接應(yīng)用34層深度CNN對陣列進(jìn)行分類,不需要任何復(fù)雜的預(yù)處理和特征工程步驟,這種方法通過使用比其它同類方法大500倍的數(shù)據(jù)集實現(xiàn)了心臟病學(xué)家級別的性能。
傳統(tǒng)的ECG信號分類方法需要提前知道一定的信號先驗知識,或經(jīng)常需要專家進(jìn)行手動標(biāo)注,耗費(fèi)大量時間,準(zhǔn)確性和效率往往差異很大,且不利于穿戴式設(shè)備應(yīng)用?;谶@些不足,本文提出一種基于降噪白編碼模式的CNN與GRU結(jié)合的心電分類方法,提高了心電圖(ECG)信號分類準(zhǔn)確性和效率,并有利于可穿戴設(shè)備應(yīng)用。
1數(shù)據(jù)處理
1.1數(shù)據(jù)庫選擇
本文選用的MIT-BIH心律失常數(shù)據(jù)庫[16]。包含48條半小時的2導(dǎo)聯(lián)動態(tài)心電圖記錄,錄音采樣頻率是360Hz,所有記錄都包含原始心電信號,并由兩名或兩名以上心臟病專家分別進(jìn)行逐拍標(biāo)記,被標(biāo)記的心跳總數(shù)為108655次。這些心跳分成15種不同的類型,如表1所示。4個記錄(102、104、107和217)被排除在外,因為它們包含有節(jié)奏的心跳。剩下的44條記錄分為訓(xùn)練集、測試集和驗證集,本文選用的是導(dǎo)聯(lián)Ⅱ。
1.2數(shù)據(jù)預(yù)處理
與文獻(xiàn)[17-18]類似,所有心電信號都是先用200ms寬度的中值濾波去除P波和QRS波,再用600ms寬度的中值濾波去除T波。利用原始輸入的ECG信號減去利用中值濾波器去除完的P波、QRS波和T波,得到的信號便是基線校正后的ECG信號。然后采用截止頻率為35Hz的12階低通濾波器去除電源線和高頻噪聲.最終得到本文所需要的ECG信號,如圖l所示。
1.3數(shù)據(jù)分割
數(shù)據(jù)分割先要進(jìn)行R峰檢測。由于在MIT-BIH數(shù)據(jù)庫中給出了準(zhǔn)確的R峰位置,因此本文直接使用原有的R峰位置劃分心拍。在MIT-BIH數(shù)據(jù)庫所給的R峰中,去除第一個R峰與最后一個R峰,取每個R峰與前一個R峰和后一個R峰的RR間隔的一半之和為一個心拍,運(yùn)用插值法對剩余的n-2個心拍進(jìn)行降采樣,降為60維即一個心拍的長度為60,其中包含P-QRS-T波,如圖2所示。眾所周知,時間信息對于識別類簽名非常重要,因此添加4個時間特性,即前RR間隔、后RR間隔、局部RR間隔和全局RR間隔。每一個R峰與前一個R峰的RR間隔為前RR間隔,與后一個R峰的RR間隔為后RR間隔,局部RR間隔是在lOs內(nèi)通過滑動R峰窗口得到的所有R峰間隔的平均值。全局RR間隔是在5分鐘內(nèi)通過滑動R峰窗口得到的所有R峰中平均值,最終拼接成64維矩陣輸入模型。
2模型
2.1降噪自編碼模型
白編碼模型是一種壓縮再解壓過程。本文的降噪白編碼在訓(xùn)練過程中輸入的數(shù)據(jù)有一部分是“損壞”的。DAE( Denoising Autoencoder)的核心思想是,一個能夠恢復(fù)出原始信號的神經(jīng)網(wǎng)絡(luò)表達(dá)未必是最好的,能夠?qū)Α皳p壞”的原始數(shù)據(jù)編碼、解碼,然后還能恢復(fù)真正的原始數(shù)據(jù),這樣的特征才是好的。選擇降噪白編碼原因是,白編碼學(xué)習(xí)只是對輸入的原始數(shù)據(jù)加以保存,并不能確保從中獲得重要的特征表示;而降噪白編碼器可以通過對輸人數(shù)據(jù)加入噪聲重構(gòu)含有噪聲的輸入數(shù)據(jù)解決該問題。降噪白編碼分為數(shù)據(jù)損壞、編碼和解碼階段。
(1)原始數(shù)據(jù)“損壞”階段。本文給原始數(shù)據(jù)加入15dB的高斯白噪聲,如圖3所示。
(2)編碼階段。對加入高斯噪聲之后的ECG信號進(jìn)行壓縮,編碼階段公式如下:
(3)解碼階段。對進(jìn)行編碼后的ECG信號進(jìn)行解壓,解碼階段公式如下: 2.2 CNN模型
卷積神經(jīng)網(wǎng)絡(luò)是一種特征提取器,其中包含了卷積層和子采樣層。在卷積神經(jīng)網(wǎng)絡(luò)的卷積層中,一個神經(jīng)元只能與很少的部分神經(jīng)元相互連接。CNN權(quán)值共享的特點(diǎn)減少了相應(yīng)的訓(xùn)練參數(shù),相同的權(quán)值可以使濾波器的檢測結(jié)果不受信號位置影響,池化運(yùn)算降低了網(wǎng)絡(luò)的空間分辨率,從而消除了信號的微小偏移和扭曲。對輸入數(shù)據(jù)的平移不變性要求不高,使訓(xùn)練出來的模型具有較強(qiáng)的泛化能力,卷積的矩陣尺寸如式3所示。
其中,w為卷積層的矩陣大小,F(xiàn)為卷積核大小,s為卷積核移動幅度,P為零填充邊界寬度。
2.3 GRU模型
GRU模型是遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,GRU層有更新門和重置門兩個門,相對于RNN而言,GRU可以很好地解決其梯度消失和梯度爆炸問題,因此GRU是對遞歸神經(jīng)網(wǎng)絡(luò)( RNN)的一種改進(jìn)。重置門r可由公式(4)計算得到。
其中,r,是用來計算候選隱藏層的,即前一時刻隱藏層h,中的信息有多少保留在當(dāng)前時刻 ,中;x,為f時刻隱藏層所輸入的心電圖信號,h,1為t時刻前一個時間點(diǎn)輸出的心電圖信號,W為重置門權(quán)值,U為f時刻的前一時刻隱藏層中重置門的權(quán)值。通過公式(5)計算更新門。
z,指前一個時間點(diǎn)隱藏層h,忘記多少信息,候選隱藏層 加入了多少信息。W,為更新門權(quán)值,U.為f時刻的前一個時間更新門權(quán)值,最終輸出結(jié)果通過公式(6)計算得到。其中h見公式(7)。
式中,U為f時刻前一個時間點(diǎn)隱藏層權(quán)重,w為候選隱藏層權(quán)值。GRU不但在訓(xùn)練樣本較少情況下可以防止訓(xùn)練出現(xiàn)過擬合,而且在訓(xùn)練樣本多的時候可以節(jié)省訓(xùn)練時間。
2.4實驗?zāi)P?/p>
本文采用基于降噪白編碼的CNN與GRU結(jié)合的心電分類方法,在編碼階段使用兩層卷積和兩層GRU,在解碼階段僅使用兩層卷積,在一定程度上節(jié)省了很多訓(xùn)練時間,實驗?zāi)P腿鐖D4所示。
3 實驗結(jié)果
通過對MIT-BIH數(shù)據(jù)庫進(jìn)行訓(xùn)練與測試,得到測試集的混淆矩陣如表2所示。
通過混淆矩陣可以算出測試集的準(zhǔn)確率、精確率和靈敏度。準(zhǔn)確率指分類模型中所有判斷正確的結(jié)果占總觀測值的比重;精確率指模型預(yù)測為positive的所有結(jié)果中,模型預(yù)測正確的比重;靈敏度指真實值為positive的所有結(jié)果中,模型預(yù)測正確的比重。由于在MIT-BIH數(shù)據(jù)庫中,類F和Q在數(shù)據(jù)集中的比例非常?。ㄐ∮?%),因此這兩類分類性能對總體性能貢獻(xiàn)不大。另一方面,S類和V類的比例更高(約10%)[19]。這兩類包含了大多數(shù)心律失常,因此把重點(diǎn)放在這兩類上。對比結(jié)果[20]如表3所示。
4 結(jié)語
本文采用基于降噪白編碼的兩層卷積神經(jīng)網(wǎng)絡(luò)和GRU神經(jīng)網(wǎng)絡(luò),不僅提高了心電圖(ECG)信號分類的準(zhǔn)確性和效率,而且采用的兩層卷積神經(jīng)網(wǎng)絡(luò)在一定程度上可以滿足可穿戴設(shè)備應(yīng)用。后續(xù)將從以下幾方面進(jìn)行深入研究:①多導(dǎo)聯(lián)心電數(shù)據(jù)處理;②用可變窗口對心律失常變長進(jìn)行分類;③分析更多導(dǎo)聯(lián)(2-12)的心電信號片段;④在臨床環(huán)境中對提出的方法進(jìn)行測試。
參考文獻(xiàn):
[1]陳學(xué)琴.基于心電圖分析的心率失常分類[D].北京:北京交通大
學(xué),2011.
[2]DEANS. ZANDRA C. Recommended practice for testing and report-ing performance results of rentricular arrhmtmia detection algorithms[c].Arlington:Associatinn Advanc.ement Medical Instrumentation ,1987.
[3]張文輝基于深度學(xué)習(xí)的監(jiān)控視頻車輛實時監(jiān)測[J].軟件導(dǎo)刊,2019,18(7):37-40.
[4]HINTON G E. OSINDERO S Y.A fast learning algorithm for deep he-lief nets[J]. Neural Comput, 2006(18): 1527-1554
[5]朱龍飛,王鵬程.基于深度信念網(wǎng)絡(luò)的腦電信號疲勞檢測系統(tǒng)[J].計算機(jī)測量與控制,2019,27(5):26-29,34
[6]SWIETOJANSKI P, GHOSHAL A. RENALS S.Convolutional neuralnetworks for distant speech recngnition[J].IEEE Signal Process. Lett,2014(21):1120-1124.
[7]崔廣新,李殿奎基于自編碼算法的深度學(xué)習(xí)綜述[J].計算機(jī)系統(tǒng)
應(yīng)用,2018,27(9):47-51.
[8]SCHMIDHUBER J Deep learning in neural networks: An overview[J] Neural lYretw, 2015( 61):85-117.
[9]高碩,許少華.一種集成CNN模型及其在ECG信號分類中的應(yīng)用
[J]軟件導(dǎo)刊,2019. 18(7):24-27.
[lo]]楊鑫,楊晶東基于多分支網(wǎng)絡(luò)的圖像分類算法[J].軟件導(dǎo)刊,
2019.18(7):56-59.
[11]BAI J,WU Y. ZHANG J,et al. Subset based deep learning forRCB-D object recognition[J]. Neurocomputing, 2015(165):280-292
[12]程嘉遠(yuǎn),于小紅.不確定性理論在通信目標(biāo)識別中的應(yīng)用[J]火力與指揮控制,2018,43(8):96-101.
[13]ACHARYA U R. FUJITA H. GERTYCH A. et al. Automated iden- tification of shockable and non-shockahle life-threatening ventricu-lar arrhvthmias using convolu tional neural network[J].Future Gener-ation Computer Svstems, 2018(79): 952-959.
[14]RAJPURKAR P. HANNUNr A. PREPRINT M H. Cardiologist-levelarrh\'thmia detection with convolutional neural netwnrks[DB/OL].https: //aixiv.org/pdf/1707 .01 836.pdf
[15]HE K.ZHANC X. REN S,et al. Deep residual learning for image rec-ognition[EB/OL].https: //blog.csdn.net/wspba/article/details/57074389.
[16]TAN J H. HACIWARA Y. PANG W,et al. Application nf stackedcon,'olutional and long shoit-tPrm memorv network for accurate iden-tification of CAD ECG signals[J]. Computers in Biology and Medi-cine. 2018(94):19-26.
[17] DE CHAZAL P.0'DWYER M,REILLY R B,Automatic classififi-cation of heartheats using ECC morphology and heartbeat interval fea-tures[J].IEEE Transactions on Biome dic al Engineering, 2004(51):1196-1206.
[18]DE CHAZAL P, REILLY R B A patient-adapting heartbeat classifi-fier using ECG morphology and heanbeat interval features[ Jl. IEEETransactions on Binmedical EWineering, 2006(53): 2535-2543.
[19]XL S S,MAK M W.CHEUNG C C Towards end-tr)-end ECG classi-fication with raw signal extraction and deep neural networks[J].IEEE Journal of Biomedical and Health Informatics, 2018(5):287-351
[20]ACHARYA L R, OH S L, HACIWARA Y. et al.A deep convolu-tional neural network model to classifv heartbeats [J]. Computers inBiology and Medicine,2017(89): 389-396.
(責(zé)任編輯:杜能鋼)
收稿日期:2019-07-11
作者簡介:燕婷(1995-),女,山東科技大學(xué)計算機(jī)科學(xué)與工程學(xué)院碩士研究生,研究方向為人工智能。