胡峻峰,曹 軍
(東北林業(yè)大學機電工程學院,哈爾濱 150040)
如果將正常竇性心律或者室性心動過速(Ventricular Tachycardia,VT)[1]誤診為心室纖顫[2](Ventricular Fibrillation,VF),病人的心臟將會受到不必要的損傷。相反,如果將VF誤診為VT,結(jié)果可能是致命的,這使得VF和VT的正確檢測是非常重要的。
目前許多采用不同檢測方法的VF自動檢測系統(tǒng),包括時域分析[3]、頻域分析[4]、神經(jīng)網(wǎng)絡(luò)[5]、小波分析[6]和非線性分析[7],大多研究者選擇時域分析方法,因為該方法相對簡單。時域分析包含自相關(guān)函數(shù)(Auto Correlation Function,ACF)[3]、越限區(qū)間(Threshold-crossing Interval,TCI)[3]、時延方法[3]和越限樣本計數(shù)(Threshold-crossing Sample Count,TCSC)[3],通常采用功率譜分析,通過觀察VF信號的功率譜將VF信號特征化,頻譜據(jù)范圍為4 Hz~7 Hz。其他采用頻域分析的方法包括改進振幅分布分析(Mended Amplitude Distribution Analysis,MADA)[8]和多重分形頻譜分析(Multifractal Spectrum Analysis,MSA)[9]。隨著神經(jīng)計算領(lǐng)域的迅速發(fā)展,學者將人工神經(jīng)網(wǎng)絡(luò)應(yīng)用到VF信號檢測中,該技術(shù)可解決類與類之間的非線性區(qū)分問題[10]。小波轉(zhuǎn)換[11]和非線性分析[12]也已應(yīng)用到檢測和區(qū)分VF信號中。雖然這些方法中一部分很有前景,特別在它們的敏感度和專業(yè)性方面仍有很大的提升空間,但它們僅可以區(qū)分正常竇性節(jié)律和VF,而不能很好地區(qū)分VT[13-14]。
綜上所述,必須合理地分類與識別VF和VT才能避免不必要的損害,因此,本文提出了一種語義挖掘(Semantic Mining,SM)方法,通過提取頻率、衰減系數(shù)和輸入信號等信息來特征化VT和VF。
原始心電圖(Electrocardiogram,ECG)[15]信號通常含有噪聲,會影響某些ECG識別系統(tǒng)識別ECG信號模式的能力。ECG噪聲包括肌肉噪聲、電極運動引起的人造噪聲、電源線干擾噪聲和基線漂移。另外擁有與量子共振檢測儀(Quantum Resonance Spectrometer,QRS)[6]復體相同的高頻特征T波可能也影響ECG識別系統(tǒng)的性能。因此,需要一個濾波處理來克服這些問題。本文將文獻[4]中的濾波處理稍加改進,首先選擇通頻帶為1 Hz~30 Hz的巴特沃斯帶通濾波器對ECG信號進行濾波[4],并將濾波過的ECG信號分割為4-s ECG,接著將分割的4-s ECG正則化為段中的最大絕對值,最后將正則化ECG信號轉(zhuǎn)化為二進制脈沖0-1。
語義挖掘通過模擬語義概念的表現(xiàn)模式來描述一個系統(tǒng)的振蕩行為,相反,模擬由語義概念產(chǎn)生的系統(tǒng)輸出不僅決定語義的概念值,還決定精確的參數(shù)值,該參數(shù)值決定了它們的表現(xiàn)性能,式(1)展示了它們的關(guān)聯(lián)性:
其中,ω是自然頻率;ζ是阻尼系數(shù);u是心臟振動系統(tǒng)的輸入?yún)?shù);x是由式(2)中的ECG二進制分解獲得的二進制脈沖。ω,ζ,u這3個參數(shù)可能是常數(shù)、變量或者可能動態(tài)變化。文獻[7]通過消除這3個參數(shù)(ω,ζ,u)為模式識別結(jié)構(gòu),提出了3種單獨的算法組成一個語義挖掘算法。所提方法采用第3種算法,因為當提取的參數(shù)是變量且系統(tǒng)擁有二階動態(tài)特征時,它能更好地預(yù)測ω和u。
采用第3種算法,時刻1到時刻4衍生了一個單點,分別表示為x',x'',x''',x'''',給出二階系統(tǒng):
采用這些提取的參數(shù)(由式(6)~式(8)獲得),每個參數(shù)的平均振幅可計算出。分析這些平均振幅可以確定N,VT,VF發(fā)作之間的顯著區(qū)別,圖1顯示了包括采用語義挖掘算法特征化N,VT,VF的處理流程。
圖1 檢測算法處理流程
正常竇性節(jié)律的ECG信號、VT和VF由MIT cudb(克瑞頓大學室性心律失常數(shù)據(jù)庫)[9]獲得,該數(shù)據(jù)庫是大型的通用在線識別數(shù)據(jù)庫。本文研究使用100例正常竇性節(jié)律(N)發(fā)作,100例室性心動過速信號(VT)和100例心室纖顫從該數(shù)據(jù)庫選出。N發(fā)作從每個ECG記錄中選出,該記錄包含VT或VF發(fā)作。這些發(fā)作病例是由數(shù)據(jù)庫提供的一個合格心臟病學家的注釋進行選擇,每次發(fā)作時間為4 s。
圖2為ECG信號的實例。正常竇性節(jié)律的ECG由相同的P波、QRS復體和T波組成,同時帶有規(guī)則的節(jié)奏(圖2(a)),但是在室性心動過速ECG中,沒有發(fā)現(xiàn)P波,QRS復體是廣泛且不規(guī)則的(圖2(b)),同時節(jié)奏有時是規(guī)則的,有時是不規(guī)則的,心室纖顫ECG沒有P波和QRS復體,節(jié)奏是混亂的(圖2(c))。
圖2 采用ECG信號的實例
圖3表明了針對每種類型的ECG發(fā)作的語義挖掘算法的步驟,首先對原始ECG信號應(yīng)用濾波器處理來消除噪聲,去除噪聲后,將ECG標準化為段中長達4 s且值為最大的小段,接著采用式(2)將標準化的ECG信號轉(zhuǎn)化為二進制脈沖(0-1),最后在這些來自ECG信號的二進制脈沖上實施語義挖掘,采用式(6)~式(8)提取出3個參數(shù)(ω,ζ,u)。將每個參數(shù)的平均振幅計算出,對其分析從而識別出N,VT和VF發(fā)作之間的顯著區(qū)別。
圖3 N發(fā)作分析的語義挖掘算法
本文采用單因素模型的方差分析(Analysis of Variance,ANOVA)表進行統(tǒng)計分析,以確定由N,VT,VF提取的每個參數(shù)(ω,ζ,u)的概率分布,ANOVA顯示自然頻率(ω)、輸入?yún)?shù)(μ)的平均振幅和標準偏差,ω和u分別表明當F2299=690.47,P <0.001和F2299=1795.11,P<0.001時,N,VT,VF之間的顯著差別。
實驗僅考慮T測試分析中的ω和u,因為ζ沒有顯示出不同ECG發(fā)作間的明顯區(qū)別,ECG發(fā)作的正常頻率(ω)參數(shù)平均振幅設(shè)置固體水平線的2個閾值:高(t1=0.34)、低(t2=0.175)。ECG發(fā)作輸入?yún)?shù)(u)平均振幅設(shè)置固體水平線的2個閾值:高(t3=0.335)、低(t4=0.20)。其中,300例ECG發(fā)作中每種類型的ECG信號:N,VT和VF各100例。
分析ECG發(fā)作的輸入?yún)?shù)(ω)的平均振幅可知,參數(shù)ω的平均樣本明顯不同于N和VT發(fā)作(P<0.001),N發(fā)作(0.11±0.003)的平均振幅明顯低于VT發(fā)作(0.40±0.005)的。平均振幅的不同是明顯的(P<0.001),其中,VF 發(fā)作(0.30±0.008)的平均振幅明顯低于N發(fā)作(0.11±0.008)。VT和VF發(fā)作間的顯著區(qū)別發(fā)現(xiàn)(P<0.001),VT 發(fā)作(0.40±0.005)的平均振幅稍微高于VF發(fā)作(0.30±0.008)的平均振幅。
分析ECG發(fā)作的輸入?yún)?shù)(u)的平均振幅可知,通過設(shè)定2個閾值 t3=0.335和t4=0.20,任何平均振幅低于t4的ECG發(fā)作將會分類為N;一個平均振幅在t3和t4之間的ECG發(fā)作將會歸類為VT,該歸類通過統(tǒng)計分析采用T測試驗證(表1),其中,數(shù)據(jù)的形式是均值±標準差。平均ω值的顯著區(qū)別在N和VT發(fā)作(P<0.001)、N和VF發(fā)作(P<0.001)和VT和VF發(fā)作(P<0.001)之間發(fā)現(xiàn),VT發(fā)作(0.37±0.004)的平均振幅在3種ECG中是最高的,接著是VF發(fā)作(0.30±0.004)和N 發(fā)作(0.08±0.003)。
表1 不同類型ECG信號的平均振幅分布
用來對ECG發(fā)作(N,VT,VF)進行分類的所提算法的性能由靈敏度(Se)和專一性(Sp)來衡量,定義如下:
其中,TP是真陽性的;TN是真陰性;FN是假陰性;FP是假陽性。如如果集中計算正常節(jié)奏的Se和Sp,將TP定義為非正常節(jié)奏,它可正確地特征化為非正常節(jié)奏,將TN定義為正常節(jié)奏,它可正確地特征化為正常節(jié)奏,將FN定義為非正常節(jié)奏,它可錯誤地特征化為正常節(jié)奏,將FP定義為正常節(jié)奏,它可錯誤地特征化為非正常節(jié)奏。這些參數(shù)對于VT到非VT和VF到非VF都很適用。
實驗采用300個ECG發(fā)作用來進行訓練、驗證和測試以評估語義挖掘(SM)檢測技術(shù)。將這300個 ECG發(fā)作中 的180個分配到訓練階段(58個N發(fā)作,62個VT發(fā)作和60個VF發(fā)作),另外60個發(fā)作分配到驗證階段(20個N發(fā)作,21個VT發(fā)作和19個VF發(fā)作),剩下的60個發(fā)作分配到測試階段(22個N發(fā)作,17個VT發(fā)作和21個VF發(fā)作)。圖4顯示了混淆矩陣,總結(jié)了SM算法的結(jié)果。
圖4 語義挖掘算法的混淆矩陣
從圖4(a)的訓練混淆矩陣可以看出,58個發(fā)作都特征化為N,產(chǎn)生了100%的靈敏度。
從圖4(b)的驗證混淆矩陣可以看出,VT中的2個發(fā)作錯誤的特征化為VF,4個VF發(fā)作錯誤的分類為VT,產(chǎn)生了96.8%(60/62正確的識別為VT)的靈敏度。
從圖4(c)的測試混淆矩陣可以看出,沒有發(fā)現(xiàn)錯誤的N類型ECG發(fā)作的檢測,對于N發(fā)作,產(chǎn)生了100%的靈敏度,對于VT發(fā)作,產(chǎn)生了94.1%(16/17正確識別為VT)的靈敏度,對于VF發(fā)作,產(chǎn)生了95.2%(20/21正確識別為VF)的靈敏度。
因此,本文算法可以完全區(qū)分開N發(fā)作和VT,VF發(fā)作而沒有任何錯誤檢測,同時可以區(qū)分VF和非VF發(fā)作(N和VT),靈敏度和專一性分別為95.2%(20/21正確識別為VF)和97.4%(38/39正確識別為非VF)。
為了更好地評估算法的性能,將本文的SM技術(shù)與以前的算法比較,包括相空間重構(gòu)(Phase Space Reconstruction,PSR)[3],越限樣本計數(shù)(Threshold-crossing Sample Count,TCSC)[4],K近鄰規(guī)則[11]和多重分形奇異譜(Multifractal Singularity Spectrum,MSS)[6],選擇這4種技術(shù)是因為它們有較高的靈敏度和專一性值。選擇靈敏度和專一性作為比較特征是因為靈敏度說明了該技術(shù)在對ECG正確分類上有好的表現(xiàn)(N發(fā)作正確地檢測為N,VT發(fā)作正確地分類為VT,VF發(fā)作正確地特征化為VF),同時專一性揭示了該技術(shù)在檢測一個信號的特征出現(xiàn)的性能。也就是說,該技術(shù)可以描述一個VF發(fā)作是否可以分類為既不是N又不是VT,反之亦然。
表2比較了提出SM技術(shù)的VF和非VF分類和通過其他方法獲得的靈敏度和專一性。MSS技術(shù)相對于其他4種方法產(chǎn)生了最高的專一性和靈敏度(99%),接著就是提出的SM和K近鄰技術(shù),它產(chǎn)生了稍低的專一性和靈敏度值。雖然MSS的專一性和靈敏度是最高的,但是MSS相對于SM使用了較長的ECG發(fā)作進行分析(5 s與4 s)。相同的結(jié)果在K近鄰技術(shù)中發(fā)現(xiàn),它們使用了更長的持續(xù)8 s的ECG發(fā)作。一個持續(xù)更長時間的分析可能提高檢測精度,但是因為VF是可致命的,它必須快速檢測,較長的信號可能不合理,該分析必須在來自短時間數(shù)據(jù)下高效地運行。表2表明,采用語義挖掘的提出方法不僅有高靈敏度和專一性,同時相對于其他4種分析的方法需要更短的發(fā)作持續(xù)時間。
表2 語義挖掘方法和其他方法的對比
針對現(xiàn)有的診斷系統(tǒng)較難準確區(qū)分室性心動過速(VT)和心室纖顫(VF)的問題,本文提出了一種檢測室性心動過速和心室纖顫的語義挖掘方法,通過采用語義挖掘來提取ECG信號的顯著特征,并利用提取的特征將ECG信號分為N,VT和VF 3類。實驗結(jié)果表明,本文提出的語義挖掘方法具有識別ECG模式的能力,可以準確區(qū)分N,VT和VF。此外,與其他已有的方法相比,本文所提方法計算高效,非常適用于實時完成任務(wù)。下一步將本文所提的語義挖掘方法用于其他領(lǐng)域,通過改變初始參數(shù)的設(shè)置,進一步提高檢測效率。
[1]周賢惠,何 莉,湯寶鵬,等.三維電解剖指導右心室流出道特發(fā)性室性心動過速的導管消融[J].中國介入心臟病學雜志,2011,19(1):15-21.
[2]謝佳興,王 俊.基于多重分形去趨勢漲落的心室纖顫和心動過速分析[J].北京生物醫(yī)學工程,2011,30(5):490-496.
[3]Amann A,Tratnig R,Unterkofler K.Detecting Ventricular Fibrillation by Time-delay Methods[J].IEEE Transactions on Biomedical Engineering,2009,54(2):174-177.
[4]Arafat M A,Chowdhury A W,Hasan M K.A Simple Time Domain Algorithm for Detection of Ventricular Fibrillation in Electrocardiogram[J].Signal Image&Video Processing,2009,23(3):221-228.
[5]Fokkenrood S,Leijdekkers P,Gay V.Ventricular Tachycardia/Fibrillation Detection Algorithm for 24/7 Personal Wireless Heart Monitoring[C]//Proceedings of the 5th International Conference on Smart Homes and Health Telematics.[S.1.]:IEEE Press,2010:110-120.
[6]Wang Gang,Huang Hai,Xie Hongbo.Multifractal Analysis of Ventricular Fibrillation and Ventricular Tachycardia[J].Medical Engineering&Physics,2009,29(2):375-379.
[7]Abbas R,Aziz W,Arif M.Prediction of Ventricular Tachyarrhythmiain ECG Using Neuro-wavelet Approach[J].Emerging Technologies,2012,34(5):82-87.
[8]劉亞楠,吳 飛,莊越挺.基于多模態(tài)子空間相關(guān)性傳遞的視頻語義挖掘[J].計算機研究與發(fā)展,2009,46(1):1-8.
[9]Jekova I,Dushanova J,Popivanov D.Method for Ventricular Fibrillation in the External Electrocardiogram Using Nonlinear Prediction,Institute of Physics Publishing[J].Physiological Measurement,2012,33(2):337-345.
[10]Sun Y,Chan K L,Krishnan S M.Life-threatening Ventricular Arrhythmia Recognition by Nonlinear Descriptor[J].Biomedical Engineering Online,2010,29(2):503-511.
[11]劉婷婷,林 琿,代漢青.利用SVM相關(guān)反饋和語義挖掘的遙感影像檢索[J].武漢大學學報:信息科學版,2012,37(4):203-210.
[12]Arafat M A,Sieed J,Hasan M K.Detection of Ventricular Fibrillation Using Empirical Mode Decomposition and Bayes Decision Theory[J].Computers in Biology and Medicine,2009,39(2):1051-1057.
[13]Othman M A,Safri N M.Characterization of Ventricular Arrhythmias in Electrocardiogram Signal Using Semantic Mining Algorithm[J].Analytical Modelling and Computer Simulation,2010,31(3):307-311.
[14]Othman M A,Safri N M.Characterization of Ventricular Arrhythmias Using Semantic Mining Algorithm[J].Journal of Mechanics in Medicine and Biology,2012,12(1):1-11.
[15]楊 偉,朱燦焰.基于混沌系統(tǒng)的心電圖信號分類檢測方法[J].通信技術(shù),2011,44(2):125-128.