王 婷,石 藍(lán),黃 瑋,張子辰
(江蘇信息職業(yè)技術(shù)學(xué)院,江蘇 無錫 214000)
癲癇是一種常見的神經(jīng)系統(tǒng)疾病。目前,被癲癇疾病影響的人數(shù)全球超過5 000萬人[1]。頭皮電極獲得的腦電圖(EEG)、磁共振成像和計(jì)算機(jī)斷層掃描等影像技術(shù)結(jié)合使用,是癲癇診斷的常規(guī)方式[2]。在傳統(tǒng)的癲癇檢測中,醫(yī)學(xué)專家觀察腦電圖是否包含癲癇特征波,這種方法不僅耗時(shí),而且高度主觀依賴經(jīng)驗(yàn)。腦電圖中存在的大量噪聲可能會(huì)干擾專家的判斷。設(shè)計(jì)腦電的可穿戴式檢測芯片的算法,可以自動(dòng)檢測患者的癲癇發(fā)作情況,從而高效地協(xié)助醫(yī)生進(jìn)行診斷。
在癲癇信號(hào)特征提取階段,為了達(dá)到良好的特征區(qū)分和數(shù)據(jù)降維效果,國內(nèi)外已經(jīng)進(jìn)行了多種提取方式的探索?;诮?jīng)驗(yàn)?zāi)B(tài)分解的變分模態(tài)分解主要思想是將信號(hào)分解為圍繞各中心頻率附近變化的窄帶變分模態(tài)分量,通過尋找約束變分模型的最優(yōu)解來自適應(yīng)獲取變分模態(tài)函數(shù)(VMF)。發(fā)作期腦電的不確定度會(huì)明顯降低,出現(xiàn)了許多與熵(En)有關(guān)的腦電特征提取研究方法,主要包括近似熵、樣本熵、模糊熵[3-4]。精細(xì)復(fù)合多尺度散布熵是在散布熵的基礎(chǔ)上對(duì)信號(hào)進(jìn)行多尺度量化得到的,避免了原始散布熵因僅在單一尺度上處理信號(hào)而出現(xiàn)的復(fù)雜性導(dǎo)致特征提取不完全等問題[5]。
雖然已有許多特征提取方法和分類方法運(yùn)用于癲癇檢測中,但大多是針對(duì)癲癇發(fā)作期腦電與正常腦電的二分類。而對(duì)于癲癇患者不發(fā)作時(shí)進(jìn)行的檢測也是有必要的,即發(fā)作間期的檢測。發(fā)作期間的腦電圖通常也可見異常的癲癇樣放電。因此,本文主要研究正常時(shí)期、發(fā)作間期與癲癇發(fā)作期3類腦電信號(hào)的檢測。發(fā)作間期的腦電圖部分由慢波化組成,若基本節(jié)律中混有較多的慢波,則形成不規(guī)則的腦電圖。針對(duì)發(fā)作間期的背景節(jié)律性特點(diǎn),本文提出一種基于變分模態(tài)分解的癲癇檢測算法。EEG信號(hào)經(jīng)VMD分解后獲得變化中心頻率的VMF,對(duì)VMF進(jìn)行能量分離,加強(qiáng)慢波、棘波等特征,再二次提取其均值、方差和RCMDE 3種特征,并利用隨機(jī)森林對(duì)其進(jìn)行分類,完成了正常腦電信號(hào)、發(fā)作間期與癲癇發(fā)作期的3分類。通過與文獻(xiàn)方法對(duì)比,本研究驗(yàn)證了該方法提取EEG信號(hào)的有效性。
圖1為本文提出的基于變分模態(tài)分解的癲癇腦電信號(hào)檢測算法的流程圖。本方法包括如下4個(gè)步驟:(1)對(duì)腦電信號(hào)數(shù)據(jù)集進(jìn)行VMD分解,分解為有不同中心頻率和帶限的固有模式函數(shù)多個(gè)子模態(tài);(2)對(duì)子模態(tài)進(jìn)行能量分離,增強(qiáng)信號(hào)瞬態(tài)沖擊成分;(3)經(jīng)過能量分離后的信號(hào)二次特征提取其均值、方差和RCMDE;(4)將提取的特征輸入隨機(jī)森林進(jìn)行分類。
圖1 癲癇檢測流程
變分模態(tài)分解是自適應(yīng)、完全非遞歸的數(shù)據(jù)處理方法。它是根據(jù)當(dāng)前數(shù)據(jù)來確定信號(hào)序列的模態(tài)分解個(gè)數(shù),可以自適應(yīng)對(duì)每種模態(tài)的最佳中心頻率和有限帶寬進(jìn)行變化,有效地對(duì)固有模態(tài)分量進(jìn)行分解。它的核心思想是構(gòu)建和求解變分問題。由于EEG測試時(shí)間以及被測樣本的不同,各頻帶段中心頻率也會(huì)發(fā)生小范圍的改變,VMD并不是固定的中心頻率,而是將EEG信號(hào)分解成在中心頻率附近的變分模態(tài)分量,不斷迭代的中心頻率可以良好表達(dá)這種神經(jīng)活動(dòng)的輕微變化。VMD 算法中懲罰因子可以保證高斯噪聲環(huán)境下信號(hào)重構(gòu)的準(zhǔn)確性,其值過大會(huì)引起模態(tài)重疊,較小會(huì)引入噪聲,默認(rèn)將其設(shè)定為2 000。分解模態(tài)個(gè)數(shù)K對(duì)序列分解和預(yù)測精度都有較大影響,若K值過大會(huì)造成過分解,產(chǎn)生無用分量,高頻模式過多,增加計(jì)算復(fù)雜度。若 K 值過小,序列將不會(huì)完全分解,使部分帶限信號(hào)分解不出來造成原信號(hào)信息的丟失,進(jìn)而影響分析結(jié)果。腦電信號(hào)的癲癇異常信息大多在25 Hz以下,根據(jù)中心頻率觀察法選取分解模態(tài)個(gè)數(shù)K=4。對(duì)數(shù)據(jù)集A010、D010、E010前1 000個(gè)數(shù)據(jù)進(jìn)行VMD分解,癲癇信號(hào)特征波主要集中出現(xiàn)在子頻帶 VMF2~VMF4內(nèi)。故在后續(xù)的特征提取工作中,僅分析 VMF2~VMF4頻帶內(nèi)的腦電信號(hào)。
Teager能量算子是一個(gè)非線性算子,可以對(duì)被測信號(hào)相鄰的3個(gè)采樣點(diǎn)進(jìn)行計(jì)算,具備優(yōu)良的時(shí)間分辨率,計(jì)算過程簡單快速,能夠增大癲癇波特征頻率的倍數(shù)。對(duì)正常腦電信號(hào)數(shù)據(jù)集中的A010、癲癇發(fā)作間期D010 以及癲癇發(fā)作期E010 經(jīng)VMD分解后,將VMF2~VMF4 頻帶信號(hào)進(jìn)行Teager 非線性能量算子計(jì)算后,正常腦電信號(hào)的Teager能量較為平緩,在0~700 μA范圍內(nèi)波動(dòng)。癲癇發(fā)作間期,腦電信號(hào)的間歇性突增最高達(dá)7 000 μA。癲癇發(fā)作期時(shí),能量在棘波處波動(dòng)非常劇烈,可達(dá)2×105μA。經(jīng)過Teager能量分離后,3種EEG信號(hào)的特征更加明顯,其中每組信號(hào)的四頻帶信號(hào)最為敏感,所以只選取正常EEG、發(fā)作間期EEG、發(fā)作期EEG的四頻帶的能量作為后續(xù)二次特征提取。
根據(jù)以上分析,信號(hào)經(jīng)能量分離后的四頻帶能量包含腦電信息的重要組成部分,接下來將對(duì)四頻帶能量進(jìn)行二次特征提取,分別提取均值、方差與精細(xì)復(fù)合多尺度散布熵。RCMDE用來表征TEOV4時(shí)間序列的復(fù)雜性,人腦非致癇區(qū)域的神經(jīng)活動(dòng)相對(duì)致癇區(qū)域更活躍,通過RCMDE可以更好地觀測EEG的規(guī)則性和組織性,計(jì)算 RCMDE 需要對(duì)4個(gè)參數(shù)分別設(shè)置:類別個(gè)數(shù)c,嵌入維度m,時(shí)間延遲d以及尺度因子τ。類別個(gè)數(shù)c若過大會(huì)導(dǎo)致具有較大差異的兩個(gè)量被歸為同一類,過小則導(dǎo)致具有較小差異的兩個(gè)量被歸為不同類,此處將c值設(shè)為 6。對(duì)于嵌入維度m,為了保證統(tǒng)計(jì)可靠性,將m值設(shè)為 3。時(shí)間延遲d一般取 1,本文尺度因子τ設(shè)為 10,即每個(gè)數(shù)據(jù)段提取10個(gè)尺度上的 RCMDE 值。利用RCMDE計(jì)算能量算子結(jié)果如圖2所示。
圖2 不同EEG的RCMDE
患者在癲癇發(fā)作期間產(chǎn)生的棘波和尖波等波形具有節(jié)律性,在0~10時(shí)間尺度上,正常EEG的RCMDE都要大于癲癇患者EEG的RCMDE,發(fā)作間期的腦電信號(hào)幅值變化最小。在腦電圖中的潛在的腦電模式未知的情況下,相關(guān)的時(shí)間尺度也是未知的。通過RCMDE將腦電信號(hào)擴(kuò)展到10個(gè)時(shí)間尺度,有利于在時(shí)間尺度未知時(shí)提供特殊的觀察視角。有可能某一時(shí)間尺度上,正常腦電信號(hào)的熵值與癲癇信號(hào)的熵值接近,但在其他時(shí)間尺度則會(huì)有明顯差別。RCMDE可以增加癲癇判斷容錯(cuò)率,進(jìn)一步利于構(gòu)建后續(xù)腦電信號(hào)分類模型。
隨機(jī)森林算法(Random Forest,RF)基本單元是決策樹。每棵樹都可以視為單個(gè)分類器,分類輸出由所有決策樹投票。RF通過自助抽樣和隨機(jī)子空間,能夠?qū)Χ嗑S度、多特征的數(shù)據(jù)進(jìn)行快速分析以及提高分類性能,將提取的三維特征作為隨機(jī)森林輸入,首先假設(shè)N為訓(xùn)練集中的事例數(shù),則從訓(xùn)練集中隨機(jī)抽取N個(gè)樣本,有放回在每個(gè)樣本過程和獲取的N個(gè)訓(xùn)練樣本中。從m個(gè)特征變量中隨機(jī)等概率抽取d個(gè)子變量,這些子變量組成此節(jié)點(diǎn)的分裂特征變量子集,然后利用基尼系數(shù)值最小原則選擇一個(gè)最優(yōu)的分裂特征變量繼續(xù)對(duì)該節(jié)點(diǎn)分裂,建立多個(gè)決策樹組合為隨機(jī)森林。針對(duì)測試的數(shù)據(jù)集,每個(gè)決策樹都會(huì)得到一個(gè)分類結(jié)果,對(duì)這些結(jié)果進(jìn)行投票表決,得票數(shù)最多的分類結(jié)果為最終決策。
實(shí)驗(yàn)數(shù)據(jù)來自德國Born癲癇腦電研究室。此數(shù)據(jù)集中共包含標(biāo)號(hào)從 A~E的 5個(gè)子數(shù)據(jù)集,每個(gè)子數(shù)據(jù)集均包括100個(gè)腦電信號(hào)。每個(gè)腦電信號(hào)的長度為 23.6 s,采樣頻率為 173.6 Hz。
由于EEG是非線性和非穩(wěn)態(tài)的信號(hào),傳統(tǒng)的頻域分析方法只能揭示EEG信號(hào)的整體特征。而癲癇的特征波可能會(huì)在瞬間出現(xiàn)。為了捕捉腦電信號(hào)的瞬時(shí)行為,本研究通過使用VMD將原始EEG信號(hào)分解為4個(gè)數(shù)量的子模態(tài)。子模態(tài)中的癲癇特征信息此時(shí)仍然受背景噪聲的干擾,沖擊成分不明顯,采用能量分離對(duì)癲癇特征起到增強(qiáng)的作用。為了減少運(yùn)算,本研究選擇最敏感的能量分布TEOV4作為后續(xù)提取特征。在TEOV4中提取均值、方差和RCMDE3類數(shù)據(jù)特征作為后續(xù)隨機(jī)森林的分類特征。隨機(jī)森林的分類性能與決策樹的數(shù)量有關(guān),當(dāng)樹的數(shù)量少于100棵時(shí),誤差會(huì)迅速減少,而當(dāng)樹的數(shù)量大于250棵時(shí),誤差會(huì)保持溫和的浮動(dòng)。因此,在接下來的實(shí)驗(yàn)中,隨機(jī)森林的決策樹數(shù)量被設(shè)定為250棵。
在腦電信號(hào)數(shù)據(jù)集中,隨機(jī)抽取70%的腦電信號(hào)作為訓(xùn)練集,30%作為測試集,隨機(jī)森林中包含250棵決策樹。表1顯示了分類器的準(zhǔn)確度 (ACC)、靈敏度 (SEN)和特異性 (SPE)3個(gè)評(píng)價(jià)指標(biāo)。
表1 與其他算法結(jié)果對(duì)比
本文針對(duì)正常EEG、發(fā)作間期EEG、發(fā)作期EEG進(jìn)行三分類,而表中兩種算法是針對(duì)發(fā)病與非發(fā)病的二分類研究。Acharya 等[6]采用熵等23個(gè)特征進(jìn)行腦電分類獲得87.93%準(zhǔn)確度,Bhattacharyya 等[7]基于可調(diào)Q小波變換提取多元模糊熵方法對(duì)腦電信號(hào)處理獲得了84.67%準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明,本文算法在ACC、SEN、SPE都在一定程度有所提升,證明該方法對(duì)于腦電信號(hào)分析具有可行性。
由于用癲癇腦電記錄進(jìn)行人工診斷是一種低效的方式,本文提出了一種基于變分模態(tài)分解的癲癇腦電信號(hào)可穿戴芯片的檢測算法。應(yīng)用能量分離,對(duì)VMD分解后的信號(hào)序列進(jìn)行特征信息增強(qiáng),從中提取均值、方差和RCMDE 3種特征,并通過隨機(jī)森林進(jìn)行自動(dòng)預(yù)測,分類了正常時(shí)期、發(fā)作間期與癲癇發(fā)作期3類腦電信號(hào)。實(shí)驗(yàn)結(jié)果顯示本文所提出的方法分類準(zhǔn)確度90.78%,可以輔助臨床醫(yī)生進(jìn)行診斷,具備潛在臨床應(yīng)用價(jià)值。