韋曉燕,周霖,周毅△
(1. 中山大學(xué)中山醫(yī)學(xué)院,廣州 510080; 2. 中山大學(xué) 數(shù)據(jù)科學(xué)與計(jì)算機(jī)學(xué)院,廣州 510006)
癲癇是一種由于大腦異常同步放電且具有連續(xù)發(fā)作特征的慢性疾病,藥物治療和手術(shù)切除是主要的治療形式,其發(fā)作往往具有不可預(yù)測性,給患者造成帶來極大的心理壓力與工作生活困難[1]。1970s年學(xué)者發(fā)現(xiàn)癲癇發(fā)作前一段時(shí)間信號(hào)表現(xiàn)出不同程度的顯著變化,通過量化腦電(electroencephalography, EEG)變化能夠提前預(yù)測癲癇發(fā)作以便提供臨床治療[2]。2013年發(fā)表于《柳葉刀神經(jīng)病學(xué)》的開創(chuàng)性研究表明預(yù)測癲癇發(fā)作具有可行性[3]。關(guān)于癲癇預(yù)測的研究接踵而至,但統(tǒng)計(jì)驗(yàn)證和可重復(fù)性實(shí)驗(yàn)缺乏[4]。
到目前為止,癲癇發(fā)作研究眾多,但沒有專門致力算法預(yù)測框架的整體方法論。我們從癲癇發(fā)作預(yù)測基本原則出發(fā),聚焦于EEG數(shù)據(jù)的單變量和多變量特征提取,考慮預(yù)測模型以及性能評(píng)價(jià)。
癲癇發(fā)作預(yù)測在于檢測癲癇發(fā)作前的信號(hào)特征變化。大量研究發(fā)現(xiàn),在發(fā)作間期和發(fā)作期之間存在一個(gè)過渡期,稱為癲癇發(fā)作前期。因此,癲癇發(fā)作的預(yù)測可以被視為發(fā)作前期的早期檢測[5]。圖1給出了癲癇發(fā)作過程不同時(shí)期的過渡。
圖1EEG癲癇發(fā)作過程
Fig1TransformationofepilepticseizuresofEEG
癲癇預(yù)測的研究通過數(shù)據(jù)預(yù)處理,接著提取不同特征指標(biāo)顯示癲癇發(fā)作前期的變化,通過閾值-分類方法進(jìn)而預(yù)測,最后評(píng)估算法。如圖2所示,以一種方法論的方式回顧基于算法的研究。
圖2癲癇預(yù)測框架流程圖
Fig2Frameworkofepilepticprediction
2.2.1數(shù)據(jù)獲取 數(shù)據(jù)形式和公共數(shù)據(jù)集
腦電信號(hào)記錄的形式多種多樣,包括頭皮腦電(scalp EEG,EEG),顱內(nèi)腦電(intracranial EEG , iEEG),功能磁共振成像等,以EEG為主。但數(shù)據(jù)樣本少,制約了評(píng)估算法的性能[6]。用Kendall’s tau系數(shù)表示癲癇發(fā)作的敏感度與發(fā)作次數(shù)和平均記錄時(shí)間具有統(tǒng)計(jì)學(xué)意義的關(guān)聯(lián)性,提出需要連續(xù)長期EEG記錄評(píng)估算法性能。近年來網(wǎng)絡(luò)公共數(shù)據(jù)庫開始出現(xiàn)[7-8],見表1。相關(guān)研究[9]已經(jīng)開始采用便攜式腦電儀采集數(shù)據(jù)。
2.2.2信號(hào)預(yù)處理 (1)去噪和過濾
高效算法的實(shí)現(xiàn)得益于高質(zhì)量數(shù)據(jù)的獲取。初期需要人工刪除壞段,進(jìn)行目視檢驗(yàn)。根據(jù)腦電信息濾波器范圍一般維持在0.3~35 Hz左右。同時(shí)在腦電記錄過程中因外部因素引起信號(hào)偽跡。常使用偽跡減法、小波變換、獨(dú)立分量分析和經(jīng)驗(yàn)?zāi)J椒纸獾热コ齻污E[10-11]。
表1網(wǎng)絡(luò)癲癇公共數(shù)據(jù)集
Table 1 Web-based seizure prediction databases
(2)數(shù)據(jù)分段
由于腦電信號(hào)是非平穩(wěn)數(shù)據(jù),窗口時(shí)間應(yīng)保證數(shù)據(jù)的平穩(wěn)性,包括重疊滑動(dòng)窗和非重疊滑動(dòng)窗[12]。其中重疊滑動(dòng)窗口可以保證數(shù)據(jù)的連續(xù)性,但易造成信息冗余,因此多采用非重疊滑動(dòng)窗口。一般情況下由神經(jīng)電生理專家指導(dǎo)確定,累積經(jīng)驗(yàn)發(fā)現(xiàn)其時(shí)間窗口設(shè)置在5~60 s不等[13]。
(3)發(fā)作前期確定
25年前癲癇發(fā)作預(yù)測時(shí)間的可行性調(diào)查就已開始,但至今沒有標(biāo)準(zhǔn)。Teixeiera等人[14]測試了278位患者數(shù)據(jù),分別設(shè)定10, 20, 30,40 min發(fā)作前期,發(fā)現(xiàn)設(shè)置更長的發(fā)作前期時(shí)間預(yù)測錯(cuò)誤率顯著地降低,其中最優(yōu)預(yù)測為30.47 min。Bandarabadi等人[15]使用振幅發(fā)布直方圖確定分界點(diǎn)。設(shè)置發(fā)作前5~180 min,最佳預(yù)測在44.3 min。與之相反的是Moghim[16]提出0~20 min發(fā)作時(shí)間可變方法,發(fā)現(xiàn)針對(duì)同一患者其發(fā)作前期設(shè)定也有不同。對(duì)于發(fā)作前期時(shí)間的設(shè)定需要經(jīng)過大量實(shí)驗(yàn)摸索得到,缺乏統(tǒng)計(jì)驗(yàn)證。
2.2.3特征提取 衡量癲癇腦電活動(dòng)的特征指標(biāo)見圖3。從特征提取從變量和方法學(xué)角度出發(fā),可以分為單變量線性提取,單變量非線性提取,多變量線性提取,多變量非線性提取[17]。
(1) 單變量線性度量
早期的癲癇特征提取是基于信號(hào)最基本的特征屬性在時(shí)域、頻域、時(shí)頻方向進(jìn)行刻畫。在時(shí)域上劉銀霞報(bào)道了在發(fā)作前期狀態(tài)下峰度和方差提出棘波頻次計(jì)算方法[18]。在頻域上Boubchir發(fā)現(xiàn)癲癇發(fā)作時(shí)會(huì)比未發(fā)作時(shí)能量明顯增大[19]。Gao[20]等使用小波能量和EMD分解計(jì)算其波動(dòng)指標(biāo)作為特征。雖對(duì)信號(hào)描述能力較好,但對(duì)數(shù)據(jù)平穩(wěn)性和線性要求較高。
圖3癲癇特征提取理論圖
Fig3Seizurefeatureextraction
(2)單變量非線性度量
事實(shí)上大腦作為混沌系統(tǒng),基于非線性動(dòng)力學(xué)的分析方法被引。其一基于系統(tǒng)復(fù)雜性分析,研究表明癲癇發(fā)作時(shí)期大腦復(fù)雜度降低,如近似熵,樣本熵等[21]。其二基于系統(tǒng)混沌性分析,發(fā)作前期其混沌性降低,如相關(guān)維數(shù),最大Lyapunov指數(shù)[22]。其三基于系統(tǒng)反持久性分析,如Hurst指數(shù)指示癲癇未發(fā)作信號(hào)的持久性低于發(fā)作期[23]。很多學(xué)者只對(duì)一個(gè)或者幾個(gè)特征指標(biāo)進(jìn)行研究,需要綜合多特征全面研究。
(3)雙變量線性度量
癲癇放電往往從某一區(qū)域起源,隨著放電的持續(xù)進(jìn)行不斷向周圍傳播。使用雙變量方法能夠有效地跟蹤前期發(fā)作狀態(tài)。其中最常用的是互相關(guān)分析,用于量化2個(gè)時(shí)間序列的互相關(guān)系數(shù),進(jìn)而提取等效寬度等指標(biāo)[24]。Bandarabadi[25]等將光譜功率的使用擴(kuò)展到雙變量方法,量化不同頻帶和信道之間的跨功率信息。
(4)雙變量非線性度量
研究表明在發(fā)作過程中非線性系統(tǒng)的同步性必然高于未發(fā)作時(shí)期。Acharya等人回顧了4種同步性度量(最大互相關(guān)指數(shù),非線性相互依賴性,短期Lyapunov指數(shù)差異性)作為EEG特征來進(jìn)行預(yù)測[26]。 Mormann等比較了8種不同的雙變量非線性特征,發(fā)現(xiàn)平均相位相干指數(shù)和條件概率指數(shù)表現(xiàn)較好[27]。但是計(jì)算的同步性也只是延遲一定時(shí)間的同步。
2.2.4預(yù)測 在以上基礎(chǔ)上提出了癲癇發(fā)作預(yù)測研究的核心算法,分別是基于閾值預(yù)測和標(biāo)簽多分類問題。
(1)閾值預(yù)測
癲癇預(yù)測的重點(diǎn)在于區(qū)分不同時(shí)期的狀態(tài)變化,因此根據(jù)發(fā)作間期設(shè)定正常閾值,通過發(fā)作前期是否超過閾值來判斷。Aarabi 和He計(jì)算發(fā)作間期的特征值確定閾值置信區(qū)間,設(shè)置三次閾值,如果發(fā)作前期特征值超過該閾值,則標(biāo)記發(fā)出預(yù)警[28]。Zhang通過設(shè)置正常腦電數(shù)據(jù)醫(yī)學(xué)參考值確定最優(yōu)導(dǎo)聯(lián)下的閾值,一旦發(fā)作前期的特征值偏離醫(yī)學(xué)參考值范圍,就有理由相信這段數(shù)據(jù)異常從而來進(jìn)行預(yù)測[29]。見圖4。
圖4基于閾值的癲癇預(yù)測算法圖
Fig4Methodsforseizurepredictionbythreshold
(2)分類預(yù)測
對(duì)數(shù)據(jù)進(jìn)行標(biāo)注轉(zhuǎn)化為分類問題。使用若干種分類器,包括徑向基網(wǎng)絡(luò),BP網(wǎng)絡(luò),Elman網(wǎng)絡(luò)以及貝葉斯網(wǎng)絡(luò)等比較預(yù)測癲癇發(fā)作的性能[30]。支持向量機(jī)是應(yīng)用有效的方法,同時(shí)敏感支持向量機(jī)用來處理不平衡采樣數(shù)據(jù)[31]。隨著深度學(xué)習(xí)的崛起,開始出現(xiàn)部分使用深度學(xué)習(xí)來進(jìn)行癲癇預(yù)測的研究,例如,IBM公司使用深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測癲癇發(fā)作[32]。2014年Kaggle癲癇發(fā)作預(yù)測挑戰(zhàn)賽其top3中第一名使用人工特征+隨機(jī)森林方法,第二名使用的即是深度學(xué)習(xí)方法[33]。這些基于機(jī)器學(xué)習(xí)方法的預(yù)測,為癲癇研究奠定了基礎(chǔ)。
圖5癲癇發(fā)作自動(dòng)預(yù)測流程圖
Fig5Flowchartofautomatedseizureprediction
2.2.5性能評(píng)價(jià) (1)性能描述
如果報(bào)警后在控制范圍內(nèi)實(shí)際出現(xiàn)了發(fā)作,稱之為正確預(yù)測;否則是錯(cuò)誤預(yù)測。常采用敏感度、特異、準(zhǔn)確度等和錯(cuò)誤預(yù)測率評(píng)估[34]。敏感度通常被量化為發(fā)作前期正確分類的概率;特異度指在未發(fā)作片段內(nèi)其最終未發(fā)作的概率;準(zhǔn)確度指正確分類的樣本占總樣本比例;錯(cuò)誤預(yù)測率指如果癲癇實(shí)際發(fā)作了,在預(yù)測范圍內(nèi)發(fā)作沒有報(bào)警的概率[35]。
(2)統(tǒng)計(jì)檢驗(yàn)
測試模型性能是否優(yōu)于偶然預(yù)測十分重要。一般包括基于蒙特卡羅的數(shù)值驗(yàn)證和隨機(jī)預(yù)測器分析驗(yàn)證[36],其中基于蒙特卡羅模擬提出發(fā)作時(shí)間替代概念來彌補(bǔ)性能統(tǒng)計(jì)驗(yàn)證。該方法由隨機(jī)洗牌原發(fā)性發(fā)作時(shí)間,以產(chǎn)生人為設(shè)定時(shí)間進(jìn)行性能比較。但此種方法容易增加虛假預(yù)測率。而第二種是從得到的分析結(jié)果進(jìn)行比較(隨機(jī)或周期性)預(yù)測方案[37]。通過預(yù)測算法與其比較,確定其統(tǒng)計(jì)學(xué)意義,排除隨機(jī)干擾。
基于上述回顧了癲癇發(fā)作預(yù)測框架中出現(xiàn)的整體框架以及不足。隨著信號(hào)處理和人工智能技術(shù)的進(jìn)步,對(duì)于癲癇研究來說有更多的可能性。
從數(shù)據(jù)收集的角度出發(fā),允許高采樣率和高頻振蕩(80~500 Hz)的檢測,獲取大樣本數(shù)據(jù)量來實(shí)現(xiàn)大數(shù)據(jù)分析處理。并且現(xiàn)在也出現(xiàn)了多模態(tài)數(shù)據(jù),包括圖像,視頻,電子病歷等,如何融合這些信息進(jìn)行數(shù)據(jù)挖掘也是一大難點(diǎn)。
在癲癇發(fā)作預(yù)測研究中需要選擇合適的電極。目前臨床使用的是32導(dǎo)聯(lián),科研使用64~128導(dǎo)聯(lián),并且以后導(dǎo)聯(lián)數(shù)目會(huì)不斷增加。但并不是所有導(dǎo)聯(lián)都是必須的,比如針對(duì)于局灶性癲癇其發(fā)作區(qū)域固定在某一大腦范圍。
目前預(yù)測模型還是小樣本人工特征+機(jī)器學(xué)習(xí)方法,缺乏統(tǒng)計(jì)驗(yàn)證。深度學(xué)習(xí)具有強(qiáng)大的自學(xué)習(xí)能力,其中卷積神經(jīng)網(wǎng)絡(luò)可以自動(dòng)學(xué)習(xí)原始腦電特征,循環(huán)神經(jīng)網(wǎng)絡(luò)考慮到時(shí)間順序來進(jìn)行輸出,墨爾本大學(xué)癲癇研究中心提出從EEG數(shù)據(jù)集解讀與癲癇發(fā)作有關(guān)的電活動(dòng)類似于計(jì)算機(jī)視覺領(lǐng)域的對(duì)象識(shí)別任務(wù)。
從回顧中可以看出,在癲癇發(fā)作預(yù)測框架中的每個(gè)模塊可以在未來進(jìn)行改進(jìn),重要的是采取這種全面的發(fā)作預(yù)測框架來實(shí)現(xiàn)更可靠準(zhǔn)確的性能表現(xiàn)。