尚照巖, 喬曉艷
(山西大學 物理電子工程學院, 山西 太原 030006)
世界衛(wèi)生組織數(shù)據(jù)顯示, 抑郁癥已經(jīng)影響了大約3.5億人, 是全世界最嚴重的疾病之一. 抑郁癥患者會出現(xiàn)持續(xù)的情緒低落, 沉浸于悲觀心境, 甚至可能自殺. 抑郁癥及時篩查和診斷是非常重要的, 探索一種抑郁癥的機器識別方法有重要的應用價值和現(xiàn)實意義[1].
腦電(Electroencephalogram, EEG)作為一種客觀可靠的抑郁評估手段, 具有較高的時間分辨率、 相對低成本、 易記錄且對患者身體無任何侵入式傷害等優(yōu)點, 越來越多的學者開始使用腦電數(shù)據(jù)建立機器學習模型對抑郁癥和正常人進行識別[2-4]. Yang等[5]采集5 min靜息態(tài)EEG數(shù)據(jù), 采用單一時間窗口對腦電beta節(jié)律數(shù)據(jù)進行處理, 提取了線性和非線性特征, 使用機器學習算法對 beta 節(jié)律腦電特征在不同導聯(lián)下進行分類, 準確率依次為導聯(lián) FP1(76.41%), O2(75.23%), F3(75.12%), C3(74.29%). 由于該方法僅使用了單一時間窗口和單一的beta節(jié)律腦電數(shù)據(jù), 沒有選擇最佳時間窗口, 未考慮alpha、 theta和gamma節(jié)律蘊含不同的腦電信息, 因此, 單導聯(lián)分類準確率較低. 文獻[6-7]等人提取了30名中重度抑郁癥患者和17名正常對照的單導聯(lián)靜息態(tài)腦電的8個線性特征, 使用GreedyStepwise特征搜索和k近鄰分類算法對單導聯(lián)進行分類, 對于 alpha 節(jié)律的靜息態(tài)腦電數(shù)據(jù), 可以實現(xiàn) 80.85%的分類準確率, 其電極分布在顳區(qū); 對于 beta 節(jié)律的腦電數(shù)據(jù), 最高分類準確率為 78.72%, 電極分布在顳區(qū)和頂區(qū); 對于 theta 波段的腦電數(shù)據(jù), 可獲得 80.85%的最高分類結果, 其電極分布在前額區(qū). 該文對不同節(jié)律的單導聯(lián)分別進行分類, 得到每個腦電節(jié)律的分類準確率以及腦區(qū)位置, 該方法沒有利用腦電的非線性特征, 沒有對腦電進行有效分段, 導致分類準確率較低. Li等[8-9]以6 s時間窗對腦電數(shù)據(jù)分段, 提取出8個線性特征和9個非線性特征, 并使用K近鄰分類算法對輕度抑郁患者和正常人的腦電特征分類, 單個導聯(lián)分類結果依次為: O2(82.88%)、 F4(81.84%)、 T4(80.54%)、 C4(80.15%), 該研究提取的17個腦電特征與抑郁癥的關聯(lián)性有冗余, 抑郁識別正確率還有待提高. 現(xiàn)有的研究還沒有給出與輕度抑郁癥密切相關的最佳腦電導聯(lián)以及最有效的腦電特征組合, 且抑郁識別最佳的腦電時間窗口也不明確, 這些因素導致輕度抑郁癥機器識別準確率有待提高. 因此, 本文從53名被試的16導聯(lián)靜息腦電數(shù)據(jù)中, 分別提取與抑郁情緒密切相關的腦電時域、 頻域、 時頻非線性特征, 利用隨機森林、 K近鄰以及支持向量機3種機器學習分類器進行抑郁腦電識別, 并對腦電時間窗口、 導聯(lián)組合、 特征組合以及節(jié)律組合進行分析, 探索靜息態(tài)腦電抑郁癥機器識別的最有效方式, 提高輕度抑郁癥分類正確率和識別效率, 為臨床診斷抑郁癥提供有效支持.
本文采用的數(shù)據(jù)集是蘭州大學普適感知與智能系統(tǒng)實驗室公開的輕度抑郁癥數(shù)據(jù)集[10]. 所有的抑郁障礙患者是從蘭州大學第二附屬醫(yī)院住院和門診患者中招募的, 并且由至少一名臨床精神科醫(yī)生診斷, 正常對照是通過海報招募的, 得到蘭州大學第二附屬醫(yī)院倫理委員會批準, 并在實驗開始前獲得了所有被試的書面知情同意. 所有抑郁癥患者都接受了一個結構化的迷你國際神經(jīng)精神病學訪談(MINI), 該訪談符合基于DSM-IV的精神疾病診斷和統(tǒng)計手冊(DSM)中的主要抑郁癥診斷標準. 對于抑郁癥患者, 納入標準為MINI符合抑郁癥診斷標準, 患者健康問卷PHQ-9評分大于或等于5分, 近兩周未進行精神藥物治療. 排除抑郁癥中有嚴重身體疾病和自殺傾向的患者, 并且排除正常對照中有精神障礙的被試或有精神障礙家族史的被試.
該數(shù)據(jù)集包含53個被試的靜息態(tài)腦電數(shù)據(jù), 其中包括24名輕度抑郁癥患者(13名男性和11名女性, 年齡為16歲~56歲), 以及29名健康對照者(20名男性和9名女性, 年齡為18歲~55歲). 腦電信號記錄采用128導聯(lián)的HydroCel Geodesic Sensor Net (Electrical Geodesics Inc., Oregon Eugene, USA)和Net Station(版本為4.5.4)采集軟件, 采樣頻率為250 Hz, 參考電極為Cz導聯(lián). 在靜息態(tài)腦電數(shù)據(jù)采集時, 首先對被試的頭圍進行測量, 然后根據(jù)頭圍選擇合適的腦電帽. 記錄數(shù)據(jù)之前對各個電極的阻抗進行測量, 確保接觸良好, 并保持在50 kΩ以下. 在安靜、 隔音、 無強電磁干擾、 通風良好的房間內對腦電信號進行測量. 記錄了所有被試5 min閉眼靜息狀態(tài)的腦電數(shù)據(jù). 實驗過程中要求被試保持清醒和靜止, 沒有任何身體活動, 以及任何不必要的眼睛移動、 掃視和眨眼. 因此, 數(shù)據(jù)集中包含有53名被試、 128導聯(lián)的5 min靜息態(tài)腦電數(shù)據(jù), 并且該數(shù)據(jù)集進行了眼電偽跡的去除.
本文選擇與情緒相關聯(lián)的16個腦電導聯(lián)進行研究[11], 對應導聯(lián)電極分別為: FP2、 FP1、 F3、 F7、 C3、 T3、 P3、 T5、 O1、 O2、 P4、 T6、 C4、 T4、 F8、 F4. 預處理采用MATLAB軟件的EEGlab工具箱完成. 步驟為:
1) 電極重參考: 選用Cz為參考電極, 以其他電極與Cz電極之間的電勢差為該電極的數(shù)據(jù).
2) 濾波: 設置高通和低通濾波器對信號進行濾波, 高通濾波器截止頻率設置為0.5 Hz, 低通濾波器截止頻率為45 Hz. 目的是濾除工頻干擾、 高頻噪聲、 直流漂移以及肌電偽跡. 濾波之后的腦電信號(僅示出1 s片段)如圖 1 所示.
圖 1 濾波之后的腦電信號片段Fig.1 EEG segment after filtering
3) 數(shù)據(jù)分段: 每個被試的腦電采集時間是5 min, 為了避免采集開始和結束對腦電記錄的影響, 去除開始和結束各30 s的數(shù)據(jù), 將剩余4 min腦電數(shù)據(jù)(采樣點數(shù)為4×60×250)以不同時間窗口長度(8 s、 10 s、 12 s、 15 s、 20 s、 24 s、 30 s)劃分數(shù)據(jù)片段, 用以選擇腦電數(shù)據(jù)最佳的窗口時間.
4) 獲取腦電節(jié)律: 對腦電數(shù)據(jù)片段設置帶通濾波器截止頻率, 獲取theta(4 Hz~8 Hz)、 alpha(8 Hz~13 Hz)、 beta(13 Hz~30 Hz)和gamma(31 Hz~45 Hz)4個不同頻段的腦電節(jié)律.
若選用20 s的時間窗口, 對于每一個導聯(lián), 每名被試有12個腦電數(shù)據(jù)片段. 數(shù)據(jù)集中, 24名抑郁癥患者共有288(12×24)個抑郁腦電數(shù)據(jù)片段, 29名正常人共有348(12×29)個正常腦電數(shù)據(jù)片段. 若選取16個導聯(lián), 則共有288×16個抑郁腦電數(shù)據(jù)片段和348×16個正常腦電數(shù)據(jù)片段.
活動性、 移動性、 復雜度是Hjorth定義的3個參數(shù), 活動性和移動性可用于檢查信號震蕩程度, 是定量評估非平穩(wěn)腦電信號的重要指標[12]. 復雜度是腦電活動非線性評估參數(shù), 它反映了腦電信號的復雜混沌程度[13].
活動性定義為
(1)
式中:y(t)為腦電信號;μ為信號的均值,i=1,2,3,…,N, 腦電數(shù)據(jù)片段的樣本數(shù)量; var表示方差. 對抑郁患者和正常被試, 各取288個腦電信號片段, 利用式(1)計算16個導聯(lián)的腦電活動性. 其中, 在O1導聯(lián)抑郁腦電和正常腦電的活動性如圖 2 所示.
圖 2 O1導聯(lián)腦電活動性對比圖Fig.2 Contrast map of EEG activity in lead O1
移動性定義為
(2)
復雜度定義為
(3)
式中:Mobility為移動性. 對抑郁患者和正常被試, 各取288個腦電信號片段, 按照式(3)計算16個導聯(lián)的腦電復雜度, 其中在O1導聯(lián)抑郁腦電和正常腦電的復雜度如圖 4 所示.
圖 3 O1導聯(lián)腦電移動性對比圖Fig.3 Contrast chart of lead O1 EEG mobility
圖 4 O1導聯(lián)腦電復雜度對比圖Fig.4 Contrast chart of EEG complexity of lead O1
由于腦電信號是隨機信號, 本文采用AR(Auto Regressive)模型方法計算功率譜密度(Power Spectrum Density, PSD)[14], 計算公式為
(4)
圖 5 O1導聯(lián)腦電最大功率譜密度值對比圖Fig.5 The comparison chart of the maximum power spectral density value of lead O1 EEG
小波變換可以將腦電信號分成不同的子帶, 每個子帶內小波系數(shù)的模按尺度函數(shù)累加形成小波能量, 每個子帶內的小波系數(shù)反映了信號的能量分布. 系數(shù)較大者攜帶的信號能量較多, 反之, 能量較少. 熵表示信號的不確定程度, 小波能量熵采用小波變換在不同尺度的能量分布代替信號的概率分布, 小波能量熵計算公式為
(5)
式中:i=1,2,…,j, 為小波分解的層數(shù);EDi為第i層分解的小波細節(jié)系數(shù)能量;Et為小波總能量.
小波奇異熵是小波變換、 奇異值分解和信息熵的結合, 可以對被分解信號的突變程度給出確定的度量. 因此, 小波奇異熵可以區(qū)分具有不同時頻分布的信號. 小波奇異熵計算公式為
(6)
式中:φj,φi為奇異值分解后對角矩陣上的奇異值. 對腦電信號的小波系數(shù)進行奇異值分解, 得到的對角矩陣能反映腦電信號的時頻分布特征. 考慮到特征奇異值的個數(shù)有很多, 因此, 取前k(1≤k≤ρ)個奇異值以保證計算的精確性.
對抑郁患者和正常被試, 各取288個腦電信號片段, 利用式(5)和式(6)分別計算16個導聯(lián)的腦電小波能量熵和小波奇異熵, 其中在O1導聯(lián)抑郁腦電和正常腦電的小波能量熵和小波奇異熵結果如圖 6 所示.
(a) 小波能量熵對比圖
為了對比不同機器學習方法對輕度抑郁癥腦電識別的有效性, 使用單導聯(lián)全頻段腦電的歸一化數(shù)據(jù)特征作為輸入集, 輸入特征矩陣為636×6. 其中, 636為單導聯(lián)的腦電片段樣本數(shù)量, 6為上節(jié)中提取的腦電6個特征量(特征維數(shù)). 將輸入特征集分為訓練集和測試集, 其中訓練集特征矩陣為445×6, 測試集特征矩陣為191×6.
K近鄰(K-Nearest Neighbor, KNN)是一種用于解決分類和回歸問題的有監(jiān)督的機器學習算法. 在傳統(tǒng)機器學習算法中, 它是簡單、 有效、 易于實現(xiàn)的算法之一. 在特征空間中, 如果一個樣本最近鄰的K個樣本的大多數(shù)屬于某一個類別, 則該樣本也屬于這個類別.K值范圍在1~30之間, 使用網(wǎng)格搜索算法進行參數(shù)調整, 得到的最佳取值是1.
支持向量機(Support Vector Machines, SVM)是建立在統(tǒng)計學理論結構風險最小原理基礎上的, 能較好地解決小樣本、 非線性、 高維數(shù)和局部極小點等問題, 具有求解速度快、 泛化能力強的優(yōu)點. 本文對不同核函數(shù)的SVM進行對比分析, 選擇核函數(shù)為高斯徑向基的SVM. 在SVM的參數(shù)中, gamma參數(shù)顯示了訓練示例的影響范圍, 高值通常表示為“近”, 低值表示為“遠”. 參數(shù)c表示正則化, 根據(jù)決策函數(shù)的邊際最大化來糾正訓練樣本的分類. 一般, gamma在-5~1之間進行取值,c在0.01~50之間進行取值, 本文使用網(wǎng)格搜索算法進行參數(shù)調整, 得到gamma的最佳取值為0.212,c的最佳取值為19.7.
隨機森林(Random Forest, RF)是具有代表性的Bagging集成算法, 由決策樹組成隨機森林評估器. 裝袋法的核心是構建多個相互獨立的評估器, 然后對其預測進行表決來判定集成評估器的結果. 隨機森林考慮多個決策樹的建模結果, 得到一個綜合評判, 以此來獲取比單個模型更好的回歸或分類表現(xiàn). 本文采用網(wǎng)格搜索進行決策樹的數(shù)量、 最大深度、 最小樣本個數(shù)以及最小分裂樣本個數(shù)調整, 得到?jīng)Q策樹個數(shù)為17、 最大深度為11、 最小樣本個數(shù)為1以及最小分裂樣本個數(shù)為2.
分類問題常用的模型評價指標為分類準確率(Accuracy, Acc)、 精確率(Precision, P)、 召回率(Recall, R)和F1值. 其中,F(xiàn)1值可以反映精確率和召回率.F1值越大, 表明分類器泛化性能越好.
分類準確率為
(7)
精確率為
(8)
召回率為
(9)
F1值為
(10)
式中:TP表示將正類預測為正類數(shù), 即真正類;FN表示將正類預測為負類數(shù), 即假負類;FP表示將負類預測為正類數(shù), 即假正類;TN表示將負類預測為負類數(shù), 即真負類.
將提取到的腦電信號時域特征、 頻域特征、 非線性特征, 采用KNN、 SVM和RF算法對每個腦電導聯(lián)的輸入特征集進行分類, 得到高斯徑向基SVM的分類結果優(yōu)于其他2個分類方法. 導聯(lián)O1在SVM、 KNN、 RF分類器上的混淆矩陣如圖 7 所示, 并利用式(7)~式(10)計算其分類準確率Acc、 精確率P、 召回率R和F1值.
由圖 7 可知, 采用SVM方法進行輕度抑郁癥腦電分類, 單導聯(lián)O1得到的識別準確率為84.3%,F(xiàn)1值為0.833; KNN方法得到分類準確率79.6%,F(xiàn)1值為0.806; RF方法獲得的識別準確率為80.1%,F(xiàn)1值為0.815. 由此可見, SVM方法對輕度抑郁腦電進行分類, 其識別正確率和泛化能力均比KNN方法和RF方法好, 也較文獻中采用相同抑郁腦電數(shù)據(jù)集的識別準確率高. 因此, 在結果分析時, 采用了SVM分類器.
在抑郁癥臨床診斷中, 腦電節(jié)律信息可作為識別抑郁癥的有效生物標記物. 本文對腦電theta、 alpha、 beta和gamma節(jié)律分別提取了6個特征, 構成特征集. 針對不同的輸入特征, 在導聯(lián)O1、 O2、 T5的分類結果如表 1 所示.
表 1 不同特征組合的支持向量機分類準確率Tab.1 Support vector machine classification accuracy for different feature combinations
由表 1 可知, 在4個單一腦電節(jié)律中, beta節(jié)律取得了最高的分類準確率, 可知腦電β節(jié)律與抑郁情緒更相關. 采用alpha, beta, gamma 3個節(jié)律組合, 在絕大多數(shù)的腦電導聯(lián)都獲得了最好的分類準確率. 采用多個腦電節(jié)律組合進行輕度抑郁癥識別相比單一的腦電節(jié)律, 識別準確率提高了13%; 相比全頻段腦電, 識別平均準確率提高了9%. 由此可見, 對于靜息態(tài)抑郁腦電的機器識別, 選用腦電alpha, beta, gamma節(jié)律組合更有效.
使用SVM分類器對16個腦電單導聯(lián)一一進行抑郁分類, 單導聯(lián)的分類準確率如圖 8 所示.
圖 8 單導聯(lián)的分類準確率Fig.8 Single-lead classification accuracy
由圖 8 可知, 導聯(lián)T5取得最高的分類準確率89.53%, 導聯(lián)C4取得最低的分類準確率 76.44%. 由于大腦是一個復雜的系統(tǒng), 為探索適合輕度抑郁癥識別的最佳導聯(lián)組合, 本文選擇分類準確率較高的單導聯(lián) O1、 O2、 T5進行組合, 按照分類準確率進行對應導聯(lián)組合, 得到3種不同組合方式的抑郁腦電分類性能評價, 如表 2 所示.
表 2 不同導聯(lián)組合的分類性能評價Tab.2 Classification performance evaluation of different lead combinations
由表 2 可知: 在導聯(lián)O2和T5組合下, 可以取得最高的分類準確率93.19%、 召回率90.59%和精確度95.28%, 因此, O2+T5可作為輕度抑郁識別的最有效的腦電導聯(lián)組合. 由于本方法僅依靠這兩個導聯(lián)的腦電信息即可獲得較高的識別準確率, 故而為抑郁癥機器篩查探索出了一種最佳的腦電導聯(lián)選擇方式, 取得了優(yōu)于其他導聯(lián)輸入方式的抑郁識別正確率.
選用不同的時間窗口對原始測量的腦電信號進行分段, 不同大小的時間窗口對抑郁腦電識別結果產生影響, 為了找到輕度抑郁癥識別的最佳時間窗口, 按照不同時間窗口分別對O1、 O2、 T5導聯(lián)的原始腦電數(shù)據(jù)分段并提取特征, 得到抑郁腦電分類結果如表 3 所示.
表 3 不同時間窗口的分類準確率Tab.3 Classification accuracy for different time windows
由表 3 可知: 在8 s時間窗口, 導聯(lián)O1、 O2、 T5均取得了較低的分類準確率; 在20 s時間窗口, 導聯(lián)O1、 O2、 T5取得了最高的分類準確率. 之后隨著窗口時間的增加, 分類準確率下降. 這是因為時間窗口較小時, 截取腦電片段所包含的抑郁信息不夠充分; 時間窗口過大時, 腦電信息產生相互冗余導致分類正確率降低. 因此, 對于輕度抑郁癥腦電進行機器識別, 20 s時間窗口是最佳的腦電分類時間窗口.
選取alpha、 beta和gamma節(jié)律組合、 O2+T5導聯(lián)組合、 20 s時間窗口, 利用支持向量機方法對腦電單個特征一一進行分類, 單特征分類正確率如圖 9 所示.
由圖 9 可知, 腦電活動性特征取得了84.56% 的單特征分類準確率, 可作為識別抑郁癥的有效生物標記物. 小波能量熵和小波奇異熵兩個非線性特征的分類準確率適中, 可以對輕度抑郁癥患者和正常被試的腦電數(shù)據(jù)進行較好的區(qū)分. 依據(jù)單特征分類準確率的排序, 對腦電不同特征進行組合, 組合2表示活動性+移動性, 組合3表示活動性+移動性+小波能量熵, 其余依次類推. 分別對這些特征組合采用支持向量機進行分類, 其準確率、 召回率、 精確度如圖 10 所示.
圖 9 單特征分類準確率Fig.9 Single feature classification accuracy
圖 10 不同特征組合的支持向量機分類結果Fig.10 Support vector machine classification results for different feature combinations
由圖 10 可知, 將活躍度、 移動性、 小波能量熵、 小波奇異熵4個特征進行組合時, 取得最高的分類準確率94.24%、 召回率92.35%、 精確度96.23%. 由于活動性和移動性反映了腦電的震蕩性, 熵反映腦電的非線性不確定度, 表明腦電的非平穩(wěn)震蕩特性與輕度抑郁癥關系更密切, 腦電非線性與輕度抑郁的關系次之. 此外, 隨著腦電特征組合數(shù)量的增加, 分類準確率降低, 表明特征之間存在冗余, 并非特征越多越好.
本文提取了腦電活躍度、 移動性、 復雜度、 功率譜密度、 小波能量熵、 小波奇異熵特征, 使用SVM、 KNN、 RF機器學習方法進行靜息態(tài)抑郁腦電分類. 通過對腦電最佳時間窗口、 導聯(lián)組合、 特征組合、 不同節(jié)律組合的分析, 探尋了腦電與輕度抑郁癥相關聯(lián)的有效信息, 得到最有效的分類器為SVM方法, 最佳的特征組合為活躍度、 移動性、 小波能量熵和小波奇異熵, 最優(yōu)的導聯(lián)組合為O2、 T5, 以及腦電節(jié)律組合為alpha、 beta、 gamma. 在此基礎上, 得到靜息態(tài)抑郁腦電的識別準確率最高為94.24%、 召回率92.35%、 精確度96.23%. 該研究可以應用于輕度抑郁癥的機器篩查, 為抑郁癥機器識別探索了更有效的腦電處理方式.
由于本研究僅使用了靜息態(tài)的抑郁腦電數(shù)據(jù), 沒有對睡眠態(tài)和誘發(fā)態(tài)的腦電數(shù)據(jù)進行機器識別和分析, 因此, 研究結果僅適用于靜息態(tài)的抑郁腦電檢測和分類.