劉 清 萬志遠 楊 柳* 何 萌 陳俊華 楊 錟
(武漢理工大學交通與物流工程學院1) 武漢 430063) (國家水運安全工程技術研究中心2) 武漢 430063)
人為因素占水上交通事故的75%~96%[1-4],且任何海事事故中都包含人為因素[5].研究表明腦電信號與包括航空[6]、公路[7]在內(nèi)的駕駛行為存在相關性,有研究者將人為因素分為工作負荷、情緒、注意力、壓力和疲勞五類[8].其中工作負荷(mental workload)與鐵路機車駕駛員的疲勞程度存在正相關關系,與汽車駕駛員在駕駛中的視覺行為也存在強相關性[9].在心理層面,工作負荷會對飛行員的決策產(chǎn)生影響.工作負荷的研究方法可以分為主觀研究和客觀研究.主觀研究方法包括主觀打分評價法、心理量表問卷等;客觀研究方法包括績效評價、生理信號研究等.其中生理信號研究包括了腦電波(electroencephalogram, EEG)、眼動、心率變化、皮電、肌電、血壓、體溫等多種指標.
近年來,腦電分析方法也從早期的時域分析發(fā)展到了頻域分析、時頻域分析、空間域分析方法.頻域分析方法多應用于交通安全中的人為因素研究,使用腦電信號研究交通參與者的工作負荷、情緒、注意力、壓力和疲勞等.工作負荷可以視作中樞神經(jīng)系統(tǒng)處理外界任務的腦力負荷,影響與中樞神經(jīng)相關的功能結構以及其他生理過程,而這些生理過程可以較為方便地去感知與研究.同時,腦電各個頻段對于工作負荷的變化敏感,采用模式識別可以正確識別各頻段的工作負荷水平,并有較高的識別準確率.
支持向量機(support vector machines, SVM)是模式識別研究中一種常用的模型,它是定義在特征空間上的間隔最大的線性分類器.通過SVM的核函數(shù),在特征空間中投影數(shù)據(jù),以此來獲取最優(yōu)超平面,從而建立分類器.這種算法在解決小樣本、非線性及高維模式識別問題中具有一定的優(yōu)勢,有良好的通用性和魯棒性.
盡管基于腦電的工作負荷研究具有生理活動較易檢測、針對頻段模式識別準確率較高的優(yōu)點,但目前腦電研究還存在一些局限性,如腦電采集設備體積龐大、被試人員不能移動、腦電信號中干擾信號難以去除等問題.同時,水上交通具有需要多人協(xié)同駕駛、駕駛員頻繁移動等特點,制約了大型腦電設備在水上交通領域研究的應用.文中使用移動式無線腦電采集設備,在船舶駕駛員的工作環(huán)境中正常采集腦電信號,借助腦電數(shù)據(jù)識別船舶駕駛人員的工作負荷.
船舶模擬系統(tǒng)基于全任務大型船舶操縱模擬器構建,使用Navi-Trainer Professional 5000型設備.模擬系統(tǒng)具備與真實船舶相同或高度近似的綜合船橋駕駛臺、船舶控制系統(tǒng)、雷達系統(tǒng)、導航系統(tǒng)、通信系統(tǒng)等.腦電采集儀為Neurosky公司的Mindwave Mobile 2,采集頻率512 Hz,F(xiàn)P1單通道,使用耳垂電極作為參考.
被試人員46名,均為男性.其中有8人正在接受船長崗位培訓,38人正在接受大副崗位培訓.被試人員的年齡為(36.5±6)歲,有(11.4±6.4)年駕齡,具有長期的駕駛經(jīng)驗,在實驗過程中能夠表現(xiàn)出更為職業(yè)化的反應.
被試人員隨機分為若干個四人小組,每個小組內(nèi)四人輪流扮演船長、駕駛員、通信員和舵工四類船員角色.
實驗場景由固定事件和隨機突發(fā)事件組成,實驗時長平均45 min.場景流程為:離泊、正常航行、能見度降低及恢復、隨機突發(fā)事件(包括火災、溢油、船舶碰撞、人員落水、故障、擱淺、風浪、船舶追越、會遇),根據(jù)突發(fā)事件處理結果進行靠泊或終止實驗.
完成實驗后,實驗人員獲取了被試人員的全程腦電數(shù)據(jù)、場景錄像和每場實驗的事件時間軸作為實驗數(shù)據(jù).其中腦電數(shù)據(jù)記錄了52人·次,每人·次的數(shù)據(jù)記錄時長為45~60 min不等,每秒記錄512條腦電信號,以45 min計算約為130萬條未經(jīng)篩選的腦電信號原始數(shù)據(jù),原始數(shù)據(jù)為腦電采集設備的配套軟件直接記錄的電位差,保存為單通道時間序列結構.
綜合考慮船員在正常航行和突發(fā)事件處理場景下不同的船舶駕駛任務、通信時長、艙內(nèi)溝通頻率頻次等,將正常航行場景標定為低工作負荷狀態(tài),將突發(fā)事件處理場景標定為高工作負荷.
1) 由于設備采用干式單電極,穩(wěn)定性和精度容易受到影響,而且腦電波的信號強度極低,通常以μV為單位波動,需要人工檢查腦電信號數(shù)據(jù),通過對波形的觀察,初步篩選,剔除噪聲信號過大的無效數(shù)據(jù).
2) 考慮到采集的腦電信號中存在身體活動(移動、眨眼、講話等)和設備本身電信號的干擾,使用帶通濾波和陷波濾波的方式排除部分干擾信號.具體到腦電信號的頻段,本文的研究對象為0.5~80 Hz頻段的腦電信號,為了保證數(shù)據(jù)的完整性,有限長單位沖激響應濾波器(finite impulse response, FIR)低通濾波的截止頻率為0.5 Hz,高通濾波的截止頻率為100 Hz.考慮到腦電采集系統(tǒng)的設備供電,將陷波濾波器的中心頻率設置為50 Hz.
圖1為預處理前后數(shù)據(jù)對比.由圖1可知:預處理操作經(jīng)過濾波后,剔除了部分噪聲信號(即圖中的部分波峰信號),平滑了原始信號,保留了有效數(shù)據(jù).整體波動趨勢和原始信號保持一致.
圖1 預處理前后數(shù)據(jù)對比
腦電信號可以根據(jù)頻段分為δ波、θ波、α波和β波,不同頻段的腦電波是大腦功能區(qū)域在生理活動中產(chǎn)生的,例如頻率為8~13 Hz的α波通常在安靜或清醒狀態(tài)下最為顯著,頻率為14~30 Hz的β波通常在緊張或專注狀態(tài)下較為顯著.具體頻率劃分和對應的功能活動見表1.
表1 腦電波頻率及功能劃分 單位:Hz
功率譜密度(power spectral density, PSD)是腦電信號在單位頻帶內(nèi)的功率,表征了腦電信號在不同頻率上的功率強度分布.使用周期圖法計算PSD,其計算公式為
(1)
腦電信號是一個有限長度的時間序列,因此將式(1)改寫為
(2)
在Matlab中使用式(2),計算出的功率譜密度見圖2.其中50 Hz頻率上功率的減少是由于陷波濾波器的中心頻率設置為了50 Hz,同樣地,由于帶通濾波器的高通截止頻率為100 Hz,功率譜密度的圖像并未顯示100 Hz以上頻率的功率譜密度.在此基礎上,分別對0.5~3,4~7,8~13和14~30Hz頻段進行積分運算,提取了δ波、θ波、α波、β波的功率,將四種腦電波的功率記做Pα、Pβ、Pθ、Pδ.
圖2 數(shù)據(jù)經(jīng)過處理后獲得的功率譜密度圖
由于α波和β波分別對應大腦放松和注意力集中的狀態(tài),因此考慮分析Pα和Pβ的比值與工作負荷的相關性.在不同工作負荷水平下進行多次采樣,獲取樣本,根據(jù)工作負荷水平分為兩組(低工作負荷水平、高工作負荷水平)后進行方差分析.其中P1為正常航行場景,即低工作負荷水平下的數(shù)據(jù)組,P2為突發(fā)事件處理場景,即高工作負荷水平下的數(shù)據(jù)組.
具體計算中將腦電數(shù)據(jù)以10 s長度分段,分別計算各數(shù)據(jù)段腦電特征值.低工作負荷水平下各個分段數(shù)據(jù)計算得出的α波特征值依次記做
式中:y為在低工作負荷水平下的數(shù)據(jù)分段數(shù)量.
高工作負荷水平下各個分段數(shù)據(jù)計算得出的α波特征值依次記做
式中:z為在高工作負荷水平下的數(shù)據(jù)分段數(shù)量.
計算后得出,兩組數(shù)據(jù)的在方差齊性檢驗上的顯著性均遠大于0.05,證明兩組數(shù)據(jù)具有方差一致性,可以進行單因素方差分析,結果見表2.
表2 單因素方差分析
由表2可知:單因素方差分析的顯著性水平遠低于0.05,證明P1和P2兩組數(shù)據(jù)存在顯著性差異.因此,Pα/Pβ指標在不同工作負荷水平下的水平存在差異,即Pα/Pβ指標可以滿足識別模型對輸入?yún)?shù)的要求,以識別低工作負荷水平和高工作負荷水平.
核函數(shù)及其參數(shù)是SVM的一個重要部分,影響SVM的學習能力和泛化能力.徑向基函數(shù) (radial basis function, RBF)具有映射維度廣、決策邊界多樣和表現(xiàn)穩(wěn)定等優(yōu)點,被廣泛應用于基于SVM的分類研究[10].因此,選用RBF核函數(shù)開展工作負荷模型研究.
選取適當?shù)暮撕瘮?shù)K(x,z)罰參數(shù)C>0,構造并求解凸二次規(guī)劃問題.
(3)
(4)
0≤αi≤C,i=1,2,…,N
(5)
在選擇RBF作為核函數(shù)的情況下,分類決策函數(shù)為
(6)
選擇網(wǎng)格搜索進行交叉驗證,作為懲罰系數(shù)C和核函數(shù)參數(shù)gamma的優(yōu)化算法,網(wǎng)格搜索法優(yōu)點是可以得到全局最優(yōu)解,交叉驗證可以提高訓練集分類的準確率.
從實驗數(shù)據(jù)中選擇了50組低工作負荷狀態(tài)的腦電信號數(shù)據(jù)和50組高工作負荷狀態(tài)的腦電數(shù)據(jù),共計100組數(shù)據(jù),每組數(shù)據(jù)均為長度為10 s的原始數(shù)據(jù),使用Pα/Pβ作為特征指標,輸入本章所述的SVM模型,使用四折交叉驗證方法進行訓練.完成網(wǎng)格搜索算法后,獲得最優(yōu)懲罰系數(shù)C=1.319 5,最優(yōu)核函數(shù)參數(shù)gamma=9.181 6.C和gamma是SVM模型的關鍵參數(shù),可以代表SVM模型的訓練結果.
使用隨機選取的25組訓練集數(shù)據(jù)輸入訓練后的SVM模型,得到了每組數(shù)據(jù)的工作負荷水平識別結果,見圖3.該模型正確識別了其中24組數(shù)據(jù)的工作負荷水平,訓練集識別準確率達到了96%.因此在最優(yōu)懲罰系數(shù)C=1.319 5,最優(yōu)核函數(shù)參數(shù)gamma=9.181 6時,SVM模型的參數(shù)達到了最優(yōu).
圖3 SVM訓練集預測準確率
從訓練集之外的數(shù)據(jù)集中,隨機選取了25組不同工作負荷水平的數(shù)據(jù)作為測試集,輸入訓練好的SVM模型后得到了25組數(shù)據(jù)的工作負荷水平識別結果,見圖4.與測試集的真實工作負荷對比,模型識別出的結果僅有2組數(shù)據(jù)錯誤,測試集的識別準確率達到了92%.
圖4 SVM測試集預測準確率
Macro-ROC曲線是以SVM模型分類結果的真陽性率(true positive rate, TPR)為Y軸,以假陽性率(false positive rate, FPR)為X軸繪制的曲線圖,能夠對多種分類器的性能進行評價.在曲線圖中,曲線越趨向圖像左上角(0,1)點,表示SVM模型的分類性能越優(yōu)秀.相反的,曲線越趨向于圖像的右下角(1,0)點則表征SVM模型分類器的分類性能越差.通過Macro-ROC曲線圖,可以直觀地定性評價SVM模型的分類性能.
Macro-AUC值與Macro-ROC曲線相關,通過計算曲線下的面積求得,用于評價多種分類器的性能,在本文中用于評價SVM模型的分類性能.一般條件下,Macro-AUC取值為[0,1],AUC的值越趨近于1,表示模型的分類性能越好,相反的,越趨近于0,則表示模型的分類性能越差.Macro-AUC的值可以定量地評價SVM模型的分類性能,評價結果見圖5.
圖5 Macro-ROC曲線圖
由圖5可知:Macro-ROC曲線趨向于左上角(0,1)點,表示訓練好的SVM模型分類性能較為優(yōu)秀,同時Macro-ROC曲線下的面積,即Macro-AUC值為0.993 75,接近1,表示訓練好的SVM模型分類性能較為優(yōu)秀.上述評價指標的評價結果基本相同.
綜合上述指標,訓練完成后的工作負荷識別模型使用隨機選取的包含不同工作負荷水平的新數(shù)據(jù)作為測試集,可以達到92%的識別準確率,且Macro-AUC值可以達到0.993 75,Macro-ROC曲線貼近左上角.因此基于EEG的船員工作負荷識別模型能夠較好地識別船員在不同實驗場景下的實時工作負荷水平,取得了較好的分類效果.同時,也證實了船員不同的工作負荷會對船員的腦電活動產(chǎn)生一定影響.
1) 船舶駕駛員在不同工作負荷水平下的腦電波存在顯著差異.α波與β波的功率之比可以作為船舶駕駛員的工作負荷識別的腦電特征.
2) 針對船舶駕駛員的工作負荷識別問題,基于SVM構建了一種識別模型,該模型分類識別工作負荷的準確率達到了92%,遠超過隨機分類的50%準確率,Macro-AUC值達到了0.993 75,驗證了有效性.因此,可以認為該模型具備較好的分類性能.
本研究的不足之處在于,所有實驗數(shù)據(jù)均由仿真實驗環(huán)境中獲得,模型在真實駕駛條件下的有效性待驗證;此外,模型的數(shù)據(jù)來源和識別對象為船舶駕駛員,對輪機人員、水手等船員的有效性還需進一步研究.