徐軍莉
關(guān)鍵詞:性別差異性; 眼動(dòng)和腦電信號(hào); 駕駛疲勞; 疲勞特征;性別識(shí)別
0 引言
疲勞駕駛是引發(fā)車(chē)禍的主要因素之一[1]。因此,為了降低因疲勞引發(fā)的交通事故,很多研究者通過(guò)各種方法對(duì)駕駛疲勞進(jìn)行檢測(cè)[2-3],其中眼動(dòng)特征和腦電特征都是疲勞檢測(cè)的有效手段。牛清寧等人[4]采用眨眼頻率、Perclos(Percentage of Eyelid Closure)、注視方向和注視時(shí)間作為疲勞特征進(jìn)行檢測(cè)。劉志強(qiáng)等人[5]采用Perclos、眼睛焦點(diǎn)的位置作為疲勞特征。Hu, J等人[6]用腦電信號(hào)的熵特征進(jìn)行了疲勞檢測(cè)。此外,也有研究者結(jié)合眼動(dòng)信號(hào)和腦電信號(hào)兩者的優(yōu)勢(shì),將眼動(dòng)特征和腦電特征進(jìn)行融合作為混合疲勞特征。姚娟娟等人[7]基于前額單通道的腦電信號(hào)和腦電信號(hào)中的眼電信號(hào)特征來(lái)檢測(cè)疲勞狀態(tài),其疲勞識(shí)別率達(dá)到了93.10%。Chi Zhang等人[8]采用腦電圖、肌電圖和眼圖信號(hào),利用各種熵的峰值來(lái)檢測(cè)駕駛員的疲勞,準(zhǔn)確率為96.5%~99.5%。本文作者將腦電特征與眼動(dòng)的掃視長(zhǎng)度作為融合特征進(jìn)行疲勞檢測(cè),檢測(cè)率也可達(dá)92.32%[9]。這些研究都表明眼動(dòng)和腦電的混合疲勞特征能有效對(duì)駕駛疲勞進(jìn)行檢測(cè)。
駕駛疲勞是一個(gè)復(fù)雜的生理現(xiàn)象,在相同的駕駛環(huán)境下,男女駕駛員產(chǎn)生疲勞的過(guò)程會(huì)有所不同。據(jù)何揚(yáng)研究發(fā)現(xiàn),女性駕駛員的疲勞狀態(tài)隨著駕駛時(shí)間延長(zhǎng)而緩慢增加;男性駕駛員可能在駕駛過(guò)程中保持長(zhǎng)時(shí)間的興奮狀態(tài),但是當(dāng)他們感到疲勞時(shí),疲勞感會(huì)來(lái)得急劇而強(qiáng)烈[10]。由于男女駕駛員產(chǎn)生疲勞的過(guò)程存在差異,那么這種差異性是否會(huì)導(dǎo)致采用的疲勞特征也存在性別差異呢?目前這方面的研究較少。目前,只有以腦電信號(hào)為研究?jī)?nèi)容,研究腦電信號(hào)中是否存在性別差異性的相關(guān)研究。例如有研究者發(fā)現(xiàn)相同模式下采集的腦電信號(hào)具有顯著的男女性別差異。VOLF等人[11]在研究男女腦電圖時(shí)發(fā)現(xiàn),在腦電功率和左右半球的一致性反應(yīng)上是存在性別差異的。徐桂芝等人[12]利用靜息狀態(tài)腦電信號(hào)為工具,分析男性和女性在功能性腦網(wǎng)絡(luò)特征上的差異性,結(jié)果顯示在聚集系數(shù)、最短路徑、度和全局效能上男女特征均存在較大的差異性。穆振東等人[13]也指出在駕駛過(guò)程中,采用腦電特征進(jìn)行檢測(cè),在識(shí)別率上、聚集系數(shù)和度特征上,均顯示出男性和女性之間是有顯著性差異的。那么對(duì)于其他常用的疲勞檢測(cè)信號(hào)特征,例如眼動(dòng)特征、腦電與眼動(dòng)的混合特征等,它們是否也會(huì)存在顯著性別差異?如果這些疲勞特征存在顯著性別差異,是否可以將其作為性別特征建立模型進(jìn)行男女駕駛員性別鑒別呢?
為了驗(yàn)證這些問(wèn)題,本文分別采用了4個(gè)眼動(dòng)特征、3個(gè)腦電特征以及4個(gè)眼動(dòng)與腦電的混合特征來(lái)進(jìn)行疲勞檢測(cè)。先從這11個(gè)特征中篩選出檢測(cè)穩(wěn)定的疲勞特征,然后分析這些疲勞特征是否存在顯著性別差異;如果存在具有顯著性別差異的特征,則以這些特征建立模型對(duì)男女駕駛員進(jìn)行性別識(shí)別,分析其識(shí)別效果。
1 疲勞駕駛實(shí)驗(yàn)
1.1 實(shí)驗(yàn)?zāi)J?/p>
實(shí)驗(yàn)中選取了30名年齡在19~21歲的在校大學(xué)生(男生20名、女生10名)作為受試者。受試者坐在一間屏蔽室中,通過(guò)實(shí)物方向盤(pán)操控前方電腦中的模擬駕駛過(guò)程。整個(gè)實(shí)驗(yàn)分為清醒駕駛和疲勞駕駛2個(gè)階段進(jìn)行,實(shí)驗(yàn)時(shí)間選擇下午。受試者試駕5分鐘后,實(shí)驗(yàn)員開(kāi)始采集受試者的眼動(dòng)和腦電數(shù)據(jù)。采集時(shí)間為60分鐘。將實(shí)驗(yàn)開(kāi)始采集數(shù)據(jù)后的10分鐘的數(shù)據(jù)定義為清醒狀態(tài)數(shù)據(jù),實(shí)驗(yàn)結(jié)束前10分鐘數(shù)據(jù)定義為疲勞狀態(tài)數(shù)據(jù)。實(shí)驗(yàn)過(guò)程中,具體實(shí)驗(yàn)平臺(tái)、設(shè)備以及腦電電極分布如圖1所示。
受試者戴著腦電設(shè)備和眼動(dòng)設(shè)備來(lái)同步采集腦電和眼動(dòng)信號(hào)。眼球追蹤儀負(fù)責(zé)采集眼動(dòng)信號(hào),配套的D-lab軟件則負(fù)責(zé)對(duì)眼動(dòng)信號(hào)進(jìn)行預(yù)處理,D-lab軟件的采樣頻率設(shè)置為25 Hz;Neuroscan公司的32導(dǎo)聯(lián)腦電電極帽負(fù)責(zé)獲取受試者的腦電信號(hào),scan4.3軟件負(fù)責(zé)收集腦電信號(hào)并對(duì)腦電信號(hào)進(jìn)行預(yù)處理,電極帽采樣頻率為1 000 Hz。
采集30例實(shí)驗(yàn)者的數(shù)據(jù)后,由于采集到的實(shí)驗(yàn)樣本中有部分樣本數(shù)據(jù)存在一定缺失值,本文只采用了16例受試者的樣本數(shù)據(jù)(其中男女各8名),共320個(gè)樣本。其中240個(gè)作為訓(xùn)練樣本,80個(gè)作為測(cè)試樣本。這16例樣本數(shù)據(jù)將用于疲勞檢測(cè)模型和性別識(shí)別模型。
1.2 疲勞特征的選取
對(duì)于眼動(dòng)數(shù)據(jù),本文選取了清醒狀態(tài)和疲勞狀態(tài)有明顯差異性的4個(gè)疲勞特征,分別為眼瞼閉合的百分比Perclos,掃視長(zhǎng)度s_len,瞳孔面積e_area及眨眼時(shí)間均值t_zy。對(duì)于腦電數(shù)據(jù),參考MU Zhendong等人[14]采用的疲勞特征,本文利用小波熵函數(shù)提取受試者腦電疲勞特征,然后分別抽取Fp1、Fp2兩個(gè)電極的腦電疲勞特征(簡(jiǎn)稱(chēng)2導(dǎo))和T5、TP7、TP8、FP1四個(gè)電極的腦電疲勞特征(簡(jiǎn)稱(chēng)4導(dǎo))。此外,根據(jù)作者前期的研究結(jié)果[9],本文將從腦電極中的10個(gè)電極(CP4、TP8、T5、P3、Pz、P4、T6、O1、Oz、O2)(簡(jiǎn)稱(chēng)10導(dǎo))上提取的腦電特征作為疲勞特征。作者前期研究發(fā)現(xiàn),采用10導(dǎo)作為疲勞特征進(jìn)行疲勞檢測(cè)效果比2導(dǎo)、4導(dǎo)更好,因此,本文采用眼動(dòng)特征和10導(dǎo)的混合特征,分別為perclos+10 導(dǎo)(簡(jiǎn)稱(chēng)p_10)、s_len+10 導(dǎo)(簡(jiǎn)稱(chēng)s_len_10) ,e_area+10導(dǎo)(簡(jiǎn)稱(chēng)e_area_10) 及t_zy+10導(dǎo)(簡(jiǎn)稱(chēng)t_zy_10) 。具體選取的疲勞特征如表1所示。
2 方法
為了分析在駕駛環(huán)境下基于眼動(dòng)和腦電的疲勞特征是否存在顯著性別差異性,本文采用KNN(KNearestNeighbor) 分類(lèi)算法,分別采用眼動(dòng)特征、腦電特征以及眼動(dòng)與腦電的混合特征來(lái)進(jìn)行疲勞檢測(cè)。首先分析疲勞檢測(cè)中這些疲勞特征是否存在顯著性別差異。如果存在部分疲勞特征有顯著性別差異,則將它們指定為性別識(shí)別特征;再采用KNN算法建立基于性別識(shí)別特征的性別識(shí)別模型,對(duì)男女駕駛員進(jìn)行性別識(shí)別。具體實(shí)現(xiàn)流程如圖2所示。
在建立檢測(cè)模型時(shí),本文都采用了KNN 算法。KNN法是一個(gè)理論上比較成熟的方法,也是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法之一。KNN算法的核心思想是:如果一個(gè)樣本在特征空間中的K個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類(lèi)別,則該樣本也屬于這個(gè)類(lèi)別,并具有這個(gè)類(lèi)別上樣本的特性。KNN分類(lèi)算法包括以下4個(gè)步驟:
①準(zhǔn)備數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。
②計(jì)算測(cè)試樣本點(diǎn)到其他每個(gè)樣本點(diǎn)的距離。
③對(duì)每個(gè)距離進(jìn)行排序,然后選擇出距離最小的K個(gè)點(diǎn)。
④對(duì)K 個(gè)點(diǎn)所屬的類(lèi)別進(jìn)行比較,根據(jù)少數(shù)服從多數(shù)的原則,將測(cè)試樣本點(diǎn)歸入在K 個(gè)點(diǎn)中占比最高的那一類(lèi)。
其中點(diǎn)距離常采用的是歐式距離,歐式距離的計(jì)算公式為:
而K 值的選取則通過(guò)交叉驗(yàn)證,從選取一個(gè)較小的K 值開(kāi)始,不斷增加K 的值,然后計(jì)算驗(yàn)證集合的方差,最終找到一個(gè)比較合適的K 值。
3 結(jié)果分析
3.1 比較不同疲勞檢測(cè)模型對(duì)男生和女生檢測(cè)的穩(wěn)定性
為了判斷疲勞檢測(cè)模型對(duì)所有男生(女生)的檢測(cè)率變化程度,本文采用了變異系數(shù)指標(biāo)(變異系數(shù)=標(biāo)準(zhǔn)差/均值)。如果變異系數(shù)小,則檢測(cè)模型具有較高穩(wěn)定性;反之,則模型具有較低穩(wěn)定性。一般情況下,在進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析時(shí),如果變異系數(shù)小于0.1,說(shuō)明一組數(shù)據(jù)具有弱變異性。本文計(jì)算出男生和女生采用不同疲勞檢測(cè)模型的檢測(cè)率變異系數(shù),結(jié)果如表2所示。
從表2中可以看出,對(duì)于男生來(lái)說(shuō),當(dāng)疲勞特征分別為e_area,s_len_10,t_zy_10時(shí)建立的檢測(cè)模型,其檢測(cè)率的變異系數(shù)小于0.1,則檢測(cè)模型對(duì)男生的檢測(cè)率相對(duì)來(lái)說(shuō)較為穩(wěn)定。而對(duì)于女生而言,當(dāng)疲勞特征分別為10導(dǎo),s_len_10,e_area_10時(shí)建立的檢測(cè)模型,其檢測(cè)率的變異系數(shù)小于0.1,則檢測(cè)模型對(duì)女生的檢測(cè)率相對(duì)來(lái)說(shuō)較為穩(wěn)定。
3.2 不同疲勞特征的性別差異性比較
在考慮模型穩(wěn)定性的基礎(chǔ)上,圖3列出了分別基于e_area、s_len_10、t_zy_10、10 導(dǎo)、e_area_10 疲勞特征的檢測(cè)模型對(duì)男生和女生的檢測(cè)率均值。
從圖3可以看出,男生和女生相同的是:除了采用e_area特征的檢測(cè)模型檢測(cè)率低于70%外,采用其他4個(gè)疲勞特征建立的模型檢測(cè)率都較高。并且女生的平均檢測(cè)率普遍大于男生的平均檢測(cè)率。這是由于在駕駛過(guò)程中,男性駕駛員的抗疲勞能力要強(qiáng)于女性駕駛員,女性駕駛員的疲勞狀態(tài)隨著駕駛時(shí)間延長(zhǎng)而緩慢增加,疲勞特征較明顯;男性駕駛員則能在駕駛過(guò)程保持長(zhǎng)的興奮狀態(tài),疲勞特征不明顯。為了判斷這5個(gè)疲勞特征是否具有顯著的性別差異,本文將基于這5個(gè)疲勞特征的模型進(jìn)行檢測(cè)的男生組和女生組檢測(cè)率兩組數(shù)據(jù)進(jìn)行T檢驗(yàn)。當(dāng)采用e_area_10作為疲勞特征時(shí),男生和女生的檢測(cè)率兩組數(shù)T 檢驗(yàn)的p值為0.039<0.05,表明男生和女生組檢測(cè)率存在顯著差異;而采用其他疲勞特征時(shí),T 檢驗(yàn)的p 值都大于0.05,由此判斷,e_area_10特征是存在顯著性別差異的,而其他疲勞特征都不存在顯著性別差異。
3.3 以e_area_10 為特征建立性別識(shí)別模型進(jìn)行性別識(shí)別
由于e_area_10特征是存在顯著性別差異的,因此,本文將e_area_10作為性別識(shí)別特征,采用KNN算法建立基于e_area_10的性別檢測(cè)模型。通過(guò)該檢測(cè)模型來(lái)識(shí)別樣本數(shù)據(jù)的性別。實(shí)驗(yàn)樣本數(shù)據(jù)為16例受試者的樣本數(shù)據(jù)(其中男女各8名),共320個(gè)樣本。其中240個(gè)作為訓(xùn)練樣本,80個(gè)作為測(cè)試樣本。為了評(píng)估模型的預(yù)測(cè)性能,獲取KNN模型的最佳k 參數(shù),本文采用了5折交叉驗(yàn)證。不同k 值對(duì)應(yīng)的模型檢測(cè)率結(jié)果如圖4所示。從圖4可以看出,當(dāng)k=3時(shí),模型的識(shí)別率最高,為85.13%。這表明基于e_area_10 的性別檢測(cè)模型能有效識(shí)別受試者的性別。
性別識(shí)別技術(shù)主要包括通過(guò)說(shuō)話人的聲音特征、人臉特征、步態(tài)特征等來(lái)進(jìn)行性別識(shí)別。這些技術(shù)研究成果也較豐富。劉遵雄和馬汝成提出使用特征臉和最小二乘支持向量機(jī)分類(lèi)器相結(jié)合的人臉性別分類(lèi)方法,分類(lèi)準(zhǔn)確率為94.75%[16]。張德等人則采用局部熵描述子對(duì)步態(tài)運(yùn)動(dòng)歷史圖像進(jìn)行信息提取,利用該特征在CASIA B 步態(tài)數(shù)據(jù)庫(kù)上進(jìn)行性別分類(lèi)實(shí)驗(yàn)[17]。邱晨等人通過(guò)提取多音頻特征,使用支持向量機(jī)對(duì)音頻信號(hào)進(jìn)行分類(lèi)來(lái)識(shí)別性別,該方法的識(shí)別率也可以達(dá)到96.1%以上[18]。其中人臉作為性別識(shí)別技術(shù)的主要特征,研究者對(duì)它的研究也是非常多,研究者為了提高基于人臉特征的性別模型的識(shí)別率,在模型中嘗試了很多分類(lèi)器,包括KNN、SVM、BP和Ada?Boost等。本文將通過(guò)e_area_10特征進(jìn)行性別識(shí)別的結(jié)果與以往研究者以人臉為特征,采用單個(gè)分類(lèi)算法進(jìn)行性別識(shí)別的結(jié)果進(jìn)行對(duì)比,比較結(jié)果如表3所示。從表3可以看出,本文采用KNN算法,以e_area_10為特征的識(shí)別結(jié)果與人臉識(shí)別中采用SVM算法的識(shí)別結(jié)果類(lèi)似,說(shuō)明取得了較好的識(shí)別效果。
4 結(jié)論
為了研究疲勞檢測(cè)采用的疲勞特征是否存在性別差異以及是否能使用這些具有性別差異性的疲勞特征進(jìn)行性別識(shí)別,本文利用具有性別差異性的e_area_10特征作為性別識(shí)別特征,采用KNN算法建立了基于e_area_10的性別檢測(cè)模型對(duì)駕駛員進(jìn)行性別鑒別。本文得出的主要結(jié)論包括:
1) 采用了眼動(dòng)特征、腦電特征以及眼動(dòng)與腦電的混合特征來(lái)進(jìn)行疲勞檢測(cè),分析出只有混合特征e_area_10存在顯著性別差異,其他特征都不存在顯著性別差異。
2) 建立了基于e_area_10的性別識(shí)別模型對(duì)男女駕駛員進(jìn)行性別識(shí)別。當(dāng)k 取3時(shí),識(shí)別模型的識(shí)別準(zhǔn)確率最高,為85.13%。說(shuō)明基于e_area_10的性別識(shí)別模型能有效識(shí)別男女。為了驗(yàn)證這個(gè)結(jié)論是否在樣本數(shù)更多的情況下也成立,后期筆者將進(jìn)一步加大實(shí)驗(yàn)樣本來(lái)驗(yàn)證本文實(shí)驗(yàn)結(jié)論。
同時(shí),這一結(jié)論也存在一些不足之處。由于實(shí)驗(yàn)是在模擬駕駛環(huán)境下進(jìn)行的,受測(cè)試樣本數(shù)量等實(shí)驗(yàn)條件的限制,測(cè)試結(jié)果與實(shí)際情況存在一定的偏差。為了進(jìn)一步提高模型的識(shí)別精度,本文作者將進(jìn)一步采用其他分類(lèi)算法對(duì)模型進(jìn)行改進(jìn)。