周理想,曾 娟
(武漢理工大學(xué)汽車(chē)工程學(xué)院,湖北 武漢 430070)
在汽車(chē)行駛過(guò)程中,危險(xiǎn)物通常以外顯刺激的方式呈現(xiàn)。比較典型的場(chǎng)景有前方車(chē)輛突然剎車(chē)、臨近車(chē)道上車(chē)輛突然變道、行人橫穿馬路等。而駕駛過(guò)程中80%的有用信息依靠眼睛獲取,其余感官獲取信息比例只占20%[1],因此,駕駛員視覺(jué)搜索模式的研究對(duì)于揭示交通事故的機(jī)理、主動(dòng)安全技術(shù)開(kāi)發(fā)具有非常重要的意義。
對(duì)于出現(xiàn)在中央視野和外周視野的刺激,駕駛員認(rèn)知加工過(guò)程是不同的。神經(jīng)生理學(xué)研究表明[2]:中心視野的信息由視覺(jué)皮層來(lái)處理,而外周視野的信息由大腦皮層下通道處理。由于光流效應(yīng),駕駛員在識(shí)別外周視野刺激物時(shí),會(huì)對(duì)自己的車(chē)速產(chǎn)生錯(cuò)覺(jué),眼睛產(chǎn)生感知的深度線索,紋理梯度與距離成反比[3]。而外周視野空間的部分信息發(fā)生改變,駕駛員會(huì)產(chǎn)生視覺(jué)的選擇性注意[4],即視覺(jué)對(duì)信號(hào)產(chǎn)生有選擇的處理和加工。方向、運(yùn)動(dòng)、空間頻率和最小可感知的差異都對(duì)外源性眼睛跳躍有顯著貢獻(xiàn),在中央視野,刺激物直接落在視網(wǎng)膜中央凹視覺(jué)區(qū)內(nèi),優(yōu)先獲得注意力;在外周視野,刺激物會(huì)引起眼球自動(dòng)朝向反應(yīng)[5],但目前的研究還無(wú)法確定眼動(dòng)和注意機(jī)制發(fā)生的先后順序[6]。
KRENDEL等[7]根據(jù)搜索時(shí)間t以及累積搜索概率F(t),提出了單目標(biāo)隨機(jī)搜索模型。NEISSER[8]提出單目標(biāo)系統(tǒng)搜索策略,特征為掃視點(diǎn)嚴(yán)格不重復(fù),即第i個(gè)掃視點(diǎn)只能隨機(jī)分布在前i-1個(gè)掃視點(diǎn)沒(méi)有覆蓋的區(qū)域,并提出累積概率與搜索時(shí)間之間直線關(guān)系函數(shù)。ENGEL[9]給出了視覺(jué)搜索作業(yè)中發(fā)現(xiàn)一個(gè)目標(biāo)所需的平均時(shí)間。隨后,MORAWSKI等[10]進(jìn)一步發(fā)展了單目標(biāo)隨機(jī)視覺(jué)搜索模型,得到了比較完整的發(fā)現(xiàn)目標(biāo)累積概率與搜索時(shí)間的指數(shù)關(guān)系函數(shù)。ARANI等[11]提出了可變記憶效果模型,該模型非常復(fù)雜,包含了第i次掃視時(shí)回憶第i-1個(gè)掃視點(diǎn)的概率。CORBETTA等[12]研究了眼動(dòng)與注意轉(zhuǎn)移機(jī)制的關(guān)系。視覺(jué)搜索是通過(guò)一系列眼跳(saccades)和注視(fixation)獲取外界刺激信息,二者在選擇視覺(jué)信息、找到注視目標(biāo)以及忽略無(wú)關(guān)信息的過(guò)程中都發(fā)揮作用,但二者相互獨(dú)立,同時(shí)也相互影響。眼跳是對(duì)目標(biāo)的外顯朝向,而注意是對(duì)選擇物體過(guò)程的內(nèi)隱朝向。
近60年來(lái),學(xué)術(shù)界基本都通過(guò)視覺(jué)搜索時(shí)間分布曲線來(lái)判斷視覺(jué)搜索策略。采用擬合分布曲線最大的缺陷在于樣本數(shù)量具有局限性。當(dāng)訓(xùn)練樣本無(wú)限多時(shí),訓(xùn)練誤差才收斂于實(shí)際風(fēng)險(xiǎn),然而在實(shí)際中,樣本數(shù)量通常都是有限的[13]。采用傳統(tǒng)數(shù)值擬合的方式判斷視覺(jué)搜索模式存在著規(guī)則制定困難、推廣實(shí)用性差的局限性。另外在駕駛行為中,一個(gè)典型的場(chǎng)景是駕駛主任務(wù)和外周視野刺激物雙重任務(wù)。隨著搜索目標(biāo)個(gè)數(shù)的增加及其相互間的交互,擬合視覺(jué)搜索績(jī)效模型的有效性及可操作性都受影響[14]。因此,對(duì)多目標(biāo)視覺(jué)搜索模式的影響因子交互關(guān)系及獨(dú)立性問(wèn)題的研究,更有效、可行的算法設(shè)計(jì)是該領(lǐng)域研究的難點(diǎn)所在。
21世紀(jì)以來(lái),隨著信息跟蹤技術(shù)和通信技術(shù)的迅猛發(fā)展,人因工程領(lǐng)域內(nèi)大量的視覺(jué)信息以計(jì)算機(jī)可讀的形式存在,精準(zhǔn)的眼動(dòng)數(shù)據(jù)實(shí)時(shí)采集和存儲(chǔ)為機(jī)器學(xué)習(xí)的數(shù)據(jù)處理方法提供了充分的資源。在這種情況下,以機(jī)器學(xué)習(xí)技術(shù)為主的視覺(jué)搜索分類(lèi)技術(shù)逐步取代基于擬合曲線的統(tǒng)計(jì)方法,成為機(jī)器視覺(jué)領(lǐng)域里的重點(diǎn)研究方向。
在機(jī)器視覺(jué)領(lǐng)域的分類(lèi)算法主要包括三類(lèi):①基于概率論和信息理論的分類(lèi)算法,如樸素貝葉斯算法(Na?ve Bayes,簡(jiǎn)稱“NB”)[15]、最大熵算法[16];②基于TFIDF權(quán)值計(jì)算方法的算法,包括Rocchio算法、TFIDF算法、K近鄰算法(簡(jiǎn)稱“KN”)[17];③基于知識(shí)學(xué)習(xí)的分類(lèi)算法,如決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱“ANN”)、支持向量機(jī)(簡(jiǎn)稱“SVM”)[18]。
同決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)算法相比,支持向量機(jī)基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,而不是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原理,因此不存在局部極小點(diǎn)問(wèn)題,避免了模型選擇、過(guò)學(xué)習(xí)的問(wèn)題,具有很強(qiáng)的泛化能力。SVM分類(lèi)算法的最大優(yōu)勢(shì)是針對(duì)樣本不足的問(wèn)題,在選取合適的和函數(shù)、懲罰函數(shù)的基礎(chǔ)上,仍然可以獲得較高的分類(lèi)正確率[19]。
針對(duì)駕駛過(guò)程中外周視野目標(biāo)搜索問(wèn)題,本研究將探討視覺(jué)搜索模式中影響因子的交互關(guān)系,在此基礎(chǔ)上,采用SVM分類(lèi)方法構(gòu)建視覺(jué)搜索績(jī)效的判斷模型。
本實(shí)驗(yàn)采用實(shí)車(chē)場(chǎng)地測(cè)試的方式。駕駛員頭戴眼動(dòng)儀,駕駛汽車(chē)通過(guò)道路寬10 m的雙向道路。道路全長(zhǎng)1 000 m。實(shí)驗(yàn)按速度分為3個(gè)水平:v=20 km/h、v=25 km/h、v=30 km/h。受試者按照性別、年齡平均分成3組,每組10人。實(shí)驗(yàn)場(chǎng)景包括2個(gè)干擾場(chǎng)景和1個(gè)實(shí)驗(yàn)場(chǎng)景:①干擾場(chǎng)景1,對(duì)向車(chē)道上有轎車(chē)變道;②干擾場(chǎng)景2,前方車(chē)輛減速;③實(shí)驗(yàn)場(chǎng)景,當(dāng)車(chē)輛距離設(shè)定位置10 m時(shí),行人從固定位置橫穿馬路,行人速度為10 km/h。行人起始點(diǎn)位于駕駛員外周視野內(nèi)。觀察駕駛員是否有反應(yīng),對(duì)應(yīng)指標(biāo)為駕駛員眼動(dòng)指標(biāo)、轉(zhuǎn)向指標(biāo)和踩剎車(chē)指標(biāo)。
受試者為30名有經(jīng)驗(yàn)的駕駛員(駕齡大于3年)。男性駕駛員25名,女性駕駛員5名,年齡分布20~60歲。受試者此前均未接受過(guò)類(lèi)似實(shí)驗(yàn)。
本實(shí)驗(yàn)選用Tobii Pro Glasses 2眼鏡式眼動(dòng)儀,如圖1所示。采用的實(shí)驗(yàn)車(chē)是廣州本田思鉑睿。
圖1 Tobii Pro Glasses 2眼鏡式眼動(dòng)儀
實(shí)驗(yàn)流程如下:①駕駛員戴好眼動(dòng)儀,按照指定路線行駛400 m路程,副駕駛的工作人員講解實(shí)驗(yàn)注意事項(xiàng)。②由場(chǎng)邊工作人員指引到實(shí)驗(yàn)車(chē)道,加速到指定車(chē)速。依次經(jīng)過(guò)上述三個(gè)場(chǎng)景。每位受試者僅參與一次實(shí)驗(yàn)。眼動(dòng)儀場(chǎng)景攝像頭記錄整個(gè)實(shí)驗(yàn)過(guò)程,并將視頻數(shù)據(jù)儲(chǔ)存在SD儲(chǔ)存卡中。③實(shí)驗(yàn)結(jié)束后,由工作人員將車(chē)開(kāi)回指定的起點(diǎn),重復(fù)上述過(guò)程,直到所有實(shí)驗(yàn)組結(jié)束。
實(shí)驗(yàn)樣本共30個(gè),其中有效實(shí)驗(yàn)樣本24個(gè),無(wú)效實(shí)驗(yàn)樣本6個(gè)。在有效實(shí)驗(yàn)樣本中,踩下制動(dòng)踏板的樣本共20個(gè),未踩下制動(dòng)踏板的樣本4個(gè)。
踩下制動(dòng)踏板和未踩下制動(dòng)踏板受試者累計(jì)注視時(shí)間對(duì)比如圖2所示。A組為踩下制動(dòng)踏板的樣本組,B組為未踩下制動(dòng)踏板的樣本組。
圖2 累計(jì)注視時(shí)間對(duì)比
由圖2可看出,A組樣本的累計(jì)注視時(shí)間最低值為922 ms,B組最低值則為743 ms,最高值為1 444 ms,A組75%的樣本累計(jì)注視時(shí)間在1 420~1 560 ms之間,A組在1 444 ms以上是高于B組樣本的,但是,A組累計(jì)注視時(shí)間中在922~1 444 ms這一值域之間的樣本和B組樣本是重合的。這說(shuō)明,累計(jì)注視時(shí)間不能單獨(dú)用來(lái)衡量注意的加工行為是否發(fā)生(即是否踩下自動(dòng)踏板)。
進(jìn)一步分析眼跳頻率,踩下制動(dòng)踏板和未踩下制動(dòng)踏板受試者眼跳頻率分布如圖3所示。A組為踩下制動(dòng)踏板的樣本組,B組為未踩下制動(dòng)踏板的樣本組。
圖3 受試者眼跳頻率分布圖
圖3 中A組為踩下制動(dòng)踏板的樣本組,認(rèn)定為注意到了外周視野的危險(xiǎn);B組為未踩下制動(dòng)踏板的樣本組,實(shí)驗(yàn)結(jié)束后訪談,4人均表示沒(méi)有注意到外周視野的危險(xiǎn)。A組受試者有2種視覺(jué)搜索模式,有12位受試者采用系統(tǒng)搜索模式,即僅眼跳1次便進(jìn)行信息加工,有8位受試者采用隨機(jī)搜索模式[14],多次眼跳,掃視點(diǎn)有重復(fù),有信息加工。而B(niǎo)組受試者多次眼跳過(guò)程中信息加工并未發(fā)生。兩者綜合說(shuō)明,在隨機(jī)搜索的過(guò)程中,信息的加工可能發(fā)生,也可能不發(fā)生。所以,眼跳頻率不能單獨(dú)用來(lái)衡量注意的加工行為是否發(fā)生。
踩下制動(dòng)踏板的受試者發(fā)生單次眼跳、兩次眼跳和三次眼跳時(shí)注視時(shí)間最大值分布如圖4所示。
圖4 踩下制動(dòng)踏板受試者單次注視時(shí)間最大值分布圖
從圖4看出,踩下制動(dòng)踏板的樣本中,在單次眼跳的樣本中75%的受試者單次注視時(shí)間最大值在1 469~2 560 ms之間,二次眼跳的樣本中單次注視時(shí)間最大值在732~1410ms之間,三次眼跳的樣本中單次注視時(shí)間最大值在849~1 134 ms之間,即單次眼跳要明顯高于發(fā)生二次和三次眼跳的樣本。無(wú)論是單次眼跳還是多次眼跳,踩下制動(dòng)踏板受試者單次注視時(shí)間的最大值的取值不低于732 ms;而對(duì)于未踩下制動(dòng)踏板的樣本,其單次注視時(shí)間的最大值均低于500 ms,即踩下制動(dòng)踏板的樣本的值域明顯高于未踩下制動(dòng)踏板樣本的值域。因此,單次注視時(shí)間可以作為信息加工是否發(fā)生的判斷因子。
對(duì)數(shù)據(jù)進(jìn)行SVM建模,首先需要提取特征變量。由于單次注視時(shí)間可以用來(lái)判斷信息的加工是否發(fā)生,因此,解釋變量選取為駕駛?cè)藛未巫⒁晻r(shí)間。
當(dāng)各個(gè)解釋變量之間的相關(guān)系數(shù)過(guò)高時(shí),可能會(huì)存在多重共線性問(wèn)題。通過(guò)相關(guān)系數(shù)矩陣觀察各個(gè)解釋變量之間的相關(guān)性,發(fā)現(xiàn)各個(gè)解釋變量之間的相關(guān)系數(shù)均低于0.4,基本上認(rèn)為在本研究中不存在多重共線性問(wèn)題。因此,適合建模需要。
SVM模型是一種基于統(tǒng)計(jì)學(xué)習(xí)理論用來(lái)解決分類(lèi)問(wèn)題的非參數(shù)方法,該模型最初被應(yīng)用于二分類(lèi)問(wèn)題且已經(jīng)被很多研究中所使用[20]。
根據(jù)模式識(shí)別理論,低維空間線性不可分的模式通過(guò)非線性映射到高維特征空間則可能實(shí)現(xiàn)線性可分,但是如果直接采用這種技術(shù)在高維空間進(jìn)行分類(lèi)或回歸,則存在確定非線性映射函數(shù)的形式和參數(shù)、特征空間維數(shù)等問(wèn)題,而最大的障礙則是在高維特征空間運(yùn)算時(shí)存在的“維數(shù)災(zāi)難”。采用核函數(shù)技術(shù)可以有效地解決這樣的問(wèn)題。
將被解釋變量設(shè)為駕駛?cè)耸欠癫认伦詣?dòng)踏板,即信息的加工是否發(fā)生,將踩下制動(dòng)踏板歸為正類(lèi),未踩下制動(dòng)踏板歸為負(fù)類(lèi)。將樣本分為訓(xùn)練集和測(cè)試集,其中各占50%。建立SVM模型,由于各個(gè)特征之間的相關(guān)系數(shù)較低,選擇多項(xiàng)式核函數(shù),擬合模型,預(yù)測(cè)并計(jì)算準(zhǔn)確率。
ROC曲線是根據(jù)二分類(lèi)方式(分界值或決定閾),以真陽(yáng)率為縱坐標(biāo),誤檢率為橫坐標(biāo)繪制的曲線。在計(jì)算出準(zhǔn)確率的基礎(chǔ)上,定義函數(shù)畫(huà)ROC圖,如圖5所示。
圖5 AUC-ROC曲線
從AUC-ROC曲線可以看出,SVM模型的真陽(yáng)率(TPR)為86.67%(圖中A點(diǎn)),這說(shuō)明,實(shí)際是正類(lèi)(踩下制動(dòng)踏板)中,有86.67%的正類(lèi)被SVM模型發(fā)現(xiàn)。SVM模型的誤檢率(FPR)為50%,這說(shuō)明,SVM模型誤認(rèn)為正類(lèi)的負(fù)實(shí)例(未踩下制動(dòng)踏板)占所有負(fù)實(shí)例的比例為50%。
AUC(Area Under Curve)被定義為ROC曲線下與坐標(biāo)軸圍成的面積,圖中AUC=0.711 54,表明SVM模型的預(yù)測(cè)能力較好但不夠完美,其中主要原因是未剎車(chē)的樣本量占比僅有14.81%且樣本量較少,使得模型對(duì)負(fù)類(lèi)實(shí)例的錯(cuò)分類(lèi)就十分敏感,模型預(yù)測(cè)的FPR大大提高。要解決這一問(wèn)題,可以使正負(fù)樣本的比例比較均勻或者提高樣本量。
因?yàn)樵诶塾?jì)注視時(shí)間922~1 444 ms這一值域內(nèi)注意的加工行為有可能發(fā)生,有可能未發(fā)生。因此,累計(jì)注視時(shí)間不能單獨(dú)用來(lái)衡量注意的信息加工行為是否發(fā)生。在隨機(jī)搜索的過(guò)程中,信息的加工可能發(fā)生,也可能不發(fā)生。因此,眼跳頻率不能用來(lái)衡量信息的加工是否發(fā)生。
踩下制動(dòng)踏板的樣本單次注視時(shí)間最大值的值域明顯大于未踩下制動(dòng)踏板樣本單次注視時(shí)間最大值的值域。因此,單次注視時(shí)間可以作為信息的加工是否發(fā)生的判斷因子。
對(duì)駕駛?cè)颂卣飨蛄窟M(jìn)行SVM的建模分析,得到SVM模型的真陽(yáng)率為86.67%。畫(huà)出的ROC圖中,AUC=0.711 54,表明SVM模型的預(yù)測(cè)能力較好但不夠完美,主要原因是未踩下制動(dòng)踏板的樣本量占比低且樣本量較少,使得模型對(duì)負(fù)類(lèi)實(shí)例的錯(cuò)分類(lèi)十分敏感,模型預(yù)測(cè)的誤檢率大大提高??梢允拐?fù)樣本的比例更加均勻或者提高樣本量來(lái)解決這一問(wèn)題。