郭 城,姚保峰,蔡紹峰
(蚌埠學院 計算機與信息工程學院,安徽 蚌埠 233000)
歐盟發(fā)布的一項數據顯示,交通事故已經超過戰(zhàn)爭成為僅次于疾病的第二大致死因素。對引發(fā)交通事故的原因進行分析,我們可以發(fā)現導致交通事故的因素有兩類,一類為外部因素,如路況、車況、天氣因素等;另一類為駕駛員自身的主客觀因素,如酒駕、毒駕、開車不專心、過度疲勞等。在這兩類因素中,后者是主要的因素,因為有超過一半的事故是駕駛員分心造成的。如果有一種方法能夠監(jiān)測駕駛員是否存在分心駕駛的行為并作出預警,那么交通事故也一定會明顯下降。將現代技術手段應用于駕駛員駕駛狀態(tài)監(jiān)測,將成為保障駕乘人員人身和財產安全的重要手段。
分心駕駛是一種非常危險并極易造成車毀人亡的危險行為,被多個國家列為引發(fā)交通事故的常見因素。隨著各種新穎有趣的車載多媒體設備的應用與更新,分心駕駛問題越來越嚴重,因此,研究駕駛員分心駕駛行為監(jiān)測技術,并對駕駛員及時進行提醒很有必要。
學術界迄今尚無一致的分心駕駛定義。當前學術界一般采用澳大利亞道委會提出的定義,即將分心駕駛定義為在排除酒精、疲勞、藥物等因素的情況下,駕駛員自主或非自主地把注意力從駕駛任務上轉移到能夠造成駕駛技能及預判能力降低的非駕駛任務上。換言之,分心駕駛是駕駛員在主客觀因素作用下進入的一種不集中注意力的狀態(tài)。根據分心產生的原因,通常將分心駕駛行為分為三種,一種是因駕駛員的非駕駛動作,如將手從方向盤上移開造成的分心,被稱為操作分心,最典型的表現是開車打電話等;一種是駕駛員的視線偏離或離開汽車的前進方向的分心,被稱為視覺分心,這種分心會導致駕駛員反應時間變長和車輛偏離正常行駛路線,最典型的表現為開車看手機、調節(jié)車載多媒體設備等動作;一種是駕駛員的思維判斷能力不能完全集中在操控汽車行駛主任務的分心,被稱為認知分心,這種分心會導致駕駛員的注意力下降,大腦判斷能力遲鈍,降低駕駛人員對車輛周圍情況的監(jiān)測能力,最典型的表現是駕駛員開車時說話、思考其他問題等。值得注意的是,這三種分心在日常駕駛中并不是單獨出現的,很多時候是成對出現的,如駕駛中的打電話行為,手拿話機會致操作分心,講話時會占用大腦的一部分思維資源而造成認知分心。
如前所述,當駕駛員進入分心狀態(tài)后,會出現足以影響駕乘人員人身安全的注意力轉移狀態(tài),其本質是駕駛員將部分或者全部注意力分散到駕駛的次任務上,進而影響駕駛的主任務動作,并由此產生一些駕駛員外在的生理表現和車輛行駛軌跡變化。據此可知,分心駕駛的監(jiān)測應圍繞駕駛員外在生理表現和車輛行駛軌跡變化的監(jiān)測進行。這些外在的表現可以分為駕駛員生理信號的特征表現、駕駛員的外在特征表現、車輛行駛特征表現等。根據這些外在的特征表現,分心駕駛監(jiān)測技術分為直接監(jiān)測和間接監(jiān)測。
間接監(jiān)測是指運用多種傳感器對車輛的行駛狀態(tài)特征進行監(jiān)測,而不是直接進行駕駛員狀態(tài)數據的獲取,如監(jiān)測車輛行駛時的速度、軌跡、加速度、相對位置和司機在方向盤上的抓握力等,以此來判定駕駛員的狀態(tài)。駕駛員操控汽車的動作行為會直接反映在汽車的行駛狀態(tài)上,如果駕駛員出現分心的話其操控行為會導致汽車行駛狀態(tài)的改變,通過監(jiān)測這些改變就能夠判斷出駕駛員當時所處的狀態(tài)。文獻[1]通過駕駛模擬器進行認知分心對車輛操控影響實驗,結果表明方向盤轉動角變化的頻率與認知分心程度為正相關;油門開度,制動踏板位置均值和方差,加速度標準差等參數在駕駛員處于認知分心狀態(tài)時均變大,導致跟車穩(wěn)定性降低。
間接監(jiān)測的優(yōu)點是可以在不接觸駕駛員的情況下進行監(jiān)測,對駕駛員駕駛汽車不產生影響。同時這種監(jiān)測方式所需要的傳感器一般較為常見,可以有效控制監(jiān)測成本。但這種方法也存在一定不足,主要是受車輛狀況、司機操作習慣等因素的影響較大,監(jiān)測結果的準確性還有待進一步提升。另外,目前在間接監(jiān)測方法研究中采集的樣本數據不夠豐富,研究方法有待改進。
直接監(jiān)測是指利用多種傳感器,或者運用AI算法直接獲取駕駛員本人狀態(tài)數據的監(jiān)測?,F階段的直接監(jiān)測技術主要圍繞駕駛員生理參數、視覺特征和機器視覺特征等方面進行。
2.2.1 基于駕駛員生理參數的監(jiān)測技術
這類監(jiān)測技術需要使用專門的設備來監(jiān)測駕駛員心電信號、腦電波信號、肌電信號、大腦皮層激活信號等生理參數,然后提取參數中的特征進行統(tǒng)計分析并與正常狀態(tài)下的駕駛參數進行對比分析,進而得出駕駛員是否處在分心狀態(tài)的結論。例如,趙國朕在駕駛模擬器上提取了駕駛員在認知分心狀態(tài)下和正常駕駛狀態(tài)下的腦電信號,通過研究分析得出從腦頂葉采集的信號中Beta波與Alpha波的比值能夠很好地區(qū)分出正常駕駛與認知分心駕駛狀態(tài)的結論,并利用機器學習算法搭建了能夠對認知造成的分心駕駛進行識別的模型,其準確率高達80%以上[2]。此種方法一般采取接觸式的方式進行駕駛員生理參數的獲取,所以穩(wěn)定性和準確性都比較高。但此種方法也存在著一些不足,一是所需的采集設備一般較大且價格不菲,經濟性不高;二是現階段對于這種方法的研究大多采用的是模擬器數據,實車數據較少;三是接觸性采集設備工作時可能會影響到正常駕駛。
2.2.2 基于駕駛員視覺特征的監(jiān)測技術
視覺是人們獲取周圍環(huán)境信息最為重要的方式之一,特別是對于司機這一特定人群來說獲取道路、車況等信息的唯一方式就是眼睛。據研究,駕駛員在駕駛汽車時視覺信息源提供的信息量占據了所有信息量的80%[3]。閉眼、眨眼、掃視、注視等眼部動作統(tǒng)稱為眼動行為,根據這些行為研究人員又設定了相應的眼動參數。例如,掃視的左右擺幅大小以及時長、注視的持續(xù)時間、瞳孔面積的占比、眼瞼閉合時間、眨眼次數等。周揚等提出了一種能判定認知分心的模型,他們運用隨機森林算法分析了模擬駕駛器上采集來的駕駛員眨眼時間、注視時長兩個指標,通過模擬駕駛試驗得出隨著認知分心的增強,眨眼時長會增加、注視時長會減少,模型的平均識別率為83.69%的結論[4]。對駕駛員眼動特征的追蹤、獲取、判定是基于視覺特征監(jiān)測技術的核心要素,此種方法通常通過眼動儀來獲取駕駛人的眼動特征數據,對分心駕駛的判別率較高。但此種方式也存在著以下幾個方面的問題:一是魯棒性不高,如駕駛員戴墨鏡的情況下就無法對眼動特征進行監(jiān)測獲??;二是因眼動特征較多,運用此種方法去判別分心的指標尚不統(tǒng)一,且各種指標的閾值也未確定;三是當前研究多利用人工干預的方法讓駕駛員進入分心狀態(tài),然后再進行數據的獲取,這種強制分心模式下的數據難免會與真實駕駛狀態(tài)下的分心過程存在差異。
2.2.3 基于機器視覺特征的監(jiān)測技術
機器視覺特征監(jiān)測技術是指根據攝像頭拍攝的駕駛員圖像信息,運用圖像處理算法,來判定駕駛員的狀態(tài)是否處于分心之中的監(jiān)測技術。這種方法一般分為兩個過程塊,一個是訓練過程塊,另一個是測試過程塊。訓練過程塊中先是對攝像頭采集的圖像數據進行濾波、去除噪聲等的預處理,隨后提取圖像的特征,最后把提取到的特征運用SVM、K-means等聚類算法進行分類識別訓練。測試過程塊是利用訓練好的模型,在測試集上進行測試得出最終結果。卜慶志等在研究中首先對獲取的圖像進行預處理(去噪、增強、歸一化),隨后利用梯度直方圖(HOG)和支持向量機(SVM)構建了一種駕駛員行為監(jiān)測算法,進行駕駛員行為監(jiān)測[5]。
近年來在AI圖像處理領域又出現了一道新的曙光——深度學習,圖像處理領域卷積神經網絡算法的精度和魯棒性不斷提高,這為基于機器視覺特征的駕駛員分心監(jiān)測技術帶來了新的方向。陳軍等提出了一種改進型的CNN分心監(jiān)測模型,先用輕型CNN網絡進行原始圖像篩查,再用VGG進行精確識別,準確率達到93.3%[6]。Baheti等在研究中不僅關注卷積神經網絡的精確度,同時還關注了網絡在存儲和速度方面的效率問題,他們利用谷歌公司提出的深度可分離卷積核,構建了名為MobileVGG的一種新體系結構,其模型僅有2.2M的參數,在AUC和Statefarm數據集上分別達到了95.24%和99.75%的精度,而計算復雜度和內存需求卻更低[7]。Moslemi在研究中考慮了時間維度信息,使用3D卷積神經網絡與光流法來改善駕駛員分心監(jiān)測,分別在光流輸入和RGB輸入上訓練了兩個3D網絡,判斷駕駛員的分心狀態(tài)[8]。
因深度學習算法在分心監(jiān)測領域有著更高的魯棒性和準確性,所以機器視覺特征的監(jiān)測技術主要研究方向在深度學習。但現階段使用深度學習進行分心監(jiān)測的算法還存在著一些問題:①現階段用于訓練模型的數據集都只包含了特定的一些分心動作,而在真實環(huán)境中駕駛員分心駕駛的行為多種多樣,這就導致出現開放集識別的問題;②模型設計出來后需要大量的訓練,其過程較為繁雜;③模型運行時占用的機器運行資源較多,而在汽車上的機器多為資源受限的嵌入式設備,難以在真實環(huán)境中應用;④大部分研究仍停留在使用傳統(tǒng)的CNN結構上,這種結構只能分析靜態(tài)的單張圖片,而駕駛員的分心行為是一個動態(tài)變化的過程,大部分模型無法使用輸入模型的前后信息進行分心監(jiān)測,這會導致漏檢、錯檢的問題。
分心駕駛一直是導致交通事故發(fā)生的主要原因之一,隨著車內多媒體設備的多樣化,分心駕駛現象有逐漸增多的趨勢。國內外針對駕駛員分心行為監(jiān)測的主要方法有兩類,雖然這兩類方法都有各自的優(yōu)勢,但也各有局限性,監(jiān)測的精度和魯棒性都有待提高。
從本文研究可以得到以下結論:在不同的監(jiān)測技術中,用于識別分心的參數及其閾值尚未統(tǒng)一,駕駛員的分心程度還需劃分,國內外尚未形成一套科學的評價體系為分心駕駛的監(jiān)測與預警,為運用自動駕駛技術自動接管分心中的駕駛員等提供參考。同時也可以發(fā)現以下趨勢:①分心駕駛的研究應該從預防、監(jiān)測、解除三個方面同時進行,而現階段研究較多關注監(jiān)測,對分心的預防和解除的研究將是今后的重要方向。②現階段各種監(jiān)測技術的準確性、魯棒性和監(jiān)測模型效率還有進一步提高的潛力,可以更多采用多證據源信息融合監(jiān)測法,如融合車輛的行駛狀態(tài)特征和駕駛員的眼動特征、融合機器視覺特征與車輛行駛狀態(tài)特征等進行監(jiān)測。③機器視覺監(jiān)測研究將是今后研究的熱門領域,一是要關注對現有模型的剪枝、壓縮和提高訓練效率,使其能部署在車內的嵌入式設備中;二是要考慮利用輸入模型數據的上下文信息綜合判斷分心的狀態(tài),目前出現了針對分心駕駛監(jiān)測的3D結構CNN網絡,但其網絡參數規(guī)模相比原有CNN的規(guī)模龐大許多,而且3D卷積神經網絡只能處理固定時長的視頻,忽略了時間維度結構的問題,還有較大發(fā)展空間。④現有監(jiān)測技術中多缺少針對實車駕駛數據的分析,訓練神經網絡模型的分心駕駛數據集仍需加強。