檀亞寧 劉宏玉 金澤明
摘 要 隨著車聯(lián)網技術的發(fā)展,車輛行駛的許多指標監(jiān)測更為精確,因此產生的行車數(shù)據(jù)也日益增多,交通運輸大數(shù)據(jù)時代也已經來臨。如何利用數(shù)據(jù)挖掘技術判別行車安全狀況成為當前運輸行業(yè)研究的熱點問題。本文對所給數(shù)據(jù)進行數(shù)據(jù)預處理操作,結合數(shù)據(jù)得出行車里程、平均行車速度、急加速和急減速情況,其次進一步挖掘每輛運輸車輛的不良駕駛行為得到的不良駕駛行為數(shù)據(jù),利用邏輯回歸模型求解出每類不良駕駛行為影響因素對應的權值并且利用灰色關聯(lián)分析評價每輛車對應的安全狀況,建立了基于邏輯回歸模型和灰色關聯(lián)分析的行車安全評價模型。
關鍵詞 數(shù)據(jù)挖掘;行車安全;KNN:邏輯回歸模型;灰色關聯(lián);評價模型
引言
隨著我國經濟高速增長,道路運輸行業(yè)持續(xù)發(fā)展,車聯(lián)網技術的大規(guī)模應用,對應產生的行車狀況數(shù)據(jù)呈大幅增長趨勢。利用邏輯回歸模型計算出各個影響因素的權值并將計算得到的權值結合灰色關聯(lián)分析法構建行車安全評價模型。行車安全評價模型可以有效的評價車輛在行駛過程中的安全狀況
1 數(shù)據(jù)預處理
①去除異常值,在給出的數(shù)據(jù)出現(xiàn)了部分的異常值,主要包括速度突變過大、經緯度數(shù)據(jù)異常和轉向不合理,本文將類似異常值都進行了刪除,保證行車數(shù)據(jù)的合理性。
②填補缺失值,對于數(shù)據(jù)中部分車輛出現(xiàn)數(shù)據(jù)缺失的情況,本文根據(jù)數(shù)據(jù)集中記錄的取值分布情況采用KNN預測缺失值方法對缺失值進行填補。
2 行車數(shù)據(jù)分析與提取
通過所給數(shù)據(jù),本文挖掘每輛運輸車輛的不良駕駛行為,主要包括疲勞駕駛、急加速、急減速、怠速預熱、超長怠速、熄火滑行、超速、急變道等。
3 安全評價模型
3.1 邏輯回歸模型
本文采用客觀權重邏輯回歸模型[1]來確定影響因素的權重系數(shù)。不良駕駛行為對于安全評價模型的影響有怠速情況、疲勞駕駛、加速度突變、超速、急變道這五種指標。
經過選取測評指標、指標正向化處理、指標歸一化處理,利用梯度上升法[2],對處理過后的指標變量的計算,可以得到在導致不良駕駛行為的因素中,疲勞駕駛占比最大,達到0.27,駕駛者的怠速情況占比相對較小,只有0.13,其他影響因素的權重情況如下表1所示。
3.2 邏輯回歸模型和灰色關聯(lián)分析的行車安全評價模型
經過選取最優(yōu)值[3]、確定特征矩陣、數(shù)據(jù)無量綱化、求差值序列、計算關聯(lián)系數(shù)[4]、求解關聯(lián)度等步驟。我們對導致不良駕駛行為的影響因素進行等權關聯(lián)計算和加權關聯(lián)計算[5]得到部分車輛的相關結果如下表2所示。
根據(jù)上表,我們劃分安全等級,為安全性高,不易發(fā)生交通事故,為安全性中等,可能會發(fā)生交通事故,為安全性低,極易發(fā)生交通事故。得到測評對象4車在安全行駛,可以繼續(xù)安全行駛,測評對象2車極易發(fā)生交通事故,需要立即靠邊停車調整行駛狀態(tài),疲勞駕駛應進行休息,超速行駛應按照規(guī)定速度行駛等等。1、3、5車安全性中等,但是其駕駛者同樣也要提高警惕,以防交通事故的發(fā)生。
4 總結
從評價結果來看,大部分的車輛駕駛者的交通安全意識處于一般或低水平,因此在平常駕駛中有一定的發(fā)生交通事故的風險。大部分駕駛員在駕車過程中總存在不同程度的駕駛失當及危險行為。針對這一現(xiàn)象,本文建議在駕駛證的考取上應該嚴格把關,交通管理部門應加強對車輛駕駛者安全意識的培養(yǎng)以提高其駕駛安全程度,加強對交通運輸?shù)墓芾恚e極宣傳安全駕駛規(guī)范,嚴格執(zhí)行交通法規(guī),降低交通事故的發(fā)生率。
參考文獻
[1] 王進,郭靖,王衛(wèi)東,方理剛.權重線性組合與邏輯回歸模型在滑坡易發(fā)性區(qū)劃中的應用與比較[J].中南大學學報(自然科學版),2012,43(5):1932-1939.
[2] 熊笑.基于梯度上升決策回歸樹的網約出租車需求動態(tài)預測[D].華中科技大學,2017.-09-23.
[3] Sy Han Chiou,Rebecca A.Betensky,Raji Balasubramanian. The missing indicator approach for censored covariates subject to limit of detection in logistic regression models[J]. Annals of Epidemiology,2019.
[4] 馬萍.灰色系統(tǒng)GM(1,1)模型的改進及灰色統(tǒng)計模型研究[D].吉林大學,2007.
[5] 史青春,王平心.基于合作博弈的供應鏈伙伴績效灰色綜合評價方法[J].軟科學,2010,24(1):56-59.