王金剛,徐 航,劉 海,于晗正男,劉 昱
(1. 河北工業(yè)大學 機械工程學院,天津 300130; 2. 天津市新能源汽車動力傳動與安全技術重點實驗室,天津 300130; 3. 滄州交通學院 機械與動力工程學院,河北 滄州 061199; 4. 中國汽車技術研究中心有限公司,天津 300300)
汽車行駛工況定義為某類車輛在實際道路條件下駕駛特性的時間-速度曲線。通常被作為評價汽車經(jīng)濟性、排放和行駛里程的標準,同時也在電動汽車的動力系統(tǒng)、電池管理系統(tǒng)、能耗預測和現(xiàn)實生命周期等評估與設計方面起到關鍵性作用[1-2]。
截至2019年底,我國純電動汽車保有量達310萬輛,同比增長46.9%,因此急需建立純電動汽車的行駛工況標準[3-4]。考慮到城市交通狀況,學界進行了大量研究:LIN Jie等[5]提出短行程方法,從實際數(shù)據(jù)中提取短行程片段作為基本組成單元,構(gòu)建了汽車行駛工況;K.S.NESAMANI等[6]基于GPS數(shù)據(jù),建立了印度金奈的市內(nèi)公交車的行駛工況;G.AMIRJAMSHIDI等[7]運用多目標遺傳算法對加拿大多倫多地區(qū)的卡車行駛工況進行了構(gòu)建;S.K.MAYAKUNTLA等[8]提出用旅行段行程替代短行程,構(gòu)建了印度班加羅爾地區(qū)的汽車行駛工況;LIN Jie[9]基于馬爾可夫鏈和概率轉(zhuǎn)移矩陣,分析了汽車行駛工況;WANG Zhenpo等[10]基于道路和能耗信息,采用馬爾可夫蒙特卡洛方法構(gòu)建了北京市純電動汽車的汽車行駛工況;姜平等[11]基于小波變化,構(gòu)建了城市道路汽車循環(huán)工況;田慧欣等[12]基于定步長劃分法和K均值聚類,進行了車輛行駛工況的構(gòu)建。
筆者以天津市純電動乘用車為研究對象,基于短行程法將實測道路數(shù)據(jù)劃分為若干個短行程片段,提出將t分布鄰域嵌入法(t-distributed stochastic neighbor embedding, t-SNE)用于數(shù)據(jù)投影降維;將模糊C均值聚類法(fuzzy C-means clustering, FCM)用于片段分類;將 灰色關聯(lián)分析(grey relational analysis, GRA)用于工況構(gòu)建;將 平均絕對百分比誤差(mean absolute percentage error, MAPE)和K-S檢驗(Kolmogorov-Smirnov)用于驗證構(gòu)建工況有效性。
筆者以中汽中心中國工況信息化平臺2020年8月1日—9月1日的天津市純電動乘用車運行數(shù)據(jù)進行研究。數(shù)據(jù)包括3輛私家車和7輛出租車,共5款不同車型;采樣頻率為1 Hz,行駛里程為4.9×104km。車輛單日行車軌跡如圖1。
對車輛行駛中獲得的實時數(shù)據(jù)(如:時間、速度、經(jīng)緯度、電流等)進行處理。將受隧道、機場等影響所缺失的經(jīng)緯度GPS信號和與行駛狀況不符數(shù)據(jù)刪除,最后將基于短行程片段提取的20個特征參數(shù)和24個分布參數(shù)用于短行程片段描述。
20個特征參數(shù)分別是:行駛時間(T)、怠速時間(Ti)、加速時間(Ta)、減速時間(Td)、勻速時間(Tc),s;行駛距離S,m;怠速比例(Pi)、加速比例(Pa)、減速比例(Pd)、勻速比例(Pc),%;平均速度(Vm)、平均行駛速度 (Vmr)、最大速度(Vmax)、速度標準差(Vstd),km/h;加速度95%分位數(shù)(A0.95)、平均加速度(Amean)、加速度標準差(Astd),m/s2;減速度5%分位數(shù)(D0.05)、平均減速度(Dmean)、減速度標準差(Dstd),m/s2。24個分布參數(shù)為:分別在(0, 10]、(10, 20]、(20, 30]、(30, 40]、(40, 50]、(50, 60]、(60, 70]、(70, +∞) 速度區(qū)間的分布參數(shù)Pvi,%;分別在(-∞, -3.5]、(-3.5, -3.0]、(-3.0, -2.5]、(-2.5, -2.0]、(-2.0, -1.5]、(-1.5, -1.0]、(-1.0, -0.5]、(-0.5, 0]、(0, 0.5]、(0.5, 1.0]、(1.0, 1.5]、(1.5, 2.0]、(2.0, 2.5]、(2.5, 3.0]、(3.0, 3.5]、(3.5, +∞)加速度區(qū)間的分布參數(shù)Pai,%。
選擇車速-時間等信息作為研究數(shù)據(jù),使用t-SNE算法將所采集數(shù)據(jù)投影到三維空間,以減少計算量[13-14];采用FCM聚類算法劃分為不同道路和交通條件下的行駛片段;對比傳統(tǒng)方法主成分分析法(principal component analysis, PCA)和K均值聚類法(K-means clustering, K-means),并交叉使用;利用GRA[15]構(gòu)建出4種不同的行駛工況(分別為PKG、PFG、TKG、TFG,以各算法首字母組合表示)來代表天津市純電動乘用車的實際道路行駛工況;采用MAPE檢驗和K-S檢驗分別驗證車輛行駛工況的準確性。車輛行駛工況構(gòu)建流程如圖2。
在實際駕駛過程中,受道路環(huán)境及駕駛行為的影響,車輛行駛曲線由不同比例的加減速、勻速和怠速片段組成。車輛行駛過程是多個啟停過程的組合,可在運動學中用短行程來描述一次車輛的啟停。短行程示意如圖3;汽車行駛狀態(tài)(怠速、加速、減速、勻速)劃分原則如表1。
圖3 短行程示意Fig. 3 Sketch map of micro-trip
表1 車輛行駛狀態(tài)劃分原則Table 1 Division principle of vehicle driving state
由此可劃分為4 382個短行程片段,計算短行程片段的綜合特征參數(shù),如表2。由表2可知:天津市純電動乘用車平均速度為23.73 km/h,平均行駛速度為32.14 km/h,怠速比例為25.02%。
表2 短行程片段綜合特征參數(shù)Table 2 Comprehensive characteristic parameters of micro-trip
t-SNE算法是利用概率進行數(shù)據(jù)投影的一種方法,將各個短行程片段之間特征參數(shù)的歐式距離轉(zhuǎn)化為概率相似度,并用概率分布矩陣描述短行程片段之間的分布特性,可在保留絕大部分主要信息情況下,將高維空間數(shù)據(jù)投影到3維空間。該算法用高斯分布函數(shù)對原始短行程數(shù)據(jù)進行計算,再用t分布函數(shù)對低維數(shù)據(jù)進行轉(zhuǎn)化,最后根據(jù)高維概率分布矩陣和低維概率分布矩陣間的KL(kullback-leibler divergence)散度評估分布一致性。
設短行程片段樣本數(shù)為m,特征參數(shù)評價數(shù)目為n,可用矩陣Xmn表示,如式(1):
(1)
各特征值的量綱不同,應進行標準化處理,如式(2):
(2)
標準化后的集合為X′=(X′1,X′2, …,X′m),X′a、X′b分別集合中的兩個點,即兩個不同的短行程樣本,分別服從高斯分布pa和pb,其中高斯分布pa的中心為X′a,方差為σa。用歐式距離轉(zhuǎn)換為相似的條件概率pb|a和兩樣本之間的聯(lián)合概率分布pab,如式(3)、 式(4):
(3)
(4)
集合Y=(Y1,Y2,…,Ym)T為集合X′=(X′1,X′2, …,X′m)T的低維嵌入坐標,且在低維空間中服從t分布,則樣本X′a、X′b在低維空間中對應的數(shù)據(jù)點Ya、Yb的聯(lián)合概率分布qab如式(5):
(5)
通過KL散度衡量高維空間和低維空間分布的相似性C,如式(6):
(6)
C值越小說明低維空間對高維空間模擬點的正確性越高;若C=0,說明這二者概率分布相同。為了獲取最小KL散度,利用梯度下降法優(yōu)化KL散度,如式(7):
(7)
為提高降維效果,對原始數(shù)據(jù)進行多次迭代運算,提高低維空間模擬數(shù)據(jù)的正確性。采用PCA法,選擇累計貢獻率達到85.7%的前4個主成分進行相應的聚類分析。
FCM是將數(shù)據(jù)集中每個數(shù)據(jù)點對應的每個聚類簇賦予了一個權值,稱為隸屬度。根據(jù)隸屬度矩陣可定義數(shù)據(jù)點屬于某個簇。將給定數(shù)據(jù)集Xmn劃分為k類,聚類中心為cl(l=1, 2, …,k),則數(shù)據(jù)點xi與某個聚類中點cl的隸屬度為uil,其目標函數(shù)和約束條件如式(8)、式(9):
(8)
(9)
式中:w為隸屬度uil的指數(shù)權重因子,w=2。
當式(8)最小時,利用拉格朗日乘數(shù)法求出uil和cl,如式(10)、式(11):
(10)
(11)
隨機初始化滿足式(9)的uil,根據(jù)式(11)計算cl,作為輸入由式(10)得到新的uil,再根據(jù)式(8)計算出目標函數(shù)I;經(jīng)過多次迭代后,直到I達到最小值,得到隸屬度uil,完成聚類。
對t-SNE與PCA所得的數(shù)據(jù)分別使用FCM和K-means將短行程片段分為3類(擁堵、一般、快速),如表3。
表3 聚類結(jié)果Table 3 Clustering results
表3中:t-SNE+FCM與PCA+K-means分類都較為明顯;在加減速方面,前者加減速比例逐漸降低,后者加減速比例逐漸升高,表現(xiàn)出顯著的差異性;在快速工況中都擁有較高的勻速比例和較低的怠速比例。t-SNE+FCM算法與PCA+K-means算法所得三維散點圖如圖4。
圖4 t-SNE+FCM和PCA+K-means聚類結(jié)果Fig. 4 Clustering results diagram of t-SNE+FCM and PCA + K-means
GRA是通過確定參考數(shù)列和若干個比較數(shù)列的幾何形狀的相似程度來判斷其聯(lián)系是否緊密,其反映了曲線之間的關聯(lián)程度。
首先確定反應整體的參考數(shù)列和影響系統(tǒng)的比較數(shù)列,根據(jù)所得到的聚類結(jié)果,將描述k個不同聚類整體的n個特征參數(shù)作為參考數(shù)列,同一聚類整體中各個短行程片段的特征參數(shù)作為比較數(shù)列,如式(12)、式(13):
X0l=(x01l,x02l,…,x0jl,…,x0nl)
(12)
Xil=(xi1l,xi2l,…,xijl,…,xinl)
(13)
式中:i=1,2,…,m′;j=1,2,…,n;l=1,2,…,k;X0l為第l個聚類整體中的參考數(shù)列;Xil為第l個聚類中的第i個比較數(shù)列;m′為比較數(shù)列的個數(shù),即各個聚類片段中的短行程片段數(shù)目;n為特征參數(shù)的個數(shù)。
對上述數(shù)列進行無量綱均值化,如式(14):
(14)
計算關聯(lián)系數(shù),如式(15):
(15)
式中:ξijl為第l個聚類整體中第i個參考數(shù)列與比較數(shù)列的第j個特征參數(shù)的關聯(lián)系數(shù);ρ為分辨系數(shù),ρ=0.5。
計算關聯(lián)度如式(16):
(16)
式中:ril為第l個聚類整體中第i個比較數(shù)列的關聯(lián)度。
車輛行駛工況構(gòu)建結(jié)果如圖5。圖5中:PKG、PFG、TKG、TFG工況的總時間分別為1 814、1 809、1 808、1 794 s。將這4種工況所得的關聯(lián)度進行降序排列,依次選擇短行程片段直到滿足時間要求。
為驗證不同工況模型的準確性,對比聚類整體之間理論時間比例和對應工況片段之間實際時間比例,根據(jù)對比差異增刪相應的怠速部分,使得這4種工況時長均為1 800 s。通過計算修改前后特征參數(shù)變化,可知特征參數(shù)最大參數(shù)誤差為3.28%,對最終結(jié)果幾乎無影響。
圖5 汽車行駛工況構(gòu)建結(jié)果Fig. 5 Construction results of vehicle driving conditions
筆者對這4種車輛行駛工況構(gòu)建結(jié)果準確性并進行驗證,選出最具代表意義的車輛行駛工況。
使用MAPE檢驗評估構(gòu)建結(jié)果與實際工況之間的特征參數(shù)差異,如式(17):
(17)
式中:N為特征參數(shù)的個數(shù);PRj為實際駕駛數(shù)據(jù)中第j個特征參數(shù)的值;Pj為所構(gòu)建工況中第j個特征參數(shù)的值。
使用K-S檢驗評估構(gòu)建工況與實際工況在速度和加速度分布參數(shù)之間的差異,如式(18):
Z=max|D(Y)-R(Y)|
(18)
式中:D(Y)和R(Y)分別為構(gòu)建工況和實際駕駛數(shù)據(jù)分布參數(shù)的累計分布函數(shù);Z為D(Y)和R(Y)絕對值的最大值,表示分布參數(shù)與實際工況間的差異。
選取表3中除時間T外的14個特征參數(shù),以及24個分布參數(shù)(8個速度分布參數(shù)和16個加速度分布參數(shù)),根據(jù)式(17)、式(18)分別進行特征參數(shù)MAPE檢驗和分布參數(shù)K-S檢驗,并將特征參數(shù)按表3排序依次記作1~14。圖6、圖7分別為4種工況的MAPE與K-S檢驗結(jié)果。
在特征參數(shù)方面,圖6中的4種不同工況的MAPE具體誤差為:PKG、PFG、TKG、TFG工況的最大參數(shù)誤差分別為8.13%、16.14%、13.02%、9.94%。其中,PKG和TKG工況最大誤差為最大速度,PFG和TFG工況為怠速比例,PKG和TFG工況全部特征參數(shù)誤差均小于10%。這4種工況的MAPE檢驗值分別為4.08%、5.35%、4.37%、3.82%;TFG工況的MAPE檢驗值相比其他3種工況分別降低了6.00%、28.60%、12.59%;上述4種工況的MAPE檢驗值最大為5.35%,仍具有代表意義。
在分布參數(shù)方面,由圖7可知:PKG、PFG、TKG的速度K-S檢驗值分別為0.098 9、0.087 6、0.104 0,遠高于TFG工況的0.047 1,與實際情況相差較大。在加速度分布參數(shù)方面,這4種工況的加速度K-S檢驗值分別為0.015 0、0.038 2、0.030 0、0.012 6,相差較小,TFG和PKG工況擁有較好的表現(xiàn),其中TFG工況比PKG工況降低了16%。
圖6 MAPE檢驗結(jié)果Fig. 6 MAPE test results
圖7 K-S檢驗結(jié)果Fig. 7 K-S test results
筆者選擇TFG工況作為天津市純電動乘用車實際道路行駛工況。按照最大速度判斷,將TFG工況與典型工況NEDC市區(qū)部分(NEDC1)和WLTC低、中速部分(WLTC1+2)進行對比,具體特征參數(shù)如表4。
表4 不同工況與實際工況特征參數(shù)的MAPE與K-S檢驗結(jié)果Table 4 MAPE and K-S test results of characteristic parameters in different working conditions and actual working conditions
表4中:NEDC1與WLTC1+2的MAPE檢驗值分別為42.11%和25.62%,遠高于TFG的3.82%。NEDC1相對于TFG的最大參數(shù)誤差在怠速比例方面為78.34%;WLTC1+2在加速度標準差上有最大參數(shù)誤差為47.89%。且NEDC和WLTC的速度K-S檢驗值分別為0.1789和0.0619,高于TFG的0.047 1,但WLTC1+2較NEDC1更符合天津市實際行駛工況。在加速度分布參數(shù)方面,NEDC1和WLTC1+2的加速度K-S檢驗值分別為0.209 1和0.068 7,與TFG的 0.012 6仍有較大差距。
綜上所述,TFG工況速度較低,加減速頻繁,啟停過程多,交通情況有待改善,典型工況NEDC1和WLTC1+2與天津市實際駕駛環(huán)境仍有一定差異。
筆者根據(jù)天津市10輛純電動乘用車1個月的實際行駛數(shù)據(jù),基于短行程片段提取了20個特征參數(shù)和24個分布參數(shù),采用t-SNE算法對短行程片段進行降維,采用FCM聚類將短行程片段分為3類;通過對比傳統(tǒng)PCA與K-means聚類算法,采用GRA法將3類典型短片段構(gòu)建出4種車輛行駛工況;利用MAPE和K-S檢驗對4種工況進行對比分析,選擇TFG工況作為最優(yōu)工況。所構(gòu)建的方法比傳統(tǒng)PCA與K-means法更具有代表性,同時表明典型工況并不適用天津市的實際駕駛環(huán)境。