王沛 陳勁杰
摘? 要:隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展,從汽車大國(guó)到汽車強(qiáng)國(guó)的逐步轉(zhuǎn)變,汽車數(shù)量也急劇增加。本文針對(duì)輕型汽車實(shí)際道路行駛采集的數(shù)據(jù)(采樣頻率1Hz),處理為各個(gè)運(yùn)動(dòng)學(xué)片段,采用PCA結(jié)合K-means++聚類方法,對(duì)處理后數(shù)據(jù)樣本進(jìn)行降維處理,分析其中主要特征成分,將各運(yùn)動(dòng)學(xué)片段依據(jù)綜合特征指標(biāo)歸類,計(jì)算主要特征參數(shù),使用相關(guān)系數(shù)篩選典型特征片段。構(gòu)建典型汽車行駛工況曲線。使用K-means聚類處理數(shù)據(jù)段,計(jì)算處理結(jié)果并分析與總體樣本特征偏差范圍,判斷工況曲線構(gòu)建的合理性,是否符合世界WLTC工況標(biāo)準(zhǔn)。結(jié)合汽車標(biāo)準(zhǔn)行駛工況比較分析綜合特征指標(biāo)差異。
關(guān)鍵詞:PCA;K-means++聚類;汽車標(biāo)準(zhǔn)行駛工況
中圖分類號(hào):TP18? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
Abstract:With the rapid development of the Chinese economy,the number of cars has also increased dramatically,since the gradual transformation from a large automobile country to the car power.This paper focuses on the data collected from the actual road driving of the light vehicle (sampling frequency 1Hz),then processes the data into each kinematic segment.Using PCA combined with K-means++ clustering method,the processed data samples are subjected to dimensionality reduction processing.Then the main characteristic components are analyzed.Each kinematic segment is classified according to the comprehensive feature index.Then the main feature parameters are calculated.Lastly,the correlation feature is used to filter the typical feature segments.The typical vehicle driving condition curve is constructed.The K-means cluster is used to process the data segments.The processing results are calculated,and the deviation range from the overall sample characteristics is analyzed to determine the rationality of the construction of the working condition curve and whether it meets the world WLTC working condition standard.The characteristics and difference of the comprehensive characteristic indicators are compared and analyzed in combination with the standard driving conditions of the automobile.
Keywords:PCA;K-means++ clustering;automotive standard driving conditions
1? ?引言(Introduction)
在信息量丟失最小的前提下,主成分分析法可以將多個(gè)特征參數(shù)變量進(jìn)行降維找出少數(shù)的幾個(gè)主成分。本文主要將PCA主成分分析和K-means算法結(jié)合,對(duì)處理后數(shù)據(jù)樣本進(jìn)行降維處理[1],分析其中主要特征成分,將各運(yùn)動(dòng)學(xué)片段依據(jù)綜合特征指標(biāo)歸類,計(jì)算主要特征參數(shù),使用相關(guān)系數(shù)篩選典型特征片段。構(gòu)建典型汽車行駛工況曲線。對(duì)比傳統(tǒng)K-means和優(yōu)化后K-means++聚類處理數(shù)據(jù)段,計(jì)算處理結(jié)果并分析與總體樣本特征偏差范圍,判斷工況曲線構(gòu)建的合理性。結(jié)合汽車標(biāo)準(zhǔn)行駛工況比較分析綜合特征指標(biāo)差異。
2? ?總體設(shè)計(jì)路線(Overall design route)
所給數(shù)據(jù)是同一輛汽車在不同時(shí)間段的實(shí)際行駛數(shù)據(jù),數(shù)據(jù)量大約50萬(wàn)條。根據(jù)相關(guān)研究文獻(xiàn)數(shù)據(jù),本文運(yùn)用數(shù)學(xué)建模的方法進(jìn)行篩選,使用插值方法、平滑處理方法(smooth函數(shù))、Excel過(guò)濾篩選功能進(jìn)行數(shù)值預(yù)處理,由于主要研究的是工況曲線構(gòu)建的合理性,所以對(duì)于以上的方法暫不贅述。之后對(duì)處理后的數(shù)據(jù)劃分為多個(gè)運(yùn)動(dòng)學(xué)片段,通過(guò)網(wǎng)上查找資料可知,將車輛從一個(gè)怠速開(kāi)始到下一個(gè)怠速開(kāi)始的運(yùn)動(dòng)定義為運(yùn)動(dòng)學(xué)片段,車輛的行程即可視為各種片段的組合。其中某些片段反映的交通狀況可能相同,不同的地理位置及時(shí)間和公路類型會(huì)出現(xiàn)相同的片段,有時(shí)高速公路上的片段可能和擁擠的城市中的片段完全一致[2]。將這些片段類型和交通狀況聯(lián)系起來(lái),針對(duì)性地分析不同速度的運(yùn)動(dòng)形態(tài)。通過(guò)篩選數(shù)據(jù)中的怠速區(qū)間,對(duì)經(jīng)預(yù)處理后的數(shù)據(jù)進(jìn)行后劃分成多個(gè)運(yùn)動(dòng)學(xué)片段,并結(jié)合汽車運(yùn)動(dòng)相關(guān)知識(shí)計(jì)算各運(yùn)動(dòng)學(xué)片段的運(yùn)動(dòng)參數(shù)指標(biāo)。
5.2? ?工況驗(yàn)證
將采集的行駛數(shù)據(jù)作為總體樣本數(shù)據(jù),選取平均速度V、加速段的平均加速度A減速段的平均加速度aa、怠速比例P、加速比例P。減速比例P15個(gè)特征參數(shù)作為判定準(zhǔn)則,并基于K-means和融合優(yōu)化后的K-means++算法計(jì)算各特征參數(shù)向量[7],與構(gòu)建的車輛行駛工況與總體樣本數(shù)據(jù)進(jìn)行對(duì)比,各工況下的特征參數(shù)值,詳見(jiàn)表7。
經(jīng)過(guò)K-means和優(yōu)化后K-means++算法所計(jì)算的相關(guān)特征參數(shù)數(shù)據(jù)與整個(gè)樣本的總體樣本數(shù)據(jù)具有一定偏差,因此從中選擇一定的特征參數(shù)作為分析的指標(biāo),分別計(jì)算構(gòu)建的道路行駛工況與道路行駛工況總樣本的相對(duì)誤差,根據(jù)所計(jì)算的結(jié)果來(lái)分析構(gòu)建出的工況是否有效。誤差計(jì)算公式如下:
式中,——相對(duì)誤差;
——構(gòu)建行駛工況特征參數(shù);
——總體樣本工況特征參數(shù)。
通過(guò)誤差計(jì)算公式計(jì)算出使用K-means和優(yōu)化后K-means++算法所計(jì)算的相關(guān)特征參數(shù)數(shù)據(jù)與整個(gè)樣本的總體樣本數(shù)據(jù)偏差,如圖5所示。
6? ?結(jié)論(Conclusion)
可見(jiàn)構(gòu)建的行駛工況特性與總體樣本行駛工況特性有一定的偏差,但所取的五個(gè)特征參數(shù)能夠大部分反映行駛工況綜合特性,誤差率都控制在10%,屬于可接受范圍。使用K-means算法和優(yōu)化后K-means++進(jìn)行比較,優(yōu)化后的K-means++算法在一定程度上相對(duì)于K-means聚類算法減小了與真實(shí)樣本數(shù)據(jù)的偏差值,計(jì)算結(jié)果更接近于總體樣本行駛工況。
在國(guó)際標(biāo)準(zhǔn)行駛工況中,我國(guó)直接采用歐洲的NEDC行駛工況,NEDC工況為基準(zhǔn)所優(yōu)化標(biāo)定的汽車,實(shí)際油耗與法規(guī)認(rèn)證結(jié)果偏差越來(lái)越大,影響了政府的公信力(譬如對(duì)某型號(hào)汽車,該車標(biāo)注的工信部油耗6.5升/100公里,用戶體驗(yàn)實(shí)際油耗可能是8.5—10升/100公里)。另外,歐洲在多年的實(shí)踐中也發(fā)現(xiàn)NEDC工況的諸多不足,轉(zhuǎn)而采用世界輕型車測(cè)試循環(huán),但標(biāo)準(zhǔn)工況往常難以代表實(shí)際行駛工況。通過(guò)計(jì)算構(gòu)建行駛工況與標(biāo)準(zhǔn)工況的偏差,可以分析了解各標(biāo)準(zhǔn)工況與實(shí)際行駛工況之間的差異。選取NEDC行駛工況和WLTC行駛工況進(jìn)行比較,并選取工況時(shí)間、平均加速度、平均減速度、平均速度四個(gè)指標(biāo)作為參考,如圖6所示。
由圖分析可知,測(cè)試工況時(shí)間介于兩種工況之間,基本符合世界WLTC工況標(biāo)準(zhǔn),在平均速度特征指標(biāo)上落后于NEDC和WLTC標(biāo)準(zhǔn)工況[8],在平均加、減速度上均大于兩種標(biāo)準(zhǔn)工況值,且特征指標(biāo)偏差較大。因此,對(duì)于實(shí)際行駛情況有必要制定對(duì)應(yīng)當(dāng)?shù)貙?duì)應(yīng)的汽車行駛工況。
參考文獻(xiàn)(References)
[1] Chen Y,Lin Z,Zhao X,et al.Deep learning-based lassification of hyperspectral data[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014:18-26.
[2] Alisa Arunamata,Jesse Stringer,Sowmya Balasubramanian,et al.Cardiac Segmental Strain Analysis in Pediatric Left Ventricular Noncompaction Cardiomyopathy[J].Journal of the American Society of Echocardiography,2019(6):57-68.
[3] Ho,Sze-Hwee,Wong,Yiik-Diew,et al.DevelopingSingapore Driving Cycle for Passenger cars to estimate fuel consumption and vehicular emissions[J].Atmospheric Environment 2014,97:353-362.
[4] 姜平,石琴,陳無(wú)畏,等.基于小波分析的城市道路行駛工況構(gòu)建的研究[J].汽車工程,2011(1):70-73.
[5] 梁聰,夏書(shū)銀,陳子忠.基于參考點(diǎn)的改進(jìn)k近鄰分類算法[J].計(jì)算機(jī)工程,2019(02):167-178.
[6] 吳信東,嵇圣硙.MapReduce與Spark用于大數(shù)據(jù)分析之比較[J].軟件學(xué)報(bào),2018(06):1770-1791.
[7] 祁力鈞,程一帆,程湞湞,等.基于M-K聚類法的果樹(shù)上下冠層體積比測(cè)算[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2018(05):45-49.
[8] 石則強(qiáng),紀(jì)常偉,王偉,等.車輛燃料消耗量計(jì)算方法研究[J].車輛與動(dòng)力技術(shù),2010(04):19-24.
作者簡(jiǎn)介:
王? 沛(1994-),男,碩士生.研究領(lǐng)域:人工智能.
陳勁杰(1969-),男,碩士,副教授.研究領(lǐng)域:智能機(jī)器人,機(jī)器學(xué)習(xí).