王膺博,秦靜,裴毅強(qiáng),呂永,鐘凱,鄭德,陳濤
(1.天津大學(xué)內(nèi)燃機(jī)研究所,天津,300072;2.天津大學(xué)內(nèi)燃機(jī)燃燒學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,天津,300072;3.廣州汽車集團(tuán)股份有限公司汽車工程研究院,廣東廣州,511434)
隨著人們對(duì)環(huán)境問題的日益重視,汽車排放法規(guī)越來越嚴(yán)格。汽車的排放問題被越來越多的學(xué)者所關(guān)注,一個(gè)有效的預(yù)測(cè)模型能夠在發(fā)動(dòng)機(jī)研發(fā)階段節(jié)約大量的人力物力,具有一定的理論意義和工程應(yīng)用價(jià)值。為此,國(guó)內(nèi)外學(xué)者進(jìn)行了大量的研究。在穩(wěn)態(tài)工況預(yù)測(cè)方面,冀樹德等[1-2]構(gòu)建了BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型用來預(yù)測(cè)穩(wěn)態(tài)工況下的柴油機(jī)的NOx排放,其預(yù)測(cè)結(jié)果與實(shí)際測(cè)量值相關(guān)系數(shù)在99%以上。LI 等[3-4]使用多隱含層神經(jīng)網(wǎng)絡(luò)對(duì)NOx排放進(jìn)行預(yù)測(cè),發(fā)現(xiàn)多隱含層神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值與實(shí)測(cè)值吻合較好。在瞬態(tài)工況預(yù)測(cè)方面,ASHER 等[5-6]采用神經(jīng)網(wǎng)絡(luò)對(duì)NOx的排放進(jìn)行預(yù)測(cè),預(yù)測(cè)值與實(shí)際值的相關(guān)系數(shù)達(dá)到了85%以上。
然而,在特征選取上,大多數(shù)模型的輸入?yún)?shù)基于經(jīng)驗(yàn)或使用線性分析方法選取。根據(jù)經(jīng)驗(yàn)選取輸入?yún)?shù)因個(gè)人主觀因素容易產(chǎn)生誤判。發(fā)動(dòng)機(jī)控制及排放研究多數(shù)屬于非線性問題,使用線性分析亦容易導(dǎo)致分析錯(cuò)誤。基于此,本文作者對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行改良,對(duì)發(fā)動(dòng)機(jī)穩(wěn)態(tài)萬有數(shù)據(jù)及瞬態(tài)WLTC 數(shù)據(jù)進(jìn)行預(yù)測(cè)。并提出基于組合神經(jīng)網(wǎng)絡(luò)的模型輸入?yún)?shù)特征選取方法,探尋影響排放的具體參數(shù),最終得到精確的發(fā)動(dòng)機(jī)排放預(yù)測(cè)模型,為發(fā)動(dòng)機(jī)的開發(fā)提供便利。
文中使用的數(shù)據(jù)源于國(guó)內(nèi)某一上市汽油車的試驗(yàn)結(jié)果,其發(fā)動(dòng)機(jī)主要參數(shù)如表1所示。
表1 發(fā)動(dòng)機(jī)參數(shù)Table 1 Engine technical parameters
穩(wěn)態(tài)工況數(shù)據(jù)為試驗(yàn)臺(tái)架上測(cè)得的發(fā)動(dòng)機(jī)萬有數(shù)據(jù),轉(zhuǎn)速?gòu)?00 r/min 到6 000 r/min 時(shí),共有360個(gè)工況點(diǎn)。待發(fā)動(dòng)機(jī)工況穩(wěn)定后,記錄發(fā)動(dòng)機(jī)控制參數(shù)、環(huán)境參數(shù)以及測(cè)量得到的渦輪前NOx體積分?jǐn)?shù)。瞬態(tài)數(shù)據(jù)為測(cè)得的整車WLTC工況數(shù)據(jù),采集時(shí)間為1 800 s,采集頻率為10 Hz,共18 000個(gè)工況點(diǎn)。
通過INCA直接記錄獲取發(fā)動(dòng)機(jī)控制參數(shù),考慮到測(cè)量的便捷性和準(zhǔn)確性,只采集轉(zhuǎn)速、扭矩、過量空氣系數(shù)、軌壓、點(diǎn)火提前角、進(jìn)氣量、排氣溫度等來源于ECU 及溫度傳感器和壓力傳感器的17 個(gè)參數(shù)。使用CLD500 儀器測(cè)量NOx體積分?jǐn)?shù),其采樣頻率可達(dá)到1 000 Hz,考慮到數(shù)據(jù)使用的方便性,在瞬態(tài)工況下僅采用10 Hz的數(shù)據(jù)作為測(cè)量結(jié)果。部分結(jié)果如表2所示。
表2 部分發(fā)動(dòng)機(jī)工況數(shù)據(jù)Table 2 Part of engine operating data
為了減少試驗(yàn)量,在確保模型精度的情況下應(yīng)使用盡可能少的數(shù)據(jù)作為模型訓(xùn)練集。參考神經(jīng)網(wǎng)絡(luò)樣本劃分的遍布性、均勻性原則[7],訓(xùn)練集樣本應(yīng)盡可能包含所有工況。文中僅選取均勻分布的25%數(shù)據(jù)作為訓(xùn)練集,剩余的75%數(shù)據(jù)作為預(yù)測(cè)集。具體樣本分布情況如圖1所示,共計(jì)88組訓(xùn)練集,272組預(yù)測(cè)集。
圖1 訓(xùn)練集和預(yù)測(cè)集樣本分布Fig.1 Sample distributions of training set and prediction set
而對(duì)于瞬態(tài)數(shù)據(jù),則選取34%的數(shù)據(jù)作為訓(xùn)練集,剩余66%數(shù)據(jù)作為預(yù)測(cè)集,同樣采用均勻選取的方法,等距抽樣,每3個(gè)工況點(diǎn)選取1個(gè)工況點(diǎn)作為訓(xùn)練集數(shù)據(jù),其余2個(gè)工況點(diǎn)作為預(yù)測(cè)集數(shù)據(jù)。
因各參數(shù)變化范圍數(shù)量級(jí)差別較大,容易造成模型擬合速度變慢,預(yù)測(cè)誤差變大。需要對(duì)模型的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化來消除參數(shù)范圍不一致帶來的誤差。在眾多標(biāo)準(zhǔn)化方式中,選擇歸一化[8]處理,其具體公式為
式中:Va為需要處理的數(shù)據(jù);Vnorm為Va的歸一化結(jié)果;Vmax為數(shù)據(jù)中最大值;Vmin為數(shù)據(jù)中最小值;Vh為歸一化結(jié)果的上限;Vl為歸一化結(jié)果的下限。
本文取Vh=1,Vl=0,使處理后的數(shù)據(jù)都分布在[0,1]之間。經(jīng)過上述處理后,原始數(shù)據(jù)均轉(zhuǎn)化為量綱一評(píng)測(cè)值,有利于模型的建立。在查看模型輸出時(shí)進(jìn)行反歸一化,即可得到真實(shí)尺度的預(yù)測(cè)結(jié)果。
單一神經(jīng)網(wǎng)絡(luò)模型由于自身擬合的隨機(jī)性,其模型預(yù)測(cè)精度會(huì)有較大幅度波動(dòng)。導(dǎo)致在工程應(yīng)用時(shí),試驗(yàn)結(jié)果未知的情況下,模型預(yù)測(cè)精度無法保證,這對(duì)模型的應(yīng)用造成了很大的影響。為克服單一神經(jīng)網(wǎng)絡(luò)的這一缺陷,通過集成算法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行改良,并在神經(jīng)網(wǎng)絡(luò)中融入隨機(jī)森林算法的隨機(jī)采樣(bootstrap aggregaing)來抵消集成算法帶來的過擬合問題。
集成算法不是一個(gè)單獨(dú)的機(jī)器學(xué)習(xí)算法,而是通過構(gòu)建并結(jié)合多個(gè)相互獨(dú)立的機(jī)器學(xué)習(xí)器來完成學(xué)習(xí)任務(wù)[9]。在這一算法過程中,單個(gè)個(gè)體學(xué)習(xí)器作為弱學(xué)習(xí)器,相互之間沒有依賴關(guān)系,通過并行組成一個(gè)強(qiáng)學(xué)習(xí)器。將多個(gè)弱學(xué)習(xí)器作出的估計(jì)平均,方差項(xiàng)的作用趨于抵消,從而使預(yù)測(cè)的結(jié)果具有較高的精確度、穩(wěn)定性和泛化性[10]。研究表明,隨著模型數(shù)目不斷增加,模型誤差最終會(huì)收斂且會(huì)趨于一定值。
隨機(jī)采樣則是對(duì)數(shù)據(jù)集進(jìn)行有放回的隨機(jī)抽取以生成相同數(shù)目的采樣集,在一個(gè)采樣過程中,每個(gè)樣本未被抽中的概率P為
式中:M為數(shù)據(jù)集樣本數(shù)目;N為隨機(jī)采樣次數(shù)。
當(dāng)N趨近于無窮大時(shí),N次采樣中每個(gè)樣本未被抽中的概率為1/e,約為0.368。也就是說,在每輪隨機(jī)采樣中,數(shù)據(jù)集中大約有36.8%的數(shù)據(jù)未被抽取,后續(xù)不參與模型的訓(xùn)練,但可作為驗(yàn)證數(shù)據(jù)用于測(cè)試模型的預(yù)測(cè)精度和泛化能力[11]。
首先,對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行隨機(jī)采樣,生成多個(gè)采樣集。將這些采樣集作為訓(xùn)練集分別建立多個(gè)互不相關(guān)的神經(jīng)網(wǎng)絡(luò)模型,對(duì)每個(gè)神經(jīng)網(wǎng)絡(luò)模型計(jì)算其對(duì)總訓(xùn)練集的預(yù)測(cè)效果,以此作為此模型的權(quán)數(shù)。最終取模型預(yù)測(cè)結(jié)果的加權(quán)平均值作為組合神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果。
組合神經(jīng)網(wǎng)絡(luò)架構(gòu)如圖2所示。在這一集成算法的過程中,單個(gè)神經(jīng)網(wǎng)絡(luò)為弱學(xué)習(xí)器,多個(gè)神經(jīng)網(wǎng)絡(luò)的組合為強(qiáng)學(xué)習(xí)器。通過加權(quán)均值消除了預(yù)測(cè)結(jié)果的方差項(xiàng),以此來提高神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度并減小精度波動(dòng)狀況。為了保證學(xué)習(xí)器間的相互獨(dú)立性,通過對(duì)訓(xùn)練樣本隨機(jī)采樣,盡可能地減少模型間的相關(guān)性,同時(shí),有效地減少了訓(xùn)練模型所需的數(shù)據(jù)量,避免多個(gè)神經(jīng)網(wǎng)絡(luò)容易過擬合的缺點(diǎn),使模型泛化性更強(qiáng)。由于多個(gè)模型并行計(jì)算,模型計(jì)算時(shí)間并未大幅增加,計(jì)算時(shí)間與相同模型數(shù)目的隨機(jī)森林算法的計(jì)算時(shí)間大致相同。
圖2 組合神經(jīng)網(wǎng)絡(luò)架構(gòu)Fig.2 Framework of group neural network
最終的預(yù)測(cè)結(jié)果H(x)可表示為
式中:hi(x)為第i個(gè)神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果;wi為第i個(gè)神經(jīng)網(wǎng)絡(luò)模型的權(quán)數(shù)。
為了準(zhǔn)確地比較模型預(yù)測(cè)效果的優(yōu)劣,采用決定系數(shù)R2來表示模型的精度,其值衡量預(yù)測(cè)值對(duì)于真實(shí)值的擬合程度[12]。它有效地避免了相關(guān)系數(shù)r只能度量?jī)山M數(shù)的線性相關(guān)關(guān)系,并不能衡量?jī)山M數(shù)據(jù)的接近程度的缺點(diǎn)。具體計(jì)算公式為
式中:hk為第k個(gè)工況點(diǎn)的預(yù)測(cè)結(jié)果;yk為第k個(gè)工況點(diǎn)的真實(shí)值;yˉ為真實(shí)值的平均值。
考慮到發(fā)動(dòng)機(jī)工作過程的非線性特點(diǎn),選用雙隱含層BP神經(jīng)網(wǎng)絡(luò)來構(gòu)建單個(gè)模型,以使模型具有較強(qiáng)的擬合能力和泛化能力,且能較好地處理樣本噪聲的學(xué)習(xí)問題,使得非線性逼近效果良好。
神經(jīng)網(wǎng)絡(luò)隱含層的節(jié)點(diǎn)數(shù)在模型的建立中非常重要,若節(jié)點(diǎn)數(shù)太少,則神經(jīng)網(wǎng)絡(luò)擬合能力不足導(dǎo)致“欠擬合”;若節(jié)點(diǎn)數(shù)太多,則會(huì)大大增加模型學(xué)習(xí)時(shí)間,同時(shí)容易出現(xiàn)“過擬合”問題[13]。對(duì)于神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù),根據(jù)前人的經(jīng)驗(yàn)公式[1]及部分建模試驗(yàn),選擇第一層10 個(gè)隱含層節(jié)點(diǎn)、第二層4 個(gè)隱含層節(jié)點(diǎn)作為單個(gè)神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)。
對(duì)于整體隨機(jī)組合神經(jīng)網(wǎng)絡(luò),計(jì)算其對(duì)訓(xùn)練集數(shù)據(jù)擬合精度R2隨神經(jīng)網(wǎng)絡(luò)個(gè)數(shù)增加的變化趨勢(shì),當(dāng)模型連續(xù)10次無增加時(shí),停止模型的訓(xùn)練,并返回尋找擬合精度最高時(shí)的神經(jīng)網(wǎng)絡(luò)個(gè)數(shù),采用其作為最終模型,對(duì)預(yù)測(cè)集數(shù)據(jù)進(jìn)行預(yù)測(cè)。組合神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)流程如圖3所示。
圖3 組合神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)流程Fig.3 Flow chart of group neural network
運(yùn)用上述得到的隨機(jī)組合神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)模型,對(duì)發(fā)動(dòng)機(jī)穩(wěn)態(tài)NOx排放和瞬態(tài)NOx排放進(jìn)行預(yù)測(cè)。預(yù)測(cè)結(jié)果如圖4所示。
從圖4可知:在穩(wěn)態(tài)工況下,其擬合訓(xùn)練樣本的精度達(dá)到99.22%,對(duì)預(yù)測(cè)集數(shù)據(jù)的預(yù)測(cè)精度達(dá)到96.68%。在瞬態(tài)工況下,其擬合精度達(dá)到98.97%,預(yù)測(cè)精度達(dá)到了97.19%。
圖4 組合神經(jīng)網(wǎng)絡(luò)對(duì)NOx體積分?jǐn)?shù)的預(yù)測(cè)值與試驗(yàn)值對(duì)比Fig.4 Comparison of predicted value and experimental value with combined neural network of NOx volume fraction
為了對(duì)比分析隨機(jī)組合神經(jīng)網(wǎng)絡(luò)算法模型性能,采用完全相同的訓(xùn)練集和預(yù)測(cè)集分別建立起神經(jīng)網(wǎng)絡(luò)模型和隨機(jī)森林模型,各模型的預(yù)測(cè)效果如表3所示,包含各模型的預(yù)測(cè)精度,擬合精度以及預(yù)測(cè)精度波動(dòng)。從訓(xùn)練集的擬合結(jié)果看,隨機(jī)森林和組合神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本的擬合效果較好,得分均在99%以上,而傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型得分僅為94%,說明隨機(jī)森林算法和組合神經(jīng)網(wǎng)絡(luò)算法的擬合能力更強(qiáng)。
表3 3種模型的預(yù)測(cè)結(jié)果對(duì)比Table 3 Comparison of prediction results of three models
預(yù)測(cè)樣本中包含一系列內(nèi)插值點(diǎn)和外延點(diǎn),反映著模型的擬合性能和泛化性能。從預(yù)測(cè)結(jié)果看,3 種模型都有較好的預(yù)測(cè)結(jié)果,但相比之下,隨機(jī)組合神經(jīng)網(wǎng)絡(luò)模型對(duì)預(yù)測(cè)集樣本的預(yù)測(cè)精度更高,且其預(yù)測(cè)精度的波動(dòng)更小。隨機(jī)森林預(yù)測(cè)精度稍低且波動(dòng)較小,而神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度最低且預(yù)測(cè)精度波動(dòng)很大。
綜合來看,與其他2種方法相比,隨機(jī)組合神經(jīng)網(wǎng)絡(luò)算法綜合能力更優(yōu)異,具體表現(xiàn)在其擬合能力強(qiáng),泛化能力強(qiáng),預(yù)測(cè)精度高,能夠很好地預(yù)測(cè)發(fā)動(dòng)機(jī)的排放。
與排放相關(guān)的發(fā)動(dòng)機(jī)控制參數(shù)眾多,且相互影響制約。輸入?yún)?shù)的選取影響著排放模型的精度。當(dāng)輸入?yún)?shù)太多時(shí),其中部分參數(shù)包含較多無效信息和噪聲信息,對(duì)模型造成干擾,從而影響模型的運(yùn)行效率和預(yù)測(cè)精度。而當(dāng)輸入?yún)?shù)太少時(shí),給模型提供的信息不足,不能保證模型質(zhì)量[14]。因此,通過特征選取來選擇合適的參數(shù)作為模型的輸入?yún)?shù)是建立模型的關(guān)鍵。為了方便表述,使用模型貢獻(xiàn)度來代表輸入?yún)?shù)與排放物間關(guān)聯(lián)程度,模型貢獻(xiàn)度越大,說明其在模型中越重要。
隨著神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度的穩(wěn)定,基于神經(jīng)網(wǎng)絡(luò)分析輸入?yún)?shù)與輸出參數(shù)間的相關(guān)性已成為可能?;谏窠?jīng)網(wǎng)絡(luò)的輸入?yún)?shù)特征選取分析方法對(duì)于神經(jīng)網(wǎng)絡(luò)的建模更有適配性,且相較于線性分析方法,對(duì)非線性問題有更好的分析精度。
由于發(fā)動(dòng)機(jī)部分參數(shù)間存在著較強(qiáng)的自相關(guān)性,在特征選取分析時(shí)容易造成自相關(guān)參數(shù)模型貢獻(xiàn)度較實(shí)際值偏低的情況。為避免對(duì)分析結(jié)果造成影響,需先對(duì)輸入?yún)?shù)間的自相關(guān)性進(jìn)行分析,本文選取PEARSON線性相關(guān)分析方法[15],為了便于區(qū)分,使用p2來表示相關(guān)系數(shù),其計(jì)算公式為
式中:xi為第一個(gè)輸入?yún)?shù)值;yi為第二個(gè)輸入?yún)?shù)值;n為樣本數(shù)量;p2為相關(guān)系數(shù)。
將輸入?yún)?shù)間相關(guān)系數(shù)p2大于0.9的參數(shù)都認(rèn)為是自相關(guān)參數(shù),僅選取其中測(cè)量最準(zhǔn)確的參數(shù)進(jìn)行分析。
在對(duì)參數(shù)進(jìn)行篩選后,使用其建立組合神經(jīng)網(wǎng)絡(luò)模型,計(jì)算模型預(yù)測(cè)結(jié)果與試驗(yàn)結(jié)果之間的決定系數(shù)R20。然后,保持訓(xùn)練集和預(yù)測(cè)集不變,依次缺失第i個(gè)輸入?yún)?shù)進(jìn)行重新建模,計(jì)算其預(yù)測(cè)結(jié)果的R2i。觀測(cè)前后預(yù)測(cè)精度的差值以此來判斷第i個(gè)輸入?yún)?shù)的模型貢獻(xiàn)度Ci,其計(jì)算公式為
正值代表該參數(shù)對(duì)排放物的預(yù)測(cè)起正向作用,負(fù)值代表該參數(shù)對(duì)排放物的預(yù)測(cè)起反向作用,其數(shù)值越大,說明作用越強(qiáng)。
最后,再逐一增加之前剔除的自相關(guān)參數(shù),據(jù)前后模型預(yù)測(cè)精度差值來衡量其是否值得選取。若模型精度無增加,則說明該參數(shù)內(nèi)蘊(yùn)含的關(guān)鍵信息皆已包含在其自相關(guān)參數(shù)中。當(dāng)其自相關(guān)參數(shù)存在時(shí),該參數(shù)的增加對(duì)模型已無作用。
對(duì)穩(wěn)態(tài)工況發(fā)動(dòng)機(jī)萬有數(shù)據(jù)進(jìn)行特征選取,得到的部分參數(shù)分析結(jié)果如圖5所示。
圖5 輸入?yún)?shù)模型貢獻(xiàn)度分布圖Fig.5 Distribution diagram of parametric contribution to model
因參數(shù)過多,僅展示模型貢獻(xiàn)度為正的參數(shù)作為特征提取結(jié)果。在穩(wěn)態(tài)工況下,選取貢獻(xiàn)度較大的6個(gè)參數(shù)作為特征提取結(jié)果,其中,總噴油脈寬、排氣溫度和過量空氣系數(shù)對(duì)模型起著決定性作用,進(jìn)氣壓力、軌壓、進(jìn)氣VVT 對(duì)排放物的預(yù)測(cè)起補(bǔ)充作用。扭矩、二次噴射脈寬、渦前排壓等參數(shù)僅對(duì)模型的預(yù)測(cè)有微小作用,考慮到計(jì)算量和計(jì)算時(shí)間,舍棄這些參數(shù)。
在瞬態(tài)工況下對(duì)特征進(jìn)行選取,得到不同的特征提取結(jié)果。瞬態(tài)工況下的模型貢獻(xiàn)度分布較為均勻,因此,選取貢獻(xiàn)度為正的全部14 個(gè)參數(shù)作為特征提取結(jié)果。其中,過量空氣系數(shù)、進(jìn)氣VVT、總噴油脈寬對(duì)模型起著決定性作用,其余參數(shù)起著補(bǔ)充作用。
為了驗(yàn)證分析結(jié)果的正確性,選取特征提取后的參數(shù)建立新的組合神經(jīng)網(wǎng)絡(luò)模型,模型計(jì)算時(shí)間大大減少,且穩(wěn)態(tài)數(shù)據(jù)預(yù)測(cè)結(jié)果的決定系數(shù)R2達(dá)到98.6%、瞬態(tài)數(shù)據(jù)預(yù)測(cè)結(jié)果的決定系數(shù)R2達(dá)到97.73%。特征提取后模型對(duì)NOx體積分?jǐn)?shù)的預(yù)測(cè)值與試驗(yàn)值對(duì)比結(jié)果如圖6所示。特征提取后輸入模型的信息中無效數(shù)據(jù)大大減少,證明特征提取方法有效。
圖6 特征提取后模型對(duì)NOx體積分?jǐn)?shù)的預(yù)測(cè)值與試驗(yàn)值對(duì)比Fig.6 Comparison of predicted value and experimental value of NOx volume fraction after parameters selection
在穩(wěn)態(tài)條件下,發(fā)動(dòng)機(jī)油路與氣路均保持相對(duì)穩(wěn)定,控制參數(shù)間自相關(guān)性比較大,僅選取較少的控制參數(shù)即可準(zhǔn)確地反映出發(fā)動(dòng)機(jī)工作狀態(tài)。
對(duì)于模型起決定性作用的3個(gè)變量中,排氣溫度從側(cè)面反映了缸內(nèi)的燃燒狀況,代表缸內(nèi)燃燒狀態(tài);而過量空氣系數(shù)和總噴油脈寬從發(fā)動(dòng)機(jī)工況以及進(jìn)氣等方面影響發(fā)動(dòng)機(jī)的點(diǎn)火參數(shù)和進(jìn)氣質(zhì)量,主要反映發(fā)動(dòng)機(jī)內(nèi)部發(fā)的燃前氣體狀態(tài);發(fā)動(dòng)機(jī)缸內(nèi)燃燒前后狀態(tài)確定后,其排放物濃度即可基本確定[16-19]。
而轉(zhuǎn)速作為發(fā)動(dòng)機(jī)的主要參數(shù),其影響著燃燒室內(nèi)混合氣的擾流混合和渦流擴(kuò)散,對(duì)燃燒速度和散熱都有影響[20]。但在穩(wěn)態(tài)工況下,渦輪前排氣溫度是這些影響的最終反映,可以完全取代發(fā)動(dòng)機(jī)轉(zhuǎn)速在模型中的作用,所以,不選取發(fā)動(dòng)機(jī)轉(zhuǎn)速作為輸入變量。
而在瞬態(tài)工況下,發(fā)動(dòng)機(jī)油路響應(yīng)時(shí)間較短,氣路響應(yīng)時(shí)間較長(zhǎng),這就造成了氣、油兩路不相匹配,發(fā)動(dòng)機(jī)各控制參數(shù)間自相關(guān)性較小,因此,必須選取更多的參數(shù)才能表征發(fā)動(dòng)機(jī)的工作狀態(tài)。且在穩(wěn)態(tài)工況下,其主要作用的幾個(gè)控制參數(shù)在瞬態(tài)工況下仍然占據(jù)著核心地位。
雖然該方法是一種數(shù)據(jù)驅(qū)動(dòng)的方法,受到不同參數(shù)的變化范圍及分布的影響,但由該方法得到的影響汽油機(jī)NOx排放的控制參數(shù)與NOx生成理論基本相符,因而,該方法也可以為理論研究提供一定的指導(dǎo)作用。特征選取在建模過程中對(duì)于模型的簡(jiǎn)化有著非常重要的作用。
對(duì)分析結(jié)果在其他機(jī)型上進(jìn)行驗(yàn)證,驗(yàn)證機(jī)型的參數(shù)如表4所示。
表4 驗(yàn)證機(jī)型技術(shù)參數(shù)Table 4 Verification engines technical parameters
采用同樣的樣本劃分方法及建模參數(shù),分別建立起全部變量作為輸入的模型和特征選取后參數(shù)作為輸入的模型,通過對(duì)比兩者模型精度來評(píng)判特征選取結(jié)果的普適性,建模結(jié)果如表5所示。
表5 特征提取前后預(yù)測(cè)結(jié)果對(duì)比Table 5 Comparison of prediction results before and after feature extraction
從表5可知:使用特征提取后的參數(shù)建立的模型預(yù)測(cè)精度均有小幅提升,特征提取結(jié)果在這些機(jī)型上同樣適用。驗(yàn)證結(jié)果符合之前的分析結(jié)論,證明該特征選取方法具有普適性和可靠性。
1)組合神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度、穩(wěn)定性及泛化性皆優(yōu)于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型和隨機(jī)森林模型。
2)用組合神經(jīng)網(wǎng)絡(luò)模型能有效地預(yù)測(cè)發(fā)動(dòng)機(jī)的NOx排放,其預(yù)測(cè)值與試驗(yàn)值決定系數(shù)達(dá)到98%以上,相關(guān)系數(shù)達(dá)到99%以上。組合神經(jīng)網(wǎng)絡(luò)對(duì)發(fā)動(dòng)機(jī)NOx排放有著較好的預(yù)測(cè)結(jié)果。
3)總噴油脈寬、渦輪前排氣溫度和過量空氣系數(shù)對(duì)穩(wěn)態(tài)工況下的NOx排放預(yù)測(cè)模型起著決定性作用。進(jìn)氣壓力、軌壓、進(jìn)氣VVT、扭矩、二次噴射脈寬等參數(shù)對(duì)NOx的排放預(yù)測(cè)起著補(bǔ)充作用,在追求高精度模型時(shí)可作為輸入?yún)?shù)。
4)在瞬態(tài)工況下,因氣路和油路相應(yīng)時(shí)間不一致,需要更多的參數(shù)才能建立精度較高的模型。
5)特征選取得到的分析結(jié)果能小幅提升模型精度,簡(jiǎn)化模型,加快模型運(yùn)算速度,具有一定的指導(dǎo)性。