楊愛平 ,唐倩 ,撒利軍 ,劉達(dá)
(1.重慶大學(xué) 機(jī)械傳動(dòng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,重慶 400044;2.長(zhǎng)安汽車有限責(zé)任公司,重慶 400023)
車輛在行駛過程中會(huì)產(chǎn)生大量熱量,對(duì)于傳統(tǒng)內(nèi)燃機(jī)汽車,熱量來自于動(dòng)力總成中內(nèi)燃機(jī)缸體內(nèi)燃料的燃燒與零件的相對(duì)運(yùn)動(dòng),而對(duì)于電驅(qū)動(dòng)的新能源汽車,熱量則來自于車輛內(nèi)鋰離子電池的產(chǎn)熱[1]。這些熱量若沒有及時(shí)被帶走,輕則造成車輛運(yùn)行穩(wěn)定性下降、燃油經(jīng)濟(jì)性降低,重則導(dǎo)致動(dòng)力總成過熱報(bào)廢?,F(xiàn)代車輛冷卻系統(tǒng)多傾向于使用成熟的液冷散熱,但液冷散熱系統(tǒng)存在大量的冷卻管路,需要保證其具有良好的密封性。在汽車的生產(chǎn)過程中,冷卻系統(tǒng)的密封性檢測(cè)是在冷卻液加注之前進(jìn)行的,具體方法是對(duì)冷卻系統(tǒng)進(jìn)行氣體加壓處理,通過一個(gè)保壓過程進(jìn)行密封性測(cè)試[2]。但這種方法工序復(fù)雜,并且測(cè)試要求的環(huán)境條件較高。隨著大數(shù)據(jù)科學(xué)的快速發(fā)展及汽車生產(chǎn)中全流程信息采集系統(tǒng)的廣泛應(yīng)用,已經(jīng)可以實(shí)現(xiàn)以低成本、大范圍、增量累計(jì)的方式獲取車輛生產(chǎn)過程中的有用信息[3],這為使用基于數(shù)據(jù)驅(qū)動(dòng)的方法進(jìn)行動(dòng)力總成冷卻系統(tǒng)密封性預(yù)測(cè)奠定了基礎(chǔ)。相比于傳統(tǒng)基于模型的方法,數(shù)據(jù)驅(qū)動(dòng)的方法可以在沒有系統(tǒng)先驗(yàn)知識(shí)與準(zhǔn)確數(shù)學(xué)模型的基礎(chǔ)上,通過生產(chǎn)與測(cè)試過程中產(chǎn)生的大量有用信息訓(xùn)練AI模型,使其具備解決某一特定問題的能力[4]。基于數(shù)據(jù)的預(yù)測(cè)方法已經(jīng)取得了十分廣泛的應(yīng)用,胡杰等[5]基于車輛狀態(tài)參數(shù)、環(huán)境信息對(duì)電動(dòng)車行駛里程進(jìn)行了預(yù)測(cè),Lin Xie等[6]基于天然氣、石油行業(yè)安全儀表的操作數(shù)據(jù)預(yù)測(cè)了儀表的故障率。在車輛生產(chǎn)過程中,獲取生產(chǎn)數(shù)據(jù)是比較容易的,并且這些數(shù)據(jù)中往往蘊(yùn)含了大量與冷卻系統(tǒng)密封性有關(guān)的信息,因此使用基于數(shù)據(jù)的方法預(yù)測(cè)冷卻系統(tǒng)密封性是較為合適的。本文通過數(shù)據(jù)驅(qū)動(dòng)的方法對(duì)動(dòng)力總成密封性測(cè)試結(jié)果進(jìn)行預(yù)測(cè),具體選擇了二分類的邏輯回歸判別模型。方案基于大量的生產(chǎn)過程工藝數(shù)據(jù)樣本,訓(xùn)練邏輯回歸模型,直至模型具備良好的輸出精度,最終實(shí)現(xiàn)對(duì)密封性測(cè)試結(jié)果的預(yù)測(cè),本方案的具體流程如圖1所示。
圖1 方案流程圖
動(dòng)力總成是車輛的核心部件,負(fù)責(zé)車輛動(dòng)力的產(chǎn)生,決定了整車的動(dòng)力性、經(jīng)濟(jì)性與可靠性[7]。對(duì)于傳統(tǒng)內(nèi)燃機(jī)車輛,動(dòng)力總成包含發(fā)動(dòng)機(jī)、變速器、進(jìn)氣系統(tǒng)、排氣系統(tǒng)、冷卻系統(tǒng)、供油系統(tǒng)、發(fā)動(dòng)機(jī)懸掛等,而對(duì)于電驅(qū)動(dòng)的新能源汽車,動(dòng)力總成則包含整車動(dòng)力驅(qū)動(dòng)控制單元、電動(dòng)機(jī)及其逆變器、變速器、冷卻系統(tǒng)等。雖然傳統(tǒng)汽車與新能源汽車動(dòng)力總成在結(jié)構(gòu)上存在較大的區(qū)別,但均存在冷卻系統(tǒng),冷卻系統(tǒng)的運(yùn)轉(zhuǎn)情況將決定車輛行駛過程是否安全、穩(wěn)定。傳統(tǒng)內(nèi)燃機(jī)汽車的冷卻系統(tǒng)主要是為發(fā)動(dòng)機(jī)缸體降溫,而新能源汽車?yán)鋮s系統(tǒng)則主要為電池系統(tǒng)降溫。車輛冷卻系統(tǒng)保證了動(dòng)力總成在較高輸出功率的同時(shí),又具有良好的經(jīng)濟(jì)性與可靠性。
現(xiàn)代車輛動(dòng)力總成主要采用閉式強(qiáng)制循環(huán)冷卻系統(tǒng)[8],一般由冷卻水泵、水熱交換器、散熱器、循環(huán)管路等部分組成,屬于典型的液冷散熱方式。此外,在純電驅(qū)動(dòng)汽車的冷卻系統(tǒng)中,還會(huì)采用風(fēng)冷、相變材料冷卻、熱管冷卻等冷卻方式,但由于液冷散熱效率高,其仍然為車輛動(dòng)力總成主要冷卻方式。采用液體方式的冷卻系統(tǒng)中,由于冷卻管路中冷卻液存在較大壓力,因此普遍存在泄漏風(fēng)險(xiǎn),是本文主要研究的問題。液冷系統(tǒng)冷卻液泄漏會(huì)造成車輛散熱效率下降,若冷卻液滴落在動(dòng)力總成中某些控制電路中,則會(huì)造成更為嚴(yán)重的損失。
為了使汽車在生產(chǎn)過程中能及時(shí)檢測(cè)到冷卻系統(tǒng)是否存在泄漏隱患,本文通過數(shù)據(jù)驅(qū)動(dòng)的方式對(duì)冷卻管路進(jìn)行密封性預(yù)測(cè),若預(yù)測(cè)模型判斷某一動(dòng)力總成冷卻系統(tǒng)存在泄漏的風(fēng)險(xiǎn),則將該動(dòng)力總成下線檢查,將安全隱患排除在產(chǎn)品交付之前。
數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)模型依賴于大量的數(shù)據(jù)來訓(xùn)練模型,這些數(shù)據(jù)又分為訓(xùn)練集與測(cè)試集,統(tǒng)稱為數(shù)據(jù)集。訓(xùn)練集為訓(xùn)練模型的樣本數(shù)據(jù),測(cè)試集為模型訓(xùn)練好后評(píng)價(jià)模型的樣本數(shù)據(jù),由于測(cè)試集沒有參與模型訓(xùn)練,因此基于其的評(píng)價(jià)結(jié)果會(huì)更加客觀。本文的數(shù)據(jù)集來源于動(dòng)力總成制造過程中產(chǎn)生的生產(chǎn)數(shù)據(jù),數(shù)據(jù)集中包含特征值與目標(biāo)值,特征值為輸入模型的數(shù)據(jù),目標(biāo)值為模型輸出的數(shù)據(jù),本文數(shù)據(jù)集中特征值為生產(chǎn)過程中冷卻管路各個(gè)螺栓的擰緊數(shù)據(jù),目標(biāo)值為對(duì)應(yīng)動(dòng)力總成冷卻系統(tǒng)管路密封性測(cè)試是否合格的布爾值,其中測(cè)試合格情況與布爾值的具體對(duì)應(yīng)方式如表1所示,模型輸入輸出關(guān)系如圖2所示。
圖2 模型輸入輸出關(guān)系圖
表1 泄漏測(cè)試結(jié)果布爾值對(duì)應(yīng)表
對(duì)于已經(jīng)采集好的數(shù)據(jù),還需進(jìn)行預(yù)處理,包含缺失值處理、歸一化處理等。在使用機(jī)器學(xué)習(xí)等數(shù)據(jù)驅(qū)動(dòng)的方法建模前,需要將訓(xùn)練數(shù)據(jù)集中異常的缺失值(如Null)進(jìn)行處理,本文采用的缺失值處理的方法為平均值插補(bǔ),具體策略為若某一樣本的某一數(shù)據(jù)存在缺失且缺失數(shù)據(jù)量較少,則結(jié)合多個(gè)樣本得到這一項(xiàng)的平均值,以平均值插補(bǔ)替換缺失值,若缺失數(shù)據(jù)量太多,則舍棄該樣本。除平均值插補(bǔ)法外,還有固定值插補(bǔ)法、最鄰近插補(bǔ)法,但由于這類方法對(duì)樣本誤差的影響較大[9],故沒有采用。缺失值處理能使模型需求的每個(gè)輸入值都存在,保證了模型穩(wěn)定性。
歸一化處理的目的是為了消除樣本之間的量綱影響,并加快模型訓(xùn)練時(shí)的收斂速度,本文使用z分?jǐn)?shù)(zscore)歸一化方法,該方法使所有處理后的數(shù)據(jù)樣本符合均值為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布,歸一化處理的數(shù)據(jù)的計(jì)算公式為
式中:x為原始數(shù)據(jù);x*為歸一化處理的數(shù)據(jù);μ是樣本均值;σ是樣本標(biāo)準(zhǔn)差。
邏輯回歸(Logistic Regression)是一種廣義的線性回歸模型(Generalized linear model),是一種常用的統(tǒng)計(jì)學(xué)方法?;貧w一般指研究某一數(shù)學(xué)問題因變量與自變量之間的關(guān)系,而邏輯回歸往往是使用了Sigmoid函數(shù)的回歸模型。邏輯回歸在機(jī)器學(xué)習(xí)中屬于有監(jiān)督學(xué)習(xí),通過預(yù)測(cè)不同自變量發(fā)生某種情況的概率,從而求解某一分類或多分類問題的解,是一種經(jīng)典的分類問題預(yù)測(cè)方法。由于本文研究的動(dòng)力總成冷卻系統(tǒng)密封性檢測(cè)是否合格的問題屬于二分類問題,故使用二分類的邏輯回歸模型進(jìn)行預(yù)測(cè)。
邏輯回歸的輸入函數(shù)h(X)為一線性函數(shù),它將所有螺栓的擰緊數(shù)據(jù)包含進(jìn)來,并使用權(quán)值系數(shù)將螺栓擰緊數(shù)據(jù)結(jié)合到一起,以便于后續(xù)的求解分析,輸入函數(shù)的具體形式為
式中:w0、w1、……、wn為各個(gè)權(quán)值系數(shù);x0、x1、……、xn為具體的螺栓擰緊數(shù)據(jù);b0、b1、……、bn為每一項(xiàng)的偏置系數(shù);W為權(quán)值系數(shù)集合;X為各螺栓擰緊數(shù)據(jù)集合。
在定義好邏輯回歸輸入函數(shù)后,引入Sigmoid函數(shù),其值域?yàn)閇0,1]。Sigmoid函數(shù)的具體數(shù)學(xué)形式見式(3),對(duì)應(yīng)的函數(shù)圖像如圖3所示。
圖3 Sigmoid函數(shù)圖像
由于本文需要預(yù)測(cè)的目標(biāo)為動(dòng)力總成冷卻系統(tǒng)泄漏檢測(cè)是否合格,具體的檢測(cè)結(jié)果只有合格與不合格之分,前文已經(jīng)將測(cè)試結(jié)果與布爾值相對(duì)應(yīng),接下來應(yīng)該使其與條件概率聯(lián)系起來,使模型輸出測(cè)試合格與不合格條件下的概率值。為獲得二項(xiàng)邏輯回歸的條件概率模型,需將邏輯回歸輸入函數(shù)h(X)代入Sigmoid函數(shù)σ(i)中,使函數(shù)h(X)的輸出映射到值域?yàn)閇0,1]的區(qū)間中,式(4)、式(5)分別為泄漏測(cè)試合格(Y=1)與泄漏測(cè)試不合格(Y=0)條件下的條件概率分布函數(shù)。
在獲得條件概率分布函數(shù)后,需要將預(yù)測(cè)得到的條件概率劃分為具體的正例與反例以實(shí)現(xiàn)二分類,因此需要設(shè)定一個(gè)閾值s來區(qū)分正反例。本文設(shè)置的閾值s=0.5,當(dāng)P(Y=1|X)>0.5時(shí),劃分為正例,模型預(yù)測(cè)結(jié)果為動(dòng)力總成冷卻系統(tǒng)密封性檢測(cè)合格,當(dāng)P(Y=1|X)<0.5(即P(Y=0|X)>0.5)時(shí),模型預(yù)測(cè)結(jié)果為動(dòng)力總成冷卻系統(tǒng)密封性檢測(cè)不合格。
由于本文研究的是分類問題,因此通常使用混淆矩陣來評(píng)價(jià)模型預(yù)測(cè)能力?;煜仃囀且环N表示精度評(píng)價(jià)的標(biāo)準(zhǔn)格式,也稱為誤差矩陣,當(dāng)問題被分為n類時(shí),往往由n行n列的矩陣構(gòu)成,二分類的混淆矩陣形式如表2所示?;煜仃囍?,TP(True Postive)表示真實(shí)結(jié)果與預(yù)測(cè)結(jié)果均為合格的樣本數(shù);TN(True Negative)表示真實(shí)結(jié)果與預(yù)測(cè)結(jié)果均不合格的樣本數(shù);FP(False Positive)屬于統(tǒng)計(jì)學(xué)第一類錯(cuò)誤,表示將實(shí)際不合格的產(chǎn)品預(yù)測(cè)成合格產(chǎn)品;FN(False Negative)屬于統(tǒng)計(jì)學(xué)第二類錯(cuò)誤,表示將實(shí)際合格的產(chǎn)品預(yù)測(cè)成不合格產(chǎn)品[10]。除混淆矩陣外,還有準(zhǔn)確率(Accuracy)、精確率(Precision)、正類正確率(True Positive Rate,TPR)、負(fù)類正確率(True Negative Rate,TNR)等評(píng)價(jià)指標(biāo),其計(jì)算公式如表3所示。
表2 二分類的混淆矩陣形式
表3 評(píng)價(jià)指標(biāo)計(jì)算公式
本文使用從某車企生產(chǎn)現(xiàn)場(chǎng)采集的218組動(dòng)力總成歷史生產(chǎn)裝配數(shù)據(jù)用作訓(xùn)練模型,每組數(shù)據(jù)為一臺(tái)動(dòng)力總成的與密封性有關(guān)的螺栓擰緊力與擰緊轉(zhuǎn)矩及最終密封性測(cè)試結(jié)果。實(shí)驗(yàn)平臺(tái)配置為處理器i5-9400f(2.90 GHz),內(nèi) 存 為16 GB,顯 卡 為NVIDIA GTX1660。實(shí)驗(yàn)使用Python編程語言并基于Pytorch機(jī)器學(xué)習(xí)庫(kù)構(gòu)建了邏輯回歸模型。
首先將數(shù)據(jù)集進(jìn)行缺失值處理與歸一化處理,保證數(shù)據(jù)完整且利于模型求解收斂。以7:3的比例將數(shù)據(jù)集劃分為訓(xùn)練集與測(cè)試集,分別設(shè)置邏輯回歸模型超參數(shù):學(xué)習(xí)率為0.01,分類閾值為0.5,正則化力度為0.01,迭代次數(shù)設(shè)置為200次,求解優(yōu)化器選擇隨機(jī)梯度下 降(stochastic gradient descent,SGD)。進(jìn)行求解運(yùn)算,得到200次迭代過程中訓(xùn)練集與測(cè)試集準(zhǔn)確率變化曲線如圖4、圖5所示。
由圖4與圖5可知,測(cè)試集的準(zhǔn)確率隨訓(xùn)練次數(shù)的增加而增加,且與訓(xùn)練集準(zhǔn)確率增長(zhǎng)趨勢(shì)較為一致,說明本文所選的螺栓擰緊數(shù)據(jù)與密封性之間存在較大的關(guān)聯(lián)性,間接證明了方法的有效性。在訓(xùn)練次數(shù)到達(dá)100次時(shí),模型開始學(xué)習(xí)到有價(jià)值信息并且開始收斂,在第100次到150次迭代過程中,訓(xùn)練集與測(cè)試集準(zhǔn)確率上升較快,150次迭代以后,訓(xùn)練集準(zhǔn)確率上升緩慢,測(cè)試集準(zhǔn)確率不再明顯上升并開始在85%之間波動(dòng),表現(xiàn)出過擬合現(xiàn)象,故訓(xùn)練停止。表4展示了動(dòng)力總成密封性測(cè)試的部分實(shí)際測(cè)試結(jié)果與預(yù)測(cè)結(jié)果。
圖4 訓(xùn)練集準(zhǔn)確率
圖5 測(cè)試集準(zhǔn)確率
從表4可以看出,邏輯回歸模型對(duì)于動(dòng)力總成密封性的預(yù)測(cè)擁有較高的準(zhǔn)確率,除2號(hào)樣本預(yù)測(cè)錯(cuò)誤以外,其余樣本均預(yù)測(cè)正確。由于訓(xùn)練集參加了模型的訓(xùn)練過程,測(cè)試集的預(yù)測(cè)結(jié)果才能客觀體現(xiàn)模型的預(yù)測(cè)性能,為了驗(yàn)證模型對(duì)于測(cè)試集整體的預(yù)測(cè)能力,給出了測(cè)試集樣本預(yù)測(cè)結(jié)果的混淆矩陣如表5所示,模型分類能力評(píng)價(jià)指標(biāo)如表6所示。
表4 部分實(shí)際測(cè)試結(jié)果與預(yù)測(cè)結(jié)果
表6 模型分類能力評(píng)價(jià)指標(biāo)%
從表5的混淆矩陣中可得,測(cè)試集共66個(gè)樣本,只有7個(gè)樣本預(yù)測(cè)錯(cuò)誤,其中包括2個(gè)統(tǒng)計(jì)學(xué)第一類錯(cuò)誤的樣本,5個(gè)第二類錯(cuò)誤樣本,模型將預(yù)測(cè)錯(cuò)誤的樣本數(shù)控制在了較低的水平。由于本文最主要的目的是將密封性有問題的動(dòng)力總成檢測(cè)出來,因此負(fù)類正確率(TNR)指標(biāo)尤為重要,模型基于測(cè)試集的負(fù)類正確率為88.23%,這表明10個(gè)問題樣本中會(huì)有接近9個(gè)被檢測(cè)出來。此外模型在其他指標(biāo)上也表現(xiàn)出較高的性能,其中準(zhǔn)確率(Accuracy)達(dá)到89.39%,精確率(Precision)為95.65%,正類正確率(TPR)為89.79%。以上數(shù)據(jù)表明,本文的邏輯回歸模型具有較高的預(yù)測(cè)能力,側(cè)面驗(yàn)證了本方案的有效性。
表5 預(yù)測(cè)結(jié)果與真實(shí)結(jié)果的混淆矩陣
本文基于數(shù)據(jù)驅(qū)動(dòng)的邏輯回歸算法建立了對(duì)動(dòng)力總成冷卻系統(tǒng)密封性質(zhì)量的分類判別模型。使用真實(shí)生產(chǎn)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),得到的預(yù)測(cè)模型顯示出較高的精度,其中最重要的TPR指標(biāo)達(dá)到89.79%,表明不合格動(dòng)力總成被檢測(cè)出來的概率較大,滿足了實(shí)際生產(chǎn)檢測(cè)需求。通過使用本文的預(yù)測(cè)模型,可以及時(shí)將生產(chǎn)過程中有問題的動(dòng)力總成下線檢修,也可以對(duì)此后的人工密封性檢測(cè)結(jié)果提供參考,具有一定的工程意義。