陳孟秋,何明霞*,李 萌,曲秋紅
1.天津大學(xué)測試計量技術(shù)及儀器國家重點實驗室,天津 300072 2.萊儀特太赫茲(天津)科技有限公司,天津 300019
發(fā)動機潤滑油,主要成分是碳氫化合物,主要功能為對發(fā)動機起到潤滑防磨、冷卻降溫、減震緩沖、防銹蝕防漏等作用[1]。新出廠的發(fā)動機潤滑油是不含水分的,但在存儲、運輸和使用的過程中,可能會因為各種原因混入水分。按照國家標準,發(fā)動機潤滑油中允許的含水量應(yīng)在0.03%以下,若含水量超過標準,潤滑油中會產(chǎn)生酸類物質(zhì),這些酸類物質(zhì)會增加對發(fā)動機的腐蝕,引起發(fā)動機抱軸、燒瓦等嚴重事故。
針對發(fā)動機潤滑油中水含量的檢測現(xiàn)在常用方法有重量法、紅外光譜分析法、蒸餾法、卡爾·費休法等。這些方法均已有成熟的測試步驟,但仍存在各自的不足,如:當樣品中水分含量高時采用重量法會在烘干過程中發(fā)生飛濺,影響測量精度;紅外光譜分析法會受到基礎(chǔ)油類別、潤滑油劣化程度等因素影響[2];蒸餾法則需要的樣品量較多,耗時較長;卡爾·費休法雖然應(yīng)用最廣泛,但是這種方法副反應(yīng)較多,且測量使用的化學(xué)試劑具有毒性[3]。
太赫茲(Terahertz,THz)波是指波長在0.03~3 mm之間,頻率在0.1~10 THz,介于紅外和微波之間的電磁波[4]。水在太赫茲頻段擁有獨特的分子鍵振動模式,使得水對太赫茲具有強烈的吸收性[5-6]。太赫茲光譜技術(shù)已被用于測量變壓器油、原油、生物組織及細胞中的微水含量[7]。
本文利用太赫茲時域光譜技術(shù)對發(fā)動機潤滑油中水含量進行檢測并結(jié)合特征譜區(qū)篩選算法進行定量分析,對潤滑油中水含量這一指標進行建模分析,對不同模型比較選優(yōu),建立最優(yōu)定量分析模型。以期尋找一種檢定潤滑油含水量的新方法。
實驗使用的是日本advantest公司的TAS7400SU太赫茲光譜系統(tǒng)。光譜范圍為0.5~7.0 THz,頻率精度±10 GHz,動態(tài)范圍為57 dB,頻率分辨率為7.6 GHz。該系統(tǒng)由三個主要部分組成,分別是飛秒激光器,太赫茲發(fā)射天線和接收天線。本實驗中用的是其透射模塊,其結(jié)構(gòu)如圖1所示。
圖1 太赫茲時域光譜系統(tǒng)Fig.1 Schematic of THz-TDS
實驗選用汽車發(fā)動機同型號不同老化程度的潤滑油,利用卡爾·費休水分測定儀對其含水量進行測量,卡爾·費休法是利用了樣品中的水與卡爾費休試劑中SO2和I2產(chǎn)生的氧化還原反應(yīng)對其進行水含量的測量,每種潤滑油分別測量3次,取平均值。其含水量分別為0.039 2%,0.029 2%,0.026 1%,0.017 4%,0.015 8%和0.013 3%,液體樣品池采用光程為10 mm的JGS1級石英比色皿,樣品需要干燥密封保存。
在實驗中,以干燥空氣作為背景信號,相同含水量的潤滑油樣品各準備6個樣本,每個樣本移動不同位置分別測量5次。得到每種潤滑油各采集30組光譜數(shù)據(jù),總共180組光譜數(shù)據(jù)。
為了降低系統(tǒng)及實驗因素導(dǎo)致的干擾和噪聲,使用Savitzky-Golay(S-G)平滑預(yù)處理,考慮原光譜的特性,將平滑濾波器的擬合階數(shù)設(shè)置為3階,設(shè)置每15個點平滑一次。樣品集的劃分采用Kennard-Stone(KS)算法,將所有樣本均視為訓(xùn)練集候選樣本,依次從中挑選樣本進入訓(xùn)練集。通過KS算法,將樣品中150組數(shù)據(jù)設(shè)為校正集,30組數(shù)據(jù)設(shè)為預(yù)測集。
常規(guī)區(qū)間最小二乘(iPLS)是一種較為常用的優(yōu)選特征光譜區(qū)間的化學(xué)計量方法,由N?rgaard等提出。將數(shù)據(jù)集劃分為n個子區(qū)間,分別建立每個子區(qū)間的PLS模型,取子區(qū)間交互驗證均方根誤差(RMSECV)最小時的因子數(shù)為最優(yōu)因子數(shù),以建立各個子區(qū)間的最優(yōu)模型。向后區(qū)間偏最小二乘法(BiPLS)是每次排除根據(jù)RMSECV數(shù)值顯示建模效果最差的子區(qū)間,使得在(n-1)個子區(qū)間內(nèi)建模,取RMSECV最小的區(qū)間組合為最優(yōu)建模區(qū)間。聯(lián)合區(qū)間偏最小二乘法(SiPLS)則是根據(jù)指定的組合區(qū)間個數(shù)將各個子區(qū)間隨機組合,對每種組合的區(qū)間建立PLS模型,取RMSECV最小的區(qū)間組合為最優(yōu)建模區(qū)間。
經(jīng)平滑處理后得到的THz吸收系數(shù)誤差棒譜線如圖2所示,光譜范圍取1.0~3.5 THz,頻率間隔7.6 GHz,每條譜線包含328個變量。從圖中可以看出吸收系數(shù)譜線隨含水量增加而升高,當頻率大于3.5 THz時,由于受系統(tǒng)功率影響,出現(xiàn)了明顯噪聲,因此為了保證數(shù)據(jù)的可靠性,采用1.0~3.5 THz的數(shù)據(jù)作為定量分析的對象。
圖2 不同含水量潤滑油的吸收系數(shù)誤差棒譜線Fig.2 Dielectric constant spectra of lubricants with different water contents
2.2.1 iPLS模型
將預(yù)處理過的1.0~3.5 THz范圍的光譜區(qū)域劃分為10~30個子區(qū)間,分別建立iPLS特征光譜區(qū)間篩選模型,比較不同模型的交互驗證均方根誤差(RMSECV)。選取所建立的回歸模型中RMSECV最小時的子區(qū)間劃分數(shù)、入選區(qū)間及主因子數(shù)建立潤滑油水含量的定量分析模型,并以獨立的預(yù)測集進行驗證,比較預(yù)測模型的預(yù)測均方根誤差(RMSEP)。
由表1中各模型的RMSECV值可知,在對應(yīng)的iPLS譜區(qū)篩選模型的21個區(qū)間間隔劃分模型中,當整個區(qū)間光譜間隔數(shù)為10個子區(qū)間,選擇第2個子區(qū)間,對應(yīng)1.258 85~1.502 99 THz,主因子數(shù)為8時建模結(jié)果最佳。iPLS最優(yōu)模型的RMSECV=0.004 8,RMSEP=0.006 0,校正集相關(guān)系數(shù)Rc為0.848 2,預(yù)測集相關(guān)系數(shù)Rp為0.761 8,對應(yīng)頻率范圍為1.258 85~1.502 99 THz。
表1 不同區(qū)間劃分數(shù)量時iPLS建模模型Table 1 Results of iPLS model with different number of interval divisions
2.2.2 BiPLS模型
將預(yù)處理過的1.0~3.5 THz范圍的光譜區(qū)域劃分為10~30個子區(qū)間,分別建立BiPLS特征光譜區(qū)間篩選模型,以優(yōu)選的光譜區(qū)間建立水含量定量分析模型并進行預(yù)測。
由表2可見,在對應(yīng)的BiPLS譜區(qū)篩選模型的21個區(qū)間間隔劃分模型中,當整個區(qū)間光譜間隔數(shù)為26個子區(qū)間,選擇[18 10 4 3 8 12 5 11 24 13 16 21 2]子區(qū)間組合,主因子數(shù)為10時建模結(jié)果最佳。BiPLS最優(yōu)模型的RMSECV=0.003 5,RMSEP=0.0046,Rc=0.919 3,Rp=0.865 7。
表2 不同區(qū)間劃分數(shù)量時BiPLS建模模型Table 2 Results of BiPLS model with different number of interval divisions
2.2.3 SiPLS模型
將預(yù)處理過的1.0~3.5 THz范圍的光譜劃分為10~30個子區(qū)間,在區(qū)間間隔劃分數(shù)相同的條件下,分別計算了2個、3個和4個區(qū)間聯(lián)合的模型,并以優(yōu)選區(qū)間進行模型建立和預(yù)測。
由表3可得:當區(qū)間聯(lián)合個數(shù)為2時,在全頻段被劃分成28個間隔,取第2、第19區(qū)間,主因子數(shù)為7時建模,RMSECV=0.003 9,RMSEP=0.005 3,Rc=0.900 2,Rp=0.816 1。
表3 不同區(qū)間劃分數(shù)量時BiPLS建模模型Table 3 Results of SiPLS model with different number of interval divisions
當區(qū)間聯(lián)合個數(shù)為3時,在全頻段被劃分成23個間隔,取第1、第3和第16區(qū)間,主因子數(shù)為7時建模,RMSECV=0.003 8,RMSEP=0.004 6,Rc=0.906 2,Rp=0.862 0。
當區(qū)間聯(lián)合個數(shù)為4時,在全頻段被劃分成20個間隔,取第1、第3、第7和第14區(qū)間,主因子數(shù)為7時建模,RMSECV=0.003 7,RMSEP=0.004 7,Rc=0.913 7,Rp=0.859 9。
綜合考慮相關(guān)系數(shù)r,RMSECV,RMSEP以及計算時間等因素,采用區(qū)間聯(lián)合個數(shù)為3時,全頻段被劃分成23個間隔,取第1、第3和第16區(qū)間,主因子數(shù)為7時建模,對應(yīng)頻率范圍為1.007 1~1.113 9,1.236 0~1.342 8和2.655 0~2.754 2 THz。
將采用上述三種方法所建立的模型進行比較,各模型預(yù)測結(jié)果如表4。
表4 不同光譜區(qū)間建模的優(yōu)選模型Table 4 Selected models with different spectral regions
由表4中數(shù)據(jù)可以得到,BiPLS模型的Rc和Rp均高于iPLS模型和SiPLS模型,且運算速度遠快于SiPLS模型。
本實驗最后采用BiPLS模型用于潤滑油中微量水含量的定量分析,模型區(qū)間數(shù)為26,入選區(qū)間為[18 10 4 3 8 12 5 11 24 13 16 21 2]子區(qū)間組合,主因子數(shù)為10,最優(yōu)模型的RMSECV=0.003 5,RMSEP=0.004 6,Rc=0.919 3,Rp=0.865 7,預(yù)測效果如圖3。
圖3 潤滑油水含量的BiPLS模型(a)和最優(yōu)預(yù)測結(jié)果(b)Fig.3 BiPLS model of lubricant water content (a) and optimal results of prediction models obtained by (b) BiPLS for water content of lubricating oil
基于太赫茲時域光譜,采用特征譜區(qū)間篩選算法建模并優(yōu)選最佳建模方式。最終選用向后區(qū)間偏最小二乘法(BiPLS)用于發(fā)動機潤滑油中微量水含量的定量分析,所建模型具有較好的定量分析效果,且建模計算速度快,計算量較小。為測定發(fā)動機潤滑油中微量水含量提供了一種較為快速簡便的方式,也為檢定發(fā)動機潤滑油老化程度提供了一種新的思路。