陳東杰,姜沛宏,郭風(fēng)軍,張玉華*,張長(zhǎng)峰
1.國(guó)家農(nóng)產(chǎn)品現(xiàn)代物流工程技術(shù)研究中心,山東 濟(jì)南 250103 2.山東省農(nóng)產(chǎn)品貯運(yùn)保鮮技術(shù)重點(diǎn)實(shí)驗(yàn)室,山東 濟(jì)南 250103
庫(kù)爾勒香梨(PyrussinkiangensisYü)為新疆特色優(yōu)質(zhì)果品,因肉質(zhì)清脆,香味獨(dú)特,口感合適深受?chē)?guó)內(nèi)外消費(fèi)者的喜愛(ài)。庫(kù)爾勒香梨外部形狀的多樣化,增加了庫(kù)爾勒香梨商業(yè)化分選的難度。傳統(tǒng)的人工分級(jí)方法遠(yuǎn)遠(yuǎn)不能滿足果農(nóng)的要求。其近紅外光譜已應(yīng)用在檢測(cè)蘋(píng)果、草莓、柑桔、梨、西瓜[1-4]等的品質(zhì),是一種很有效經(jīng)濟(jì)的分選方法。國(guó)內(nèi)外學(xué)者對(duì)近紅外紅光譜在線檢測(cè)做了很多研究:李龍等[5]利用近紅外光譜和機(jī)器視覺(jué)搭建了蘋(píng)果在線無(wú)損檢測(cè)分級(jí)系統(tǒng),蘋(píng)果內(nèi)部可溶性固形物含量所建立模型的校正集相關(guān)系數(shù)為0.950 8,校正集均方根誤差為0.347%,預(yù)測(cè)集相關(guān)系數(shù)為0.949,預(yù)測(cè)集均方根誤差為0.449%。單個(gè)蘋(píng)果的檢測(cè)時(shí)間為0.71 s。McGlone[6]等采用2種近紅外光譜系統(tǒng),采用漫透射,分別獲取運(yùn)動(dòng)速度0.5 m·s-1蘋(píng)果光譜,建立干物質(zhì)含量的預(yù)測(cè)模型。Sun[7]等采用近紅外光譜在線分析技術(shù),研究速度對(duì)翠冠梨可溶性固形物的影響,發(fā)現(xiàn)運(yùn)行速度為0.3 m·s-1的預(yù)測(cè)效果最好。
針對(duì)目前存在這些問(wèn)題,與北京偉創(chuàng)英圖科技有限公司聯(lián)合研制可見(jiàn)光-近紅外光譜可移動(dòng)式果品在線快速分選系統(tǒng),該系統(tǒng)自動(dòng)化程度高,可移動(dòng)且體積小,對(duì)庫(kù)爾勒香梨內(nèi)外品質(zhì)快速在線檢測(cè)分選集成化高,可滿足果農(nóng)日常分選的需要。基于該系統(tǒng)研究不同運(yùn)行速度對(duì)庫(kù)爾勒香梨SSC和硬度預(yù)測(cè)模型影響,并建立一種速度補(bǔ)償模型,以降低移動(dòng)速度對(duì)庫(kù)爾勒香梨SSC和硬度在線檢測(cè)的影響,建立混合速度的SSC和硬度預(yù)測(cè)模型。
庫(kù)爾勒香梨由濟(jì)南堤口集團(tuán)有限責(zé)任公司提供,共選取122個(gè)庫(kù)爾勒香梨,從冷庫(kù)取出后,置于室溫下24 h,待樣品與室溫一致,沿著果品赤道部位進(jìn)行標(biāo)記,手動(dòng)將庫(kù)爾勒香梨放置于果托上(圖3),對(duì)標(biāo)記區(qū)域進(jìn)行光譜采集,每個(gè)樣品采集3次,其平均光譜用于后續(xù)的數(shù)據(jù)處理分析。
如圖1所示,在線動(dòng)態(tài)檢測(cè)系統(tǒng)主要包括光譜采集單元、機(jī)器視覺(jué)系統(tǒng)、數(shù)據(jù)采集單元、品級(jí)分選單元及系統(tǒng)主控單元。本試驗(yàn)只采集庫(kù)爾勒香梨光譜,并不進(jìn)行圖像采集。近紅外光譜系統(tǒng)采用海洋光學(xué)(Ocean Optics Inc.,USA)USB2000+光纖光譜儀,波長(zhǎng)范圍600~1 000 nm,配有SMA905標(biāo)準(zhǔn)光纖接口,通過(guò)USB接口與計(jì)算機(jī)相連,光源為12 V/50 W鹵素?zé)簦灿?個(gè),分別位于近紅外檢查箱內(nèi)部的四個(gè)角;光譜儀光纖探頭固定于傳動(dòng)鏈條的下方,采取水平照射底部測(cè)量模式,光源水平照射果品;果品置于果托之上,果托中心呈2 cm空心圓洞(如圖3),近紅外測(cè)量探頭置于下方,有效避免果品非測(cè)量部位造成的漫反射光干擾(如圖2)。
圖1 庫(kù)爾勒香梨在線檢測(cè)系統(tǒng)示意圖Fig.1 Pear quality inspection and classification online system diagram
1.3.1 硬度測(cè)定
采用TA5探頭在質(zhì)構(gòu)儀TMS-PRO(美國(guó),F(xiàn)TC)上進(jìn)TPA測(cè)試。沿著標(biāo)記區(qū)域進(jìn)行測(cè)試,設(shè)置測(cè)前速率1 mm·s-1;測(cè)中及測(cè)后速率1 mm·s-1;壓縮程度25%,起始力1 N。
圖2 近紅外光譜檢測(cè)模塊結(jié)構(gòu)圖1:光源;2:傳感器;3:光纖傳感器;4:光譜儀Fig.2 NIR inspection module structure diagram1:Light;2:Sensor;3:Optical fiber Sensor;4:Spectrometer
圖3 光源套件實(shí)物及效果圖Fig.3 Diagram and rendering of light source modules
1.3.2 可溶性固形物(soluble solids content,SSC)測(cè)定
按照NY/T585—2002庫(kù)爾勒香梨進(jìn)行測(cè)定。采集完光譜后,將庫(kù)爾勒香梨放入研缽中研磨成勻漿,用紗布濾后得到濾液后滴在Atago(日本,Atago)數(shù)顯糖度計(jì)上,記錄讀數(shù),測(cè)定3次,取平均值為庫(kù)爾勒香梨的SSC值。
1.3.3 質(zhì)量測(cè)定
將采集光譜的庫(kù)爾勒香梨,放置于梅特勒電子天平ME204/02(美國(guó),METTLER TOLEDO)進(jìn)行稱(chēng)量,測(cè)定三次,取平均值。
采集的近紅外原始光譜除含有樣品信息外,還包含隨機(jī)噪聲、基線漂移及測(cè)定環(huán)境背景等干擾因素,為提高模型的穩(wěn)健性和適用能力,獲得高信噪比,降低背景干擾,降低模型復(fù)雜度,需對(duì)原始光譜進(jìn)行預(yù)處理。采用SG-平滑(Savitzky-Golay smooth)(窗口寬度為5點(diǎn)、擬合3次)、SG卷積導(dǎo)數(shù)(窗口寬度為5點(diǎn)、擬合3次)、多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)能量變換(SNV)、歸一化(normalization)等多種光譜預(yù)處理方法對(duì)600~1 000 nm波長(zhǎng)范圍的光譜進(jìn)行預(yù)處理,消除或減弱噪聲,以提高預(yù)測(cè)庫(kù)爾勒香梨品質(zhì)的精度和使用能力。后采用偏最小二乘回歸法(partial least squares regression,PLSR)建立庫(kù)爾勒香梨品質(zhì)的PLS預(yù)測(cè)模型。所建立預(yù)測(cè)模型采用校正集相關(guān)系數(shù)(correlation coefficient of calibration,rc)、驗(yàn)證集相關(guān)系數(shù)(correlation coefficient of validation,rp)、校正集均方根誤差(root mean square error of calibration,RMSEC)和驗(yàn)證集均方根誤差(root mean square error of validation,RMSEP)進(jìn)行評(píng)定,相關(guān)系數(shù)越高,均方根誤差越低,建立的預(yù)測(cè)模型越好。
圖譜處理采用北京偉創(chuàng)英圖科技有限公司ChemoStudio2018 化學(xué)計(jì)量學(xué)軟件和matlab8.0對(duì)光譜圖進(jìn)行預(yù)處理、完成模型導(dǎo)入自行搭架建的近紅外光譜系統(tǒng)中,采集光譜前調(diào)用已建立好的預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)庫(kù)爾勒香梨無(wú)損快速分級(jí)。
在采集庫(kù)爾勒香梨光譜前,確定果品品質(zhì)在線無(wú)損檢測(cè)系統(tǒng)最佳采集參數(shù)。將庫(kù)爾勒香梨置于果托上,設(shè)置樣品積分時(shí)間40 ms,在最高速度下(0.5 m·s-1),分別設(shè)置參比積分時(shí)間為20,10和5 ms,采集3次庫(kù)爾勒香梨的近紅外光譜,采集的光譜如圖4所示。設(shè)置參比積分時(shí)間不同,其光譜的吸光度也不同,產(chǎn)生能量也不同。由圖5可知,當(dāng)參比積分時(shí)間設(shè)置為20和10 ms時(shí),在波長(zhǎng)680~840 nm范圍,參比能量已飽和,而參比積分為5 ms,參比能量值低于飽和值,故此選設(shè)置參比積分時(shí)間為5 ms。
圖5 不同參比積分時(shí)間下參比能量圖Fig.5 The reference energy under different reference integral time
利用自行搭建的在線動(dòng)態(tài)檢測(cè)系統(tǒng)采集庫(kù)爾香梨光譜,共采集122張光譜圖,采用Kennard-Stone分類(lèi)方法對(duì)采集的光譜進(jìn)行按照3∶1進(jìn)行分類(lèi),校正光譜為85張,驗(yàn)證光譜為37張;庫(kù)爾勒香梨的SSC和硬度校正集和驗(yàn)證集的統(tǒng)計(jì)分布如表1所示。校準(zhǔn)集和預(yù)測(cè)集的SSC在11.2~15.0°Bri和12.0~15.0°Bri,硬度的校正集和預(yù)測(cè)集為4.27~7.65和4.05~7.50 N之間,為了消除蘋(píng)果的大小及重量影響,校準(zhǔn)集的重量范圍為113.26~138.55 g與預(yù)測(cè)集的108.56~140.80 g。
表1 庫(kù)爾勒香梨物理參數(shù)的校正與預(yù)測(cè)集統(tǒng)計(jì)Table 1 Statistics of physical parameters of pear samples in calibration and prediction sets
采集庫(kù)爾勒香梨的波長(zhǎng)范圍為600~1 000 nm,所有的光譜為漫透射光譜。圖6是分別在S1(0.3 m·s-1)和S2(0.5 m·s-1)采集的平均光譜圖,在移動(dòng)速度為S1和S2下,光譜在680 nm處有最大吸收峰,在725 nm處有波谷,說(shuō)明不同運(yùn)行速度并未改變其光譜的吸收峰和波谷的位置。但低速S1運(yùn)行速度下采集光譜的吸光度高于S2,說(shuō)明不同移動(dòng)速度下,采集樣品相同部位的信息,所采集光譜存在差異。由于不同速度下的光譜存在的差異性,采取預(yù)處理方法去除或者減小這些差異是十分必要的。
圖6 S1和S2速度下樣品的平均光譜Fig.6 Average spectra of samples under S1,S2
由表2可知,不同移動(dòng)速度下,采用不同預(yù)處理方法,用PLS建立的模型預(yù)測(cè)性能也不一樣。與其他預(yù)處理方法相比,移動(dòng)速度為0.3 m·s-1下,采用SG-DER預(yù)處理效果建立模型效果最好,其校正集和驗(yàn)證集相關(guān)系數(shù)分別為0.895 1和0.875 6,均方根誤差分別為0.393 2°Bri和0.413 1°Bri。移動(dòng)速度為0.5 m·s-1下,同樣采用SG-DER預(yù)處理建立模型效果最好。其校正集和驗(yàn)證集相關(guān)系數(shù)分別為0.901 4和0.880 2均方根誤差分別為0.380 2°Bri和0.391 5°Bri。從建模效果來(lái)看,速度0.5 m·s-1下建立模型略?xún)?yōu)于0.3 m·s-1下建立的SSC預(yù)測(cè)模型;預(yù)處理方法采用SG-DER,在兩種速度下建立SCC模型都最好,故此后續(xù)采用其他算法建立預(yù)測(cè)模型,其預(yù)處理方法采用SG-DER。
表2 采用不同預(yù)處理方法建立PLS模型預(yù)測(cè)庫(kù)爾勒香梨的SSCTable 2 Prediction results of SSC of pear samples by PLS model using different preprocessing methods
圖7 CARS-PLS庫(kù)爾勒香梨SSC的預(yù)測(cè)值和實(shí)際值散點(diǎn)圖Fig.7 Plots of actual versus predicted values of pear SSC obtained with CARS-PLS
由表3可知,在移動(dòng)速度為0.3和0.5 m·s-1下,采用SGS處理建立模型效果最好。移動(dòng)速度為0.3 m·s-1下,其校正集和驗(yàn)證集相關(guān)系數(shù)分別為0.820 2和0.801 0,均方根誤差分別為0.450 8和0.470 8 N。移動(dòng)速度為0.5 m·s-1的校正集和驗(yàn)證集相關(guān)系數(shù)分別為0.792 3和0.780 1,均方根誤差分別為0.486 2和0.505 6 N。速度0.3 m·s-1的模型略?xún)?yōu)于0.5 m·s-1的硬度預(yù)測(cè)模型,而在兩種速度下采用預(yù)處理SGS,建立模型都最好,故此后續(xù)庫(kù)爾勒香梨硬度預(yù)測(cè)模型采用SGS預(yù)處理方法。
圖8 SPA-PLS庫(kù)爾勒香梨硬度的預(yù)測(cè)值和實(shí)際值散點(diǎn)圖Fig.8 Plots of actual versus predicted values of pear firmness obtained with SPA-PLS
表3 采用不同預(yù)處理方法建立PLS模型預(yù)測(cè)庫(kù)爾勒香梨的硬度Table 3 Prediction firmness values of samples by PLS model using different preprocessing methods
由表2可知,在同一波段范圍,采用相同預(yù)處理方法,用PLS建立的SCC預(yù)測(cè)模型,移動(dòng)速度為0.5 m·s-1建立模型更為穩(wěn)定。由表3可知,采用相同預(yù)處理方法用PLS建立的硬度預(yù)測(cè)模型,移動(dòng)速度為0.3 m·s-1下建立模型更好。說(shuō)明移動(dòng)速度對(duì)建立庫(kù)爾勒香梨預(yù)測(cè)模型產(chǎn)生影響。為了減少不同移動(dòng)速度對(duì)庫(kù)爾勒香梨的SSC和硬度預(yù)測(cè)模型的影響,建立混合速度(S3)預(yù)測(cè)模型。隨機(jī)挑選S1和S2采集的光譜圖,用于預(yù)測(cè)集各43條,用于校正集各18條。分別采用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling,CARS)[8-9]、連續(xù)投影算法(successive projections algorithm,SPA)[10-11]篩選特征波長(zhǎng),再進(jìn)行PLS建模,比較PLS,CARS-PLS和SPA-PLS 3種建模方法對(duì)庫(kù)爾勒香梨的SSC和硬度預(yù)測(cè)效果影響。
由表4可知,混合速度模型下,采用CARS和SPA算法建立的SSC和硬度預(yù)測(cè)模型與原始相比,都可以降低參與建模的主因子數(shù)(如圖10),而且采用CARS和SPA算法使得建模的波長(zhǎng)數(shù)量大大降低,說(shuō)明這兩種方法都可剔除噪聲過(guò)大和去除不相關(guān)變量的變量,這與郭志明和劉燕德的研究類(lèi)似[12-13]。不同品質(zhì)指標(biāo),采用相同的算法,所選的特征變量不相同。對(duì)于SSC預(yù)測(cè)模型,采用CARS對(duì)庫(kù)爾勒香梨近紅外光譜數(shù)據(jù)進(jìn)行特征變量選取,其中從全波長(zhǎng)401個(gè)光譜中篩選出24個(gè)變量,建立了SSC CARS-PLS模型,從全波長(zhǎng)401個(gè)光譜中篩選出38個(gè)變量,建立了硬度CARS-PLS模型。其rp和RMSEP分別為0.915 0,0.371 9和0.801 3,0.502 3。采用SPA對(duì)庫(kù)爾勒香梨近紅外光譜數(shù)據(jù)進(jìn)行特征變量選取,從全波長(zhǎng)401個(gè)光譜中篩選出26個(gè)變量,建立了SSC SPA-PLS模型,從全波長(zhǎng)401個(gè)光譜中篩選出32個(gè)特整變量,其rp和RMSEP和0.900 2,0.381 5和0.821 0,0.492 0。
表4 可溶性固形物建模效果比較Table 4 Comparison of different soluble solids content models
采用CARS和SPA建立的SSC和硬度模型優(yōu)于用全波長(zhǎng)建立的預(yù)測(cè)模型,其中SSC模型中以CARS-PLS模型更優(yōu),其rp和RMSEP為0.915 0和0.371 9,硬度模型以SPA-PLS模型更優(yōu),其rp和RMSEP為0.821 0和0.492 0。由圖10可知,SSC模型采用CARS選取24個(gè)特征變量為606,669,690,697,706,711,719,726,735,745,749,773,784,792,854,867,879,886,893,906,920,931,941和951 nm。由圖11可知,硬度模型采用SPA選取32特征變量611,620,633,641,654,672,680,689,704,719,730,741,750,755,763,775,780,788,802,811,820,834,840,903,910,917,923,927,932,937,942和946 nm。
圖9 CARS選擇的特征光譜變量Fig.9 Distribution of selected from the global model by CARS for prediction of SSC using the full spectra
圖10 SPA選擇的特征光譜變量Fig.10 Spectral variables of selected by SPA for prediction of firmness using the full spectra
圖11 SSC模型主因子數(shù)Fig.11 Principal componet factor of SSC model
圖12 硬度模型主因子數(shù)Fig.12 Principal componet factor of firmness model
設(shè)計(jì)了可用于檢測(cè)庫(kù)爾勒香梨內(nèi)部品質(zhì)的在線無(wú)損檢測(cè)系統(tǒng),該系統(tǒng)主要由光譜采集單元、數(shù)據(jù)采集單元、品級(jí)分選單元及系統(tǒng)主控單元組成?;谠撓到y(tǒng),利用可見(jiàn)光近紅外漫透射技術(shù)研究不同移動(dòng)速度對(duì)在線檢測(cè)庫(kù)爾勒香梨品質(zhì)影響。采用不同預(yù)處理方法對(duì)兩種不同速度下采集光譜進(jìn)行處理,采用PLS建立庫(kù)爾勒香梨SSC和硬度模型,結(jié)果表明:用SG-DER方法、SGS預(yù)處理建立SSC預(yù)測(cè)模型、硬度模型更為穩(wěn)健。在兩種不同移動(dòng)速度下,移動(dòng)速度為0.5 m·s-1建立SSC預(yù)測(cè)模型優(yōu)于0.3 m·s-1,而在0.3 m·s-1建立的硬度模型優(yōu)于0.5 m·s-1。說(shuō)明不同移動(dòng)速度對(duì)庫(kù)爾勒香梨品質(zhì)預(yù)測(cè)產(chǎn)生影響。建立混合速度(S3)模型,采用CARS方法,從501個(gè)光譜中篩選出24個(gè)變量,建立了SCAR-PLS模型,其中建立的SSC模型較好,其rp和RMSEP分別為0.915 0和0.371 9。采用SPA方法,從501個(gè)光譜中篩選出26個(gè)變量,建立硬度模型較好,其rp和RMSEP分別為0.821 0和0.492 0。
本文研究了在線移動(dòng)速度對(duì)庫(kù)爾勒香梨品質(zhì)檢測(cè)的影響,為研制升級(jí)在線分選系統(tǒng)提供基礎(chǔ),未來(lái)的研究將采用品種果品,研究多種不同移動(dòng)速度對(duì)建立果品品質(zhì)預(yù)測(cè)模型的影響。進(jìn)一步分析,以實(shí)現(xiàn)更準(zhǔn)確的和穩(wěn)健模型。