崔 程,劉翠玲,孫曉榮,吳靜珠
(北京工商大學(xué)食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100048)
花生是我國總產(chǎn)量及平均畝產(chǎn)最高、出口量最大的油料作物[1]。但是花生在收獲、運(yùn)輸、儲(chǔ)藏和加工過程中極易受環(huán)境溫濕度變化出現(xiàn)凍傷現(xiàn)象,導(dǎo)致花生出油率和花生油品質(zhì)明顯下降。我國現(xiàn)行標(biāo)準(zhǔn)如花生GB 1532-2008、食用花生NY/T 1067-2006、油用花生NY/T 1068-2006 等尚未規(guī)定花生凍傷判別的檢測標(biāo)準(zhǔn)和方法。當(dāng)前花生凍傷檢測階段還停留在人工判別階段,通過對(duì)帶有外皮的花生粒的外形、顏色、軟硬程度觀察實(shí)現(xiàn)人工判別,不僅效率低下、容易出現(xiàn)判別錯(cuò)誤,而且受到檢測者主觀影響非常嚴(yán)重。因此,我國亟待大力發(fā)展便捷、綠色的花生品質(zhì)檢測技術(shù)以提高我國花生加工行業(yè)整體水平,滿足我國在全球花生及花生制品進(jìn)出口貿(mào)易中的發(fā)展需求[2-3]。
近紅外高光譜成像技術(shù)集合了光譜技術(shù)和數(shù)字圖像處理技術(shù)的優(yōu)勢,能夠同時(shí)獲得被測物的一維光譜信息和二維空間信息,相較于多光譜成像技術(shù),高光譜成像技術(shù)能近乎連續(xù)地獲取光譜信息,可以準(zhǔn)確獲取被測物質(zhì)特征,增強(qiáng)檢測和識(shí)別性能,并且在高光譜圖像中可以估計(jì)出被測物質(zhì)的狀態(tài)參量,提升了成像分析質(zhì)量。近年來在農(nóng)產(chǎn)品品質(zhì)[4-6]、食品安全[7-9]和食品品質(zhì)[10-12]的快速無損檢測技術(shù)領(lǐng)域日趨成為研究熱點(diǎn)。但是近紅外光譜本身吸收強(qiáng)度和靈敏度低、譜帶寬且重疊嚴(yán)重,且采用全光譜方式建模還存在信息冗余度高、共線性強(qiáng)等問題導(dǎo)致模型預(yù)測性能較差。特征波長篩選可以有效簡化模型,提升模型的運(yùn)算效率并提高模型的可解釋性,并消除可能影響模型預(yù)測性和穩(wěn)定性的無關(guān)變量[13-14],因此特征波長篩選已然成為化學(xué)計(jì)量學(xué)和光譜分析、檢測領(lǐng)域的研究熱點(diǎn)[15]。王粒[16]采用GBDT、Light GBM、Cat Boost 和XGBoost 算法提取花生高光譜數(shù)據(jù)中的重要特征波段,對(duì)花生霉變情況進(jìn)行檢測,結(jié)果表明Light GBM 是最優(yōu)算法,其檢測準(zhǔn)確率為99.10%,并使用Optuna 算法對(duì)其參數(shù)進(jìn)行調(diào)優(yōu),減少了模型運(yùn)行時(shí)間;劉良源[17]在基于近紅外光譜的花生脂肪酸檢測方法研究中利用SiPLS 和BOSS 算法聯(lián)合提取花生的近紅外光譜特征波長建立了SVM模型,有效減少了信息冗余,將脂肪酸模型的R2從0.8805 提升到0.9446;孫建非[18]基于高光譜圖像技術(shù)對(duì)花生霉變和水分含量進(jìn)行研究,采用SPA 算法對(duì)花生高光譜數(shù)據(jù)進(jìn)行特征提取,結(jié)果表明SPA 算法分別有效提取了與花生霉變和水分含量相關(guān)性最高的特征波長組,采用LDA 模型的花生霉變識(shí)別準(zhǔn)確率高達(dá)100%,采用MLR 的花生水分含量模型預(yù)測集R2為0.9315,RMSEP 為0.4895%。但是目前鮮有國內(nèi)學(xué)者對(duì)花生凍傷的檢測進(jìn)行了研究?;ㄉ霈F(xiàn)凍傷現(xiàn)象會(huì)導(dǎo)致花生品質(zhì)嚴(yán)重惡化,蛋白質(zhì)、亞油酸和蔗糖含量增加,油脂和油酸含量降低,油亞比(油酸/亞油酸)明顯下降,嚴(yán)重影響經(jīng)濟(jì)效益,目前急需提升凍傷花生的檢測效率。
針對(duì)當(dāng)前花生凍傷缺乏快速無損檢測技術(shù)的現(xiàn)狀,本文重點(diǎn)探索基于近紅外高光譜成像技術(shù)的花生凍傷快速判別方法的可行性,并研究采用競爭自適應(yīng)重加權(quán)法[19-20](competitive adapative reweighted sampling,CARS)、隨 機(jī) 蛙 跳[21-22](random frog,RF)、變量重要性投影[23](variable importance in projection,VIP)、連續(xù)投影算法[24](successive projections algorithm,SPA)、蒙特卡洛無信息變量消除[25](Monte Carlo uninformative variable elimination,MC-UVE)、迭代保留信息變量[26](Iteration retention information variable,IRIV)、變量組合種群分析-迭代保留信息變量[27](Variable combination population analysis-Iteration retention information variable,VCPA-IRIV)和變量組合種群分析-遺傳算法[27]
(Variable combination population analysis-Genetic Algorithm,VCPA-GA)8 種變量選擇方法初步篩選出與花生凍傷相關(guān)的特征波長,其中CARS、IRIV、VCPA-IRIV、VCPA-GA 屬于“組合尋優(yōu)”類變量選擇算法,RF、VIP、SPA 和MC-UVE 屬于“變量重要性”類變量選擇算法,為進(jìn)一步探索花生凍傷機(jī)理,將“組合尋優(yōu)”類方法篩選的特征波長采用VIP 分析獲得每個(gè)特征波長對(duì)凍傷檢測的貢獻(xiàn)度并排序,同“變量重要性”類變量選擇算法篩選出的花生凍傷特征波長數(shù)據(jù)集通過建立支持向量機(jī)(Support vector machine,SVM)模型選用能達(dá)到判別準(zhǔn)確率閾值為90%的最少波長變量組合作為花生凍傷特征波長變量,進(jìn)一步對(duì)花生凍傷特征波長進(jìn)行篩選,實(shí)現(xiàn)精選優(yōu)選,并通過精選的特征波長進(jìn)行花生凍傷機(jī)理分析,研究結(jié)果為花生凍傷檢測技術(shù)提供理論參考。
花生樣本 共1623 粒,來自某加工企業(yè)現(xiàn)場收集,包括787 粒正常樣本和836 粒凍傷樣本(由人工判斷篩選)。單粒凍傷和正常花生如圖1 所示,凍傷花生與正?;ㄉ庥^上有明顯差異,相較于正常花生,凍傷花生整體干癟,顏色較深,且表皮部分呈現(xiàn)透明狀。
圖1 單?;ㄉ鷺悠稦ig.1 Single peanut sample
FX17 高光譜相機(jī)(高光譜采集系統(tǒng)結(jié)構(gòu)示意圖2 所示)芬蘭SPECIM 公司。
圖2 高光譜成像系統(tǒng)結(jié)構(gòu)示意圖Fig.2 Structure diagram of hyperspectral imaging system
隨機(jī)選取數(shù)據(jù)集中80%樣品作為訓(xùn)練集,剩余20%樣品為測試集。其中訓(xùn)練集630 粒為正?;ㄉ?69 粒為凍傷花生;測試集157 粒為正?;ㄉ?67 粒為凍傷花生。
設(shè)備參數(shù)設(shè)置:波長范圍:935~1720 nm,F(xiàn)WHM 譜寬:3.5 nm,波長變量:224 個(gè),幀率:50 Hz,曝光時(shí)間:2.0 μs,空間采樣分辨率:640 px/line。在上述設(shè)備參數(shù)設(shè)置下采集花生高光譜圖像,采樣時(shí)將花生樣本隨機(jī)散放在置物臺(tái)上以模擬流水線傳送帶,采取正常組和凍傷組每組交替采樣以降低因高光譜相機(jī)隨采集時(shí)間的增加而產(chǎn)生的影響。
在高光譜采集過程中,除目標(biāo)樣品外,背景信息同樣被采集,為后續(xù)花生籽粒數(shù)據(jù)進(jìn)一步處理分析,首先需要將花生籽粒與背景分離。本研究采用主成分分析法(PCA)進(jìn)行背景剔除,以實(shí)現(xiàn)花生高光譜圖像中樣品與背景分割的目的。
由于外界環(huán)境和儀器等影響因素,近紅外光譜信號(hào)容易受到噪聲的干擾,為了排除干擾,實(shí)驗(yàn)采用包括標(biāo)準(zhǔn)歸一化變量SNV、多元散射校正MSC、Savitzky-Golag(SG)卷積平滑以及SG 平滑-SNV和SG 平滑-MSC 組合預(yù)處理在內(nèi)的五種預(yù)處理方法消除由環(huán)境或傳感器的不確定干擾等引起的噪聲,增強(qiáng)數(shù)據(jù)穩(wěn)定性,提高頻譜信噪比,并通過建立支持向量機(jī)模型驗(yàn)證預(yù)處理效果。
建立花生種子凍傷判別模型時(shí),若使用花生種子的全譜近紅外光譜數(shù)據(jù)作為輸入變量,由于花生復(fù)雜的特性以及過多的全譜變量數(shù),使得模型復(fù)雜程度高,導(dǎo)致模型性能下降,限制了實(shí)際生產(chǎn)的使用;而特征波長篩選方法可以實(shí)現(xiàn)模型的簡化,提高預(yù)測結(jié)果的穩(wěn)定性,消除共線性的原始數(shù)據(jù)。此外,由于國內(nèi)外在花生凍傷領(lǐng)域研究較少,花生出現(xiàn)凍傷的內(nèi)在特點(diǎn)也不夠明確,因此,采用八種光譜波長點(diǎn)篩選(Wavelength point selection,WPS)算 法:CARS、RF、VIP、SPA、MC-UVE、IRIV、VCPA-IRIV 和VCPAGA 結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)花生凍傷特征波長進(jìn)行篩選,并對(duì)篩選出的特征波長進(jìn)行分析。
文中選擇的八種變量選擇算法可分為兩類—“組合尋優(yōu)”類和“變量重要性”類,其中“組合尋優(yōu)”類包括CARS、IRIV、VCPA-IRIV、VCPA-GA,“變量重要性”類包括RF、VIP、SPA、MC-UVE?!敖M合尋優(yōu)”類變量選擇算法研究有限范圍內(nèi)多變量非線性函數(shù)全局最優(yōu)解的性質(zhì),以及尋找全局最優(yōu)解計(jì)算方法的構(gòu)造,組合尋優(yōu)可以在合理的時(shí)間內(nèi)逼近問題的最優(yōu)解;“變量重要性”類變量選擇算法通過某種規(guī)則建立數(shù)據(jù)集中每個(gè)變量的重要性并按變量重要性進(jìn)行排序,RF、VIP、SPA 和MC-UVE 分別將每個(gè)變量的穩(wěn)定性、VIP 值、COSS 值和RI 值進(jìn)行排序;分別采用上述兩類變量選擇算法對(duì)花生光譜數(shù)據(jù)進(jìn)行特征波長篩選,建立支持向量機(jī)模型驗(yàn)證所選特征波長,為進(jìn)一步篩選與花生凍傷相關(guān)性更高的特征波長,將“組合尋優(yōu)”類方法結(jié)合VIP 算法,將篩選的特征波長按變量重要性進(jìn)行排序,選取變量重要性排名靠前的變量組合,“變量重要性”類方法同理將特征波長按變量重要性排列選取,建立支持向量機(jī)模型選用達(dá)到判別準(zhǔn)確率閾值為90%的特征波長作為與花生凍傷相關(guān)性最高的特征波長并進(jìn)行針對(duì)這些特征波長進(jìn)行分析。
為了評(píng)估模型的性能,訓(xùn)練集和測試集的預(yù)測準(zhǔn)確率作為模型性能評(píng)估的關(guān)鍵表征。訓(xùn)練集和測試集的預(yù)測準(zhǔn)確率為正確分類的樣本數(shù)與樣本集總數(shù)的比值,本文以測試集預(yù)測準(zhǔn)確率作為模型性能評(píng)價(jià)指標(biāo),預(yù)測準(zhǔn)確率越高,說明被正確識(shí)別的樣本數(shù)量越多,模型的性能越優(yōu)秀。
實(shí)驗(yàn)采用MATLAB R2020a、Evince 2.7.15、The Unscrambler X 10.4 和Origin 2022 進(jìn)行數(shù)據(jù)處理,其中高光譜圖像的背景剔除和原始光譜數(shù)據(jù)提取在Evince 2.7.15 中進(jìn)行,原始光譜的預(yù)處理在The Unscrambler X 10.4 軟件中進(jìn)行,訓(xùn)練集和測試集的劃分、特征波長篩選、建立支持向量機(jī)判別模型在MATLAB R2020a 軟件中進(jìn)行,圖表的繪制在Origin 2022 軟件中進(jìn)行。
本研究采用Evince2.7.15 軟件對(duì)高光譜圖像進(jìn)行PCA 分析,圖3 所示為原始高光譜圖像的PCA分布圖,采用PCA 分析法可以有效去除背景,實(shí)現(xiàn)高光譜背景分割。
圖3 原始高光譜圖像PCA 分布圖Fig.3 PCA distribution of original hyperspectral image
為方便觀察,花生高光譜圖像采用偽彩色可視化渲染,對(duì)比單粒凍傷與正?;ㄉコ尘昂蟮母吖庾V圖像,如圖4 所示。通過觀察對(duì)比,單粒正?;ㄉ吖庾V呈現(xiàn)淺色;凍傷花生整體顏色較深,且花生凍傷情況越嚴(yán)重深色面積越大。通過單粒高光譜圖像對(duì)比可以清晰觀察到正常與凍傷花生的區(qū)別,初步證明采用高光譜成像技術(shù)和近紅外光譜技術(shù)對(duì)花生凍傷進(jìn)行檢測是可行的。
圖4 單?;ㄉ吖庾V圖像Fig.4 Hyperspectral image of single peanut
提取背景剔除后每粒花生的所有像素點(diǎn),單?;ㄉ墓庾V數(shù)據(jù)采用該花生所有像素點(diǎn)光譜的平均值表示,從而獲取1623 粒花生的原始光譜數(shù)據(jù)集,如圖5 所示。
采用SVM 作為建模方法對(duì)數(shù)據(jù)處理進(jìn)行驗(yàn)證,由于其可解決高維問題,且較強(qiáng)的泛化能力[28],非常適合建立花生是否凍傷的模型。表1 展示了原始數(shù)據(jù)、各種光譜預(yù)處理算法(SNV、MSC、SGSM、SGSM-SNV、SGSM-MSC)的花生凍傷SVM 預(yù)測結(jié)果。本文通過測試集準(zhǔn)確率來評(píng)估預(yù)處理后數(shù)據(jù)在建模性能上是否優(yōu)于原始數(shù)據(jù)。建模選用RBF 核函數(shù),采用網(wǎng)格尋優(yōu)法和五折交叉驗(yàn)證在給定范圍內(nèi)對(duì)SVM 的c(懲罰系數(shù))和核函數(shù)參數(shù)g(gamma)進(jìn)行尋優(yōu),采用最優(yōu)的c 和g 對(duì)數(shù)據(jù)集建立SVM 模型進(jìn)訓(xùn)練和預(yù)測。在表1 中,基于不同數(shù)據(jù)(例如原始數(shù)據(jù)、SNV、MSC、SGSM、SGSM-SNV、SGSMMSC)的模型在測試集中的準(zhǔn)確率分別為:93.21%、93.83%、94.13%、93.52%、91.36%和93.83%。MSC預(yù)處理后的模型具有最高的測試集準(zhǔn)確率,因此采用MSC 預(yù)處理后的光譜作為變量選擇算法的輸入。
表1 不同光譜預(yù)處理方法的SVM 模型預(yù)測結(jié)果Table 1 SVM model prediction results of different spectral pretreatment methods
2.3.1 變量選擇 對(duì)經(jīng)過MSC 預(yù)處理后的花生光譜數(shù)據(jù)采用八種不同變量選擇方法進(jìn)行特征波長篩選,圖6 和表2 分別展示了經(jīng)過MSC 預(yù)處理后的花生光譜數(shù)據(jù)經(jīng)過八種不同變量選擇算法后篩選出的特征波長變量和采用它們作為輸入分別建立SVM的建模結(jié)果。將224 個(gè)波長變量按照1~224 號(hào)進(jìn)行標(biāo)號(hào),由于RF、VIP、SPA 和MC-UVE 方法篩選的特征波長變量按變量重要性進(jìn)行排序,為保證篩選的特征波長變量組在包含充足信息且盡可能少包含無關(guān)變量和干擾變量,故本實(shí)驗(yàn)中“變量重要性”類方法篩選的特征波長只取重要性前50 的波長變量。
表2 不同光譜預(yù)處理方法的SVM 模型預(yù)測結(jié)果Table 2 Prediction results of SVM model with different spectral preprocessing methods
圖6 MSC 預(yù)處理后不同變量選擇算法篩選出的變量組合Fig.6 Combination of variables filtered by different variable selection algorithms after MSC preprocessing
由表2 可以得出結(jié)論:8 種變量選擇算法經(jīng)SVM 建模達(dá)到可觀的識(shí)別準(zhǔn)確率,且對(duì)比全譜數(shù)據(jù)建模時(shí)間大幅縮短,說明8 種變量選擇方法均能有效對(duì)凍傷花生進(jìn)行特征提取,并且降低了模型復(fù)雜程度。雖然花生數(shù)據(jù)集通過8 種變量選擇方法剔除部分無用或干擾變量,減少了冗余信息,但選出的特征波長仍較多,且分布在全譜范圍,不利于花生凍傷的機(jī)理分析。
將“組合尋優(yōu)”類變量選擇算法選擇的特征波長變量進(jìn)行VIP 分析,將特征波長變量按變量重要性進(jìn)行排序,隨后同“變量重要性”類建立SVM 模型驗(yàn)證,選擇達(dá)到判別準(zhǔn)確率閾值為90%的最少特征波長變量作為與花生凍傷相關(guān)性最高的特征波長。表3 展示了變量選擇建立SVM 模型驗(yàn)證的結(jié)果。圖7 展示了經(jīng)MSC 預(yù)處理后的所有花生樣本光譜數(shù)據(jù)以及八種不同變量選擇再篩選后的特征波長的位置。由表和圖可以看出VCPA-GA 能達(dá)到較高的準(zhǔn)確率的情況下篩選出最少的特征波長,通過VCPA-GA 方法篩選的7 個(gè)特征波長分別為:959.81、1329.70、1371.97、1375.50、1403.73、1531.21 和1573.87 nm,另外七種變量選擇算法篩選出的特征波長除了IRIV,與通過VCPA-GA 選擇出的特征波長多數(shù)基本重疊,可以得出對(duì)于花生凍傷實(shí)驗(yàn),VCPAGA 是針對(duì)花生凍傷特征分析性能相對(duì)優(yōu)秀的變量選擇算法,這主要是因?yàn)閂CPA 算法采用EDF 對(duì)變量進(jìn)行連續(xù)收縮,在EDF 運(yùn)行時(shí)會(huì)消除對(duì)結(jié)果貢獻(xiàn)較小的波長變量,同時(shí),BMS 和MPA 分別提供相同的采樣能力,用于使用不同的變量組合構(gòu)建子模型,并提取子模型中包含的最佳變量組合,通過每個(gè)子模型的判別準(zhǔn)確率來保留子系統(tǒng)中一定比例的具有最高頻率的變量。同時(shí)結(jié)合遺傳算法(GA)進(jìn)一步優(yōu)化,充分結(jié)合遺傳算法擴(kuò)展性好、可搜索潛在并行性和魯棒性強(qiáng)等優(yōu)點(diǎn),因此VCPA-GA 的綜合變量篩選策略在花生凍傷上優(yōu)于其他方法。
表3 花生凍傷特征波長精選驗(yàn)證結(jié)果Table 3 Validation results of peanut frostbite characteristic wavelength selection
圖7 各類變量選擇算法在花生數(shù)據(jù)集中選擇的特征波長Fig.7 Characteristic wavelength selected by various variable selection algorithms in peanut dataset
2.3.2 花生凍傷機(jī)理分析 近紅外光譜主要是由分子振動(dòng)的非諧振性使分子震動(dòng)從基態(tài)向高能級(jí)躍遷時(shí)產(chǎn)生的[29-30]。在近紅外光譜中分子中包含了單個(gè)化學(xué)鍵的基頻振動(dòng)的倍頻和合頻信息,它常常受含氫基團(tuán)X-H(X=C、N、O)的倍頻和合頻重疊主導(dǎo),近紅外光譜能準(zhǔn)確地表現(xiàn)出物質(zhì)的結(jié)構(gòu)信息[31],非常適合結(jié)合特征波長對(duì)目標(biāo)物質(zhì)進(jìn)行物化分析。
花生的主要營養(yǎng)物質(zhì)為脂肪、蛋白質(zhì)、糖類和其他微量元素,此外,花生中還含有7~8 種人體所需的氨基酸及不飽和脂肪酸。花生出現(xiàn)凍傷現(xiàn)象會(huì)導(dǎo)致花生蛋白質(zhì)、亞油酸和蔗糖含量增加,油脂和油酸含量降低,油亞比(油酸/亞油酸)明顯下降[32]?;ㄉ械牟伙柡椭舅嶂饕獮橛退幔退釋儆隰人犷愇镔|(zhì),其官能團(tuán)為羧基,由一個(gè)碳原子、兩個(gè)氧原子和一個(gè)氫原子組合而成,包含一個(gè)碳氧雙鍵(C=O)、碳氧-氧鍵(O=C-O)以及氫氧鍵(O-H),其化學(xué)式為RCOOH,羧基的空間結(jié)構(gòu)式如圖8 所示[33-34]。
圖8 羧基的空間結(jié)構(gòu)式Fig.8 Spatial structural formula of carboxyl group
此外,花生主要營養(yǎng)物質(zhì)中含量占比僅次于脂肪的成分為蛋白質(zhì),其主官能團(tuán)為酰胺鍵,包含一個(gè)碳氧雙鍵(C=O)、氮?dú)滏I(N-H),其化學(xué)式為R-CONH-R,酰胺鍵的空間結(jié)構(gòu)式如圖9 所示[34]。
圖9 酰胺鍵的空間結(jié)構(gòu)式Fig.9 Spatial structure formula of amide bond
由花生凍傷特征波長篩選實(shí)驗(yàn),對(duì)花生凍傷檢測貢獻(xiàn)最大的波長在959.81、1329.70、1371.97、1375.50、1403.73、1531.21 和1573.87 nm 處。在1350 nm 附近,主要為O-H 鍵伸縮振動(dòng)和OCO 彎曲振動(dòng)一級(jí)倍頻的組合頻吸收,已測定蛋白質(zhì)的特征譜帶為1500~1530 nm 附近的N-H 伸縮振動(dòng)一級(jí)倍頻[35]。換言之由特征波長篩選出的特征波長體現(xiàn)了油酸和蛋白質(zhì)的信息,由此可以推測油酸和蛋白質(zhì)受到凍傷的負(fù)面影響,過低的溫度會(huì)使花生呼吸作用受到抑制,使油酸發(fā)生氧化作用分解,導(dǎo)致油酸含量下降,同時(shí)使花生內(nèi)部蛋白質(zhì)代謝紊亂,導(dǎo)致蛋白質(zhì)含量增加。最終導(dǎo)致花生的品質(zhì)下降。
針對(duì)在運(yùn)輸、存儲(chǔ)的過程中受到低溫影響產(chǎn)生凍傷的花生,本文探索了一種基于近紅外高光譜成像技術(shù)的高效鑒別花生是否凍傷的方法,采用八種變量選擇方法對(duì)經(jīng)過MSC 預(yù)處理后的花生光譜數(shù)據(jù)進(jìn)行特征波長初步篩選,采用VIP 算法對(duì)八種變量選擇方法初步篩選出的特征波長按照變量重要性進(jìn)行排序并組合,驗(yàn)證了“組合尋優(yōu)”類與“變量重要性”類變量選擇方法結(jié)合的可行性,采用SVM 建立凍傷檢測模型,篩選出達(dá)到判別準(zhǔn)確率閾值為90%的特征波長作為與花生凍傷相關(guān)性最高的特征波長,其中采用VCPA-GA-VIP 方法篩選出的前7 個(gè)波長:959.81、1329.70、1371.97、1375.50、1403.73、1531.21和1573.87 nm 滿足條件,訓(xùn)練集和測試集判別準(zhǔn)確率分別達(dá)到了91.6089%和90.1235%,可作為花生凍傷特征變量,為全譜波長數(shù)的3.125%。通過近紅外光譜的吸收帶對(duì)特征波長進(jìn)行分析,驗(yàn)證了花生凍傷后內(nèi)部油酸含量下降且蛋白質(zhì)含量增加。實(shí)驗(yàn)結(jié)果表明高光譜成像技術(shù)、近紅外光譜技術(shù)在花生凍傷檢測上是可行的,基于近紅外光譜的變量篩選方法的研究可為其他作物病害判別模型的建立以及特征波長篩選提供研究思路,且經(jīng)本研究篩選出的花生凍傷特征波長可為研發(fā)專用型花生凍傷檢測濾光片提供理論基礎(chǔ)。但本研究僅能判斷正常和凍傷花生內(nèi)部物質(zhì)的差異,無法確定物質(zhì)含量的變化,且采用一個(gè)品種的花生進(jìn)行凍傷檢測分析,后續(xù)可以針對(duì)多品種花生凍傷檢測進(jìn)行研究,并建立相關(guān)分析數(shù)據(jù)庫,將有利于完善我國花生凍傷檢測行業(yè)標(biāo)準(zhǔn),提升花生質(zhì)量和經(jīng)濟(jì)收益。