郭林鴿,殷 勇,于慧春,袁云霞
(河南科技大學(xué)食品與生物工程學(xué)院,河南 洛陽(yáng) 471023)
馬鈴薯又稱土豆、洋山芋等,具有糧菜兼具的特點(diǎn),素有“能源植物”“蔬菜之王”等美譽(yù),是全球第四大糧食作物[1-2]。馬鈴薯中VC含量豐富,是馬鈴薯品質(zhì)的重要指標(biāo)[3]。馬鈴薯VC含量的快速檢測(cè)可用于馬鈴薯的品質(zhì)監(jiān)控,同時(shí)為馬鈴薯育種、篩選、產(chǎn)業(yè)原料的選擇提供便利。目前,VC含量的測(cè)定方法一般包括高效液相色譜法、2,6-二氯靛酚滴定法、紫外分光光度法等[4-5];但這些方法樣品處理繁瑣、費(fèi)時(shí)、易產(chǎn)生誤差,且有化學(xué)試劑污染的缺陷。因此,尋找一種快速、準(zhǔn)確、高效檢測(cè)VC含量的方法具有重要意義。
近年來(lái),高光譜成像(hyperspectral imaging,HSI)技術(shù)因其快速、分辨率高等優(yōu)點(diǎn),被廣泛應(yīng)用于農(nóng)產(chǎn)品病害檢測(cè)[6-8]、缺陷檢測(cè)[9-11]、肉制品質(zhì)量檢測(cè)[12-13]、摻假摻雜[14-15]等方面。HSI技術(shù)是傳統(tǒng)圖像和光譜技術(shù)的結(jié)合,可同時(shí)獲取待測(cè)樣品的空間和光譜信息,進(jìn)而實(shí)現(xiàn)待測(cè)物的定性和定量分析[16-17]。Xiao Qinlin等[18]利用HSI結(jié)合多變量分析研究鮮切馬鈴薯塊莖的顏色指數(shù)和水分含量。對(duì)于顏色預(yù)測(cè)建立的所有最小二乘支持向量機(jī)(least squares-support vector machine,LS-SVM)模型的校正集決定系數(shù)(determination coefficient of calibration set,)、預(yù)測(cè)集決定系數(shù)(determination coefficient of prediction set,)和剩余預(yù)測(cè)偏差(residual prediction deviation,RPD)分別超過0.90、0.84和2.10;對(duì)于水分含量預(yù)測(cè)建立的LS-SVM模型的、和RPD分別超過0.80、0.77、1.90;表明HSI技術(shù)檢測(cè)馬鈴薯顏色指數(shù)及水分含量的可行性。Chen Huazhou等[19]利用近紅外HSI技術(shù)結(jié)合先進(jìn)的化學(xué)計(jì)量學(xué)方法對(duì)柚果品質(zhì)進(jìn)行快速檢測(cè)。通過改進(jìn)非線性回歸,優(yōu)化建模過程的參數(shù)縮放,建立徑向基函數(shù)(radial basis function,RBF)結(jié)合偏最小二乘(partial least squares,PLS)模型實(shí)現(xiàn)了樣品中糖、VC和有機(jī)酸的定量預(yù)測(cè),為HSI技術(shù)應(yīng)用于檢測(cè)水果中VC含量提供參考。
Fisher判別分析(Fisher discriminant analysis,F(xiàn)DA)是一種經(jīng)典的分類方法,能夠生成光譜特征的線性組合,并構(gòu)建用于分類的線性識(shí)別模型。如Cui Lihan等[20]采用FDA建立識(shí)別不同應(yīng)力的模型,該模型在所有壓力下的判別正確率均超過93%。Ma Huiqin等[21]采用FDA建立鐮刀菌頭枯萎病識(shí)別模型,識(shí)別正確率達(dá)到88.7%。故經(jīng)FDA線性組合后生成的新變量可用于表征樣本間的差異性。由于FDA是對(duì)原始變量的線性組合,且生成的新變量相互正交,若采用FDA對(duì)特征波長(zhǎng)進(jìn)行融合后,可能會(huì)減少變量間相互作用的影響,提高模型檢測(cè)結(jié)果的準(zhǔn)確性。故可以將FDA看作一種數(shù)據(jù)融合方法,用于構(gòu)建檢測(cè)模型的輸入變量。
綜上所述,本研究以HSI技術(shù)檢測(cè)馬鈴薯VC含量為切入點(diǎn),提出一種基于FDA可分性數(shù)據(jù)融合的檢測(cè)模型輸入變量構(gòu)建方法,并借助PLS模型和反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)模型提高馬鈴薯VC含量檢測(cè)結(jié)果的準(zhǔn)確性。由于FDA本身也是一種分類方法,故該檢測(cè)模型既能實(shí)現(xiàn)馬鈴薯品種鑒別,也能實(shí)現(xiàn)馬鈴薯VC含量檢測(cè)。
實(shí)驗(yàn)所用馬鈴薯為湖北馬爾科馬鈴薯、云南黃心馬鈴薯、陜西沙地馬鈴薯和山東荷蘭馬鈴薯。每個(gè)品種共制備50 個(gè)厚度為15 mm的檢測(cè)樣本,4 個(gè)品種共200 個(gè)樣本用于VC含量檢測(cè)。其中,每個(gè)品種隨機(jī)選取40 個(gè)檢測(cè)樣本組成訓(xùn)練集,共160 個(gè)樣本,剩余10 個(gè)檢測(cè)樣本作為測(cè)試集,共40 個(gè)樣本。
IST50-3810型成像光譜儀 德國(guó)Inno-Spec公司;RK90000420108型可調(diào)節(jié)鹵素?zé)簦üβ?00 W)德國(guó)Esylux公司;物料滑臺(tái)及其控制裝置為自制。
1.3.1 HSI系統(tǒng)
實(shí)驗(yàn)室所用HSI系統(tǒng)的組成為:計(jì)算機(jī)、成像光譜儀、4 個(gè)可調(diào)節(jié)鹵素?zé)簦üβ?00 W)、物料滑臺(tái)及其控制裝置。通過該系統(tǒng)可獲得371.05~1 023.82 nm的光譜信息,光譜分辨率為2.8 nm。其他性能參數(shù)與Xue Shuning等[22]所用設(shè)備相同。
1.3.2 理化指標(biāo)測(cè)定
VC含量的傳統(tǒng)測(cè)定方法參照GB 5009.86—2016《食品安全國(guó)家標(biāo)準(zhǔn) 食品中抗壞血酸的測(cè)定》第三法2,6-二氯靛酚滴定法。均勻稱取4 g馬鈴薯可食部分,放入研缽中,加入少許2 g/100 mL草酸溶液,迅速研磨成漿,轉(zhuǎn)移到50 mL容量瓶中,用2 g/100 mL草酸溶液定容,搖勻后過濾。準(zhǔn)確吸取10 mL濾液于錐形瓶中,用已標(biāo)定的2,6-二氯靛酚溶液進(jìn)行滴定。每個(gè)品種隨機(jī)選取3 個(gè)平行樣本,每個(gè)樣本平行滴定3 次,結(jié)果取算術(shù)平均值。VC含量按式(1)計(jì)算。
式中:V為滴定樣本所消耗2,6-二氯靛酚溶液體積/mL;V0為滴定空白所消耗2,6-二氯靛酚溶液體積/mL;T為2,6-二氯靛酚溶液滴定度,即每毫升2,6-二氯靛酚溶液相當(dāng)于VC的毫克數(shù)/(mg/mL);n為稀釋倍數(shù);m為樣本質(zhì)量/g。
1.3.3 高光譜信息采集與校正
經(jīng)預(yù)實(shí)驗(yàn)確定HSI系統(tǒng)檢測(cè)參數(shù)為:物料滑臺(tái)傳送速率1.30 mm/s,物距215 mm。高光譜信息采集時(shí),將制作的馬鈴薯樣本含有表皮的一面朝上放置在酶標(biāo)板蓋;然后,把酶標(biāo)板蓋放置在載物臺(tái);最后使用SICap-STVR軟件采集樣本的高光譜信息。每個(gè)樣本共采集1 288 個(gè)波段的高光譜信息。為減少暗電流及外界光源對(duì)數(shù)據(jù)的影響,需在采集光譜信息前進(jìn)行黑白校正。校正公式如式(2)所示:
式中:R為校正后的高光譜圖像信息;Ro為原始高光譜圖像信息;Rd為全黑標(biāo)定圖像信息;Rw為全白標(biāo)定圖像信息。
利用ENVI 5.1軟件從采集的樣本圖像中在反光區(qū)域周圍靠近中線的位置選取大小為2 352 個(gè)像素點(diǎn)的區(qū)域?yàn)楦信d趣區(qū)域,進(jìn)行光譜數(shù)據(jù)提取并得到所有樣本的高光譜數(shù)據(jù)。
1.3.4 光譜數(shù)據(jù)預(yù)處理
高光譜數(shù)據(jù)包含1288 個(gè)波段,波長(zhǎng)范圍371.05~1 023.82 nm。由于信號(hào)采集過程中兩端噪聲較大,平均光譜反射值差異過大,易引起干擾。因此,去除371.05~421.66、974.39~1 023.82 nm的波段,選擇421.66~974.39 nm的光譜數(shù)據(jù)(含1 088 個(gè)波段)進(jìn)行后續(xù)處理。為消除噪音和外界不均勻光照等因素對(duì)高光譜數(shù)據(jù)的影響,提高馬鈴薯VC含量預(yù)測(cè)模型的可靠性,需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理。采用卷積平滑(Savitzky-Golary smoothing,S-G)[23]、標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate,SNV)[24]、標(biāo)準(zhǔn)化[25]、歸一化[26]、多元散射校正(multiplicative scatter correction,MSC)[27]、一階導(dǎo)數(shù)[28]6 種預(yù)處理方法,并借助PLS、BPNN等建模處理后,對(duì)比不同預(yù)處理方法前后的建模結(jié)果選擇較優(yōu)的預(yù)處理方法。
1.3.5 光譜特征波長(zhǎng)提取
高光譜數(shù)據(jù)量大、冗余信息多,為加快計(jì)算速度、提高模型的可靠性,需要提取出能表征馬鈴薯VC含量的特征波長(zhǎng)。文獻(xiàn)檢索發(fā)現(xiàn),競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣(competitive adaptive reweighted sampling,CARS)[29-35]、連續(xù)投影算法(successive projections algorithm,SPA)[34-39]和CARS-SPA[40-43]組合算法提取的特征波長(zhǎng)能較好表征不同樣本的重要信息。因此,采取CARS、SPA及CARS-SPA組合算法作為光譜數(shù)據(jù)的特征波長(zhǎng)提取方法。
CARS算法采用蒙特卡羅采樣法選擇變量,并建立PLS模型,將模型回歸系數(shù)的絕對(duì)值作為篩選特征波長(zhǎng)的指標(biāo)用以構(gòu)建新變量,基于新變量建立PLS模型并進(jìn)行交叉驗(yàn)證。經(jīng)過多次計(jì)算,最終選擇交叉驗(yàn)證均方差(root mean square error of cross validation,RMSECV)最小時(shí)所對(duì)應(yīng)的變量集作為特征波長(zhǎng)[44]。
SPA需提前設(shè)定提取特征波長(zhǎng)的個(gè)數(shù),隨機(jī)在原始光譜矩陣選擇一列向量作為初始波長(zhǎng),使用矢量的投影分析將初始波長(zhǎng)分別映射到剩余波長(zhǎng)上,具有最大投影矢量的波長(zhǎng)即為要選擇的特征波長(zhǎng)[45]。每次迭代加入一個(gè)新變量,直至所選變量數(shù)達(dá)到設(shè)定波長(zhǎng)數(shù),然后基于校正模型確定最終的特征波長(zhǎng)。
CARS-SPA組合算法可實(shí)現(xiàn)特征波長(zhǎng)的二次提取,能有效減少冗余信息和共線性問題。在CARS-SPA組合算法中,首先采用CARS算法進(jìn)行初步特征提取,再基于提取的特征波長(zhǎng)采用SPA進(jìn)行二次特征提取,以獲取最終特征波長(zhǎng)個(gè)數(shù)。
1.3.6 檢測(cè)模型輸入變量構(gòu)建
FDA是基于線性變換構(gòu)建使不同樣品具有可分離性的新空間變量。由于新變量均是原始變量的線性組合,且各變量間相互正交,因此可將FDA看作是一種數(shù)據(jù)融合方法,且融合后的新變量能最大程度地體現(xiàn)被測(cè)樣本間的差異性。若將這種新變量作為不同樣本某個(gè)(些)成分含量檢測(cè)模型的輸入變量,那么可使檢測(cè)模型更容易檢測(cè)出不同樣品的差異性,進(jìn)而可給出被測(cè)成分可靠、準(zhǔn)確的檢測(cè)結(jié)果。由于經(jīng)FDA融合后生成的新變量對(duì)不同樣本差異性判別能力按照降序排列,故可依據(jù)前幾個(gè)新變量的判別能力之和進(jìn)行降維,以減少分析變量個(gè)數(shù),降低分析的復(fù)雜性。因此,在提取特征波長(zhǎng)的基礎(chǔ)上,擬采用FDA對(duì)特征波長(zhǎng)(作為變量)進(jìn)行分析生成新融合變量,選取新融合變量累計(jì)判別能力達(dá)到99%以上的前幾個(gè)變量作為VC含量檢測(cè)模型的輸入變量,以保證不同樣本間的可分性,提升VC含量檢測(cè)結(jié)果的準(zhǔn)確性。
1.3.7 檢測(cè)模型構(gòu)建
選擇線性PLS擬合方法和BPNN方法建立馬鈴薯VC含量預(yù)測(cè)模型。PLS是一種經(jīng)典的線性擬合方法,該方法能最大限度地提取因變量和自變量中的主成分,并在建模過程中最大化該主成分之間的相關(guān)性[46]。BPNN具有較強(qiáng)的非線性預(yù)測(cè)能力,能將信號(hào)正向傳播,計(jì)算輸出值與真實(shí)值的誤差,將誤差進(jìn)行反向傳播以修正網(wǎng)絡(luò)的權(quán)值和閾值,直到誤差達(dá)到最小[47-48]。其建模過程如下[49]:1)輸入變量,劃分訓(xùn)練集和測(cè)試集,歸一化數(shù)據(jù);2)建立網(wǎng)絡(luò),設(shè)置參數(shù)(訓(xùn)練次數(shù)1 000、學(xué)習(xí)率0.01、訓(xùn)練目標(biāo)最小誤差0.001);3)訓(xùn)練網(wǎng)絡(luò);4)網(wǎng)絡(luò)仿真測(cè)試及性能評(píng)價(jià)。
對(duì)預(yù)處理前后的數(shù)據(jù)分別建立PLS和BPNN模型,采用和預(yù)測(cè)集均方根誤差(root mean square error,RMSEP)作為模型的評(píng)價(jià)指標(biāo)。越接近1,RMSEP越小,說(shuō)明擬合程度越高,模型越可靠[50]。由表1可知,與原始數(shù)據(jù)所建模型的預(yù)測(cè)能力相比,一階導(dǎo)數(shù)預(yù)處理后所建PLS模型的預(yù)測(cè)能力與其基本相當(dāng),但BPNN模型的預(yù)測(cè)能力較低,不適合作為馬鈴薯VC含量檢測(cè)模型的預(yù)處理方法。其余5 種方法預(yù)處理后所建模型的預(yù)測(cè)能力均優(yōu)于原始數(shù)據(jù)所建模型的預(yù)測(cè)能力,尤其是經(jīng)MSC方法預(yù)處理后所建PLS和BPNN模型,和RMSEP由0.858 2和1.652 6、0.893 9和1.467 3分別提高至0.928 4和1.173 9、0.956 5和0.935 4,極大地提高了模型的預(yù)測(cè)能力。因此,初步確定MSC為原始數(shù)據(jù)的預(yù)處理方法。
表1 不同預(yù)處理方法下PLS和BPNN模型和RMSEPTable 1 and RMSEP of PLS and BPNN models with different preprocessing methods
表1 不同預(yù)處理方法下PLS和BPNN模型和RMSEPTable 1 and RMSEP of PLS and BPNN models with different preprocessing methods
如圖1所示,MSC通過偏移校正能有效減少由于散射水平不同引起的光譜差異,增強(qiáng)光譜與數(shù)據(jù)之間的相關(guān)性,提升模型預(yù)測(cè)能力,這與表1的結(jié)果相吻合。因此確定MSC為光譜預(yù)處理方法。
圖1 MSC處理前后馬鈴薯樣本光譜的對(duì)比Fig.1 Comparison of spectral data of potato samples before and after MSC treatment
2.2.1 基于CARS算法的特征波長(zhǎng)提取
在CARS算法中,設(shè)定蒙特卡羅采樣次數(shù)為50,采用5折交叉驗(yàn)證計(jì)算RMSEP。由圖2可知,當(dāng)采樣次數(shù)為28 次時(shí)獲得的RMSECV最小,對(duì)應(yīng)特征變量個(gè)數(shù)為34,故此時(shí)所選的34 個(gè)特征變量即為提取結(jié)果。
圖2 基于CARS算法的特征波長(zhǎng)選擇Fig.2 Feature wavelength selection by CARS
2.2.2 基于SPA的特征波長(zhǎng)提取
在SPA中,設(shè)定特征變量個(gè)數(shù)選擇范圍為1~90,最小的RMSECV對(duì)應(yīng)的變量個(gè)數(shù)即為特征波長(zhǎng)個(gè)數(shù)。由圖3可知,特征變量個(gè)數(shù)為36時(shí),RMSECV達(dá)到最小且逐漸穩(wěn)定,此時(shí)提取的36 個(gè)特征波段對(duì)應(yīng)的波長(zhǎng)為最終的特征波長(zhǎng)。
圖3 基于SPA的特征波長(zhǎng)選擇Fig.3 Feature wavelength selection by SPA
2.2.3 基于CARS-SPA組合算法的特征波長(zhǎng)提取
在CARS-SPA組合算法中,SPA進(jìn)行二次特征波長(zhǎng)提取時(shí)的變量為1~34。通過CARS算法提取34 個(gè)特征波長(zhǎng),再經(jīng)SPA二次提取得到23 個(gè)特征波長(zhǎng)。CARS-SPA組合算法能極大減少特征波長(zhǎng)的個(gè)數(shù),簡(jiǎn)化模型運(yùn)算。
如表2所示,CARS-SPA組合算法提取的特征波長(zhǎng)數(shù)最少,但其所建模型的相關(guān)系數(shù)最低,雖然模型得到簡(jiǎn)化,但降低了模型的預(yù)測(cè)能力。與SPA相比,CARS算法提取的特征波長(zhǎng)數(shù)量相對(duì)較少,所建模型的相關(guān)系數(shù)高,RMSEP小,能有效減少光譜信息中的冗余信息,更適合作為馬鈴薯光譜數(shù)據(jù)的特征波長(zhǎng)提取方法。經(jīng)CARS算法篩選出的34 個(gè)特征波段所建PLS和BPNN模型將和RMSEP由最初的0.928 4和1.173 9、0.956 5和0.935 4分別提高到0.948 6和0.996 7、0.972 6和0.772 3,實(shí)現(xiàn)了簡(jiǎn)化模型的同時(shí)提高模型的可靠性,這與文獻(xiàn)[51]中采用CARS所達(dá)到的效果類似。結(jié)合表1、2可以發(fā)現(xiàn),BPNN模型預(yù)測(cè)結(jié)果優(yōu)于PLS模型預(yù)測(cè)結(jié)果。因此,可初步確定BPNN更適合作為檢測(cè)馬鈴薯VC含量的建模方法。
表2 不同特征波長(zhǎng)提取方法的PLS和BPNN模型和RMSEPTable 2 and RMSEP of PLS and BPNN models with different feature wavelength extraction methods
表2 不同特征波長(zhǎng)提取方法的PLS和BPNN模型和RMSEPTable 2 and RMSEP of PLS and BPNN models with different feature wavelength extraction methods
FD1、FD2分別是基于CARS算法提取的34 個(gè)特征波長(zhǎng)經(jīng)FDA融合后對(duì)樣本間差異性判別能力前兩位的變量。圖4是FD1和FD2對(duì)不同樣本間可分離性的可視化表達(dá),訓(xùn)練集和測(cè)試集的分類正確率均達(dá)到100%,表明FD1、FD2能檢測(cè)出不同樣本間的差異性,且經(jīng)FDA融合后的變量相互正交,可減少變量間的關(guān)聯(lián)性對(duì)模型的影響。
圖4 基于特征波長(zhǎng)的FDA結(jié)果Fig.4 FDA results based on feature wavelengths
由表3可知,F(xiàn)D1和FD2累計(jì)判別能力僅有0.93左右,若以FD1、FD2組成向量作為檢測(cè)模型的輸入變量,可能會(huì)對(duì)模型的準(zhǔn)確性造成不利影響。而FD1、FD2、FD3對(duì)樣本間差異的累計(jì)判別能力接近于100%,F(xiàn)D4及其后變量對(duì)樣本間差異的判別能力可忽略不計(jì)。因此,選擇由FD1、FD2、FD3組成向量作為VC含量檢測(cè)模型的輸入變量。
表3 新變量的前4 個(gè)變量的判別能力Table 3 Discrimination capacity of the first four new variables
通過傳統(tǒng)方法測(cè)得4 種馬鈴薯VC含量作為預(yù)測(cè)模型的真實(shí)值,通過PLS和BPNN模型分別獲得VC含量預(yù)測(cè)值,根據(jù)擬合結(jié)果判斷模型的準(zhǔn)確性。由表4可知,除湖北馬爾科馬鈴薯外,經(jīng)FDA融合后建立的BPNN模型獲得的VC含量預(yù)測(cè)值與傳統(tǒng)方法測(cè)得的VC含量真實(shí)值基本一致,模型預(yù)測(cè)結(jié)果良好。
表4 不同品種馬鈴薯VC含量的真實(shí)值和預(yù)測(cè)值Table 4 Real and predicted values of VC contents in different potato varieties mg/100 g
由表5可知,經(jīng)FDA生成的輸入變量所構(gòu)建的PLS和BPNN模型的均有所提高,尤其是經(jīng)FDA構(gòu)建的輸入變量構(gòu)建的BPNN模型由0.972 6提高到0.999 0,RMSEP也由0.772 3減小到0.172 7。由此可知,經(jīng)FDA構(gòu)建的輸入變量能有效提高馬鈴薯VC含量預(yù)測(cè)模型的預(yù)測(cè)能力。此外,基于不同輸入變量的BPNN模型的相關(guān)性能參數(shù)均優(yōu)于PLS模型,與表1、2結(jié)果一致。故確定BPNN為預(yù)測(cè)馬鈴薯VC含量的建模方法。
表5 基于不同輸入變量構(gòu)建方法的PLS和BPNN模型和RMSEPTable 5 and RMSEP of PLS and BPNN models based on different input variable construction methods
表5 基于不同輸入變量構(gòu)建方法的PLS和BPNN模型和RMSEPTable 5 and RMSEP of PLS and BPNN models based on different input variable construction methods
基于MSC-CARS-FDA-BPNN的序貫組合方法建立4 類馬鈴薯VC預(yù)測(cè)模型的預(yù)測(cè)值和真實(shí)值的擬合結(jié)果如圖5所示。湖北馬爾科馬鈴薯有2 個(gè)樣本的預(yù)測(cè)值略偏大,其余樣本預(yù)測(cè)值均在14.33~14.36 mg/100 g內(nèi),與表4的真實(shí)值基本一致。說(shuō)明基于FDA可分性數(shù)據(jù)融合構(gòu)建的輸入變量能提高馬鈴薯VC含量預(yù)測(cè)結(jié)果的準(zhǔn)確性。
圖5 基于FDA的BPNN模型預(yù)測(cè)結(jié)果Fig.5 Prediction results of BPNN models based on FDA
采集4 種不同品種的馬鈴薯的高光譜數(shù)據(jù),探究6 種預(yù)處理方法對(duì)模型預(yù)測(cè)VC含量結(jié)果的影響,確定MSC為最優(yōu)預(yù)處理方法。在對(duì)比3 種特征波長(zhǎng)提取方法提取效果的基礎(chǔ)上,借助PLS模型和BPNN模型探討了經(jīng)FDA融合前后模型預(yù)測(cè)結(jié)果的準(zhǔn)確性,并確定最優(yōu)預(yù)測(cè)模型。對(duì)比分析SPA、CARS算法和CARS-SPA組合算法提取的特征波長(zhǎng)對(duì)VC含量檢測(cè)結(jié)果準(zhǔn)確性的影響,發(fā)現(xiàn)CARS算法篩選的34 個(gè)特征波長(zhǎng)能很好表征不同品種馬鈴薯的重要信息,不僅簡(jiǎn)化了模型運(yùn)算,還提高了模型檢測(cè)結(jié)果的準(zhǔn)確性。將34 個(gè)特征波長(zhǎng)進(jìn)行FDA可分性融合后生成新變量,發(fā)現(xiàn)前3 個(gè)變量(FD1、FD2、FD3)對(duì)樣本間差異的累計(jì)判別能力達(dá)99%以上,將該組合變量作為VC含量檢測(cè)模型的輸入變量,顯著提高了VC含量檢測(cè)結(jié)果的準(zhǔn)確性。探討不同輸入變量的PLS、BPNN模型R2p和RMSEP發(fā)現(xiàn),BPNN模型的預(yù)測(cè)值和真實(shí)值擬合效果更好,更適合用于馬鈴薯VC含量的檢測(cè)。
綜上,經(jīng)FDA可分性數(shù)據(jù)融合所構(gòu)建的輸入變量能顯著提高馬鈴薯VC含量檢測(cè)結(jié)果的準(zhǔn)確性。同時(shí),采用MSC-CARS-FDA-BPNN的序貫組合方法不僅實(shí)現(xiàn)了馬鈴薯中VC含量的快速、準(zhǔn)確檢測(cè),還實(shí)現(xiàn)了馬鈴薯的種類鑒別。