殷 勇 戴松松 于慧春
(河南科技大學(xué)食品與生物工程學(xué)院,河南 洛陽 471023)
玉米(Zea mays Linn.)是我國重要的農(nóng)作物之一,其營養(yǎng)價值豐富,可作為主食、飼料、工業(yè)加工重要原料,是養(yǎng)殖業(yè)的重要能量來源,但玉米在運輸和貯藏過程中極易發(fā)生霉變,霉變后會產(chǎn)生分布廣泛、致癌力較強(qiáng)的黃曲霉毒素B1,如果對黃曲霉毒素B1處理不當(dāng),則極易引起人、畜、禽中毒。 因此,及時檢出霉變玉米及霉變等級尤為重要[1]。
黃曲霉毒素B1的檢測方法主要包括感官評定[2]、高效液相色譜法(high performance liquid chromatography, HPLC)[3]、 聚 合 酶 鏈 式 反 應(yīng)(polymerase chain reaction,PCR)[4]、氣質(zhì)聯(lián)用法(gas chromatography mass spectrometer,GC-MS)[5]及DNA 探針法[6]、酶聯(lián)免疫(enzyme-linked immuno sorbent assay,ELISA)法[7-8]等,但上述方法存在主觀性強(qiáng)、結(jié)果可靠性差,或破壞物料、操作復(fù)雜等缺點。 而高光譜技術(shù)具有高效、無損、低成本和可重復(fù)等優(yōu)勢[9],已被廣泛應(yīng)用于肉類[10-12]、杏仁[13]、水果[14-18]、雞蛋[19]、茶葉[20]、谷類[21]和油料作物[22-23]等農(nóng)副產(chǎn)品檢測,并取得了較好的分析結(jié)果。 近年來,高光譜技術(shù)在玉米霉變檢測中也有報道,褚璇等[24]對獲取400 ~1 000 nm 波段范圍內(nèi)的霉變玉米高光譜圖像,引入基于Fisher 判別最小誤判率的方法選擇最優(yōu)波長,并以所選最優(yōu)波長作為判別模型的輸入,其驗證集的判別正確率為80. 9%。 袁瑩等[25]利用高光譜技術(shù)對霉變玉米進(jìn)行上述檢測,采用支持向量機(jī)分類模型得出的訓(xùn)練集和預(yù)測集的預(yù)測準(zhǔn)確率分別為93. 3% 和91. 7%。 研究表明,高光譜有能力對霉變玉米進(jìn)行鑒別,但對霉變玉米的檢測正確率不高,且多是定性鑒別,缺乏定量分析。 因此,本研究擬利用高光譜技術(shù)對霉變玉米中黃曲霉毒素B1進(jìn)行定量預(yù)測分析,以期為霉變玉米中黃曲霉毒素B1定量檢測提供一種新手段,為實現(xiàn)霉變玉米中黃曲霉毒素B1的高光譜無損檢測奠定基礎(chǔ)。
玉米品種為中單909,購自洛陽市中原農(nóng)貿(mào)城。將新鮮玉米放入相對濕度為90%、溫度為30℃的LHS-HC-100 恒溫恒濕培養(yǎng)箱(上海資一儀器設(shè)備有限公司)中培育。 采用不同培育天數(shù)的玉米來表征不同的霉變程度。 試驗選用培育第0、第2、第4、第6、第8 天來標(biāo)記5 個等級的霉變玉米。 每個等級的樣品各取50 個樣本(35 個訓(xùn)練集,15 個測試集),每個樣本量為60±0.5 g。
高光譜圖像采集系統(tǒng)由IST50—3810 成像光譜儀(德 國Inno-spec 公 司)、 計 算 機(jī)、4 個500 W 的RK90000420108 光纖鹵素?zé)?德國ESYLUX 公司)和傳送裝置等組成。 可采集到的反射光譜范圍為371.05~1 023.82 nm,光譜分辨率為2.8 nm,共得到1 288 個不同的波段。 高光譜掃描設(shè)定范圍為Width 760、Heigh 550,得到的高光譜圖像分辨率為760×550。因此,最終得到的每個樣本大小為760×550×1 288 的高光譜圖像。
采集樣本高光譜數(shù)據(jù)時,將樣本均勻地平鋪在規(guī)格為8 cm×8 cm 的正方體盒子中,然后將盛有樣品的盒子放在搭建的傳送帶上,由SICap-STVR V1.0.x 軟件平臺驅(qū)動控制成像儀,并記錄和存儲高光譜數(shù)據(jù)。采集樣本在371.05~1 023.82 nm 的反射光譜,然后對采集的高光譜圖像信息進(jìn)行黑白校正,校正方法詳見文獻(xiàn)[26]。 針對所采集的高光譜圖像,用ENVI 4.8提取每個樣本的所有像素點在各波長下的平均反射值,以此得到250 個樣本的平均反射光譜數(shù)據(jù),最后通過Matlab 2014a 軟件對光譜數(shù)據(jù)進(jìn)行處理。
為降低儀器噪音和暗電流等的干擾,本試驗采用多元散射校正法(multiplicative scatter correction,MSC)對黑白校正后的高光譜數(shù)據(jù)進(jìn)行預(yù)處理。 MSC 可以增強(qiáng)與成分含量相關(guān)的光譜吸收信息,消除光譜數(shù)據(jù)中散射帶來的影響。 但采用該方法的前提是要先建立一個樣品的“理想光譜”,即樣品中待測成分的含量與光譜變化滿足直接線性關(guān)系,以該光譜為標(biāo)準(zhǔn)對其他樣品光譜通過基線平移和偏移校正進(jìn)行修正。 首先計算樣品高光譜的平均值,然后以平均值作為標(biāo)準(zhǔn)光譜,將樣品光譜于標(biāo)準(zhǔn)光譜進(jìn)行一元線性回歸運算,最后進(jìn)行多元散射校正[27],相關(guān)計算公式如下:
平均光譜:
一元線性回歸:
多元散射校正:
式中,A 表示光譜數(shù)據(jù)矩陣;n 為樣品數(shù);A-表示所有樣品的原始高光譜在各個波長點處求平均值所得到的平均光譜矢量;mi和bi分別表示各樣品高光譜Ai與平均光譜A-進(jìn)行一元線性回歸后得到的相對偏移系數(shù)和平移量。
參照GB 5009.22-2016[28]的測定方法對不同霉變等級玉米中的黃曲霉毒素B1進(jìn)行測定。
采集到的高光譜信息是高達(dá)1 288 個波段的數(shù)據(jù),加上光譜數(shù)據(jù)中相鄰光譜值存在極高的相關(guān)性,故含有大量的冗余信息,使得特征吸收峰不明顯,因此,特征波長的提取對減少計算量、提高檢測精度至關(guān)重要。 本試驗擬通過偏最小二乘回歸(partial least squares regression,PLSR)法對1 288 個波段上樣本的平均光譜反射值進(jìn)行回歸分析,借助于回歸系數(shù)的大小來提取特征波長。
基于偏最小二乘回歸系數(shù)來選擇特征波長的基本方法:通過PLSR 系數(shù)構(gòu)建黃曲霉毒素B1對各波長光譜反射值的回歸模型,回歸表達(dá)式中每個波段的回歸系數(shù)表征了各波段的貢獻(xiàn)比重,系數(shù)絕對值越大,對回歸模型的影響越大。 因此,通過比較回歸系數(shù)可選出光譜的特征波長。
霉變等級判別分析是不同霉變等級黃曲霉毒素B1定量檢測的前提。 首先采用Fisher 判別分析(fisher discriminant analysis,FDA)全波長和特征波長下不同等級霉變玉米的有效性,然后采用農(nóng)產(chǎn)品食品智能無損檢測實驗室自行編寫的FDA 分析程序,以全波長和特征波長為變量進(jìn)行5 組訓(xùn)練集及其對應(yīng)的測試集的FDA 分析,比較全波長和特征波長下的FDA判別結(jié)果。
本研究以偏最小二乘回歸和BP 神經(jīng)網(wǎng)絡(luò)來建立全波長和特征波長下的預(yù)測模型,并比較模型的預(yù)測精度。
1.8.1 偏最小二乘回歸 PLSR 分析在建模過程中集中了主成分分析、典型相關(guān)分析和線性回歸分析的特點,預(yù)測能力強(qiáng)且模型簡單[29]。 PLSR 模型性能評價指標(biāo)采用訓(xùn)練集相關(guān)系數(shù)(Rc)、測試集相關(guān)系數(shù)(Rp)、訓(xùn)練集均方根誤差(RMSEC)、測試集均方根誤差(RMSEP) 來綜合評定。 Rc、Rp 越高,RMSEC、RMSEP 越小,則模型預(yù)測性能越好。
1.8.2 BP 神經(jīng)網(wǎng)絡(luò) 在BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型的構(gòu)造中,采用輸入層、中間層(隱層)和輸出層3 層網(wǎng)絡(luò)結(jié)構(gòu),全波長下輸入層神經(jīng)元個數(shù)為1 288 個(代表1 288 個波長下的光譜值),特征波長下輸入層神經(jīng)元個數(shù)為7 個(代表7 個波長下的光譜值),輸出層神經(jīng)元個數(shù)都為1(代表黃曲霉毒素B1)。 tansig 函數(shù)為隱層神經(jīng)元傳遞函數(shù)、traincgf 函數(shù)為訓(xùn)練函數(shù)、logsig 函數(shù)為輸出層神經(jīng)元傳遞函數(shù)時,用訓(xùn)練集數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò),并用試湊法來確定隱層神經(jīng)元個數(shù)(6)。 此時的網(wǎng)絡(luò)訓(xùn)練誤差為0.000 47,訓(xùn)練步數(shù)為100,學(xué)習(xí)速率為0.1。 BP 神經(jīng)網(wǎng)絡(luò)的具體用法參見文獻(xiàn)[30]。
以隨機(jī)抽取每個等級中的5 個平行樣本的平均值作為該等級的測試結(jié)果(表1)。 本結(jié)果由河南省商丘市質(zhì)量技術(shù)監(jiān)督檢驗測試中心測試并提供。
表1 霉變玉米中黃曲霉毒素B1 含量Table 1 The test results of aflatoxin B1 corresponding to different moldy grades of maize
由圖1 可知,原始光譜曲線存在較為嚴(yán)重的基線漂移現(xiàn)象,經(jīng)MSC 預(yù)處理后的光譜曲線(圖2)的基線漂移現(xiàn)象被消除了。 由獲取的光譜曲線可知,不同等級霉變玉米的光譜曲線總體變化規(guī)律具有相似性:在410 ~490 nm 波段,平均光譜反射值逐漸降低;不同霉變等級的玉米光譜反射值在490 nm附近出現(xiàn)吸收波谷,這是由玉米中黃曲霉毒素B1的吸收作用引起的;在490 ~800 nm 波段平均光譜值逐漸增加,在820 nm 附近出現(xiàn)了最大的光譜反射值,之后逐漸平穩(wěn)。
由圖3 可知,經(jīng)PLSR 分析選出了7 個特征波長,這些特征波長較好地體現(xiàn)了原光譜中大部分黃曲霉毒素B1信息。 其中,544.6、623.5、757.1、921.6 nm 4 個特征波長的平均光譜反射值與霉變玉米中黃曲霉毒素B1含量呈正相關(guān);584.1、697.1、841.7 nm 處的光譜反射值與霉變玉米中黃曲霉毒素B1的含量呈負(fù)相關(guān)。
圖1 原始光譜曲線Fig.1 The original spectrum curve
由圖4 可知,全波長下的不同程度霉變玉米大部分能夠區(qū)分開來,但第2、第4 天和第6、第8 天仍有小部分重疊,FDA 測試結(jié)果比較分散。 特征波長下的不同程度霉變玉米基本上能夠較好的區(qū)分開來,且分布較聚集(圖5)。 由表2 可知,全波長下的FDA 鑒別正確率在85%~88%之間,特征波長下的FDA 鑒別正確率均在98%以上。 因此,在鑒別分析中運用特征波長能較好地判別不同霉變等級的玉米樣本。
圖2 經(jīng)MSC 預(yù)處理后的光譜曲線Fig.2 The spectrum curves after MSC pretreatment
圖3 黃曲霉毒素B1 模型權(quán)重系數(shù)圖Fig.3 The weight coefficient curves of aflatoxin B1 PLSR model
圖4 基于全波長下的FDA 結(jié)果Fig.4 FDA results based on the full wavelengths
圖5 基于特征波長下的FDA 結(jié)果Fig.5 FDA results based on the characteristic wavelengths
表2 全波長和特征波長下對應(yīng)測試集的FDA 鑒別正確率Table 2 FDA accuracy of test set based on the full wavelength and the Characteristic wavelength /%
圖6 全波長和特征波長下對應(yīng)測試集的PLSR 預(yù)測結(jié)果Fig.6 PLSR prediction results of test set based on the full wavelength and characteristic wavelengths
2.5.1 偏最小二乘回歸模型的分析 不同霉變等級玉米能得到有效鑒別是構(gòu)建黃曲霉毒素B1定量預(yù)測模型的基礎(chǔ)。 由圖6 可知,基于特征波長下預(yù)測模型的Rp(0.9570)略低于全波長下的Rp(0.991 1),但RMSEP ( 2.779 2) 略高于全波長的 RMSEP(1.261 2)。特征波長下的預(yù)測模型性能參數(shù)劣于全波長的預(yù)測模型,但兩者精度相差不大,且特征波長預(yù)測模型的變量降到7 個,遠(yuǎn)低于全波長的1 288 個變量,說明特征波長的提取及所構(gòu)建的預(yù)測模型是有效的。
2.5.2 BP 神經(jīng)網(wǎng)絡(luò)模型的分析 由表3 可知,在75個測試集中,全波長下預(yù)測相關(guān)系數(shù)Rp=0.994 4,RMSEP=0.339 1;特征波長下預(yù)測模型的相關(guān)系數(shù)Rp=0.999 9,RMSEP=0.180 9,說明特征波長下的預(yù)測效果優(yōu)于全波長,特征波長光譜信息能代表全波長信息。
2.5.3 PLSR 與BP 神經(jīng)網(wǎng)絡(luò)模型的比較分析 由表4 可知,在2 種預(yù)測模型中,預(yù)測準(zhǔn)確度均在95%以上。 在全波長下,BP 神經(jīng)網(wǎng)絡(luò)模型和PLSR 模型的預(yù)測相關(guān)系數(shù)相近,均在99%以上,但BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測集的均方根誤差RMSEP=0.339 1,小于PLSR 模型預(yù)測集的均方根誤差RMSEP=1.261 2,其預(yù)測精度高于PLSR 模型。 在特征波長下,BP 神經(jīng)網(wǎng)絡(luò)模型的Rp=0.999 9,高于PLSR 模型的Rp=0.957 0,且其均方根誤差RMSEP = 0.180 9 遠(yuǎn)低于PLSR 模型的RMSEP=2.779 2,說明BP 神經(jīng)網(wǎng)絡(luò)模型在特征波長下的預(yù)測效果優(yōu)于PLSR 模型。 而全波長下,BP 神經(jīng)網(wǎng)絡(luò)模型中的模型預(yù)測相關(guān)系數(shù)Rp=0.994 4,略低于特征波長下的Rp = 0.999 9, 預(yù)測精度RMSEP(0.339 1)高于特征波長下的RMSEP(0.180 9),這與玉米霉變等級鑒別分析中,特征波長下的FDA 鑒別正確率在98%以上相吻合。 綜上,特征波長下的BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有較高的穩(wěn)定性與可靠性。
玉米中毒素的產(chǎn)生主要是由于其自身帶有孢子和芽孢,芽孢是細(xì)菌的休眠體,孢子由霉菌產(chǎn)生,它們在適宜的生長環(huán)境下可使玉米產(chǎn)生霉變[2],而有關(guān)玉米霉變的分析,前人主要是通過理化試驗對其進(jìn)行鑒定。本研究對霉變玉米進(jìn)行了黃曲霉毒素B1含量的高光譜預(yù)測,達(dá)到了無損快速檢測霉變玉米中黃曲霉毒素B1的目的,為實現(xiàn)玉米霉變的在線、快速、精確檢測提供了借鑒。
表3 測試集中黃曲霉毒素B1 期望值與BP 神經(jīng)網(wǎng)絡(luò)預(yù)測值Table 3 Prediction vales of aflatoxin B1 based on BP neural network and their desired values for test set /(μg·kg-1)
表4 2 種預(yù)測模型中測試集對比評價指標(biāo)Table 4 Comparison of two test models in the test set evaluation index
本試驗中,影響高光譜預(yù)測霉變玉米中黃曲霉毒素B1結(jié)果的因素主要包括特征波長的選取和模型的構(gòu)建。 本試驗結(jié)果表明,特征波長的FDA 鑒別正確率高于全波長,說明特征波長的提取是有效的,將特征波長作為不同霉變等級黃曲霉毒素B1定量檢測的模型輸入時,發(fā)現(xiàn)預(yù)測精度明顯提高,這與孫靜濤等[31]采用高光譜技術(shù)并結(jié)合特征波長的提取預(yù)測哈密瓜可溶性固形物和硬度的結(jié)論一致。 本研究中,特征波長下的PLSR 預(yù)測模型精度略低于全波長,而BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測模型中,特征波長下的預(yù)測精度又明顯比全波長高,說明構(gòu)建的模型不同,其特征波長下的預(yù)測精度并不是都比全波長下的高,這可能與本研究只用了偏最小二乘權(quán)重回歸系數(shù)這一種方法提取特征波長有關(guān),因為提取的這7 個特征波長雖然去除了冗余信息,提高了模型精度,但是特征波長的選擇方法可能并不是最佳的,所以針對高光譜特征波長的選擇仍需進(jìn)一步研究。
高光譜成像技術(shù)在霉變玉米無損檢測中仍然存在一定的局限性,還需要進(jìn)一步完善,同時本研究的樣本的數(shù)量及種類可能還不夠多,地域、品種覆蓋范圍還不夠廣,霉變天數(shù)的選擇也可能不是預(yù)測霉變玉米中黃曲霉毒素B1的最佳等級,以及霉變玉米的鑒別方法比較單一,構(gòu)建的預(yù)測模型泛化能力有待進(jìn)一步提高,因此,后續(xù)工作仍有待深入研究。
針對霉變玉米中黃曲霉毒素B1的高光譜檢測方法,在提取霉變玉米高光譜特征波長的基礎(chǔ)上,分別研究了全波長和特征波長下的FDA 判別效果。 結(jié)果表明,特征波長能較好地判別不同等級的霉變玉米;特征波長下的BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型,具有較高的穩(wěn)定性與可靠性。 因此,特征波長光譜信息能代表全波長信息,而且進(jìn)行特征波長的提取也是必要的,可減少計算量、提高檢測精度及減少信息的冗余現(xiàn)象。