劉紅梅,申 濤,張文怡,石習(xí)文,戴 濤,白 濤,肖應(yīng)輝
湖南農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,湖南 長沙 410128
水稻是世界及我國重要的糧食作物之一,全球超過一半的人以大米為主食,我國則有60%以上的人口以大米為主食。隨著生活水平的提高,人民對米質(zhì)的要求越來越高,因此,水稻品質(zhì)改良育種尤其重要。稻米膠稠度與米飯的柔軟度和粘稠度有關(guān),能反映稻米蒸煮食味品質(zhì)的優(yōu)劣[1-2]。化學(xué)方法測定膠稠度操作繁瑣、 測試周期長、 檢測過的樣品不能繼續(xù)用于育種研究,不利于育種工作者對早世代品種的快速篩選[3]。近紅外分析技術(shù)可快速檢測有機物含量[4],能無損地檢測稻米品質(zhì),對加快優(yōu)質(zhì)稻的育種進(jìn)程具有重要意義。近紅外分析技術(shù)在醫(yī)藥、 農(nóng)業(yè)等領(lǐng)域已得到廣泛的研究應(yīng)用[5-7],而在稻米膠稠度檢測方面的研究少有報道。因此,本研究收集南方稻區(qū)主栽或新育成的水稻品種(組合)為材料,測定其膠稠度的化學(xué)值,收集其近紅外光譜,采用偏最小二乘法,建立稻米膠稠度的近紅外分析模型,以期為稻米膠稠度的快速無損檢測提供參考。
收集137份南方稻區(qū)主栽或新育成的水稻品種(組合)。
1.2.1 稻米膠稠度化學(xué)值的測定
按NY/T 83—2017《米質(zhì)測定方法》測定稻米膠稠度的化學(xué)值。準(zhǔn)確稱取經(jīng)過100目篩的精米米粉100 mg(±1 mg),加入定制的試管內(nèi),防止米粉粘在試管口壁,4次重復(fù)。用移液管加入95%乙醇麝香草酚藍(lán)溶液0.2 mL,并輕微搖動試管,使米粉充分分散而不沉淀結(jié)塊; 再加0.2 mol·L-1的KOH溶液2.0 mL,并輕輕搖動試管,勿使米粉沉淀,將試管立即放入沸水浴中加熱8 min,試管口蓋上玻璃珠,保持試管內(nèi)液面低于水浴鍋水面,且在加熱過程中米膠高度始終維持在試管長度的2/3,不應(yīng)超過或者溢出; 加熱完畢將試管取出,取下玻璃珠將試管置于試管架上靜置5~10 min后,置于冰浴冷卻20 min,然后將試管平放于米膠測定箱內(nèi)(25±2 ℃),1 h后以mm為單位測量米膠長度。
1.2.2 近紅外光譜的采集
用近紅外光譜分析儀(波通 DA7200)掃描樣品獲得近紅外漫反射光譜值,掃描波長范圍為950~1 650 nm,識別度為5 nm,環(huán)境溫度控制在25 ℃,每個樣品重復(fù)掃描4次,對光譜值進(jìn)行均值化處理。
用The Unscrambler 9.7(CAMO)分析軟件,基于偏最小二乘法(PLS)分別對校正集樣品采用不同數(shù)據(jù)預(yù)處理方式和不同波長段的近紅外光譜進(jìn)行建模。為了防止模型過擬合,采用交互檢驗確定最佳主因子數(shù)。
1.3.1 校正集樣品預(yù)處理方式的篩選
將平滑(smoothing)、 多元散射校正(multiplicative scatter correction, MSC)、 標(biāo)準(zhǔn)正態(tài)變量轉(zhuǎn)換(standard normal variate transformation, SNV)、 一階導(dǎo)數(shù)(first derivative)、 二階導(dǎo)數(shù)(second derivative)等預(yù)處理方法單獨或組合共20種預(yù)處理方式分別對原始光譜進(jìn)行處理,根據(jù)模型評價指標(biāo)確定最佳預(yù)處理方式。
1.3.2 最佳波長段的選擇
因樣品的近紅外光譜在某些波長段明顯的吸收峰,分別對這些表現(xiàn)出明顯吸收峰的波長段及其復(fù)合波長段進(jìn)行稻米膠稠度的近紅外光譜分析,通過對比各模型評價指標(biāo)確定最佳波長段。
1.3.3 模型評價指標(biāo)
以校準(zhǔn)相關(guān)系數(shù)(R)、 校準(zhǔn)標(biāo)準(zhǔn)差(SEC)、 校準(zhǔn)均方根誤差(RMSEC)、 檢驗相關(guān)系數(shù)(r)、 檢驗標(biāo)準(zhǔn)差(SECV)、 檢驗均方根誤差(RMSECV)作為衡量稻米膠稠度近紅外模型預(yù)測效果的主要指標(biāo)。模型的相關(guān)系數(shù)越接近1越好,綜合使用相對百分比偏差(relative percent deviation,RPD)進(jìn)一步對模型預(yù)測效果進(jìn)行評價。若RPD≥3,說明該模型檢測精確度高,可用于相關(guān)組分的檢測; 若2.5≤RPD<3,說明所建立的近紅外模型檢測效果一般,可用于相關(guān)組分的定量分析,但其精度需進(jìn)一步修正提高; 若RPD<2.5,則說明使用該近紅外模型進(jìn)行分析檢測比較困難[8]。
1.3.4 模型檢驗
將用于驗證集的30份樣品(不參與建模)用DA7200采集其近紅外光譜,用已經(jīng)建立的稻米膠稠度近紅外分析模型預(yù)測膠稠度,建立預(yù)測值和化學(xué)值的對比表格,計算其絕對誤差和配對t測驗的p值,以判斷該近紅外模型檢測膠稠度的可行性。
表1為校正集和驗證集稻米膠稠度的分布情況。校正集范圍為43.0~94.0 mm,平均值為71.0 mm,標(biāo)準(zhǔn)差為12.2 mm。樣本膠稠度分布范圍較廣,且驗證集兩端極值在校正集之中,保證了模型預(yù)測值的準(zhǔn)確性、 實用性。
表1 稻米膠稠度的化學(xué)值統(tǒng)計表Table 1 The chemical value of rice gel consistency
從校正集和驗證集綜合來看,由表2可知,采用平滑處理其校正集的校準(zhǔn)相關(guān)系數(shù)(R)、 校準(zhǔn)標(biāo)準(zhǔn)差(SEC)、 校準(zhǔn)均方誤差(RMSEC)分別為0.970 0,2.971 8和2.957 9; 驗證集的檢驗相關(guān)系數(shù)(r)、 檢驗標(biāo)準(zhǔn)差(SECV)、 檢驗均方根誤差(RMSECV)分別為0.964 2,3.342 1和3.227 1,相對百分比偏差RPD=3.780 5(>3),說明平滑處理的近紅外分析模型效果最佳。
表2 不同預(yù)處理方法稻米膠稠度近紅外模型的評價指標(biāo)Table 2 Evaluation indexes of NIR model of rice gel consistency under different treatments
續(xù)表2
從圖1可知校正集樣品吸收峰主要分布在950~1 100,1 100~1 300和1 300~1 650 nm,所以分別對這3個波長段及組合950~1 100,1 100~1 300,1 300~1 650,950~1 300,1 100~1 650和950~1 650 nm等6個波長段的稻米膠稠度近紅外光譜經(jīng)平滑處理后,用偏最小二乘法(PLS)建立各波長段的稻米膠稠度近紅外分析模型。由表3可知在波長段(1 100~1 650 nm)的建模效果最好,其校正集模型評價指標(biāo)R,SEC和RMSEC分別為0.969 4,3.003 0和2.989 0; 驗證集模型評價指標(biāo)r,SECV和RMSECV分別為0.963 8,3.261 1和3.245 9,相對百分比偏差(RPD)為3.758 6,吸收峰越高其相關(guān)性越大。
圖1 校正集近紅外光譜Fig.1 Near infrared spectra of the calibration samples
表3 稻米膠稠度在不同波長段近紅外分析模型的評價指標(biāo)Table 3 Evaluation Indexes of near infrared analysis models of rice gel consistency at different wavelength bands
通過軟件分析,如圖2,圖3,剔除殘差高的11個異常樣品后模型評價指標(biāo)進(jìn)一步提高,校正集評價指標(biāo)R,SEC和RMSEC分別為0.979 0,2.540 6和2.527 3; 驗證集的評價參數(shù)r,SECV和RMSECV分別為0.974 1,2.820 6和2.805 8,RPD為4.419 4,提高了模型的準(zhǔn)確性。
圖2 稻米膠稠度近紅外分析的殘差和杠桿值Fig.2 The leverage and residual of rice gelconsistency by near infrared analysis
圖3 稻米膠稠度建立的回歸模型預(yù)測值與其化學(xué)值的相關(guān)性圖
用DA7200收集30份驗證集樣品的近紅外光譜值,用新建立的稻米膠稠度近紅外模型檢測其膠稠度,并將稻米膠稠度的化學(xué)值與近紅外光譜檢測值進(jìn)行對比分析,結(jié)果如表4,其絕對誤差范圍在0.198 6~6.502 4 mm,均符合GB/T 22294—2008 《大米膠稠度的測定》誤差標(biāo)準(zhǔn),膠稠度40~60 mm時誤差不超過5 mm,膠稠度大于60 mm時誤差不超過7 mm。
對驗證集稻米膠稠度近紅外檢測值和化學(xué)測定值進(jìn)行配對t檢驗,結(jié)果如表5,p值為0.726>0.05,表明用此近紅外模型檢測和化學(xué)方法分析得到的結(jié)果無顯著差異,即用此新建的近紅外模型檢測稻米膠稠度是可靠的。
表4 驗證集模型預(yù)測值與化學(xué)測定值Table 4 Predicted value and chemical value of validation set
表5 驗證集稻米膠稠度的模型檢測值和化學(xué)測定值的配對t檢驗Table 5 Paired t test of model prediction value and chemical value of rice gel consistency in validation set
用DA7200掃描獲得了137份南方稻區(qū)稻米的近紅外漫反射光譜,樣品膠稠度范圍為43.0~94.0 mm,覆蓋了大部份稻米膠稠度范圍。采用偏最小二乘法(PLS)分別經(jīng)20種預(yù)處理方式和6組波長段下建立近紅外分析模型。根據(jù)模型評價指標(biāo)判斷最佳預(yù)處理方式為平滑處理,最佳建模波長段為1 100~1 650 nm。對經(jīng)過平滑預(yù)處理的1 100~1 650 nm波長段建立的近紅外分析模型進(jìn)行參數(shù)評價,校正集的R,SEC和RMSEC分別為0.979 0,2.540 6和2.527 3,驗證集的r,SECV,RMSECV和RPD分別為0.974 1,2.820 6,2.805 8和4.419 4,模型參數(shù)較優(yōu)。用新建的近紅外模型對30份驗證集樣品(未參與建模)進(jìn)行檢測,與化學(xué)值進(jìn)行配對t檢驗,近紅外檢測值與化學(xué)值絕對誤差在0.198 6~6.502 4 mm,配對t檢驗p=0.726(>0.05),表明此近紅外分析模型可用于稻米膠稠度的檢測。與同組分的其他研究結(jié)果相比[2],此近紅外分析模型檢測效果更佳,其建模評價指標(biāo)和外部驗證結(jié)果都更優(yōu),能用于稻米膠稠度的分析檢測,并能為今后稻米膠稠度的近紅外分析的相關(guān)研究提供理論參考。
近紅外光譜分析在農(nóng)業(yè)領(lǐng)域的研究及應(yīng)用還有待加強。為了提高模型的準(zhǔn)確性,采用了20種不同的預(yù)處理方式和6組波長段處理,發(fā)現(xiàn)經(jīng)平滑處理的1 100~1 650 nm波長段建立的近紅外分析模型效果最佳,且經(jīng)驗證表明此模型可用于稻米膠稠度的分析檢測。是否還有更好的預(yù)處理方法? 是否在其他波長段包含更多的膠稠度信息? 是否其他建模方法建立的模型更精確? 這些有待進(jìn)一步探索。因此,為了獲得更準(zhǔn)確的近紅外分析模型,(1)可以嘗試足夠多的光譜預(yù)處理方法或者開發(fā)新的預(yù)處理方法以減少光譜的影響因素; (2)可考慮用不同的回歸分析模型進(jìn)行建模以選擇更優(yōu)的建模方法。