張 銘,王文芳,郜一川,吳悅菊,王國英
(河北農(nóng)業(yè)大學(xué) 園藝學(xué)院/河北省梨工程技術(shù)研究中心, 河北 保定 071000)
果實品質(zhì)是果實重要的經(jīng)濟性狀,提高果實品質(zhì)是果樹栽培和育種工作的重要方向[1]。果實中的糖是果面顏色和風(fēng)味物質(zhì)合成的基礎(chǔ)原料,糖代謝和積累是影響果實品質(zhì)和生長發(fā)育的重要因素[2]。果實積累的糖主要為果糖、葡萄糖和蔗糖[3]。傳統(tǒng)梨可溶性糖含量測定方法有3,5-二硝基水楊酸比色法[4]、蒽酮比色法[5]和高效液相色譜法[6]等,這些方法雖然精準(zhǔn)度高,但在梨果的處理過程中存在檢測速度慢和檢測成本高的問題,其過程需要大量的人工和化學(xué)藥劑,且梨果會有損壞[7]。
光譜分析技術(shù)是一類新型的定性、定量分析技術(shù),具有無破壞性、成本低、高效節(jié)能、簡單快速和綠色環(huán)保等優(yōu)點,目前已廣泛應(yīng)用于農(nóng)、林、牧、漁等領(lǐng)域[8-10]。Sinelli N 闡明了光譜技術(shù)可以無損檢測藍莓中糖和水的含量[11]。Guoqiang[12]、劉燕德[13]研究表明光譜技術(shù)可以準(zhǔn)確、快速、無損檢測蘋果可溶性固形物含量。郭俊先等利用高光譜成像技術(shù)掃描新疆冰糖心紅富士并鑒別出水心病果,通過機器學(xué)習(xí)建立相關(guān)光譜模型,其校正集和預(yù)測集均高于80%,研究結(jié)果表明光譜成像技術(shù)可以無損檢測出紅富士水心病果[14]。何嘉琳等建立了測定靈武長棗VC含量的最佳預(yù)測模型,較準(zhǔn)確的預(yù)測靈武長棗VC含量[15]。胡潤文通過近紅外光譜掃描臍橙果面,采用機器學(xué)習(xí)建立了臍橙糖酸比近紅外光譜的預(yù)測模型,結(jié)果表明通過近紅外光譜技術(shù)可以無損檢測臍橙可溶性糖含量[16]。綜上所述,光譜技術(shù)可以準(zhǔn)確檢測每個像素點的光譜數(shù)據(jù),為無損檢測梨可溶性糖含量提供技術(shù)支持。
本研究利用光譜儀對梨果實進行掃描,并將所得光譜數(shù)據(jù)與通過蒽酮比色法測得的梨可溶性糖含量進行統(tǒng)計學(xué)關(guān)聯(lián)分析,建立梨果實可溶性糖含量的光譜預(yù)測模型,實現(xiàn)基于光譜分析技術(shù)建立的準(zhǔn)確、高效、無損、低成本的梨果實可溶性糖含量測定。
本試驗在河北省威縣龍集梨園進行,選取7 年生‘新梨7 號’,株行距1 m ×4 m。試驗采用五點取樣法選取梨樹,每個點選取樹勢相近的5 棵樹,于果實成熟期在每棵試驗樹正東和正西方向分別挑選2 個形狀相近、大小均勻且完好無損的‘新梨7 號’果實,共50 個試驗樣品,其中40 個梨果為訓(xùn)練集用于建立模型,10 個梨果為測試集用于檢驗?zāi)P?,?xùn)練集和測試集比例為4 ∶1。采后當(dāng)天將樣品送至實驗室并放置于4 ℃冰箱中保存。
室內(nèi)分析試驗主要在河北省梨工程技術(shù)研究中心實驗室進行。
光譜采集裝置所用光纖光譜儀為便攜式地物光譜儀(丹麥,PSR-1100),其波長范圍在320 ~1 100 nm,在左端與光譜儀呈60°的方向裝鹵鎢燈(12V、100W),采用直流穩(wěn)壓電源供電,且電壓和電流可調(diào),計算機與檢測探頭間使用1 000 μm ×2 m 光纖連接,探頭位于傳送線正上方。如圖1所示。
圖1 用于梨可溶性糖含量測定的光譜掃描系統(tǒng)Fig. 1 Spectral scanning system for determination of soluble sugar content in pears
1.2.1 光譜數(shù)據(jù)采集 光譜測量在室溫(25±1)℃下進行,將探頭垂直向下,由于光譜儀掃描范圍為左右45°,故為保證掃描果實面積達到90%以上,將升降臺高度設(shè)置為40 cm,利用光譜設(shè)備隨機掃描梨果面3 次,每面重復(fù)3 次,取平均值作為該樣本的光譜反射率,在每次測量前用白板進行校正。
1.2.2 光譜數(shù)據(jù)的預(yù)處理 采用SG 平滑濾波法,通過最小二乘原理的多項式平滑算法進行平滑去噪,并將去除噪音后的光譜信號進行了頻譜分析,獲得無噪音無雜波可利用的光譜圖像。SNV 標(biāo)準(zhǔn)正態(tài)化方法主要用來消除光譜信號的變異,過濾試驗中光程的變化對光譜信號的影響,消除散射現(xiàn)象,從而進行光譜數(shù)據(jù)歸一化、準(zhǔn)確化、中心化處理。OSC正交信號校正方法可將被測品質(zhì)之外的所有信息濾除[17],從而使得光譜曲線更加光滑、整齊、緊密,準(zhǔn)確性顯著提升,計算公式如下:
1.2.3 降維分析 本試驗采用主成分分析法(PCA)和連續(xù)投影算法(SPA),分別對光譜圖像進行高緯度特征數(shù)據(jù)降維分析。主成分分析濾除光譜圖像中重復(fù)的變量和多種多余的變量,從而建立數(shù)量相對少的新變量,使得建立的新變量之間無緊密關(guān)系,新變量在反映光譜信號時依舊保持原有的重要光譜信息[18]。利用主成分分析可以將大量的原始變量用數(shù)量最少的新變量代替,從而降低復(fù)雜程度提高光譜數(shù)據(jù)的準(zhǔn)確性。連續(xù)投影算法是對原始波段進行精確篩選,選取出具有代表性的光譜特征波段,將特征波段的波長信息進行投影從而代替全波段,該算法可有效消除原始波段中多余的信息。
1.2.4 預(yù)測模型建立 本研究采用多元線性回歸(MLR)、偏最小二乘法(PLSR)和支持向量機回歸(SVR)建立梨可溶性糖含量的預(yù)測模型。多元線性回歸(MLR)就是多種自變量和一種因變量的線性關(guān)系;偏最小二乘法(PLSR)是一種多元數(shù)據(jù)處理分析方法,可以解決多重線性回歸問題[19];支持向量機回歸(SVR)可以擬合多種數(shù)據(jù),使數(shù)據(jù)更具有代表性,從而提高圖像數(shù)據(jù)的精確度[20]。最終將梨可溶性糖含量的最終預(yù)測模型通過R2和RMSE 進行評判。計算公式如下:
梨樣品的可溶性糖含量采用分光光度計(UV5500 型紫外可見分光光度計,上海元析儀器有限公司)測量,其波長范圍在190 ~ 1 100 nm,光譜波帶在2 nm,波長準(zhǔn)確度在±0.5 nm。為提高機械測量準(zhǔn)確度應(yīng)在測量前預(yù)熱30 min。
按照每個采集光譜果面的中心位作為采樣部位,用水果刀在每個部位的梨果赤道處切取長度、寬度和深度均為3 cm 的樣品,切取后進行混樣,并在混樣中稱取0.3 g 果肉(果肉不帶果皮)于研缽中研磨,待研磨均勻后轉(zhuǎn)入10 mL 離心管中,加入10 mL 蒸餾水,用塑料薄膜封口置于沸水中,水浴30 min 后取出,放置室溫后提取上清液,過濾到25 mL 容量瓶中,并用蒸餾水定容作為提取液。吸取0.5 mL 提取液于20 mL 試管中,加入1.5 mL 蒸餾水,按順序依次向試管中加入0.5 mL 蒽酮乙酸乙酯試劑和 5 mL 濃硫酸,充分震蕩均勻后立即放入沸水中,水浴1 min 后取出冷卻至室溫,以空白作為參照,在630 nm 波長下測量光密度。
采 用Microsoft Excel 2010 整 理 數(shù) 據(jù), 使 用Matlab、SPSS 22.0 和Unscrambler X10.4 進行數(shù)據(jù)分析,采用Origin 2020 作圖。
使用蒽酮比色法測得梨可溶性糖含量數(shù)據(jù)如表1 所示。訓(xùn)練集中所測40 個梨樣品可溶性糖含量的平均值為50.89 g/kg,測試集中所測10 個梨樣品中可溶性糖含量的平均值為49.36 g/kg,訓(xùn)練集的梨可溶性糖含量范圍大于測試集,測試集在訓(xùn)練集范圍內(nèi),能夠有效實現(xiàn)預(yù)測。
表1 訓(xùn)練集與測試集梨可溶性糖含量Table 1 Soluble sugar content of pear in training set and test set
圖2a 為原始光譜數(shù)據(jù),圖2b 為SG 平滑濾波對原始數(shù)據(jù)的噪音進行去噪處理后的圖像,通過該方法可以消除外界干擾,獲得可利用的光譜數(shù)據(jù),因試驗過程中光譜噪音較小,經(jīng)SG 平滑濾波處理后與原始光譜數(shù)據(jù)差異較小。圖2c 為使用SNV 標(biāo)準(zhǔn)歸一化預(yù)處理光譜圖像,通過該方法對光譜樣本中差異較大的光譜反射率進行校正處理,可以有效消除圖像表面散射問題,獲得標(biāo)準(zhǔn)歸一化的光譜圖像。圖2d 為原始光譜經(jīng)過SG 平滑濾波后又經(jīng)過SNV 標(biāo)準(zhǔn)歸一化的光譜預(yù)處理數(shù)據(jù),通過這2 種方法的疊加既可以濾除外界噪聲對圖像的干擾又可以對光譜圖像各個光程進行歸一校正。圖2e 為OSC正交信號校正法,利用該方法過濾掉與可溶性糖含量無關(guān)的光譜信號且消除散射的影響。
圖2 梨可溶性糖含量的光譜圖Fig. 2 Images of detecting soluble sugar content of pear based on spectroscopic technique
2.3.1 主成分分析 利用主成分分析法,將781 個變量用占有原始變量不足1%的綜合變量代替,降低了模型的運算難度,提高了模型精確度和運行速度。其中4 種方法所提取主成分的累計貢獻率如表2 所示。
表2 不同方法提取主成分累計貢獻率Table 2 Cumulative contribution rate of Principal components analysis by different methods
2.3.2 連續(xù)投影算法 基于SG 平滑濾波預(yù)處理后的數(shù)據(jù)選取了505、657、682、1 071 nm 4 個特征波段,基于SNV 預(yù)處理后光譜數(shù)據(jù)選取了354、529、657、741、863、966、1 033、1 036、1 041、1 069 nm 10 個特征波段,基于SG 平滑濾波與SNV后預(yù)處理數(shù)據(jù)利用連續(xù)投影算法選取了351、528、586、657、741、813、864、966、1 031、1 053、 1 066、1 069 nm 12 個特征波段?;贠SC 預(yù)處理數(shù)據(jù)的連續(xù)投影算法提取了476、670、892、948、1 062 nm 5 個特征波段。
本研究利用多元線性回歸(MLR)、偏最小二乘法(PLSR)和支持向量機回歸(SVR)建模方法建立了梨可溶性糖含量的預(yù)測模型,通過3 種建模方法分別建立了基于SG 平滑預(yù)處理、SNV 標(biāo)準(zhǔn)正態(tài)變化預(yù)處理、SG 平滑濾波+SNV 標(biāo)準(zhǔn)正態(tài)變量以及OSC 正交信號校正結(jié)合主成分分析(PCA)與連續(xù)投影算法(SPA)的預(yù)測模型。其預(yù)測模型的可決系數(shù)(RC2)和標(biāo)準(zhǔn)誤差(RMSE)如表3 所示。
表3 梨可溶性糖含量與光譜數(shù)據(jù)不同的預(yù)處理建模Table 3 pretreatment modeling of pear soluble sugar content and spectral data
根據(jù)不同方法所建立的預(yù)測模型,最終選取OSC+PCA+SVR 建 立 模 型,此 模 型 的RC2=0.85,RMSE=2.21。 另 取10 個 梨 作 為 測 試 集 帶 入OSC+PCA+SVR 的非線性回歸中進行模型驗證,測試集=0.78,RMSE=1.48?;谡恍盘栃U∣SC)和主成分分析法(PCA)結(jié)合支持向量機回歸(SVR)預(yù)處理后建立的模型擬合圖,如圖3 所示。
圖3 梨可溶性糖含量的化學(xué)實測值與模型預(yù)測值的擬合 效果圖Fig. 3 fitting effect of chemical measured value and model predicted value of soluble sugar content in Pear
本研究應(yīng)用光譜技術(shù)對梨可溶性糖含量進行預(yù)測,通過理化試驗建立可溶性糖含量與光譜數(shù)據(jù)的機器學(xué)習(xí)模型,該方法可以快速、便捷、無損測定梨可溶性糖含量。本試驗供試品種為‘新梨7 號’,所建模型可能僅適用于‘新梨7 號’可溶性糖含量的檢測,不能代替其他品種可溶性糖含量的估測模型,故今后還應(yīng)在不同品種進行驗證。盛曉慧[21]等通過近紅外光譜技術(shù)檢測庫爾勒香梨可溶性糖含量同樣發(fā)現(xiàn),該方法可能僅限于庫爾勒香梨可溶性糖含量的無損檢測。王銘海[22]等通過對成熟期內(nèi)碭山酥梨可溶性固形物含量的測定結(jié)合近紅外漫反射光譜技術(shù)建立算法模型,該模型在可滴定酸含量和VC含量的無損檢測應(yīng)用中還有待驗證,與本研究結(jié)果相符。
本研究利用主成分分析(PCA)方法對預(yù)處理后的數(shù)據(jù)進行降維處理,將原始變量的781 波段用10 個主成分代替,僅以不到1%原始變量代替所有原始變量,其累計貢獻率達到99.559%,極大的降低了模型的復(fù)雜度,從而使所得光譜數(shù)據(jù)更具有代表性。采用正交信號校正法(OSC)過濾掉與可溶性糖含量無關(guān)的光譜信號且消除散射的影響,在經(jīng)過主成分分析(PCA)降維處理和支持向量機回歸(SVR)可以擬合多種數(shù)據(jù),使得模型更為準(zhǔn)確,最終獲得最佳的可溶性糖估測模型OSC+PCA+SVR,該 模 型RC2 達 到0.85,RMSE 為2.21,Rv2達到0.78,RMSE 為1.48。
綜上所述,采用光譜技術(shù)掃描梨果和適當(dāng)?shù)闹鞒煞趾Y選與建模技術(shù),可以較為準(zhǔn)確地測定梨可溶性糖含量,為梨可溶性糖含量的實時監(jiān)測提供依據(jù),為梨果分級分裝設(shè)備的研發(fā)及應(yīng)用提供技術(shù)支持,通過該方法可以更加省時省力、高效便捷和低成本測得梨可溶性糖含量。因此該模型的建立在園藝產(chǎn)品品質(zhì)檢測方面有廣闊的應(yīng)用前景,為未來光譜技術(shù)與梨可溶性糖含量模型的建立也提供了重要參考。