余懷鑫, 潘新星,朱旭, 葉子凡,祝志慧,劉繼紅
1.華中農業(yè)大學工學院,武漢430070;2.浠水縣長福水稻專業(yè)合作社,浠水 438200;3.華中農業(yè)大學園藝林學學院,武漢 430070
含水率是衡量柑橘品質的重要指標之一,水分豐富的柑橘更受市場青睞。溫州蜜柑是我國柑橘栽培的重要鮮食品種,至今已有2 400多年的栽培歷史,果肉及果汁具有解熱生津、開胃、利尿、祛痰止咳的功效,橘皮及絡可做中藥,具有很大的經濟價值。目前對溫州蜜柑等水果的外部品質檢測方法主要有光電分選法,通常用于外部品質的分級,通過分析水果外部的特征以大小、顏色、缺陷等作為分選的依據。而內部品質的檢測方法還不成熟,主要有人工試吃和通過化學實驗進行分析兩種,前者存在很強的主觀性,后者檢測時間長、成本高且為有損檢測[1],無法滿足溫州蜜柑含水率無損檢測和實現(xiàn)品質的快速評定分級的需求,給消費者帶來了極大的不便。因此,對溫州蜜柑含水率進行快速無損檢測具有重要意義。
近些年來,光譜技術的出現(xiàn)為無損檢測提供了良好的手段,可以進行定量和定性檢測[2-3]。許多學者利用可見/近紅外光譜對柑橘品質進行了無損檢測,主要的研究指標為柑橘的可溶性固形物、糖度、酸度以及維生素C含量等[4-8],對柑橘水分研究甚少。但也有學者通過高光譜/近紅外光譜對梨[9]、黑寶石李[10]和南疆紅棗[11]等進行了水分無損檢測,均取得了較好的效果。光譜技術作為一種新興的無損檢測技術,具有效率高、成本低且易于實現(xiàn)自動化生產的特點[12]。本研究利用光譜技術對溫州蜜柑的含水率進行研究,旨在考察基于光譜技術檢測溫州蜜柑含水率的可行性。
2019年11月份從湖北省武漢市農業(yè)科學院林業(yè)果樹研究所采摘的新鮮溫州蜜柑樣本40個,樣本的最大橫向直徑45~60 mm、質量為60~120 g/個。將樣本用抹布清理掉表面污漬,置于常溫下、通風處儲存,讓其自然風干。每2 d采集1次透射光譜,并用精度為1 mg的電子天平稱質量,共采集10次,最后用蘇珀電熱恒溫鼓風干燥箱進行脫水,根據GB 5009.3―2016方法測定40個樣本在試驗過程中的含水率,共得到400組數(shù)據。測量過程如下:用精度為1 mg的電子天平對試驗當天的樣本稱質量并記錄,待到19 d試驗結束后,將全部樣本放入烘干箱中以105 ℃烘干72 h,再記錄烘干后樣本的質量。含水率=(初始質量-烘干后質量)/初始質量×100%。
采用如圖1所示的光譜采集暗箱,暗箱上端1處安裝光譜采集探頭,與電腦相連,下部中間位置安裝光源,由于需要采集透射光譜,而柑橘果皮厚度不一,故要選用穿透性強、能量強度高的光源。本次光源選用的是MR16鹵素燈,鹵素燈與水平面垂直朝向中央采集窗口。由于MR16鹵素燈功率大、溫度高,導致暗箱內部散熱差,易使設備老化,故在暗箱下端兩側安裝散熱風扇進行散熱。光譜儀采用的是海洋光學的Maya2000pro光譜儀,光譜儀參數(shù)設置:掃描范圍為200~1 100 nm,平滑次數(shù)為5,積分時間為100 ms,得到的每條光譜含有2 068個變量。
1.光纖探頭 Optical fiber probe; 2.取物口 Sampling port; 3.樣本放置口 Sample placing port; 4.散熱風扇 Cooling fan; 5.光源 Light source; 6.電腦 Computer.
圖2為使用Maya2000pro光譜儀采集同一個樣本的果肉和完整果實的透射光譜。由圖2可知,果肉的透過率比完整果實透過率高,是因為果皮的存在導致的。果肉和完整果實光譜圖在680、720、780 nm處均出現(xiàn)峰值,光譜相似度較高。隨著柑橘的逐漸成熟,葉綠素會逐漸轉化為類胡蘿卜素與類黃酮,這也是柑橘表皮顏色出現(xiàn)變化的原因,在400~700 nm這一部分主要是受到葉綠素的影響,而在700~800 nm之間出現(xiàn)高吸收峰則是由類胡蘿卜素造成的,這也是完整果實的透射光譜吸收強度遠比果肉大的原因。由于需要進行無損檢測,因此相比其果肉,選擇完整果實的透射光譜進行建模是可行的。
圖2 樣本完整果實和果肉的透射光譜圖
在未進行試驗前,溫州蜜柑的含水率無法得知,由于是同一批采摘的蜜柑,其含水率差異不大,為了擴大試驗樣本的含水率范圍,采用常溫保存讓其自動失水的方法。每隔2 d測量溫州蜜柑的質量,得到其含水率均值變化趨勢(圖3)。由圖3可知,隨著時間的變化,溫州蜜柑的水分含量不斷減少,且40個樣本的含水率變化趨勢大致相同,表明在該試驗條件下該批柑橘的變化趨勢一致。當進行第10次采集時,即試驗進行至第19天時,柑橘表皮已經出現(xiàn)了明顯的硬化,表明柑橘在試驗期間散失了一定水分,從試驗結果來看,水分平均散失了4~5個百分點,水分梯度也進一步擴大,表明通過常溫儲存的方法擴大含水率梯度是可行的。在蜜柑貯存過程中存在呼吸作用等影響內部變化的因素,會造成蜜柑質量的變化,但對質量影響最大的還是水分,其他物質如糖、酸、類黃酮等含量變化較小,因此不考慮其對含水率測量結果的影響。
圖3 溫州蜜柑水分隨時間變化
1)光譜預處理。由于儀器對于外界環(huán)境的變化比較敏感,采集到的光譜中會含有部分的噪聲信息,采用合適的預處理方法能夠有效地消除噪聲及特定物理因素的干擾,確保光譜信息的準確性[13]。因此,將無預處理和SD、MSC/SNV、SG平滑、標準化5種預處理方法根據不同預處理的作用按照表1進行排列組合(其中0表示不進行預處理),共得到2×3×2×2=24種預處理方式,用數(shù)字1~24對所有組合進行編號,最后根據預處理后建立的PLS模型的建模效果,得到較優(yōu)的預處理方法。
表1 預處理方法 Table 1 Pretreatment methods
2)光譜特征波長選擇。采集的光譜波段為200~1 100 nm,光譜范圍較寬、波段數(shù)目較多(2 068維),部分波段存在較強的相關性,原始光譜除了包含反映內部成分差異的信息外還含有大量冗余信息,分類時可能會產生“維數(shù)災難”現(xiàn)象[14],且會影響分類的精度。因此降維就顯得十分必要,本研究采用CARS來篩選特征波長以達到降維目的。競爭性自適應重加權采樣算法(CARS)采用“適者生存”法則,利用蒙特卡羅采樣(MCS)法采樣N次,對比每次產生的PLS回歸模型的交互驗證均方差值(root mean square error of cross validation,RMSECV),RMSECV值最小的那個模型所對應的變量子集被選為最優(yōu)變量子集[15]。
PLS分析是一種新型的多元數(shù)據分析方法,通過投影將預測變量和觀測變量投影到一個新的空間之中以尋找一個線性回歸的模型,集主成分分析、典型相關分析以及多元線性回歸于一身,因此被廣泛應用于多種分析統(tǒng)計領域。BP神經網絡主要由輸入層、隱含層和輸出層組成,輸入層的每個節(jié)點對應一個自變量,輸出層的每個節(jié)點對應1個應變量,而各層的節(jié)點數(shù)則代表了該模型的訓練效果。當節(jié)點越多,得到的信息會越全面,但訓練時間也會隨之延長。LSSVM采用最小二乘線性系統(tǒng)作為損失函數(shù),替代傳統(tǒng)的支持向量機所用的二次規(guī)劃方法,簡化了計算的復雜性,是一種可以同時處理線性和非線性信息的建模方法[16]。
本研究將柑橘的含水率測量值作為因變量,光譜的波長值作為自變量,建立PLS、BP以及LSSVM模型。建立模型的好壞由訓練集相關系數(shù)(Rc)、訓練集均方根誤差(RMSEC)、測試集相關系數(shù)(Rp)以及測試集均方根誤差(RMSEP)決定,其中相關系數(shù)越接近1,均方根誤差越小,模型的效果就越好,上述計算均由MATLAB 2014a完成。
將試驗得到的400個溫州蜜柑樣本的初始可見/近紅外光譜通過馬氏距離法剔除異常樣本,如圖4所示,位于綠色實線上方的樣本被當做異常樣本剔除,共23個。為了將差異性大的樣本劃入訓練集中,保證訓練集的樣本具有較強的代表性,采用Kennard-Stone算法[17]以3∶1劃分校正集和驗證集,并將24種排列組合預處理后的光譜建立基于含水率的PLS模型,得到的建模結果如圖5所示。
圖4 馬氏距離法剔除異常樣本
從圖5可知,當采用FD(編號13~24)后,訓練集相關系數(shù)較高,測試集相關系數(shù)較低,出現(xiàn)了過擬合現(xiàn)象。通過對比相關系數(shù)(越大越好)和均方根誤差(越小越好)可以發(fā)現(xiàn),相較于第1組(無預處理),2~12組建模結果均有所提升,表明有效的預處理可以去除外界干擾信息,提高建模效果,其中建模效果最好的是第5組,采用的預處理方式為SNV。
圖5 24種不同預處理組合方式下的PLS建模結果
本研究采用的特征波長的提取方法為CARS,采樣次數(shù)設定為50次,交叉驗證設定為5次,以建立LSSVM為例,特征波長提取的過程如圖6所示,其中橫坐標均為采樣次數(shù)。從圖6A可以看出,選用的變量數(shù)先急劇減少后趨于穩(wěn)定,這是指數(shù)衰減函數(shù)造成的;圖6B表示RMSECV值的變化情況,在采樣第7次時為最小值,表明采樣第7次時剔除后剩余的波長點與溫州蜜柑含水率相關性較大;圖6C中各線是隨著采樣次數(shù)的增加回歸系數(shù)的變化,圖6中的“*”線為RMSECV最小值處,與圖6B相對應,利用CARS算法進行多次篩選后最終確定第7次篩選出的359個特征波長變量作為最終入選的特征值。經過CARS處理后可以極大地減少參與建模的波數(shù),提高建模效率。
圖6 CARS篩選特征波長過程
將經過SNV預處理后的光譜利用CARS算法提取特征波長,分別建立PLS模型、BP神經網絡模型以及LSSVM模型。BP神經網絡模型選用LM函數(shù)作為訓練函數(shù),并確定隱含層節(jié)點個數(shù)為10;LSSVM模型中選用徑向基函數(shù)(RBF)作為核函數(shù),因其能夠實現(xiàn)非線性映射,且相比于多項式核函數(shù)它所需參數(shù)較少,模型復雜程度較低,計算速度較快。核函數(shù)參數(shù)為100,懲罰因子為30,3個模型的建模結果如表2所示。
表2 基于CARS的不同模型建模結果 Table 2 Modeling results of different models based on CARS
由表2可知,效果最佳的是經過CARS提取特征波長后建立的LSSVM模型,經過CARS篩選后參與建模的波數(shù)由2 068個減少為359個,僅占原始波數(shù)的17.36%,提高了模型的運算效率,該模型的校正集相關系數(shù)和均方根誤差分別為0.937 5和0.008 6,驗證集相關系數(shù)和均方根誤差分別為0.831 6和0.012 0。圖7是LSSVM含水率預測模型效果圖,表明利用SNV+CARS+LSSVM檢測溫州蜜柑水分是可行的。
圖7 LSSVM含水率預測模型
水分作為柑橘品質的一項重要指標,對采收后柑橘的貯存和加工具有重要的意義。前人對柑橘品質檢測的研究重點集中在糖度、酸度、維生素C等營養(yǎng)物質方面,對水分的研究大都集中在柑橘種植期的水分供給方面。本試驗對溫州蜜柑進行了水分檢測,得到的測試集相關系數(shù)為0.831 6,與文獻[18]預測砂糖橘水分結果相近,但相比其0.82~0.87的水分梯度[18],本試驗通過自然貯存的方式將含水率梯度擴大到了0.73~0.85,提高了模型的適應性,且能夠滿足蜜柑水分的檢測要求,為便攜式儀器的開發(fā)提供了理論基礎。后續(xù)研究可以將不同品種、種植區(qū)域的蜜柑進行試驗,并比較不同成熟期蜜柑的水分差異性,實現(xiàn)對不同成熟期柑橘的預測,探究通過控制烘干時長來進一步擴大含水率范圍,并改進光譜特征提取方法以及建模方法來進一步提高模型的準確性和適應性。同時可以探究不同貯藏期水分含量的變化趨勢,便于根據水分信息合理安排柑橘的貯藏條件與時間,有利于提高整體經濟效益。