周芳,高麗,陳嘉,葉發(fā)銀,趙國華,2,3*
1(西南大學(xué) 食品科學(xué)學(xué)院,重慶,400715) 2(重慶市甘薯工程技術(shù)研究中心,重慶,400715) 3(重慶市農(nóng)產(chǎn)品加工技術(shù)重點(diǎn)實(shí)驗(yàn)室,重慶,400715)
甘薯[Ipomoeabatatas(L.) Lam.],是一年生或多年生蔓生草本植物,16世紀(jì)末傳入中國,至今已有400多年的種植歷史[1]。我國是甘薯種植與消費(fèi)生產(chǎn)大國,根據(jù)世界糧農(nóng)組織統(tǒng)計(jì),2017年我國甘薯種植面積約3.36×106hm2,約占世界甘薯種植面積的36.5%;產(chǎn)量為7.2×107t,約占世界總產(chǎn)量的63.6%。甘薯是重要的糧食、飼料、工業(yè)原料[2],營養(yǎng)豐富,除含有大量的淀粉、膳食纖維、維生素和礦物質(zhì)[3]以外,還含有豐富的β-胡蘿卜素、抗壞血酸、葉酸、脫氫表雄酮和糖蛋白等生理活性物質(zhì)[4],對(duì)改善視力、提高免疫力、預(yù)防骨質(zhì)疏松、防止動(dòng)脈硬化等均有一定的作用[5],是營養(yǎng)均衡的保健食品。
甘薯中含有豐富的β-胡蘿卜素。β-胡蘿卜素屬于異戊二烯構(gòu)成的多烯類化合物,是一種維生素A原,在刺激組織分化、預(yù)防夜盲癥和癌癥等方面有重要意義,是甘薯營養(yǎng)品質(zhì)重要的物質(zhì)基礎(chǔ)和評(píng)定依據(jù),也是甘薯種植、食品營養(yǎng)強(qiáng)化與開發(fā)利用的重要對(duì)象[6-7]。目前甘薯中β-胡蘿卜素含量測定常用的方法有溶劑萃取比色法[8]、高效液相色譜法[9]等。常用的檢測方法需對(duì)樣品進(jìn)行化學(xué)處理,操作繁瑣、成本高、費(fèi)時(shí)費(fèi)力,不能滿足大樣本容量的品質(zhì)分析和種質(zhì)篩選要求,因此,開發(fā)一種快速、簡便、可靠且不需要太多化學(xué)處理的新型檢測方法意義重大。
手機(jī)數(shù)字圖像比色法是基于數(shù)字圖像比色法之上的一種更加便捷的新型檢測技術(shù),主要是利用朗伯-比爾定律,即有色溶液的顏色深度(色度)與溶液濃度成正比,將數(shù)碼相機(jī)或手機(jī)與化學(xué)顯色檢驗(yàn)結(jié)合起來的定性定量分析方法[10]。目前已用于食品成分分析[11-13]、摻假檢測[14]、酶活性檢測[15]、食品腐敗監(jiān)控[16]、生物醫(yī)學(xué)[17-19]、化學(xué)[20]、農(nóng)業(yè)[21-23]及環(huán)境[24-25]等多個(gè)領(lǐng)域中。有研究表明甘薯塊根顏色與甘薯圖像的RGB值有相關(guān)性[26],但基于手機(jī)數(shù)字圖像比色法的甘薯β-胡蘿卜素含量檢測方法研究尚未見報(bào)道。本實(shí)驗(yàn)利用智能手機(jī)采集甘薯切片的圖像,通過軟件提取圖像信息,結(jié)合化學(xué)計(jì)量學(xué)方法建立新鮮甘薯β-胡蘿卜素含量的預(yù)測模型,以期為甘薯品質(zhì)分析、種質(zhì)篩選及甘薯加工企業(yè)品質(zhì)控制提供新思路。
材料:甘薯,由重慶市甘薯工程技術(shù)研究中心提供,選取大小一致、表面光滑、無病蟲害的不同品系甘薯,共計(jì)90份樣品。將甘薯表面泥土清洗干凈,室溫下晾干其表面水分并編號(hào),儲(chǔ)存于(15±2)℃?zhèn)溆谩?/p>
試劑:丙酮,成都市科龍化工試劑廠。
TGL-16G離心機(jī),上海安亭科學(xué)儀器廠;AQ-180E粉碎機(jī),慈溪市耐歐電器有限公司;iPhone 6s智能手機(jī),美國蘋果公司;UV-2450紫外可見分光光度計(jì),日本島津公司;QL-866漩渦混合器,海門市齊林貝爾儀器制造有限公司。
1.3.1 手機(jī)拍照及顏色值采集
甘薯樣品從中心橫向一切兩半,一半用于甘薯化學(xué)法成分測定,另一半進(jìn)行切片,切片厚度約2 mm,用于手機(jī)拍照及顏色值(RGB值)采集。將切好的甘薯切片放入自制的拍照裝置(圖1)中進(jìn)行拍照。拍照裝置為正方體木箱,箱內(nèi)背景為黑色毛氈,頂部開5 mm圓孔用于手機(jī)拍照,采用25 W白色日光燈作為光源。拍照采用手動(dòng)專業(yè)模型,偏中心平均測光,光圈、快門時(shí)長等參數(shù)在拍攝時(shí)均保持一致,圖像保存為jpg格式。部分樣品切片照片見圖2-a。
圖1 手機(jī)數(shù)字圖像采集裝置Fig.1 Mobile phone digital image acquisition device
圖2 部分甘薯樣品切片照片及對(duì)應(yīng)輪廓Fig.2 Images and corresponding outlines of some sweet potato slices
照片的紅(R)、綠(G)、藍(lán)(B)值提取采用Matlab 2016a(美國MathWorks公司)軟件Image Processing Toolbox工具箱,首先選擇合適的閾值對(duì)照片進(jìn)行二值化(image binarization)處理,然后根據(jù)二值化的圖像獲取甘薯切片的輪廓(見圖2-b)。分別提取切片輪廓區(qū)域內(nèi)圖像R、G、B通道的均值,每個(gè)樣品進(jìn)行3次切片及拍照,最終樣品的顏色特征值為3次拍照的平均值。
1.3.2 β-胡蘿卜素含量測定
β-胡蘿卜素含量測定采用丙酮比色法,參考BISWAS等[27]的方法稍作改動(dòng),具體如下:首先在避光條件下使用4 ℃預(yù)冷的丙酮配制1 g/L β-胡蘿卜素標(biāo)準(zhǔn)溶液,以丙酮稀釋不同倍數(shù)后用可見分光光度計(jì)在波長449 nm下測定吸光度,并繪制標(biāo)準(zhǔn)曲線。然后,將甘薯切成碎丁,混勻后按四分法稱取甘薯樣品1 g,加適量預(yù)冷的丙酮于研缽中研磨,取上清液移至25 mL 棕色容量瓶中,重復(fù)以上操作待樣品變?yōu)闊o色,定容渦旋混合30 s后轉(zhuǎn)入10 mL離心管,2 500 r/min離心15 min,在449 nm下測定吸光度,根據(jù)上步所得標(biāo)準(zhǔn)曲線計(jì)算樣品的β-胡蘿卜素含量。
1.3.3 數(shù)據(jù)分析及模型的建立
數(shù)據(jù)分析及模型的建立采用Origin 8.0軟件。所建模型的擬合優(yōu)度采用確定系數(shù)(coefficient of determination,R2)來判定,R2的意義是一個(gè)變量的變化有百分之多少可以由另一個(gè)變量來解釋,其計(jì)算公式(1)為:
(1)
為了評(píng)價(jià)模型的預(yù)測能力,需要采用獨(dú)立的樣品對(duì)模型進(jìn)行驗(yàn)證。通常采用預(yù)測均方根誤差(root mean square error of prediction,RMSEP)、預(yù)測相關(guān)系數(shù)(correlation coefficient of prediction,rp)、預(yù)測標(biāo)準(zhǔn)偏差(SEP)、偏差(Bias)以及標(biāo)準(zhǔn)偏差比(standard deviation ratio,SDR)來評(píng)價(jià)模型的預(yù)測能力。RMSEP主要用于評(píng)價(jià)模型對(duì)外部樣本的預(yù)測能力,其值越小表明模型對(duì)外部樣品的預(yù)測能力越高,反之則預(yù)測能力越低;rp用于衡量樣本的預(yù)測值和實(shí)測值之間的相關(guān)程度,rp越接近于1,表明預(yù)測值與實(shí)測值之間的相關(guān)程度越好;SEP為預(yù)測標(biāo)準(zhǔn)偏差,對(duì)未知樣本進(jìn)行預(yù)測時(shí),SEP值越小越好;Bias為驗(yàn)證集各樣品的預(yù)測偏差的平均值,用于衡量模型的預(yù)測系統(tǒng)誤差,其值越小越好;SDR用來驗(yàn)證模型的穩(wěn)定性和預(yù)測能力,一般認(rèn)為,SDR<1表示無預(yù)測能力,SDR=1.5表明模型有一定的區(qū)分力,SDR=2表明有較好的預(yù)測能力,而SDR>3則表示模型有很強(qiáng)的預(yù)測能力[28]。RMSEP、rp、SEP、Bias和SDR的計(jì)算公式(2)、(3)、(4)、(5)、(6)分別為:
(2)
(3)
(4)
(5)
(6)
實(shí)驗(yàn)共收集了90份不同品系的甘薯樣品,樣品中β-胡蘿卜素含量檢測結(jié)果見表1。為了建立可靠的模型,采用含量梯度法[28]從90份樣品中挑選72份樣品作為校正集,用以構(gòu)建預(yù)測模型,其余18份作為外部驗(yàn)證集,以對(duì)模型的預(yù)測能力進(jìn)行驗(yàn)證,結(jié)果見表1。
表1 甘薯β-胡蘿卜素含量測定結(jié)果及樣品劃分Table 1 β-carotene content of sweet potato samples and partition of calibration and validation subsets
注:a同一指標(biāo)下帶有不同小寫字母的數(shù)據(jù)差異顯著(P<0.05)。
由表1可以看出,原始樣品集中,β-胡蘿卜素含量范圍為0.08~24.90 mg/100 g,與以往文獻(xiàn)中的報(bào)道結(jié)果一致[29],變異系數(shù)為97.95%,說明甘薯β-胡蘿卜素含量變異范圍很大,表明實(shí)驗(yàn)材料涵蓋的范圍廣,有利于后期模型的擬合。通過含量梯度法劃分校正集與驗(yàn)證集后,校正集中的β-胡蘿卜素含量范圍>驗(yàn)證樣品集,有利于建立高精度的預(yù)測模型。進(jìn)一步通過方差分析發(fā)現(xiàn),原始樣品校正集和驗(yàn)證集之間沒有顯著差異,說明樣品集劃分合理,有利于模型的校正和預(yù)測精度的評(píng)估。
分別以校正集樣品的數(shù)字圖像的顏色值(紅值R,綠值G,藍(lán)值B)為橫軸,以β-胡蘿卜素含量為縱軸作圖,以考察切片圖像的顏色值與β-胡蘿卜素含量間的變化規(guī)律,結(jié)果見圖3。做β-胡蘿卜素含量與R、G、B值的相關(guān)性分析,結(jié)果見表2。
圖3 甘薯β-胡蘿卜素含量與數(shù)字圖像RGB值的關(guān)系圖Fig.3 Relationship between β-carotene content of sweet potatoes and RGB values of their digital images
表2 甘薯β-胡蘿卜素含量與數(shù)字圖像RGB值的相關(guān)性分析Table 2 Correlation analysis between RGB value of digital image and β-carotene content in sweet potato
注:**:P< 0.01。
圖3-a為R值與β-胡蘿卜素含量間關(guān)系圖,可以看出,圖中數(shù)據(jù)點(diǎn)的分布無規(guī)律性,相關(guān)性分析結(jié)果顯示(表2),R值與β-胡蘿卜素含量無相關(guān)性。圖3-b為G值與β-胡蘿卜素含量關(guān)系圖,可以看出,G值越低β-胡蘿卜素含量越高,G值與β-胡蘿卜素含量間存在極強(qiáng)的負(fù)相關(guān),相關(guān)系數(shù)達(dá)到-0.925。圖3-c為B值與β-胡蘿卜素含量關(guān)系圖,可以看出,B值與β-胡蘿卜素含量大體上呈中等強(qiáng)度負(fù)相關(guān),相關(guān)系數(shù)為-0.614。β-胡蘿卜素是一種橘黃色天然色素,當(dāng)白光照射至甘薯切片時(shí),β-胡蘿卜素吸收光線中藍(lán)綠色光的同時(shí)反射紅黃色光,從而使甘薯塊根切片呈現(xiàn)橘黃色,手機(jī)鏡頭拍攝到的實(shí)際是切片吸收色的補(bǔ)色。甘薯中β-胡蘿卜素含量越高,切片吸收的藍(lán)綠色光越多,因此表現(xiàn)出β-胡蘿卜素含量與G值或B值間呈負(fù)相關(guān)趨勢。
手機(jī)數(shù)字圖像的G值與β-胡蘿卜素含量間存在極強(qiáng)的負(fù)相關(guān),并且數(shù)據(jù)點(diǎn)的分布呈較強(qiáng)的規(guī)律性,表明采用手機(jī)數(shù)字圖像的G值對(duì)β-胡蘿卜素含量進(jìn)行擬合建模是可行的;B值雖然與β-胡蘿卜素含量呈中等強(qiáng)度負(fù)相關(guān),但數(shù)據(jù)點(diǎn)的分布較為分散,規(guī)律性差;R值與β-胡蘿卜素含量無相關(guān)性,數(shù)據(jù)點(diǎn)的分布無規(guī)律性可言。因此,在后續(xù)模型擬合中,只采用G值進(jìn)行擬合。
分別以線性函數(shù)、多項(xiàng)式函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)及冪函數(shù)對(duì)G值與β-胡蘿卜素含量間的關(guān)系進(jìn)行擬合,各模型的確定系數(shù)R2見表3。
表3 甘薯β-胡蘿卜素含量模型擬合結(jié)果Table 3 The results of calibration models of beta-carotene content in sweet potato
注:函數(shù)中自變量x為數(shù)字圖像的綠值(G)。
由表3可以看出,在所有模型中線性模型的擬合確定系數(shù)最低(R2=0.856),說明β-胡蘿卜素含量與G值之間不是簡單的線性關(guān)系,這也與圖3-b散點(diǎn)圖的變化趨勢一致。圖3-b中,樣品β-胡蘿卜素含量分布呈下凹弧線趨勢,非線性的多項(xiàng)式函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)以及冪函數(shù)的函數(shù)圖像與該趨勢近似,因此,采用多項(xiàng)式函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)及冪函數(shù)擬合模型的R2均高于線性函數(shù)模型。多項(xiàng)式函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)模型的確定系數(shù)R2較為接近,分為另0.941,0.946和0.947,高于冪函數(shù)的確定系數(shù)(R2=0.928)。因此,在后續(xù)實(shí)驗(yàn)中只選擇多項(xiàng)式函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)模型進(jìn)行進(jìn)一步評(píng)價(jià)對(duì)比。為了進(jìn)一步比較3種模型的預(yù)測能力,需要采用獨(dú)立的驗(yàn)證集樣品對(duì)3種模型進(jìn)行外部驗(yàn)證,以進(jìn)行比較。
為了評(píng)價(jià)模型的預(yù)測能力,采用獨(dú)立的驗(yàn)證集樣品對(duì)多項(xiàng)式函數(shù)模型、指數(shù)函數(shù)模型、對(duì)數(shù)函數(shù)模型進(jìn)行驗(yàn)證,分別做3種模型的預(yù)測值與實(shí)測值的相關(guān)關(guān)系圖及殘差圖,結(jié)果見圖4(多項(xiàng)式函數(shù)模型),圖5(指數(shù)函數(shù)模型)和圖6(對(duì)數(shù)函數(shù)模型)。模型的驗(yàn)證統(tǒng)計(jì)參數(shù)見表4。
a-多項(xiàng)式函數(shù)實(shí)測值與預(yù)測值關(guān)系圖;b-殘差圖圖4 多項(xiàng)式函數(shù)模型的預(yù)測值與實(shí)測值關(guān)系及殘差圖Fig.4 Relationship between predicted and true values and regression residuals plot of polynomial function model
a-指數(shù)函數(shù)實(shí)測與預(yù)測值關(guān)系圖;b-殘差圖圖5 指數(shù)函數(shù)模型的預(yù)測值與實(shí)測值關(guān)系及殘差圖Fig.5 Relationship between predicted and true values and regression residuals plot of exponential function model
a-對(duì)數(shù)函數(shù)模型的預(yù)測與實(shí)測值關(guān)系;b-殘差圖圖6 對(duì)數(shù)函數(shù)模型的預(yù)測值與實(shí)測值關(guān)系及殘差圖Fig.6 Relationship between predicted and true values and regression residuals plot of logarithmic function model
可以看出,3種函數(shù)模型的預(yù)測值與實(shí)測值比較集中地分布在擬合線周圍,說明3種模型的預(yù)測值和實(shí)測值之間的相關(guān)程度均較高??偟膩碚f,3種模型的殘差分布均勻,均無明顯的聚集或偏移趨勢,但對(duì)數(shù)函數(shù)模型的殘差(圖6-b)更為集中在y=0水平線附近,說明對(duì)數(shù)函數(shù)模型的預(yù)測誤差更小。
表4為多項(xiàng)式函數(shù)模型、指數(shù)函數(shù)模型、對(duì)數(shù)函數(shù)模型對(duì)驗(yàn)證集進(jìn)行驗(yàn)證的結(jié)果統(tǒng)計(jì)表??梢钥闯?,3種函數(shù)模型的rp均大于0.97,說明對(duì)于驗(yàn)證集樣品3種模型預(yù)測值和實(shí)測值之間的相關(guān)程度較高;SDR均大于3,說明3種模型均有較強(qiáng)的預(yù)測能力。對(duì)數(shù)函數(shù)模型的RMSEP=0.819,低于其他模型,而SDR=5.269,高于其他模型,說明對(duì)數(shù)模型對(duì)外部樣本的預(yù)測能力最強(qiáng);SEP與Bias最小,表明對(duì)數(shù)函數(shù)預(yù)測的標(biāo)準(zhǔn)偏差與系統(tǒng)誤差最小,預(yù)測能力優(yōu)于其他函數(shù)。
表4 模型的驗(yàn)證結(jié)果Table 4 Validation results of the models
采用手機(jī)拍攝甘薯塊根切片圖像,提取圖像的RGB信息,對(duì)圖像的RGB信息與甘薯β-胡蘿卜素含量間的關(guān)系進(jìn)行了研究,建立了圖像RGB信息與甘薯β-胡蘿卜素含量間的數(shù)學(xué)模型并進(jìn)行了驗(yàn)證。研究發(fā)現(xiàn),手機(jī)數(shù)字圖像可以反映甘薯β-胡蘿卜素含量間的差異,甘薯β-胡蘿卜素含量與甘薯切片圖像的G值間呈極強(qiáng)的負(fù)相關(guān)(相關(guān)系數(shù)-0.925),與B值呈中等強(qiáng)度負(fù)相關(guān)(相關(guān)系數(shù)-0.613),與R值無相關(guān)。采用對(duì)數(shù)函數(shù)對(duì)G值與β-胡蘿卜素含量間的關(guān)系進(jìn)行擬合,模型的預(yù)測能力最強(qiáng),所得模型的數(shù)學(xué)表達(dá)式為y=42.87-9.73×ln(x-144.87),模型的擬合確定系數(shù)R2=0.947。采用驗(yàn)證集樣本對(duì)模型進(jìn)行檢驗(yàn),預(yù)測值與實(shí)測值的相關(guān)系數(shù)rp=0.983,RMSEP=0.819,SDR=5.269,達(dá)到了較好的預(yù)測精度。采用手機(jī)數(shù)字圖像比色法檢測甘薯β-胡蘿卜素含量,在模型建立之后,樣品無需前處理,操作簡便迅速,為甘薯品質(zhì)檢測提供了一種新的思路與方法,為數(shù)字圖像比色法在食品檢測中應(yīng)用積累經(jīng)驗(yàn)。需要說明的是,從對(duì)數(shù)函數(shù)擬合模型的數(shù)學(xué)表達(dá)式可以看出,模型的自變量是有一定范圍限制的,即(144.87