黃 華, 祝詩平, 卓佳鑫, 劉廣昊, 朱 潔, 吳習宇, 于麗敏
1. 西南大學工程技術學院, 重慶 400716 2. 西南大學食品科學學院, 重慶 400716 3. 山東農(nóng)業(yè)工程學院, 山東 濟南 250100
胡椒分為白胡椒與黑胡椒兩種類型, 原產(chǎn)于印度。 胡椒粉不僅可以作為調(diào)味料, 還具有較高的藥用價值, 因此胡椒作為一種經(jīng)濟作物在世界上多數(shù)熱帶地區(qū)都有種植, 如中國的海南省和云南省都在發(fā)展胡椒產(chǎn)業(yè)[1]。 隨著胡椒經(jīng)濟價值的增加, 近年來胡椒的摻假產(chǎn)品也在市場上有報道。 由于木瓜籽與黑胡椒具有相似性, 因此有學者[2]對于在黑胡椒中摻入木瓜籽進行了相關的研究。
胡椒含有揮發(fā)油和胡椒堿[3]等成分。 目前的研究主要是通過胡椒粉末中胡椒堿的含量來鑒別胡椒粉的真假。 對胡椒堿的檢測方法有比色法[3]、 高效液相色譜法[4]、 DNA法[5]、 紫外光譜法[6]和近紅外光譜法[7-9]等。 例如, Smita G Patil[6]等使用紫外可見光譜儀發(fā)現(xiàn)胡椒堿在343 nm處具有最大的吸光度, 并利用該波長點建立了預測胡椒堿含量的線性回歸方法。 Umang Shah[7]等利用近紅外光譜儀結(jié)合偏最小二乘法和主成分分析等化學計量學方法檢測了黑胡椒中胡椒堿的含量, 該方法具有檢測速度快、 不破壞樣品等特點。 Hamrapurkar[4]等利用高效液相色譜法預測胡椒中胡椒堿的含量, 其預測精度高。 Madan[10]等利用胡椒粉中皂化值、 碘值以及皂化值和碘值比值作為參數(shù), 分析了黑胡椒中摻入木瓜籽的情況, 其能識別的最小摻雜量為15%。 Parvathy[5]等利用DNA條形碼對黑胡椒粉末中摻入辣椒粉進行研究, 其可以檢測的最小摻雜量為0.5%。 陳家華[11]等利用液相色譜法通過測定樣品中的胡椒堿的含量來判別胡椒的真假, 其相關系數(shù)達到0.99。 吳習宇[8]等利用近紅外光譜儀對花椒中摻入麥麩和稻糠等雜質(zhì)進行了研究。 McGoverin[9]等比較了近紅外和中紅外光譜法對黑胡椒中摻假蕎麥和小米的識別結(jié)果, 發(fā)現(xiàn)利用近紅外比中紅外具有更高的準確度。
高光譜成像不僅可以獲得物質(zhì)光譜信息, 還有空間位置信息。 因此利用高光譜成像技術為實現(xiàn)定位摻假物的位置提供了可能。 Mishra[12]等應用高光譜成像技術研究了在面粉中摻入0.1%~10%花生粉的檢測方法, 其模型的相關系數(shù)為0.94。 Vermeulent[13]等利用高光譜成像技術對麥角和面粉的混雜進行了識別, 其模型的相關系數(shù)達到0.99。 Barreiro[14]等使用推掃式高光譜儀研究了花生粉在牛奶粉中的摻假情況。
白胡椒粉末與面粉顏色非常接近, 如果在白胡椒粉末中摻入少量的面粉很難通過人的視覺或嗅覺判別, 因此有必要利用高光譜成像技術預測面粉在白胡椒粉末中的含量和定位面粉在白胡椒粉末中的摻入位置。 本研究為實現(xiàn)快速、 無損和可視化鑒別白胡椒真假提供一種參考方法。
制備白胡椒60份, 每份取重量500 g, 利用粉碎機將白胡椒顆粒粉碎, 然后通過60目的篩網(wǎng)篩選, 獲得純白胡椒粉末樣品。 純面粉成品從超市購得。 使用精度為0.1 mg的分析天平從制備的白胡椒粉末樣品中取出5 000 mg粉末, 按照1%~60%的比重和1%的梯度將純面粉摻入到純白胡椒末中; 利用攪拌機將樣品攪拌均勻, 使面粉與白胡椒粉充分混合, 即得到摻雜濃度不同的樣本粉末60份; 再取純白胡椒粉和純面粉各一份樣品, 即一共組成62份樣品。 將樣品放入尺寸為6.80 cm×6.80 cm樣品池中, 利用刮刀在樣品池表面反復刮動, 使樣品表面平整。 如圖1(a)所示。
圖1 摻入25%的面粉樣本圖像
圖1是在白胡椒粉中摻入25%的面粉的圖像, 該樣品總質(zhì)量為5 342.7 mg, 其中白胡椒粉為4 007.0 mg, 面粉為1 335.7 mg。 圖1(a)是由分辨率為3 024×4 032的相機拍攝獲得。 為了減小樣品水分含量對光譜的影響, 再將樣品經(jīng)BH-2型鼓風干燥機干燥1小時后取出為高光譜掃描做準備。
選用五鈴光學的VNIR-HIS-B1621可見/近紅外成像系統(tǒng)作為高光譜圖像采集系統(tǒng)。 該系統(tǒng)主要由CCD相機(Raptor EM285CL, USA)、 363~1 025 nm光譜成像儀(Imspector V10E, Oulu, Finland)、 IT 3900型150 W鹵素光源、 移動平臺和暗箱等組成。 高光譜相機使用35 nm鏡頭, 鏡頭與樣品池的距離為30 cm, 高光譜的圖像分辨率1 632×1 232, 曝光時間20 ms, 載物臺的移動速度為0.79 mm·s-1。 計算機通過Hyper Spectral Image軟件來控制攝像機和樣品臺的操作。 獲得的高光譜偽彩色圖如圖1(b)所示。 圖1(b)是由波長分別為680, 550和470 nm等3個波長點合成的RGB三基色偽彩色圖像。
1.3.1 目標區(qū)域提取
對制備的62份樣品, 每份樣品單獨裝入樣品池中進行高光譜掃描, 即共獲得62份高光譜數(shù)據(jù)。 圖1(b)所示的高光譜圖像空間分辨率為1 632×1 670。 利用大小為700×700的矩形框從原始高光譜圖像中提取目標區(qū)域。 如圖1(b)中紅色矩形框區(qū)域為目標區(qū)域, 然后通過計算目標區(qū)域內(nèi)所有像素點的平均光譜數(shù)據(jù), 重復此操作獲得62份掃描樣品的平均光譜數(shù)據(jù)。 樣品的反射光譜曲線如圖2所示。
圖2 樣品反射光強度曲線
圖2中橫軸為波長, 縱軸為反射光強度, 選取的目標區(qū)域波長范圍是465~897 nm。 在波長678 nm附近反射光強度較高, 隨后兩端呈下降趨勢。 從圖2中可以直觀的觀察到隨著面粉摻雜含量的逐漸增加, 樣品反射光強度隨之增大。 如圖2中最上方的光譜曲線為純面粉, 其反射光強度最高; 最下方的光譜曲線為純白胡椒粉, 其反射光強度最低。
在高光譜成像系統(tǒng)中, 光源強度并不是均勻分布的, 通常需要按式(1)進行白板與黑板校正, 從而將圖2中原始光譜的反射強度轉(zhuǎn)換成反射率。
(1)
式(1)中E為校正后的高光譜數(shù)據(jù),EO為原始高光譜數(shù)據(jù),EB為參考黑板的光譜數(shù)據(jù),EW為參考白板的光譜數(shù)據(jù)。 在圖1(b)所示的樣品池上方貼有白色膠帶用于白板校正, 即從原始光譜數(shù)據(jù)中提取白色膠帶區(qū)域的平均光譜作為EW。 這樣可以避免每次光譜掃描時都要做單獨的白板校正。 經(jīng)過白板與黑板校正后的反射率曲線如圖3所示。
從圖3中可以看出, 隨著波長的增加, 樣品的反射率總體呈現(xiàn)出緩慢上升的趨勢; 由于白胡椒粉末對光譜的吸收度大于面粉, 因此隨著樣品摻雜濃度的增加, 反射率比值就越大。
圖3 樣品光譜反射率曲線
1.3.2 模型建立與評價
偏最小二乘回歸(partial least square regression, PLSR)建模方法廣泛應用光譜的定量分析中。 將獲得的62份樣品高光譜數(shù)據(jù)分成校正集與預測集, 隨機選出42份樣品作為校正集, 余下20份樣品作為預測集。 在校正集中, 利用PLSR方法建立面粉在白胡椒粉末中的含量的定量分析預測模型; 再將校正集中的光譜數(shù)據(jù)代入PLSR的回歸模型中, 獲得白胡椒粉末摻雜面粉的濃度含量值; 最后利用相關系數(shù)法和最大最小判別準則在原始光譜圖像中標記面粉的位置。
在光譜的預處理中, 常見的方法[15]有去中心化(Mean)、 標準正態(tài)變換(standard normal variate, SNV)、 多元散射校正(multiplicative scatter correction, MSC)、 應用Savitzky-Golay平滑的一階導數(shù)(first derivatives, SAVG1)和二階導數(shù)(second derivatives, SAVG2)等。 以及將以上方法兩兩組合的復合預處理方法。 本工作將分析比較未做預處理(None)、 Mean、 SNV、 MSC、 MSC+Mean、 MSC+SNV、 SAVG1和SAVG2等8種方法對建立PLSR預測模型的影響。 根據(jù)校正集均方根誤差(root mean square error of calibration, RMSEC)、 預測集均方根誤差(root mean square error of prediction, RMSEP)、 校正集相關系數(shù)(correction of calibration,RC)、 預測集相關系數(shù)(correction of prediction,RP)來評價PLSR模型的預測性能。 在不同主成分(principal component, PC)下, RMSEP值越小,RP值越大, 說明該模型預測性能越好。
對校正集中的42份樣品利用偏最小二乘回歸法(PLSR)建立識別白胡椒粉末中面粉含量的預測模型, 然后再利用該預測模型對預測集中的20份樣品進行檢驗。 為了獲得最佳的預測模型, 分析比較了將原始的光譜數(shù)據(jù)分別通過Mean、 SNV、 MSC、 MSC+Mean、 MSC+SNV、 SAVG1和SAVG2等不同的預測處理方法后的預測結(jié)果。 如表1所示。
表1 白胡椒粉末中摻入面粉含量預測結(jié)果
從表1可以看出, 不同的預處理方法在校正集中都有較好的相關系數(shù), 其RC均達到0.99。 這主要是由于在白胡椒粉末中摻入面粉后, 隨著摻入面粉濃度的增加其光譜的反射率也隨之增加, 表現(xiàn)出較好的相關性和線性關系。 在這8種預處理方法中采用SAVG1預處理方法時, 其RMSEC最小為0.83%, 其所對應的預測集的RMSEP也最小為2.73%。 在SAVG1預測處理下, 畫出摻雜面粉1%~60%的預測集與校正集的回歸曲線, 如圖4所示。
圖4 PLS回歸曲線
高光譜成像技術不僅可以獲得被測物體的光譜信息, 還能將每一條光譜曲線與物體空間位置上的一個點聯(lián)系起來, 這樣既可以獲得光譜信息, 又可以獲得圖像信息。 為了能在摻入面粉的白胡椒粉末樣品中定位面粉摻入位置, 利用相關系數(shù)法和最大最小判別準則進行識別。
按式(2)計算樣品與純胡椒粉末和面粉的相關系數(shù)
(2)
式(2)中,X為樣品的光譜,Y為純面粉光譜,Z為純胡椒粉末光譜。 COV表示協(xié)方差函數(shù),σ表示方差。R1為樣品與純面粉的相關系數(shù), 其數(shù)值介于0~1之間, 若樣品的光譜曲線越接近于面粉, 則R1數(shù)值越大;R2為樣品與純白胡椒粉末的相關系數(shù)。 在白胡椒粉末中摻入面粉的含量越高R1的數(shù)值將越大, 而R2的數(shù)值將越小。 以含25%面粉的樣品為例, 為了顯示方便僅顯示原始圖像中心位置點一行的相關系數(shù), 即在原始的數(shù)據(jù)700×700矩陣中取出第300行, 第300~399列位置點所對應的100條光譜, 計算其與純面粉相關系數(shù)和純白胡椒粉末的相關系數(shù), 如圖5所示。
圖5 樣品與純面粉和白胡椒粉的相關系數(shù)
在圖5中下方的曲線表示樣品與面粉的相關系數(shù)R1, 上方的曲線表示樣品與純胡椒粉末的相關系數(shù)R2。 從圖5中虛線所示峰值點可以看出, 當R1相關系數(shù)達到最大時,R2的相關系數(shù)將達到最小。 反之若該位置是純白胡椒粉末的光譜, 則R1達到最小,R2最大。 因此可以利用最大最小的判別準則來判別該位置點是否是面粉。 最大最小的判別準則步驟如下: 首先計算R1與R2的差值, 獲得新的數(shù)據(jù)R, 然后將R按由小到大的順序排序, 再利用PLSR預測面粉含量的預測結(jié)果為判決門限值, 以此門限值將R中相應的位置點判別為面粉。 以白胡椒粉末中摻入25%的面粉為例說明該判別方法, 首先將摻入25%面粉的原始光譜數(shù)據(jù)經(jīng)過Mean預處理后, 代入PLSR回歸模型中, 預測摻入面粉的含量為22.67%; 分別計算該原始光譜與純白胡椒粉末和面粉的光譜之間的相關系數(shù)獲得R1和R2, 再計算R=R1-R2; 然后將R值按由小到大的次序排列, 將R中前22.67%個數(shù)據(jù)點判別為面粉, 最后在原始圖像中標記這些被判別為面粉的位置點。 如圖6所示。
圖6 胡椒粉末中摻入25%面粉識別結(jié)果
圖6(a)是摻入25%面粉的樣品在550 nm波長處的灰度圖像。 圖6(b)是利用相關系數(shù)法和最大最小判別準則后, 在圖6(a)原始灰度圖像中標記出面粉的位置, 圖中白色顯示部分表示面粉。 為了更加清楚地在白胡椒粉末中顯示出摻入面粉的情況, 將圖6(b)轉(zhuǎn)換成二值圖像, 黑色表示白胡椒粉末, 白色表示面粉, 并放大7倍后顯示, 其結(jié)果如圖7(b)所示。 其他摻雜比例的結(jié)果如圖7(a—f)所示。
圖7 放大7倍后的識別結(jié)果
對60份按照1%~60%的配比和1%的梯度將純面粉摻入到純白胡椒末中的樣品進行高光譜掃描。 計算每份樣品的平均光譜, 經(jīng)Mean預處理后, 運用PLSR方法建立預測面粉含量的定量分析模型, 其校正集的RMSEC為0.83%, 預測集的RMSEP為2.73%, 校正集與預測集都具有較高的相關系數(shù)RC=0.99,RP=0.98。 PLSR建模有較好的預測效果, 主要原因是白胡椒粉末與面粉對光的吸收程度不同, 面粉的光反射較強, 而白胡椒粉的光吸收較強。 因此隨著面粉摻入濃度的提高, 光譜的反射系數(shù)就越大, 表現(xiàn)出較強的相關系數(shù)。 但是PLSR建模是利用樣品的平均光譜數(shù)據(jù), 由于在推掃式高光譜儀的分辨率為1 632×1 232下, 每一份樣品的光譜矩陣大小為1 670×1 632×1 232個光譜數(shù)據(jù)點, 即每一個樣品都有1 670×1 632條譜線, 其譜線的變化范圍超過了434條平均光譜的變化范圍, 因此不能將樣品中各個空間位置點的譜線代入PLSR回歸模型中, 這樣會造成較大的預測誤差。 為了在原始光譜圖像中標記出面粉的具體位置, 采用了相關系數(shù)法和最大最小判別準則, 分別計算原始光譜矩陣中的每一個空間位置點的譜線分別與純面粉和純胡椒粉末相關系數(shù), 根據(jù)該空間位置點與純面粉和純白胡椒粉末的相關系數(shù)的差值進行判別該位置點是否為面粉。 應用最大最小判別準則的關鍵點是確定判決門限; 以PLSR預測的濃度含量為門限值; 從而在原始光譜圖像中定位出面粉的位置。 實驗表明利用高光譜成像技術, 不僅可以預測白胡椒粉末中摻入面粉的含量, 還可以通過空間位置點的光譜數(shù)據(jù)定位面粉在白胡椒粉末中的位置。 今后將進一步研究利用高光譜成像識別在胡椒粉末中摻入多種物質(zhì)的方法。