郝 欣 邱 燁 陳 晏 孔維恒 劉 鑫* 忻 欣 徐記各
(1.中國海關(guān)科學(xué)技術(shù)研究中心,北京 100026;2.北京工業(yè)設(shè)計促進(jìn)中心,北京100088;3.西派特(北京)科技有限公司,北京100029)
鱈魚屬脊椎動物門、脊椎動物亞門、真骨魚綱、鱈形目。純正鱈魚主要指大西洋鱈魚。近年來,為了滿足我國國內(nèi)消費(fèi)需求,鱈魚產(chǎn)品進(jìn)口量增長迅速,貿(mào)易規(guī)模不斷擴(kuò)大。目前,隨著水產(chǎn)品進(jìn)口數(shù)量逐漸增加,水產(chǎn)分類易混淆不清而出現(xiàn)利用廉價的油魚冒充鱈魚等現(xiàn)象。如何在口岸快速無損鑒定進(jìn)口魚類物種分類成為了海關(guān)各口岸亟待解決的問題。
近紅外檢測技術(shù)在農(nóng)產(chǎn)品領(lǐng)域通常用于食品成分分析等方面[1]。其中,拉曼光譜技術(shù)是近年來應(yīng)用較廣泛的一種分子光譜分析技術(shù)。其利用拉曼散射效應(yīng)反映分子轉(zhuǎn)動和振動性質(zhì)?,F(xiàn)階段,拉曼光譜因其信息豐富,可從分子水平上反映物質(zhì)組成和結(jié)構(gòu)信息,同時又便攜、高效等特點已應(yīng)用于考古、毒品檢測、化工生產(chǎn)、化學(xué)品檢測平臺、材料學(xué)、醫(yī)藥學(xué)和環(huán)境等領(lǐng)域[2-9]。相關(guān)研究表明,拉曼光譜技術(shù)可應(yīng)用于魚類物種鑒別。其中,Alamprese等[10]通過NIR法分別兩對魚類品種:鯔魚和紅鰹、鰈和偏口魚進(jìn)行了分類鑒別。Sivertsen等[11]通過NIR-VIS聯(lián)用法區(qū)別冷凍鱈魚片的新鮮度。本實驗利用采集魚肉蛋白與脂肪組織的拉曼光譜數(shù)據(jù),通過波長標(biāo)定法進(jìn)行采集數(shù)據(jù)降噪處理,結(jié)合多元散射校正和均值中心化方法對光譜數(shù)據(jù)進(jìn)行前處理,采用簇類獨立軟模式法建立大西洋鱈魚、銀鱈魚、黑線鱈魚、龍利魚、巴沙魚和狹鱈魚6種魚類的動物種屬鑒別分析模型。
本實驗選用的6種不同進(jìn)口魚類樣品來源于中國海關(guān)科學(xué)技術(shù)研究中心。6種魚類樣品的種屬鑒定確證實驗已完成,此鑒定由廣西中醫(yī)藥大學(xué)完成。
ExR810廣域拉曼光譜儀。
實驗選取的6種魚類樣品光譜數(shù)據(jù)的采集數(shù)量、校正集及驗證集數(shù)據(jù)如表1所示。
表1 6種魚類樣品分類信息
每個魚肉樣品采取凈魚肉部分作為采集位置,每個樣品采集1個位置點,每個位置點采集1個數(shù)據(jù)。
依據(jù)實驗設(shè)計,將魚肉樣品置于樣品臺上,設(shè)定積分時間10 s,每個樣品的平均采集次數(shù)為6 次,設(shè)備功率等級設(shè)定為10 級,拉曼光譜的掃描范圍設(shè)定為167~3745 cm-1。
本實驗采用多元散射校正法(MSC)和均值中心化法對6種魚類樣品的光譜數(shù)據(jù)進(jìn)行預(yù)處理,利用MSC法和求導(dǎo)是校正基線漂移現(xiàn)象的有效處理辦法[12]。中心化是從變量中減去它的均值,均值中心化法是從樣品光譜數(shù)據(jù)中去掉校正集的平均光譜數(shù)據(jù),從而得到符合正態(tài)分布的有力數(shù)據(jù)[13]。本實驗的數(shù)據(jù)處理程序采用MATLAB(R2017b)軟件編寫。如圖1所示,6種魚肉樣品中銀鱈魚的拉曼信號最強(qiáng),其次為黑線鱈魚,這兩種魚的強(qiáng)信號來自于魚肉中的脂肪成分,判斷此兩種魚可能為高脂肪魚;其他4種魚肉的拉曼信號較弱,這些弱信號來自于魚肉中的蛋白質(zhì)成分,判斷此4種魚可能為高蛋白魚。
圖1 6種魚肉樣品的拉曼光譜圖
本實驗利用簇類獨立軟模式分類法(Soft Independent Modeling Class Analog,SIMCA)先驗分類知識,對每一種類別的魚類樣品建立一個主成分分析(principle component analysis,PCA)模型,再利用這些建立的模型判斷未選入建模集的魚類樣本進(jìn)行歸屬[14]。本實驗光譜數(shù)據(jù)定性識別準(zhǔn)確率按公式(1)計算。
(1)
本實驗先對樣品進(jìn)行主成分分解,建立已知類別的SIMCA主成分分析模型,建模樣品類別與樣品的對應(yīng)關(guān)系見表2。
表2 樣品名稱及類別號對應(yīng)關(guān)系表
圖2~圖7為建立的6種魚類樣品的SIMCA主成分分析模型,模型以Q與T22個參數(shù)衡量樣本與PCA模型的擬合程度。Q為樣本與PCA模型中主成分投影之間的殘差,用于評價樣本與模型擬合程度的好壞。而T2用于描述樣本在PCA模型內(nèi)部的遠(yuǎn)離程度[15]。再將未知樣本與各類SIMCA主成分分析模型進(jìn)行擬合,綜合Q與T2的值判斷未知樣本屬于哪一類。
圖2 巴沙魚(0號)與其他魚類之間的區(qū)分
圖3 大西洋鱈(1號)與其他魚類之間的區(qū)分
圖4 黑線鱈(2號)與其他魚類之間的區(qū)分
圖5 龍利魚(3號)與其他魚類之間的區(qū)分
圖6 狹鱈魚(4號)與其他魚類之間的區(qū)分
圖7 銀鱈魚(5號)與其他魚類之間的區(qū)分
本實驗利用SIMCA定性分析首先從6種魚類樣品430個樣本中選擇297個建立訓(xùn)練集。將光譜數(shù)據(jù)進(jìn)行前處理后,選出適當(dāng)?shù)闹饕蜃訑?shù)以便防止光譜中的有效信息過度擬合,從而利用SIMCA法分別建立6種不同魚類樣品的主成分定性分析模型數(shù)據(jù)庫。其中,巴沙魚、大西洋鱈魚、黑線鱈魚、龍利魚、狹鱈魚和銀鱈魚6種進(jìn)口魚類樣品的主因子數(shù)分別選取6、6、5、5、3、6。
由圖2~圖7可見,6個魚類樣品之間可顯著區(qū)分。由此可見,利用拉曼光譜法和有效的數(shù)據(jù)處理方法能較高效的提取出不同種屬進(jìn)口魚類樣品的脂肪、蛋白質(zhì)組成以及其肉質(zhì)結(jié)構(gòu)等方面的光譜數(shù)據(jù)內(nèi)容,完成鑒別進(jìn)口魚類樣品的種屬分類。
6種魚類樣品數(shù)據(jù)通過SIMCA模型分析后,內(nèi)部驗證數(shù)據(jù)見表3,外部驗證數(shù)據(jù)見表4,其中外部樣品選擇經(jīng)鑒定的非建模用魚類樣本,可視為盲樣。
對巴沙魚、大西洋鱈魚.等6類魚進(jìn)行63個樣品的內(nèi)部驗證(如表3所示),正確率均為100%。
表3 內(nèi)部樣品驗證正確率
如表4所示,對巴沙魚、大西洋鱈魚.等6類魚進(jìn)行70個樣品的樣品外部驗證正確率亦為100%,表明本實驗建立起來的SIMCA主成分定性識別模型對6種不同進(jìn)口魚類樣品的種屬具備良好的鑒別能力。
表4 外部樣品驗證正確率
本實驗利用拉曼光譜技術(shù)結(jié)合簇類獨立軟模式方法建立快速鑒別進(jìn)口鱈魚真?zhèn)螜z測方法。采集數(shù)據(jù)處理結(jié)合多元散射校正和波長標(biāo)定降噪技術(shù),建立起6種魚的SIMCA主成分定性分類模型,并對70個不同種類的魚類樣品種屬進(jìn)行盲樣定性鑒別,識別正確率達(dá)100%。單個樣品檢測可實現(xiàn)在瞬時內(nèi)完成實驗檢測,操作簡便,無破壞性。因此,采用拉曼光譜技術(shù)和可行的光譜數(shù)據(jù)處理法并利用SIMCA方法建立主成分分析模型,可快速鑒別進(jìn)口鱈魚樣品真?zhèn)吻闆r,從而解決在口岸快速無損鑒定進(jìn)口魚類物種分類的問題。