劉 軍 ,吳夢婷 ,譚正林 ,李 威
1.智能機(jī)器人湖北省重點(diǎn)實(shí)驗(yàn)室(武漢工程大學(xué)),湖北 武漢 430205;
2.湖北經(jīng)濟(jì)學(xué)院烹飪與營養(yǎng)學(xué)系,湖北 武漢 430205;
3.武漢工程大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,湖北 武漢 430205
近紅外光譜無損檢測技術(shù)中數(shù)據(jù)的分析方法概述
劉 軍1,3,吳夢婷1,3,譚正林2,李 威1,3
1.智能機(jī)器人湖北省重點(diǎn)實(shí)驗(yàn)室(武漢工程大學(xué)),湖北 武漢 430205;
2.湖北經(jīng)濟(jì)學(xué)院烹飪與營養(yǎng)學(xué)系,湖北 武漢 430205;
3.武漢工程大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,湖北 武漢 430205
近紅外光譜無損檢測技術(shù)可用于品種鑒別與農(nóng)產(chǎn)品的定性或者是定量的分析工作.本文介紹了近紅外光譜的基本原理及各類近紅外光譜分析方法.近紅外光譜無損檢測技術(shù)中數(shù)據(jù)分析方法是通過光譜定量分析找到光譜以及對應(yīng)濃度的內(nèi)在關(guān)系,建立相應(yīng)的數(shù)學(xué)模型.這些方法主要有偏最小二乘回歸、主成分分析法、BP神經(jīng)網(wǎng)絡(luò)算法、支持向量機(jī)、K最近鄰分類算法和線性判別分析法等.通過這些分析模型的對比,研究表明:支持向量機(jī)將是近紅外光譜數(shù)據(jù)分析方法未來一個(gè)重要的研究方向.
近紅外光譜;無損檢測;數(shù)據(jù)分析方法
近紅外光譜檢測技術(shù)的成本低,對于樣本無損傷、無污染、方便在線分析[1].在食品無損檢測中得到了廣泛的應(yīng)用.
近紅外光譜技術(shù)是建立一個(gè)穩(wěn)定可靠的定性或者定量模型來實(shí)現(xiàn)數(shù)據(jù)樣本的校準(zhǔn),常用于定性分析[2].定性分析中常用的方法有主成分分析法(principal component analysis,PCA)、模式識別方法等;定量分析中常用的方法主要是各種多元校正技術(shù),如偏最小二乘回歸(partial least squares,PLS)、支持向量機(jī)(support vector machine,SVM)以及神經(jīng)網(wǎng)絡(luò)算法(back propagation,BP)等.下面將對幾種常用算法的原理和應(yīng)用進(jìn)行比較分析,以便找到最適合對小樣本數(shù)據(jù)進(jìn)行分類的算法.
紅外光譜又可以稱為分子振動光譜或者轉(zhuǎn)動光譜.近紅外光譜主要是通過投射光譜技術(shù)和反射光譜技術(shù)獲得.近紅外光譜主要采集樣品的含氫基團(tuán)的伸縮振動的倍頻和合頻信息,其中包含了反映物質(zhì)特性的化學(xué)成分、分子結(jié)構(gòu)和狀態(tài)信息[3].由于近紅外光譜技術(shù)在檢測樣品的過程中,不會對樣品造成損傷[1],因此近紅外光譜分析技術(shù)可以被用于食品的無損檢測中.近紅外光譜通過合適的化學(xué)計(jì)量法對于樣本進(jìn)行定性分析,可以將已知的樣品劃分為子集,用以提高校正模型的預(yù)測精度.定量分析是依據(jù)實(shí)驗(yàn)中得到的數(shù)據(jù),通過相應(yīng)的算法建立數(shù)學(xué)模型,并且使用模型計(jì)算出分析對象各項(xiàng)指標(biāo)以及其數(shù)值的一種方法.與其他的檢測方法相比,近紅外光譜技術(shù)便于實(shí)現(xiàn)在線分析和典型的無損分析技術(shù)[3].
偏最小二乘法(partial least squares,PLS)是一種新的多元校正方法,可以建立多元的回歸模型,主要是基于因子分析.偏最小二乘法的原理是首先將樣本的光譜矩陣X和光譜濃度矩陣Y進(jìn)行分解,同時(shí)把包含在樣本中的信息引入進(jìn)來,分解后提取出樣本中的m個(gè)主因子,如公式(1)所示:
式(1)中:測量矩陣 X和Y的得分矩陣分別是T和U;tk和uk分別表示光譜矩陣X的第k個(gè)主成分因子和濃度矩陣的第k個(gè)主成分因子;pk和qk表示主成分因子的載荷,m為成分因子的個(gè)數(shù).
對于U和T進(jìn)行線性關(guān)聯(lián),如公式(2)所示:
在進(jìn)行回歸預(yù)測時(shí),首先求出未知樣品光譜矩陣的得分TX,再根據(jù)公式(3)得到組分濃度預(yù)測值,如公式(3)所示:
在該算法的整個(gè)運(yùn)算過程中,矩陣的分解和回歸分析是同時(shí)進(jìn)行的,計(jì)算新的主成分時(shí),首先交換T和U,使X的主成分和測量矩陣Y直接關(guān)聯(lián).
偏最小二乘PLS算法分析是通過建立光譜數(shù)據(jù)和品種分類之間的回歸模型來實(shí)現(xiàn)的[4].使用PLS分析得到的結(jié)果中,不僅可以建立更優(yōu)化的回歸模型,還可以同時(shí)進(jìn)行主成分分析來簡化數(shù)據(jù)結(jié)構(gòu),觀察變量之間的相互關(guān)系等研究內(nèi)容,提供更多的建模信息[4].
所有的獨(dú)立變量都可以包含在最終建立的回歸模型中,PLS可以有效解決變量多重性問題.
目前,在光譜分析中多數(shù)應(yīng)用都使用的多元校正方法.Mauer等[5]使用近紅外光譜和中紅外光譜對嬰兒奶粉中三聚氰胺的含量進(jìn)行定量檢測,使用偏最小二乘法(PLS)建??梢钥焖贆z測出三聚氰胺含量最低值.
主成分分析是一種線性投影方法,它主要被應(yīng)用在多元統(tǒng)計(jì)分析中,在不損害樣本的原始信息的前提下,對高維數(shù)據(jù)進(jìn)行降維處理,將其映射到低維空間中.PCA的基本思路是通過最優(yōu)化方法簡化樣本的數(shù)據(jù)矩陣,降低維數(shù),從原本樣本的指標(biāo)中,得到幾個(gè)主成分,用來揭示樣本中包含的信息.
計(jì)算步驟首先是對原始數(shù)據(jù)矩陣X進(jìn)行拆分,如公式(4)所示:
借助投影矩陣LT將X投影到多維子空間.T中的列向量和L中的列向量是相互正交的關(guān)系,如公式(5)所示:
重建后的數(shù)據(jù)變量相互獨(dú)立,各主成分按照方差順序進(jìn)行排列,第一主成分包含了數(shù)據(jù)方差的絕大部分,排名越靠前的主成分,其所包含的的數(shù)據(jù)信息量越大[6].經(jīng)過計(jì)算所得到的新的橫坐標(biāo)是樣本原來變量的線性組合.第一主成分元素可以表示為如下形式:
主成分分析的對象減少,從而可以有效地降低分析的工作量和誤差.分析過程中只使用獨(dú)立變量,這樣可以達(dá)到消除噪音的目的.對數(shù)據(jù)進(jìn)行降維處理可以幫助信息的提取和聚類分析.
在區(qū)分產(chǎn)于紹興和嘉善的中國米酒的實(shí)驗(yàn)中,使用到近紅外光譜技術(shù),在區(qū)分的過程中,同時(shí)使用到主成分分析法和偏最小二乘法建立判別模型,準(zhǔn)確率高達(dá)100%[7].
BP算法又稱為誤差反向傳播算法,是人工神經(jīng)網(wǎng)絡(luò)中的一種基于誤差反向傳播的監(jiān)督式學(xué)習(xí)算法[8].在理論上,BP神經(jīng)網(wǎng)絡(luò)算法可以逼近任意函數(shù),基本的結(jié)構(gòu)是由很多非線性變化的單元組成,具有實(shí)現(xiàn)輸入和輸出數(shù)據(jù)高度非線性映射能力.人工神經(jīng)網(wǎng)絡(luò)是對人類大腦結(jié)構(gòu)以及信息處理運(yùn)作過程進(jìn)行模擬之后,提出的信息處理系統(tǒng).因此具有自學(xué)習(xí)和自適應(yīng)的能力[9].
BP神經(jīng)網(wǎng)絡(luò)的計(jì)算包括正向和反向兩個(gè)子過程.正向傳播過程中,是從輸入層逐層轉(zhuǎn)向傳出層.如果輸出和期望不同的時(shí)候,則進(jìn)行反向傳播,把誤差沿著正向傳播路徑的原路徑反向傳播回去,經(jīng)過各個(gè)神經(jīng)元的修改,使得誤差達(dá)到最小.
BP神經(jīng)網(wǎng)絡(luò)法的缺點(diǎn)是學(xué)習(xí)速度慢;在解決全局問題時(shí),很有可能陷入局部最優(yōu)化,使得訓(xùn)練失敗;由于學(xué)習(xí)能力和泛化能力之間的矛盾,過程中容易出現(xiàn)“過擬合”現(xiàn)象[25].
Mutlu等[10]在預(yù)測面粉的蛋白質(zhì)和水分含量等相關(guān)參數(shù)時(shí),使用到近紅外光譜進(jìn)行檢測和人工神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)處理,得到的相關(guān)系數(shù)分別為 0.952,0.948,0.933,0.920,0.917和 0.832,有效的證明了近紅外光譜結(jié)合神經(jīng)網(wǎng)絡(luò)算法可以很好地解決此類問題.
支持向量機(jī)算法的優(yōu)化原則是采用以結(jié)構(gòu)化風(fēng)險(xiǎn)最小化取代我們常用的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化;基本思想是利用核函數(shù)代替向高維空間的非線性映射,對于樣本,若是非線性可再分,則構(gòu)建一個(gè)或多個(gè)甚至無限多個(gè)高維的超平面,在經(jīng)過變換后的高維空間,利用這個(gè)超平面來對樣本點(diǎn)進(jìn)行分類.一個(gè)好的超平面要求離分類邊界最近的訓(xùn)練樣本點(diǎn)的與分類邊界的距離越大越好,這個(gè)距離被稱之為間隔(Margin),這些樣本點(diǎn)被稱之為支持向量.SVM的目標(biāo)就是要找出使間隔最大的分類超平面[11].
給定的樣本集,步驟一般如下:首先要將樣本集分為訓(xùn)練集和測試集,訓(xùn)練集是(x1,y1)(x2y2)…(xiyi),其中橫坐標(biāo) xi∈Rn為輸入變量的值,yi∈Rn為相應(yīng)的輸出值.通過對訓(xùn)練集進(jìn)行機(jī)器學(xué)習(xí),尋求最優(yōu)化的模式M(x),要求這個(gè)模式不僅滿足訓(xùn)練集輸入和輸出的對應(yīng)關(guān)系,而且對于測試集的樣本輸入變量的值進(jìn)行預(yù)測,同樣能得到效果較好的輸出.
在支持向量機(jī)算法中,使用不同的核函數(shù)會產(chǎn)生不同的算法[25],因?yàn)镾VM具有優(yōu)秀的泛化能力,所以是一種適合小樣本的學(xué)習(xí)方法.在SVM進(jìn)行分類的時(shí)候,起到?jīng)Q定性作用的是支持向量.計(jì)算的復(fù)雜性取決于支持向量的數(shù)目,在實(shí)驗(yàn)的過程中只需要抓住關(guān)鍵的樣本.SVM在運(yùn)算的過程中很少涉及到概率測度及大數(shù)定律等規(guī)律,而且支持向量法整體具有較好的“魯棒”性[12].
在數(shù)據(jù)挖掘的實(shí)際應(yīng)用中,一般要解決多類的分類問題[13].如:將SVM與粗集理論結(jié)合,形成一種優(yōu)勢互補(bǔ)的多類問題的組合分類器[14].
攀玉霞等[15]在研究豬肉肉糜樣本,采用支持向量機(jī)回歸方法建立相應(yīng)參數(shù)的模型模型.在這個(gè)研究中,實(shí)驗(yàn)者以魚糜為研究對象,使用支持向量機(jī)(SVM)建立其水分和蛋白質(zhì)的定量分析模型.
最小二乘支持向量機(jī)(least square support vector machines,LS-SVM)是支持向量機(jī)的一種類型[16],是在經(jīng)典SVM的基礎(chǔ)上改進(jìn)得來的.LS-SVM既可以進(jìn)行線性,也可以進(jìn)行非線性的多元建模,支持少量的訓(xùn)練樣本中高維特征空間的學(xué)習(xí),是解決多元建模的一種快速方法[17].
最小二乘支持向量機(jī)具有建模速度快、優(yōu)化參數(shù)少、泛化能力強(qiáng)等優(yōu)點(diǎn),因此被廣泛應(yīng)用于近紅外光譜技術(shù)檢測的定量分析中[17].最小二乘支持向量機(jī)同時(shí)具有很好的非線性處理能力,可以用于快速建立多元模型[18].
羅微等[4]在對白菜種子不同品種的鑒別的實(shí)驗(yàn)中,建立最小二乘支持向量機(jī)(partial least squares discrimination analysis,PLS-DA)和偏最小二乘判別的模型.
在K最近鄰分類算法(K-nearest neighbor,KNN)算法中每個(gè)樣本都可以用它最接近的k個(gè)鄰居來代表.KNN算法的核心思想是在特征空間中,如果以一個(gè)樣本為中心,它周圍最相鄰的k個(gè)樣本,它們大多數(shù)屬于某一個(gè)類別,則這個(gè)樣本也屬于這個(gè)類別,并且具有這個(gè)類別上其他k個(gè)樣本的特性.
如圖1所示,有三類不同樣本,分別以方框、空心圓點(diǎn)和實(shí)心圓點(diǎn)表示.其中以“+”標(biāo)記出的樣本,需要分析出它所屬的類別.在此圖中以該樣本作為圓心,畫出兩個(gè)圓,如果以小圓為界線,只有2個(gè)實(shí)心圓點(diǎn)落在小圓的范圍內(nèi),此時(shí)按照KNN原理應(yīng)該將樣本劃分為實(shí)心圓點(diǎn)那一類.如果以大圓為界線,共有10個(gè)點(diǎn)落在了大圓的范圍內(nèi),其中有3個(gè)方框類,有8個(gè)實(shí)心圓點(diǎn)類,按照KNN理論,也應(yīng)該被劃為實(shí)心圓點(diǎn)這一類.這說明K值的大小對判別的結(jié)果是有一定的影響的.如果K>1,則這K個(gè)最近鄰樣本不一定都屬于這一類.如果K=1,很自然這一個(gè)最近鄰樣本屬于哪類,那么未知樣本就屬于此類[19].
圖1 K最近鄰算法原理示意圖Fig.1 Schematic diagram of K-Nearest Neighbor algorithm
KNN分類算法的最大優(yōu)點(diǎn)是其適合于屬性較多或者數(shù)據(jù)量很大的問題.在進(jìn)行數(shù)據(jù)處理的過程中,不需要提前設(shè)計(jì)分類器對訓(xùn)練樣本進(jìn)行分類,而是可以直接進(jìn)行分類,確定每個(gè)類的類標(biāo)識號,不需要估計(jì)參數(shù),無需訓(xùn)練;在解決多分類的問題上KNN比SVM表現(xiàn)要好.
KNN在實(shí)際的應(yīng)用中存在下面兩個(gè)問題:當(dāng)對估計(jì)參數(shù)沒有相應(yīng)的限制時(shí),訓(xùn)練集的數(shù)目又比較大,這時(shí)尋找最近鄰所花費(fèi)的時(shí)間較長.其次,對于觀測集的增長速度有較高要求.
K最近鄰分類算法被廣泛應(yīng)用于模式識別、數(shù)據(jù)挖掘、后驗(yàn)概率統(tǒng)計(jì)、相似性分析、計(jì)算機(jī)視覺和生物信息學(xué)等各種人工智能領(lǐng)域[19].倪力軍等在鑒別真奶和假奶樣品中各成分的實(shí)驗(yàn)中,使用近紅外光譜對所有的樣品進(jìn)行檢測,并使用改進(jìn)的K最鄰近結(jié)點(diǎn)算法和支持向量機(jī)法分別建立判別各類摻假物質(zhì)的模型[20].
主要用來判斷樣品的類別,即可以對樣品中的成分進(jìn)行定性分析,線性判別分析法(linear discriminant analysis,LDA)在醫(yī)學(xué)診斷、氣象學(xué)、市場預(yù)測、經(jīng)濟(jì)學(xué)和地質(zhì)勘探等領(lǐng)域中均已起著重要作用[20].
LDA算法的基本思想是通過特征向量將已經(jīng)分組的數(shù)據(jù)向低維的方向投影,使得同一個(gè)組的數(shù)據(jù)關(guān)系更為緊密,不同組的之間盡可能的分開.LDA的目標(biāo)是要根據(jù)樣本中的n個(gè)指標(biāo)變量x=(x1,x2,…,xn)T建立一個(gè)最優(yōu)分類判別函數(shù),判別函數(shù)的建立最終是尋找一個(gè)矢量ω=(ω1,ω2,…ωn)T,那建立一個(gè)如下的判別模型,如公式(9)所示:
矢量ω是個(gè)常數(shù),稱作閥值權(quán),相應(yīng)的決策規(guī)則則可表示為,如公式(10)所示:
f(ω,x)=0是相應(yīng)的決策面方程,如公式(11)所示:
f(ω,x)也就是該決策面到d維空間中任一點(diǎn)ω距離的代數(shù)度量,根據(jù)其到該面距離的正負(fù)號,該決策平面將樣本分類,并且確定出相應(yīng)的類別.ω(ω0≠0)表示的是決策面在特征空間中的位置,當(dāng)其值為0時(shí),表示這個(gè)決策面過原點(diǎn).
線性判別分析算法是從訓(xùn)練集中訓(xùn)練出判別函數(shù),當(dāng)?shù)玫叫碌臉悠窌r(shí),根據(jù)相關(guān)的判別準(zhǔn)則對其與判別函數(shù)之間的相似程度進(jìn)行比較.由于線性判別分析算法在應(yīng)用的時(shí)候需要樣本標(biāo)簽,屬于有監(jiān)督學(xué)習(xí)降維.
連續(xù)投影算法(successive projections algorithm,SPA)是在線性空間中,使共線性達(dá)到最小化的一種前向變量選擇算法[21].
設(shè)定標(biāo)集中樣品個(gè)數(shù)為n,包含波長數(shù)為m,組成一個(gè)光譜矩陣 Xn×m,SPA從任選一個(gè)波長作為起始波長點(diǎn),循環(huán)進(jìn)行搜索,搜索投影中沒有被引入波長組合的部分,每次都將最大的投影方向不斷地引入,直到循環(huán)w(w<n-1)次以后,就可以形成一個(gè)波長鏈,使得此鏈中的任意相鄰兩個(gè)波長之間線性關(guān)系最小[22].算法如下:
初始化波長:令n=1,任取一個(gè)波長xj作為算法循環(huán)的起始點(diǎn),記為xm(0).把剩下的沒有選擇到波長鏈中的所有波長,記為一個(gè)集合s={j,1 ≤j≤m,j?{m(0),m(1),…,m(n-1)}}
計(jì)算s中波長與xj的投影向量,如公式(12)所示:
選擇其中最大的投影,并且記錄下相應(yīng)序號作為入選的波長,如公式(13)所示:
當(dāng)n=w時(shí)停止循環(huán),否則返回到第二步不斷地做投影優(yōu)選波長.這樣總共得到w×m個(gè)模型.
連續(xù)投影算法的優(yōu)點(diǎn)是:最大程度的降低了變量之間的共線性,提取最低限度的冗余信息變量組可以減少建立模型所需要變量的個(gè)數(shù),提高建模效率和速度[23].
浙江大學(xué)[21]利用鮮肉的近紅外光譜中少量特征波長對其pH值進(jìn)行預(yù)測,可以大幅度降低模型復(fù)雜性和計(jì)算量,通過連續(xù)投影算法(SPA)選擇特征波長,并且得到相應(yīng)的多元線性回歸模型.
偏最小二乘法是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,通常被用于曲線擬合.主成分分析法是一種降維的統(tǒng)計(jì)方法,使用各主成分代替原有的變量進(jìn)行回歸分析.偏最小二乘法在建模的過程中包含了主成分分析的特點(diǎn),因此在這兩種算法中,偏最小二乘法的性能明顯優(yōu)于主成分分析法.吳遠(yuǎn)遠(yuǎn)等人在老陳醋可溶性固形物定量分析的實(shí)驗(yàn)當(dāng)中,分別采用PCR和PLS建立SSC的定量分析模型,結(jié)果表明,采用5點(diǎn)平滑預(yù)處理后,利用PLS建立的老陳醋SSC的定量分析模型最優(yōu)[24].
SVM最基本的應(yīng)用是分類,求解最優(yōu)分類面,然后用于分類.支持向量機(jī)可以較好的解決小樣本的分類問題,泛化功能好.張海云等人在對生鮮豬肉水分含量進(jìn)行無損檢測的實(shí)驗(yàn)中,對比了PLS和SVM的性能.實(shí)驗(yàn)結(jié)果分析后得到,采用SVM方法建模要明顯好于PLS建立回歸模型法[13].
LDA是一種有效的特征抽取方法,能夠使投影后模式樣本的類間三部矩陣最大,同時(shí)保證類內(nèi)散布矩陣最小.
BP和SVM是分類領(lǐng)域中的兩種重要的方法.神經(jīng)網(wǎng)絡(luò)是模擬人腦神經(jīng)系統(tǒng)的數(shù)學(xué)模型,具有高度并行性、較強(qiáng)的自學(xué)習(xí)自適應(yīng)和聯(lián)想記憶功能特點(diǎn)[25].神經(jīng)網(wǎng)絡(luò)算法具有強(qiáng)大的非線性處理能力,其中使用最為廣泛的就是前饋神經(jīng)網(wǎng)絡(luò)[26].SVM算法在小樣本上表現(xiàn)明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò).KNN分類算法則在多分類問題上表現(xiàn)比SVM要好.算法的優(yōu)缺點(diǎn)對比,如表1所示.
表1 算法對比Tab.1 Algorithm comparison
由于所做實(shí)驗(yàn)數(shù)據(jù)是小樣本,因此在選擇分類算法時(shí)會選擇SVM算法.今后的研究方向主要是使用改進(jìn)的支持向量機(jī)算法對近紅外光譜無損檢測的數(shù)據(jù)進(jìn)行分析.與其他分析方法相比,SVM能夠很好地克服其他算法中出現(xiàn)的訓(xùn)練時(shí)間長,結(jié)果不準(zhǔn)確等特點(diǎn).其中LS-SVM可以降低支持向量數(shù)目,減少變量存儲空間和計(jì)算量,可以用來提高實(shí)際應(yīng)用中定量分析的效率.
近年來,支持向量機(jī)結(jié)合近紅外光譜技術(shù),被用于煤種分類、山茶油摻假鑒別、識別樹種和無損檢測的實(shí)驗(yàn)中,均得到了相當(dāng)不錯(cuò)的結(jié)果.
[1] 黃瑞娟.紅外光譜技術(shù)在食品檢測中的應(yīng)用[J].現(xiàn)代測量與實(shí)驗(yàn)室管理,2015(1):9-14.HUANG R J.Application of infrared spectroscopy in food detection [J]. Advanced Measurementand Laboratory Management,2015(1):9-14.
[2] MODAREST F, ARAGHINEJAD S.A comparative assessment of support vector machines,probabilistic neural networks,and k-nearest neighbor algorithms for water quality classification [J].Water Resources Management,2014,28(12):4095-4111.
[3] 譚正林,金國粱,吳夢婷,等.奶油中人工色素檢測方法概述[J]. 食品安全質(zhì)量檢測學(xué)報(bào),2017,8(2):468-474.TAN Z L,JIN G L,WU M T,et al.Overview on detection methods of artificial pigments in cream[J].Journal of Food Safety& Quality,2017,8(2):468-474.
[4] 章海亮,羅微,杜焱喆.PCA和SPA的近紅外光譜識別白菜種子品種研究[J].光譜學(xué)與光譜分析,2016,36(11):3536-3541.ZHANG H L,LUO W,DU Y Z.Discrimination of varieties of cabbage with near infrared spectra based on PCA and SPA[J].Spectroscopy and Spectral Analysis,2016,36(11):3536-3541.
[5] MAUER L J,CHERNYSHOVA A A,HIATT A N,et al.Melamine detection in infant formula powder using near-and mid-infrared spectroscopy[J]. Journalof Agricultural and Food Chemistry.2009,57(10):3974-3980.
[6] 閻吉祥,王茜蒨,黃志文,等.基于主成分分析和人工神經(jīng)網(wǎng)絡(luò)的激光誘導(dǎo)擊穿光譜塑料分類識別方法研究[J]. 光譜學(xué)與光譜分析,2012(12):3179-3182.YANJX,WANGQQ,HUANGZW,et al.Classification of plastics with laser-induced breakdown spectroscopy based on principal component analysis and artificial neural network model[J].Spectroscopy and Spectral Analysis,2012(12):3179-3182.
[7] 劉洪林.基于近紅外光譜技術(shù)(NIRS)對工夫紅茶含水率、游離態(tài)氨基酸、茶多酚品質(zhì)成分評價(jià)研究[J].食品工業(yè)科技,2016,37(12):67-70.LIU H L.Research to moisture content,free form amino acids,polyphenols quality ingredients of Kungfu black tea by near infrared spectroscopy[J].Science and Technology of Food Industry,2016,37(12):67-70.
[8] 徐可欣,苗靜,曹玉珍,等.基于二維相關(guān)近紅外譜參數(shù)化及BP神經(jīng)網(wǎng)絡(luò)的摻雜牛奶鑒別[J].光譜學(xué)與光譜分析,2013,33(11):3032-3035.XU K X,MIAO J,CAO Y Z,et al.Identification of adulterated milk based on two-dimensional correlation near-infrared spectra parameterization and BP neural network [J]. Spectroscopy and SpectralAnalysis,2013,33(11):3032-3035.
[9] WANG Y S,LI Q Y.Application study on assistive movement training using BP neural network[C]//Internation Conrerence on Computational Science and Engineering.Paris: Atlantis Press, zeger karssen,2015:274-277.
[10] MUTLU A C,BOYACI I H,GENIS H E,et al.Prediction of wheat quality parameters using near-infrared spectroscopy and artificial neural networks[J].European Food Research&Technology,2011,233(2):267-274.
[11] 白京,彭彥昆,王文秀.基于可見近紅外光譜玉米種子活力的無損檢測方法[J].食品安全質(zhì)量檢測學(xué)報(bào),2016,7(11):4472-4477.BAI J,PENG Y K,WANG W X.Discrimination of vitality of maize seeds based on near visible infrared spectroscopy[J].Journal of Food Safety and Quality,2016,7(11):4472-4477.
[12] 王小燕,王錫昌,劉源,等.基于SVM算法的近紅外光譜技術(shù)在魚糜水分和蛋白質(zhì)檢測中的應(yīng)用[J].光譜學(xué)與光譜分析,2012,32(9):2418-2421.WANG X Y,WANG X C,LIU Y,et al.Application of near infrared spectroscopy technique based on support vector machine in the measurement of moisture and protein contents in surimi[J].Spetroscopy and Spectral Analysis,2012,32(9):2418-2421.
[13] 張海云,彭彥昆,王偉,等.基于光譜技術(shù)和支持向量機(jī)的生鮮豬肉水分含量快速無損檢測[J].光譜學(xué)與光譜分析,2012,32(10):2794-2798.ZHANG H Y,PENG Y K,WANG W,et al.Rapid nondestructive detection of water content in fresh pork based on spectroscopy technique combined with support vector machine[J].Spetroscopy and Spectral Analysis,2012,32(10):2794-2798.
[14] 吳習(xí)宇,趙國華,祝詩平.近紅外光譜分析技術(shù)在肉類產(chǎn)品檢測中的應(yīng)用研究進(jìn)展[J].食品工業(yè)科技,2014,35(1):371-374,380.WU X Y,ZHAO G H,ZHU S P.Study on the application of near infrared spectroscopy in the meat quality evaluation[J].Science and Technology of Food Industry,2014,35(1):371-374,380.
[15] 陳彬,劉閣,張賢明.連續(xù)投影算法的潤滑油中含水量的近紅外光譜分析[J].紅外與激光工程,2013(12):3168-3174.CHEN B,LIU G,ZHANG X M.Analysis on near infrared spectroscopy of water content in lubricating oil using successive projections algorithm [J].Infrared and Laser Engineering,2013(12):3168-3174.
[16] ZHANG N,SHETTY D.An effective LS-SVM based approach for surface roughness prediction in machined surfaces[J].Neurocomputing,2016,198:35-39.
[17] 喬延江,徐冰,王星,等.基于遺傳算法的多目標(biāo)最小二乘支持向量機(jī)在近紅外多組分定量分析中的應(yīng)用[J]. 光譜學(xué)與光譜分析,2014(3):638-642.QIAO Y J,XU B,WANG X,et al.Genetic algorithm based multi-objectiveleastsquaresupportvector machine for simultaneous determination of multiple components by near infrared spectroscopy [J].Spectroscopy and SpectralAnalysis, 2014(3) :638-642.
[18] JI J,ZHANG C S,GUI Y L,et al.New observations on the application ofLS-SVM in slope system reliability analysis[J].Journal of Computing in Civil Engineering,2016(10):601-602.
[19] 劉應(yīng)東,?;菝?基于K-最近鄰圖的小樣本KNN分類算法[J]. 計(jì)算機(jī)工程,2011,37(9):198-200.LIU Y D,NIU H M.KNN classification algorithm based on K-nearest neighbor graph for small sample[J].Computer Engineering,2011,37(9):198-200.
[20] 倪力軍,鐘霖,張鑫,等.近紅外光譜結(jié)合非線性模式識別方法進(jìn)行牛奶中摻假物質(zhì)的判別[J].光譜學(xué)與光譜分析,2014(10):2673-2678.NI L J,ZHONG L,ZHANG X,et al.Identification of adulterantsin adulterated milksby nearinfrared spectroscopy combined with non-linear pattern recognition methods[J].Spectroscopy and Spectral Analysis,2014(10):2673-2678.
[21] 伍學(xué)千,廖宜濤,樊玉霞,等.連續(xù)投影算法在豬肉PH值無損檢測中的應(yīng)用[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(增刊):379-383.WU X Q,LIAO Y T,F(xiàn)AN Y X,et al.Application of successive projections algorithm to nondestructive determination of pork PH value[J].Transactions of the Chinese Society of Agricultural Engineering 2010,26(Suppl.):379-383.
[22] CHENG J H,SUN D W,PU H,et al.Combining the genetic algorithm and successive projection algorithm for the selection of feature wavelengths to evaluate exudative characteristics in frozen-thawed fish muscle[J].Food Chemistry,2016(197):855-863.
[23] 應(yīng)義斌,介鄧飛,謝麗娟,等.近紅外光譜變量篩選提高西瓜糖度預(yù)測模型精度[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(12):264-270.YING Y B,JIE D F,XIE L J,et al.Improving accuracy of prediction model for soluble solids content of watermelon by variable selection based on near-infrared spectroscopy[J]. Transaction of the Chinese Society of Agricultural Engineering,2013,29(12):264-270.
[24] 王福杰,吳遠(yuǎn)遠(yuǎn),陸輝山,等.基于近紅外光譜技術(shù)的老陳醋可溶性固形物定量分析[J].中國釀造,2016(8):69-72.WANG F J,WU Y Y,LU H S,et al.Quantitative analysis of soluble solids content in mature vinegar based on near infrared spectroscopy technology[J].China Brewing,2016(8):69-72.
[25] 孫劍偉,王宏濤.基于BP神經(jīng)網(wǎng)絡(luò)和SVM的分類方法研究[J]. 軟件,2015,36(11):96-99.SUN J W,WANG H T.Research on the classification method based on BP neural network and SVM[J].Software,2015,36(11):96-99.
[26] 馮先成,李寒,周密,等.基于前饋神經(jīng)網(wǎng)絡(luò)的智慧城市空巢老人識別[J].武漢工程大學(xué)學(xué)報(bào),2015,37(10):36-39.FENG X C,LI H,ZHOU M,et al.Recognition of empty-nest elders in intelligent city based on feedforward neural network[J].Journal of Wuhan Institute of Technology,2015,37(10):36-39.
Overview of Data Analysis Methods in Near-Infrared Spectroscopy Nondestructive Testing
LIU Jun1,3,WU Mengting1,3,TAN Zhenglin2,LI Wei1,3
1.Hubei Key Laboratory of Intelligent Robot(Wuhan Institute of Technology),Wuhan 430205,China;2.Department of Cuisine and Nutrition Education,Hubei University of Economics,Wuhan 430205,China;
3.School of Computer Science and Engineering,Wuhan Institute of Technology,Wuhan 430205,China
Near-infrared spectroscopy nondestructive testing technology can be used for variety identification and the qualitative or quantitative analysis of agricultural products.The basic principle of near-infrared spectroscopy and the methods of near-infrared spectrum analysis were introduced.The data analysis methods in near-infrared nondestructive testing technology aim at finding the relationship between the spectrum and the corresponding concentration through the quantitative analysisofthe spectrum,and establishing the corresponding mathematical model,which mainly include partial least squares regression,principal component analysis,back propagation artificial neural network,support vector machine(SVM),K-Nearest neighbor classification algorithm and linear discriminant analysis.The comparison result of these analytical models show that SVM method may be a future research direction in near infrared spectrum data analysis.
near-infrared spectroscopy;nondestructive testing;data analysis methods
2017-05-20
湖北省食品藥品監(jiān)督管理局項(xiàng)目(201610+13);湖北省智能機(jī)器人重點(diǎn)實(shí)驗(yàn)室開放基金(HBIR 201608);武漢工程大學(xué)研究生創(chuàng)新基金(CX2016063)
劉 軍,博士,副教授.E-mail:liujun@wit.edu.cn
劉軍,吳夢婷,譚正林,等.近紅外光譜無損檢測技術(shù)中數(shù)據(jù)的分析方法概述[J].武漢工程大學(xué)學(xué)報(bào),2017,39(5):496-502.
LIU J,WU M T ,TAN Z L,et al.Overview of data analysis methods in near-infrared spectroscopy nondestructive testing[J].Journal of Wuhan Institute of Technology,2017,39(5):496-502.
R857.3
A
10.3969/j.issn.1674-2869.2017.05.001
1674-2869(2017)05-0496-07
陳小平