鄭立章 龔中良 文 韜,2 董 帥 桑孟祥
(中南林業(yè)科技大學(xué)機(jī)電工程學(xué)院1,長沙 410004) (華南農(nóng)業(yè)大學(xué)南方農(nóng)業(yè)機(jī)械與裝備關(guān)鍵技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室2,廣州 510642)
基于高光譜技術(shù)的秈稻霉變程度鑒別模型構(gòu)建與優(yōu)化
鄭立章1龔中良1文 韜1,2董 帥1桑孟祥1
(中南林業(yè)科技大學(xué)機(jī)電工程學(xué)院1,長沙 410004) (華南農(nóng)業(yè)大學(xué)南方農(nóng)業(yè)機(jī)械與裝備關(guān)鍵技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室2,廣州 510642)
為解決快速無損鑒別秈稻霉變程度問題,利用高光譜技術(shù)采集200份霉變樣本可見/近紅外光譜信息,隨機(jī)選取155份樣本作為校正集,剩余45份作為驗(yàn)證集,根據(jù)預(yù)測濃度殘差檢驗(yàn)標(biāo)準(zhǔn)對校正集中異常樣本進(jìn)行剔除。以新校正集建立主成分線性判別分析(PCA-LDA)和簇類獨(dú)立軟模式法(SIMCA)模型,選用正確識別率為指標(biāo),優(yōu)選最佳鑒別模型。并采用連續(xù)投影算法(SPA)提取特征波長,優(yōu)化優(yōu)選的最佳模型構(gòu)建速度。研究結(jié)果表明,PCA-LDA對所有樣本的誤判總數(shù)為15,正確識別率為92.50%;SIMCA和SPA-SIMCA對所有樣本的未能正確識別總數(shù)分別為6、2,正確識別率分別為97.00%、99.00%,并且經(jīng)SPA篩選的變量數(shù)為20,僅占原始變量數(shù)的7.81%,建模時(shí)長縮短為原始變量的40.93%。因此,SPA-SIMCA鑒別效果最好,該方法在快速、準(zhǔn)確鑒別秈稻霉變程度上具有可行性。
高光譜技術(shù) 霉變秈稻 鑒別 簇類獨(dú)立軟模式法 連續(xù)投影算法
稻谷的生產(chǎn)具有季節(jié)性,儲藏時(shí),所含淀粉、蛋白質(zhì)及碳水化合物等成分在微生物作用下會發(fā)生變化,導(dǎo)致其營養(yǎng)價(jià)值和品質(zhì)降低,甚至有可能霉變[1]。霉變稻谷一旦流入市場,必將存在安全隱患,因此,如何快速、準(zhǔn)確鑒別稻谷霉變程度顯得尤為重要。稻谷霉變過程中會產(chǎn)生一種穩(wěn)定物質(zhì)(脂肪酸),該物質(zhì)會在霉變稻谷內(nèi)沉積[2-3],因此,稻谷的霉變程度可由脂肪酸含量衡量。
當(dāng)?shù)竟鹊闹舅岷砍^25 mg/100 g可認(rèn)為其開始霉變[4],但對霉變程度還鮮見具體量化標(biāo)準(zhǔn)。惠國華等[5]、張紅梅等[6]、鄒小波等[7]均根據(jù)培養(yǎng)時(shí)間確定谷物的霉變程度;陳紅等[8]根據(jù)不同霉變花生的外觀和顏色確定其霉變程度。通常將稻谷霉變程度劃分為3個(gè)等級,即輕度霉變、中度霉變和重度霉變。在輕度霉變時(shí),稻谷開始變色、潮濕;中度霉變時(shí),其胚部開始出現(xiàn)菌落,并伴有霉斑和霉味;重度霉變時(shí),稻谷產(chǎn)生刺鼻的霉味和酸味,出現(xiàn)結(jié)塊現(xiàn)象[9-10]。目前,主要依賴于人工檢測稻谷霉變程度,檢測員根據(jù)不同霉變稻谷的特點(diǎn)進(jìn)行分類,這種傳統(tǒng)的檢測方法比較費(fèi)時(shí),不適用于快速鑒別。
高光譜分析是一種操作簡便、快速、綠色環(huán)保的檢測技術(shù),該技術(shù)用于霉變農(nóng)作物的理化指標(biāo)測定[11-15]的研究報(bào)道較多,但對其霉變程度的鑒別報(bào)道相對較少,近年來,該技術(shù)逐步應(yīng)用于農(nóng)作物的霉變鑒別,如袁瑩等[16]應(yīng)用近紅外對霉變玉米進(jìn)行了檢測;周竹等[17]對霉變板栗進(jìn)行識別;黃星奕等[18]對霉變出芽花生進(jìn)行了鑒別,這些研究的鑒別準(zhǔn)確率范圍為87.8%~98.84%,為本試驗(yàn)提供了可行性技術(shù)支持。但上述研究方法很少涉及異常樣本對模型精度影響的研究,也很少涉及分析PCA-LDA和SIMCA方法對鑒別結(jié)果的影響。因此,本試驗(yàn)選取霉變秈稻作為研究對象,用高光譜分析儀采集4種不同霉變程度秈稻的光譜信息,將樣本隨機(jī)劃分為校正集和驗(yàn)證集,對校正集中異常樣本進(jìn)行剔除,采用新校正集構(gòu)建PCA-LDA和SIMCA鑒別模型,優(yōu)選最佳模型,并對其建模速度進(jìn)行優(yōu)化,以期為快速、準(zhǔn)確鑒別秈稻霉變程度提供一種新方法。
1.1 材料
試驗(yàn)材料分別為正常秈稻(C兩優(yōu)34156秈稻,為兩系雜交一季晚稻,含水量14.2%,千粒重23.1 g,由湖南農(nóng)業(yè)大學(xué)選育,主要種植在湖南地區(qū))和不同霉變程度秈稻(實(shí)驗(yàn)室培養(yǎng)制得),考慮到試驗(yàn)樣本應(yīng)具有普適性和代表性,結(jié)合傳統(tǒng)分級方法和參考文獻(xiàn)[4-7]所述的樣本劃分方法,將霉變秈稻劃分為3個(gè)等級:輕度、中度以及重度霉變。根據(jù)霉菌作用秈稻時(shí)間不同,使其產(chǎn)生不同程度霉變,故可用培養(yǎng)初始(正常稻谷)、第10、第20、第30天來標(biāo)記稻谷的4個(gè)霉變等級[19],每個(gè)等級樣本為50份,每份100 g,正常稻谷按實(shí)際儲藏要求(溫度10 ℃,相對濕度15%)進(jìn)行儲存,保證樣本不發(fā)生霉變。霉變稻谷儲藏溫度為30 ℃,相對濕度90%,模擬實(shí)際儲藏條件變化所導(dǎo)致的稻谷不同程度霉變結(jié)果。培養(yǎng)過程中借助傳統(tǒng)經(jīng)驗(yàn)觀察稻谷色澤和氣味的感官變化,并通過隨機(jī)抽樣測定培養(yǎng)霉變秈稻的脂肪酸含量,保證能獲得不同霉變程度樣本,培養(yǎng)結(jié)束后,測定其脂肪酸含量,最終獲得正常、輕度、中度和重度霉變秈稻的脂肪酸含量范圍分別為18.55~24.40、27.03~80.90、84.44~127.26、101.09~124.88 mg/100 g。
1.2 光譜數(shù)據(jù)采集及預(yù)處理
采用HyperSIS-VNIR-PFH高光譜成像分析儀(北京卓立漢光儀器有限公司)采集樣本的光譜信息,該系統(tǒng)內(nèi)部結(jié)構(gòu)如圖1所示。圖2為稻谷樣本在光譜檢測載物臺上的分布,通過高光譜相機(jī)采集每個(gè)稻谷的256個(gè)波段圖像,利用遙感圖像處理平臺選取載物臺上的稻谷樣本作為感興趣區(qū)域,通過計(jì)算感興趣區(qū)域的各個(gè)像素點(diǎn)的光譜反射率平均值,作為觀測稻谷的光譜反射率。其中理想曝光時(shí)間20 ms,平臺移動速度14.6 mm/s,掃描距離150 mm,光譜范圍380~1 000 nm,光譜分辨率2.8 nm。
注:1 高光譜相機(jī);2 光源;3 暗箱;4 載物臺;5 線性導(dǎo)軌圖。圖1 高光譜信息采樣系統(tǒng)
圖2 稻谷樣本在光譜檢測載物臺上的分布
采用Unscrambler 10.3和Matlab R2013a軟件對光譜數(shù)據(jù)進(jìn)行處理和分析。由于高光譜分析儀采集的數(shù)據(jù)在反映樣品化學(xué)信息的同時(shí),也會受到其物理性質(zhì)和環(huán)境因素的影響,例如由稻谷樣本顆粒不均勻產(chǎn)生的散射、儀器和環(huán)境噪聲以及基線漂移為光譜數(shù)據(jù)引入了較大誤差。故采用Savitzky-Golay平滑(savitzky-golay,SG)、多元散射校正(multiplicative scatter correction,MSC)、一階導(dǎo)數(shù)(first derivation,FD)、二階導(dǎo)數(shù)(second derivation,SD)對光譜進(jìn)行預(yù)處理以提高建模和預(yù)測效果,通過對比優(yōu)選最佳預(yù)處理方法。
1.3 建模方法
利用霉變秈稻的可見/近紅外光譜信息,分別選用主成分線性判別分析(principal component analysis-linear discriminate analysis,PCA-LDA)和簇類獨(dú)立軟模式法(soft independent modeling of class analogy,SIMCA)構(gòu)建秈稻霉變程度鑒別模型。其中PCA-LDA算法是對所有類樣本的光譜數(shù)據(jù)進(jìn)行特征壓縮,然后建立數(shù)學(xué)模型,并將所有未知樣本與數(shù)學(xué)模型進(jìn)行擬合,從而判斷樣本所屬的類,而SIMCA則是針對每一類樣本的光譜數(shù)據(jù)進(jìn)行主成分分析,建立每一類主成分分析數(shù)學(xué)模型,然后分別將未知樣品與各類樣品的數(shù)學(xué)模型進(jìn)行逐一擬合,進(jìn)而判斷未知樣品的類別。
鑒別模型的構(gòu)建如圖3所示,對霉變秈稻賦值,即正常為1、輕度為2、中度為3、重度為4,以此作為真實(shí)分類變量;隨機(jī)選取155份樣本作校正集(正常、輕度、中度、重度分別為39、39、37、40),脂肪酸含量范圍為18.55~127.26 mg/100 g,剩余45份作為驗(yàn)證集(正常、輕度、中度、重度分別為11、11、13、10),脂肪酸含量范圍為18.74~116.55 mg/100 g;對校正集樣本采用留一交叉驗(yàn)證MLR建模,根據(jù)預(yù)測濃度殘差檢驗(yàn)標(biāo)準(zhǔn)[20]剔除校正集中異常樣本;采用新校正集建立PCA-LDA和SIMCA模型,并對驗(yàn)證集樣本進(jìn)行預(yù)測分類,以正確識別率為評價(jià)指標(biāo),優(yōu)選最佳鑒別模型;采用連續(xù)投影算法(successive projections algorithm,SPA)篩選特征變量,壓縮輸入變量,簡化最佳鑒別模型。
圖3 模型的建立與評價(jià)
2.1 可見/近紅外光譜特征分析
4種霉變程度秈稻的光譜數(shù)據(jù)經(jīng)SG平滑預(yù)處理后的平均光譜圖如圖4所示。由圖4可知,4條光譜反射率曲線整體變化趨勢基本相同,呈現(xiàn)霉變秈稻所特有的光譜變化規(guī)律:在波長為380~700、850~1 000 nm時(shí),光譜反射率有較明顯變化,在波長為700~850 nm時(shí),光譜反射率無明顯變化。在波長為420 nm附近時(shí),4條反射率曲線均出現(xiàn)不同程度的低谷,在波長為450~700 nm時(shí),光譜反射率變化趨勢隨著秈稻霉變程度的加深而減緩,此波長范圍內(nèi),光譜反射率差異明顯,其中正常和重度霉變樣本的反射率曲線差異最大,表明在后期鑒別時(shí)較容易區(qū)分2者。但輕度和中度霉變樣本的反射率曲線差異較小,這必定給后期準(zhǔn)確鑒別2者帶來困難。在波長為850~1 000 nm時(shí),正常、中度和重度霉變樣本的反射率曲線差異較大,其反射率值均有所下降,但正常和輕度霉變樣本的反射率基本重合。
2.2 剔除異常的校正集樣本
當(dāng)校正集中存在異常樣本時(shí),使用該樣本集建立模型,會使其可靠性和預(yù)測精度降低。因此,必須尋找和剔除異常樣本,保證模型的有效性。試驗(yàn)先采用PCA對光譜數(shù)據(jù)進(jìn)行壓縮,根據(jù)主成分累計(jì)貢獻(xiàn)率確定較佳主成分?jǐn)?shù),其前1、2、3、4個(gè)主成分累計(jì)貢獻(xiàn)率分別為98.96%、99.57%、99.91%、99.95%,前3個(gè)主成分累計(jì)貢獻(xiàn)率已達(dá)99.91%,說明其包含了原始光譜的99.91%的信息。以該較佳主成分作為輸入變量,采用留一交叉驗(yàn)證MLR法計(jì)算預(yù)測值與真實(shí)分類變量之間的殘差,并對該殘差進(jìn)行顯著水平P=0.05的F檢驗(yàn),根據(jù)殘差置信區(qū)間范圍篩選異常樣本,由圖5可知,黑色線條對應(yīng)樣本的殘差離零點(diǎn)較遠(yuǎn),說明該類樣本的預(yù)測值與真實(shí)值偏離程度較大,并且其殘差置信區(qū)間不包括零,即該類樣本異常。表1為不同校正集的MLR模型預(yù)測結(jié)果,由表1可知,輕度霉變樣本剔除個(gè)數(shù)為1,中度為5,重度為1,以新校正集建立模型的校正集相關(guān)系數(shù)RC比未剔除異常樣本提高了0.031,但驗(yàn)證集相關(guān)系數(shù)RP減小了0.004。因此,剔除異常樣本雖可提高校正模型精度,但預(yù)測精度卻存在下降,為了保證模型的預(yù)測效果較優(yōu),本研究選用的校正集為原始校正樣本集。
圖4 4種霉變稻谷光譜平滑圖
圖5 校正集樣本的殘差
表1 不同校正集的MLR模型預(yù)測結(jié)果
校正集類型樣本數(shù)異常樣本數(shù)正常輕度中度重度校正集RMSECRC驗(yàn)證集RMSEPRP未預(yù)處理15500000545087505770850新校正集14801510482090605840846
2.3 PCA-LDA和SIMCA對霉變秈稻的判別分析
2.3.1 PCA-LDA對霉變秈稻的判別分析
對校正集原始光譜數(shù)據(jù)進(jìn)行主成分分析,其前3個(gè)主成分累計(jì)貢獻(xiàn)率達(dá)到99.91%,包含了絕大部分光譜信息。圖6為樣本前3個(gè)主成分得分圖,該3個(gè)主成分得分值分別為98.96%、0.61%、0.34%,由圖6可知,正常、輕度和中度霉變樣本各自的聚合程度較好,其中正常樣本同輕度和中度霉變樣本之間存在少量重疊,但輕度和中度霉變樣本之間重疊部分較多,說明某些輕度霉變樣本的光譜與中度霉變樣本較為相似,給準(zhǔn)確識別帶來了困難。重度霉變樣本的聚合程度較差,同輕度和中度霉變樣本之間存在少量重疊,但重度霉變樣本同正常樣本之間區(qū)分明顯,可以準(zhǔn)確區(qū)分兩類樣本。因此,通過PCA對不同霉變樣本的區(qū)分具有可行性,為了提高模型預(yù)測精度和定量分析誤判情況,對原始光譜數(shù)據(jù)實(shí)施SG、MSC、FD、SD等預(yù)處理,并采用PCA分別提取經(jīng)上述方法處理后的光譜數(shù)據(jù)的主成分,其主成分?jǐn)?shù)分別為3、3、4、4,對應(yīng)的累計(jì)貢獻(xiàn)率分別為99.91%、99.93%、99.95%、99.98%,利用上述主成分的得分對校正集樣本進(jìn)行Fisher判別分析,同時(shí),應(yīng)用該模型對驗(yàn)證集樣本進(jìn)行預(yù)測分類,不同預(yù)處理方法的PCA-LDA鑒別結(jié)果如表2所示。
圖6 霉變稻谷樣本前3個(gè)主成分得分圖
表2 不同預(yù)處理方法的PCA-LDA鑒別結(jié)果
預(yù)處理方法主成分?jǐn)?shù)校正集誤判數(shù)識別率/%驗(yàn)證集誤判數(shù)識別率/%未預(yù)處理311929049111SG311929049111MSC318883968667FD423851678444SD421864598000
由表2可知,光譜數(shù)據(jù)經(jīng)MSC、FD、SD等處理后的校正集和驗(yàn)證集的正確識別率均小90%,其中,SD處理的預(yù)測效果最差,驗(yàn)證集的正確識別率最小(80%),光譜數(shù)據(jù)經(jīng)MSC、FD、SD預(yù)處理效果變差,可能因?yàn)轭A(yù)處理過程中丟失了一些重要信息。未預(yù)處理和SG平滑建模的校正集和驗(yàn)證集的正確識別率相同,均大于90%,因此,本試驗(yàn)選用原始數(shù)據(jù)建模效果較佳,由原始數(shù)據(jù)建立的PCA-LDA鑒別結(jié)果如表3所示。
表3 采用原始數(shù)據(jù)的PCA-LDA鑒別結(jié)果
注:1代表正常樣本;2代表輕度霉變樣本;3代表中度霉變樣本;4代表重度霉變樣本,下同。
由表3可知,PCA-LDA對校正集中的4類樣本均存在誤判,正確識別率范圍為89.19%~94.87%,將2個(gè)正常樣本誤判為中度霉變;2輕度霉變樣本分別誤判為中度和重度霉變;4個(gè)中度霉變樣本分別誤判為1個(gè)正常、2個(gè)輕度和1個(gè)重度霉變;3個(gè)重度霉變樣本誤判為輕度霉變。該模型可正確識別驗(yàn)證集中的輕度霉變樣本,識別率為100%;將1個(gè)正常樣本誤判為中度霉變;2個(gè)中度霉變和1個(gè)重度霉變樣本均誤判為輕度霉變,正確識別率分別為84.62%、90.00%。PCA-LDA對校正集和驗(yàn)證集樣本的總體正確識別率分別為92.90%、91.11%,因此,該模型可對霉變稻谷進(jìn)行粗略鑒別,其識別精度有待提高。
2.3.2 SIMCA對霉變秈稻的判別分析
為解決PCA-LDA精度不高問題,在主成分分析基礎(chǔ)上采用SIMCA模式識別方法。利用校正集建立SIMCA鑒別模型,并通過驗(yàn)證集的45份樣本對模型可靠性進(jìn)行檢驗(yàn)。先對校正集中的4類樣本分別進(jìn)行主成分分析,通過交叉驗(yàn)證法得出正常、輕度、中度、重度霉變樣本的主成分?jǐn)?shù)分別為3、3、5、3,45份樣本驗(yàn)證該模型的結(jié)果如表4所示。
表4 采用原始數(shù)據(jù)的SIMCA鑒別結(jié)果
由表4可知,在顯著水平P=0.05下,校正集和驗(yàn)證集中的輕度和重度霉變樣本的正確識別率均為100%;校正集和驗(yàn)證集中的正常樣本的正確識別率分別為97.44%、90.91%,兩類樣本集中均有1個(gè)樣本未能正確識別;校正集和驗(yàn)證集中的中度霉變樣本的正確識別率分別為91.89%、92.31%,未能正確識別個(gè)數(shù)分別為3、1。SIMCA的構(gòu)建時(shí)長為1 488 s,其對校正集和驗(yàn)證集樣本的總體正確識別率分別為97.42%、95.56%,因此,該模型對霉變稻谷的鑒別具有可行性。
2.4 SPA優(yōu)化SIMCA光譜建模
對比PCA-LDA和SIMCA的鑒別結(jié)果,可知SIMCA鑒別效果優(yōu)于前者,其對校正集和驗(yàn)證集樣本的總體正確識別率分別提高了4.52%、4.45%。為了進(jìn)一步提高SIMCA構(gòu)建速度,同時(shí)剔除光譜數(shù)據(jù)中的冗余信息。采用SPA提取光譜特征波段,指定波段數(shù)N范圍為10~50,并以該特征波段作為SIMCA的輸入變量。圖7為不同變量數(shù)下的交叉驗(yàn)證均方根誤差(RMSECV)的變化情況。由圖7可知,變量數(shù)在1~20范圍內(nèi),RMSECV具有較高的下降速率,在變量數(shù)為20時(shí),RMSECV值最小(0.299),變量數(shù)在20~43范圍內(nèi),RMSECV變化趨于平緩,說明在變量數(shù)為20以后,其預(yù)測值與真實(shí)值之間的均方根誤差無明顯差異。故最終優(yōu)選的變量數(shù)為20,僅占原始變量數(shù)的7.81%,大大壓縮了數(shù)據(jù)維數(shù),簡化了SIMCA模型。將特征波段作為輸入變量構(gòu)建SIMCA模型,并對校正集和驗(yàn)證集樣本進(jìn)行預(yù)測分類,具體鑒別結(jié)果如表5所示。
圖7 最優(yōu)特征波長數(shù)選取
由表5可知,SPA-SIMCA可準(zhǔn)確鑒別校正集中的輕度、中度和重度霉變樣本,正確識別率均為100%,正常樣本中存在2個(gè)樣本未能正確識別,正確識別率為94.87%;該模型可準(zhǔn)確鑒別驗(yàn)證集中的4類樣本。SPA-SIMCA的構(gòu)建時(shí)長為609 s,其對校正集和驗(yàn)證集樣本的總體正確識別率分別為98.71%、100%。因此,該模型的鑒別效果優(yōu)于全波段的SIMCA模型,SPA算法不僅可以壓縮光譜數(shù)據(jù),節(jié)約建模時(shí)間,也可提高SIMCA精度。同時(shí),SPA-SIMCA的鑒別效果也優(yōu)于PCA-LDA,可能因?yàn)楣庾V數(shù)據(jù)經(jīng)SPA處理,剔除了一些冗余信息,保留了對秈稻霉變程度貢獻(xiàn)率大的特征波段,而PCA進(jìn)行數(shù)據(jù)壓縮時(shí),一些低敏感波段被保留下來,導(dǎo)致其鑒別效果較差。
表5 采用原始數(shù)據(jù)的SPA-SIMCA鑒別結(jié)果
3.1 霉變秈稻的反射率曲線變化趨勢基本一致,呈現(xiàn)其獨(dú)有的光譜特性:在波長為380~700、850~1 000 nm時(shí),反射率有較明顯變化,在波長為700~850 nm時(shí),反射率無明顯變化。
3.2 根據(jù)預(yù)測濃度殘差檢驗(yàn)標(biāo)準(zhǔn),得出校正集中存在7個(gè)異常樣本,剔除該樣本后的校正集相關(guān)系數(shù)比未剔除異常樣本提高了0.031,但驗(yàn)證集相關(guān)系數(shù)RP減小了0.004。
3.3 PCA-LDA對校正集和驗(yàn)證集的誤判個(gè)數(shù)分別為11、4,總體正確識別率分別為92.90%、91.11%;SIMCA對校正集和驗(yàn)證集的未能正確識別個(gè)數(shù)分別為4、2,總體正確識別率分別為97.42%、95.56%。
3.4 SPA篩選的特征變量數(shù)為20,僅占原始變量數(shù)的7.81%,建模時(shí)長縮短為原始變量的40.93%,同時(shí),采用特征波段建立的SIMCA模型對校正集和驗(yàn)證集的正確識別率比全波段建模分別提高了1.29%、4.44%。SPA-SIMCA對校正集和驗(yàn)證集的未能正確識別個(gè)數(shù)分別為2、0,總體正確識別率分別為98.71%、100%。
因此,SPA-SIMCA更適于建模,該方法可為快速、無損鑒別秈稻霉變程度提供技術(shù)支持,也可以為在線檢測流入市場的秈稻是否霉變以及霉變程度提供參考依據(jù)。
[1]包清彬,豬谷富雄.儲藏條件對糙米理化特性影響的研究[J].農(nóng)業(yè)工程學(xué)報(bào),2003,19(6):25-27
Bao Qinbing,Tomio ITANI.Influence of storage conditions on physicochemical characteristic of brown rice[J].Transactions of the Chinese Society of Agricultural Engineering,2003,19(6):25-27
[2]蘇永騰,劉強(qiáng).谷物霉菌毒素的危害及其控制措施的研究[J].中國食物與營養(yǎng),2010(4):9-12
Su Yongteng,Liu Qiang.Hazards and control measures of grain mycotoxin[J].Food and Nutrition in China,2010(4):9-12
[3]Aibara S,Ismail I A.Changes in rice bran lipids and fatty acids during storage[J].Agriculture Biology Chemistry,1986,50(3):665-673
[4]楊曉蓉,周建新,姚明蘭,等.不同儲藏條件下稻谷脂肪酸值變化和霉變相關(guān)性研究[J].糧食儲藏,2006,35(5):49-52
Yang Xiaorong,Zhou Jianxin,Yao Minglan,et al.Study on a correlation between the fatty acid value change and mould of indica rice in different storage conditions[J].Grain Storage,2006,35(5):49-52
[5]惠國華,陳裕泉.基于隨機(jī)共振的電子鼻系統(tǒng)構(gòu)建及在谷物霉變程度檢測中的應(yīng)用[J].傳感技術(shù)學(xué)報(bào),2011,24(2):159-164
Hui Guohua,Chen Yuquan,Establishment of an electronic nose system using stochastic resonance and its application in moldy corn status detection[J].Chinese Journal of Sensors and Actuators,2011,24(2):159-164
[6]張紅梅,王俊,葉盛,等.電子鼻傳感器陣列優(yōu)化與谷物霉變程度的檢測[J].傳感技術(shù)學(xué)報(bào),2007,20(6):1207-1210
Zhang Hongmei,Wang Jun,Ye Sheng,et al.Optimized of sensor array and detection of moldy degree for grain by electronic nose[J].Chinese Journal of Sensors and Actuators,2007,20(6):1207-1210
[7]鄒小波,趙杰文.電子鼻快速檢測谷物霉變的研究[J].農(nóng)業(yè)工程學(xué)報(bào),2004,20(4):121-124
Zou Xiaobo,Zhao Jiewen.Rapid identification of moldy corn by electronic nose[J].Transactions of the Chinese Society of Agricultural Engineering,2004,20(4):121-124
[8]陳紅,熊利榮,胡筱波.基于神經(jīng)網(wǎng)絡(luò)與圖像處理的花生仁霉變識別方法[J].農(nóng)業(yè)工程學(xué)報(bào),2007,23(4):158-161
Chen Hong,Xiong Lirong,Hu Xiaobo,et al.Identification method for moldy peanut kernels based on neural network and image processing[J].Transactions of the Chinese Society of Agricultural Engineering,2007,23(4):158-161
[9]周建新.論糧食霉變中的生物化學(xué)[J].糧食儲藏,2004,32(1):9-12
Zhou Jianxin.The biochemistry during grain mildewing[J].Grain Storage,2004,32(1):9-12
[10]惠國華,倪彧.基于信噪比分析技術(shù)的谷物霉變快速檢測方法[J].農(nóng)業(yè)工程學(xué)報(bào),2011,27(3):336-340
Hui Guohua,Ni Yu.Investigation of moldy corn fast detection based on signal-to-noise ratio spectrum analysis technique[J].Transactions of the Chinese Society of Agricultural Engineering,2011,27(3):336-340
[11]張強(qiáng),劉成海,孫井坤,等.基于支持向量機(jī)稻谷黃曲霉毒素B1近紅外無損檢測[J].東北農(nóng)業(yè)大學(xué)學(xué)報(bào),2015,46(5):84-88
Zhang Qiang,Liu Chenghai,Sun Jingkun,et al.Near-infrared spectroscopy nondestructive determination of aflatoxin B1 in indica rice rice based on support vector machine regression[J].Journal of Northeast Agricultural University,2015,46(5):84-88
[12]Pettersson H,Aberg L.Near infrared spectroscopy for deter-mination of mycotoxins in cereals[J].Food Control,2003,14(4):229-232
[13]袁瑩,王偉,褚璇,等.基于高光譜成像技術(shù)和因子判別分析的玉米黃曲霉毒素檢測研究[J].中國糧油學(xué)報(bào),2014,29(12):107-110
Yuan Ying,Wang Wei,Chu Xuan,et al.Detection of Corn Aflatoxin Based on Hyperspectral Imaging Technology and Factor Discriminant Analysis[J].Journal of the Chinese Cereals and Oils Association,2014,29(12):107-110
[14]Fernández-Ibanez V,Soldado A,Martínez-Fernández A,et al.Application of near infrared spectroscopy for rapid detection of aflatoxin B1 in maize and barley as analytical quality assessment[J].Food Chemistry,2009,113(2):629-634
[15]文韜,洪添勝,李立君,等.基于高光譜技術(shù)的霉變稻谷脂肪酸含量無損檢測[J].農(nóng)業(yè)工程學(xué)報(bào),2015,31(18):233-239
Wen Tao,Hong Tiansheng,Li Lijun,et al.Non-destructive detection of fatty acid content in mould indica rice based on high-spectral technology[J].Transactions of the Chinese Society of Agricultural Engineering,2015,31(18):233-239
[16]袁瑩,王偉,褚璇,等.基于傅里葉變換近紅外和支持向量機(jī)的霉變玉米檢測[J].中國糧油學(xué)報(bào),2015,30(5):143-146
Yuan Ying,Wang Wei,Chu Xuan,et al.Detection of moldy corns with FT-NIR spectroscopy based on SVM[J].Journal of the Chinese Cereals and Oils Association,2015,30(5):143-146
[17]周竹,李小昱,李培武,等.基于GA-LSSVM和近紅外傅里葉變換的霉變板栗識別[J].農(nóng)業(yè)工程學(xué)報(bào),2011,3(3):331-335
Zhou Zhu,Li Xiaoyu,Li Peiwu,et al.Near-infrared spectral detection of moldy chestnut based on GA-LSSVM and FFT[J].Transactions of the Chinese Society of Agricultural Engineering,2011,3(3):331-335
[18]黃星奕,丁然,史嘉辰,等.霉變出芽花生的近紅外光譜無損檢測研究[J].中國農(nóng)業(yè)科技導(dǎo)報(bào),2015,17(5):27-32
Huang Xingyi,Ding ran,Shi Jiachen.et al.Studies on Non-destructive testing method of moldy and budding peanuts by Near Infrared Spectroscopy[J].Journal of Agricultural Science and Technology,2015,17(5):27-32
[19]張瑛,吳先山,吳敬德,等.稻谷儲藏過程中理化特性變化的研究[J].中國糧油學(xué)報(bào),2003,18(6):565-566
Zhang Ying,Wu Xianshan,Wu Jingde,et al.Study on physical and chemical characters in rice storage[J].Journal of the Chinese Cereals and Oils Association,2003,18(6):565-566
[20]祝詩平,王一鳴,張小超,等.近紅外光譜建模異常樣品剔除準(zhǔn)則與方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2004,35(4):115-119
Zhu Shiping,Wang Yiming,Zhang Xiaochao,et al.Outlier sample eliminating criterions and methods for building calibration model of near infrared spectroscopy analysis[J].Transactions of the Chinese Society of Agricultural Machinery,2004,35(4):115-119.
Establishment and Optimization of Identification Model for the Degree of Moldy Indica Rice Based on Hyperspectral Technology
Zheng Lizhang1Gong Zhongliang1Wen Tao1,2Dong Shuai1Sang Mengxiang1
(School of Mechanical and Electrical Engineering,Central South University of Forestry and Technology1,Changsha 410004) (Key Laboratory of Key Technology for South Agricultural Machinery and Equipment, Ministry of Education,South China Agricultural University2,Guangzhou 510642)
In order to solve the problem of fast and nondestructive identification of moldy indica rice,the hyperspectral technique was used to collect the visible/near infrared spectroscopy of 200 moldy paddies,155 samples were randomly chosen as calibration set,and 45 samples were chosen as validation set.According to the criterion of predicted concentration residual,the outlier samples of calibration set were eliminated.Then,the principal component analysis combined with linear discriminate analysis(PCA-LDA)and soft independent modeling of class analogy(SIMCA)were established by using the new calibration set.Further,by comparing the correct recognition rate of the two models,the optimal model was elected.In order to improve the speed of establishing the optimal model,the successive projections algorithm(SPA)was used to extract the characteristic wavelength.The results showed that 15 samples of the all samples were mistakenly identified by using the PCA-LDA,the correct recognition rate was 92.50%.The numbers of wrongly identified samples of the all samples respectively were 6 and 2 by using the SIMCA and SPA-SIMCA;the correct recognition rates were 97.00% and 99.00%,respectively.20 characteristic wavelengths were selected by SPA;the number of variables was dropped to 7.81%,and the time of establishing model was reduced to 40.93% compared with initial variables.Therefore,the identification model established by the SPA-SIMCA was the best.The model is feasible for fast and accurately identifying the moldy degree of the indica rice.
hyperspectral technology,moldy indica rice,identification,soft independent modeling of class analogy,successive projections algorithm
S123;S511
A
1003-0174(2017)11-0151-07
國家自然科學(xué)基金(31401281),湖南省科技計(jì)劃重點(diǎn)研發(fā)項(xiàng)目(2016NK2151),湖南省自然科學(xué)基金(14JJ3115),湖南省高??萍紕?chuàng)新團(tuán)隊(duì)支持計(jì)劃(2014207)
2016-10-06
鄭立章,男,1992年出生,碩士,農(nóng)產(chǎn)品品質(zhì)與安全無損檢測技術(shù)應(yīng)用基礎(chǔ)研究
文韜,男,1983年出生,副教授,農(nóng)產(chǎn)品品質(zhì)與安全無損檢測技術(shù)應(yīng)用基礎(chǔ)研究