李軍宇,張淑娟,張學(xué)豪,薛建新
(山西農(nóng)業(yè)大學(xué) 工學(xué)院,山西 太谷 030801)
李果實(shí)成熟度的高光譜成像判別研究
李軍宇,張淑娟,張學(xué)豪,薛建新
(山西農(nóng)業(yè)大學(xué) 工學(xué)院,山西 太谷 030801)
為實(shí)現(xiàn)對李果實(shí)成熟度的快速、準(zhǔn)確判別,采用高光譜成像技術(shù)(450~1 000nm)采集不同成熟階段(未熟期、半熟期、成熟期、過熟期)的李果實(shí)共計(jì)640個樣本的高光譜信息進(jìn)行判別研究。對不同成熟階段的李果實(shí)樣本測定表征成熟度的理化指標(biāo)(可溶性固形物和硬度值)并進(jìn)行單因素方差分析,結(jié)果表明:不同成熟度樣本的兩項(xiàng)指標(biāo)均存在極顯著差異,硬度值差異最大。采用連續(xù)投影算法(Successive projections algorithm,SPA)和主成分分析(Principal component analysis,PCA)分別提取得到不同成熟度樣本光譜數(shù)據(jù)的10個特征波長(381、382、387、408、443、494、596、813、963、1 008nm)和前5個主成分值(累積貢獻(xiàn)率達(dá)97.83%)。基于RGB、HSV顏色模型對不同成熟度李果實(shí)樣本圖像進(jìn)行顏色特征提取,最終得到6項(xiàng)顏色特征指標(biāo)(R、G、B 及H、S、V分量圖像的平均值和標(biāo)準(zhǔn)差)。分別建立基于光譜信息、圖像信息及融合信息的偏最小二乘(Partial least squares,PLS)判別模型,結(jié)果表明:基于特征波長和RGB特征信息融合值建立的PLS模型判別結(jié)果最佳,準(zhǔn)確率達(dá)91.25%。由此可見,采用高光譜成像技術(shù)在光譜和圖像信息方面對不同成熟度李果實(shí)進(jìn)行判別是可行的、有效的,該研究為實(shí)現(xiàn)李果實(shí)成熟度在線檢測提供了理論依據(jù)。
李果實(shí);成熟度;光譜;圖像;偏最小二乘模型
李果實(shí)[1]屬薔薇科李屬植物,別名麥李、李實(shí)。其果實(shí)肥碩,汁甜肉脆且味酸性涼,具有清肝滌熱、促進(jìn)消化的功效,經(jīng)常食用李果實(shí)又可起到美容養(yǎng)顏的作用,是人們最喜愛的水果之一。李果實(shí)屬于典型的呼吸躍變型水果,其采收期主要集中于7、8月份的高溫時期,采后果肉極易后熟軟化,難以儲存,造成經(jīng)濟(jì)損失。在實(shí)際生產(chǎn)過程中,經(jīng)常采摘還未成熟的李果實(shí),以延長其貯藏期;但若過早采摘,果實(shí)過于生硬影響口感且易受冷害,若過晚采摘,果實(shí)過于柔軟,容易腐爛難以貯藏[2]。因此,確定合適的采摘成熟度是降低貯藏?fù)p失,保證水果品質(zhì)的關(guān)鍵。
高光譜成像技術(shù)可以實(shí)現(xiàn)光譜信息與圖像信息的融合[3],不僅在信息豐富程度方面有了極大提高,且對光譜數(shù)據(jù)可以進(jìn)行更為合理、有效的分析處理,具有波段多、分辨率高等特點(diǎn)。蔣浩[4]等采用高光譜成像技術(shù),建立多光譜參數(shù)對3種不同成熟度的草莓進(jìn)行分類判別,研究表明:基于參數(shù)i1、i2、i3的線性判別分析模型優(yōu)于參數(shù)i4,可用于草莓成熟度的自動分類。薛建新[5]等利用高光譜成像系統(tǒng)(400~1 000nm)采集4種不同成熟階段的金沙杏光譜數(shù)據(jù),結(jié)果表明:基于特征波長與顏色特征融合值建立的ELM模型判別結(jié)果最佳,判別準(zhǔn)確率達(dá)93.33%。目前,關(guān)于高光譜成像技術(shù)對李果實(shí)成熟度進(jìn)行分類研究的相關(guān)文獻(xiàn)較少。
本文以4種不同成熟度的李果實(shí)為研究對象,利用高光譜成像技術(shù)采集得到不同成熟度李果實(shí)樣本的光譜信息和圖像信息,對光譜數(shù)據(jù)分別采用連續(xù)投影算法(SPA)和主成分分析法(PCA)進(jìn)行光譜特征信息的提??;對圖像信息采用RGB和HSV模型進(jìn)行圖像的顏色特征信息提取。依據(jù)光譜信息、圖像信息及融合信息,分別建立李果實(shí)成熟度的PLS判別模型,通過分析比較確定最佳的李果實(shí)成熟度的判別模型。該研究可為李果實(shí)成熟度的在線檢測裝置設(shè)計(jì)提供理論依據(jù)。
1.1 樣本采集
根據(jù)李果實(shí)開花期后發(fā)育階段的不同,可分為4種成熟階段:未熟期、半熟期、成熟期、過熟期。李果實(shí)未熟期果皮顏色呈青綠色,果實(shí)基部較硬;半熟期果皮顏色開始泛紅,果實(shí)基部微硬;成熟期果皮顏色大部分為紅色,果實(shí)基部較軟;過熟期果皮顏色全部為深紅色,果實(shí)基部很軟。隨著成熟度的增加,李果實(shí)的果皮顏色由綠向紅轉(zhuǎn)變,果實(shí)基部由硬變軟。
本實(shí)驗(yàn)以采自山西太谷縣侯城鄉(xiāng)“脆紅李”作為研究對象,分批次采摘處于不同成熟階段的李果實(shí)樣本各160個,共計(jì)640個實(shí)驗(yàn)樣本。其中,未熟期樣本于2015年6月15日采摘,半熟期樣本于6月30日采摘、成熟期樣本于7月10日采摘,過熟期樣本于7月15日采摘。圖1為不同成熟度的李果實(shí)樣本。利用Kennard-Stone[6]算法,將不同成熟度的樣本按照3:1的比例隨機(jī)分成校正集(480個)和預(yù)測集(160個)。
圖1 不同成熟度的李果實(shí)樣本Fig.1 Different maturity of plums
1.2 儀器設(shè)備
實(shí)驗(yàn)中采用的高光譜成像系統(tǒng)主要由ImSpector V10E(Specim,Finland)成像光譜儀(光譜波段范圍為
380~1 000nm),面陣CCD偵測器,2個光強(qiáng)可調(diào)的150W光纖鹵素?zé)?,OLE23型C-mount成像鏡頭,OBF570型濾光片,傳送平臺及計(jì)算機(jī)等設(shè)備組成。實(shí)驗(yàn)的采集物距(采集對象至鏡頭邊緣)為30cm,曝光時間為3 000μs,平臺運(yùn)行速度為20mm/s,總運(yùn)行距離為400mm。
1.3 黑白校正
由于光源強(qiáng)度在不同波段范圍內(nèi)分布不均,且接收器會產(chǎn)生暗電流噪聲,導(dǎo)致采集到的圖像在弱波段內(nèi)含有噪聲。因此,為了使系統(tǒng)標(biāo)定環(huán)境與圖像采集時的環(huán)境相同,需要進(jìn)行黑白校正,轉(zhuǎn)換公式參見文獻(xiàn)[7]。
1.4 理化指標(biāo)檢測與分析
農(nóng)村財(cái)務(wù)審計(jì)工作對于會計(jì)人員提出了更高的要求,增加了會計(jì)人員的工作內(nèi)容與工作壓力?,F(xiàn)階段,我國農(nóng)村財(cái)務(wù)會計(jì)年齡普遍較大,其不具備必要的專業(yè)知識與職業(yè)素養(yǎng),導(dǎo)致財(cái)務(wù)審計(jì)工作難以開展。在實(shí)際工作中財(cái)務(wù)賬目處理錯誤時有發(fā)生,嚴(yán)重違反哭基礎(chǔ)規(guī)范要求,農(nóng)村財(cái)務(wù)賬目真實(shí)性得不到有效的保障。這顯然不利于農(nóng)村經(jīng)濟(jì)的穩(wěn)定發(fā)展。而通過推行農(nóng)村財(cái)務(wù)審計(jì)工作,在一定程度上會對農(nóng)村財(cái)務(wù)會計(jì)人員的工作造成壓力,迫使他們改變敷衍了事的工作態(tài)度,提高工作質(zhì)量,同時,審計(jì)標(biāo)準(zhǔn)的制度規(guī)定有利于促進(jìn)農(nóng)村財(cái)務(wù)會計(jì)工作人員了解現(xiàn)代會計(jì)工作制度要求,完善會計(jì)科目等,保障農(nóng)村財(cái)務(wù)會計(jì)建賬、記賬、報賬記錄的真實(shí)性,會計(jì)資料的真實(shí)性。
可溶性固形物[8](Soluble solid content,SSC)和硬度值[9](Firmness)是確定水果成熟期的兩個非常重要的理化指標(biāo)。利用SPSS軟件剔除李果實(shí)樣本的可溶性固形物和硬度值中的異常樣本,采用單因素方差分析對其可溶性固形物和硬度值進(jìn)行顯著性檢驗(yàn)。李果實(shí)樣本的理化指標(biāo)值及方差分析如表1所示。從表1中可以看出:不同成熟度李果實(shí)樣本的兩項(xiàng)理化指標(biāo)均具有極顯著差異,兩項(xiàng)理化指標(biāo)均可表征成熟度,硬度值的F值遠(yuǎn)大于可溶性固形物,使用硬度值表征成熟度比可溶性固形物具有更顯著的差異。因此,這兩項(xiàng)理化指標(biāo)可作為李果實(shí)成熟度的分類判別指標(biāo)。
表1 李果實(shí)樣本的理化指標(biāo)分布及方差分析
1.5 判別建模方法
偏最小二乘[10](PLS)是一種應(yīng)用廣泛的建模方法,其采用迭代回歸思路,在計(jì)算過程中根據(jù)其顯著性逐步提取光譜數(shù)據(jù)中的成分,當(dāng)顯著性達(dá)到要求時停止,具有預(yù)測能力強(qiáng)、判別率高等優(yōu)點(diǎn)。本研究中對不同成熟度李果實(shí)樣本進(jìn)行成熟度判別時,分別給每類樣本(未熟期、半熟期、成熟期、過熟期)假設(shè)一個值(1,2,3,4)作為判別成熟度的依據(jù),建立李果實(shí)樣本成熟度的判別模型。
2.1 基于光譜信息的李果實(shí)成熟度判別
2.1.1 平均光譜分析
采用ENVI 4.7軟件對不同成熟度李果實(shí)光譜圖像提取感興趣的區(qū)域,對得到的光譜曲線進(jìn)行去噪、平滑處理并計(jì)算其平均值,得到4種不同成熟度的平均光譜曲線,如圖2所示。從圖2中可以看出:在450~1 000nm的波長范圍內(nèi),不同成熟度李果實(shí)的光譜曲線變化明顯。這可能是由于李果實(shí)在不同成熟度時內(nèi)部碳水化合物、糖、氨基酸等成分不同引起的[11],樣本在680nm和960nm處出現(xiàn)特征吸收峰。在680nm處的特征吸收峰反映了不同成熟度李果實(shí)果皮顏色的變化,可能是由于不同成熟度李果實(shí)果皮葉綠素含量的不同所致[12]。果皮葉綠素含量在果實(shí)成熟初期含量較高,隨著果實(shí)的不斷發(fā)育含量逐漸減少。在960nm處出現(xiàn)特征吸收峰,可能是由于果皮含水量不同引起的[13]。
圖2 平均光譜曲線圖Fig.2 Average spectrum image
2.1.2 特征波長提取
特征波長提取[14]是高光譜數(shù)據(jù)提取的一個中心環(huán)節(jié),優(yōu)選提取特征波長并建立模型,不僅可以大幅度提高運(yùn)算速度,還可以提升模型的預(yù)測精度。
2.1.3 特征主成分分析
主成分分析(PCA)是一種多元統(tǒng)計(jì)分析方法,可實(shí)現(xiàn)數(shù)據(jù)降維。利用PCA對全波段光譜數(shù)據(jù)進(jìn)行主成分分析,結(jié)果如表2所示。
表2 前8個主成分的累積貢獻(xiàn)率
其中,前5個主成分的累積貢獻(xiàn)率已達(dá)97.83%,所以選取前5個主成分值作為建模的輸入?yún)?shù)。
2.2 基于圖像信息的李果實(shí)成熟度判別
不同成熟度的李果實(shí)果皮色澤轉(zhuǎn)化進(jìn)程差異較大,由未熟的青色到過熟的深紅色,變化比較明顯,所以通過提取顏色特征值判別其成熟度是可行的。目前,對于圖像特征信息提取采用的模型[15]有兩種:一種是RGB模型,是由紅、綠、藍(lán)3種基本色彩混合后來描述圖像;另一種是HSV模型,是由色調(diào)、亮度和飽和度來描述圖像。
本文利用MatLab R2010b軟件,采用RGB、HSV顏色模型對不同成熟度李果實(shí)樣本圖像進(jìn)行處理,得到其R、G、B和H、S、V分量上的R、G、B 及H、S、V分量圖像的平均值和標(biāo)準(zhǔn)差。其中,RGB模型提取到的不同成熟度李果實(shí)樣本的6項(xiàng)顏色特征指標(biāo)如表3所示。
表3 RGB模型提取到的6項(xiàng)顏色特征指標(biāo)
從表3中可以看出:不同成熟度李果實(shí)樣本其μR、μG、μB存在明顯差距。其中,未熟樣本μG明顯高于其他樣本,μG隨著成熟度的增加呈遞減趨勢,是由于初期果皮中的葉綠素含量較高,隨著果實(shí)發(fā)育其含量逐漸減少;過熟樣本μR數(shù)值最高,是由于當(dāng)果實(shí)接近成熟時,葉綠素不斷降解,花青苷含量不斷增加,果實(shí)呈現(xiàn)紅色,因此μR值最高。未熟期和半熟期的μB、σR、σG、σB較為接近,可能會對李果實(shí)成熟度的判別造成一定誤差。
2.3 判別結(jié)果分析
高光譜可以實(shí)現(xiàn)光譜信息和圖像信息的融合,從而在本文中可對李果實(shí)成熟度進(jìn)行更為合理、有效的分析。本文以光譜信息(特征波長、主成分)、圖像信息(RGB特征信息模型、HSV特征信息模型)及融合信息(特征波長與RGB特征信息模型、主成分與RGB特征信息模型、特征波長與HSV特征信息模型、主成分與HSV特征信息模型)作為模型的輸入量,分別建立李果實(shí)成熟度的PLS判別模型,對不同成熟度李果實(shí)樣本進(jìn)行判別研究。其中,校正集樣本480個,預(yù)測集樣本160個,判別結(jié)果如表4所示。
表4 基于PLS判別模型對樣本成熟度的預(yù)測集判別結(jié)果
從表4中可以看出:光譜信息方面,基于特征波長建立的PLS模型的判別結(jié)果優(yōu)于主成分模型,預(yù)測集準(zhǔn)確率達(dá)到了89.37%。圖像信息方面,基于RGB特征信息的PLS模型的判別結(jié)果優(yōu)于HSV特征信息模型,準(zhǔn)確率達(dá)85.63%,由于不同成熟度李果實(shí)顏色由青綠向深紅轉(zhuǎn)變,變化較為明顯。總的來看,基于光譜信息建立的PLS判別模型普遍優(yōu)于圖像信息建立的PLS模型。
比較融合信息模型和單一模型可知:光譜和圖像融合信息建立的PLS判別模型正確率相對較高。其中,光譜特征波長與RBG特征信息融合模型判別準(zhǔn)確率要高于與HSV特征信息的融合模型,主成分與RGB特征信息融合的判別準(zhǔn)確率高于與HSV特征信息融合模型,以特征波長和RGB特征信息值建立的PLS模型判別結(jié)果最佳,準(zhǔn)確率達(dá)91.25%。
1)李果實(shí)樣本的可溶性固形物和硬度值兩項(xiàng)理化指標(biāo)均可以表征李果實(shí)的成熟度,其硬度值的顯著性差異最大,可以更好地表征成熟度。
2)針對不同成熟度李果實(shí)樣本的光譜信息,基于特征波長建立的PLS判別模型準(zhǔn)確率最高,達(dá)89.37%。圖像信息方面,建立的基于RGB特征信息的PLS判別模型準(zhǔn)確率最高,達(dá)85.63%。
3)將不同成熟度李果實(shí)樣本的光譜和圖像融合信息作為PLS模型的輸入量,建立了4種李果實(shí)模型,結(jié)果表明:融合信息建立的PLS判別模型正確率相對較高,其中基于特征波長和RGB特征信息的融合模型判別結(jié)果最佳,準(zhǔn)確率達(dá)91.25%。
[1] 雷靜,關(guān)文強(qiáng).黑總統(tǒng)品種李子全產(chǎn)業(yè)鏈物流保鮮技術(shù)[J].保鮮與加工,2016,16(3):107-109.
[2]KucukerE,OzturkB.Effectofpre-harvestmethyljasmonatetreatmentonpost-harvestfruitqualityofJapaneseplums[J].AfricanJournalofTraditionalComplementary&AlternativeMedicines,2014,11(6):105-117.
[3] 趙杰文,劉劍華,陳全勝,等.利用高光譜圖像技術(shù)檢測水果輕微損傷[J].農(nóng)業(yè)機(jī)械學(xué)報,2008,39(1):106-109.
[4] 蔣浩,張初,劉飛,等.基于高光譜圖像多光譜參數(shù)的草莓成熟度識別[J].光譜學(xué)與光譜分析,2016,36(5):1423-1427.
[5] 薛建新,張淑娟,張晶晶.基于高光譜成像技術(shù)的沙金杏成熟度判別[J].農(nóng)業(yè)工程學(xué)報,2015,31(11):300-307.
[6] 王斌,薛建新,張淑娟.基于高光譜成像技術(shù)的腐爛、病害梨棗檢測[J].農(nóng)業(yè)機(jī)械學(xué)報,2013,44(S1):205-209.
[7] 徐明珠,李梅,白志鵬,等.馬鈴薯葉片早疫病的高光譜識別研究[J].農(nóng)機(jī)化研究,2016,38(6):205-209.
[8] 張淑娟,張海紅,趙艷茹,等.鮮棗可溶性固形物可見/近紅外光譜檢測建模方法比較[J].農(nóng)業(yè)機(jī)械學(xué)報,2012,43(3):108-112.
[9] 郭文川,房麗杰,董金磊,等.介電譜無損檢測梨內(nèi)部品質(zhì)方法研究[J].農(nóng)業(yè)機(jī)械學(xué)報,2015,46(9):233-239.
[10] 張初,劉飛,孔汶汶,等.利用近紅外高光譜圖像技術(shù)快速鑒別西瓜種子品種[J].農(nóng)業(yè)工程學(xué) 報,2013,29(20):270-277.
[11]MendozaF,LuR,ArianaD,etal.Integratedspectralandimageanalysisofhuperspectralscatteringdataforpredictionofapplefruitfirmnessandsolublesolidscontent[J].PostharvestBiologyandTechnology,2011,62(2): 149-160.
[12]RajkumarP,WangN,ElmasryG,etal.Studiesonbananafruitqualityandmaturitystagesusinghypersepctralimaging[J].JournalofFoodEngineering, 2012, 108(1): 194-200.
[13]ElMasryG,WangN,ElsayedA,etal.Hyperspectralimagingfornondestructivedeterminationofsomequalityattributesforstrawberry[J].JournalofFoodEngineering,2007,81(1):98-107.
[14] 程術(shù)希,謝傳奇,王巧男,等.不同波長提取方法的高光譜成像技術(shù)檢測番茄葉片早疫病的研究[J].光譜學(xué)與光譜分析,2014,34(5):1362-1366.
[15] 劉衍琪,詹福宇.MatLab圖像與視頻處理實(shí)用案例詳解[M].北京:電子工業(yè)出版社,2015.
Research on the Hyperspectral Imaging Judgment of the Plum Maturity
Li Junyu, Zhang Shujuan, Zhang Xuehao, Xue Jianxin
(College of Engineering,Shanxi Agricultural University,Taigu 030801,China)
In order to achieve the rapid and accurate determination of the plums maturity, the hyperspectral imaging technology with the band of 450~1000nm was adopted to collect altogether 640 hyperspectral information samples of the plum for judgment.The samples were classified into four maturity, unripe, mid-ripe, ripe and over-ripe. Firstly, the soluble solid content (SSC) and firmness were chosen as physical and chemical indexes on the plum samples during various mature stages, and one-way analysis of variance was conducted, the results of which indicated that there were remarkable differences in the two indexes among samples , and the greatest differences was found in firmness .Afterwards, successive projections algorithm (SPA) was adopted, and 10 wavelengths at 381, 382, 387, 408, 443, 494, 596, 813, 963 and 1008nm were selected as the optimal sensitive wavelengths ; principal component analysis (PCA) was used to compress spectral data of plum samples, the analysis suggested that the cumulative contribution of the top 5 principal components with rate of 97.83%. Finally, 6 color feature indexes including the mean and the standard deviation of the R, G, B, H, S and V component images were obtained through extraction based on the RGB and HSV color feature information of the plum images . Spectral information, image information and fusion information were based on the partial least squares (PLS) models to judge the plums maturity. The results demonstrated that the PLS model based on the sensitive wavelength and RGB characteristic information was the best, and accuracy rate of 91.25%. Thus it could be seen that the adoption of hyperspectral imaging technology to judge the plums with various degrees of maturity on the aspects of spectrum and image information was feasible and effective, and this research had provided theoretical foundation for achieving the online detection of the plums maturity.
plums; maturity; spectrum; image; partial least squares model
2016-10-08
國家自然科學(xué)基金項(xiàng)目(31271973);山西省自然科學(xué)基金項(xiàng)目(2012011030-3)
李軍宇(1991-),女,山西襄汾人,碩士研究生,(E-mail)lijy0801@126.com。
張淑娟(1963-),女,山西襄汾人,教授,博士生導(dǎo)師,(E-mail)zsujuan1@163.com。
S123; S662.3
A
1003-188X(2017)12-0141-05