黎 靜,伍臣鵬,劉木華,陳金印,鄭建鴻,張一帆,王 威,賴曲芳,薛 龍, 2*
1. 江西農(nóng)業(yè)大學(xué)工學(xué)院,江西 南昌 330045 2. 江西省現(xiàn)代農(nóng)業(yè)裝備重點實驗室,江西 南昌 330045 3. 江西省果蔬采后處理關(guān)鍵技術(shù)與質(zhì)量安全協(xié)同創(chuàng)新中心,江西 南昌 330045
中國是獼猴桃的原生中心,也是獼猴桃的最大生產(chǎn)國,果園面積與產(chǎn)量均居世界第一。作為江西盛產(chǎn)的“金魁”獼猴桃,有其獨特的天然優(yōu)勢,果實個頭大,耐貯性強,果肉品質(zhì)極佳,營養(yǎng)價值高,深受廣大消費者的喜愛[1]。但金魁獼猴桃存在一個普遍現(xiàn)象:畸形果居多?;喂囊话闾卣鳎汗麑嵱欣鉅罾咂?、 斜肩、 側(cè)扁等多處發(fā)生形變。而正常果一般呈圓柱形,果形端正,且大小均勻、 整齊一致,果面較為完好。目前,獼猴桃產(chǎn)后分級處理主要采用人工分級,效率低且人為主觀因素大,導(dǎo)致分級效果不佳?;喂某霈F(xiàn)不僅加重產(chǎn)后分級處理的難度,也嚴重影響了果實的外觀和商品價值。因此,如何高效準確對獼猴桃形狀分類檢測研究具有重要意義和巨大的發(fā)展前景。
主要研究內(nèi)容:
(1)利用主成分分析法提取特征波長,融合成新的圖像;
(2)采用四叉樹分解算法對圖像分割,以保證獼猴桃邊界信息完整;
(3)提取12組獼猴桃形狀特征參數(shù),利用可見-近紅外高光譜成像結(jié)合偏最小二乘線性判別分析、 反向傳播神經(jīng)網(wǎng)絡(luò)、 最小二乘支持向量機建立分類模型,以驗證模型的可行性,然后比較模型優(yōu)劣,選出最佳分類模型。
以“金魁”獼猴桃為研究對象,采購于江西奉新某獼猴桃果園,剔除損傷、 被異物污染的樣品。獼猴桃畸形果和正常果的分類由多位專業(yè)果形分析人員綜合評定,得到正常果107個,畸形果141個,共用樣品248個。實驗前將樣品表面可能殘留雜物或者絨毛擦拭掉,對其分別編號,再進行高光譜圖像的采集。圖1為采購的兩種不同果形的獼猴桃樣品。
圖1 購買的獼猴桃樣品(a):正常果;(b)—(d):畸形果Fig.1 Purchased kiwifruit samples(a):Normal;(b)—(d):Malformation
高光譜圖像采集系統(tǒng)如圖2所示。該系統(tǒng)主要由1臺CMOS照相機(Photonfocus,Switzerland),1臺行掃描光譜攝制儀(Spectrograph V10E),2個250 W的光纖鹵素燈(ALPHA-1501,21 V/250 W Halogen Tugsten Lamp)和一套光學(xué)移動平臺(由步進電機控制的載物臺)等部件組成。為防止采集的圖像受噪聲和雜散光的干擾,將其他硬件設(shè)備(除電腦外)全放置暗箱中。圖像采集范圍是400~1 000 nm,光譜分辨率約為1 nm,曝光時間40 ms。光譜采集軟件為Spectral Cube(Spectral Imaging Ltd. ,F(xiàn)inland)。
圖2 高光譜采集系統(tǒng)((a):示意圖;(b):實物圖(Fig.2 Hyperspectral acquisition system((a):Schematic diagram;(b):Actual picture
采集高光譜圖像前,設(shè)定設(shè)備相關(guān)參數(shù),然后將儀器預(yù)熱30 min。為了避免光線和強電流對圖像的影響,必須對圖像進行校正。首先采集反射率為99.9%的白板得到白標定圖像Iwhite,然后擰上相機鏡頭得到黑標定圖像Iblack,然后對采集的原始圖像Ioriginal,利用校正式(1)處理得到校正圖像I。校正公式
(1)
式(1)中,I為校正后的高光譜圖像,作為后續(xù)處理時的原始圖像。
高光譜圖像由光譜信息和圖像信息合成,數(shù)據(jù)量大,信息冗余度高,直接處理不方便。采用ENVI4.3(Research System, Inc.,USA)軟件對高光譜圖像光譜區(qū)域進行主成分分析(principal component analysis,PCA),減少無關(guān)變量的輸出[7]。選取500~918 nm波段的圖像進行PCA處理,大于918 nm和小于500 nm的波段受噪聲影響較大。每個PC圖像是原始光譜波段的線性組合,由相應(yīng)的光譜權(quán)重系數(shù)加權(quán)[8]。
圖3顯示了獼猴桃第一主成分(PC-1)圖像的光譜權(quán)重系數(shù),根據(jù)波峰、 波谷等特征位置得到3個特征波長(682,809和858 nm),在圖上已標明。利用3個特征波長,對原始圖像進行加權(quán)計算,融合成一個和PC-1很接近的圖像。圖4顯示了波長為800 nm的原始圖像及由PC-1的融合圖像,對比可看出,融合圖像[圖4(b)]前景和背景差異性較大,獼猴桃區(qū)域亮度更高,邊界更清晰,便于處理。
圖3 獼猴桃PC-1圖像的光譜權(quán)重系數(shù)Fig.3 Spectral weight coefficient of kiwifruit PC-1 image
圖4 單波長和特征波長下灰度圖像的對比(a):波長為800 nm;(b):特征波長Fig.4 Contrast of grayscale images at single wavelength and characteristic wavelength(a):Wavelength at 800 nm;(b):Characteristic wavelength
由于獼猴桃表面覆蓋絨毛,果實邊緣像素值極低,采用基于區(qū)域的圖像分割技術(shù)難以將背景分離,或者不能保證圖像邊緣的完整性?;谒牟鏄涞膱D像分割法能夠有效解決這個問題,保持圖像細節(jié)更優(yōu)越[9],因此采用基于四叉樹分解方法對融合圖像進行分割。
四叉樹分解過程:首先將圖像分成4個區(qū)域,把具有一致性的像素分到同一區(qū)域,若像素間不滿足一致性標準,則繼續(xù)分成4個區(qū)域,以此類推,直到圖像中的所有區(qū)域都滿足一致性標準才停止。
圖5顯示了利用四叉樹分解對畸形果和正常果圖像分割過程。圖5(a)表示由3個特征波長融合而成的新圖像(融合圖像),然后利用四叉樹分解算法對融合圖像進行分割,再進行形態(tài)學(xué)腐蝕、 膨脹等處理得到掩膜圖像[圖5(b)],從圖5(b)中可以看出,掩膜圖像的邊緣較為完整,細節(jié)部分提取較好。
圖5 基于四叉樹分解提取掩膜圖像的過程(a):融合圖像;(b):掩膜圖像Fig.5 The process of extracting mask images based on quadtree decomposition(a):Fused image;(b):Mask image
形狀特征是果實圖像比較直觀的外形特征,也是果形分類研究最穩(wěn)定的特征,采用MatlabR2018a(Math Works,USA)對形狀特征參數(shù)進行提取。形狀特征參數(shù)的定義及計算方法如下,
(1)面積(Area)
衡量獼猴桃大小的度量單位,定義為目標區(qū)域的實際面積(像素個數(shù)),用V1表示。
(2)周長(Perimeter)
表示包圍目標區(qū)域的邊界輪廓長度,用V2表示。
(3)離散度(Dispersion)
用于描述果實形狀復(fù)雜的指數(shù),表示在果實區(qū)域內(nèi),單位面積內(nèi)的周長的大小。其計算公式如式(2)所示,
(2)
(4)圓形度(Circularity)
圓形度是獼猴桃與圓、 矩形的接近程度的參數(shù),如該參數(shù)越接近1,說明獼猴桃越接近圓形,參數(shù)接近0.79時,獼猴桃形狀接近矩形[4]。其計算公式如式(3)所示,
(3)
(5)離心率(Eccentricity)
與獼猴桃區(qū)域具有相同標準二階中心矩的橢圓的離心率定義為獼猴桃離心率,表示橢圓兩焦點間的距離和長軸長度的比值[10]。其計算公式如式(4)所示,
(4)
式(4)中,focallength是與獼猴桃具有相同標準二階中心矩的橢圓的半焦距,longaxis是其長半軸。
(6)質(zhì)心比(Centroid ratio)
質(zhì)心比表示目標圖像的質(zhì)心到邊界距離的最大值和最小值(Rmax,Rmin)的比值,該值體現(xiàn)其形狀的復(fù)雜性,其計算公式如式(5)所示,
(5)
(7)橢圓率(Ellipticity)
將獼猴桃區(qū)域的最小外接矩形的長和寬比值定義為橢圓率,用于表示目標獼猴桃形狀與橢圓的相似程度。其計算公式如式(6)所示,
(6)
(8)矩形度(Rectangularity)
獼猴桃區(qū)域面積和獼猴桃區(qū)域的最小外接矩形的長和寬的乘積比,其計算公式如式(7)所示,
(7)
(9)當量直徑(Equivalent diameter)
當量直徑表示與獼猴桃區(qū)域面積大小相等圓的直徑[4],其計算公式如式(8)所示,
(8)
(10)緊湊度(Compactness)
將當量直徑和最小外接矩形的長之比定義為緊湊度[4],其計算公式如式(9)所示,
(9)
(11)分形維數(shù)(Fractal dimension)
分形維數(shù)也稱分維,主要用于描述復(fù)雜形體的不規(guī)則性[11]。分形維數(shù)的計算公式如式(10)所示,
(10)
式中,ε表示小立方體的長度,N(ε)表示此小立方體覆蓋被測形體所得的數(shù)量。
(12)傅里葉描述子(Fourier descriptors)
為了定性描述獼猴桃形狀特征,提取傅里葉描述子進行計算,首先計算目標圖像中心坐標,然后計算中心坐標到邊界各點的半徑序列并歸一化,最后采用離散傅里葉變換得到傅里葉描述子,這里取離散傅里葉變換的前15項分量描述邊界信息[5]。其計算公式如式(11)所示,
(11)
式中,m是邊界點坐標個數(shù),rk表示歸一化后的半徑序列,exp是傅里葉變換函數(shù),w是頻率。
為了消除形狀特征參數(shù)因個別數(shù)據(jù)差異性過大,或者由于單位量綱不同、 自身變異所引起的誤差,需要對數(shù)據(jù)進行歸一化處理。歸一化可以把有量綱的表達式經(jīng)過變換變成無量綱的數(shù),計算公式如式(12)所示,
(12)
其中,x表示需要處理的數(shù)據(jù),xmax是數(shù)據(jù)中最大值,xmin是數(shù)據(jù)中最小值,x*表示已處理完成的數(shù)據(jù)。
水利工程大壩一旦出現(xiàn)失控,就會給人民的生命財產(chǎn)安全帶來巨大的威脅,在水利工程大壩防滲加固施工中引入帷幕灌漿技術(shù),可以有效避免水利工程出現(xiàn)安全問題,促進水利工程安全運行,全面提高水利工程的經(jīng)濟效益。高質(zhì)量完成帷幕灌漿技術(shù),可以在水利工程大壩防滲加固中充分發(fā)揮作用。所以,對于帷幕灌漿技術(shù)的研究十分有必要。
在建模前,一般將樣本集劃分為訓(xùn)練集和測試集,采用Kennard-Stone(KS)算法劃分選樣,該算法是從所有樣品中選擇預(yù)定數(shù)目的樣本作為訓(xùn)練集,剩余樣品本作為測試集。KS選樣過程:
(1)首先計算兩兩樣本間的歐幾里德距離,選擇距離最大兩個樣品;
(2)然后分別計算剩余的樣本與已選擇的兩個樣本之間的距離;
(3)對于剩余每個樣本而言,其與已選樣品間的最短距離被選擇,然后選擇這些最短距離中相對最長的距離所對應(yīng)的樣本作為測試集;
(4)重復(fù)步驟(3),直至所選的樣本數(shù)等于需要的數(shù)目為止[12]。
采用KS算法以2∶1的比例對獼猴桃樣本進行劃分,結(jié)果如表1所示,訓(xùn)練集樣本數(shù)包含正常果、 畸形果共有166個,同樣測試集樣本包含正常果、 畸形果共有82個。訓(xùn)練集用于建立獼猴桃形狀特征的分類模型,測試集則驗證模型的分類性能。
表1 獼猴桃樣品劃分統(tǒng)計結(jié)果Table 1 Statistical results of kiwifruit sample division
(1)偏最小二乘線性判別分析
線性判別分析(linear discriminant analysis,LDA)的目標是從高維空間中找到最具分辨能力特征值,將同一類別的樣本聚集在一起,從而達到模式分類識別。但傳統(tǒng)的LDA在訓(xùn)練樣本沒有足夠多時不能保證類內(nèi)離散度矩陣可逆,而偏最小二乘(partial least squares,PLS)最初為一種基于特征變量的回歸方法,為擬合變量集和反應(yīng)變量集之間的線性關(guān)系。
因而,偏最小二乘線性判別分析(partial least squares-linear discriminant analysis, PLS-LDA)的基本思路: 首先利用PLS算法將矩陣X和y進行主成分分解,得到X矩陣的主成分T。然后利用T和各樣本的y值做線性判別分析,最終導(dǎo)出判別函數(shù)[13]。
(2)反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)
反向傳播神經(jīng)網(wǎng)絡(luò),由Rumelhart和McClelland為首的科學(xué)家于1986年提出,是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),具有任意復(fù)雜的模式分類能力和優(yōu)良的多維函數(shù)映射能力?;舅枷胧翘荻认陆捣ǎ锰荻人阉骷夹g(shù),以期使網(wǎng)絡(luò)的實際輸出值和期望輸出值的誤差均方差為最小[14]。
(2)最小二乘支持向量機
支持向量機(support vector machines,SVM)是Corinna Cortes和Vapnik于1995年首先提出,在解決小樣本、 非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢。最小二乘支持向量機(least squares support vector machines,LSSVM)是SVM的一種擴展,在利用結(jié)構(gòu)風險原則時選取不同的損失函數(shù),對數(shù)據(jù)分析和模式識別有較大優(yōu)勢,可用于分類和回歸分析[15]。
模型的性能評價以訓(xùn)練集分類準確率、 測試集分類準確率及總體分類準確率作為評價指標。
以正常果(賦值1)、 畸形果(賦值0)的分類形狀為指標,利用12組形狀特征參數(shù)分別建立PLS-LDA,BPNN和LSSVM模型,然后進行模型判別分析。
3.1.1 PLS-LDA建模分析
對于PLS-LDA模型的建立,首先是通過交叉驗證得到最小錯分率為0.162 7,最優(yōu)主成分數(shù)為8,利用最優(yōu)主成分數(shù)來建模,表2為PLS-LDA模型的分類結(jié)果。從表中可知,利用PLS-LDA模型對正常果的分類,其分類準確率較高,訓(xùn)練集中誤判個數(shù)為5個,而測試集的分類準確率達到100%,對畸形果的分類效果較差,訓(xùn)練集和測試集的準確率分別為69.15%和59.57%。
表2 PLS-LDA模型分類結(jié)果Table 2 Classification result of PLS-LDA model
3.1.2 BPNN建模分析
利用BPNN建立模型,參數(shù)的合理選擇尤其重要。隱藏層數(shù)取2,節(jié)點數(shù)為7,學(xué)習速率為0.3,最大訓(xùn)練次數(shù)為1 000,最小均方誤差為1×10-8。表3表示不同果形的獼猴桃樣品結(jié)合BPNN判別結(jié)果。結(jié)果表明,利用BPNN分類判別,訓(xùn)練集效果較好,正常果、 畸形果的誤判樣本數(shù)分別為1和2,總體準確率為98.19%;測試集的分類效果也較為理想,正常果沒有出現(xiàn)誤判,畸形果誤判個數(shù)為2,準確率為95.74%,而總體準確率也高達97.56%。
表3 BPNN判別結(jié)果Table 3 Discriminant result of BPNN
3.1.2 LSSVM建模分析
對于LSSVM模型,參數(shù)選擇也較為重要。先是采用7-折交叉驗證得到最優(yōu)參數(shù),其中正則化參數(shù)和內(nèi)核參數(shù)分別為816.486 9和11.175 4。利用最優(yōu)參數(shù)建模,然后對模型進行訓(xùn)練、 仿真得出分類結(jié)果,表4為獼猴桃的LSSVM模型分類結(jié)果。結(jié)果表明,利用LSSVM建立模型,訓(xùn)練集畸形果有4個誤判,準確率為95.74%,正常果零誤判,總體準確率達到97.59%;測試集中4個誤判樣本均為畸形果,總體準確率為95.12%。
表4 LSSVM模型分類結(jié)果Table 4 Classification results of LSSVM model
3.2.1 模型比較
結(jié)合PLS-LDA,BPNN和LSSVM建立的分類模型,對于正常果的檢測,訓(xùn)練集的誤判樣本數(shù):PLS-LDA,BPNN和LSSVM分別為4,1和0,對應(yīng)的其分類準確率均在94%以上,而三種模型測試集均未出現(xiàn)誤判,分類準確率為100%,模型總體分類效果較好,模型性能依次是LSSVM最好、 BPNN其次、 PLS-LDA最差。對于畸形果的檢測,PLS-LDA,BPNN和LSSVM模型訓(xùn)練集的誤判樣本數(shù)分別為29,2和4,前者的分類準確率低于70%,后兩者在95%以上,三種模型測試集的誤判個數(shù)分別為19,2和4,分類準確率分別為59.57%,95.74%和91.49%,模型分類效果:BPNN最優(yōu)、 LSSVM其次,PLS-LDA效果最差。
綜合比較獼猴桃形狀特征的PLS-LDA、 BPNN和LSSVM分類模型,可以看出PLS-LDA模型的分類效果最差,訓(xùn)練集和測試集的總體準確率分別為80.12%和76.83%,BPNN和LSSVM模型效果較接近。BPNN模型對正常果的檢測,訓(xùn)練集中出現(xiàn)1個誤判,但是測試集誤判樣本數(shù)僅為LSSVM模型的一半,同時在畸形果的檢測中,BPNN模型的分類效果均優(yōu)于LSSVM,訓(xùn)練集和測試集的總體分類準確率均大于LSSVM,故認為BPNN是最優(yōu)模型,具有最高的總體分類準確率(98.19%和97.56%)。
3.2.2 誤判樣本分析
在最優(yōu)模型BPNN模型中,共有5個樣品未能正確分類,訓(xùn)練集中2個畸形、 1個正常樣品,測試集中2個畸形;出現(xiàn)誤判有多方面的原因。如圖6(a)所示,融合圖像(左邊)包含樣品表面缺陷、 邊界形狀雙重特征,由專業(yè)分析人員定義為畸形果,但僅根據(jù)該樣品的輪廓(右圖)進行判別,模型容易出現(xiàn)錯分。
圖6 BPNN模型的誤判樣本(a):畸形果誤判;(b):正常果誤判Fig.6 Misjudged samples of BPNN model(a):Misjudged malformation;(b):Misjudged normal
其次,影響正常樣品未正確分類的另一個因素是果梗的存在,如圖6(b)所示,果梗的存在與否,將直接影響提取的形狀特征參數(shù)值,然后影響模型分類能力,導(dǎo)致模型的準確率不高。在今后的試驗中,將改進試驗方法,盡量保證樣品特征的一致性(同種特征參與建模計算),減少不同特征的差異性,以提高模型分類準確率。
基于獼猴桃形狀特征,利用高光譜成像結(jié)合多種建模方式對獼猴桃正常果、 畸形果進行分類判別具有如下結(jié)論:
(1)采用主成分分析法對光譜數(shù)據(jù)降維并提取特征波長,對特征波長進行組合計算;利用四叉樹分解算法來分割背景,得到的掩膜圖像,沒有雜散光和噪聲影響,邊界信息保留較為完整。
(2)提取了12組獼猴桃形狀特征參數(shù),結(jié)合PLS-LDA,BPNN和LSSVM建模分析。結(jié)果表明,BPNN和LSSVM模型的分類效果較為理想,總體的準確率均達到95%以上,表明了利用高光譜成像來檢測獼猴桃形狀是可行的。
(3)基于獼猴桃形狀特征參數(shù)建立的3種模型,其最佳分類模型為BPNN模型,總體分類準確率分別為98.19%和97.56%。該技術(shù)為獼猴桃形狀分類提供方法和理論依據(jù),為農(nóng)產(chǎn)品外形無損檢測奠定了理論基礎(chǔ)。