摘要:掃描了4個玉米品種各70粒種子圖像,采用OSTU法對圖像進行分割,利用改進的開閉運算對分割后圖像進行修整,并用快速混合重構(gòu)算法對修整過的二值圖像中的孔洞進行填充,最終得到玉米子粒的胚部圖像。利用連通區(qū)域標記法和多對象輪廓提取算法對胚部圖像進行形態(tài)特征參數(shù)的提取,對每粒玉米子粒的胚部提取了面積、周長、圓形度、橢圓短長軸比、矩形度、離心率6個形態(tài)特征參數(shù)。利用K-均值聚類分析對提取到的特征參數(shù)進行品種識別,4種玉米品種的檢出率達到94%以上。利用胚部形態(tài)特征進行玉米品種識別是有效的。
關(guān)鍵詞:玉米;品種識別;胚部特征;K-均值聚類
中圖分類號:TP391.41 文獻識別碼:A 文章編號:0439-8114(2013)17-4232-03
Varieties Identification of Maize Based on Embryo Characteristics
ZHANG Wen-jing1,CHENG Hong1,2,WANG Ke-jian1
(1.College of Information Science Technology, Agriculture University of Hebei, Baoding 071001,Hebei,China;
2. College of Information and Electrical Engineering, China Agricultural University,Beijing 100083, China)
Abstract: Four maize varieties were selected, and 70 images of each variety were scanned. The images were segmentled by OSTU, then were repaired through the improved open-close operation, and the rapid mixing reconstruction algorithm was used to fill the repaired binary image holes, so the embryo images of maize were obtained. Morphological parameters of embryo were extracted with connected components labeling method and multi-object contour extraction algorithm, which contained the following 6 morphological parameters, area, perimeter, circularity, elliptic short-long axis ratio, rectangular degree and eccentricity. Using K-means cluster to identify the maize varieties with the morphological parameters, the detection rates of the four maize varieties were all over 94%. The experimental results verified the effectiveness of maize variety identification using embryo morphology.
Key words: maize; variety identification; embryo characteristic; K-means cluster
收稿日期:2013-05-22
基金項目:河北農(nóng)業(yè)大學理工基金項目(LG20110604);河北省教育廳資助項目(Q2012139)
作者簡介:張文靜(1981-),女,河北邯鄲人,講師,碩士,主要從事數(shù)據(jù)挖掘和人工智能方面的研究,(電話)15903120820(電子信箱)
zwjndjs@163.com。
目前,種子品種質(zhì)量檢驗的實驗室方法有電泳技術(shù)、色譜分析技術(shù)、熒光掃描技術(shù)、遺傳物質(zhì)DNA分析技術(shù)以及近些年出現(xiàn)的近紅外光譜分析[1-3]等。這些檢驗具有準確率高而且能夠進行純度鑒定等顯著優(yōu)勢,但成本高、周期長而且需要專門的儀器設(shè)備條件等特點使得這些方法都不能應(yīng)用于種子交易流通的現(xiàn)場。利用機器視覺進行農(nóng)作物種子品種的自動識別,可以實現(xiàn)快速、無損檢測,便于形成簡單便攜的應(yīng)用于種子流通和種植現(xiàn)場的檢測設(shè)備。但是,相對于上述列舉的各種實驗室檢測方法,目前利用機器視覺進行品種自動識別的準確率還難以滿足實際應(yīng)用的需要,解決的途徑就是基于更有效的特征參數(shù)建立更準確的識別模型。
利用機器視覺進行玉米品種的自動識別研究,大部分采用針對玉米種子整體的特征參數(shù)[4-13]。為了提高分類識別的準確率,近些年也開始進行局部特征的研究。寧紀鋒等[14]利用玉米種子尖端的形態(tài)特征和胚部圖像的亮度特征進行了玉米子粒品質(zhì)的識別研究;史智興等[15]提出了把玉米子粒的數(shù)字圖像分解為胚部和冠部尋找局部特征參數(shù)的研究思路,分別提取了玉米胚部和冠部的顏色和面積等直接特征,構(gòu)造了胚部和冠部的面積比等間接特征,在少量樣本下驗證了局部特征在品種識別中的有效性;韓仲志等[16]提出了一種基于獨立分量分析ICA的玉米胚部測量方法,并建立了檢測模型。
玉米子粒由胚部(白色部分)與冠部(黃色部分)組成。其中的胚部部分是玉米的重要農(nóng)藝性狀之一。玉米的胚形指的是玉米子粒白色胚部果皮的形態(tài)、面積的大小及沿形狀。在遺傳過程中,玉米子粒的胚形具有相對穩(wěn)定性,是玉米品種的主要特征之一。因此,研究玉米種子的胚形可以有效地進行玉米品種的鑒別[17]。為了進一步驗證胚部在玉米識別過程中的有效性,以玉米子粒的胚部為研究對象,提取了胚部的6個形態(tài)特征參數(shù),并以K-聚類分析算法進行了基于玉米胚部特征的品種識別。
1 試驗材料
試驗選取4個玉米品種,分別是先玉335、農(nóng)大4967、京科25和金秋963,主色調(diào)均為黃色,由河北農(nóng)業(yè)大學農(nóng)學院作物育種部門提供。每個玉米品種選取具有固有特征的70粒種子作為試驗樣本。
2 圖像采集與參數(shù)提取
2.1 玉米子粒圖像的采集
選取的4個玉米品種共280粒的試驗樣本,若每個子粒單獨采集圖像,工作量大,效率低,故選擇先同時采集多個玉米子粒圖像,后期進行圖像分割,進而分離出每個玉米子粒胚部圖像的方法。
具體方法為:采用人工擺放方式將一個玉米品種的70粒種子樣本全部放在黑色橡膠板上。要求玉米子粒相互間不重疊,玉米子粒胚部所在面朝上,并且使玉米子粒尖端朝向掃描起始方向(以便減少掃描儀照明所產(chǎn)生的胚部皺褶陰影)。采用明基Q52平板掃描儀以600 dpi進行掃描。最終獲得4個品種玉米子粒的4幅RGB圖像,圖像格式為.bmp。
2.2 玉米子粒胚部圖像的提取
采用閾值分割中的OSTU法對采集到的玉米子粒圖像進行分割,并對分割后圖像運用數(shù)學形態(tài)學中改進的開閉運算進行修整,采用快速混合重構(gòu)算法對修整過的二值圖像中的孔洞進行填充,可以得到玉米子粒的胚部圖像。
2.3 特征參數(shù)的提取
利用連通區(qū)域標記法和多對象輪廓提取算法,從提取到的玉米子粒的胚部圖像中提取胚部的特征參數(shù)。每個子粒胚部提取6個形態(tài)特征參數(shù),分別是面積、周長、圓形度、橢圓短長軸比、矩形度、離心率(表1)。
各參數(shù)的定義如下:①面積:胚部區(qū)域像素的個數(shù);②周長:胚部區(qū)域的邊緣像素個數(shù);③矩形度:胚部區(qū)域的面積/包圍該連通域的最小矩形面積;④圓形度=4π×面積/(周長×周長);⑤橢圓短長軸比:與胚部區(qū)域具有相同標準二階中心矩的橢圓的短軸與長軸的比值;⑥離心率:具有相同標準二階中心矩的橢圓的離心率。
3 基于胚部特征的玉米品種的識別
3.1 K-均值聚類分析算法
根據(jù)數(shù)據(jù)的內(nèi)在性質(zhì)將數(shù)據(jù)集合中的數(shù)據(jù)分成若干類,聚類的原則是,將具有相同特性的數(shù)據(jù)盡可能地歸為同一個聚合類中,并且使不同類之間的屬性差別盡可能大。K-均值聚類算法是目前應(yīng)用最為廣泛的一種聚類算法,其基本原理是用戶指定聚類的數(shù)目k,算法依據(jù)某個距離函數(shù)把指定的數(shù)據(jù)集合中的數(shù)據(jù)反復地分入k個聚類中。
具體的K-均值聚類過程如下:
初始的聚類中心由系統(tǒng)隨機選取的k個對象決定,分別計算各個種子聚類中心與每個對象之間的距離,選擇最近的聚類中心距離分配對象。一個聚類由分配的對象和該類的聚類中心組成。當全部對象都被分配完成后,再根據(jù)聚類中現(xiàn)有的對象重新計算該聚類中的聚類中心。不斷地重復這個過程,直到某個終止條件成立。終止條件可以為:
1)每個聚類中不再有新的對象被分配進入;
2)所有的聚類中心不再發(fā)生變化;
3)誤差平方和局部最小。
算法的偽代碼如下:
1)選擇k個點作為初始質(zhì)心;
2)repeat
將每個點指派到最近的質(zhì)心,形成k個簇重新計算每個簇的質(zhì)心
util 質(zhì)心不發(fā)生變化
3.2 品種識別過程
采用SPSS軟件提供的k-均值聚類功能對試驗所提取到的4個玉米品種子粒的6個胚部形態(tài)特征參數(shù)進行聚類分析。每次分析的樣本數(shù)量為100粒,其中含有一定數(shù)量的待測品種和若干粒其他雜粒品種。初始聚類中心由系統(tǒng)隨機選擇。4個玉米品種的識別率達到94%以上,結(jié)果如表2所示。
利用K-均值聚類分析對4個玉米品種的識別率高低不同,原因主要有以下幾點:不同的玉米種子本身存在著個體差異,如胚部的飽滿與凹陷等;在圖像采集時,掃描儀照明產(chǎn)生的某些胚部皺褶陰影導致最后提取到的胚部圖像信息存在一些差異。聚類分析所選取的聚類特征不盡完美,還有待進一步的研究。這些都在一定程度上對玉米種子胚部圖像的提取和參數(shù)特征分析產(chǎn)生了不同程度的影響。
4 小結(jié)
種子的質(zhì)量對農(nóng)作物的產(chǎn)量有著重大的影響。玉米是我國最主要的農(nóng)作物之一, 對玉米品種的識別研究一直是農(nóng)業(yè)領(lǐng)域的熱點課題。玉米子粒的胚部特征是重要的農(nóng)藝性狀之一,不同品種的玉米胚部特征有較大的差別。掃描了玉米4個品種各70粒種子的圖像,并利用OSTU、開閉運算、連通區(qū)域標記法和多對象輪廓提取算法對圖像進行處理,得到了玉米子粒的胚部形態(tài)特征參數(shù)。利用K-均值聚類分析對提取到的特征參數(shù)進行聚類分析,4個玉米品種的檢出率達到94%以上。試驗結(jié)果驗證了利用胚部形態(tài)特征進行玉米品種識別的有效性。
參考文獻:
[1] 鄔文錦,王紅武,陳紹江,等.基于近紅外光譜的商品玉米品種快速鑒別方法[J].光譜學與光譜分析,2010,30(5):1248-1251.
[2] 陳新亮,王徽蓉,李衛(wèi)軍,等.一種用于玉米品種鑒別的近紅外光譜頻率選擇方法[J].光譜學與光譜分析,2010,30(9):2919-2922.
[3] VENORA G,GRILLO O,SHAHIN M A,et al.Identification of Sicilian landraces and Canadian cultivars of lentil using an image analysis system[J]. Food Research International,2007, 40(1):161-166.
[4] CHOUDHARY R,PALIWAL J,JAYAS D S.Classification of cereal rains using wavelet, morphological,colour,and textural features of non-touching kernel images[J].Biosystems Engineering,2008,99(3):330-337.
[5] MOHAN L A,KARUNAKARAN K,JAYAS D S, et al.classification of bulk cereals using visible and NIR reflectance characteristics[J]. Canadian Biosystems Engineering,2005,47(7):7-14.
[6] 權(quán)龍哲,祝榮欣,雷 溥,等.基于K-L變換與LS-SVM的玉米品種識別方法[J].農(nóng)業(yè)機械學報,2010,41(4):168-172.
[7] 楊錦忠,郝建平,杜天慶,等.基于種子圖像處理的大數(shù)目玉米品種形態(tài)識別[J].作物學報,2008,34(6):1069-1073.
[8] 周 紅,劉光蓉,管庶安.數(shù)字圖像處理技術(shù)在玉米種子輪廓檢測中的應(yīng)用[J].種子,2004,23(9):90-92.
[9] 楊錦忠,張宏生,郝建平,等.玉米果穗圖像單一特征的品種鑒別力評價[J].農(nóng)業(yè)工程學報,2011,27(1):196-200.
[10] 閘建文,陳永艷.基于外部特征的玉米品種計算機識別系統(tǒng)[J].農(nóng)業(yè)機械學報,2004,35(6):115-118.
[11] 王玉亮,劉賢喜,蘇慶堂,等.多對象特征提取和優(yōu)化神經(jīng)網(wǎng)絡(luò)的玉米種子品種識別[J].農(nóng)業(yè)工程學報,2010,26(6):199-204.
[12] 熊 凱,李向紅,李言照,等.基于ANN和PCA的玉米品種特征分析與識別研究[J].糧油食品科技,2010,18(4):1-5.
[13] 程 洪,史智興,么 煒,等.基于支持向量機的玉米品種識別[J].農(nóng)業(yè)機械學報,2009,40(3):180-183.
[14] 寧紀鋒,何東健,楊蜀秦.玉米籽粒的尖端和胚部的計算機視覺識別[J].農(nóng)業(yè)工程學報,2004,20(3):117-119.
[15] 史智興,程 洪,李江濤,等.圖像處理識別玉米品種的特征參數(shù)研究[J].農(nóng)業(yè)工程學報,2008,24(6):193-195.
[16] 韓仲志,趙友剛,楊錦忠.基于籽粒RGB圖像獨立分量的玉米胚部特征檢測[J].農(nóng)業(yè)工程學報,2010,26(3):222-226.
[17] 史 勇.談玉米種子的胚形[J].種子世界,2002(4):49.
(責任編輯 王曉芳)