康智強, 袁朝輝, 程瑞鋒
1.西北工業(yè)大學(xué) 自動化學(xué)院, 陜西 西安 710072; 2.西安建筑科技大學(xué) 機電工程學(xué)院, 陜西 西安 710055; 3.西北工業(yè)大學(xué) 航海學(xué)院, 陜西 西安 710072
玉米是糧食、飼料、工業(yè)原料兼用型作物。據(jù)統(tǒng)計,2013~2014年全國玉米總產(chǎn)量約20億噸。全國玉米種植面積2014年為35 000萬公頃,2016年我國的玉米播種面積3 676萬公頃,產(chǎn)量超過21 955萬噸;國儲2.4億噸。據(jù)USDA統(tǒng)計,近幾年世界玉米使用量超過7億噸,并有逐年遞增的趨勢。我國玉米面積和總產(chǎn)都居世界第二位[1]。玉米生產(chǎn)在國家糧食生產(chǎn)和糧食安全中占有極重要戰(zhàn)略地位,玉米種子更重要,研究證明[2]玉米優(yōu)良種的推廣使我國玉米增產(chǎn)40%,種子質(zhì)量直接關(guān)系到玉米產(chǎn)量高低及玉米質(zhì)量和品質(zhì)的優(yōu)劣[3],而推廣優(yōu)良的雜交種需要大量優(yōu)質(zhì)種子。因此,中國玉米產(chǎn)業(yè)的發(fā)展史同時也是玉米種子的優(yōu)化史。
據(jù)有關(guān)部門的研究推算,玉米新品種的推廣利用在玉米增產(chǎn)總額中發(fā)揮40%的作用。在未來玉米種植面積增速將總體趨緩的背景下,玉米產(chǎn)量持續(xù)增長將主要依賴于良種開發(fā)帶來的單產(chǎn)提高。玉米種子企業(yè)的核心競爭力取決于企業(yè)擁有的產(chǎn)品品種優(yōu)勢??v觀玉米種業(yè)發(fā)展歷史,耐密植、綜合抗性好、籽粒品質(zhì)優(yōu)良、早熟以及抗倒性強逐漸為品種推廣潛力的重要條件。近年來,玉米品種的申報和審核數(shù)在各類品種中占絕對優(yōu)勢,但從增長速度來看,國審玉米品種的增速明顯低于其他大田作物,下降趨勢明顯,這也預(yù)示現(xiàn)階段玉米種子“真正”的匱乏。 我國玉米種子種植地每年采摘的玉米果穗都需要先除玉米穗子皮,才烘干脫粒。這些工作主要是依靠人工篩選,人工檢測玉米果穗依靠人眼分辨,效率低、準(zhǔn)確性差,易疲勞等缺點,如果將有玉米穗子皮的玉米進入烘干機很難快速烘干顆粒,或者會將不合格的玉米穗子進入烘干機等,這些都將會導(dǎo)致大量損失。
植物新品種測試是對申請保護的植物新品種進行特異性、一致性和穩(wěn)定性的栽培鑒定試驗或室內(nèi)分析測試的過程(簡稱DUS測試),根據(jù)特異性、一致性和穩(wěn)定性的試驗結(jié)果,判定測試品種是否屬于新品種,為植物新品種保護提供可靠的判定依據(jù)。
根據(jù)參考文獻[4]對玉米種子品種鑒別方面的研究結(jié)果,不同類型的籽粒特征在識別中作用不同,其識別效果次序為:大小類、形狀類、紋理類、顏色類特征。種子顏色在玉米品種識別中的作用非常明顯。大小類、形狀類、紋理類、顏色類、后3類組合、全部4類組合等模型的品種檢出率分別為25%、33%、39%、95%、95%和95%,平均籽粒拒真率分別為90%、90%、86%、45%、47%和42%,認(rèn)偽率為92%、92%、88%、46%、48%和43%,且后2個誤判率高度正相關(guān)(r=0.83~0.91)。機器視覺檢測具有成本和速度上的優(yōu)勢,能夠用于大數(shù)目玉米品種的真?zhèn)舞b定,形狀+紋理+顏色組合模型最佳,經(jīng)改進技術(shù)識別率可以進一步提高。本文主要通過圖1系統(tǒng)的機器視覺分析處理。
圖1 玉米種子果穗檢測圖
實驗樣本共測定46個形態(tài)特征指標(biāo),其中,反映種子大小的有長度、寬度、長軸長、短軸長、周長、等面圓直徑、側(cè)投影面積等7個指標(biāo);反映種子形狀的有矩形度、橢圓度、凹凸比、圓形度、短/長軸長比、緊湊度、相對質(zhì)心的縱坐標(biāo)與橫坐標(biāo)等8個指標(biāo);反映種子紋理的為7個統(tǒng)計不變矩,種子紋理變量反映種子圖像灰度值的次數(shù)分布特點。反映種子顏色的有24個特征指標(biāo),分別由RGB與HSV色彩空間的R、G、B、H、S 和V分量的均值、方差、偏度和峰度組成。
根據(jù)參考文獻[5]在DUS測試中,對尋找新的果穗性狀并評價它們單獨鑒別品種能力的研究結(jié)果,采用4大類形態(tài)特征共計145個性狀,逐一性狀對品種進行判別分析(以性狀的品種識別率表示性狀鑒別品種的能力大小),單一性狀的品種識別率變化在0.244~0.634之間,在前17個高鑒別力性狀中,果穗長寬比等具有與指南性狀同等的甚至更高的品種區(qū)分能力。
4大屬性的鑒別力從大到小依次為形狀類、紋理類、顏色類、大小類。
表1 玉米種子果穗圖像特征匯總
圖2和圖3是根據(jù)表1要求給出的合格和不合格樣本。
圖2 合格玉米種子果穗
圖3 不合格的玉米種子果穗
判別分析法是根據(jù)所研究個體的觀測值來構(gòu)建一個綜合標(biāo)準(zhǔn)用來推斷個體屬于己知種類中的哪一類的方法[6],這種統(tǒng)計方法在自然科學(xué)和社會科學(xué)的研究中會經(jīng)常用到。因為所采用的標(biāo)準(zhǔn)有很多種,所以判別分析也有多種方法,logistic回歸線性判別分析,感知機準(zhǔn)則,最小二乘(最小均方誤差)準(zhǔn)則。
本文將玉米果穗檢測分類器的設(shè)計,通過對比線性分類器中的權(quán)值向量發(fā)現(xiàn):
1)感知機準(zhǔn)則的優(yōu)點是簡單、便于實現(xiàn),缺點是結(jié)果不唯一,在線性不可分情況下不收斂。
2)最小二乘準(zhǔn)則是基于最小二乘法求線性組合的權(quán)值,優(yōu)點是回歸結(jié)果與坐標(biāo)選擇無關(guān),缺點是對于異常值非常敏感。
Fisher判別法的數(shù)學(xué)思想方法是將多維空間中的點投影到一維直線Y上,使得由總體θ1和θ2產(chǎn)生的y盡可能分開,然后再利用距離判別法建立判別準(zhǔn)則,進而達到判別個體所屬群體的一種統(tǒng)計方法[7]。采用Fisher線性判別根據(jù)閾值選擇投影方向可以達到很好的預(yù)期分類效果。Fisher線性判別是把線性分類器的設(shè)計分為2步,一是確定最優(yōu)方向,二是在這個方向上確定分類閾值;感知機則是通過不斷迭代直接得到完整的線性判別函數(shù)。
假設(shè)θ1和θ2為二維總體,如圖4所示“·”為θ1的點,“°”為θ2的點,按原來的橫坐標(biāo)x1和縱坐標(biāo)y1,難以將這2個總體的點分開,但是如果將這些點朝直線y上投影,形成一維空間集合的點,則能較容易分開。
圖4 θ1和θ2在Y方向的投影圖
顯然,直線y是x1和y1的線性組合,即y=c1x1+c2y1。一般地,設(shè)在p維空間里,x的線性組合為y=αTx。其中:α為p維實向量,設(shè)θ1和θ2的均值分別為μ1和μ2,它們有共同的協(xié)方差陣Σ,那對應(yīng)線性組合y=αTx的均值為:
μ1y=E(y|x,y∈θ1)=αTμ1
(1)
μ2y=E(y|x,y∈θ2)=αTμ2
(2)
對應(yīng)的方差為:
var(y)=var(αT(x,y))=αTSα
(3)
由圖4可知,使得μ1y和μ2y的距離越大,線性組合越好,考察以下比值:
(μ1y-μ2y)2var(y)=[αT(μ1-μ2)]2αTΣα
(4)
確定參數(shù)α,設(shè)x為p維隨機向量,當(dāng)α=cΣ-1(μ1-μ2)(c為非零常數(shù))時,(4)式取值最大。當(dāng)c=1時函數(shù)
y=αTx=(μ1-μ2)TΣ-1x
(5)
則(5)式為Fisher線性判別函數(shù)。將圖像投影到玉米種子果穗上,矩陣W包含來自N個對象的所有特征向量,即
W=[W1,…,Wi,…,WN]
(6)
對于第i個類的pi個訓(xùn)練圖像i=1,2…,N,將圖像投影到玉米果穗空間上,即:
Wi=[wi,1,…wi,j,…wi,pi]∈RL×pi
(7)
式中,每個向量是一個大小為L×1的列向量,在訓(xùn)練階段第i類由向量空間wi表示,稱為每個對象的預(yù)測器。根據(jù)Fisher準(zhǔn)則,本文求類間重建誤差(BCRE)與類間重建誤差(WCRE)比值來尋找最優(yōu)投影。優(yōu)化后找FC-LDRC算法要最大化給定的目標(biāo)函數(shù),表示為:
maxUJ(U)=maxUEBCEWC
(8)
J(U)=EBC/EWC=
1M(c-1)∑Mi=1,j=1∑cj≠l(xi)‖yi-‖21M∑Mi=1‖yi-‖2
(9)
J(U)=
=tr(UTEbU)tr(UTEωU)
(10)
式中,Eb和Eω分別表示為LRC得到的類間重建誤差矩陣和類內(nèi)重建誤差矩陣:
(11)
(12)
由LRC引起的內(nèi)部類重建誤差的每個類的樣本數(shù)通常小于樣本空間的維度,(8)式中定義的目標(biāo)函數(shù)變換為:
argmaxJU(U)=argmaxUUTEbUUTEωU
(13)
argmaxJU(U)=argmaxUUTEbUUTEωU=
(14)
等價可求最大特征值對應(yīng)的特征向量:
λmax[(UW)-1Eb]
(15)
式中,λmax為標(biāo)量,最佳投影方向U為(UW)-1(EBC-EWC)。
本文采用機器視覺自動檢測玉米種子果穗,在計算測量實驗中發(fā)現(xiàn),僅僅依靠圖像簡單的衡量玉米果穗種子的合格是非常有限而且不能滿足檢測的效率。在數(shù)字圖像處理的基礎(chǔ)上結(jié)合Fisher準(zhǔn)則能夠快速有效的區(qū)分合格和不合格種子。根據(jù)玉米種子果穗檢測要求,創(chuàng)建如圖5所示的一個包含簡單玉米果穗種子數(shù)據(jù)集。采用basler工業(yè)相機acA1300-60工業(yè)相機,分辨率1 280×1 024。鏡頭采用35 mm廣角光學(xué)鏡頭,分別應(yīng)用Fisher準(zhǔn)則、感知機準(zhǔn)則和最小二乘法準(zhǔn)則對檢測結(jié)果的以下幾個方面進行對比區(qū)分:
圖5 玉米種子果穗樣品
1) 顏色檢測學(xué)習(xí)
顏色是成品檢測的第一關(guān),通過玉米果穗的整體顏色、玉米果穗上的雜色、異色所占比率和玉米果穗兩頭穗軸色可初步完成成品檢測。顏色檢測主要包括區(qū)分穗整體顏色、粒頂主、次顏色、和行間顏色3個子類顏色,RGB與HIS等2個顏色空間,R、G、B、H、I、S等6個分量的均值、標(biāo)準(zhǔn)差、偏度和峰度以及各類顏色的比例,檢測方法為:根據(jù)玉米果穗上的雜色、異色所占比率,找出雜色異色區(qū)域進行分析,結(jié)果如圖6所示。
圖6 玉米種子果穗顏色取值
2) 形狀檢測學(xué)習(xí)
通過圖7所示的玉米種子果穗形狀提取,分析比較穗緣角、長寬比、凹凸比、相對質(zhì)心縱橫坐標(biāo)、緊湊度、矩形度、圓形度、離心率、球面度、球體度等特征。
3) 大小檢測學(xué)習(xí)
通過圖8所示的玉米種子果穗大小取值的提取,進行穗長與有效長、穗粗與眾數(shù)粗、橢圓長與短軸長、周長與面積及凸形面積、表面積與體積、等面圓與等面球及等體球的直徑的比較分析。
圖7 玉米種子果圖8 玉米種子果 穗形狀取值 穗大小取值
4) 紋理檢測學(xué)習(xí)
紋理是客觀世界存在的,是圖像分析中常用的概念,也是圖像的基本特征。從廣義上說,紋理反映了圖像灰度模式的空間分布,包含了表面信息以其與周圍環(huán)境的關(guān)系,兼顧了圖像的宏觀結(jié)構(gòu)與微觀結(jié)構(gòu)。目前關(guān)于紋理具有代表性定義主要有:①紋理構(gòu)成了一個宏觀的區(qū)域。它的結(jié)構(gòu)可歸結(jié)為某種重復(fù)模式,其元素或者基元按照某種放置規(guī)則排列。②圖像紋理是抽象的和細(xì)胞化的。一個圖像紋理可以用它的所有基元的類型和數(shù)目以及基元的空間組織構(gòu)架來描述。對于許多平滑的灰度表面,存在某一尺度,在此尺度下,表面不具有紋理,而當(dāng)分辨率增加時,它的精細(xì)紋理就會顯現(xiàn),反之就是粗紋理。③如果函數(shù)的局部統(tǒng)計性質(zhì)或其他局部性的屬性集是恒定的,緩慢變化的,或者具有近似的周期性,則圖像的某一區(qū)域就具有某種不變紋理。7個統(tǒng)計不變矩、穗行數(shù)與穗行角、亮度均值與標(biāo)準(zhǔn)差及偏度、均勻度與粗糙度及熵、傅里葉變換的峰值位置與均值及方差。
結(jié)合紋理特征,根據(jù)圖9所示的玉米種子圖像紋理的提取進行紋理檢測。
圖9 圖像紋理的提取
通過圖6~圖9所示的對玉米種子果穗圖像的預(yù)處理和分析,選取其中20種處理結(jié)果,如表2所示。從這些特征數(shù)值中可以簡單分析出玉米種子果穗的優(yōu)劣,但是單從一種特征很難區(qū)分,例如能量和熵,因此本文采用Fisher方法[9]對數(shù)據(jù)進行二次分析。
表2 實驗數(shù)據(jù)集
由于在分類問題上,有些方法不像支持向量機等方法[10]可以通過核函數(shù)映射到高維空間再用超平面進行分類,而只能將多維特征投影到一維直線上,把分類問題轉(zhuǎn)化成尋找分界點問題進行處理[11]。但在高維空間里,采用這種方法把它們投影到任意一條直線上,有可能使不同類別的樣本混淆在一起,無法有效區(qū)分樣本[12]。為此,采用Fisher算法在方向選取方面的優(yōu)勢,根據(jù)類間離散度矩陣與總類間離散度矩陣之比的最大值來確定投影方向,選取對樣本投影最好的直線方向;并通過對樣本間離散度的選取,實現(xiàn)最好方向投影的變換。將樣本映射到最好方向向量的變換原則為:在該向量上,不同樣本間離散度矩陣盡量大,而同種樣本間離散度盡量小。
為此,本實驗通過重排像素值,將PCA降維作為玉米種子果穗的特征向量,通過Fisher學(xué)習(xí)分類來訓(xùn)練樣本集。實驗首先將所有玉米種子果穗轉(zhuǎn)化為灰度,對于每個條件,為了減少識別結(jié)果的變化,計算了平均識別精度作為最后的識別精度。在此基礎(chǔ)上,對抽取的20種玉米果穗采用Fisher算法和線性判別分析、感知機準(zhǔn)則和最小二乘法的識別率對比,結(jié)果如表2所示。
表3為Fisher方法和其他的一些方法線性分析對比。
表3 幾種線性分類方法結(jié)果對比
本文采用機器視覺自動檢測玉米種子果穗,根據(jù)檢測要求主要檢測玉米種子果穗的大小類、形狀類、紋理類、顏色類,本文對其中的23種處理結(jié)果,從這些特征數(shù)值中可以簡單分析出玉米種子果穗的優(yōu)劣,但是單從一種特征區(qū)分度不是很高。而且這些檢測玉米果穗種子方法非常有限而且不能滿足檢測的效率。
本文在檢測中參考很多文獻,每一種檢測方法都有自己的優(yōu)點和缺點,本文檢測的玉米種子果穗要求很高,單純的一種方法不能滿足檢測要求,但是幾種方法融合可以很好地滿足檢測要求。
本文通過自己編寫的算法結(jié)合Fisher準(zhǔn)則根據(jù)類間離散度矩陣與總類間離散度矩陣之比的最大值確定投影方向,通過大量實驗數(shù)據(jù)證明能夠高效率高精度的分揀玉米果穗種子。
參考文獻:
[1] 王玉亮. 基于機器視覺的玉米種子品種識別與檢測研究[D]. 泰安:山東農(nóng)業(yè)大學(xué),2008:1-5
Wang Yuliang. Research on Identification and Detection of Maize Seed Varieties Based on Machine Vision[D]. Taian, Shandong Agricultural University, 2008 (in Chinese)
[2] 張超良, 王斌. 玉米種子純度檢驗的方法及其評價[J]. 作物雜志,1998(1):12-16
Zhang Chaoliang, Wang Bin. Method and Evaluation of Purity Test of Maize Seed[J]. Crop Science, 1998(1): 12-16 (in Chinese)
[3] 高榮岐,張春慶. 作物種子學(xué)[M]. 北京:中國農(nóng)業(yè)科技出版社,2010
Gao Rongqi, Zhang Chunqing. Plant the Seeds[M]. Beijing, China Agricultural Science and Technology Press, 2010 (in Chinese)
[4] 史中輝. 玉米種子品種智能識別系統(tǒng)研究[D]. 泰安:山東農(nóng)業(yè)大學(xué),2011,6: 27-48
Shi Zhonghui. Research on Corn Seed Varieties Intelligent Identification System[D]. Taian, Shandong Agricultural University, 2011, 6: 27-48 (in Chinese)
[5] 楊錦忠, 張洪生,郝建平,等. 玉米果穗圖像單一特征的品種鑒別力評價[J]. 農(nóng)業(yè)工程學(xué)報,2011, 27(1): 196-200
Yang Jinzhong, Zhang Hongsheng, Hao Jianping, et al. Discrimination Evaluation of Single Feature of Maize Ear Image[J].Trans of the Chinese Society of Agricultural Engineering, 2011, 27(1):196-200 (in Chinese)
[6] 黃利文. 改進的Fisher判別方法[J]. 福州大學(xué)學(xué)報:自然科學(xué)版,2006, 34(4): 473-474
Huang Liwen. Improvement Fisher Discriminant Analysis Method[J]. Journal of Fuzhou University, Natural Science, 2006, 34(4): 473-474 (in Chinese)
[7] 李建軍,丁正生,張海燕. 常用判別分類方法分析[J]. 西安科技大學(xué)學(xué)報,2007,27(1):138-139
Li Jianjun, Ding Zhengsheng, Zhang Haiyan. The Analysis of a Few Discriminances[J]. Journal of Xi′an University of Science and Technology, 2007, 27(1): 138-139 (in Chinese)
[8] 曾賢灝,李向偉. 基于Fisher準(zhǔn)則改進線性判別回歸分類的人臉識別[J]. 計算機應(yīng)用與軟件,2014,31(9):184-186
Zeng Xianhao, Li Xiangwei. Improving Face Recognition with Linear Discriminant Regression Classification Based on Fisher Criterion[J]. Computer Applications and Software, 2014,31(9):184-186 (in Chinese)
[9] 王明合,張二華,唐振民,等. 基于Fisher線性判別分析的語音信號端點檢測方法[J]. 電子與信息學(xué)報,2015,37(6):1343-1349
Wang Minghe, Zhang Erhua, Tang Zhenmin, et al. Voice Activity Detection Based on Fisher Linear Discriminant Analysis[J]. Journal of Electronics & Information Technology, 2015,37(6):1343-1349 (in Chinese)
[10] Civicioglu P, Erkan B.A Conceptual Comparison of the Cuckoo-Search, Particle Swarm Optimization, Differential Evolution and Artificial Bee Colony Algorithms[J]. Artificial Intelligence Review, 2013,39(4):315-346
[11] Wang H Z, Zhang H C,Wang Z Y,et al. Extended Multivariate Public Key Cryptosystems with Secure Encryptron Function[J]. Science China-Information Sciences,2011,54(6):1161-1171
[12] Niu Y Q. Detecting the Community Structure in Complex Net-Works Based on Quantum Mechanics[J]. Physica A:Statistical Mechanics and Its Applications, 2008, 387: 6215-6224