吳進(jìn)玲 張海東 李哲 施偉 田小軍
摘要:通過采集完好、霉變、破損葵花子的圖像并對其進(jìn)行預(yù)處理,研究共提取了3個(gè)顏色特征值(G、B、I)和5個(gè)紋理特征值(灰度均勻性、梯度均勻性、慣性矩、一致性、熵),采用BP神經(jīng)網(wǎng)絡(luò)和決策樹算法分別對3種葵花子進(jìn)行檢測識別。結(jié)果顯示,BP網(wǎng)絡(luò)采納全部8個(gè)特征值,正確率98.58%;決策樹算法采納2個(gè)特征值(G、B),正確率99.25%,說明決策樹算法模型更簡潔,效果更好,表明計(jì)算機(jī)視覺技術(shù)可以實(shí)現(xiàn)完好、霉變、破損葵花子的檢測識別。
關(guān)鍵詞:葵花子;計(jì)算機(jī)視覺;神經(jīng)網(wǎng)絡(luò);決策樹
中圖分類號:S126? ? ? ? ?文獻(xiàn)標(biāo)識碼:A
文章編號:0439-8114(2019)23-0201-06
DOI:10.14088/j.cnki.issn0439-8114.2019.23.050? ? ? ? ? ?開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
Research on detection of sunflower seed's appearance quality based on computer vision
WU Jin-ling,ZHANG Hai-dong,LI Zhe,SHI Wei,TIAN Xiao-jun
(School of Mechanical and Electrical Engineering,Yunnan Agricultural University,Kunming 650201,China)
Abstract: The images of intact, mildewed and damaged sunflower seed samples were acquired and preprocessed to extract 3 color featuresvalue of G, B and I, and extract 5 texture feature values which include gray uniformity, gradient uniformity, moment of inertia, consistency and entropy. Then BP neural network and decision tree algorithm were conducted to discriminate above three kinds of sunflower seed samples based on extracted color features and texture features. Results showed that all eight image features were adopted by BP neural network, and the BP model gave the recognition rate by 98.58% for intact, mildewed and damaged sunflower seed samples respectively; while only two features were inputted into decision tree model, G and B, and the model gave the recognition rate by 99.25%. Compared with BP neural network model, the decision tree model shows more concise structure and more efficient performance. Result told that intact, mildew and damaged sunflower seeds can be discriminated computer vision technology.
Key words: sunflower seeds; computer vision; neural network; decision tree
葵花子外觀是評價(jià)葵花子品質(zhì)的重要指標(biāo),外觀品質(zhì)的好壞直接影響其價(jià)格和銷售,影響其市場競爭力。葵花子外觀品質(zhì)通常包括尺寸、形狀、破損和霉變等方面。傳統(tǒng)上,這些外觀品質(zhì)主要依靠人工挑揀,工作量大且精度低,易受人為因素的影響。計(jì)算機(jī)視覺作為一種無損檢測技術(shù),不僅能夠?qū)崿F(xiàn)非接觸、長時(shí)間穩(wěn)定的檢測,并且識別精度高,故在水果、肉類、鮮花等相關(guān)品質(zhì)的檢測中得到了廣泛應(yīng)用,極大地提高了農(nóng)產(chǎn)品檢測的質(zhì)量和效率[1-4]。趙巍[2]根據(jù)西瓜的外形和表面特點(diǎn),提出基于計(jì)算機(jī)視覺技術(shù)的西瓜無損檢測與分級技術(shù)。張靜[3]以牛肉為研究對象,利用高光譜成像技術(shù)檢測牛肉微生物腐敗過程;許文方[4]利用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)了玫瑰切花品質(zhì)的評判研究。
本研究擬利用計(jì)算機(jī)視覺技術(shù)對葵花子外觀品質(zhì)進(jìn)行檢測研究,通過采集葵花子圖像,進(jìn)行預(yù)處理并提取相關(guān)特征,利用BP神經(jīng)網(wǎng)絡(luò)以及決策樹算法進(jìn)行分級,以此來實(shí)現(xiàn)葵花子外觀品質(zhì)的自動(dòng)化識別和精選,從而促進(jìn)葵花子生產(chǎn)過程數(shù)字化、智能化控制和管理,有效提高葵花子的成品質(zhì)量和生產(chǎn)效率。
1? 材料與方法
1.1? 試驗(yàn)材料
研究選用云南滇王驛農(nóng)業(yè)科技開發(fā)有限公司的黑珍珠葵花子作為樣本,經(jīng)過人工處理挑選出完好葵花子470粒,霉變葵花子470粒,破損葵花子520,3個(gè)種類總共1 460粒樣本,每種又分成兩部分,一部分取出70粒用于模型的建立,剩下的另外一部分用于模型的驗(yàn)證。
1.2? 圖像采集
1.2.1? 圖像采集系統(tǒng)? 研究的圖像采集系統(tǒng)結(jié)構(gòu)和組成如圖1所示,主要包括光箱、光源、工業(yè)相機(jī)和計(jì)算機(jī)等部分。
1.2.2? 參數(shù)設(shè)置? 為了使工業(yè)相機(jī)能夠采集到清晰的葵花子圖像,根據(jù)光源的選用原則并結(jié)合本研究的實(shí)際情況,圖像采集過程在光箱內(nèi)進(jìn)行,光箱規(guī)格為35 cm×25 cm×75 cm,內(nèi)壁用黑色紙片包裹。光源用一個(gè)自制圓柱形燈罩密封起來,并在燈罩上方放置一張相同大小的透明墊片,方便放置葵花子。光源采用OPPLE LED燈,功率30 W,色溫正白色。相機(jī)鏡頭與葵花子距離為55 cm,光源與葵花子距離為4 cm,工業(yè)相機(jī)分辨率為1 024×768。
1.2.3? 圖像采集? 圖像采集時(shí),將樣本葵花子平躺放置于光源室墊片上方,打開光源,每個(gè)樣本分別采集3次,從中選取效果最好的一張圖像。采集過程中,注意保證相機(jī)焦距、物距等參數(shù)不變,并使葵花子樣本與光軸垂直。圖2中(a)、(b)、(c)分別為完好葵花子、霉變葵花子和破損葵花子圖像。
2? 圖像預(yù)處理及特征參數(shù)提取
2.1? 圖像預(yù)處理
圖像預(yù)處理可以提取出圖像中有用的信息,去除無用的信息,增強(qiáng)有關(guān)信息的可檢測性,最大限度的簡化數(shù)據(jù)[5]。研究采用了以下圖像預(yù)處理方法。
2.1.1? 圖像分割? 圖像分割的目的是提取出研究所需要的目標(biāo)對象[6]?;叶乳撝捣指罘ㄊ且环N最常用的并行區(qū)域技術(shù),該算法的關(guān)鍵是確定合適的分割閾值,為了確定葵花子圖像的分割閾值,需要將葵花子原始圖像轉(zhuǎn)換為灰度圖像[7]。圖3是樣本葵花子灰度圖像閾值直方圖。由圖3可以發(fā)現(xiàn),葵花子灰度圖像閾值直方圖的波峰開始是在低于500的范圍內(nèi)波動(dòng),隨著灰度值的增大逐漸出現(xiàn)一段低谷,最后波峰突然增高達(dá)到4 000以上。低谷處灰度值可作為閾值分割的依據(jù)[7],圖4是分割后的葵花子。
2.1.2? 圖像去噪? 圖像在輸入、傳送、處理過程中受到干擾,形成噪聲,降低圖像質(zhì)量,中值濾波是一種典型的圖像去噪方法[8],圖5為中值濾波后的葵花子。
2.1.3? 圖像二值化? 二值圖像只有黑白兩個(gè)灰度級,能夠很好地突出圖像特征,便于圖像識別[8]。圖6為二值化處理后的葵花子。
2.1.4? 膨脹和腐蝕? 膨脹是對圖像中的目標(biāo)對象增加像素,腐蝕則相反[9]。對圖像先進(jìn)行腐蝕而后膨脹的操作稱為開啟運(yùn)算,利用該運(yùn)算可以消除尖峰、凸緣、切斷狹細(xì)連接,起到磨光邊緣的作用(圖7),得到的不是原始圖像,結(jié)果會(huì)比原始圖像更簡單[9]。
2.1.5? 邊緣檢測? 邊緣檢測的目的是標(biāo)識數(shù)字圖像中亮度變化明顯的點(diǎn),保留圖像重要的結(jié)構(gòu)屬性[10]。本研究邊緣檢測結(jié)果如圖8所示。
2.1.6? 圖像合成? 將葵花子邊緣檢測后的圖像作為模板與分割后的圖像進(jìn)行位運(yùn)算,把模板圖形中間部分用分割后的彩色圖像代替,而輪廓不變合成新的圖像,這樣能夠較好的保留葵花子的顏色、紋理和輪廓特征[10]。圖9是本研究合成后的葵花子。
2.2? 特征參數(shù)提取
霉變、破損葵花子表皮的顏色、表面光滑程度和正常葵花子存在明顯差異。本研究提取葵花子的3個(gè)顏色特征(G、B、I)和5個(gè)紋理特征(灰度分布不均勻性、梯度分布不均勻性、慣性矩、一致性和熵)分別建立基于計(jì)算機(jī)視覺的葵花子霉變、破損神經(jīng)網(wǎng)絡(luò)以及決策樹檢測識別模型。
2.2.1? 葵花子顏色特征參數(shù)提取? 每幅葵花子圖像中葵花子所有像素G、B、I的均值,計(jì)算公式如下:
2.2.2? 葵花子紋理特征參數(shù)提取? 紋理是按一定規(guī)則對元素或基元進(jìn)行排列所形成的重復(fù)模式[11]。根據(jù)各紋理特征的意義和試驗(yàn)需求,本研究選用灰度分布不均勻性、梯度分布不均勻性、慣性矩、一致性、熵5個(gè)紋理特征提取葵花子圖片特征參數(shù)。表1是所提取特征參數(shù)的范圍、均值和標(biāo)準(zhǔn)差。比較表1數(shù)據(jù)可以看出,無論是特征參數(shù)的范圍、均值還是標(biāo)準(zhǔn)差,完好、霉變、破損葵花子都存在一定的區(qū)別。總體上,完好葵花子要比霉變、破損葵花子顏色更偏向綠色和藍(lán)色,紋理特征排列更加有序;霉變葵花子的特征基本介于完好以及破損葵花子之間;破損葵花子的顏色特征最弱,且熵值明顯大于其他兩類而灰度均勻性明顯小于其他兩類;說明葵花子圖像處理的效果良好,滿足后續(xù)研究要求。
3? 葵花子外觀品質(zhì)分類模型的建立與分析
3.1? BP神經(jīng)網(wǎng)絡(luò)
3.1.1? BP神經(jīng)網(wǎng)絡(luò)概述? BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),它通過自身的訓(xùn)練,學(xué)習(xí)某種規(guī)則,在給定輸入值時(shí)得到最接近期望輸出值的結(jié)果,實(shí)現(xiàn)了從輸入到輸出的非線性映射[12]。BP神經(jīng)網(wǎng)絡(luò)包括輸入層、隱含層和輸出層,當(dāng)輸入節(jié)點(diǎn)為n,輸出節(jié)點(diǎn)數(shù)為m時(shí),BP神經(jīng)網(wǎng)絡(luò)就表達(dá)了從n個(gè)自變量到m個(gè)因變量的函數(shù)映射關(guān)系[13]。圖10是BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。
3.1.2? 霉變、破損葵花子的BP神經(jīng)網(wǎng)絡(luò)識別? BP神經(jīng)網(wǎng)絡(luò)的隱含層節(jié)點(diǎn)數(shù)直接影響B(tài)P神經(jīng)網(wǎng)絡(luò)的預(yù)測精度[14],選擇最佳隱含層節(jié)點(diǎn)數(shù)的參考公式為:
式中,l為隱含層節(jié)點(diǎn)數(shù),n為輸入層節(jié)點(diǎn)數(shù),m為輸出層節(jié)點(diǎn)數(shù)[14]。
本研究以輸入層和輸出層節(jié)點(diǎn)數(shù)之和的平均值4作為隱含層節(jié)點(diǎn)初始數(shù),圖11顯示了不同隱含層節(jié)點(diǎn)數(shù)與網(wǎng)絡(luò)分類誤差的關(guān)系。
由圖11可以看出隱含層節(jié)點(diǎn)數(shù)為4時(shí),分類誤差最小。本研究以隱含層、輸入層、輸出層節(jié)點(diǎn)數(shù)分別為4、8、1建立完好、霉變、破損葵花子BP神經(jīng)網(wǎng)絡(luò)識別模型。圖12和13分別為訓(xùn)練集和測試集葵花子的BP神經(jīng)網(wǎng)絡(luò)分級結(jié)果。
從圖12、圖13可以看出,訓(xùn)練集樣本中有1個(gè)完好葵花子被誤判為霉變葵花子,其他樣本均識別正確,識別正確率為99.92%;測試集樣本中存在2個(gè)破損葵花子被誤判為完好葵花子,其余樣本均分級正確,識別正確率為98.58%。表2為BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練集和測試集樣本中各種葵花子識別正確率。由表2可以看出,在訓(xùn)練集樣本中,霉變、破損葵花子的識別正確率均為100%,完好葵花子的識別正確率為99.75%,總體識別正確率為99.92%;測試集樣本中,完好、破損葵花子識別正確率均為100%,破損葵花子的識別正確率為97.50%,總體識別正確率為98.58%,這充分說明了該模型對葵花子有較好的識別能力。
3.2? 決策樹算法
決策樹算法是一種歸納學(xué)習(xí)算法,它能夠從一組毫無規(guī)律的數(shù)據(jù)樣本集合中推理出決策樹具體的表示形式以及分類規(guī)則[15]。如圖14是一棵決策樹,其中A,B,C表示屬性名,a1,b1,c1分別表示A,B,C的取值,當(dāng)屬性A的取值為a1,屬性B的取值為B1時(shí),它屬于第1類,其余樹的分支以此類推。從圖14可以發(fā)現(xiàn),構(gòu)造好的決策樹分為根節(jié)點(diǎn)、內(nèi)部節(jié)點(diǎn)、葉節(jié)點(diǎn)三大類,其中根節(jié)點(diǎn)和內(nèi)部節(jié)點(diǎn)都是數(shù)據(jù)的屬性或者屬性的集合,葉節(jié)點(diǎn)則是分類的結(jié)果[15]。該算法用信息增益率作為選擇標(biāo)準(zhǔn),信息增益是指數(shù)據(jù)集原有的信息量與經(jīng)過分類以后的信息量的差值[16]。對于屬性A的信息增益率計(jì)算方法如下:
GainRatio(A)=Gain(A)/SplitInfo(A)? ?(5)
本研究信息增益率設(shè)置為0.1,如果信息增益率小于0.1時(shí),那么決策樹模型對于樣本的識別判斷將不再增加新的特征。以根節(jié)點(diǎn)與葉節(jié)點(diǎn)數(shù)分別為8、3建立完好、霉變、破損葵花子決策樹識別模型,圖15為本研究決策樹算法識別結(jié)果。圖15中,x1、x2分別表示葵花子圖像特征G和B;1、2、3分別代表完好、霉變、破損葵花子。從圖15可以看出,運(yùn)用該算法只需要前兩個(gè)特征就可以正確的識別出葵花子不同種類,此時(shí)再增加其他任何特征,信息增益率均小于0.1,所以識別模型停止添加新特征。表3為決策樹算法訓(xùn)練集和測試集樣本中各種葵花子識別正確率。由表3可以看出,訓(xùn)練集樣本中,完好和霉變葵花子的識別正確率均為100%,破損葵花子的識別正確率為99.30%,總體識別正確率為99.77%;測試集樣本中,霉變和破損葵花子識別正確率均為100%,完好葵花子的識別正確率為98.58%,總體識別正確率為99.52%,這充分說明了該模型對葵花子具有較高的識別判斷能力。
3.3? 兩種算法結(jié)果比較
將兩種算法先后在同一臺筆記本上運(yùn)行,筆記本型號為華碩X43B,表4是兩種算法性能比較。分析比較表4可以發(fā)現(xiàn),決策樹算法用時(shí)明顯少于神經(jīng)網(wǎng)絡(luò),且準(zhǔn)確率更高。運(yùn)用BP神經(jīng)網(wǎng)絡(luò)以及決策樹算法,均能對葵花子完好、霉變、破損進(jìn)行較準(zhǔn)確的識別,決策樹算法可以選用更少的特征,能夠展現(xiàn)出具體的節(jié)點(diǎn)數(shù)據(jù),但是具體誤判情況需要識別判斷前后數(shù)據(jù)對比得知,不夠直觀;而BP神經(jīng)網(wǎng)絡(luò)結(jié)果可以直接顯示出每種樣本誤判的情況以及誤判個(gè)數(shù),更加直觀。
4? 結(jié)論
本研究基于計(jì)算機(jī)視覺技術(shù),提取完好、破損、霉變葵花子圖像的顏色、紋理特征,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)、決策樹算法分別對3種葵花子進(jìn)行檢測識別,并對兩種算法結(jié)果性能進(jìn)行比較,表明運(yùn)用計(jì)算機(jī)視覺技術(shù)檢測葵花子外觀品質(zhì)是完全可行的。
參考文獻(xiàn):
[1] 陳? 旭,呂小俊,賈志洋.淺談?dòng)?jì)算機(jī)視覺的發(fā)展及應(yīng)用[J].科技信息,2013(16):6.
[2] 趙? 巍.計(jì)算機(jī)視覺在西瓜無損檢測與分級中的應(yīng)用[D].武漢:華中農(nóng)業(yè)大學(xué),2013.
[3] 張? 靜.基于高光譜成像的牛肉微生物腐敗檢測方法的研究[D].北京:中國農(nóng)業(yè)大學(xué),2010.
[4] 許文方.利用計(jì)算機(jī)視覺技術(shù)評判玫瑰切花品質(zhì)的研究[D].昆明:云南農(nóng)業(yè)大學(xué),2013.
[5] XU T G. A study on the quality Evaluation of cut Rose Flowers by computer Vision technique[D].Kunming:Yunnan Agricultural University,2013.
[6] SUN D W. Infrared spectroscopy for food quality analysis and control[M].Holland:Elsevier,2009.
[7] 胡祖輝,徐? 毅.大數(shù)據(jù)背景下髙校教育數(shù)據(jù)的分析與應(yīng)用研究[J].現(xiàn)代教育科學(xué),2017(1):109-114.
[8] 高? 文,陳熙霖.計(jì)算機(jī)視覺—算法與系統(tǒng)原理[M].北京:清華大學(xué)出版社,1999.
[9] RICHARD S,STEVE S,DAVID F. Computer vision:Algorithms and applications[M].London:Springer,2011.
[10] 高? 成.Matlab圖像處理與應(yīng)用[M].北京:國防工業(yè)出版社,2007.
[11] 趙娟娟.數(shù)字圖像邊緣檢測方法的對比分析及優(yōu)化[J].甘肅科學(xué)學(xué)報(bào),2012,24(3):143-146.
[12] 朱曉麗.關(guān)于機(jī)器視覺及其應(yīng)用問題的探討[J].中國教育技術(shù)裝備,2010(9):89.
[13] 馬? 燈.基于C4.5算法的高校教師評價(jià)研究[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2017(2):42-44.
[14] 路? 獅,徐? 輝,楊永春.基于決策樹分類算法的研究與應(yīng)用[J].電子設(shè)計(jì)工程,2016,24(28):1-3.
[15] MA L,DEST E S,WANG Y. Online active learning of decision trees with evidential data[J].Pattern recognition,2016,52:33-45.
[16] SANTOS C N D,GATTIT M. Deep convolutional neural networks for sentiment analysis of? short? texts[A].Proc of international? conference on computational linguistics[C].Dublin:Technical papers,2014.69-78.