牛沖 +牛昱光 +李寒++鄭文剛+卜云龍++周增產(chǎn)
)
摘要:通過作物可見光圖像,對作物病蟲害進行準確識別,在作物生長自動監(jiān)測、精準施藥等領域具有重要意義。提出一種基于圖像灰度直方圖特征的草莓病蟲害識別算法識別草莓蛇眼病。該算法首先計算訓練集草莓葉片灰度圖像的直方圖,然后提取直方圖的8個特征(平均灰度、標準偏差、三階中心矩、平滑度、均勻性、平均信息量、最大概率灰度級、灰度范圍)并進行歸一化處理,通過支持向量機(support vector machine,簡稱SVM)、K-近鄰(K-nearest neighbor,簡稱KNN)及樸素貝葉斯3種識別方法對8個特征進行訓練,得到相應的病蟲害識別分類器。結(jié)果表明,SVM分類器的分類效果優(yōu)于其他分類器,因此本研究最終選用SVM分類器對驗證集圖像進行分類,得到分類正確率達90%以上。
關鍵詞:草莓蛇眼?。徊∠x害;識別;支持向量機;灰度圖像;直方圖
中圖分類號: S436.68+4文獻標志碼: A
文章編號:1002-1302(2017)04-0169-03
2015年,農(nóng)業(yè)部發(fā)布《到2020年農(nóng)藥使用量零增長行動方案》,重點強調(diào)了通過推行精準科學施藥,減少農(nóng)藥的使用劑量和次數(shù)。通過病蟲害監(jiān)測預報,診治作物病蟲害,有助于推進農(nóng)藥減量,關系到農(nóng)業(yè)生產(chǎn)安全、農(nóng)產(chǎn)品質(zhì)量安全以及生態(tài)環(huán)境安全,積極探索產(chǎn)出高效、產(chǎn)品安全、資源節(jié)約、環(huán)境友好的現(xiàn)代農(nóng)業(yè)發(fā)展之路。在我國,草莓是繼香蕉、蘋果、橘子和葡萄之后的大眾消費最多的漿果之一,種植面積迅速擴大,草莓產(chǎn)業(yè)迅猛發(fā)展,作為草莓消費和出口大國,草莓生產(chǎn)對我國的經(jīng)濟有著重要影響。所以,對草莓病蟲害檢測方法的研究具有重要的實際意義和理論價值。
針對作物病蟲害的識別,國內(nèi)學者做了很多研究,識別方法一般分為人工檢測、化學檢測和基于圖像的智能檢測等。因基于圖像的智能檢測方法可以實現(xiàn)不接觸、快速實時的監(jiān)測而被廣泛應用。
許多學者基于多光譜或者高光譜圖像分析成功分割并提取病害部位[1-7]。由于數(shù)碼CCD相機的價格便宜且應用靈活,有很多學者在對可見光圖像分析的基礎上利用各種識別方法成功識別病蟲害區(qū)域[8-12],并且取得了長足進步。耿長興等研究了可見光波段的黃瓜霜霉病信息分布和分割方法,有效實現(xiàn)了溫室非結(jié)構(gòu)環(huán)境下黃瓜病害信息識別[13]。廉飛宇等將支持向量機引入到復雜條件下運動車輛牌照字符的識別中[14]。劉君等構(gòu)建了葉片病斑圖像處理的計算機診斷系統(tǒng),以實現(xiàn)作物葉部病害的自動識別[15]。岑苗鑫等利用圖像的顏色統(tǒng)計特征對不同時期的病蟲害樣本圖像進行分類和識別[16]。柴洋等為了準確有效判定溫室大棚中番茄病害,利用圖像和模式識別技術,采用貝葉斯判別法,對番茄病蟲害進行識別[17]。
葉片是反映作物生長狀態(tài)的重要部分。為了實現(xiàn)對作物的生長狀態(tài)監(jiān)測,需要對其葉片的健康狀況進行持續(xù)監(jiān)測,對作物葉片部分是否異常的診斷可以指導種植者是否對作物進行噴藥,以及噴藥種類、噴藥量等。草莓蛇眼病是草莓生產(chǎn)中的病害之一,會嚴重影響草莓生產(chǎn)過程中的產(chǎn)量和質(zhì)量。本研究針對草莓蛇眼病害,提出一種基于灰度直方圖特征的支持向量機分類方法,成功對草莓的健康葉片以及染病葉片的染病區(qū)域進行分類和識別。
1材料與方法
1.1材料
草莓葉片為北京市農(nóng)林科學院林業(yè)果樹研究所種植的B89草莓葉片樣本,共提取100個草莓葉片樣本,其中50個為含有草莓蛇眼病病斑的葉片圖像樣本,另外50個為健康的草莓葉片圖像樣本。圖1-a、圖1-b分別為草莓病蟲害葉片、健康葉片。圖像獲取設備采用可見光相機(尼康J1,日本),圖像處理軟件采用Matlab(2010b)。
1.2圖像識別流程
首先對林業(yè)果樹研究所采集的草莓葉片進行圖像預處理,包括灰度化、求取直方圖等操作,并提取圖像灰度直方圖中的8種特征進行融合,然后對融合后形成的特征向量使用支持向量機、K-近鄰及樸素貝葉斯方法進行訓練,得到分類器。通過分類器區(qū)分待檢測的草莓葉片圖像是否出現(xiàn)草莓蛇眼病,最終根據(jù)分類結(jié)果判斷分類器的優(yōu)劣。圖2為算法的大致流程。
1.3支持向量機
支持向量機一般可以解決2類問題,樣本集線性可分情形和樣本集線性不可分情形。
1.3.1線性可分情形
設樣本集為(xi,yi),i=1,2,…,n,xi∈R,yi∈{+1,-1}。根據(jù)訓練集的信息,找到由ω和b確定的超平面:
于是,原樣本空間的二元模式分類問題可以表示為
[JZ(]yi{[ω·Φ(xi)]+b}-1≥0,i=1,2,…,n。[JZ)][JY](6)
1.3.3徑向基核函數(shù)(radial basis function,簡稱RBF)
SVM利用核函數(shù)簡便地解決了上面的問題,核函數(shù)的引入繞過特征空間直接在輸入空間上求取,從而避免了計算非線性映射。在本例中,我們使用的核函數(shù)為徑向基核函數(shù):
[JZ(]K(x,xi)=exp(-[SX(]|x-xi|2σ2[SX)])。[JZ)][JY](7)
式中:σ2為核函數(shù)的寬度。
采用非線性可分情形下的SVM分類算法,結(jié)合特征向量及徑向基核函數(shù),可以對草莓病蟲害葉片進行分類識別。
1.4K-近鄰算法及樸素貝葉斯算法
K-近鄰算法的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。
樸素貝葉斯分類器(naive bayes classifier,簡稱NBC)發(fā)源于古典數(shù)學理論,有著堅實的數(shù)學基礎,以及穩(wěn)定的分類效率。同時,NBC模型所需估計的參數(shù)很少,對缺失數(shù)據(jù)不太敏感,算法也比較簡單。理論上,NBC模型與其他分類方法相比具有最小的誤差率。但實際上并非如此,這是因為NBC模型假設屬性之間相互獨立,這個假設在實際應用中往往是不成立的,這給NBC模型的正確分類帶來了一定影響。