何洋洋 蔣正帥 商丘工學(xué)院
采摘機(jī)器人的視覺系統(tǒng)是重要環(huán)節(jié),能否對果實快速準(zhǔn)確的定位是機(jī)器人視覺系統(tǒng)中的關(guān)鍵技術(shù),直接影響到機(jī)器人的工作效率和可靠性。在采摘機(jī)器人的相關(guān)研究中,識別準(zhǔn)確率嚴(yán)重制約著機(jī)器人在自然條件下的工作效率,M.Z.Abdullah用線性判別分析識別楊桃正確率為95.3%,油椰子分類識別率為90%,該方法要求所用數(shù)據(jù)集是正態(tài)分布的,而事實上特征空間中的數(shù)據(jù)并不一定符合條件。本文以成熟番茄果實為研究對象,為消除光照影響,根據(jù)光照無關(guān)原理對自然環(huán)境中拍攝的番茄圖像進(jìn)行關(guān)照無關(guān)化處理,獲得光照無關(guān)圖,通過不通核函數(shù)識別圖片信息,并采用交叉驗證和網(wǎng)格搜索的方法進(jìn)行支持向量機(jī)最優(yōu)模型參數(shù)優(yōu)化。
試驗所用圖像為自然條件下拍攝的彩色番茄果實圖像。為減少噪聲干擾,采用矢量中值濾波進(jìn)行圖像增強(qiáng)。由于番茄生長于自然環(huán)境中,光源的方向、拍攝距離和光照強(qiáng)度等均會對番茄果實圖像產(chǎn)生影響,環(huán)境的光照會改變圖像的真實信息,進(jìn)而影響視覺系統(tǒng)的識別準(zhǔn)確性。為消除光照強(qiáng)度的影響,本文采用圖像單個像素的顏色恒常性算法,對中值濾波后的番茄圖像進(jìn)行光照無關(guān)處理,獲得番茄光照無關(guān)圖。
本文采用最大類間方差(OSTU)法對圖像進(jìn)行成熟番茄和背景的分割,基于灰度直方圖的自動閾值分割方法,通過選取圖像的任意灰度級t為初始分割閾值計算目標(biāo)與背景之間的方差,遍歷所有灰度級計算方差值,使方差最大的灰度級就是最佳分割閾值。
在番茄圖片中,成熟番茄果實、枝葉都有特定的形狀,并且差異大,因此番茄的形狀特征明顯,根據(jù)識別理論進(jìn)行分類識別。物體的幾何形狀具有RST(旋轉(zhuǎn)、比例、平移)不變性的特點,即物體的幾何特征不會因在圖像中的位置、大小和圖像的旋轉(zhuǎn)角度的改變而變化。因此,根據(jù)上述特性,本文結(jié)合番茄圖像的特點,采用圓方差、離散度和伸長度作為形狀特征。
支持向量機(jī)(SVM)通過結(jié)構(gòu)風(fēng)險最小化準(zhǔn)則(SRM)和核函數(shù)的方法,將待解決的模式識別轉(zhuǎn)化為二次規(guī)劃尋優(yōu)問題。對于線性可分的訓(xùn)練樣本集(xi,yi),可被分類面沒有錯誤地分開。類別間的間隔距離越大,推廣能力越強(qiáng),使分類間隔距離最大的分類面為最優(yōu)分類面。對于線性不可分問題,需要引入松弛項和錯誤懲罰參數(shù)C。應(yīng)用二次規(guī)劃方法可以求出最優(yōu)分類函數(shù)為:
其中,a*為拉格朗日乘子,b為分類閾值,K(*)為核函數(shù)。
在白天不同時間、光照條件下,順光逆光不同角度拍攝番茄圖片,實驗拍攝訓(xùn)練照片240張,提取了853個訓(xùn)練樣本,測試圖片110張,提取了477個測試樣本。首先提取目標(biāo),然后計算顏色特征、形狀特征和紋理特征。識別的準(zhǔn)確率是模型識別效果好壞的重要指標(biāo),本文定義識別準(zhǔn)確率為:,其中i為正確識別的番茄數(shù)量,N為區(qū)域內(nèi)番茄的數(shù)目。
懲罰參數(shù)C和模型參數(shù)r是RBF核函數(shù)的兩個重要參數(shù),對于給定的問題,需要對C和r進(jìn)行參數(shù)優(yōu)化,本文采用交叉驗證(CV)和網(wǎng)格搜索的方法獲取最優(yōu)模型參數(shù),以實現(xiàn)分類器對番茄較高的識別準(zhǔn)確率。在交叉驗證中,現(xiàn)將訓(xùn)練集分為n個子集,然后將n-1個子集用來訓(xùn)練,剩下的一個用于測試。所有訓(xùn)練集中的每個子集都進(jìn)行一次測試,數(shù)據(jù)的正確分類百分比就是交叉驗證精度,交叉驗證可以避免過度擬合問題。在網(wǎng)格搜索中,參數(shù)C和r取不同值進(jìn)行實驗,當(dāng)識別準(zhǔn)確率達(dá)到最高時,獲取最優(yōu)參數(shù)值。
本文采用RBF核函數(shù),對樣本數(shù)據(jù)進(jìn)行交叉驗證和網(wǎng)格搜索如圖1所示,交叉驗證分類的子集數(shù)目n取不同值時,獲得的C和r也有差異,最終影響測試的準(zhǔn)確率。由圖1知,番茄圖象樣本訓(xùn)練得到模型的最優(yōu)參數(shù)中,當(dāng)子集數(shù)量分別是2個和10個時,最優(yōu)參數(shù)C=1,r=16,最高識別準(zhǔn)確率是96.7575%;當(dāng)子集數(shù)量分別為5個和7個時,最優(yōu)參數(shù)C=4,r=16,而最高識別率是96.8872%。實驗證明,支持向量機(jī)可通過交叉驗證和網(wǎng)格搜索的方法進(jìn)行參數(shù)尋優(yōu),并且使用優(yōu)化參數(shù)的支持向量機(jī)對番茄的識別正確率很高。
圖1 不同N值交叉驗證-網(wǎng)格搜索曲線
本文采用的基于光照無關(guān)圖與支持向量機(jī)識別方法,實現(xiàn)了支持向量機(jī)的分類識別。采用交叉驗證與網(wǎng)格搜索的方法對使用徑向基核函數(shù)的支持向量機(jī)進(jìn)行參數(shù)優(yōu)化,較好的解決了徑向基核函數(shù)參數(shù)選擇的難題,對于未被識別的番茄,主要原因是番茄與枝葉等其他物體之間的相互遮擋,對這種情況的番茄識別需要更多研究。