潘勝權(quán),陳凱,解印山,莫錦秋
(上海交通大學(xué)機(jī)械與動(dòng)力工程學(xué)院,上海 200240)
自主導(dǎo)航作為智能農(nóng)機(jī)系統(tǒng)中田間信息感知模塊的關(guān)鍵技術(shù),被廣泛應(yīng)用于播種、施肥、除草和收割等農(nóng)業(yè)作業(yè)不同階段[1-2]。在收割作業(yè)階段,為提高收割效率,避免重復(fù)收割和漏割,作業(yè)人員需具備豐富的收割經(jīng)驗(yàn),且在長時(shí)間反復(fù)觀察割臺(tái)與收割邊界位置的作業(yè)過程中,作業(yè)人員容易產(chǎn)生疲勞,存在一定的安全隱患。因此,為了降低勞動(dòng)成本、減少作業(yè)時(shí)間、提高生產(chǎn)率,開展智能農(nóng)機(jī)聯(lián)合收割機(jī)自主導(dǎo)航技術(shù)研究具有重大現(xiàn)實(shí)意義。
作業(yè)導(dǎo)航線識(shí)別是實(shí)現(xiàn)智能農(nóng)機(jī)自主導(dǎo)航作業(yè)極為重要的一環(huán),實(shí)時(shí)準(zhǔn)確地識(shí)別作業(yè)導(dǎo)航線能有效加快作業(yè)進(jìn)度,在收割階段還能降低作物損失率[3]。作業(yè)導(dǎo)航線識(shí)別已有研究主要可以分為兩類,即基于機(jī)器視覺的導(dǎo)航線識(shí)別[4-9]和基于測(cè)距傳感器[10-15]的導(dǎo)航線識(shí)別。由于激光雷達(dá)價(jià)格昂貴,而視覺傳感器價(jià)格低廉,且獲取目標(biāo)信息較為豐富,故國內(nèi)外關(guān)于基于機(jī)器視覺的導(dǎo)航線識(shí)別的研究不斷增多。
在導(dǎo)航線識(shí)別方面,用于早耕期與中耕期的作物行線識(shí)別技術(shù)研究已比較成熟。大多數(shù)研究以作物與背景差異明顯的顏色作為識(shí)別特征,以超綠算法為核心,對(duì)圖像進(jìn)行預(yù)處理,后續(xù)通過Hough 變換、OTSU 算法或垂直投影法完成單一或多條作物行線識(shí)別,進(jìn)而用于指導(dǎo)早耕、中耕期的智能農(nóng)機(jī)作業(yè)導(dǎo)航[16-21]。
早耕、中耕期導(dǎo)航線檢測(cè)方法均基于待檢測(cè)目標(biāo)與背景存在顏色上的明顯差異,而小麥?zhǔn)崭顖?chǎng)景下,未收割區(qū)域、已收割區(qū)域以及土地在顏色上并無明顯差異,基于顏色特征的算法難以應(yīng)用。針對(duì)顏色特征不明顯的作物收割場(chǎng)景,魏新華等[22]通過雙目相機(jī)獲得水稻收割場(chǎng)景下的點(diǎn)云信息,根據(jù)安裝參數(shù)獲得點(diǎn)云高度,結(jié)合密度峰聚類和均值聚類方法對(duì)高度信息聚類實(shí)現(xiàn)了水稻收割場(chǎng)景下的收割邊界識(shí)別;楊雨[23]針對(duì)小麥?zhǔn)崭顖?chǎng)景,利用種子點(diǎn)區(qū)域生長算法對(duì)收割區(qū)域與未收割區(qū)域進(jìn)行區(qū)分,進(jìn)而利用改進(jìn)Ransac 算法對(duì)二值圖像點(diǎn)進(jìn)行擬合得到了收割導(dǎo)航線;張成濤等[24]通過改進(jìn)平滑紋理特征實(shí)現(xiàn)了對(duì)小麥?zhǔn)崭顚?dǎo)航線的識(shí)別;曾宏偉等[25]對(duì)小麥圖像灰度直方圖進(jìn)行雙峰擬合獲取分割閾值,進(jìn)而結(jié)合區(qū)域生長算法實(shí)現(xiàn)了低對(duì)比度下小麥?zhǔn)崭顚?dǎo)航線的提取。
上述方法大多使用單一特征進(jìn)行收割場(chǎng)景導(dǎo)航線識(shí)別,而在多云天氣下作業(yè)時(shí),光線強(qiáng)度易發(fā)生變化,同一圖像不同區(qū)域的光照存在差異,單一特征往往難以適應(yīng)變化的光照條件。本文通過分析待檢測(cè)麥田特征,構(gòu)建由反映數(shù)量性紋理的圖像熵特征和反映方向性紋理的方向梯度組成的二維特征向量,通過滑動(dòng)窗口算法改進(jìn)熵特征提取方式加快特征提取過程,利用最大熵閾值分割、形態(tài)學(xué)處理得到收割麥田邊界點(diǎn),融合二維特征下得到的邊界點(diǎn)集合并結(jié)合Ransac 算法使得擬合收割直線時(shí)邊界附近待擬合點(diǎn)得到增廣,進(jìn)而得到較準(zhǔn)確的收割機(jī)導(dǎo)航線。
圖1a 為2021 年6 月18 日上午09:00—10:00,在北京小湯山精準(zhǔn)農(nóng)業(yè)基地拍攝的麥田圖像,通過對(duì)大量小麥場(chǎng)地照片分析發(fā)現(xiàn),常用于行線識(shí)別的顏色特征無法應(yīng)用于小麥?zhǔn)崭钸吔绲淖R(shí)別,但已收割區(qū)域麥茬矮小以及無頂部麥穗的特點(diǎn)使得其與未收割區(qū)域在迎光和背光時(shí)均存在均勻性、疏密等方面的差異。因此,本文選擇能反映圖像一定區(qū)域內(nèi)均勻性特點(diǎn)的熵作為判別特征。此外,由于已收割區(qū)域麥茬裸露,在圖像上顯示較為規(guī)整,其梯度方向較未收割區(qū)域更為一致。因此本文在熵特征的基礎(chǔ)上融合方向梯度特征進(jìn)行收割邊界識(shí)別。
圖1 麥田圖像及預(yù)處理結(jié)果Fig.1 Wheat field image and preprocessed results
基于視覺的導(dǎo)航線識(shí)別易受光照強(qiáng)度影響,而非結(jié)構(gòu)化農(nóng)場(chǎng)環(huán)境不同于結(jié)構(gòu)化工業(yè)環(huán)境,光照強(qiáng)度難以控制。趙博等[26]提出針對(duì)不同光照環(huán)境,使用直方圖均衡化減弱由于光照強(qiáng)度不一致帶來的影響,圖1b 與圖1c分別為原始麥田圖像灰度化以及均衡化處理后的圖像。
圖像熵E衡量一定區(qū)域內(nèi)的信息含量,反映該區(qū)域內(nèi)像素點(diǎn)的數(shù)量特征,其計(jì)算式為
式中NGray為灰度級(jí)數(shù);pi為第i個(gè)灰度級(jí)出現(xiàn)的概率。
圖像熵是針對(duì)一定區(qū)域內(nèi)的紋理特點(diǎn)而提出的,故應(yīng)選用一定大小的滑動(dòng)窗口對(duì)圖像滑動(dòng)計(jì)算不同區(qū)域的熵值大小,且通過滑動(dòng)窗口計(jì)算特征值的同時(shí),還能對(duì)圖像進(jìn)行降采樣,減少后續(xù)特征的處理量?;瑒?dòng)窗口過大會(huì)增加熵特征提取的計(jì)算量,過小則使得不同區(qū)域求得的熵值差異較小,容易造成誤判。而滑動(dòng)步長過大會(huì)使得窗口掃描較為粗略,導(dǎo)致最終求得導(dǎo)航線精度較低,滑動(dòng)步長過小則會(huì)額外產(chǎn)生大量待計(jì)算熵值的窗口,增加圖像熵特征提取的計(jì)算量。本文最終選擇大小為40 像素×30 像素的窗口,滑動(dòng)步長橫向?yàn)?0 像素,縱向?yàn)? 像素。
1.2.1 圖像感興趣區(qū)域選擇
由于相機(jī)成像存在透視現(xiàn)象,同一對(duì)象與相機(jī)距離發(fā)生變化時(shí)往往在圖像中的紋理特征會(huì)有較大的差異,而這種差異會(huì)導(dǎo)致對(duì)區(qū)域收割與否的誤判,因此需要選擇圖像中熵特征具有明顯差異的感興趣區(qū)域[27]。本文在固定相機(jī)安裝方式時(shí)以拍攝圖像縱向高度衡量小麥與相機(jī)間距離。為保證感興趣區(qū)域內(nèi)收割與否熵特征差異明顯,感興趣區(qū)域的縱向高度不宜過大,而縱向?qū)挾冗^小又容易導(dǎo)致真實(shí)邊界信息丟失。為保留真實(shí)邊界信息的同時(shí)比較不同高度區(qū)域熵特征差異明顯程度,本文將圖1a 縱向分割為3 等份,至上而下得到頂部、中部、底部3個(gè)區(qū)域的熵值,如圖2 所示。
圖2 不同區(qū)域熵值圖Fig.2 Entropy map at different areas
觀察不同區(qū)域熵圖可以發(fā)現(xiàn),底部區(qū)域距離相機(jī)過近導(dǎo)致已收割區(qū)域紋理過于清晰,而頂部區(qū)域距離相機(jī)過遠(yuǎn)使得未收割區(qū)域紋理過于模糊,均無法區(qū)分收割區(qū)域與未收割區(qū)域。故本文在固定安裝方式下選擇圖像的縱向中部區(qū)域作為收割邊界識(shí)別的感興趣區(qū)域。
1.2.2 基于滑動(dòng)窗口算法的熵特征提取
計(jì)算圖像熵特征的傳統(tǒng)方法是對(duì)原圖像按照熵特征提取所需窗口大小及位置進(jìn)行截取,統(tǒng)計(jì)所截取圖像內(nèi)直方圖,進(jìn)而計(jì)算熵值,每個(gè)窗口相互獨(dú)立。該計(jì)算方法使得不同窗口間重疊區(qū)域被重復(fù)計(jì)算,檢測(cè)實(shí)時(shí)性無法得到滿足,因此本文對(duì)直方圖統(tǒng)計(jì)方式改進(jìn)。當(dāng)生成橫向2個(gè)相鄰窗口、縱向2個(gè)相鄰窗口時(shí),如圖3 所示。按照傳統(tǒng)熵特征提取方式,子窗口A2B1B4A3,A4A3D2D1,D2C1D3C4,B4B3C2C1中數(shù)據(jù)將計(jì)算2 次,A3B4C1D2中數(shù)據(jù)將計(jì)算4 次,增加計(jì)算量。
圖3 相鄰滑窗示意圖Fig.3 Adjacent sliding windows
本文對(duì)原圖像進(jìn)行分割得到熵特征窗口的子窗口。使用滑動(dòng)窗口算法組合子窗口的灰度直方圖數(shù)據(jù),進(jìn)而得到整幅圖像的熵特征。以橫向?yàn)槔?,第iwindow個(gè)熵特征窗口的左上角以及右下角的橫坐標(biāo)分別如式(2)式(3)所示。
式中xLU(iwindow),xRD(iwindow)分別為第iwindow個(gè)矩形窗口左上角和右下角的橫坐標(biāo),像素;xstep為窗口橫向滑動(dòng)步長,像素;xwindow為窗口橫向?qū)挾龋袼?;xpic為圖像橫向?qū)挾龋袼?。此時(shí)每行橫向矩形窗口數(shù)量Nwinx如式(4)所示。
xLU(iwindow)與xRD(iwindow)即為子窗口獲取的橫向分割點(diǎn),若xpic-xwindow不是xstep的整數(shù)倍,將產(chǎn)生大量子窗口,增加計(jì)算量,分割結(jié)果如圖4 所示。
圖4 子窗口橫向分割圖Fig.4 Horizontal split diagram of sub-window
為減少子窗口數(shù)量,本文令xpic-xwindow為xstep的整數(shù)倍,此時(shí)橫向被劃分的子窗口數(shù)Nsubx為
此時(shí),特征提取窗口右邊界同時(shí)也是后續(xù)窗口的左邊界,減少了子窗口數(shù)量。如圖5 所示,R(1)既為第1個(gè)特征窗口的右邊界,也為第4個(gè)特征窗口的左邊界。熵特征提取僅需滑動(dòng)子窗口,如將第1個(gè)特征窗口向右滑動(dòng)1個(gè)子窗口即求得第2個(gè)特征窗口直方圖統(tǒng)計(jì)結(jié)果。
圖5 橫向子窗口組合示意圖Fig.5 Schematic diagram of horizontal sub-window combination
對(duì)于一幅xpic·ypic大小的圖像,熵特征提取窗口大小為xwindow×ywindow,窗口橫向和縱向滑動(dòng)步長分別為xstep、ystep時(shí),傳統(tǒng)熵特征提取算法計(jì)算量C1約為
本文改進(jìn)熵特征提取算法計(jì)算量C2約為
以本文采集原始圖像尺寸720 像素×1 280 像素為例,經(jīng)選擇感興趣區(qū)域后,實(shí)際處理為240 像素×1 280 像素。在16 GB 內(nèi)存、Intel i7-12700H CPU、RTX 3060GPU 的計(jì)算機(jī)上提取該圖像熵特征,傳統(tǒng)熵特征提取算法與改進(jìn)后的熵特征提取算法耗時(shí)分別為1.05 與0.53 s,本文算法提速約49.52%。
熵特征體現(xiàn)了窗口區(qū)域內(nèi)的像素點(diǎn)數(shù)量關(guān)系,反映了紋理的復(fù)雜程度,但無法反映紋理的方向特征。而小麥?zhǔn)崭詈罅粝碌陌缡沟檬崭顓^(qū)域的紋理方向較為一致,故本文在提取熵特征的基礎(chǔ)上增加了方向梯度特征。本文選擇大小為3×3 的Sobel 算子分別提取x、y方向上的梯度強(qiáng)度,x方向和y方向的Sobel 算子為
式中Sobelx為x方向的Sobel 算子;Sobely為y方向的Sobel 算子。
滑動(dòng)窗口的方向梯度G為
式中Gij為窗口內(nèi)位于(i,j)像素點(diǎn)的梯度強(qiáng)度,無量綱;Dirij為窗口內(nèi)位于(i,j)像素點(diǎn)的梯度方向;Area為梯度方向區(qū)間;梯度區(qū)間過大將導(dǎo)致未受割區(qū)域滑動(dòng)窗口內(nèi)方向梯度偏大,而過小將使得收割區(qū)域滑動(dòng)窗口內(nèi)方向梯度偏小,均不利于通過方向梯度特征判斷區(qū)域收割與否。根據(jù)大量采集圖像的分析結(jié)果,本文令區(qū)間大小為40°,梯度方向區(qū)間Area為[40,80)。
1.4.1 最大熵閾值分割
在得到圖像的熵特征和方向梯度特征后需要選擇合適的閾值將收割區(qū)域與未收割區(qū)域區(qū)分開來,常用的閾值分割方法有基于灰度圖的雙峰閾值分割法、最大類間方差法和熵閾值分割法等[28]。由于本文提取的特征均為浮點(diǎn)類型,選取不同的灰度級(jí)數(shù)時(shí),特征直方圖存在較大差異,故雙峰閾值分割法與最大類間方差法不適合本文。而熵閾值分割反映了分割后圖像的均勻程度,將圖像分為不同類別時(shí),整幅圖像的熵值最大時(shí),分割效果最好,灰度級(jí)數(shù)對(duì)最終閾值的選取影響較小。故本文選擇最大熵閾值分割作為閾值選取方法,二分類問題分割后圖像熵值Eseg為
式中Eseg為分割后的圖像熵值;p1i為分割后灰度級(jí)i在前景圖中出現(xiàn)頻率;p2i為分割后灰度級(jí)i在背景圖中出現(xiàn)頻率;nseg為分割閾值對(duì)應(yīng)灰度級(jí)數(shù)。
圖像的熵特征直方圖如圖6a 所示,由于拍攝光線、角度等,提取的熵特征中存在少許低值噪聲點(diǎn),這些噪聲點(diǎn)會(huì)使得最終的熵特征分割閾值偏小,而收割邊界處信息量往往較高,其熵值較大,故可舍棄低熵值點(diǎn)。
圖6 灰度級(jí)數(shù)為256 時(shí)的特征直方圖Fig.6 Characteristic histogram when grayscale progression is 256
熵特征分割閾值與舍棄低熵值點(diǎn)比例關(guān)系曲線如圖7所示。
圖7 熵特征分割閾值與低熵值舍棄比例關(guān)系曲線Fig.7 Relationship between threshold and loss ratio of entropy
舍棄比例低于5%時(shí),曲線較陡,此時(shí)低值噪聲點(diǎn)對(duì)熵特征閾值影響較大;舍棄比例高于5%時(shí),曲線較緩,低值噪聲點(diǎn)幾乎不影響最終閾值,為確保能夠消除低值點(diǎn)的影響且考慮到收割邊界熵值較大的特點(diǎn),本文舍棄10%低熵值點(diǎn)求取熵分割閾值。梯度特征直方圖如圖6b 所示,由于梯度特征反映滑動(dòng)窗口內(nèi)像素點(diǎn)在某一方向的平均梯度強(qiáng)度,受噪聲點(diǎn)影響較小,故無需處理噪聲點(diǎn)。圖8a 和圖8b 分別為舍棄低熵值點(diǎn)前后熵特征的閾值化結(jié)果;圖8c 為方向梯度特征閾值化結(jié)果。
圖8 閾值分割后的特征圖像Fig.8 Feature images after threshold segmentation
1.4.2 小連通區(qū)域去除
從圖8b 和圖8c 可以看出,兩種特征均會(huì)產(chǎn)生較多的誤判區(qū)域。其中對(duì)于熵特征,未收割區(qū)域右側(cè)由于遠(yuǎn)離中心其熵特征值較小,中間區(qū)域也存在著部分因小麥高度的差異而導(dǎo)致光照下熵值過小的區(qū)域;對(duì)于方向梯度特征,已收割區(qū)域由于麥茬裸露,其紋理方向較為一致,窗口內(nèi)位于梯度方向區(qū)間內(nèi)像素點(diǎn)較多,方向梯度特征值普遍較高,未收割區(qū)域由于各個(gè)方向的梯度分布較雜亂,窗口內(nèi)位于梯度方向區(qū)間內(nèi)像素點(diǎn)少,方向梯度特征值普遍較低,且在各區(qū)域內(nèi)也存在不同程度的誤判窗口。但兩種特征的二值化結(jié)果均使得收割邊界的左側(cè)或者右側(cè)中的一側(cè)分類準(zhǔn)確度較高,因此可以通過去除小連通區(qū)域?qū)⒘硪粎^(qū)域內(nèi)的誤判點(diǎn)去除。
本文采取四鄰域連通區(qū)域判定方式,由于相機(jī)安裝位置與收割機(jī)位置相對(duì)固定,故收割區(qū)域與未收割區(qū)域在圖像中所占比例較為固定,因此去除區(qū)域的大小可以固定。通過觀察大量二值化圖像,未收割區(qū)域中遠(yuǎn)離相機(jī)中心的區(qū)域由于透視效應(yīng),其熵值較小。為去除誤分類點(diǎn)的同時(shí)保留盡可能多的正確分類點(diǎn),針對(duì)熵特征二值化圖,本文先去除黑色小連通區(qū)域,再去除白色小連通區(qū)域,區(qū)域閾值為二值化圖像大小的1/6;針對(duì)方向梯度二值化圖,本文采取先去除白色小連通區(qū)域,再去除黑色小連通區(qū)域,區(qū)域閾值分別為二值化圖像大小的1/12 和1/6。圖9a 和圖9b 分別展示了感興趣區(qū)域內(nèi)熵特征圖像和方向梯度特征圖像經(jīng)過去小連通區(qū)域處理后的二值化圖。
圖9 去除小連通區(qū)域后的特征二值化圖Fig.9 Binary image after removing small connected regions
1.4.3 Ransac 邊界擬合
經(jīng)過圖像二值化、小連通區(qū)域去除后,通過Canny算子即可提取得到邊界輪廓點(diǎn),融合2 種特征得到的邊界點(diǎn),采取Ransac 方法擬合得到收割邊界。由于收割農(nóng)機(jī)行進(jìn)方向與收割邊界朝向一致,因此收割導(dǎo)航線在圖像中的角度變化范圍相對(duì)固定,為提高檢測(cè)準(zhǔn)確率,在進(jìn)行Ransac 擬合時(shí)應(yīng)判斷擬合邊界是否在此角度范圍內(nèi),本文選擇角度范圍為[60°,120°]。當(dāng)待評(píng)價(jià)點(diǎn)落于擬合直線一定范圍內(nèi),則將該待評(píng)價(jià)點(diǎn)視為“優(yōu)點(diǎn)”,該擬合直線得分Score 加1,本文選擇距離擬合直線2個(gè)像素點(diǎn)作為“優(yōu)點(diǎn)”評(píng)價(jià)指標(biāo)。擬合過程如下:
1)將兩種特征得到的疑似邊界點(diǎn)集Points1和Points2作為數(shù)據(jù)輸入,記為Points;
2)從Points中隨機(jī)選擇兩個(gè)初始點(diǎn)作直線L,若L傾斜角θ∈[60°,120°],則進(jìn)入步驟3),否則重復(fù)步驟2);
3)遍歷得到Points中每個(gè)點(diǎn)到L的距離Di,若Di<2像素,則該直線得分Score加1;
4)重復(fù)步驟2)至步驟4),選擇Score 最大值對(duì)應(yīng)的L作為收割邊界。
本文選用顯微精工XG300 高速工業(yè)相機(jī),并搭配中聯(lián)科創(chuàng)VM0612 鏡頭作為圖像采集設(shè)備,采集圖像分辨率為720 像素×1 280 像素,采集幀率為30 幀/s。圖像處理在計(jì)算機(jī)平臺(tái)上完成,處理器為Intel i7-12700H CPU、RTX 3060GPU,內(nèi)存大小為16 GB。2021 年6 月中旬在北京小湯山精準(zhǔn)農(nóng)業(yè)基地采集原始小麥?zhǔn)崭顖D像數(shù)據(jù),天氣為晴天與多云。小麥株高約為80 cm,麥茬高度約為8 cm,收割行進(jìn)方式為右旋法,行進(jìn)速度約1.5 m/s,收割邊界位于收割機(jī)左側(cè)。為使拍攝視域較廣并保證收割機(jī)安全作業(yè),相機(jī)安裝于駕駛艙底部居中偏左位置,相機(jī)離地高度約2.2 m,相機(jī)光軸與地面呈約30°角。
對(duì)所拍攝麥田圖像進(jìn)行人工標(biāo)注作為收割邊界的真實(shí)值,將算法提取的收割邊界與人工標(biāo)注的收割邊界之間的夾角絕對(duì)值以及橫向截距的偏移率作為本文算法精度評(píng)價(jià)指標(biāo),并以檢測(cè)率作為算法有效性的評(píng)價(jià)指標(biāo)。本文定義檢測(cè)率Rdetected為
式中Nset為試驗(yàn)數(shù)據(jù)集總數(shù),Ndetected為成功檢測(cè)到收割邊界的圖像總數(shù)。
因收割邊界均為直線,故認(rèn)為檢測(cè)邊界與真實(shí)邊界滿足如下關(guān)系時(shí)視為成功檢測(cè)收割邊界:
式中θdeviation為檢測(cè)收割邊界與真實(shí)收割邊界的角度偏差,(°);θdetection為檢測(cè)收割邊界傾斜角,(°);θreal為真實(shí)收割邊界傾斜角,(°);θthreshold為角度偏差閾值,(°);Edeviation為橫向截距偏移率,%;Bdetected為檢測(cè)收割邊界橫向截距,像素;Breal為真實(shí)收割邊界橫向截距,像素;Ethreshold為橫向截距偏移率閾值,%。
基于視覺的檢測(cè)方案易受光照影響,小麥麥穗在不同光照下更容易產(chǎn)生紋理特征變化的現(xiàn)象。為驗(yàn)證本文方法的適用性,采集了不同光照環(huán)境下的小麥?zhǔn)崭顖D像,如圖10 所示,其中圖10a 和10b 拍攝于2021 年6 月18 日上午09:00,多云天氣,圖10c 拍攝于2021 年6 月17 日中午11:00,天氣晴,強(qiáng)光照。共拍攝弱光照?qǐng)D像2 200 張,局部強(qiáng)光照?qǐng)D像758 張,強(qiáng)光照?qǐng)D像1 134 張。
圖10 不同光照麥田圖像Fig.10 Wheat field images under different lighting conditions
傳統(tǒng)的收割邊界檢測(cè)算法利用多特征較經(jīng)典的是將圖像用超像素分割算法分割成大量的超像素塊,對(duì)超像素塊進(jìn)行多維特征提取,進(jìn)而利用機(jī)器學(xué)習(xí)算法構(gòu)建對(duì)超像素塊進(jìn)行分類的分類器,最后通過分類器區(qū)域收割區(qū)域與未收割區(qū)域。洪通過構(gòu)建6 維顏色特征向量和10維紋理特征向量,以決策樹模型為弱分類器,通過Adaboost 集成學(xué)習(xí)算法對(duì)弱分類器進(jìn)行組合構(gòu)建強(qiáng)分類器進(jìn)行稻田收割機(jī)導(dǎo)航線提取,其中決策樹最大可能深度為16[29]。
分別利用基于Adaboost 集成學(xué)習(xí)算法的邊界檢測(cè)方法和本文收割邊界檢測(cè)算法進(jìn)行檢測(cè),取θthreshold=5°、Ethreshold=5%,檢測(cè)結(jié)果如表1 所示。
本文算法選擇兩種紋理特征增擴(kuò)了邊界附近數(shù)據(jù)點(diǎn),既減少了提取無用特征的時(shí)耗,又避免了其對(duì)區(qū)域收割與否造成誤判,提高了角度的判別精度,進(jìn)而使得檢測(cè)率有較大提升。由表1 可知,相較于對(duì)比算法,本文方法的收割導(dǎo)航線檢測(cè)率有明顯提升,弱光照下本文算法為90.41%,提高46.19個(gè)百分點(diǎn);局部強(qiáng)光照下為88.26%,提高46.00個(gè)百分點(diǎn);強(qiáng)光照下為89.68%,提高49.64個(gè)百分點(diǎn),不同光照下平均檢測(cè)率為89.45%,平均提高47.28個(gè)百分點(diǎn),本文方法的平均檢出角度偏差為3.69°,平均檢出橫向截距偏移率為2.06%,處理240 像素×1 280像素的圖像平均耗時(shí)0.88 s,較對(duì)比算法減少用時(shí)73.89%。本文算法提高了檢測(cè)的準(zhǔn)確性與實(shí)時(shí)性水平。
圖11 為3 種光照下兩種算法成功檢出結(jié)果對(duì)比,圖12 為兩種算法誤檢結(jié)果對(duì)比。對(duì)比算法雖然對(duì)導(dǎo)航線中心位置判斷較為準(zhǔn)確,但導(dǎo)航線角度易受航線處超像素塊識(shí)別結(jié)果影響,而其導(dǎo)航線附近超像素塊正確識(shí)別率較差,導(dǎo)致了導(dǎo)航線檢測(cè)率較低。由于本文算法使用紋理特征提取收割邊界,而收割機(jī)作業(yè)過程中,相機(jī)由于處于運(yùn)動(dòng)狀態(tài)產(chǎn)生拍攝結(jié)果“模糊”的情形,以及收割機(jī)行進(jìn)過程中相機(jī)畫面中出現(xiàn)了如輪胎壓印等存在邊界特征的對(duì)象,導(dǎo)致本文算法也出現(xiàn)了一定程度的誤檢。
圖11 不同光照條件下不同算法的檢出結(jié)果Fig.11 Detected results of different algorithms under different lighting conditions
圖12 不同光照條件下不同算法的誤檢結(jié)果Fig.12 Undetected results of different algorithms under different lighting conditions
1)提出了基于多紋理特征的麥田收割邊界檢測(cè)方法,利用熵特征反映圖像一定窗口內(nèi)像素點(diǎn)數(shù)量關(guān)系以及方向梯度特征反映一定窗口的方向紋理特性的特點(diǎn),構(gòu)建了二維互補(bǔ)紋理特征;結(jié)合特征直方圖的特點(diǎn),通過最大熵閾值分割算法獲得特征二值化圖;通過去除小連通區(qū)域與Ransac 數(shù)據(jù)點(diǎn)擬合算法處理特征二值化圖得到了麥田收割邊界。
2)在熵特征提取中,本文結(jié)合滑動(dòng)窗口算法改進(jìn)直方圖統(tǒng)計(jì)方式,加快熵特征提取速度。處理一張240 像素×1 280 像素的圖像,傳統(tǒng)熵特征提取算法耗時(shí)1.05 s,本文熵特征提取算法耗時(shí)0.53 s,提速約49.52%。
3)相比Adaboost 集成學(xué)習(xí)算法,本文通過選擇本場(chǎng)景下兩種紋理特征進(jìn)行互補(bǔ),縮短了特征提取時(shí)間,同時(shí)避免多余特征對(duì)收割與否造成誤判,提高了收割邊界檢測(cè)率。對(duì)于240 像素×1 280 像素的圖像,Adaboost集成學(xué)習(xí)算法提取收割邊界耗時(shí)3.37 s,本文算法耗時(shí)0.88 s,提速約73.89%,基本滿足農(nóng)機(jī)自主導(dǎo)航技術(shù)的實(shí)時(shí)性要求。在檢測(cè)率方面,本文算法在弱光照下為90.41%,局部強(qiáng)光下為88.26%,強(qiáng)光照下為89.68%,較對(duì)比算法分別提高46.19、46.00 和49.64個(gè)百分點(diǎn),檢測(cè)率較對(duì)比算法提升明顯。