于悅洋 王冰 王靜 湯喬
摘 要:本文介紹了一種基于BP神經(jīng)網(wǎng)絡(luò)的水果識(shí)別方法。隨著模式識(shí)別技術(shù)不斷的發(fā)展,圖像識(shí)別作為最具代表性的應(yīng)用,受到了眾多學(xué)者的關(guān)注,尤其是在圖像快速識(shí)別方面。為了解決傳統(tǒng)水果圖像分類(lèi)識(shí)別算法人工提取特征的缺陷,將經(jīng)過(guò)訓(xùn)練的BP神經(jīng)網(wǎng)絡(luò)應(yīng)用在水果的識(shí)別中。本實(shí)驗(yàn)使用數(shù)字圖像處理的方法,首先對(duì)采集到的圖像進(jìn)行預(yù)處理,并針對(duì)多種水果混合的圖像進(jìn)行提取和識(shí)別。實(shí)驗(yàn)表明,基于BP神經(jīng)網(wǎng)絡(luò)的水果識(shí)別方法能夠獲得很高的識(shí)別率,能夠有效地將同一幅圖像中的不同水果識(shí)別出來(lái)。
關(guān)鍵詞:水果識(shí)別;圖像處理;BP神經(jīng)網(wǎng)絡(luò);MATLAB
文章編號(hào):2095-2163(2019)04-0187-05 中圖分類(lèi)號(hào):TP391.41 文獻(xiàn)標(biāo)志碼:A
0 引 言
在中國(guó),通常采用人工方式進(jìn)行水果分級(jí),而人工分級(jí)往往效率低、勞動(dòng)量大、有較大的人工誤差等,難以實(shí)現(xiàn)標(biāo)準(zhǔn)分級(jí)[1]。并且人工識(shí)別具有諸多的不穩(wěn)定因素。因此,研究和開(kāi)發(fā)水果自動(dòng)實(shí)時(shí)分級(jí)系統(tǒng),對(duì)經(jīng)濟(jì)、農(nóng)業(yè)的發(fā)展具有廣闊的應(yīng)用前景。從80年代開(kāi)始,國(guó)內(nèi)外有許多學(xué)者研究水果分級(jí)的自動(dòng)識(shí)別算法,近年來(lái)也出現(xiàn)了一些基于水果識(shí)別的算法,如鄭小東等人[2]根據(jù)區(qū)域特征進(jìn)行水果的自動(dòng)識(shí)別。項(xiàng)輝宇等人實(shí)現(xiàn)了對(duì)蘋(píng)果大小、缺陷以及顏色特征的檢測(cè)。程榮花等人[3]對(duì)水果圖像的主成分分析,從而對(duì)其進(jìn)行識(shí)別預(yù)測(cè)。王水平等人[4]利用SVM分類(lèi)器,對(duì)水果進(jìn)行分類(lèi)預(yù)測(cè)。這些方法雖然在水果識(shí)別中取得了一定效果,但對(duì)于同副圖像中的多種水果識(shí)別還有欠缺。針對(duì)這一問(wèn)題,本文基于BP神經(jīng)網(wǎng)絡(luò)對(duì)水果圖像進(jìn)行識(shí)別。首先,根據(jù)水果的不同特征,對(duì)圖像進(jìn)行預(yù)處理;然后,通過(guò)標(biāo)簽化處理將圖像中各個(gè)連接成分進(jìn)行分離,從而實(shí)現(xiàn)對(duì)水果特性的研究,再提取出不同水果的顏色、邊界不規(guī)則、形狀等基本特征,對(duì)得到的水果圖像特征參數(shù)進(jìn)行計(jì)算;最后,使用多幅圖像訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),并完善水果特征庫(kù),以達(dá)到快速識(shí)別水果的目的。
1 數(shù)字圖像處理
首先,本文對(duì)不同水果圖片進(jìn)行數(shù)字圖像處理。目的是為了提高圖片的質(zhì)量,得到理想的圖像效果。圖像處理的方法有:圖像變化、圖像編碼壓縮、圖像增強(qiáng)和復(fù)原、分割、描述等。本文采用圖像識(shí)別方法的主要步驟為:首先,預(yù)處理圖像;然后,對(duì)預(yù)處理的圖像進(jìn)行分割和特征提取;最后,對(duì)圖像進(jìn)行判斷分類(lèi)。圖像分類(lèi)多數(shù)情況采用傳統(tǒng)的識(shí)別模式。傳統(tǒng)識(shí)別模式分為2大類(lèi):統(tǒng)計(jì)模式分類(lèi)和結(jié)構(gòu)模式分類(lèi)。近幾年研究中,模糊模式識(shí)別、人工神經(jīng)網(wǎng)絡(luò)模式識(shí)別,這2種新興的圖像識(shí)別方法頗受學(xué)術(shù)界的廣泛關(guān)注。
本文圖像預(yù)處理分為圖像去噪、圖像增強(qiáng)和圖像二值化3個(gè)步驟。本文采用中值濾波法對(duì)圖像去噪,中值濾波法是一種去噪聲的非線性平滑處理辦法。本文采用反銳化掩模法[5]對(duì)圖像增強(qiáng),該方法是一種常用的圖像銳化方法,先模糊處理圖像,再與原圖進(jìn)行差值運(yùn)算,再乘上一個(gè)修正因子,最后得到輪廓增強(qiáng)的圖像。該算法表達(dá)式如下:
二值化是將圖像呈現(xiàn)為黑白的對(duì)比效果的過(guò)程,該方法將圖像像素的灰度值設(shè)為“0”或“255”。圖像閾值分割法是應(yīng)用較普遍的圖像分割技術(shù),利用了圖像的背景與對(duì)象之間的灰度差異。本文采用閾值分割法對(duì)圖像進(jìn)行二值化,從而得到效果更好的二值化水果圖像。
2 水果圖像特征提取
數(shù)字圖像處理后,水果和背景被明顯的分開(kāi)。下一步,需要對(duì)每種水果進(jìn)行特征提取。具有代表性的水果特征有:紋理、形狀、顏色[6]等。計(jì)算機(jī)視覺(jué)技術(shù)主要通過(guò)從圖像或者視頻中提取出的物體特征,經(jīng)對(duì)比區(qū)別出不同物體。在農(nóng)業(yè)領(lǐng)域中應(yīng)用的水果自動(dòng)分類(lèi)識(shí)別系統(tǒng),也是通過(guò)提取所拍攝的水果圖像中的特征參數(shù),并以此為依據(jù)進(jìn)行訓(xùn)練得到識(shí)別模型從而達(dá)到分類(lèi)識(shí)別的目的。
2.1 圖像顏色模型
水果的顏色特征在圖像方向、尺寸等特征發(fā)生改變時(shí)無(wú)明顯變化,因此,在圖像識(shí)別中常用到顏色特征。顏色模型是用作精確標(biāo)定且生成多種顏色的一種方法。對(duì)于顯示設(shè)備來(lái)說(shuō),可以用紅色、綠色、藍(lán)色發(fā)光量來(lái)描述RGB。RGB又叫相加混色模型,其在實(shí)際生活中主要用于光照、顯示器等中。
(1)顏色特征,包括彩色和灰度信息處理;對(duì)于彩色信息處理,主要采用幾種常見(jiàn)的色彩空間;而對(duì)于灰度信息處理,主要采用直方圖技術(shù)。
(2)紅綠藍(lán)3色光按不同比例和強(qiáng)度混合可以用其表示近乎所有自然界的可見(jiàn)光,其顏色模型稱(chēng)之為RGB色彩空間模型[7],如圖1所示為RGB色彩空間模型。紅綠藍(lán)3色位于彩色立方體的3個(gè)頂角,其產(chǎn)生的點(diǎn)匯聚在彩色立方體的對(duì)角線上,即灰色線。在使用RGB模型時(shí),由于任一基本色上無(wú)亮度,所有RGB顏色顯示黑色。當(dāng)3基色變?yōu)樽罡叩母叨?,空間即會(huì)顯現(xiàn)出白色。其余較低高度但等量的3種基色就顯示灰色。RGB圖像每一個(gè)像素的顏色值直接存放在圖像矩陣中,通過(guò)3個(gè)M×N的二維矩陣分別表示各個(gè)像素的3種顏色分量,R、G、B3個(gè)分量分別表示每一個(gè)像素的顏色,圖像的行列數(shù)由M、N表示。
2.2 圖像形狀特征
圖像的形狀特征是指將圖像經(jīng)過(guò)邊緣提取和圖像分割,從而得到目標(biāo)的形狀。形狀的描述方法一般分為輪廓法和區(qū)域法2類(lèi)。本文采用輪廓法。并對(duì)其結(jié)果進(jìn)行美化,以達(dá)到更準(zhǔn)確的識(shí)別。圖像的形狀特征主要包括周長(zhǎng)和形狀參數(shù)。
(1)周長(zhǎng)為整個(gè)邊界的長(zhǎng)度。周長(zhǎng)通過(guò)計(jì)算物體邊界上相鄰像素的中心距的累加而得出。通常,面對(duì)傾斜方向,數(shù)據(jù)會(huì)產(chǎn)生一些誤差,所以要用2倍的原有像素?cái)?shù)進(jìn)行計(jì)算修改。
(2)物體的其中一個(gè)重要特征量是弧度,弧度是用于計(jì)算物體形狀復(fù)雜程度的參數(shù)。將弧度進(jìn)行比較,識(shí)別出不同的水果。在數(shù)字圖像中,可以通過(guò)物體所占有的像素點(diǎn)數(shù)來(lái)計(jì)算面積。
本文首先使用面積、周長(zhǎng)、弧度等參數(shù)表示水果,再使用RGB顏色模式對(duì)不同的水果圖像進(jìn)行特征提取,產(chǎn)生3幅不同通道的直方圖。通過(guò)直方圖顯示出的結(jié)果,提取不同水果中特有的特征,以達(dá)到識(shí)別水果的目的。
3 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)在上世紀(jì)八十年代年被首次提出[8]。BP神經(jīng)網(wǎng)絡(luò)是一種有效的神經(jīng)學(xué)習(xí)方法,是在誤差反傳算法的基礎(chǔ)上產(chǎn)成的,并引入了反向傳播原理,破傳統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu),解決了非線性問(wèn)題,是目前普遍應(yīng)用的神經(jīng)網(wǎng)絡(luò)模型。
BP神經(jīng)網(wǎng)絡(luò)通常由3個(gè)層次構(gòu)成,分別是輸入層、中間層、輸出層[9]。由傳遞函數(shù)將各層連接,通過(guò)特定的學(xué)習(xí)算法來(lái)訓(xùn)練網(wǎng)絡(luò)、調(diào)節(jié)權(quán)重,使輸出不斷接近預(yù)期值。輸入層接受來(lái)自外部的輸入信息,其中間層(可為單隱層或多隱層)需要進(jìn)行信息處理,各神經(jīng)元上的信息經(jīng)由最后一個(gè)隱層傳送到輸出層,處理完成的結(jié)果再通過(guò)輸出層向外界發(fā)送。
BP網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。
BP網(wǎng)絡(luò)具有非常強(qiáng)大的非線性映射能力,因此,能夠?qū)W習(xí)和大量關(guān)于存儲(chǔ)輸入與輸出之間的映射關(guān)系。3層BP神經(jīng)網(wǎng)絡(luò)可以在不描述函數(shù)映射關(guān)系的情況下逼近任意非線性函數(shù)。如圖3示出了BP網(wǎng)絡(luò)的向量圖。
BP神經(jīng)網(wǎng)絡(luò)采用梯度下降算法,這種算法適用于非線性多層網(wǎng)絡(luò)梯度的計(jì)算。BP神經(jīng)網(wǎng)絡(luò)算法的基本思路是:由前向神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)正向傳播,由遞歸神經(jīng)網(wǎng)絡(luò)(反饋神經(jīng)網(wǎng)絡(luò))實(shí)現(xiàn)誤差反向傳播。這2個(gè)進(jìn)程交替完成,在權(quán)向量空間執(zhí)行誤差梯度下降算法,從而使誤差降到最低。其具體步驟如下:
(3)選取下一個(gè)輸入模式再返回到(2)中反復(fù)訓(xùn)練直到輸出誤差達(dá)到要求為止。
在BP網(wǎng)絡(luò)的結(jié)構(gòu)中,輸入層與輸出層之間含有多層神經(jīng)元(其模擬人類(lèi)大腦神經(jīng)元擁有的基本功能:加權(quán)、求和、傳遞),這些神經(jīng)元被稱(chēng)為隱單元,隱單元與外界沒(méi)有直接的聯(lián)系,但其狀態(tài)的改變,會(huì)影響輸入與輸出之間的關(guān)系,每一層可以有無(wú)數(shù)個(gè)這樣的節(jié)點(diǎn)。
4 實(shí)驗(yàn)及結(jié)果分析
4.1 實(shí)驗(yàn)框架
本文的水果識(shí)別框架是根據(jù)不同水果特征,把需要的水果從中識(shí)別出來(lái),其總體框架如圖4所示。
本文實(shí)驗(yàn)的具體步驟如下:
(1)輸入水果圖像;
(2)圖像預(yù)處理;
(3)圖像標(biāo)簽化處理和圖像特征參數(shù)計(jì)算,把每個(gè)區(qū)域都分開(kāi),根據(jù)提取的圖像特征,將水果進(jìn)行區(qū)分;
(4)建立水果特征庫(kù),把采集的特征數(shù)據(jù)用BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,區(qū)分同一圖片中的不同水果;
(5)完成水果的識(shí)別。
4.2 實(shí)驗(yàn)結(jié)果與分析
本文實(shí)驗(yàn)環(huán)境中計(jì)算機(jī)系統(tǒng)為 Windows10,處理器為Intel 酷睿i53210M,主頻為2.5 GHz,內(nèi)存為4 GB,顯存為1 G,硬盤(pán)是500 GB,實(shí)驗(yàn)是基于MATLAB開(kāi)發(fā)工具。本文主要以蘋(píng)果、橙子、香蕉為例。圖5示出了水果圖像處理結(jié)果圖,依次為原始圖像、邊緣檢測(cè)圖像、OR運(yùn)算分割圖像和彩色標(biāo)簽化圖像。從圖中可以看出,通過(guò)一系列的圖像處理可以將不同區(qū)域的像素分開(kāi),從而利于后續(xù)對(duì)圖像特征的提取和圖像特征參數(shù)的計(jì)算。
表1為橙子、香蕉和蘋(píng)果的特征參數(shù)數(shù)據(jù)表,從中可以看出,與其它2種水果相比,香蕉的特征最為明顯,周長(zhǎng)最大、弧度最小,根據(jù)該特征能夠把香蕉從水果中分離出來(lái)。
圖6所示為3種水果的RGB通道圖及其直方圖,由圖可知,與其它2種水果對(duì)比,蘋(píng)果的R通道直方圖中其固定區(qū)域內(nèi)的像素?cái)?shù)量(200-300)與G通道和B通道像素和的比值為3水果中最大的,可得到蘋(píng)果的比值最大,可知蘋(píng)果的紅色信息量最多。
圖7為本文BP網(wǎng)絡(luò)的訓(xùn)練性能,橫坐標(biāo)代表訓(xùn)練次數(shù),縱坐標(biāo)代表均方誤差,該誤差值越小,說(shuō)明實(shí)驗(yàn)結(jié)果與原圖之間差異程度越低。從圖中可以看出本文的BP網(wǎng)絡(luò)經(jīng)過(guò)10次訓(xùn)練,其均方誤差為0.7×10-3,識(shí)別準(zhǔn)確度較高,可以直接進(jìn)行水果識(shí)別。
圖8為本文設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)及其運(yùn)行結(jié)果。測(cè)試結(jié)果表明,通過(guò)對(duì)不同測(cè)試樣本的訓(xùn)練,對(duì)蘋(píng)果的識(shí)別近乎完全正確,橙子和香蕉的識(shí)別率均為97%,這個(gè)結(jié)果進(jìn)而證實(shí)了采用特征提取和BP神經(jīng)網(wǎng)絡(luò)識(shí)別水果的有效性。通過(guò)神經(jīng)網(wǎng)絡(luò)的不斷訓(xùn)練,后期對(duì)圖像的識(shí)別更加準(zhǔn)確。就像人的大腦一樣,對(duì)圖像的特征不斷進(jìn)行記憶,使識(shí)別更加智能化。
BP神經(jīng)的優(yōu)點(diǎn):高效、智能。如果要更加準(zhǔn)確,需要加入更多的特征,在顏色的準(zhǔn)確性上需要改進(jìn)。因?yàn)樗芏囝伾^為相像,且需要更大的數(shù)據(jù)庫(kù)。
從實(shí)驗(yàn)結(jié)果中可以看出,BP神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別系統(tǒng)的自適應(yīng)能力較強(qiáng),且識(shí)別率也較高,是一種高效的檢測(cè)方法。
5 結(jié)束語(yǔ)
本文采用數(shù)字圖像處理的方法,對(duì)原始水果圖像進(jìn)行預(yù)處理并對(duì)RGB圖像進(jìn)行數(shù)據(jù)分析。通過(guò)對(duì)BP神經(jīng)網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)構(gòu)建了基于MATLAB的水果圖像識(shí)別系統(tǒng)。通過(guò)實(shí)驗(yàn)對(duì)比,本文算法誤差較小、實(shí)時(shí)性較好、正確率高,能夠?qū)崿F(xiàn)對(duì)水果特征數(shù)據(jù)的準(zhǔn)確識(shí)別。但是,本文提出的算法也存在不足,由于水果種類(lèi)繁多,重點(diǎn)選取的香蕉、蘋(píng)果等比較有特點(diǎn)的水果,所以實(shí)驗(yàn)結(jié)果較理想,若參雜其它水果種類(lèi),如青蘋(píng)果、火龍果等,則需要對(duì)算法進(jìn)行改進(jìn)。
參考文獻(xiàn)
[1] 曾平平,李林升. 基于卷積神經(jīng)網(wǎng)絡(luò)的水果圖像分類(lèi)識(shí)別研究[J]. 機(jī)械設(shè)計(jì)與研究,2019,35(1):23-26,34.
[2]王水平,唐振民,范春年,等. 基于SVM的水果分類(lèi)算法研究[J]. 武漢理工大學(xué)學(xué)報(bào),2010,32(16):44-47.
[3]程榮花,馬飛,梁亞紅. 形狀相似水果自動(dòng)化識(shí)別研究[J]. 山東農(nóng)業(yè)科學(xué),2015,47(8):116-118.
[4]鄭小東,王曉潔,李印清. 自然環(huán)境下果實(shí)的自動(dòng)識(shí)別技術(shù)[J]. 計(jì)算機(jī)應(yīng)用與軟件,2006(11):96-97,100.
[5]項(xiàng)輝宇,薛真,冷崇杰,等. 基于Halcon的蘋(píng)果品質(zhì)視覺(jué)檢測(cè)試驗(yàn)研究[J]. 食品與機(jī)械,2016,32(10):123-126.
[6]沈磊,蘇建忠,郭肇敏,等. 基于反銳化掩模技術(shù)的紅外圖像增強(qiáng)算法設(shè)計(jì)[J]. 南開(kāi)大學(xué)學(xué)報(bào)(自然科學(xué)版),2019(1):29-35.
[7]賀詢(xún). 水果識(shí)別中圖像特征綜述[J]. 河南科技,2017(21):34-35.
[8]Huang Z, Zhu Q. Detection of Red Region of Fuji Apple Based on RGB Color Model[J]. Laser & Optoelectronics Progress, 2016, 53(4):041001.
[9]文周,林偉健. 基于BP神經(jīng)網(wǎng)絡(luò)的水果氣調(diào)包裝機(jī)械故障診斷方法[J]. 包裝與食品機(jī)械,2018,36(5):69-72.