肖志云 趙曉陳
(1.內(nèi)蒙古工業(yè)大學(xué)電力學(xué)院,呼和浩特010080;2.內(nèi)蒙古工業(yè)大學(xué)內(nèi)蒙古機電控制重點實驗室,呼和浩特010051)
內(nèi)蒙古自治區(qū)是我國重要的草原畜牧業(yè)生產(chǎn)基地,全區(qū)草場面積達8 666.7 萬hm2,占內(nèi)蒙古土地面積的76.5%,約占全國天然草場面積的1/4[1]。深入研究牧草是合理利用草地資源、實現(xiàn)國家可持續(xù)發(fā)展的重要途徑。實現(xiàn)牧草生長趨勢的精準檢測、研究牧草物種多樣性等都需要對牧草進行準確分類。目前,牧草識別主要由人工完成,費時、費力,且精度較低。
隨著機器視覺技術(shù)的發(fā)展,眾多研究者以葉片的顏色、紋理、形狀等視覺特征研究植物葉片識別方法[2-7]。首先使用特定的圖像分割算法將葉片與背景分離,然后通過將提取到的葉片的顏色、紋理、邊緣等多個特征相融合的方式研究植物葉片識別方法,利用多種聚類和分類算法建立識別模型,獲得了較好的識別結(jié)果。上述方法是從圖像分割與葉片特定特征的提取出發(fā),對植物葉片進行分類識別,而當(dāng)存在光照變化、背景復(fù)雜、葉片重疊等自然因素影響時,圖像分割效果會受到影響,提取到的特征也會發(fā)生較大變化。因此,基于圖像分割與提取特征的識別方法在自然環(huán)境下效果不理想。
自ALEX 等[8]提出AlexNet 卷積神經(jīng)網(wǎng)絡(luò)模型以來,卷積神經(jīng)網(wǎng)絡(luò)大量應(yīng)用于圖像分類研究中[9-13]。文獻[14]在對稻飛虱與非稻飛虱進行圖像分類研究時,首先使用遷移學(xué)習(xí)在ResNet-50 框架上訓(xùn)練,然后通過Mask R-CNN 對其進行分類識別,平均識別精度達92.3%;文獻[15]在對花卉品種進行分類時,提出一種將卷積神經(jīng)網(wǎng)絡(luò)與隨機森林相結(jié)合的方法,相比手工提取特征方法,有效提高了識別率。與手動提取特征的方法相比,基于深度卷積網(wǎng)絡(luò)的圖像識別方法無需圖像分割,可自動提取特征,且提取的特征不受光照變化、背景復(fù)雜等環(huán)境的影響,適于自然背景下的圖像識別。
上述基于卷積神經(jīng)網(wǎng)絡(luò)的識別方法雖然提高了識別精度,但采用的都是一種池化方式,且對特征沒有按重要性進行區(qū)分,不能充分利用圖像所包含的信息。本文針對自然背景下牧草圖像難識別的問題,充分利用牧草圖像信息,設(shè)計一種基于雙池化與多尺度核特征加權(quán)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以有效提高網(wǎng)絡(luò)的識別精度。
通過兩種方式獲取牧草圖像:首先在自然場景下使用相機對牧草圖像進行采集;其次通過網(wǎng)絡(luò)爬蟲爬取互聯(lián)網(wǎng)上的圖像對數(shù)據(jù)集進行補充。通過對上述方法獲得的牧草圖像進行篩選后,共保留紫花苜蓿、紅三葉、雞眼草、紫云英等10 類2 110 幅牧草圖像,且每幅牧草圖像的背景各不相同,牧草區(qū)域有大有小,光照強弱也有不同。圖1為本文需識別的10 類牧草圖像,表1 為數(shù)據(jù)集中各類牧草的數(shù)量。
圖1 本文需識別的牧草種類Fig.1 Forage species images to be identified
表1 樣本集中各類樣本數(shù)量Tab.1 Number of pastures in sample set
本文網(wǎng)絡(luò)是在VGG-Net[16]結(jié)構(gòu)基礎(chǔ)上改進而來,VGGNet-13 結(jié)構(gòu)如圖2 所示,圖中,Conv 代表卷積核,Max Pooling 代表最大值池化,Avg Pooling 代表均值池化,F(xiàn)C 代表全連接層。網(wǎng)絡(luò)采用了卷積層堆疊的結(jié)構(gòu)且在每2 個卷積層后接1 個池化層,網(wǎng)絡(luò)共包括10 個卷積層和5 個池化層,其中卷積核尺寸為3 ×3,池化層采用Max Pooling。
為提高網(wǎng)絡(luò)對特征分布的擬合能力,卷積神經(jīng)網(wǎng)絡(luò)通常在卷積層和全連接層后引入非線性激活函數(shù)。常用的激活函數(shù)為ReLU 激活函數(shù),其表達式為
式中 x——輸入特征值
f(x)——輸出特征值
圖2 VGGNet-13 結(jié)構(gòu)Fig.2 Network layer parameter
由式(1)可知,當(dāng)x <0 時ReLU 函數(shù)的輸出為0,訓(xùn)練時會造成神經(jīng)元失活,因此本文網(wǎng)絡(luò)的非線性激活函數(shù)采用ELU[17]函數(shù),其表達式為
式中 α——伸縮因子
α 控制ELU 負值部分何時飽合,在本文中取值為1。
由式(2)可知,ELU 函數(shù)在x≤0 部分是一個指數(shù)函數(shù),因此不會出現(xiàn)神經(jīng)元失活問題。
在最后1 個池化層后引入了Global Average Pooling[18]層,可以大量減少網(wǎng)絡(luò)參數(shù),有效地防止過擬合,甚至在很多網(wǎng)絡(luò)中都使用它來替代全連接層。為提高網(wǎng)絡(luò)非線性同時保證識別精度,本文并沒有取消全連接層而是將其參數(shù)設(shè)為512,之后是Softmax 層用于對牧草圖像分類。
采用Adam 優(yōu)化器最小化損失函數(shù)。由于數(shù)據(jù)集中的樣本之間存在差異,必然存在網(wǎng)絡(luò)容易學(xué)習(xí)的樣本和難以學(xué)得的樣本,因此采用Focal loss[19]代替交叉熵作為網(wǎng)絡(luò)的損失函數(shù)。以二分類為例,交叉熵表達式為
L——交叉熵損失函數(shù)值
Focal loss 的表達式為
式中 Lf——Focal loss 值
γ——指數(shù)調(diào)控因子
由式(4)可知,F(xiàn)ocal loss 在交叉熵的基礎(chǔ)上引入了γ 因子,當(dāng)γ >0 時^y 值越大的樣本有更小的損失函數(shù)值,因此Focal loss 可以使網(wǎng)絡(luò)在訓(xùn)練時更加關(guān)注于難以學(xué)得的樣本,經(jīng)實驗測定,當(dāng)γ =5 時效果最佳。
池化層是卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu),池化可以在保留主要特征的同時降低特征維度,減少卷積神經(jīng)網(wǎng)絡(luò)的運算量,最常用的有Max Pooling 和Average Pooling。
Max Pooling 選取池化區(qū)域內(nèi)最大值作為特征值,其表達式為
式中 C——池化窗口內(nèi)(i,j)的取值集合
k(i,j)——池化窗口內(nèi)位置為(i,j)的像素值
hmax——池化后的值
Average Pooling 選取池化區(qū)域內(nèi)的平均值作為特征值,其表達式為
式中 havg——池化后的值
m——池化窗口尺寸
研究表明Max Pooling 能夠更多地保留圖像紋理等顯著性信息[20],而Average Pooling 則更多地保留了圖像的局部空間信息[21]。目前大多數(shù)卷積神經(jīng)網(wǎng)絡(luò)只選取一種池化方式,會造成更大的信息損失,為充分利用特征信息可以同時使用這兩種池化方法。
圖3 雙池化結(jié)構(gòu)Fig.3 Double pool structure
結(jié)合SeNet(Squeeze-and-excitation networks)[22]提出了一種雙池化卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其結(jié)構(gòu)如圖3所示。首先對上一個卷積層輸出的特征圖進行1 ×1卷積操作,將特征圖的個數(shù)降為原來的1/2,然后對降維后的特征圖分別進行最大池化和平均池化操作得到兩組特征圖,之后將這兩組特征圖進行拼接。
圖4 為兩種池化方式單獨使用時測試集的識別率隨訓(xùn)練次數(shù)的變化曲線,從圖中可知,兩種池化對識別結(jié)果的影響不同,因此將拼接后的特征圖直接輸入到下一個卷積層不合理。為解決這個問題,引入SeNet 中的特征重標定策略,即通過學(xué)習(xí)的方式自動獲取每個特征的重要程度,然后依照這個重要程度對特征進行加權(quán),從而提升有用的特征并抑制對當(dāng)前任務(wù)作用較小的特征。
圖4 兩種池化方式識別率對比Fig.4 Accuracy rate graph of two different pooling methods
如圖3 右半部分所示,首先對拼接后特征圖進行Global Average Pooling 操作,將H ×H ×C 的特征圖變換為1 ×1 ×C 的向量,其中H 為特征圖的尺寸,C 為特征圖的個數(shù)。然后將此向量先后輸入到2 個全連接層,第2 個全連接層輸出向量中的元素即為池化層拼接后對應(yīng)特征圖的權(quán)重,之后將該權(quán)重與原特征圖相乘得到新的特征圖,最后將新特征圖輸入到下一個卷積層。在此過程中引入全連接層的目的在于使網(wǎng)絡(luò)能夠在訓(xùn)練過程中通過學(xué)習(xí)不斷地調(diào)整特征圖的權(quán)重,直到其最大程度地滿足于當(dāng)前任務(wù)。
如圖5 為訓(xùn)練過程中權(quán)重分布圖,由圖可知,在訓(xùn)練開始階段權(quán)重分布變化幅度比較大,隨著訓(xùn)練的進行權(quán)重分布逐漸趨于穩(wěn)定,說明在本文雙池化結(jié)構(gòu)中引入特征重標定策略后其權(quán)重在網(wǎng)絡(luò)訓(xùn)練過程中不斷調(diào)整,直到其收斂于最優(yōu)權(quán)重。
圖5 網(wǎng)絡(luò)訓(xùn)練過程中權(quán)重分布變化Fig.5 Weight distribution change diagram duringnetwork training
網(wǎng)絡(luò)訓(xùn)練完成后,若最大池化層產(chǎn)生的特征圖的最小權(quán)重大于平均池化計算出的特征圖的最大權(quán)重,則說明相對最大池化,平均池化層產(chǎn)生的特征圖對當(dāng)前任務(wù)的貢獻很小,這種情況下引入平均池化將失去意義。
表2 為網(wǎng)絡(luò)訓(xùn)練完成輸入1 幅圖像后,提取的第1 個雙池化結(jié)構(gòu)中Max Pooling 和Average Pooling各特征圖的權(quán)重,即各特征圖對當(dāng)前任務(wù)的重要程度,結(jié)合圖4 可知,雖然在2 種池化單獨使用時Max Pooling 的整體效果優(yōu)于Average Pooling,但并不是Max Pooling 中所有特征圖對當(dāng)前任務(wù)的重要程度都高于Average Pooling,說明本文方法是可行的。
表2 兩種池化方式所得各特征圖權(quán)重Tab.2 Weight values of each feature map obtainedby two pooling methods
在卷積神經(jīng)網(wǎng)絡(luò)中,不同尺寸的卷積核對圖像的感受野是不同的,小尺寸的卷積核與圖像進行卷積操作得到的特征能更好地反映圖像的局部特征,大尺寸的卷積核則能更好地反映圖像的全局特征[23],為增強網(wǎng)絡(luò)適應(yīng)性,本文使用兩種尺寸卷積核的組合來對牧草進行識別,但網(wǎng)絡(luò)的運算量是隨著卷積核尺寸的增大而增大的,卷積核太大則會造成海量的運算量。因此本文只對比了尺寸為3 ×3、5 ×5、7 ×7 的卷積核與3 ×3 卷積核組合后對網(wǎng)絡(luò)識別率的影響,實驗結(jié)果顯示3 種組合的識別率分別為92.76%、94.10%、92.81%。
由以上結(jié)論可知,在3 ×3 卷積核中引入5 ×5 的卷積核后識別率提升了1. 34 個百分點,而在3 ×3 卷積核中引入7 ×7 的卷積核后網(wǎng)絡(luò)識別率提升并不明顯,因此本文使用3 ×3卷積核與5 ×5卷積核組成Conv block 結(jié)構(gòu)對牧草圖像進行識別。
為充分利用特征信息,引入了Densenet[24]中的特征復(fù)用思想,即網(wǎng)絡(luò)任意兩層之間都有直接的連接,每一層的輸入都是前面所有層輸出的并集,而該層所學(xué)習(xí)的特征圖也會被直接傳遞給其后面所有層作為輸入。其表達式為
式中 xl——第l 層特征圖
H(·)——ELU 激活函數(shù)
這樣在提高特征利用率的同時減少了參數(shù)量[25];網(wǎng)絡(luò)更容易訓(xùn)練,并且稠密連接的正則化作用在少量的訓(xùn)練集中能夠有效降低過擬合[26];加速卷積神經(jīng)網(wǎng)絡(luò)反向傳播時梯度的傳遞,在一定程度上緩解了隨著網(wǎng)絡(luò)的加深而產(chǎn)生的梯度消失問題和模型退化問題。上述Conv block 和復(fù)用特征組成的結(jié)構(gòu)如圖6 所示,具體操作如下。
Conv block 操作:首先將上一層得到的特征圖輸入到1 ×1 卷積層,目的是減少特征圖的數(shù)量,以減少運算量;然后將降維后的特征圖分別輸入到3 ×3 卷積層和5 ×5 卷積層,同樣為減少計算量將3 ×3 卷積核分解為1 ×3 卷積核和3 ×1 卷積核,5 ×5 卷積核分解為1 ×5 卷積核和5 ×1 卷積核。
特征復(fù)用操作:將經(jīng)上一個Pooling block 層或輸入層輸出的特征圖和與當(dāng)前Conv block 之間所有Conv block 輸出的特征圖進行拼接,之后經(jīng)過一組1 ×1 的卷積核進行降維。
經(jīng)過上述操作后,共產(chǎn)生3 組特征圖,之后的操作是將這3 組特征圖進行拼接。同樣,在此也引入特征重標定策略,對拼接后的特征圖進行加權(quán)以增強有用特征,抑制無用特征。
圖6 多尺度特征加權(quán)結(jié)構(gòu)圖Fig.6 Multi-scale feature weighted structure
圖7 為網(wǎng)絡(luò)訓(xùn)練完成后提取的各層輸出的特征圖,由于相鄰2 層提取的特征圖區(qū)別較小,因此每2個Conv block 模塊提取1 次特征圖。由圖可以看出,網(wǎng)絡(luò)Conv block2 模塊輸出的特征圖包含了牧草圖像空間、顏色等混合信息,但圖像的背景部分仍然存在;Conv block4 和Conv block6 的特征圖更多地包含了牧草圖像的紋理和輪廓等不變性特征,而圖像背景部分已經(jīng)基本消除;Conv block8 層則更多保留了各類牧草之間有區(qū)分性的特征,而Conv block10 輸出的特征圖則代表了與類別相關(guān)的信息。以上分析表明,隨著網(wǎng)絡(luò)層數(shù)的加深,特征的抽象程度和稀疏程度也越來越高,且提取到的圖像特征主要是牧草特征而非背景,因此本文網(wǎng)絡(luò)能夠有效提取牧草特征。
對紫花苜蓿、針茅、狼尾草、紫云英等10 種典型牧草進行識別研究,所選軟件平臺為Anaconda3 中的spyder,使用Python 語言和Tensorflow 深度學(xué)習(xí)框架進行圖像預(yù)處理和卷積神經(jīng)網(wǎng)絡(luò)的搭建;硬件平臺為計算機,處理器為IntelCore i5-8400,GPU 為GTX1060,6GB 顯存。
圖7 網(wǎng)絡(luò)各層提取的特征圖Fig.7 Feature map extracted from each layer of network
首先將獲得的樣本尺寸調(diào)整到128 像素×128 像素,然后按4∶1的比例將初始數(shù)據(jù)集隨機分為訓(xùn)練集和測試集。由于卷積神經(jīng)網(wǎng)絡(luò)參數(shù)較多,在訓(xùn)練過程中極易發(fā)生過擬合,因此在對網(wǎng)絡(luò)訓(xùn)練之前需要對初始樣本的訓(xùn)練集進行擴充。常用的數(shù)據(jù)擴充方法有平移、旋轉(zhuǎn)、亮度變換、添加噪聲等。數(shù)據(jù)擴充應(yīng)結(jié)合具體研究目標的特點,不能隨意擴充,例如形狀是牧草主要表征之一,在數(shù)據(jù)擴充時不應(yīng)改變牧草形狀。另外擴充的圖像與原圖像之間應(yīng)有一定差距,但同時要盡多地保留原始圖像中牧草的相關(guān)特征。例如在對圖像進行平移時,若平移的像素點太少,則平移后的圖像與原圖無異,在這種情況下反而會加重網(wǎng)絡(luò)過擬合,若平移過多則會丟失較多的牧草信息。因此在對圖像進行平移變換時,將平移的范圍限制在10 ~30 像素,在旋轉(zhuǎn)變換時只進行了90°、180°、270°的旋轉(zhuǎn),其他數(shù)據(jù)擴充方式也遵循以上思想。數(shù)據(jù)擴充分3 次進行:第1 次,通過旋轉(zhuǎn)、平移、裁剪和填充將數(shù)據(jù)擴充為原訓(xùn)練集的7倍。第2 次,考慮到在自然條件下光照強度對識別結(jié)果影響較大,因此對上述擴充后的圖像進行亮度變換擴充至原訓(xùn)練集的14 倍。第3 次,對原始訓(xùn)練集進行添加噪聲和水平鏡像變換。最終擴充后的訓(xùn)練集是原訓(xùn)練集的16 倍,且每次擴充后網(wǎng)絡(luò)識別率均有提升。對樣本集進行編號分類并制作標簽,擴充后各類牧草數(shù)量及各類牧草的標簽如表3 所示。
表3 擴充后的訓(xùn)練集中各類樣本數(shù)量Tab.3 Number of samples in expanded training set
在使用卷積神經(jīng)網(wǎng)絡(luò)對圖像進行處理之前首先對圖像進行標準化操作,表達式為
式中 X——圖像樣本 μ——樣本均值
σ——樣本標準差
X*——標準化的樣本
采用Adam 優(yōu)化器對網(wǎng)絡(luò)進行訓(xùn)練,批處理容量為60,采用指數(shù)衰減的學(xué)習(xí)率,基礎(chǔ)學(xué)習(xí)率0.002 2,學(xué)習(xí)率衰減系數(shù)為0.99,L2正則化系數(shù)為0.000 7,模型迭代次數(shù)為100 000。
圖8 為使用VGG-13 對牧草數(shù)據(jù)集訓(xùn)練時的相關(guān)曲線,由圖8a 可知,訓(xùn)練集識別率在訓(xùn)練10 000 次時已經(jīng)達到100%,而測試集識別率僅為70%。由圖8b 可知,訓(xùn)練集上的損失值在訓(xùn)練50 000 次后已經(jīng)接近0,而測試集上的損失值在0.3附近,由此得知在直接將VGG-13 在牧草圖像數(shù)據(jù)集上訓(xùn)練時會發(fā)生過擬合,為驗證本文網(wǎng)絡(luò)的有效性,本文對VGG-13 網(wǎng)絡(luò)各層參數(shù)進行了調(diào)整,使其適應(yīng)于牧草數(shù)據(jù)集。
圖8 VGG-13 在牧草圖像數(shù)據(jù)集上相關(guān)曲線Fig.8 Correlation curves of VGG-13 on pasture image dataset
圖9 本文網(wǎng)絡(luò)與調(diào)整后的VGG-13 相關(guān)曲線Fig.9 Comparison of network and adjusted VGG-13 correlation curves
圖9 為調(diào)整后的VGG-13 與本文網(wǎng)絡(luò)在測試集上的識別率和在訓(xùn)練集上的損失值曲線對比圖,結(jié)合圖8a 知,調(diào)整后的VGG-13 相比調(diào)整前識別率有了明顯提高,而相比調(diào)整后的VGG-13,本文網(wǎng)絡(luò)的識別率更高。由圖9b 可知,本文網(wǎng)絡(luò)的損失值在迭代20 000 次時已經(jīng)接近0,而調(diào)整后的VGG-13 在迭代近40 000 次才接近0,因此本文網(wǎng)絡(luò)明顯收斂更快。
為驗證本文方法的有效性,將調(diào)整后的VGG-13、調(diào)整后的VGG-13 +雙池化結(jié)構(gòu)和本文網(wǎng)絡(luò)在單類樣本測試集上進行了對比,其識別率如表4 所示。由表4 可得知,調(diào)整后的VGG-13 結(jié)構(gòu)只有5 類牧草識別率超過90%;VGG-13 +雙池化結(jié)構(gòu)有8 類牧草圖像識別率超過90%,其中有3 類牧草地識別率超過了95%,紫云英的識別率達到100%;本文網(wǎng)絡(luò)除雞眼草外,識別率均超過了90%,其中有5 類牧草超過了95%,針茅的識別率達到100%。由以上分析可知,3 種網(wǎng)絡(luò)中本文網(wǎng)絡(luò)在對單類樣本識別中表現(xiàn)最好,其次是調(diào)整后的VGG-13+雙池化結(jié)構(gòu),調(diào)整后的VGG-13 網(wǎng)絡(luò)表現(xiàn)最差。結(jié)果表明本文提出的牧草識別方法在單類樣本上是有效的。
表4 各網(wǎng)絡(luò)在訓(xùn)練集中各類樣本上的識別率Tab.4 Recognition rates of various networks on various samples in training set
為進一步分析識別率差異的原因,本文提取了部分分類正確和分類錯誤的圖像類激活熱力圖,分別如圖10、11 所示。
由圖10 可知,對于能夠正確分類的樣本,其對分類有貢獻的區(qū)域主要集中在牧草所在區(qū)域,尤其是與各牧草有顯著差異的部分,如紅三葉圖像中“V”形白色紋理部分,紫云英葉基部分,紫花苜蓿的葉尖部分。
由圖11 可知,對于錯分樣本,可以分為3 種情況:第1 種情況是圖像對分類起作用的區(qū)域是背景而不是牧草本身,如圖11b、11e、11f、11g、11i,原因是在原圖像中背景葉片的特征更為明顯,網(wǎng)絡(luò)在分類時誤將背景葉片作為目標葉片,進而導(dǎo)致錯分。第2 種情況是圖像中牧草葉片個數(shù)過多,單個葉片區(qū)域過小,使網(wǎng)絡(luò)無法提取有效特征,如圖11a、11h。第3 種情況是圖像對分類起作用的區(qū)域是牧草葉片部分,但卻將類別錯分,如圖11c、11d,原因是原圖像中牧草區(qū)域?qū)S刑卣鞑幻黠@,對分類起作用的區(qū)域與其他牧草相似,從而導(dǎo)致分類錯誤。由以上分析可知,歪頭菜識別率較低主要由第1 和第2種情況造成,紫花苜蓿則由第1 種情況造成,而在雞眼草被錯分的樣本中均存在這3 種情況。
圖10 分類正確圖像的類激活熱力圖Fig.10 Class activation thermal maps of correct image classification
圖11 分類錯誤圖像的類激活熱力圖Fig.11 Class activation thermal map of classification error image
表5 為各網(wǎng)絡(luò)在單幅圖像運行時間和在測試集上平均識別率對比。由表5 可知,VGG-13 網(wǎng)絡(luò)的識別率最低且所用時間最長。本文網(wǎng)絡(luò)比調(diào)整后的VGG-13 網(wǎng)絡(luò)在訓(xùn)練集上的平均識別率高5.7 個百分點,但運行時間卻只多了0.035 s,證明本文提出的方法是有效可行的。網(wǎng)絡(luò)各層參數(shù)設(shè)置如
表5 各網(wǎng)絡(luò)測試集平均識別率與運行時間對比Tab.5 Comparison of average recognition rate and running time of each network test set
表6 網(wǎng)絡(luò)各層參數(shù)設(shè)置Tab.6 Network layer parameters
(1)提出的方法能夠更充分地利用圖像包含的信息,且在測試集上的平均識別率達到了94.1%,明顯優(yōu)于VGG-13 網(wǎng)絡(luò)。
(2)提出的網(wǎng)絡(luò)結(jié)構(gòu)在訓(xùn)練時,網(wǎng)絡(luò)的收斂速度是VGG-13 網(wǎng)絡(luò)的2 倍以上,說明本文網(wǎng)絡(luò)可以大幅提高網(wǎng)絡(luò)收斂速度。
(3)對10 類牧草進行單獨識別時,本文提出的方法識別率優(yōu)于VGG-13 網(wǎng)絡(luò),且有9 類牧草識別率超過90%,其中有5 類牧草識別率在95%以上,證明本文所提出的方法能夠?qū)δ敛輬D像進行準確識別。