李 寧 王雨萱 徐守坤 石 林
1(常州大學(xué) 信息科學(xué)與工程學(xué)院 數(shù)理學(xué)院 江蘇 常州 213164)2(福建省信息處理與智能控制重點實驗室(閩江學(xué)院) 福建 福州 350108)
隨著經(jīng)濟生活的快速發(fā)展,水面漂浮物識別在水體污染監(jiān)控以及水面智能清理機器人等方面扮演著更為重要的角色。然而,目前國內(nèi)外對水面漂浮物識別的研究比較少,大部分是采用遙感圖像或信號傳播等技術(shù),實現(xiàn)水體或水上目標識別[1-3]。由于水面環(huán)境的復(fù)雜性和特殊性,水面圖像具有光照影響大、容易被噪聲污染等特點,使得水面圖像識別具有了其自身的特殊性。而在傳統(tǒng)的目標識別中,常用的解決方案是使用各類特征提取方法結(jié)合分類器實現(xiàn)[1,3],雖然這些特征提取方式確實能夠在某些特定的數(shù)據(jù)和任務(wù)中得到良好的識別效果。但這些特征在受到大量噪聲或其他因素干擾等情況下,很難被較好地提取,這樣就會影響到分類器的實現(xiàn)效果,從而無法很好地分類、識別目標。
近年來,深度學(xué)習(xí)成為模式識別領(lǐng)域的新熱點,它允許由多個處理層組成的模型來學(xué)習(xí)具有多個抽象層次的數(shù)據(jù)表示。其概念由Hinton等于2006年提出,現(xiàn)在被廣泛應(yīng)用于計算機視覺、語音識別以及自然語言處理等其他領(lǐng)域[4-6]。自21世紀初以來,卷積神經(jīng)網(wǎng)絡(luò)(ConvNets)[7]已被應(yīng)用于空中物體的圖像識別[8]?;谏疃葘W(xué)習(xí)的水面圖像識別研究較少,其中主要原因可能是深度學(xué)習(xí)在圖像分類中的成功,就在于使用了大量的訓(xùn)練數(shù)據(jù),而水面漂浮物圖像的獲取總是需要大量的人力和成本,這使得獲取大量的樣本圖像變得困難。但不可否認的是,深度學(xué)習(xí)相較于傳統(tǒng)的特征提取方式,可以實現(xiàn)更好的分類、識別效果,也是未來圖像識別領(lǐng)域的發(fā)展方向。
因此,在深度學(xué)習(xí)的基礎(chǔ)上,本文研究了小樣本容量下,水面圖像中漂浮物識別的解決方案,旨在針對水面污染提出一種更有效的污染物識別策略。更具體地說,在攝像機捕捉到的包含漂浮類污染物的普通水面圖像中(主要包括塑料袋與塑料瓶兩種常見污染物),嘗試找到一個有效的簡單框架,來解決水面污染物識別問題。本文提出以現(xiàn)有的AlexNet網(wǎng)絡(luò)[9]為基礎(chǔ),利用公開數(shù)據(jù)集ImageNet[10]以及COCO[11]等收集大量普通塑料袋、塑料瓶圖像進行網(wǎng)絡(luò)預(yù)訓(xùn)練,然后利用梯度下降法進行網(wǎng)絡(luò)微調(diào),最后將訓(xùn)練好的網(wǎng)絡(luò)用于實際采集到的水面污染物圖像識別中。同時,對于待識別的水面圖像,采用直方圖均衡化與對數(shù)變換相結(jié)合的方式,對圖像進行光照不均勻的矯正,在增強圖像整體對比度的同時,提高陰影處的亮度。由于本文目標的紋理特征較為明顯,因此在傳統(tǒng)特征提取方法中,采用HOG特征[12-13]提取方法與本文方法進行對比。實驗結(jié)果表明,網(wǎng)絡(luò)微調(diào)的方法可以有效提高傳統(tǒng)網(wǎng)絡(luò)對小樣本水面漂浮物的識別效果,相較于傳統(tǒng)的特征提取方式具有更高的識別率。另外,光照矯正有效地均勻了圖像亮度,削弱了光照影響。
深度學(xué)習(xí)的概念由Hinton等在2006年提出,源于對人工神經(jīng)網(wǎng)絡(luò)的研究,包含多隱藏層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過組合低層特征實現(xiàn)更加抽象的高層表示屬性類別或特征,以此發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。它是機器學(xué)習(xí)研究中的一個嶄新的領(lǐng)域,在于建立、模擬人腦進行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),模仿人腦的機制來解釋數(shù)據(jù),例如圖像、聲音和文本。
深度學(xué)習(xí)是基于大量數(shù)據(jù)訓(xùn)練實現(xiàn)的,一般情況下,訓(xùn)練數(shù)據(jù)越多,實現(xiàn)效果越好。但是在實際應(yīng)用中,許多特殊領(lǐng)域的圖像采集并不是那么簡單,或者采集過程需要耗費大量的人力物力。因此在這些領(lǐng)域中,基于深度學(xué)習(xí)的研究非常少,通常采用傳統(tǒng)的特征提取方式實現(xiàn)目標分類或識別。然而,隨著深度學(xué)習(xí)在機器視覺中逐漸表現(xiàn)出更多的優(yōu)勢,深度學(xué)習(xí)在這些領(lǐng)域中的應(yīng)用也是一種趨勢。
AlexNet是Alex Krizhevsky在2012年提出的,此后更深的神經(jīng)網(wǎng)絡(luò)被提出,例如vgg,GoogleLeNet以及ResNet[14]等更為復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)。相比傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)例如LetNet來說,AlexNet增添了數(shù)據(jù)增強、Dropout和Relu激活函數(shù),在很大程度上提高了傳統(tǒng)網(wǎng)絡(luò)的分類效果,到目前為止也是比較經(jīng)典且實用的網(wǎng)絡(luò)之一。而相較于更為復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)例如ResNet,AlexNet具有更簡單短小的網(wǎng)絡(luò)層次,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 AlexNet網(wǎng)絡(luò)結(jié)構(gòu)
網(wǎng)絡(luò)中包含了8個有權(quán)重的層,其中前5個是卷積層,剩下的3個是全連接層,最后一個全連接層的輸出給到一個1 000維的softmax,最終給出在1 000個類標簽上的分布。在這種簡單的網(wǎng)絡(luò)架構(gòu)下,AlexNet在一般的分類識別任務(wù)中都有良好的表現(xiàn),且這樣的網(wǎng)絡(luò)結(jié)構(gòu)更適用于小平臺搭載,可以滿足水面清理任務(wù)的分類需求,不需要再采用更加復(fù)雜的網(wǎng)絡(luò)來實現(xiàn)。否則不僅會增加運行的成本,也可能會造成大量過擬合。因此本文以AlexNet為基礎(chǔ)實現(xiàn)對小樣本水面圖像的漂浮污染物識別。
相較于普通圖像,水面圖像具有更易受光照影響的特點,例如水面反射造成部分區(qū)域亮度過高,從而影響識別效果。因此本文采用直方圖均衡化與對數(shù)變換相融合的方法,對水面圖像進行光照不均勻的矯正,然后將矯正后的圖像放入訓(xùn)練好的網(wǎng)絡(luò)中進行識別,在一定程度上提高了對水面漂浮物的識別率。
常用的圖像光照不均勻矯正算法有很多,例如頂(底)帽變換、直方圖均衡化、拉普拉斯算子增強、對數(shù)變換等。其中,頂(底)帽變換通常用于分割算法中的光照矯正,而直方圖均衡化以及對數(shù)變換屬于光照補償算法,可以有效提高圖像的整體亮度和對比度,更適用于本文提出的神經(jīng)網(wǎng)絡(luò)識別方法。
直方圖均衡化是一種常用的光照補償方法,目的是將原始圖像的直方圖轉(zhuǎn)換為均勻分布的形式,以此增加像素灰度值的動態(tài)范圍,從而增強圖像的整體對比度。對于一幅大小為的M×N圖像,假設(shè)該圖像的像素值取值范圍為{0,1,2,…,L-1},圖像中灰度值r出現(xiàn)的概率,即為該圖像的直方圖,計算公式如下:
(1)
式中:M×N為圖像中像素的總數(shù),nr表示該圖像中灰度值為r的像素點個數(shù)。
然后通過變換函數(shù),將原始輸入圖像中灰度值為r的像素映射到輸出圖像中灰度值為S的對應(yīng)像素,變換函數(shù)的計算公式如下:
(2)
直方圖均衡化利用圖像直方圖對對比度進行調(diào)整,提高了圖像中陰暗部分的亮度,但在某些光照惡劣的圖像中表現(xiàn)不佳,容易出現(xiàn)對比度過于強烈的情況。
對數(shù)變換也是圖像增強的一種常見方法,目的在于將輸入圖像中較窄的低灰度值映射到輸出圖像較寬的灰度值,對輸入圖像中灰度值的對數(shù)變換公式如下:
Gr=c×log(r+1)
(3)
式中:c是常數(shù),通常取值為c=255/log(256),且底數(shù)通常默認為e,對數(shù)變換公式即為:
Gr=c×ln(r+1)
(4)
由于對數(shù)曲線在像素值較低的區(qū)域斜率較大,在像素值較高的區(qū)域斜率較小,因此圖像經(jīng)過對數(shù)變換后,較暗區(qū)域的對比度將有所提升,以此增強圖像的暗部細節(jié),但也存在處理后的圖像邊緣模糊的問題。
將圖像進行直方圖均衡化可以有效減弱光照影響,此時圖像整體對比度明顯增強,整體亮度提高,但在光照惡劣的情況下,其實現(xiàn)效果并不理想。而對數(shù)變換處理后的圖像較為柔和,但其缺點在于容易出現(xiàn)邊緣不清晰的問題。針對兩種算法的優(yōu)缺點,本文提出將直方圖均衡化與對數(shù)變換處理后的圖像,以加權(quán)融合的方式進行合并處理,變換如下:
f′(x,y)=m×S(x,y)+(1-m)×G(x,y)
(5)
式中:S(x,y)與G(x,y)分別為直方圖均衡化以及對數(shù)變換處理后的圖像,m(0≤m≤1)為比例權(quán)值,通過m調(diào)整融合效果。
對于權(quán)值m的選擇,采用類似大律法中的最大(小)類間方差法,計算圖像的整體灰度方差,取使得灰度方差最小的m為最終權(quán)值選擇。首先取權(quán)值為m,然后對兩種方法的處理圖像進行加權(quán)融合,計算融合后圖像的整體平均灰度μ,公式如下:
(6)
則圖像的整體灰度方差g的計算公式如下:
(7)
當方差g最小時,即可認為此時圖像的平均差異最小,即最佳權(quán)值m2的判別式為:
m*=Argmin(g) 0≤m≤1
(8)
一個卷積神經(jīng)網(wǎng)絡(luò)通常有數(shù)百萬的連接和權(quán)重,盡管可以利用現(xiàn)有的連接和共享的權(quán)重,仍有大量的權(quán)重需要訓(xùn)練。當將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于一個大型數(shù)據(jù)集時,它們通常會取得很好的效果,然而在實際應(yīng)用中發(fā)現(xiàn),在小樣本容量的情況下,網(wǎng)絡(luò)對于訓(xùn)練集的精度高,對測試集的效果不佳。對水面圖像中的漂浮物識別任務(wù)來說,一個實際的問題是如何獲得足夠的樣本圖像來訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。在深度信念網(wǎng)絡(luò)(DBN)[14-15]的訓(xùn)練過程的啟發(fā)下,本文提出了一種在小樣本容量情況下,基于深度學(xué)習(xí)的水面圖像中漂浮污染物識別的解決方案,具體來說是利用一組較少的水面漂浮物圖像解決水面污染物的識別分類問題。
本文提出在小樣本容量的情況下,水面漂浮污染物的識別過程主要分為三個階段:
1) 第一個階段是用一個比較大的圖像數(shù)據(jù)集來預(yù)訓(xùn)練一個卷積神經(jīng)網(wǎng)絡(luò)(CNN)。卷積神經(jīng)網(wǎng)絡(luò)不僅是一個分類器,而且是一個特征提取器,網(wǎng)絡(luò)的隱藏層會以一種便于預(yù)測目標輸出的方式來表示網(wǎng)絡(luò)的輸入。當一個卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練階段完成后,預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)將對圖像的顏色、紋理和邊緣等信息敏感。同時自然圖像具有一定的共性,因此用不同于與我們期望識別的圖像預(yù)先訓(xùn)練一個卷積神經(jīng)網(wǎng)絡(luò)是合理的。ImageNet數(shù)據(jù)集為我們提供了這樣一個可供選擇的大型圖像數(shù)據(jù)集,它有超過1 500萬的高分辨率圖像,這些圖像屬于大約22 000個類別,同時網(wǎng)絡(luò)爬蟲技術(shù)也同樣可以提供大量高質(zhì)量圖像,這為卷積神經(jīng)網(wǎng)絡(luò)的預(yù)訓(xùn)練提供了數(shù)據(jù)支持。
2) 第二階段是用我們所擁有的小樣本圖像對預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)進行微調(diào)。多層次的網(wǎng)絡(luò)結(jié)構(gòu)可以通過隨機梯度下降法進行進一步訓(xùn)練,而圖像標簽中非常有限的信息將會被用來微調(diào)預(yù)訓(xùn)練中得到的權(quán)重。
3) 最后一個階段是測試訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)的性能。如果卷積網(wǎng)絡(luò)的精度滿足應(yīng)用要求,則可用于圖像識別。
微調(diào)網(wǎng)絡(luò)階段,本文采用隨機梯度下降SGD(Stochastic gradient descent)法進行參數(shù)更新。傳統(tǒng)的批量梯度下降,將計算整個數(shù)據(jù)集梯度,但僅進行一次更新,因此處理速度很慢且容易導(dǎo)致內(nèi)存溢出。而隨機梯度下降算法每次只隨機選擇一個樣本來更新模型參數(shù),因此學(xué)習(xí)速度很快且可以進行在線更新。
對于包含N個訓(xùn)練樣本的樣本集,采用梯度下降法更新網(wǎng)絡(luò)參數(shù),每層的參數(shù)w(i)和b(i)的計算公式分別如下:
(9)
(10)
式中:N代表輸入的樣本容量,ρ為學(xué)習(xí)率,o(i)表示輸入x(i)對應(yīng)的實際輸出,y(i)代表第i組數(shù)據(jù)對應(yīng)的類別標記,y(i)∈{1,2,…,k},k是樣本的類別數(shù)目。
通過梯度下降法更新網(wǎng)絡(luò)參數(shù),使得網(wǎng)絡(luò)的輸出層誤差函數(shù)值達到最小,從而對網(wǎng)絡(luò)實現(xiàn)微調(diào),使網(wǎng)絡(luò)適用于小樣本容量情況下的目標識別。
本文所用的實驗數(shù)據(jù)來源于網(wǎng)絡(luò)的公開數(shù)據(jù)集ImageNet、COCO數(shù)據(jù)集以及利用網(wǎng)絡(luò)爬蟲技術(shù)從網(wǎng)上得到的實驗圖像。所收集的圖像數(shù)據(jù)包括普通的塑料袋、塑料瓶圖像以及水面漂浮物圖像,在網(wǎng)絡(luò)訓(xùn)練之前先對圖像做歸一化處理,圖像數(shù)據(jù)類型包括4種,如圖2所示,數(shù)據(jù)集統(tǒng)計如表1所示。
(a) 普通塑料瓶 (b) 普通塑料袋 (c) 水面塑料袋 (d) 水面塑料瓶圖2 圖像數(shù)據(jù)類型
在實驗中,本文利用VS 2015軟件進行圖像的光照矯正,在OpenCV環(huán)境中分別采用直方圖均衡化與對數(shù)變換對輸入圖像進行處理,并將矯正結(jié)果與融合圖像進行對比,對比結(jié)果如圖3、圖4所示。圖3、圖4中的原圖均為包含水面漂浮物的圖像,圖3中原圖像在光照較好時,受水面反射的影響,包含一部分亮度較高的區(qū)域以及一部分亮度較低的區(qū)域,而圖4中原圖則由于光照不佳,整體較暗。
(a) 原圖 (b) 直方圖均衡化
(c) 對數(shù)變換 (d) 融合圖像圖3 光照矯正1
(a) 原圖 (b) 直方圖均衡化
(c) 對數(shù)變換 (d) 融合圖像圖4 光照矯正2
從圖3中可以看出,對于包含部分高亮度區(qū)域的圖像,融合后的圖像對暗部區(qū)域進行了亮度提高,同時也保留了高亮度區(qū)域的目標細節(jié)。相較于對數(shù)變換融合后圖像的物體輪廓更清晰,而對比直方圖均衡化的實現(xiàn)結(jié)果,融合圖像的暗部區(qū)域具有更高的亮度和清晰度。
對整體較暗的圖4,融合后的圖像提高了圖像的整體亮度,使得圖像細節(jié)更加清晰。對比直方圖均衡化的結(jié)果,暗區(qū)域細節(jié)更加明顯,對比對數(shù)變換保留了更多邊緣信息。
從兩種實驗圖像的對比結(jié)果來看,融合圖像在均勻圖像亮度的同時,也提高了圖像對比度,同時相較于兩種常用的光照矯正算法,保留了更多的細節(jié)信息,實現(xiàn)了更接近于真實圖像的光照矯正結(jié)果。將融合后的圖像放入訓(xùn)練好的網(wǎng)絡(luò)中進行識別,可以有效去除水面反射造成的光照影響。
利用自然信號的特性,卷積網(wǎng)絡(luò)中有四個關(guān)鍵的概念:局部連接、共享權(quán)重、池化和多層網(wǎng)絡(luò)。本文在實驗中采用了經(jīng)典的AlexNet網(wǎng)絡(luò),每個卷積層的權(quán)值都由一個零均值高斯分布初始化,其標準差是0.01,網(wǎng)絡(luò)訓(xùn)練參數(shù)見表2。
表2 網(wǎng)絡(luò)訓(xùn)練參數(shù)
4.3.1 樣本量與迭代次數(shù)
實驗中對網(wǎng)絡(luò)的訓(xùn)練分為兩個階段,第一個階段分批量測試,檢驗訓(xùn)練樣本數(shù)量對網(wǎng)絡(luò)識別率的影響,選擇最佳樣本量。網(wǎng)絡(luò)采用不同樣本量的數(shù)據(jù)集進行訓(xùn)練,根據(jù)已有訓(xùn)練集的數(shù)據(jù)量取670為基數(shù),其中按普通圖像:水面圖像=60∶7的比例,取其5、10、15、20倍的樣本量分別進行網(wǎng)絡(luò)訓(xùn)練,不同樣本量下的識別率如圖5所示。
圖5 不同訓(xùn)練樣本量的識別率
從實驗結(jié)果中可以看出,隨著樣本容量的增加,網(wǎng)絡(luò)的識別率逐漸上升,并且當樣本容量達到10 050時已基本趨于平穩(wěn),此時網(wǎng)絡(luò)達到收斂狀態(tài)。另外,網(wǎng)絡(luò)在最大樣本量情況下識別率略有提高,達到96.66%,因此之后的對比實驗均選擇采用已有的樣本量進行網(wǎng)絡(luò)訓(xùn)練,并且對樣本量不必要再做增加。
網(wǎng)絡(luò)訓(xùn)練的第二個階段,采用第一階段中的樣本容量,并分別采用不同的迭代次數(shù)進行網(wǎng)絡(luò)訓(xùn)練,分別取Epochs為5、10、15、20、25、30,識別結(jié)果如圖6所示。
從圖中可以看出,隨著迭代次數(shù)的增加,識別率顯著提高,當?shù)螖?shù)達到20個Epochs(大約2 000次迭代)時基本穩(wěn)定,在25個Epochs時略有提高,因此在之后的對比實驗中選擇迭代次數(shù)為25個Epochs。
網(wǎng)絡(luò)訓(xùn)練階段對應(yīng)的損失函數(shù)的輸出值(Loss)和預(yù)測值(Accurcay) 變化分別如圖7和圖8所示。
圖8 網(wǎng)絡(luò)的訓(xùn)練精度
從圖中可以看出,訓(xùn)練損失急劇下降,在第25個Epochs(大約2 500次迭代)后趨向于0。而訓(xùn)練精度在最初的20個Epochs中,驗證集的準確性迅速上升,并且在大約2 500次迭代后趨向于平穩(wěn)。
4.3.2 對比實驗
在第一組對比實驗中,采用沒有微調(diào)的傳統(tǒng)網(wǎng)絡(luò)分別對測試集中的普通圖像與水面圖像進行測試,判斷傳統(tǒng)方法是否適用于此類小樣本水面圖像的識別。測試中發(fā)現(xiàn),傳統(tǒng)網(wǎng)絡(luò)對普通圖像達到了98.75%的識別率,而對水面塑料瓶的識別效果最差僅為46.67%,統(tǒng)計結(jié)果如表3所示。
表3 對不同類別圖像的識別率 %
分析原因可能是由于普通圖像中的塑料瓶均為垂直方向,而水面圖像中大部分為水平或傾斜角度,因此接下來分別采用單垂直方向、單水平方向以及兩者結(jié)合的三種普通塑料瓶數(shù)據(jù)集重新進行網(wǎng)絡(luò)預(yù)訓(xùn)練。
另外,從統(tǒng)計表3中傳統(tǒng)網(wǎng)絡(luò)對水面圖像的識別率也可以看出,傳統(tǒng)方法的確不太適用于小樣本的識別。同時考慮到水面圖像可能存在的噪聲影響,在測試中對兩個方向相結(jié)合的實驗組,采用中值濾波去噪后的水面圖像進行識別測試,對比測試結(jié)果判斷是否需要對待識別圖像進行去噪處理。
第二組對比實驗中,采用不同方向的圖像訓(xùn)練傳統(tǒng)網(wǎng)絡(luò)并進行對比,同時將濾波處理后的識別結(jié)果與未處理的識別結(jié)果進行對比,判斷是否需要對待識別圖像進行去噪處理,統(tǒng)計實驗中的測試結(jié)果如表4所示。
表4 傳統(tǒng)網(wǎng)絡(luò)識別效果 %
從測試結(jié)果中可以看出,對于水面塑料瓶的識別,將兩個方向的圖像相結(jié)合進行訓(xùn)練效果更好,因此對于微調(diào)網(wǎng)絡(luò)選擇采用兩個方向結(jié)合的方式進行訓(xùn)練。另外可以看出,加入濾波去噪對水面塑料袋的識別有略微提高,但同時也降低了對塑料瓶的識別率。因此,濾波去噪對提高網(wǎng)絡(luò)的識別精度并沒有太大的幫助,反而有可能會影響識別效果,因此在后面的實驗中不再對待識別圖像進行濾波處理。
在第三組對比實驗中,采用兩個方向相結(jié)合的圖像分別訓(xùn)練傳統(tǒng)網(wǎng)絡(luò)與微調(diào)網(wǎng)絡(luò),分別采用普通圖像和水面圖像對兩種方法訓(xùn)練的網(wǎng)絡(luò)進行測試,統(tǒng)計并記錄實驗結(jié)果進行對比,見表5。
表5 不同網(wǎng)絡(luò)的識別率對比 %
從表5的對比結(jié)果中可以看出,在對水面漂浮物的識別中,本文提出的小樣本訓(xùn)練策略得到了更好的識別效果。同時在實驗中發(fā)現(xiàn),網(wǎng)絡(luò)在第25次迭代時已經(jīng)得到了較好的效果,在更多次數(shù)的迭代時,出現(xiàn)了驗證集精度高于測試集精度的現(xiàn)象,符合網(wǎng)絡(luò)訓(xùn)練時的收斂特性??傮w來說,通過多次的對比實驗證明了本文提出的訓(xùn)練策略對小樣本容量情況下的圖像識別是有效的。
第四組對比實驗中,首先采用前述的光照矯正方法處理待識別圖像,再將矯正后的圖像放入訓(xùn)練好的微調(diào)網(wǎng)絡(luò)進行識別,并將識別結(jié)果與未矯正實驗以及傳統(tǒng)的特征提取方法進行對比。由于塑料袋與塑料瓶的邊緣特征更為明顯,因此實驗中參考文獻中采用的傳統(tǒng)HOG特征提取分類與本文方法進行對比,實驗的對比結(jié)果如表6所示。
表6 光照矯正算法及識別率對比 %
從統(tǒng)計表6中可以看出,光照矯正對于水面圖像的識別有一定的積極作用,在一定程度上提高了網(wǎng)絡(luò)對水面圖像的識別率。另外,普通圖像不需要光照矯正,因此未做光照矯正的對比實驗。同時,將矯正后的微調(diào)網(wǎng)絡(luò)法與傳統(tǒng)的HOG特征提取方法對比,可以看到微調(diào)網(wǎng)絡(luò)提高了近15%的識別率,表明本文的網(wǎng)絡(luò)微調(diào)方法適用于小樣本情況下的水面漂浮物識別。
本文針對水面漂浮污染物的識別問題,提出了基于深度學(xué)習(xí)的小樣本學(xué)習(xí)策略,首先用大量相關(guān)樣本預(yù)訓(xùn)練網(wǎng)絡(luò),然后對小樣本利用梯度下降法微調(diào)網(wǎng)絡(luò),同時將直方圖均衡化法以及對數(shù)變換法兩種傳統(tǒng)的光照矯正算法相結(jié)合,對兩者的處理圖像進行加權(quán)融合,減弱待識別圖像中的光照影響。通過多組對比實驗表明,該學(xué)習(xí)策略在水面漂浮物污染物識別問題上取得了較好的效果,其識別準確率明顯優(yōu)于傳統(tǒng)的HOG特征提取分類方法。然而水面污染物種類很多,而本文僅以兩種常見的水面污染物為例實現(xiàn)小樣本學(xué)習(xí)策略的對比實驗。因此在以后的研究中,將對更多類型的污染物進行分類識別研究,以便于部署到水面清理機器人中,為水面環(huán)境的智能監(jiān)控清理提供一種便捷有效的方法。