錢嵩橙,董博文,樊繼午,牛曌,蔣欣洳,方智
摘要: 由于垃圾種類較多,顏色與形狀差異大,選用人工分揀垃圾分類存在著非常大的困難,勞動力不足,工作量大,缺乏精準(zhǔn)度。文章以MobileNet-V3small網(wǎng)絡(luò)算法為基礎(chǔ),對垃圾圖像進(jìn)行準(zhǔn)確識別和分類,達(dá)到速度快、準(zhǔn)確度高,借助CNN模型進(jìn)行光譜特征分析并分類。通過自動化分揀垃圾,實(shí)現(xiàn)垃圾分類,大大降低了人工投入量,提高垃圾分類效率。
關(guān)鍵詞:垃圾;分類;MobileNet-V3;CNN
中圖分類號:TP18? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2022)35-0014-02
伴隨中國經(jīng)濟(jì)社會的發(fā)展,人們?nèi)粘I钯|(zhì)量的提高,以及城鎮(zhèn)化的迅速深化,生活垃圾生產(chǎn)量持續(xù)推高,全球已經(jīng)面臨垃圾危機(jī)[1]。在我國當(dāng)前城市建設(shè)中,目前城建基本定型,其中垃圾中轉(zhuǎn)站的建設(shè)也會對環(huán)境產(chǎn)生污染,所以垃圾分類的實(shí)施不容樂觀。在我國,垃圾分類還存在類別不夠細(xì)致、標(biāo)準(zhǔn)不夠清晰,居民的相關(guān)分類知識缺乏。因此,自動化智能化的分揀設(shè)備被逐漸運(yùn)用在垃圾分類工作中。
另外,由于城市生活廢棄物中大多是廢棄物和廢物,因此人工分類也是廢棄物分類中必不可少的關(guān)鍵環(huán)節(jié),有利于篩選無法使用傳統(tǒng)手段篩選的廢棄物以及對廢棄物實(shí)施質(zhì)量管理。但是,進(jìn)行人工垃圾分類將面臨工程量大、工作勞動強(qiáng)度大、分類效率低下和工作環(huán)境較差的問題,因此,亟須以智能、信息化的分類方式代替?zhèn)鹘y(tǒng)分揀方式。本課題采用基于MobileNet-V3與CNN的深度學(xué)習(xí)分類模型。該模型將常見垃圾分成四種:其中包含可利用垃圾、危險垃圾、廚余廢物和一些其他垃圾。該模型將Mobilenet-V3 small網(wǎng)絡(luò)算法為基礎(chǔ)(主要設(shè)計載體),并使用新搭建的CNN模塊對數(shù)據(jù)集的光譜特征提取垃圾分析和計算,實(shí)現(xiàn)對垃圾目標(biāo)的識別進(jìn)行分類。
1 算法設(shè)計
在本次的實(shí)驗(yàn)中,模型的調(diào)用中通過搜集垃圾圖片進(jìn)行整合,每一組圖片里有且只有一種垃圾的一個圖片,照片的格式統(tǒng)一為jpg,標(biāo)簽格式為txt,在此過程中始終保持兩者為一一對應(yīng)的關(guān)系,由于采用的垃圾照片是隨機(jī)的,光線、尺寸、大小、對比度等不盡相同,其內(nèi)部數(shù)據(jù)也很復(fù)雜多亂,所以更加符合平時垃圾識別的標(biāo)準(zhǔn),貼切我們的生活實(shí)際情況。在進(jìn)一步整合之后,添加數(shù)據(jù)集標(biāo)簽,將垃圾種類分為數(shù)類,一個數(shù)字對應(yīng)一個標(biāo)簽即一個類別。
根據(jù)實(shí)驗(yàn)要求,為了合理精準(zhǔn)分類出實(shí)驗(yàn)所需垃圾圖像。采用以MobileNet-V3 small網(wǎng)絡(luò)算法為基礎(chǔ)(此計算為本次實(shí)驗(yàn)的主要設(shè)計載體),而在此基礎(chǔ)上優(yōu)化該算法,采用CNN來進(jìn)一步準(zhǔn)確提高垃圾分類的效率。CNN 是通過模擬生物神經(jīng)系統(tǒng)進(jìn)行特殊設(shè)計的一種網(wǎng)絡(luò)模型,在圖像特征提取的過程中不需要人工思考具體特征,其局部鏈接和權(quán)重共享的特性在二維圖像處理上有著明顯優(yōu)越性,可以直接作用于圖像的像素位置,因此人們能夠使用該網(wǎng)絡(luò)對輸入的垃圾像素進(jìn)行獲取特性,完成了對垃圾目標(biāo)的鑒別和分類。其中,CNN一般包含的內(nèi)容塊有最大注入層、卷積層、最大池化層,全連接層和最大輸出層等,而其要使用的基礎(chǔ)模塊則為最大卷積層(用來獲取特征)和最大池化層(用來采樣并不會破壞識別結(jié)構(gòu)),對垃圾進(jìn)行初步識別分類。
最后,將已實(shí)現(xiàn)精準(zhǔn)分類的圖像輸入MobileNet-V3 small網(wǎng)絡(luò),并使用分組卷積減少了網(wǎng)絡(luò)的計算工作量,同時MobileNet也將分組卷積技術(shù)應(yīng)用至極致,即網(wǎng)絡(luò)的分組數(shù)量和網(wǎng)絡(luò)的channel數(shù)量相當(dāng),從而將網(wǎng)站的計算量減少至最小化,并且使用NetAdap技術(shù)可以在計算與參量均受限的條件下,實(shí)現(xiàn)對不同網(wǎng)絡(luò)模塊的查詢,將搜索到的完整網(wǎng)絡(luò)模塊進(jìn)一步輸入platform-aware NAS中,從而進(jìn)一步微調(diào),在確保精度的前提下大大提高了效率,得到所需的分類結(jié)果。
2 算法模型
2.1 CNN模型
CNN是一個具有卷積構(gòu)造的深度神經(jīng)網(wǎng)絡(luò)。CNN模型的使用能夠在保證一定精度的前提下進(jìn)行高效、迅速地處理二維圖像[2]。CNN的出現(xiàn),代替了常規(guī)全連接神經(jīng)網(wǎng)絡(luò)中的矩陣加減法運(yùn)算,其優(yōu)點(diǎn)就是在GPU的并行計算能力下,還能有很大的運(yùn)算效能,最經(jīng)典的CNN包括輸入與輸出層、卷積運(yùn)算層、池化層,全連接層與輸入輸出層等,實(shí)現(xiàn)了提取圖形特征功能的內(nèi)核模塊為卷積層和池化層[3]。
卷積層與池化層可以將被提取圖像的特征進(jìn)行從淺到深進(jìn)行剖析,使原有的特征細(xì)節(jié)變得更加具體。在卷積運(yùn)算的過程中,若在核維度為x的圖像里,要使上層網(wǎng)絡(luò)的m-1的輸出值<E:\2022知網(wǎng)文件\35\1xs202235\Image\image3.pdf>輸入下層的m中,此過程的計算公式為[4]:
[Zmx=g(lmx?zm-1+amx)]? ? ? ? ? ? ? ? ?(1)
其中:[Zmx]代表在上一層卷積運(yùn)算中,核維度為x的特征圖,[lmx]代表第m層維度為x的權(quán)向量,[amx]代表第m層且維度為x的偏置單元,運(yùn)算符[?]代表本次卷積運(yùn)算的操作,g(y)為非線性的激勵函數(shù)。
在經(jīng)過卷積層的運(yùn)算后,需要提取的特征圖像會在池化層中進(jìn)行卷積特征降維,其目的在于簡化運(yùn)算,并對特征進(jìn)一步具體化,從而提取出更加典型的特征。
在本次實(shí)驗(yàn)中共運(yùn)用四層CNN模型,先將圖片中的數(shù)據(jù)輸入輸入層中,其目的是保存圖片本身的結(jié)構(gòu)。緊接著通過卷積層濾波的處理進(jìn)入卷積層中,使用卷積核進(jìn)行特征提取和特征映射,同時利用卷積層處理公式進(jìn)行特征處理,使每一個卷積層中的神經(jīng)元是都對應(yīng)一個權(quán)重。當(dāng)輸入進(jìn)入池化層時,池化層中的“池化視野(filter)”會對輸入的數(shù)據(jù)進(jìn)行掃描、計算,進(jìn)一步進(jìn)行卷積特征降維。再CNN模型尾部的全連接層主要對輸入的特征進(jìn)行重新整合,避免特征信息的丟失。最后則由輸出層輸出初步的分類結(jié)果。
2.2 Mobilenet-v3 模型
在深度學(xué)習(xí)的過程中,使用輕量級網(wǎng)絡(luò)的優(yōu)勢在于模型參數(shù)少、計算量小、測試速度更快,且適用于存儲空間和功耗受限的場景。而縮小模型的參數(shù)量一直是科研人員的研究努力方向,MobileNet-v1、MobileNet-v2便是其中的佼佼者。而本實(shí)驗(yàn)中就使用了結(jié)合二者之間優(yōu)點(diǎn)的生物識別網(wǎng)絡(luò)MobileNet-v3。MobileNet-v3的獨(dú)特創(chuàng)新的地方在于采用了互補(bǔ)搜索技術(shù)結(jié)構(gòu):即在同一網(wǎng)絡(luò)結(jié)構(gòu)中,它可以通過順序的原則對每一層進(jìn)行微小調(diào)整,而不是通過試圖推斷出不精確但整體的體系結(jié)構(gòu),同時調(diào)用NetAdapt技術(shù)和platform-aware NAS方法。其中,NetAdapt的普遍應(yīng)用特點(diǎn)就是能夠在計算時間和參量均受限的條件下完成對各個互聯(lián)網(wǎng)模型的查找,使擴(kuò)展層使用濾波器的數(shù)量達(dá)到最佳,并且瓶頸層輸出的通道數(shù)量也為最佳輸出,NAS主要是在查找并確定模塊之后完成對互聯(lián)網(wǎng)層的微調(diào)。在MobileNetV2模型中反轉(zhuǎn)殘余的誤差結(jié)構(gòu)和變量[5],采取了1*1卷積算法構(gòu)造,以便拓展到更高維的特征空間中,而其缺陷則是帶來了巨大運(yùn)算費(fèi)用和延遲。同時,為在保持低維數(shù)約減特性圖的前提下減少延遲,可以將平均池化前的層刪除并采取1*1逐點(diǎn)卷積來完成特征圖。特征生成層被刪除后,先前作為瓶頸映射的層不再要求。MobileNet-v3是繼承了MobileNet-v1與MobileNet-v2的優(yōu)點(diǎn)且重在提高精度與檢測速度方面。MobileNet-v3集現(xiàn)有MobileNet-v1與MobileNet-v2思想于一體,其中最為關(guān)鍵是使用分段線性函數(shù)模擬sigmoid函數(shù)激發(fā)變量swish進(jìn)行數(shù)值逼近的h-swish觸發(fā)變量,如公式(2)所示:
[h-swish[x]=x[ReLU6(x+3)]/6]? ? ? ? ? (2)
隨著模型參數(shù)的不斷縮小,應(yīng)用非線性激活函數(shù)的成本逐漸降低。Sigmoid不便于保持?jǐn)?shù)據(jù)的準(zhǔn)確性需要煩雜的計算過程,其中,采用新的激活函數(shù)h-swish,在確保精度的前提下,也具有諸多的優(yōu)勢,最重要的是實(shí)現(xiàn)了ReLU6的優(yōu)化且能在量化模式下,減少誤差、提高精度的同時,也能極大提升速度,這些修改超過了當(dāng)前的空間搜索范圍。
當(dāng)然,使用h-swish還會帶來一定部分的延遲,但是量化版的h-swish能夠帶來精度的提升是值得的,在具體實(shí)驗(yàn)中,還可以進(jìn)一步進(jìn)行軟件優(yōu)化,在實(shí)際計算時,可以減少對內(nèi)存的訪問開銷。
3 結(jié)束語
傳統(tǒng)的人工垃圾分類方法已經(jīng)不足以處理人們生活中產(chǎn)生的垃圾,工作量大、工作強(qiáng)度高、分類效率低等問題亟待解決。基于MobileNet-V3和CNN的深度學(xué)習(xí)分類模型對垃圾圖像分類進(jìn)行研究,根據(jù)算法提取圖像特征,采用以MobileNet-v3網(wǎng)絡(luò)算法為基礎(chǔ),同時優(yōu)化此算法,并用CNN和特征優(yōu)選實(shí)現(xiàn)對垃圾目標(biāo)的識別,提高垃圾分類的效率,并得出以下結(jié)論:
CNN可將大量參數(shù)降維成少量參數(shù),將大數(shù)據(jù)量的圖片降維成小數(shù)據(jù)。通過搭建CNN模型對數(shù)據(jù)進(jìn)行光譜特征分析實(shí)現(xiàn)初步垃圾分類與制圖。
MobileNet-V3具備互補(bǔ)搜索技術(shù)方式的優(yōu)點(diǎn),采用了NetAdapt和platform-aware NAS兩個網(wǎng)絡(luò)結(jié)構(gòu)技術(shù)方法,可以在時間和參量的限制下查找網(wǎng)絡(luò)模塊,并微調(diào)網(wǎng)絡(luò)層。
本文通過基于CNN算法和MobileNet-V3算法的結(jié)合,對垃圾數(shù)據(jù)集以及圖像的處理進(jìn)行實(shí)驗(yàn),并利用擴(kuò)充垃圾指數(shù)等新特性,以增強(qiáng)輸入信號的時效性,并優(yōu)化了基于CNN的垃圾分析和制圖的技術(shù),是今后科研今后的主要工作方向。在將輸入的特征維度擴(kuò)展后,便可深入分析研究網(wǎng)絡(luò)層次、參數(shù)對分類過程的作用,從而全面發(fā)掘CNN和MobileNet-V3的技術(shù)優(yōu)點(diǎn),以獲取表現(xiàn)更優(yōu)的模型。
參考文獻(xiàn):
[1] 呂君,翟曉穎.基于橫向視角的垃圾回收處理體系的國際比較研究及啟示[J].生態(tài)經(jīng)濟(jì),2015,31(12):102-106.
[2] Li E Z,Xia J S,Du P J,et al.Integrating multilayer features of convolutional neural networks for remote sensing scene classification[J].IEEE Transactions on Geoscience and Remote Sensing,2017,55(10):5653-5665.
[3] Hinton G E,Salakhutdinov R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
[4] 劉戈,姜小光,唐伯惠.特征優(yōu)選與卷積神經(jīng)網(wǎng)絡(luò)在農(nóng)作物精細(xì)分類中的應(yīng)用研究[J].地球信息科學(xué)學(xué)報,2021,23(6):1071-1081.
[5] Shi C P,Xia R Y,Wang L G.A novel multi-branch channel expansion network for garbage image classification[J].IEEE Access,8:154436-154452.
【通聯(lián)編輯:唐一東】