• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      目標(biāo)識(shí)別算法綜述

      2019-01-23 09:42:58尉震行
      中國設(shè)備工程 2019年1期
      關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò)蘋果

      尉震行

      (遼寧 大連 116000)

      隨著計(jì)算機(jī)科學(xué)與人工智能的不斷發(fā)展,人們對于目標(biāo)檢測識(shí)別的關(guān)注度已愈來愈高。目標(biāo)檢測的任務(wù)主要是將我們不關(guān)心的背景去除,去除背景的過程可以采用一系列的算法,之后提取出我們關(guān)心的目標(biāo)。

      目標(biāo)檢測是基于計(jì)算機(jī)視覺與圖像處理,模式識(shí)別,機(jī)器學(xué)習(xí),深度學(xué)習(xí)等眾多學(xué)科交叉的一門研究課題。本文首先對目標(biāo)檢測的硬件系統(tǒng)做了總結(jié)分析,之后對于目標(biāo)識(shí)別的傳統(tǒng)算法做了研究與比較,最后對深度學(xué)習(xí)在目標(biāo)識(shí)別領(lǐng)域的一些方法進(jìn)行了研究,并與傳統(tǒng)方法做了對比,對未來的計(jì)算機(jī)視覺和目標(biāo)檢測的發(fā)展趨勢做了一些展望。

      1 傳統(tǒng)的目標(biāo)檢測算法

      傳統(tǒng)的方法中,圖像在計(jì)算機(jī)當(dāng)中可以用函數(shù)來定義,函數(shù)的基本表達(dá)為f(x,y)。函數(shù)值代表像素的灰度。

      1.1 傳統(tǒng)方法特征選擇過程

      特征的選擇是傳統(tǒng)算法中最重要的部分,特征包含顏色特征、紋理特征、形狀特征等等。針對以顏色為主要特征的目標(biāo)檢測應(yīng)用場景中,一般目標(biāo)與背景有較大的顏色差異,我們可以選擇合適的顏色空間來將背景和目標(biāo)進(jìn)行分離,從而完成目標(biāo)的檢測。常用的顏色空間有:RGB、HIS、Lab等等。RGB顏色空間即紅綠藍(lán)三色空間,R代表紅色、G代表綠色、B代表藍(lán)色。HIS空間也有三個(gè)通道分量,H代表色調(diào)、I代表亮度、S代表飽和度,這種顏色空間的一大特點(diǎn)就是接近于人的感知。紋理是對圖象的象素灰度級在空間上的分布模式的描述,反映物品的質(zhì)地,如粗糙度、光滑性、顆粒度、隨機(jī)性和規(guī)范性等。當(dāng)圖象中大量出現(xiàn)同樣的或差不多的基本圖象元素(模式)時(shí),紋理分析是研究這類圖象的最重要的手段之一。此外分析方法也十分重要,針對以紋理為主要特征的場景中,描述一塊圖象區(qū)域的紋理有三種主要的方法,統(tǒng)計(jì)分析方法、結(jié)構(gòu)分析方法和頻譜分析方法。

      1.2 傳統(tǒng)視覺算法其余重要過程

      在采集到圖像之后,圖像往往會(huì)由于電子器件或者傳輸干擾產(chǎn)生一些噪聲,噪聲點(diǎn)過多會(huì)影響我們后續(xù)的處理操作,所以需要將噪聲去除,去除噪聲的方法有很多種,最常用的有兩種:第一種方法,中值濾波法,中值濾波法即是將圖像濾波器當(dāng)中的像素值由低到高依次排列,取出中位值,用中位值代替其他位置的像素值,一般來說濾波器的尺寸可以選為3×3濾波器或者5×5濾波器。第二種方法平均濾波法,平均濾波法即是將圖像濾波器當(dāng)中的像素值平均化處理,取出平均值,用平均值代替其他位置的像素值。在選擇完顏色空間之后,我們的目的是將目標(biāo)和背景進(jìn)行分離,需要用到分割算法。常用的分割算法有固定閾值法、顏色聚類法、自動(dòng)閾值法等等。固定閾值法主要是通過人為的設(shè)定分割閾值,大于閾值的為背景或目標(biāo),其余的為目標(biāo)或背景,這樣目標(biāo)和背景便能夠根據(jù)此值進(jìn)行分離。顏色聚類法主要是通過讓不同的顏色聚為不同的類別,從而將目標(biāo)與背景進(jìn)行分離。自動(dòng)閾值法主要是通過計(jì)算機(jī)自動(dòng)對圖像當(dāng)中的情況設(shè)定閾值,閾值可能會(huì)根據(jù)圖像的不同而不同,這樣設(shè)定的閾值更加合理,從而將目標(biāo)和背景進(jìn)行分離。

      在分割之后,往往有兩類誤差點(diǎn):第一類誤差點(diǎn)是目標(biāo)點(diǎn)被錯(cuò)誤的分類成背景點(diǎn)、第二類誤差點(diǎn)是背景點(diǎn)被錯(cuò)誤的分為目標(biāo)點(diǎn)。針對這兩種誤差,需要進(jìn)行分割圖像后處理操作。后處理過程一般為形態(tài)學(xué)處理過程,主要包括腐蝕過程和膨脹過程,腐蝕過程能夠去除一些很小的孤立點(diǎn),主要執(zhí)行的操作是目標(biāo)邊界的收縮,膨脹過程能夠去除一些目標(biāo)內(nèi)部的孔洞,主要執(zhí)行的操作是目標(biāo)邊界的向外擴(kuò)張。通過這兩種方法,一般能夠?qū)⒄`差點(diǎn)去除,從而達(dá)到很好的分割效果。在后處理之后,往往目標(biāo)已經(jīng)能夠清晰的呈現(xiàn)在眼前,這時(shí)候需要用矩形或者圓形將目標(biāo)進(jìn)行擬合,顯示出識(shí)別結(jié)果,例如在對圓形形狀的物體進(jìn)行識(shí)別的時(shí)候,往往會(huì)采用霍夫變換的方法來擬合圓形,霍夫變換最早是用來檢測直線的,用的原理是統(tǒng)計(jì)原理,即霍夫變換對組成直線的兩個(gè)像素點(diǎn)進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)數(shù)最高的直線便是目標(biāo)直線。之后霍夫變換又用來檢測圓形,根據(jù)三個(gè)點(diǎn)確定一個(gè)圓的原理,霍夫變換對輪廓上的點(diǎn)進(jìn)行統(tǒng)計(jì),找出統(tǒng)計(jì)數(shù)最高的圓形,便是目標(biāo)圓形。之后,霍夫變換又被開發(fā)改善,能夠識(shí)別橢圓形等一系列圖形,并且具有較好的穩(wěn)定性,往往被應(yīng)用在傳統(tǒng)目標(biāo)識(shí)別算法領(lǐng)域。

      1.3 傳統(tǒng)視覺方法檢測前沿進(jìn)展

      傳統(tǒng)視覺方法的檢測算法已經(jīng)越來越成熟,以水果檢測為例,在2015年,Moghimi運(yùn)用傳統(tǒng)視覺方法設(shè)計(jì)實(shí)現(xiàn)了一種溫室青椒識(shí)別檢測系統(tǒng)。Moghimi首先進(jìn)行了青椒圖像的采集工作,由于青椒與枝葉顏色相近同為綠色,所以要提取出圖像內(nèi)容中的紋理特征,然后根據(jù)紋理特征進(jìn)行分類,之后根據(jù)分類結(jié)果選出紋理特征為光滑的一類,最終進(jìn)行色調(diào)、飽和度和綠色系數(shù)的分析,最終檢測出青椒,此方法在實(shí)驗(yàn)室中進(jìn)行模擬實(shí)驗(yàn),準(zhǔn)確率能夠達(dá)到84%。2016年Brown設(shè)計(jì)了一個(gè)櫻桃采摘機(jī)器人,Brown首先通過CCD相機(jī)對櫻桃的圖像進(jìn)行實(shí)時(shí)采集,之后對圖像進(jìn)行二值化并加上腐蝕和膨脹等形態(tài)學(xué)操作,從而將櫻桃與背景進(jìn)行分割,將提取出來的果實(shí)部分再傳送給控制器,此櫻桃采摘機(jī)器人的視覺系統(tǒng)最終能夠識(shí)別出櫻桃存在的整片區(qū)域。積層:卷積層的主要目的在于充分的提取特征,卷積層中最重要的單元是卷積核,每一個(gè)卷積核相當(dāng)于一個(gè)過濾網(wǎng),能夠把符合條件的特征信息篩選過濾出來,卷積核包含多種尺寸,例如有3×3卷積核、5×5卷積核等等,大的卷積核能夠使得特征快速充分的提取出來,但是需要的參數(shù)更多,數(shù)據(jù)量更大,小的卷積核訓(xùn)練的參數(shù)較小,數(shù)據(jù)量較小,所以需要根據(jù)目標(biāo)識(shí)別系統(tǒng)的具體特點(diǎn)和識(shí)別任務(wù)的不同來進(jìn)行分析,之后選出合適的卷積核。池化層:池化層的主要目的是將卷積層處理之后的數(shù)據(jù)量進(jìn)行縮小。因?yàn)橥ㄟ^卷積之后的圖像數(shù)據(jù)量一般遠(yuǎn)遠(yuǎn)大于原始數(shù)據(jù)量,并且包含很多的重復(fù)信息或者說無用信息。為了解決這個(gè)問題,需要對數(shù)據(jù)量進(jìn)行縮減,也就是池化。池化又分為若干種,較為常用的有最大池化和平均池化。最大池化就是將模板當(dāng)中的最大值元素作為池化最終結(jié)果進(jìn)行輸出、平均池化就是將模板當(dāng)中的所有元素相加取平均作為池化的最終結(jié)果進(jìn)行輸出。最終經(jīng)過池化之后,數(shù)據(jù)量大大減少,特征提取的也較為充分,可以進(jìn)行下一步的處理。輸出層:輸出層主要是將池化之后的結(jié)果進(jìn)行進(jìn)一步的全連接處理,最終輸出結(jié)果,如圖1所示。

      圖1 bp網(wǎng)絡(luò)結(jié)構(gòu)圖

      2 深度學(xué)習(xí)目標(biāo)檢測

      2.1 人工神經(jīng)網(wǎng)絡(luò)簡介

      深度學(xué)習(xí)的靈感來源于生物的大腦認(rèn)知原理,尤其是大腦對于視覺的處理過程。大腦對于圖像的信號(hào)處理過程是:首先進(jìn)行圖像的攝入,之后通過大腦的神經(jīng)元與神經(jīng)網(wǎng)絡(luò)對眼前的圖像進(jìn)行處理,具體過程是抽象的,然后根據(jù)抽象結(jié)果,大腦進(jìn)行目標(biāo)的判斷和識(shí)別。

      計(jì)算機(jī)科學(xué)家受到生物學(xué)當(dāng)中的神經(jīng)網(wǎng)絡(luò)啟發(fā),想到模仿人腦的特點(diǎn),構(gòu)造出人工神經(jīng)網(wǎng)絡(luò)。

      2.2 卷積神經(jīng)網(wǎng)絡(luò)

      卷積神經(jīng)網(wǎng)絡(luò)主要是用來處理圖像的神經(jīng)網(wǎng)絡(luò),與其他網(wǎng)絡(luò)結(jié)構(gòu)的不同之處在于,卷積神經(jīng)網(wǎng)絡(luò)在最基本的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)之上加入了卷積層和池化層。所以,卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)大致可以分為四個(gè)部分:輸入層、卷積層、池化層、輸出層。輸入層:輸入層主要負(fù)責(zé)輸入目標(biāo)信息,具體包含圖像的信息、像素的信息等等。卷

      2.3 深度學(xué)習(xí)方法檢測前沿進(jìn)展

      深度學(xué)習(xí)方法現(xiàn)階段已經(jīng)越來越多的應(yīng)用到檢測識(shí)別領(lǐng)域之中,以水果檢測為例,王海青等采用BP神經(jīng)網(wǎng)絡(luò)分割蘋果圖像,提取 3 個(gè)紋理特征值和 4 個(gè)幾何特征值輸入到網(wǎng)絡(luò)當(dāng)中作為輸入層數(shù)據(jù),之后經(jīng)過訓(xùn)練,輸出蘋果的識(shí)別結(jié)果。針對蘋果識(shí)別,劉海全選取的是faster rcnn網(wǎng)絡(luò)框架,沒有對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行修改,此網(wǎng)絡(luò)主要由三部分構(gòu)成:特征提取、區(qū)域生成網(wǎng)絡(luò)(RPN)和fast rcnn。直接將采集到的蘋果圖像數(shù)據(jù)集輸入網(wǎng)絡(luò)做整體處理,最終得出的識(shí)別率為 79.32%。

      此外,除了這兩種網(wǎng)絡(luò)框架,rcnn在2014年被發(fā)表、SPP-NET在2014年被發(fā)表、yolo在2016年被發(fā)表、fast rcnn在2015年被發(fā)表、這幾種發(fā)表的網(wǎng)絡(luò)均廣泛用于深度學(xué)習(xí)物體檢測中,當(dāng)然還有ResNeXt、DenseNet等網(wǎng)絡(luò)也較為常用。

      3 深度學(xué)習(xí)目標(biāo)識(shí)別與傳統(tǒng)目標(biāo)識(shí)別算法前沿方案進(jìn)展與比較

      傳統(tǒng)目標(biāo)識(shí)別算法的優(yōu)點(diǎn)在于能夠?qū)⒆R(shí)別特征清晰的顯現(xiàn)出來,并且如果目標(biāo)較為簡單,輪廓較為清晰或者顏色對比較為鮮明,那么采用傳統(tǒng)目標(biāo)識(shí)別算法便可以很好的將目標(biāo)識(shí)別出來,且算法的復(fù)雜度較低。

      針對調(diào)研的有關(guān)目標(biāo)檢測的結(jié)果,統(tǒng)計(jì)了不同論文當(dāng)中傳統(tǒng)算法和深度學(xué)習(xí)算法的使用次數(shù)以及使用效果,發(fā)現(xiàn)針對于較為復(fù)雜的目標(biāo),例如人臉、車輛等使用深度學(xué)習(xí)的算法較多,且效果較好。針對于較為簡單,特征較為明顯的目標(biāo),例如蘋果、番茄、球類等使用傳統(tǒng)的目標(biāo)識(shí)別算法較多,且效果較好。具體統(tǒng)計(jì)結(jié)果見表1。

      表1 調(diào)研統(tǒng)計(jì)結(jié)果

      目前,以蘋果檢測為例,對蘋果進(jìn)行識(shí)別的思路大致分為四種:第一種是全部過程均利用神經(jīng)網(wǎng)絡(luò),將蘋果圖像作為輸入,直接進(jìn)行網(wǎng)絡(luò)訓(xùn)練,最終輸出識(shí)別結(jié)果。第二種是全部過程均采用傳統(tǒng)視覺方法,針對蘋果的形狀、顏色等特征,對蘋果進(jìn)行特征的分析,并根據(jù)特征對蘋果進(jìn)行識(shí)別。第三種是先采用神經(jīng)網(wǎng)絡(luò)方法對蘋果果實(shí)和背景進(jìn)行分割,之后再用傳統(tǒng)視覺方法進(jìn)行識(shí)別。第四種是先采用傳統(tǒng)分割方法對蘋果果實(shí)和背景進(jìn)行分割,之后采用神經(jīng)網(wǎng)絡(luò)對蘋果進(jìn)行識(shí)別。前兩種思路已經(jīng)分別在前面章節(jié)做了介紹,第三種和第四種思路屬于深度學(xué)習(xí)與傳統(tǒng)方法的融合。

      張亞靜、劉剛等人實(shí)現(xiàn)了第一種思路的蘋果識(shí)別算法,他們先采用BP神經(jīng)網(wǎng)絡(luò)對蘋果果實(shí)與背景進(jìn)行分割,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為三層,輸入層有3個(gè)神經(jīng)元,以R/B值、對比度值和亮度值作為輸入,中間隱藏層為6個(gè)神經(jīng)元,最終輸出層為1個(gè)神經(jīng)元,之后利用分割結(jié)果采用霍夫變換進(jìn)行圓擬合,實(shí)現(xiàn)對蘋果的識(shí)別。該作者最后做了識(shí)別率驗(yàn)證試驗(yàn)、試驗(yàn)條件為果園中陰天和晴天采集的蘋果照片共200張、做了整體識(shí)別率測試,識(shí)別率為 87.6%。

      李曉洋、唐磊等人實(shí)現(xiàn)了第二種思路的蘋果識(shí)別算法,首先利用聚類算法將蘋果果實(shí)與背景進(jìn)行分割,之后利用RBF神經(jīng)網(wǎng)絡(luò)對蘋果圖像進(jìn)行訓(xùn)練,RBF神經(jīng)網(wǎng)絡(luò)共有三層,分別為輸入層,中間層和輸出層,輸入層有16個(gè)神經(jīng)元,分別輸入分割后圖像的RGB、HIS等顏色特征分量和分割輪廓的周長面積比等特征,中間層也為16個(gè)神經(jīng)元,然后通過輸出層將識(shí)別結(jié)果輸出。

      張亞靜、劉剛等人實(shí)現(xiàn)了第一種思路的蘋果識(shí)別算法,他們先采用BP神經(jīng)網(wǎng)絡(luò)對蘋果果實(shí)與背景進(jìn)行分割,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為三層,輸入層有3個(gè)神經(jīng)元,以R/B值、對比度值和亮度值作為輸入,中間隱藏層為6個(gè)神經(jīng)元,最終輸出層為1個(gè)神經(jīng)元,之后利用分割結(jié)果采用霍夫變換進(jìn)行圓擬合,實(shí)現(xiàn)對蘋果的識(shí)別,如圖2。

      該作者最后做了識(shí)別率驗(yàn)證試驗(yàn)、試驗(yàn)條件為果園中陰天和晴天采集的蘋果照片共500張、識(shí)別率檢測時(shí)按照單個(gè)蘋果、枝葉遮擋下的蘋果和重疊蘋果做了分類,并最終做了整體識(shí)別率的測試,整體識(shí)別率為86.3%,如表2。

      圖2 蘋果識(shí)別效果

      表2 兩種不同結(jié)合思路效果統(tǒng)計(jì)表

      綜合以上算法的分類與比較發(fā)現(xiàn),對一個(gè)物體進(jìn)行檢測和識(shí)別的方法有多種多樣,方法的不同,最終得到的結(jié)果也不同,傳統(tǒng)方法在現(xiàn)階段如果能對特征進(jìn)行詳細(xì)的分析,在特征的基礎(chǔ)上進(jìn)行識(shí)別檢測,那么也可以達(dá)到滿意的效果,但是缺點(diǎn)就是過程繁瑣,且結(jié)果不一定好。而深度學(xué)習(xí)方法在檢測領(lǐng)域有著簡單準(zhǔn)確的特點(diǎn),采用網(wǎng)絡(luò),進(jìn)行參數(shù)的調(diào)整,訓(xùn)練、測試,最終能夠達(dá)到較好的效果,不需要對特征進(jìn)行具體闡明。另外,將深度學(xué)習(xí)算法與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法結(jié)合,一定程度上效果會(huì)更好,因?yàn)榻?jīng)過傳統(tǒng)方法對特征的提取,特征更加明確,網(wǎng)絡(luò)訓(xùn)練效果更為顯著。

      4 結(jié)語

      本文研究了計(jì)算機(jī)領(lǐng)域目標(biāo)識(shí)別的算法,包含傳統(tǒng)目標(biāo)識(shí)別算法和深度學(xué)習(xí)目標(biāo)識(shí)別算法,傳統(tǒng)目標(biāo)識(shí)別算法大致分為以下步驟:預(yù)處理、顏色空間選擇、分割算法、后處理等等,深度學(xué)習(xí)目標(biāo)識(shí)別算法主要包含卷積神經(jīng)網(wǎng)絡(luò)等。之后針對這兩種算法的前沿解決方案做了詳細(xì)的分析,并將二者結(jié)合的思路做了闡述、分析、分類與對比,得出了相關(guān)結(jié)論。

      猜你喜歡
      卷積神經(jīng)網(wǎng)絡(luò)蘋果
      基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      從濾波器理解卷積
      電子制作(2019年11期)2019-07-04 00:34:38
      基于傅里葉域卷積表示的目標(biāo)跟蹤算法
      收獲蘋果
      有毒的蘋果
      拿蘋果
      會(huì)說話的蘋果
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      泸州市| 怀远县| 秀山| 阿瓦提县| 天祝| 沂源县| 峨山| 修武县| 宁都县| 华亭县| 郎溪县| 昌都县| 岑巩县| 循化| 龙陵县| 遵化市| 察隅县| 普兰店市| 郴州市| 青海省| 五原县| 凌云县| 金昌市| 屏东市| 木兰县| 云梦县| 贵州省| 兴仁县| 噶尔县| 红原县| 宜章县| 中山市| 化州市| 临汾市| 泽州县| 洛浦县| 吉首市| 苏尼特右旗| 金溪县| 沁源县| 布拖县|