• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于YOLOv3 算法改進(jìn)的行人檢測技術(shù)研究

      2021-04-24 09:07:22萬少松
      關(guān)鍵詞:行人尺度語義

      韓 峰 萬少松

      (西京學(xué)院,陜西 西安710000)

      1 概述

      在計(jì)算機(jī)視覺這個(gè)大領(lǐng)域下有眾多的分支研究,其中對(duì)生活中行人的檢測作為其分支之一是當(dāng)下一個(gè)主流的研究,通過現(xiàn)有目標(biāo)檢測算法模型加以改進(jìn)研究以達(dá)到對(duì)行人檢測能有更好的性能。目標(biāo)檢測算法發(fā)展到當(dāng)下主要被分成了兩個(gè)類別:基于候選區(qū)域的目標(biāo)檢測算法(兩個(gè)階段):常用的有Fast R-CNN[1]、Faster R-CNN[2],基于回歸的目標(biāo)檢測算法(一個(gè)階段):常用的有YOLO[3],SSD。由Redmon 等人提出的YOLOv3 算法由于具有良好的識(shí)別率和實(shí)時(shí)性而被大量運(yùn)用于行人檢測中。

      2 YOLOv3 算法

      YOLOv3 算法是基于v1、v2 算法的基礎(chǔ)上改進(jìn)而來的,v3算法采用了分類效果更好的darknet-53,相比前2 個(gè)算法所用的ResNet-152 和ResNet-101,darknet-53 神經(jīng)網(wǎng)絡(luò)層數(shù)更精簡,但在分類精度保持一致的同時(shí)計(jì)算效率有了提升。

      FAST R-CNN 算法中使用的是候選區(qū)域特征提取,與之相比的YOLOv3 采取的方式是直接對(duì)一整張圖片來進(jìn)行卷積步驟,這樣做的好處是可以加快計(jì)算速度,但對(duì)于訓(xùn)練相對(duì)較大的物體,背景信息也可能被算成目標(biāo)里的一部分,因此在檢測大物體時(shí)檢測效果相對(duì)較差。

      YOLOv3 提取了darknet-53[5]中下采樣為8 倍、16 倍、32 倍時(shí)的特征圖圖像尺度分別為13*13、26*26、52*52。使用FPN 網(wǎng)絡(luò)[4]對(duì)darknet-53 網(wǎng)絡(luò)中提取的三個(gè)尺度不同的特征圖進(jìn)行融合處理,利用多尺度信息策略幫助網(wǎng)絡(luò)模型能學(xué)習(xí)到不同深度的特征信息,最后將多種特征融合在一起并輸入YOLO 層進(jìn)行類別預(yù)測和邊界框回歸運(yùn)算。

      每當(dāng)圖像被卷積后,尺寸發(fā)生變化縮小成原來的一半。每個(gè)卷積層的實(shí)現(xiàn)是由卷積+BN 層+激活函數(shù),設(shè)置添加后的殘差模塊在其基礎(chǔ)上需要進(jìn)行零填充的設(shè)置。YOLOv3 共計(jì)算出10647 個(gè)數(shù)據(jù)的預(yù)測。

      對(duì)于多尺度檢測來說,圖像的直接信息中就包含分辨率信息,就是構(gòu)成目標(biāo)需要的像素?cái)?shù)量。像素的數(shù)目越高,目標(biāo)圖像的語義信息就更加具體清晰,這意味著可以獲得的分辨率信息更多,因此大尺寸特征圖主要用來進(jìn)行分辨率信息獲取。語義信息在目標(biāo)檢測中的是用來區(qū)分出目標(biāo)與背景之間的關(guān)系,因此語義信息就是能準(zhǔn)確的分辨出哪些是目標(biāo)哪些是背景。不同種類的語義信息需要的細(xì)節(jié)信息也不盡相同,而且語義信息的分辨率越小,能獲得的細(xì)節(jié)信息越少。對(duì)于小目標(biāo)來講,尺度較小的特征圖無法提取有效的分辨率信息,這種時(shí)候還是需結(jié)合大尺度的特征圖的語義信息來進(jìn)一步識(shí)別。

      3 YOLOv3 算法的改進(jìn)

      3.1 網(wǎng)絡(luò)結(jié)構(gòu)

      YOLOv3 算法通過結(jié)合殘差網(wǎng)絡(luò)的作用提出Darknet-53 網(wǎng)絡(luò),并通過殘差結(jié)構(gòu)降低了訓(xùn)練的難度,Darknet-53 網(wǎng)絡(luò)實(shí)現(xiàn)了對(duì)多種目標(biāo)的檢測。然而對(duì)于本文研究的行人目標(biāo)檢測內(nèi)容來說,Darknet-53 網(wǎng)絡(luò)是復(fù)雜冗余的。因?yàn)榫W(wǎng)絡(luò)層數(shù)越多,需要計(jì)算的參數(shù)就越多,這將導(dǎo)致訓(xùn)練時(shí)間加長并且訓(xùn)練變的復(fù)雜,會(huì)極大影響訓(xùn)練的效率,造成過擬合,也會(huì)影響檢測的速度。

      因此,本文在改進(jìn)YOLOv3 算法時(shí),使用darknet-19[6]網(wǎng)絡(luò)替代原有的darknet-53 網(wǎng)絡(luò)并結(jié)合YOLOv3 的多尺度檢測環(huán)節(jié)。Darknet-19 網(wǎng)絡(luò)如圖1 所示。Darknet-19 網(wǎng)絡(luò)去掉了殘差網(wǎng)絡(luò)降低了網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性。

      圖1

      3.2 多尺度檢測的改進(jìn)

      YOLOv3 通過把多種尺度信息融合的方式進(jìn)行目標(biāo)檢測,每一種特征圖都進(jìn)行檢測,采樣倍數(shù)越高的特征圖就可以檢測更精細(xì)的目標(biāo),對(duì)于圖像中的小目標(biāo)行人檢測效果有所提升。

      YOLOv3 在darknet-53 網(wǎng)絡(luò)中選用了3 個(gè)尺度的特征層,本文則是在Darknet-19 中選擇4 個(gè)特征層,結(jié)合不同尺寸的特征圖分配相對(duì)應(yīng)的錨點(diǎn)框,最終本文提出的多尺度檢測網(wǎng)絡(luò)結(jié)構(gòu)模型如圖2 所示。

      圖2

      3.3 損失函數(shù)

      YOLOv3 中的損失函數(shù)由坐標(biāo)回歸損失、置信度損失和分類損失組成,其中坐標(biāo)回歸損失使用均方誤差(Mean Square Error, MSE)進(jìn)行計(jì)算,置信度v1,v2 損失和分類損失使用交叉熵進(jìn)行計(jì)算。

      YOLOv3 的損失函數(shù)是v1,v2 函數(shù)改進(jìn)而來, 分為三個(gè)部分:

      坐標(biāo)回歸損失函數(shù):

      4 實(shí)驗(yàn)總結(jié)

      4.1 實(shí)驗(yàn)環(huán)境與訓(xùn)練

      本文是基于pytorh 框架進(jìn)行實(shí)驗(yàn),操作系統(tǒng)是windows 10,64 位 ,CPU 為 AMD R5-3600,GPU 為 GeForce RTX2070Super。在訓(xùn)練階段通過使用批量隨機(jī)梯度下降法來優(yōu)化損失函數(shù)。

      4.2 實(shí)驗(yàn)數(shù)據(jù)

      本文實(shí)驗(yàn)訓(xùn)練所需的數(shù)據(jù)來自INRIA 數(shù)據(jù)集,選取了該數(shù)據(jù)的1804 張圖片,含有行人3542 個(gè)。除此之外,本研究還在校內(nèi)收集到了500 張含有行人的圖片,本文通過圖像標(biāo)注軟件labelImg 進(jìn)行信息標(biāo)注,得到了校園中行人的數(shù)據(jù)集。

      4.3 結(jié)果分析

      采用平均精度均值(mAP)對(duì)改進(jìn)后的算法進(jìn)行評(píng)估,實(shí)驗(yàn)結(jié)果表明在自制數(shù)據(jù)集上檢測精度達(dá)到了71.56%。但改進(jìn)后的算法對(duì)于遠(yuǎn)距離的行人目標(biāo)、受到遮擋的行人目標(biāo)依然會(huì)出現(xiàn)無法識(shí)別的問題

      5 結(jié)論

      本文通過對(duì)YOLOv3 算法的進(jìn)一步了解,在現(xiàn)有算法基礎(chǔ)了進(jìn)行了改進(jìn),充分發(fā)揮了算法在行人檢測中檢測速度和精度上的優(yōu)勢(shì)。改進(jìn)后的算法很好的完成了對(duì)自制數(shù)據(jù)集的檢測。

      但從實(shí)驗(yàn)效果來說,依然還需要去進(jìn)一步的研究,從而對(duì)YOLOv3 算法進(jìn)行更好的改進(jìn),提高對(duì)遠(yuǎn)距離目標(biāo)以及遮擋物的檢測水平。

      猜你喜歡
      行人尺度語義
      毒舌出沒,行人避讓
      意林(2021年5期)2021-04-18 12:21:17
      財(cái)產(chǎn)的五大尺度和五重應(yīng)對(duì)
      語言與語義
      路不為尋找者而設(shè)
      我是行人
      宇宙的尺度
      太空探索(2016年5期)2016-07-12 15:17:55
      “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
      認(rèn)知范疇模糊與語義模糊
      9
      行人流綜述
      香格里拉县| 蕲春县| 舞钢市| 大同县| 苏尼特左旗| 南华县| 荃湾区| 凉山| 枣强县| 乌海市| 安西县| 陕西省| 德令哈市| 清河县| 开鲁县| 桂平市| 通江县| 万州区| 株洲县| 资中县| 苍山县| 临湘市| 云南省| 邵东县| 广水市| 襄城县| 龙岩市| 名山县| 临澧县| 铅山县| 桐乡市| 盈江县| 宜城市| 建湖县| 水富县| 滨海县| 祁门县| 浪卡子县| 明光市| 闸北区| 高要市|