王敏 馮旭 譚旭洋
摘要:該文闡述了以樹(shù)莓派3b+為主控,利用單目測(cè)距方法,OpenCV計(jì)算機(jī)視覺(jué)庫(kù),VGG網(wǎng)絡(luò)模型的非接觸物體尺寸形態(tài)測(cè)量系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。通過(guò)樹(shù)莓派3b+對(duì)引導(dǎo)標(biāo)識(shí)的圖像識(shí)別捕獲處理得到平面目標(biāo)顏色、形狀、尺寸、距離,以及球的種類,與球表面最近的距離。最終測(cè)試結(jié)果表明:該系統(tǒng)能夠正確識(shí)別目標(biāo)形狀、類別、顏色,測(cè)距誤差及圖像處理時(shí)長(zhǎng)能滿足系統(tǒng)要求。
關(guān)鍵詞:?jiǎn)文繙y(cè)距;OpenCV;VGG網(wǎng)絡(luò)模型;非接觸測(cè)量
中圖分類號(hào):TP393? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)13-0246-03
1 引言
隨著流水線智能化、自動(dòng)化水平的提高,要求機(jī)械手能自主識(shí)別流水線上的工件[1]。為了讓機(jī)械手能夠準(zhǔn)確識(shí)別工件,并且處理時(shí)間短是十分有必要的。針對(duì)這一問(wèn)題,本設(shè)計(jì)研究非接觸物體尺寸形態(tài)測(cè)量系統(tǒng),一鍵式啟動(dòng)系統(tǒng)自動(dòng)識(shí)別,能夠準(zhǔn)確獲取物體尺寸形態(tài)信息。
2 系統(tǒng)方案總體設(shè)計(jì)
系統(tǒng)總體框圖如圖1所示:攝像頭作為數(shù)據(jù)采集器,獲取目標(biāo)的圖像信息;通過(guò)按鍵獲取當(dāng)前工作模式,進(jìn)入相應(yīng)工作狀態(tài)。樹(shù)莓派3b+對(duì)采集到的圖像數(shù)據(jù)進(jìn)行分析,對(duì)舵機(jī)進(jìn)行控制使攝像頭旋轉(zhuǎn)指向目標(biāo)位置; HDMI顯示屏顯示處理結(jié)果。
3 理論分析與計(jì)算
3.1 識(shí)別平面目標(biāo)形狀算法原理
本系統(tǒng)有三種測(cè)試平面目標(biāo)形狀:正三角形,圓,正方形。若目標(biāo)區(qū)域的左右頂點(diǎn)像素長(zhǎng)與上下頂點(diǎn)像素長(zhǎng)的差值大于設(shè)定閾值并且目標(biāo)像素頂點(diǎn)在設(shè)定的閾值內(nèi)存在重合點(diǎn),則目標(biāo)圖形為三角形。反之,則為圓形或者正方形。進(jìn)一步判斷,作目標(biāo)區(qū)域的外接矩形,設(shè)定上界線與下界線如圖2所示,其中上界線與下界線到外接矩形中心距離相等。若外接矩形減去四個(gè)三角形大于設(shè)定閾值并且在外接矩形中上界線與下界線所在行的目標(biāo)像素點(diǎn)數(shù)目均大于設(shè)定閾值,則目標(biāo)形狀為圓形。反之,為正方形。從而實(shí)現(xiàn)了平面目標(biāo)形狀的識(shí)別。
3.2 測(cè)量平面目標(biāo)尺寸算法原理
4 電路與程序設(shè)計(jì)
4.1 主控接口電路設(shè)計(jì)
主控接口電路設(shè)計(jì)如圖3所示,按鍵分別與GPIO28,GPIO29相接。舵機(jī)與主控芯片的GPIO25相接。LED提示燈與主控芯片的GPIO22相接。蜂鳴器與主控芯片的GPIO21相接。當(dāng)測(cè)量完成后,LED點(diǎn)亮蜂鳴器打開(kāi)維持2秒,隨后自動(dòng)關(guān)閉。
4.2 系統(tǒng)軟件設(shè)計(jì)
系統(tǒng)上電后,初始化硬件設(shè)備,按下按鍵啟動(dòng)本系統(tǒng),按鍵1對(duì)應(yīng)平面目標(biāo)識(shí)別工作模式,按鍵2對(duì)應(yīng)球類識(shí)別工作模式。樹(shù)莓派3b+對(duì)圖像的預(yù)處理過(guò)程如圖4所示。①對(duì)采集到的圖像做彩色空間轉(zhuǎn)換的預(yù)處理②設(shè)定一定的閾值,采用閾值分割的方法二值化圖像,從而識(shí)別目標(biāo)顏色,并提取出白色背景板及以內(nèi)的所有像素點(diǎn)。③通過(guò)拉伸像素強(qiáng)度分布范圍來(lái)增強(qiáng)圖像對(duì)比度,均衡化圖像中像素強(qiáng)度分布。④使用均值濾波算法對(duì)圖像降噪。預(yù)處理后,依據(jù)上述理論分析與計(jì)算識(shí)別平面目標(biāo)的形狀,尺寸,距離。
4.2.1彩色空間轉(zhuǎn)換設(shè)計(jì)
由于拍攝的照片是彩色圖像,直接處理耗時(shí)較長(zhǎng),考慮到系統(tǒng)的實(shí)時(shí)性要求,在處理圖像之前把彩色圖像轉(zhuǎn)換為灰色圖像,具體做法為RGB格式轉(zhuǎn)換為HSV格式。HSV分別是色相(Hue)、飽和度(Saturation)、亮度(Value)。RGB到HSV的轉(zhuǎn)換公式如公式11、12、13所示:
其中max等于r,g,b三者中的最大值,min等于r,g,b三者中的最小值。通過(guò)上述公式實(shí)現(xiàn)了彩色空間的轉(zhuǎn)換,避免色彩失真。由于圖像在生成和傳輸?shù)倪^(guò)程中難免會(huì)受到噪聲的污染[2],所以本系統(tǒng)采用均值濾波算法對(duì)圖像進(jìn)行降噪,以提高圖像信噪比。
4.2.2 閾值分割方法識(shí)別目標(biāo)顏色設(shè)計(jì)
設(shè)定紅綠藍(lán)三種顏色的HSV標(biāo)準(zhǔn)區(qū)間值如表1所示,通過(guò)比較圖形中像素點(diǎn)的HSV值和標(biāo)準(zhǔn)值區(qū)間值,對(duì)像素點(diǎn)進(jìn)行顏色歸類,該顏色值設(shè)為255,其余設(shè)為0。
4.2.3 判別球的種類程序設(shè)計(jì)
球類識(shí)別采用VGG網(wǎng)絡(luò)模型。VGG網(wǎng)絡(luò)是一種經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò), 卷積神經(jīng)網(wǎng)絡(luò)是一種建立在傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法[3]。主要包含卷積層、池化層、全連接層、softmax分類器。
本系統(tǒng)有三種類型的球:籃球、排球、足球。
判別球的種類的算法操作流程如圖5所示,具體步驟為:
步驟1:拍攝籃球排球足球每個(gè)樣本200張圖片作為數(shù)據(jù)集。
步驟2:將圖片尺寸轉(zhuǎn)換為224×224×3,并將圖片數(shù)據(jù)歸一化,使圖片向量值壓縮至[0,1]區(qū)間內(nèi)。
步驟3:基于VGG-16網(wǎng)絡(luò)框架,加入輸出為256的全連接層,用3標(biāo)簽的softmax分類器替換原來(lái)的VGG-16分類器。
步驟4:使用VGG-16的模型參數(shù),保持13個(gè)卷積層和池化層的參數(shù)不變,將VGG-16的最后一個(gè)池化層輸出連接自己的全連接層以及使用3標(biāo)簽的softmax分類器作為本框架的分類器。
步驟5:凍結(jié)VGG-16的前13個(gè)卷積層和池化層參數(shù),訓(xùn)練一個(gè)全連接層和softmax分類器。
權(quán)重從而實(shí)現(xiàn)本系統(tǒng)的球類分類模型。
VGG模型訓(xùn)練結(jié)果:迭代30次后模型衡量指標(biāo):訓(xùn)練損失值loss等于7.5163e-04,訓(xùn)練準(zhǔn)確率acc等于1,預(yù)測(cè)損失值val_loss等于7.7697e-04,預(yù)測(cè)準(zhǔn)確率val_acc等于1。
5 結(jié)論
本文先用彩色圖像轉(zhuǎn)灰色圖像方法以減少處理時(shí)長(zhǎng),再用均值濾波算法減少噪聲對(duì)圖片的干擾,基于單目測(cè)距方法測(cè)量目標(biāo)的距離,采用VGG網(wǎng)絡(luò)模型識(shí)別球的種類。系統(tǒng)整體算法簡(jiǎn)單,準(zhǔn)確率高。
參考文獻(xiàn):
[1] 郭天天,杜耀志.基于顏色輪廓的多邊形識(shí)別及FPGA實(shí)現(xiàn)[J].工業(yè)控制計(jì)算機(jī),2020,33(9):86-88.
[2] 郜偉雪.淺析圖像降噪的算法研究[J].無(wú)線互聯(lián)科技,2016(21):121-122.
[3] 李源熠.基于深度學(xué)習(xí)的圖片匹配算法實(shí)現(xiàn)[D].北京:北京交通大學(xué),2018.
【通聯(lián)編輯:梁書】