楊文橋,鄭力新
(1.華僑大學(xué)工學(xué)院,泉州362021;2.華僑大學(xué)工業(yè)智能化與系統(tǒng)福建省高校工程研究中心,泉州362021)
為了使機(jī)器人具有像人一樣對周圍環(huán)境感知與判斷的能力,以及計(jì)算機(jī)視覺技術(shù)方法與應(yīng)用的迅速發(fā)展,全球機(jī)器視覺市場正處于急速擴(kuò)張階段。由于機(jī)器視覺具有高效率、高自動(dòng)化、高可靠性等特點(diǎn),其應(yīng)用范圍非常廣泛,涵蓋了軍事、農(nóng)業(yè)、制造業(yè)等各個(gè)行業(yè)。國內(nèi)機(jī)器視覺起步較晚,自動(dòng)化程度和技術(shù)含量相對較低,市場也遠(yuǎn)遠(yuǎn)沒有飽和,再加之“中國制造2025”的提出,使得機(jī)器視覺將成為一片紅海。
據(jù)統(tǒng)計(jì),人類獲取外部世界的信息80%來自于視覺,這體現(xiàn)視覺是人類觀察與認(rèn)識世界的最重要方式[1]。同時(shí)也體現(xiàn)了視覺包含大量信息,人類對視覺信息的利用率之高的特點(diǎn),而充分利用這些優(yōu)點(diǎn),使得機(jī)器能夠像人一樣認(rèn)識世界,成為人類的夢想。隨著計(jì)算機(jī)技術(shù)以及基于計(jì)算機(jī)技術(shù)相關(guān)產(chǎn)業(yè)地快速發(fā)展,以人視覺系統(tǒng)為基礎(chǔ)的仿生工程也逐步發(fā)展起來,在這一過程中形成了“計(jì)算機(jī)視覺”這一新興學(xué)科。計(jì)算機(jī)視覺研究的目標(biāo)是通過一張或者多張圖像認(rèn)知周圍的環(huán)境,使之不僅能夠完成人類視覺一樣的功能[2],還能夠完成人眼不能夠勝任的任務(wù)。
那什么是機(jī)器視覺?可以簡單的理解為機(jī)器和視覺組成的系統(tǒng)。在沒有“機(jī)器視覺”這個(gè)概念時(shí),工廠里的設(shè)備,公路上行駛的車輛都可以稱為“機(jī)器”,一種沒有智慧的“機(jī)器”。但給“機(jī)器”加上視覺之后,就像人類一樣有了“眼睛”,再通過給予基本的邏輯判斷與處理能力,進(jìn)而使之具有像人類一樣的智慧。
機(jī)器視覺偏向于計(jì)算機(jī)視覺技術(shù)的工程應(yīng)用,這不同于純粹的計(jì)算機(jī)視覺理論[3]。機(jī)器視覺建立在計(jì)算機(jī)對周圍環(huán)境感知的基礎(chǔ)之上,具有類似于大腦對圖像處理加工識別的功能,但又不限于此,其還具有對圖像處理后判斷以及執(zhí)行相關(guān)動(dòng)作的功能。由此可以將機(jī)器視覺視為在對特定環(huán)境感知下,做出相應(yīng)的判斷和動(dòng)作的系統(tǒng)。從圖1 可以看出機(jī)器視覺所處的應(yīng)用技術(shù)層面。
從學(xué)科屬性上看,機(jī)器視覺屬于綜合應(yīng)用型學(xué)科,涉及圖像處理技術(shù)、機(jī)械工程技術(shù)、控制技術(shù)、電光源照明技術(shù)、光學(xué)成像技術(shù)、傳感器技術(shù)、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)軟硬件技術(shù)(圖像增強(qiáng)和分析算法、圖像卡、I/O 卡等)等技術(shù)[4]。涉及范圍之廣,學(xué)科之多,在一定程度上增加了入行的難度。
圖1
機(jī)器視覺系統(tǒng)的工作原理與人的運(yùn)動(dòng)方式比較相似:人通過眼睛觀察到目標(biāo),然后經(jīng)過大腦處理并做出相應(yīng)的判斷,最后由大腦發(fā)出指令使身體做出相應(yīng)的動(dòng)作。在工業(yè)領(lǐng)域中,鏡頭、攝像機(jī)與圖像采集卡相當(dāng)于眼睛,圖像處理系統(tǒng)則相當(dāng)于大腦,控制機(jī)構(gòu)與執(zhí)行機(jī)構(gòu)相當(dāng)于手腳等器官。具體的工作過程為圖像獲取、圖像傳輸、圖像處理,根據(jù)圖像處理結(jié)果選擇執(zhí)行決策、傳輸控制信息、執(zhí)行機(jī)構(gòu)執(zhí)行命令[5]。其基本流程如圖2 所示。
圖2 機(jī)器視覺工作流程
機(jī)器視覺系統(tǒng)通常以計(jì)算機(jī)為中心,主要有光源控制模塊、圖像捕捉模塊、圖像處理模塊、智能決策模塊以及執(zhí)行機(jī)構(gòu)。其基本組成如圖3 所示。
圖3 機(jī)器視覺系統(tǒng)
(1)被測對象到達(dá)一個(gè)固定的位置(通常是攝像機(jī)的視野中心),然后向圖像采集卡發(fā)出觸發(fā)脈沖。
(2)圖像采集卡接收到脈沖信號后,分別將觸發(fā)信號傳輸給相機(jī)和光照系統(tǒng)。
(3)光源系統(tǒng)響應(yīng)并打開曝光機(jī)構(gòu),再打開攝像機(jī)進(jìn)行圖像抓取,燈光的曝光時(shí)間長于相機(jī)捕獲圖像的時(shí)間。
(4)圖像采集卡接收模擬信號并通過A/D 將其數(shù)字化,將轉(zhuǎn)化后的數(shù)據(jù)存儲于計(jì)算機(jī)的內(nèi)存中。
(5)計(jì)算機(jī)根據(jù)需求對圖像進(jìn)行處理分析、識別,并返回判斷結(jié)果或者邏輯控制值。
(6)將邏輯控制值通過I/O 口傳輸給相應(yīng)的控制機(jī)構(gòu)(一般為PLC),而控制機(jī)構(gòu)通過現(xiàn)場總線接口控制執(zhí)行機(jī)構(gòu)(一般為電機(jī)),最終完成產(chǎn)線需求任務(wù)。
光源:是影響機(jī)器視覺系統(tǒng)輸入的重要因素,它直接影響輸入數(shù)據(jù)的質(zhì)量和應(yīng)用效果[6]。主要目的是使重要特征和非必要特征產(chǎn)生最大的對比度,即將目標(biāo)的重要特征顯現(xiàn)出來,而同時(shí)將不需要的特征抑制掉,最終形成對處理過程最佳的圖像效果。這樣一方面減少了圖像算法的復(fù)雜度,另一方面保證捕獲圖像的穩(wěn)定性,提高了系統(tǒng)的精度。所以一般在選擇光源時(shí),會(huì)考慮光源的對比度、亮度和顏色等基本要素。除此之外,還要根據(jù)工作環(huán)境的要求,例如視場及工作距離來選定用何種光源。
鏡頭:用于聚集光線使目標(biāo)能夠在相機(jī)CCD 或者COMS 上呈現(xiàn)出清晰的圖像。作為成像器件,通常要與相機(jī)、光源配合使用,因此在選擇鏡頭時(shí)一般要考慮整個(gè)環(huán)境要求。鏡頭的選擇是建立在客戶的需求之上,一般會(huì)考慮視野大小、光學(xué)放大倍數(shù)、工作距離、景深要求以及與相機(jī)相配合的一些參數(shù),如芯片大小、相機(jī)接口方式(C 接口與CS 接口方式)等,所以選擇相機(jī)的鏡頭是一個(gè)非??季康氖虑椤?/p>
工業(yè)相機(jī):屬于圖像采集單元,將光學(xué)圖像轉(zhuǎn)化為模擬/數(shù)字圖像,再將相應(yīng)的信號傳輸給圖像采集卡。與民用相機(jī)相比,具有輸出圖像質(zhì)量高、抗干擾能力強(qiáng)、可長時(shí)間工作等優(yōu)點(diǎn),其核心部件是用以接收光線的CCD 或者CMOS 芯片。在選用相機(jī)的過程中,首先考慮的參數(shù)就是分辨率,這個(gè)參數(shù)的選取受檢測精度以及視野大小的限定,其次考慮的就是幀率了,該參數(shù)的選定與當(dāng)前檢測速度有關(guān),相機(jī)的幀率一定要大于或者等于檢測速度,再之就是曝光方式的選擇。對于目前做目標(biāo)檢測與識別來說,為了識別準(zhǔn)確,防止拖影,要選擇全局曝光;對于通過抓取圖片識別的,可以選擇全局曝光與卷簾曝光方式。最后考慮其余的參數(shù)的,例如,用CCD 還是CMOS,用網(wǎng)口還USB,像素的深度又是多少,不過這些參數(shù)的選擇對于最終的實(shí)驗(yàn)效果影響不是很大。
圖像采集卡:是連接工業(yè)相機(jī)(圖像采集)與電腦(圖像處理)兩大板塊的重要組件,用于將捕獲的信號存儲于計(jì)算機(jī),相當(dāng)于眼睛的視覺神經(jīng)。
圖像處理系統(tǒng):根據(jù)實(shí)際需求所設(shè)計(jì)的一套處理被測物體圖像的算法,并輸出相關(guān)的系統(tǒng)邏輯運(yùn)動(dòng)控制信號,屬于機(jī)器視覺的核心。在實(shí)際中根據(jù)不同的應(yīng)用場景,會(huì)開發(fā)出不同的圖像處理系統(tǒng)和算法,不過也有比較通用的軟件如德國的Halcon。
控制機(jī)構(gòu):接受來自計(jì)算機(jī)圖像處理后反饋的邏輯控制信息,用于控制執(zhí)行機(jī)構(gòu),主要使用PLC 或者工控機(jī)。
執(zhí)行機(jī)構(gòu):對最后的指令進(jìn)行執(zhí)行,直接作用于被測物體,一般將機(jī)械臂或者電機(jī)作為執(zhí)行機(jī)構(gòu)。該部分一般與控制機(jī)構(gòu)構(gòu)成同一整體。
機(jī)器視覺作為機(jī)器人的眼睛,其伴隨著人工智能的快速發(fā)展,進(jìn)入到了一個(gè)發(fā)展階段,主要體現(xiàn)在機(jī)器視覺系統(tǒng)在工業(yè)、農(nóng)業(yè)、醫(yī)療、交通等行業(yè)的廣泛應(yīng)用。由于機(jī)器視覺自身的優(yōu)點(diǎn),使得在精度、速度和質(zhì)量等方面比工人更具有優(yōu)勢,在平均成本上也有所降低。下面具體闡述機(jī)器視覺在農(nóng)業(yè)智能化、制造業(yè)異常檢測、紡織業(yè)上的應(yīng)用。
(1)機(jī)器視覺的主要應(yīng)用之一:農(nóng)業(yè)智能化
機(jī)器視覺在農(nóng)業(yè)中的應(yīng)用主要體現(xiàn)在農(nóng)業(yè)機(jī)器人、農(nóng)作物病蟲害監(jiān)視和農(nóng)產(chǎn)品質(zhì)量檢測三個(gè)方面[7]。以農(nóng)產(chǎn)品為目標(biāo),經(jīng)過目標(biāo)檢測、定位、識別后,自動(dòng)化設(shè)備到達(dá)指定位置,最后通過柔性夾爪或者吸附設(shè)備來完成對農(nóng)產(chǎn)品的采摘。在檢測過程中不僅利用農(nóng)產(chǎn)品顏色、大小、形狀和氣味等特征,有時(shí)還會(huì)利用如密度、酸堿度、導(dǎo)電率等特性。其中Abundant Robotics(美國)公司最具有典型性,該公司通過真空來“抓取”如蘋果等易碎的水果。
農(nóng)作物病蟲害監(jiān)視是運(yùn)用機(jī)器視覺技術(shù)實(shí)時(shí)分析農(nóng)作物葉、莖干、果實(shí)表面,并將分析結(jié)果反饋至技術(shù)員以供指導(dǎo)生產(chǎn)活動(dòng)使用,一般情況下也可自主實(shí)施。其中比較典型的是大疆MG-1S 農(nóng)業(yè)植保機(jī),其可以實(shí)現(xiàn)作業(yè)規(guī)劃、飛行實(shí)時(shí)管理等任務(wù)。
農(nóng)產(chǎn)品質(zhì)量檢測通常應(yīng)用于分級與分揀。例如根據(jù)水果的大小、顏色等將其分為一、二、三等,也可以將農(nóng)產(chǎn)品中不符合要求或者有損傷的篩選出來,完成這樣的任務(wù)通常是一個(gè)完備的機(jī)器視覺系統(tǒng)。
(2)機(jī)器視覺的主要應(yīng)用之二:尺寸與缺陷檢測
機(jī)器視覺常被應(yīng)用于工業(yè)中的異常檢測以及尺寸測量,而其中最主要的應(yīng)用領(lǐng)域則是像PCB 印制板檢查、車門縫隙檢測和電池虛焊、隱裂、斷柵檢測等。這方面的視覺檢測通常要求比較高,精度可以達(dá)到毫米級,所以對檢測的現(xiàn)場環(huán)境極高。機(jī)器視覺的應(yīng)用解決了人工視覺檢查產(chǎn)品質(zhì)量效率和生產(chǎn)率低的問題,同時(shí)也降低了疲勞所帶來的的誤判率。
(3)機(jī)器視覺的主要應(yīng)用之三:紡織業(yè)
目前在鞋革加工制造行業(yè)中,幾乎所有的涂膠工序都是由手工來完成的[8],而制鞋流程中不可避免的會(huì)使工作人員接觸到有毒有害的原材料,再加之現(xiàn)有生產(chǎn)環(huán)境惡劣、生產(chǎn)成本上升,使用何種新技術(shù)解決噴涂等問題成為了亟待解決的問題?,F(xiàn)有的解決方案中有采用工業(yè)機(jī)械手和3D 視覺相結(jié)合的方式,該方案實(shí)現(xiàn)了高精度、高穩(wěn)定性的涂膠,這一方面做的比較好的是Pixoel 鞋底涂膠系統(tǒng)。
除以上應(yīng)用領(lǐng)域之外,機(jī)器視覺技術(shù)還可以應(yīng)用于智能交通、醫(yī)藥行業(yè)、安防等其他領(lǐng)域,具體情況如表1。
表1
如今,機(jī)器視覺仍然是個(gè)如火如荼的研究領(lǐng)域,雖然國內(nèi)主要集中在應(yīng)用、代理、二次開發(fā)的基礎(chǔ)上,但已經(jīng)超越了傳統(tǒng)的檢驗(yàn)領(lǐng)域,向著更深層次、更為多元化的方向發(fā)展;并且越來越多的應(yīng)用機(jī)器視覺公司開始在提供解決方案的基礎(chǔ)之上成立自己視覺部門,逐漸向更深的領(lǐng)域鉆研。同時(shí),也在結(jié)合多技術(shù),向著數(shù)字化、智能化發(fā)展。