曹成志
摘 ?要:隨著人工智能的飛速發(fā)展,一系列新興技術(shù)不斷興起,而圖像識別技術(shù)作為其中最有潛力的方向之一,在醫(yī)療、交通、農(nóng)業(yè)等領(lǐng)域都有十分廣泛的應(yīng)用。本文闡述了圖像識別的基本概念和技術(shù)原理,并結(jié)合深度學(xué)習(xí)具體實(shí)例,對圖像識別技術(shù)的應(yīng)用進(jìn)行初步研究,最后指出該技術(shù)存在的問題并對發(fā)展前景進(jìn)行展望。
關(guān)鍵詞:人工智能;圖像識別;深度學(xué)習(xí)
引言:
圖像,是人類歷史中最為重要的信息源之一,它通過觀測系統(tǒng)從客觀世界中獲得,可以直觀地表達(dá)事物的特征。近年來,隨著大數(shù)據(jù)時代的到來和計(jì)算機(jī)技術(shù)的蓬勃發(fā)展,圖像的數(shù)據(jù)量呈現(xiàn)指數(shù)型增長,圖像識別技術(shù)的應(yīng)用也越來越廣泛,并在衛(wèi)生醫(yī)療、科學(xué)研究、故障診斷、交通運(yùn)輸?shù)阮I(lǐng)域取得了一定的成績,并改變著人們的日常生活。本文簡要介紹了圖像識別技術(shù)的含義、原理和應(yīng)用領(lǐng)域,并分析該技術(shù)的問題和發(fā)展前景。
一、圖像識別技術(shù)概述
1.圖像識別的含義及發(fā)展
圖像識別,是模式識別技術(shù)在圖像領(lǐng)域的具體應(yīng)用,是對輸入的圖像信息建立數(shù)學(xué)模型,對圖像進(jìn)行預(yù)處理操作,分析并提取圖像特征,然后根據(jù)特征建立合適的分類器,進(jìn)行分類識別的技術(shù)[1]。其主要目的是對圖像等可視化信息進(jìn)行處理和識別,來解決計(jì)算機(jī)與外部環(huán)境的直接通信過程。
圖像識別起源于20世紀(jì)40年代,在當(dāng)時由于計(jì)算能力的限制和硬件設(shè)施的缺失,并沒有得到很好的發(fā)展。主要經(jīng)歷了三個階段:文字識別、數(shù)字圖像處理與識別、物體識別。直到20世紀(jì)90年代,伴隨著人工神經(jīng)網(wǎng)路的興起和計(jì)算機(jī)技術(shù)的發(fā)展,圖像識別技術(shù)得到廣泛應(yīng)用,并涌現(xiàn)出很多不同的算法,涉及邊緣檢測、區(qū)域提取、閾值分割等多個部分。
2.圖像識別原理
圖像中包含了豐富的數(shù)字信息,識別過程主要包括圖像預(yù)處理、特征提取和圖像分類三個部分。
1)圖像預(yù)處理
對圖像預(yù)處理的目的是減少后續(xù)過程中的復(fù)雜度并提高識別效率。通過各種降低噪聲的手段,將圖像中蘊(yùn)含的數(shù)字信息進(jìn)行適當(dāng)簡化,便于對特征進(jìn)行提取[2]。在該過程中,圖像分割的質(zhì)量對最終結(jié)果具有較大影響。如何高效地將特征目標(biāo)從源圖像中分割出來,是解決問題的關(guān)鍵。由此衍生出了一系列圖像分割法,例如基于方向圖的分割法、三級分割法等等。每一種分割法都有優(yōu)點(diǎn)和不足,在進(jìn)行處理時,往往需要將多種方法結(jié)合起來并進(jìn)行適當(dāng)修改,才能獲得最優(yōu)的分割效果。
2)特征提取
特征提取是將圖像上的特征點(diǎn)劃分為不同特征子集的過程,這些子集往往是點(diǎn)集、曲線集或連通的的區(qū)域集[3]。一般來說,提取的圖像特征主要包括顏色、形狀、紋理和空間四種。顏色特征能夠很好地描述不同顏色在整個圖像的所占比例,適合用于難以自動分割的圖像,但是無法對空間位置進(jìn)行描述;形狀特征需要對圖像的某個特定目標(biāo)進(jìn)行研究,但是如果圖像上的目標(biāo)發(fā)生變形,準(zhǔn)確度就會大大下降;紋理特征具有全局性質(zhì),對區(qū)域性的特征描述具有較好的 穩(wěn)定性,但是當(dāng)分辨率變化明顯時,得到的特征偏差也會隨之增加[4];空間特征對靜止圖像的描述效果很好,可是一旦圖像進(jìn)行縮放、旋轉(zhuǎn)等操作,特征變化會非常明顯。
3)圖像分類
圖像分類,主要是從一張或者多張圖像總識別出與模板圖像相似的區(qū)域,用來預(yù)測出對應(yīng)的類別。在實(shí)際應(yīng)用中,由于拍攝環(huán)境等因素的影響,圖像的質(zhì)量會受到各種因素的干擾,導(dǎo)致失真和扭曲等。如何提高匹配率,加強(qiáng)抗干擾能力并提高匹配速度,成為圖像匹配的主要研究方向。由此出現(xiàn)了很多基于圖像特征的匹配方法,例如幾何圖元法、傅氏形狀描述法等。近年來,深度學(xué)習(xí)的興起,為圖像匹配提供更多思路和方案。
二.圖像識別技術(shù)的應(yīng)用
目前,識別技術(shù)已經(jīng)廣泛應(yīng)用于醫(yī)療、交通、農(nóng)業(yè)等領(lǐng)域,為人們的日常生活帶來極大便利。
1.醫(yī)學(xué)圖像識別
醫(yī)學(xué)圖像種類眾多,清晰度容易受到成像環(huán)境的干擾,這些問題在一定程度上會影響醫(yī)生對病情的判斷結(jié)果。而借助圖像識別技術(shù)對患病部位進(jìn)行檢測和診斷可以顯著提高工作效率,診斷準(zhǔn)確率有時甚至可以超過人工診斷準(zhǔn)確率?,F(xiàn)階段,該技術(shù)的應(yīng)用主要集中在眼部、胸部、腦部等,可以用于診斷肺癌、乳腺癌、阿爾本次海默癥等,在這些方面取得了一定的研究成果[5]。但是目前為止,由于不具備大量相關(guān)的數(shù)據(jù)集,圖像識別技術(shù)對很多病變部位還無法做出判斷。
2.交通識別
在公共交通領(lǐng)域,圖像識別技術(shù)主要應(yīng)用于交通標(biāo)志識別、車牌識別等,在自動駕駛、智能停車、交通控制等領(lǐng)域發(fā)揮著舉足輕重的作用。近年來,一些學(xué)者將卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法運(yùn)用到交通標(biāo)志識別,可以有效提高識別的準(zhǔn)確度,并提升訓(xùn)練速度。另外,圖像識別技術(shù)還可以用來檢測路況和行人等物體,為無人駕駛汽車的興起具有顯著推動作用。
3.農(nóng)業(yè)病蟲害識別
農(nóng)業(yè)是我國最重要的基礎(chǔ)產(chǎn)業(yè)之一,在現(xiàn)代經(jīng)濟(jì)體系中具有十分重要的地位,農(nóng)作物的產(chǎn)量和質(zhì)量直接影響人民的生活水平。而農(nóng)業(yè)病蟲害的爆發(fā)往往會造成農(nóng)作物大幅度減產(chǎn),對國民經(jīng)濟(jì)造成不可逆轉(zhuǎn)的損失,因此對病蟲害的防治工作就顯得十分必要。如何對蟲害進(jìn)行準(zhǔn)確有快速的識別和處理,是保證農(nóng)作物正常生長的有效措施。而依靠人工識別方法比較浪費(fèi)人力物力,而且出錯率較高,工作繁瑣,越來越不能滿足農(nóng)業(yè)生產(chǎn)的需求。圖像識別技術(shù)具有準(zhǔn)確、實(shí)時和快速的特點(diǎn),可以很好地輔助農(nóng)民檢測和發(fā)現(xiàn)病蟲害,大大提高工作效率。目前為止,已經(jīng)實(shí)現(xiàn)了對玉米螟、棉鈴蟲等農(nóng)業(yè)害蟲的圖像識別與檢測,準(zhǔn)確率較高,同時也降低了農(nóng)業(yè)生產(chǎn)的成本。
三.問題與展望
現(xiàn)階段,圖像識別技術(shù)已經(jīng)具備了一定的應(yīng)用價值,但在該技術(shù)上的理論研究還不夠完善,依然存在一些問題丞待解決。
1.圖像分割算法的性能評估沒有特定的標(biāo)準(zhǔn),這就為方法的選擇和使用造成一定困難。
2.識別效果主要依賴于大樣本數(shù)據(jù)集,因此會為數(shù)據(jù)采集工作提出更高的要求。
3.訓(xùn)練模型越復(fù)雜,計(jì)算量越大,訓(xùn)練時間也會越長。
由此可見,如何在保證準(zhǔn)確率的同時,減少模型的計(jì)算量并提高計(jì)算效率,是圖像識別技術(shù)研究的關(guān)鍵之一。為了進(jìn)一步改善該技術(shù),我們應(yīng)注重算法的原理,不斷優(yōu)化模型結(jié)構(gòu),減少訓(xùn)練參數(shù),提高準(zhǔn)確率。
四.結(jié)束語
圖像識別技術(shù)的出現(xiàn),為人民的生產(chǎn)和生活帶來極大便利,并推動醫(yī)療、交通、農(nóng)業(yè)等領(lǐng)域的建設(shè),但依然還有很大的開發(fā)空間,需要更多學(xué)者和研究人員的投入。在將來,還會出現(xiàn)更成熟、更方便、更快捷的識別技術(shù),不斷促進(jìn)人民生活水平的提高。
參考文獻(xiàn)
[1] ?豐曉霞. 基于深度學(xué)習(xí)的圖像識別算法研究[D].太原理工大學(xué),2015.
[2] ?陳勇濤,郭曉穎,陶慧杰.基于深度學(xué)習(xí)的圖像識別模型研究綜述[J].電子世界,2018(04):65-66.
[3] ?王志瑞,閆彩良.圖像特征提取方法的綜述[J].吉首大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,32(05):43-47.
[4] ?楊德坤. 圖像紋理特征的研究[D].山東師范大學(xué),2012.
[5] ?田凈雯,張雄,胡珺,朱福.圖像識別在醫(yī)療領(lǐng)域中的應(yīng)用[J].上海醫(yī)藥,2019,40(03):12-13+54.