郝雅潔 李富忠
摘 要:隨著計算機(jī)科學(xué)技術(shù)的日益發(fā)展與進(jìn)步,計算機(jī)技術(shù)也越來越高端,圖像識別處理技術(shù)在日常生活中被廣泛應(yīng)用,識別需求也隨生活水平的提高不斷更新變化,所以識別技術(shù)也需要提高,以符合人們的需求。文中介紹了圖像識別技術(shù)的概念、發(fā)展歷程、發(fā)展現(xiàn)狀,討論技術(shù)特點、圖像識別的過程和一些需要用到的圖像處理技術(shù)的簡要概述、技術(shù)問題以及解決途徑,最后介紹圖像識別技術(shù)的應(yīng)用領(lǐng)域范圍。計算機(jī)圖像識別技術(shù)已經(jīng)深深融入到人們的日常生活中了,無處不在,如智能客戶端的掃碼付錢,為人們的生產(chǎn)生活帶來了極大的便利。未來此技術(shù)還將更加智能化,更好地為大眾服務(wù)。
關(guān)鍵詞:計算機(jī);智能化;圖像識別技術(shù);圖像處理技術(shù);掃碼付錢;神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP391.4文獻(xiàn)標(biāo)識碼:A文章編號:2095-1302(2019)08-00-03
0 引 言
隨著社會與科學(xué)技術(shù)的進(jìn)步發(fā)展,計算機(jī)圖像識別技術(shù)也越來越智能化,能夠很大程度地滿足人們對圖像的個性化需求。圖像識別技術(shù)將計算機(jī)技術(shù)、識別處理技術(shù)、智能化結(jié)合在一起,將輸入的圖像圖形信息轉(zhuǎn)換為計算機(jī)數(shù)字信號,對這些多源數(shù)據(jù)信息進(jìn)行分析處理,轉(zhuǎn)化成具有特征的信息,進(jìn)行分類匹配,得到最終的效果,這樣的方式顯著提升了圖像的處理速度和質(zhì)量[1]。計算機(jī)數(shù)字信號有抗干擾、信息量小、易存儲并能夠長期存儲的優(yōu)點,使得圖像識別容易被執(zhí)行操作[2]。計算機(jī)圖像識別技術(shù)歷經(jīng)了幾個階段的發(fā)展演變,早期只能對簡單的數(shù)字、文字信息進(jìn)行識別處理,后來漸漸發(fā)展為可以對簡單的圖形圖像數(shù)字化信息進(jìn)行識別處理,以及現(xiàn)在的稍復(fù)雜的二維圖像甚至三維立體圖像[3]?,F(xiàn)今的圖像識別系統(tǒng)大致可分為三種形式:神經(jīng)網(wǎng)絡(luò)、結(jié)構(gòu)以及統(tǒng)計,如圖1所示?;谏窠?jīng)網(wǎng)絡(luò)形式的圖像識別是一種新型的應(yīng)用廣泛的識別技術(shù),將傳統(tǒng)的圖像識別技術(shù)與先進(jìn)的神經(jīng)網(wǎng)絡(luò)方法相結(jié)合,大大提升了識別率[4]。
計算機(jī)圖像識別處理與人類對圖像的感知識別是類似的,然而計算機(jī)識別能力更強(qiáng),能處理的信息量更大??梢杂脕磉M(jìn)行條形碼識別、人臉面部識別、指紋識別、身份認(rèn)證、模型匹配等,一定程度上保障了人們?nèi)粘I畹陌踩浴:唵斡謴V泛的圖像識別應(yīng)用于智能手機(jī)方面,指紋識別、面部識別簡化了人們解鎖屏幕之前的繁瑣操作,大大縮短了解鎖時間,提升了使用效率?,F(xiàn)在的高端識別技術(shù)已經(jīng)可以實現(xiàn)當(dāng)對象物體的位置、角度和距離等無論發(fā)生怎樣的改變,計算機(jī)都能識別其本質(zhì)的特點,對圖像的最終判斷不會產(chǎn)生影響[5]。例如蘋果公司新推出的iPhone X手機(jī)的面部識別功能,無論是在黑夜,還是用戶戴眼鏡、臉上有疤痕等面部有些變化,其都能識別出并進(jìn)行解鎖。學(xué)校、機(jī)關(guān)政府等使用的掃臉打卡機(jī)器同樣也使用到了此技術(shù)。
1 技術(shù)特征點
圖像本身可能會帶有大量的數(shù)據(jù)信息,在識別過程中還需要對圖像的信息進(jìn)行比對分析,這就需要對大量的數(shù)據(jù)進(jìn)行處理,信息量很龐大。圖像的最小單位是像素,一幅圖像是由眾多的像素組成,并且各像素之間有著緊密的關(guān)系。像素對應(yīng)圖像的信息,在一定程度上反映出圖像的內(nèi)容。像素與像素間、像素與圖像間的關(guān)聯(lián)性是很強(qiáng)的,在識別過程中有著重要的作用[6]。
對圖像進(jìn)行識別,首先要將圖像信息轉(zhuǎn)變?yōu)槎S數(shù)組,即計算機(jī)可識別的數(shù)字信號,這樣任意精度間的轉(zhuǎn)換就需要高精度的數(shù)字化智能處理技術(shù)[7]。智能化的計算機(jī)圖像識別提升了圖像信息的精準(zhǔn)度,識別結(jié)果更加接近于真實性,使得圖像受環(huán)境噪聲的影響較小,提升了抗干擾性[8]。隨著科技的進(jìn)步,圖像識別技術(shù)也更加的靈活,在圖像的轉(zhuǎn)換處理上方便快捷,識別率精確很多。圖像識別處理大都為了滿足人們的生產(chǎn)生活需求,人為地進(jìn)行控制分析處理,有時會加入個人喜好情感等因素,依個人要求改變最后的識別結(jié)果[9]。
2 技術(shù)實現(xiàn)過程
計算機(jī)圖像識別的過程與人腦識別圖像的過程是類似的。首先將要識別的圖像對象輸入到計算機(jī)中,之后對其進(jìn)行預(yù)處理和壓縮處理,對圖像的關(guān)鍵特征進(jìn)行提取,之后進(jìn)行分類,最后根據(jù)要求對圖像進(jìn)行匹配[6]。圖像識別過程如圖2所示。
圖中圖像預(yù)處理過程是最為關(guān)鍵的也是最復(fù)雜困難的一個環(huán)節(jié),會將圖像中一些不重要的數(shù)據(jù)信息去除,對圖像識別效果影響最大[10]。圖像預(yù)處理包括對圖像進(jìn)行灰度化處理、二值化處理、平滑去噪及輪廓提取等操作?;叶然幚頃D像中的各像素點的灰度值根據(jù)需求,經(jīng)某一灰度化公式處理后得到成像效果[11]。二值化處理比較簡單,只需將圖像中像素點的灰度值均設(shè)置為0或255即可,最后圖像呈現(xiàn)的效果即為黑與白[12]。去噪處理是將圖像中的一些噪聲及沒用的干擾信息去除,突出需要的圖像內(nèi)容,從而使人們能直觀清晰地看到需求信息。輪廓提取是突出目標(biāo)圖像對象的邊緣輪廓信息,使人們可以僅從圖像中的形狀邊緣特征就看出圖像的信息內(nèi)容。
對圖像進(jìn)行壓縮處理,將圖像多余的信息進(jìn)行壓縮或刪減,可以減少圖像的占用空間,能夠更好的傳輸和存儲,但并不會影響圖像的可識別性。壓縮代碼及形式需根據(jù)實際情況來選擇[9]。提取圖像的關(guān)鍵特征是系統(tǒng)根據(jù)圖像的主要特征點進(jìn)行處理提取,如圖像的顏色特征、形狀特征、紋理特征及空間特征等。
3 存在問題及解決途徑
雖然我國智能化的圖像識別技術(shù)取得了迅速發(fā)展,識別效果不錯,但是我國對這項技術(shù)仍處于起步發(fā)展階段,還存在諸多的不足之處,識別技術(shù)存在一些瓶頸問題?,F(xiàn)如今的技術(shù)只能對簡單的圖像進(jìn)行識別處理,效果還比較好;然而當(dāng)圖像一旦變得復(fù)雜,數(shù)據(jù)信息多的時候,計算量以及計算時間都會變大,識別率也會下降[13]。圖像識別技術(shù)如圖3所示。
技術(shù)受限主要是由于以下幾方面的原因。我國的計算機(jī)軟硬件設(shè)備技術(shù)相對比較落后,當(dāng)識別復(fù)雜的圖像時,任務(wù)量較大,計算機(jī)運(yùn)行處理速度跟不上,無法及時地識別處理圖像,降低了識別精度和效率[14]。同時也會造成我國的研究成果少于國外具有發(fā)達(dá)水平計算機(jī)軟硬件國家的研究成果。我國智能識別的圖像大多還是二維圖像,并且有時圖像的質(zhì)量不是很高,模糊或是有雜質(zhì),或受人為因素的任意性干擾限制,都會影響圖像的識別效率。
基于以上問題,大家還需要對其進(jìn)行優(yōu)化提高,加大研究投入計算機(jī)軟硬件設(shè)備的開發(fā),多運(yùn)用高性能的計算機(jī)來支撐識別處理圖像。并且將工作重心從二維圖像逐漸轉(zhuǎn)變?yōu)槿S圖像,未來甚至?xí)l(fā)展為多維[15]。優(yōu)化完善識別技術(shù),降低圖像質(zhì)量及環(huán)境噪聲對識別處理的影響,從而提升識別精度和分辨率。
4 應(yīng)用領(lǐng)域
如今圖像識別技術(shù)隨著高端先進(jìn)的科學(xué)技術(shù)已經(jīng)漸漸深入到人們的生活中,應(yīng)用范圍領(lǐng)域廣泛,如交通領(lǐng)域、建筑工程領(lǐng)域、醫(yī)學(xué)領(lǐng)域、文學(xué)藝術(shù)領(lǐng)域、農(nóng)業(yè)領(lǐng)域等,被不斷推廣[2],并且具有著較高的應(yīng)用價值與作用,靈活便捷智能的特點使其應(yīng)用普遍,十分有必要在各行業(yè)進(jìn)行普及發(fā)展。
4.1 交通領(lǐng)域
要想富,先修路。隨著各城市經(jīng)濟(jì)的發(fā)展,城市交通設(shè)施也在不斷發(fā)展改變,道路四通八達(dá),建設(shè)面積越來越大,路況也越來越復(fù)雜,并且人們生活水平不斷提高,各家各戶都擁有了私家車,不論是節(jié)假日還是工作日都會駕車出行,這就給道路交通帶來了不小的壓力。為了保證人們能高效地駕車出行,計算機(jī)圖像識別技術(shù)在交通設(shè)施領(lǐng)域方面就起到了很大的作用,它可以同時對路況信息和車輛信息進(jìn)行檢測。各大城市都不斷地修道路,所以司機(jī)在駕駛時也會有很多道路不熟悉,無法準(zhǔn)時準(zhǔn)確地到達(dá)目的地。而圖像識別技術(shù)會為駕駛員提供實時可靠準(zhǔn)確的路況信息,為駕駛員指引方向,保障了道路、車輛以及駕駛員的雙重安全[13]。圖像識別除了對道路檢測外還可以進(jìn)行車輛檢測,通過車輛分割技術(shù)對車輛進(jìn)行跟蹤與識別,檢測車速與車流量,判斷車輛是否有超速違規(guī)等現(xiàn)象,利于交通事故的處理,以及能有效地保障道路通暢運(yùn)行。
4.2 醫(yī)學(xué)領(lǐng)域
身體是革命的本錢,擁有一個健康的身體才是無限財富的保證。如今人們對自己的健康問題越發(fā)重視了,我國醫(yī)療事業(yè)也飛速發(fā)展,醫(yī)療器械設(shè)備融入了計算機(jī)圖像識別技術(shù),越來越智能化。醫(yī)生可以直接通過設(shè)備對病人進(jìn)行拍片觀察診斷,針對性治療,清晰直觀,準(zhǔn)確又高效。例如應(yīng)用于微創(chuàng)手術(shù)的手機(jī)導(dǎo)航技術(shù)、CT技術(shù)、核磁共振以及B超、彩超等,醫(yī)生與患者可以通過圖像清晰直觀地看到病情狀況,以此提出有針對性的治療方案,提高醫(yī)學(xué)技術(shù)[16]。
4.3 安防領(lǐng)域
天網(wǎng)恢恢,疏而不漏。人民安居樂業(yè)是保障國家繁榮昌盛的關(guān)鍵所在,如今科技的進(jìn)步使得視頻監(jiān)控普及運(yùn)用,能夠遍布各個角落,如天眼一般監(jiān)控著每個地方的一舉一動,讓黑惡勢力無藏身之處,極大地保障了民生安全。安防設(shè)施的建設(shè)也日益嚴(yán)格,由傳統(tǒng)的人工視頻調(diào)查分析轉(zhuǎn)為智能化的計算機(jī)圖像識別技術(shù)分析,避免了人工可能引起的疏漏誤差,更加精準(zhǔn)嚴(yán)格[17]?,F(xiàn)在的視頻監(jiān)控分布廣雜,人工分析處理視頻信息不僅耗費(fèi)大量的時間,還會耗費(fèi)大量的人力物力,而且人為因素會造成很多信息的遺漏,速度慢、效率
低[18]。將視頻監(jiān)控自動化,通過計算機(jī)采集圖像,提取識別信息,將圖像中的信息數(shù)據(jù)一體化,精準(zhǔn)度更高,大大降低了人工操作的工作量、工作時間,提高了效率。監(jiān)控視頻信息還可以作為事故鑒定的有效依據(jù)。
4.4 農(nóng)業(yè)領(lǐng)域
民以食為天。自古以來農(nóng)業(yè)在我國就有著舉足輕重的地位,糧食產(chǎn)量對經(jīng)濟(jì)有較大的影響,所以提高產(chǎn)量是我國農(nóng)業(yè)研究人員的研究關(guān)鍵。高科技不光應(yīng)用在人們的日常生活中,農(nóng)業(yè)領(lǐng)域也同樣引入了高科技,智慧農(nóng)業(yè)也不再是什么新鮮詞匯,智能化農(nóng)業(yè)引入計算機(jī)圖像識別技術(shù),可以實時觀測到植物的生長狀況,植物葉片的病蟲害研究,對植物進(jìn)行實時全景監(jiān)控,還可以進(jìn)行農(nóng)產(chǎn)品的質(zhì)檢。對研究植物表型,影響植物生長因素以及研發(fā)植物新品種有科學(xué)指導(dǎo)意義[19]。
4.5 文藝領(lǐng)域
圖像識別技術(shù)在文藝領(lǐng)域主要應(yīng)用于對圖像、聲音方面的識別處理,呈現(xiàn)出藝術(shù)性。通過智能化識別系統(tǒng)自動將無用信息過濾掉,保證信息的有效性,匹配性。還可以依據(jù)美學(xué)原理對圖像進(jìn)行色彩調(diào)整,增強(qiáng)其藝術(shù)感,從而為人們呈現(xiàn)出更加美好的畫面,如日??吹降?D電影、3D電視等所呈現(xiàn)出的震撼場景,超強(qiáng)的視覺效果給人們帶來一場場視覺盛宴[19],讓人們身臨其境。
5 結(jié) 語
智能化的計算機(jī)圖像識別技術(shù)提取出圖像中有用有價值的信息給人們,以便更好地服務(wù)人們的生產(chǎn)、生活。其應(yīng)用價值非常廣泛,在提升人民經(jīng)濟(jì)發(fā)展的同時還能保障財產(chǎn)的安全,發(fā)展前景廣闊。然而還需要繼續(xù)研究提升識別精度,不斷地創(chuàng)新完善技術(shù),使其更加多維化、智能化,為促進(jìn)我國社會的智能化與可持續(xù)化發(fā)展做出貢獻(xiàn)。
注:本文通訊作者為李富忠。
參 考 文 獻(xiàn)
[1]樊凌,戴雯惠.基于移動端的智能手機(jī)圖像識別算法研究[J].計算機(jī)產(chǎn)品與流通,2017(8):127.
[2]唐維.芻議計算機(jī)圖像識別的智能化處理技術(shù)瓶頸與突破[J].電腦知識與技術(shù),2018,14(5):196-197.
[3]鄒棟,顏飛.計算機(jī)圖像識別技術(shù)的發(fā)展現(xiàn)狀與應(yīng)用實踐[J].計算機(jī)產(chǎn)品與流通,2017(9):13.
[4]萬兵.基于人工智能的圖像識別技術(shù)的研究[J].信息與電腦(理論版),2019(2):141-142.
[5]于婷.計算機(jī)圖像識別的智能化處理技術(shù)瓶頸與突破[J].信息與電腦(理論版),2018(21):3-4.
[6]賈孟媛.計算機(jī)智能化圖像識別技術(shù)的理論性突破[J].電腦迷,2018(3):38-39.
[7] MIN-UK Kim, KYOUNGRO Yoon. Image recognition system that uses visual word [C]// International Conference on Information Science & Applications (ICISA). Seoul: IEEE, 2014: 1-2.
[8] EL-MASHAD S Y, SHOUKRY A. A more robust feature correspondence for more accurate image recognition [C]// Canadian Conference on Computer and Robot Vision. Montreal: IEEE, 2014: 181-188.
[9]梁利亭.計算機(jī)智能圖像識別的算法與技術(shù)探究[J].電腦迷,2019(1):212.
[10]張曉軒.計算機(jī)智能圖像識別的算法與技術(shù)研究[J].科學(xué)技術(shù)創(chuàng)新,2018(24):67-68.
[11] BAI Jinfeng, CHEN Zhineng, FENG Bailan, et al. Chinese image text recognition on grayscale pixels [C]// International Conference on Acoustics, Speech and Signal Processing. Florence: IEEE, 2014: 1394-1398.
[12]陳澤岳,段剛強(qiáng),丁子健.圖像識別處理技術(shù)在農(nóng)業(yè)工程中的應(yīng)用[J].電子技術(shù)與軟件工程,2017(17):82.
[13]宮銘.計算機(jī)圖像識別技術(shù)的應(yīng)用及細(xì)節(jié)問題闡述與分析[J].信息與電腦(理論版),2019(1):7-8.
[14]向麗娜.計算機(jī)圖像識別的智能化處理方法解讀[J].電子技術(shù)與軟件工程,2019(3):137.
[15]張素杰,柯瑜.計算機(jī)圖像識別的智能化處理技術(shù)探討[J].科技風(fēng),2018(27):80.
[16]莊鋒茂.計算機(jī)圖像識別技術(shù)的應(yīng)用及細(xì)節(jié)問題研究[J].通訊世界,2018(11):39-40.
[17] ZHU Xianwen, LI Jingfu. Image recognition method based on artificial life and support vector machine [C]// Sixth International Conference on Intelligent Human-Machine Systems and Cybernetics (IHMSC). Hangzhou:IEEE,2014:17-19.
[18]王天辰.計算機(jī)圖像識別技術(shù)的應(yīng)用及細(xì)節(jié)問題[J].電子技術(shù)與軟件工程,2017(19):128.
[19]王彥超.圖像處理與識別技術(shù)的發(fā)展及應(yīng)用分析[J].無線互聯(lián)科技,2018,15(13):144-146.