薛榮輝,劉星星,王 楠
(西安汽車職業(yè)大學汽車工程學院 陜西 西安 710600)
隨著數(shù)字化計算快速發(fā)展,信息技術與智能化計算機圖像識別技術得到了融合,在此背景下,神經(jīng)網(wǎng)絡算法在圖像識別領域也發(fā)揮了重要作用。當下,計算機圖像識別在智能算法領域得到廣泛應用,從本質上來講,它是一種融合了智能化計算機技術和現(xiàn)代圖像識別、處理技術的新興數(shù)字影像技術,該技術經(jīng)過全面的技術革新,已經(jīng)被廣泛應用圖像識別與數(shù)字化技術處理等領域[1]。例如目前在很多場合都應用到了智能化技術,經(jīng)過對計算機圖像進行低照度處理,即可提高攝像機、數(shù)字化監(jiān)控設備的傳感器五色彩質量,圖像經(jīng)智能化識別與處理,清晰度較高,同時采用高感光度技術,有效提高暗光下拍攝出的圖片、圖像識別度,正是因為有了智能化圖像識別技術,才使得圖片的清晰度大大提高,在保證圖片質量的同時,無需使用陣列紅外燈補光也能夠保留住原來的圖像色彩和清晰度。
計算機智能化圖像識別技術的核心是基于機器對圖像進行識別,經(jīng)過對相關景物進行處理,收集和處理文字、圖像等圖片信息,經(jīng)過計算機智能化圖像模式識別,能夠由機器取代傳統(tǒng)的人工處理技術,可對某些計算機智能化圖像數(shù)據(jù)信息進行自動化識別、處理、辨別與分類,在此過程中,系統(tǒng)還能夠對相關圖像中的具體圖形進行快速、準確識別分類[2]。目前,在我國發(fā)展的計算機智能化圖像識別模式主要包含三個環(huán)節(jié),分別是對計算機智能化圖像進行分類,對計算機智能化圖像特征進行數(shù)據(jù)提取以及對計算機智能化圖像進行預處理。在前期處理環(huán)節(jié),主要目的是采用計算機智能化圖像識別模式對圖像進行增強處理、平滑處理、數(shù)據(jù)恢復、圖像分割、圖像邊緣檢測等,從而使圖像輸入計算機中即可將上述幾種不同模式轉換為分段處理模式。其中,計算機智能化圖像特征提取主要是借助計算機智能化圖像識別模式有效提取圖像主要特征信息,由此為計算機智能化圖像中的少部分特征進行識別和有效分類。在這幾個環(huán)節(jié)中,最為關鍵的步驟就是計算機圖像模式分類,對于計算機用戶而言,他能夠通過圖像映射,將計算機智能化圖像類型空間、部分特征向量空間進行圖像歸屬映射,進而使圖像模式分類歸屬為某一類模式,計算機智能化圖像識別技術基本模式[3]如圖1所示。
圖1 計算機智能化圖像識別技術基本模式框圖
在獲取計算機智能化圖像數(shù)據(jù)時,首先需要通過掃描儀、傳真機、數(shù)碼攝像機、數(shù)碼相機等設備,將圖片、景物、照片或圖像等經(jīng)過數(shù)字化傳感器傳入,然后再將這些圖像轉換為相應的物理量,用于計算機測量和處理[4]。
在計算機智能化圖像數(shù)據(jù)處理過程中,分別需要經(jīng)過三個不同的步驟,一是選擇計算機智能化圖像的基本特征,二是抽取計算機智能化圖像的基本特征,三是對計算機智能化圖像的基本特征信息進行預處理。經(jīng)過圖像數(shù)據(jù)預處理之后,可以有效改善計算機智能化圖像的質量,與此同時,還能夠通過圖像數(shù)據(jù)處理,徹底消除因傳輸介質所引起的圖像退化現(xiàn)象[5]。在這幾個環(huán)節(jié)中,抽取計算機智能化圖像基本特征的實質就是有效提取出計算機智能化圖像的圖像性基本元素和圖像特性數(shù)字值,而在選擇圖像基本特征時,首先需要抽取特征元素,然后方能選擇特征原圖像進行圖像智能分類識別。
計算機智能化圖像判別分類,核心是通過建立圖像智能分類基本規(guī)則,根據(jù)規(guī)則,對圖像模式進行分類選擇,在此基礎上,借助智能神經(jīng)網(wǎng)絡模式進行圖像識別,進而實現(xiàn)圖像的智能判別分類[6]。
現(xiàn)階段,研究者主要基于神經(jīng)網(wǎng)絡計算方法,對計算機智能化圖像進行神經(jīng)網(wǎng)絡識別,通過神經(jīng)網(wǎng)絡識別圖像,能夠提高圖像識別效能,這種神經(jīng)網(wǎng)絡技術具有數(shù)據(jù)大規(guī)模處理、計算機智能化圖像分布式存儲以及圖像識別自組織并行等諸多功能。
在采用神經(jīng)網(wǎng)絡計算方法進行圖像智能識別時,首先需要進行機器學習,而學習特性即是神經(jīng)網(wǎng)絡學習算法的基本特性,它能夠基于神經(jīng)網(wǎng)絡計算方法,對神經(jīng)網(wǎng)絡的具體權值以及網(wǎng)絡閾值進行有效調節(jié),從而可以實現(xiàn)計算機神經(jīng)網(wǎng)絡學習與訓練。目前,計算機神經(jīng)網(wǎng)絡學習算法主要分為監(jiān)督學習算法和無監(jiān)督學習算法兩種基本模式,其中對于計算機神經(jīng)網(wǎng)絡監(jiān)督學習算法而言,在神經(jīng)網(wǎng)絡學習訓練時,必須要有一定量的輸入矢量和目標矢量作為訓練樣本。而在學習訓練過程中,計算機神經(jīng)網(wǎng)絡能夠實時輸出目標訓練結果,并進行數(shù)值比較,根據(jù)比較情況,可有效調節(jié)網(wǎng)絡權值與相關閾值,由此經(jīng)過循環(huán)往復的學習和訓練,最終使計算機神經(jīng)網(wǎng)絡輸出結果更加靠近目標訓練值[7]。當下,最為典型的計算機神經(jīng)網(wǎng)絡算法為BP算法,它是一種常見的計算機神經(jīng)網(wǎng)絡監(jiān)督學習算法。現(xiàn)如今,也有學者通常采用計算機神經(jīng)網(wǎng)絡無監(jiān)督學習算法進行智能圖像識別,這種技術相比于監(jiān)督學習算法,它在整個學習訓練過程中,均無需學習樣本即可實現(xiàn)自我學習,系統(tǒng)只需要輸入相應的網(wǎng)絡信號,即可反復調節(jié)計算機神經(jīng)網(wǎng)絡的相關權值和閾值,最終形成一種有序的監(jiān)督學習狀態(tài)。圖2所示為基于神經(jīng)網(wǎng)絡算法的計算機監(jiān)督學習流程。
圖2 基于神經(jīng)網(wǎng)絡算法的計算機監(jiān)督學習流程框圖
在算法領域,BP算法往往具有良好的自學習性,但是其收斂速度較差,尤其在基于BP算法進行梯度下降計算時,機器學習訓練時長較長,且非常容易陷入局部極小的困境之下。對此,本研究為了改進上述BP算法缺陷,將傳統(tǒng)BP算法模式與GA遺傳算法模式相結合,形成了經(jīng)改進的GA-BP算法,該算法模式能夠有效避免以往算法模式所帶來的未成熟收斂算法缺點,同時還可進行全局最優(yōu)解搜索與收斂,相比于普通的BP算法而言,經(jīng)過改進的GA-BP算法基于神經(jīng)網(wǎng)絡算法思想,可使遺傳算法的魯棒性顯著得到增強,同時還可以充分發(fā)揮神經(jīng)網(wǎng)絡算法的非線性學習能力、收斂速度與映射能力[8]。
2.2.1 基于改進的GA-BP算法思想
改進的GA-BP算法采用遺傳算法思想進行神經(jīng)網(wǎng)絡權值學習,首先確定GA-BP算法的神經(jīng)網(wǎng)絡結構,然后列出遺傳算法神經(jīng)網(wǎng)絡神經(jīng)元之間的連接關系,在此基礎上,通過連接權編碼,分別形成實數(shù)碼串個體與群體,與此同時,進行算法優(yōu)化計算分析,最后基于遺傳算法對最優(yōu)個體進行解碼處理,由此有效確定神經(jīng)網(wǎng)絡具體權值。在本研究中,分別通過三個不同步驟的神經(jīng)網(wǎng)絡學習,獲得遺傳算法的神經(jīng)網(wǎng)絡權值。本研究通過一定次數(shù)的BP算法學習,有效選取學習結果初值,進而利用遺傳算法模式對收斂速度較慢的算法權值進行網(wǎng)絡學習,由此完成給定精度的算法初始值賦權,這種基于BP優(yōu)化算法的網(wǎng)絡模型記憶力較強,穩(wěn)定性良好,且具有較強的算法推廣能力,同時還可以提升算法網(wǎng)絡模型的全局收斂速度。
2.2.2 構建GA-BP算法網(wǎng)絡分類器
在計算機智能化圖像識別過程中,可基于GA-BP算法識別模型,分析雙隱層數(shù)字圖像BP網(wǎng)絡分類器樣本構成及其訓練方式。在對數(shù)字圖像進行去噪與分割處理之后,可對數(shù)字化圖像進行逐行、逐列進行掃描,在此過程中,分別將黑色、白色像素特征記為“1”和“0”,當算法掃描結束之后,即會構建一個具有和圖像相同個數(shù)的特征向量矩陣,該矩陣維數(shù)為3維,構建起網(wǎng)絡分類器之后,還需進行GA-BP網(wǎng)絡訓練,整個算法學習訓練過程分別包含學習速率選擇,輸入層/輸出層/隱層設計,訓練算法初始化網(wǎng)絡選擇及訓練樣本數(shù)選擇。
2.2.3 網(wǎng)絡層數(shù)選擇
BP神經(jīng)網(wǎng)絡設計的首要原則是降低算法誤差,通過增加線性輸出層與S型隱含層網(wǎng)絡的實際隱層數(shù),可以大幅提高全部有理函數(shù)的算法精度,并使其進一步逼近BP神經(jīng)網(wǎng)絡算法精度。在本文中,所選擇的BP神經(jīng)網(wǎng)絡總共包含4層,分別是網(wǎng)絡層,輸入層,輸出層和運算層,首先在網(wǎng)絡層進行第一層運算,然后將輸出量信號輸入到輸入層首層,在此基礎上,進行第二層算法運算,經(jīng)過訓練之后,將機器訓練學習結果輸出到第二層和第三層進行算法運算,在整個算法模式中,第一層的主要功能是對輸出量信號進行線性分類,然后通過第二層進行算法邏輯運算,從而使非交凸集合分類的“與”邏輯同“或”邏輯運算得以實現(xiàn),進而完成整個非交集合分類過程。
2.2.4 輸入層設計
主要根據(jù)數(shù)據(jù)表示方式類和求解問題確定算法輸入層單元數(shù),在對計算機智能化圖像信息進行識別時,首先需要輸入處理后的圖像特征空間維數(shù),在此基礎上,對特征分量維數(shù)進行提取并確定神經(jīng)單元數(shù),此時算法輸入層的圖像像素數(shù)和網(wǎng)絡神經(jīng)元數(shù)為“N”。
2.2.5 隱含層單元數(shù)選擇
BP神經(jīng)網(wǎng)絡隱層單元輸入間屬于單調上升的非線性函數(shù),而輸出時間對算法隱藏單元的要求是單元數(shù)要合理,如果在基于算法進行計算機智能化圖像識別時,由于隱層單元數(shù)較少,此時BP網(wǎng)絡層隱層單元的準確樣本特征和網(wǎng)絡可能提取及訓練不出來,在這種情形下,未訓練樣本容錯性就會大大提升,同時計算機智能化圖像就無法得到有效識別。相反,若BP神經(jīng)網(wǎng)絡隱層單元數(shù)過多,此時其整體的結構復雜度就會上升,在這種狀況下,如若BP網(wǎng)絡層隱層單元的網(wǎng)絡規(guī)模過于龐大,則隱層單元數(shù)網(wǎng)絡的訓練時間就會顯著增多,同時由于算法訓練特征不收斂,則會導致計算機智能化圖像特征空間劃分過細,如果訓練樣本網(wǎng)絡泛化能力不強,從而會使訓練以外樣本識別率大大降低。
綜上分析,本研究基于GA-BP四層神經(jīng)網(wǎng)絡進行神經(jīng)學習算法訓練學習,將隱含層節(jié)點數(shù)分別設置為6、12、18、24、30,而將輸入/輸出節(jié)點依次設置為“251”和“4”,然后分別通過對比分析不同的訓練時間、訓練次數(shù),收集和計算實驗數(shù)據(jù),對比結果發(fā)現(xiàn),通過GA-BP神經(jīng)網(wǎng)絡算法智能化識別的圖像正確率最高為96.7%,而算法識別正確率最低為86.3%,兩者相差10.4%,由此表明,采用改進的GA-BP算法進行計算機智能化圖像識別,當GA-BP四層神經(jīng)網(wǎng)絡隱含層節(jié)點數(shù)設置為24,機器學習訓練時間為8.49 s,且學習次數(shù)達到81次時,可以最大程度上減少和避免普通算法訓練收斂速度緩慢的問題發(fā)生,并取得最佳的算法識別效果。表1所示為神經(jīng)網(wǎng)絡識別數(shù)據(jù)。
表1 基于GA-BP算法的計算機智能化圖像識別數(shù)據(jù)
綜上研究,數(shù)字影像技術已經(jīng)伴隨我國信息技術發(fā)展逐步滲透、融合和應用到我們?nèi)粘I詈蜕畹母鱾€領域,尤其隨著計算機技術和互聯(lián)網(wǎng)技術、智能算法等不斷發(fā)展,計算機智能化圖像識別技術傳輸與存儲已變得十分先進。但由于傳統(tǒng)圖像識別方法具有很大的技術局限性,因此對現(xiàn)代化新興計算機智能化圖像識別技術的研究一直以來都是國內(nèi)外學者廣泛關注的研究的重點所在。在此背景之下,針對傳統(tǒng)圖像識別技術和算法搜索過程中存在的訓練時間過長、樣本冗余性大、不便于機器學習從而導致算法識別結果不精準等問題,本研究在分析問題基礎上,提出了一種經(jīng)改進的GA-BP四層神經(jīng)網(wǎng)絡學習算法,借助GA-BP神經(jīng)網(wǎng)絡識別模型進行計算機智能化圖像識別,研究分析表明,該算法模型和圖像識別新方法是高效的。數(shù)據(jù)顯示,基于GA-BP四層神經(jīng)網(wǎng)絡算法分析識別下的圖像識別率為96.7%,而傳統(tǒng)方法識別率僅86.3%,因此實驗充分表明該方法有效,且能通過GA-BP算法基于不同類型目標樣本有效解決圖像識別失真率高、檢測率低、穩(wěn)定性差等問題。