朱慶華
(河南長業(yè)智能科技發(fā)展有限公司 河南 鄭州 450000)
隨著技術的不斷發(fā)展與成熟,計算機視覺系統(tǒng)網(wǎng)絡圖像識別中引入多種先進的機器學習算法,例如:神經(jīng)網(wǎng)絡算法、小波分析算法、遺傳算法、梯度分類算法等,在數(shù)字圖像自動化識別過程中應用機器學習算法能夠發(fā)揮對比、分類、處理和存儲的性能,通過非線性方式處理計算機圖像,提高所識別圖像的直觀性。 但在實際運行中,存在著識別高速性不足的問題,為此,文章研究結構平衡網(wǎng)絡用于改進現(xiàn)有算法的方式和可行性,基于現(xiàn)有機器學習網(wǎng)絡圖像識別方法,給出改進方法,并驗證其有效性。
構建計算機視覺系統(tǒng)圖像識別系統(tǒng)利用了機器學習算法的擬合、偏差和精度驗證的高效能。 所形成的識別系統(tǒng)分為兩種模式:第一為機器學習算法在測試集和訓練集的共同作用下,獲取特征向量指標,并完成模擬圖像學習[1]。 劃分指定標準樣本中圖像信息,得到學習樣本的特征向量值,提取所得信息,奠定學習標準測試集的基礎。根據(jù)圖像數(shù)據(jù)集,模擬出與之相似的算法,完成圖像識別操作[2]。 第二為圖像被識別模式,經(jīng)圖像數(shù)據(jù)預處理、特征提取、分類后,輸出分類結果。 此種模式下分析判斷的對象為已采集圖像信息,按照同一類別將分類器單元處理的數(shù)據(jù)信息輸出,滿足圖像精度提升和識別分類要求。
在計算機中心部署經(jīng)壓縮訓練的測試集與訓練集,最終形成帶有感知層、輸出層和隱藏層的數(shù)學模型。 其中,感知層的輸入向量定義為X =(x1,x2,x3,…,xn)t,偏值為b,隱藏層輸出向量為O =(o1,o2,o3,…,on)t,輸出層輸出向量為Y =(y1,y2,y3,…,yn)t。 隱藏層的表達式為式(1):
機器學習輸出層的表達式為式(2)、式(3):
機器學習圖像識別環(huán)節(jié)易出現(xiàn)精度低、特征訓練難的情況,針對此種情況一般采取主成分分析的方式建立模型,通過優(yōu)化數(shù)據(jù)結構,提升數(shù)據(jù)的直觀度和可視化水平,利于分析和探索數(shù)據(jù)。 但學習中的維度災難降低程度仍有可提升空間,需繼續(xù)予以改進。
經(jīng)簡化黑白和灰化處理原始圖片后,圖像特征像素指標增強依賴于對比度,通過提升對比度使得預處理的圖片與原始圖片更為匹配[5]。 提取像素分布規(guī)律,將圖像像素干擾因素去除,提取圖像特征向量,匹配像素特征,分為非正常圖像和正常圖像,對正常圖像進行分類。
計算機識別系統(tǒng)功能模塊由預測結果生成、預測分類顯示區(qū)域、學習模型訓練、特征向量篩選,以及圖像顯示單元構成。 在攝像頭打開后,原始圖片資源被硬件設備獲取,經(jīng)降維、選取特征向量等處理后,在特征向量模型中導入所提取的圖像特征,生成特征向量模型,為分析提取識別圖像特征奠定基礎。 在預訓練圖片后,新圖片經(jīng)模型分析預測,輸出識別結果。 結果輸出位置為文本框,在調(diào)整分辨率、紋理、條帶、亮度、尺寸后,顯示具體圖像特征。
通過對現(xiàn)有基于機器學習的計算機視覺網(wǎng)絡圖像識別方法的闡述來看,在降維處理中存在一定問題,因此,下文將就低訓練速度和精度問題給出利用結構平衡網(wǎng)絡的改進方法。
定義兩個結構平衡網(wǎng)絡,分別為∑、∏,均具有M階結構,對應的連接關系矩陣分別為:D =(dij)∈RM×M,G=(gij) ∈RM×M,組成的矩陣集合為CM。 定義給定的M結構平衡矩陣為A =(aij)∈RM×M,則gij =(A°D)ij =aijgij,1 ≤i,j≤M,且G =A°D為結構平衡矩陣,其逆變換為D =A[-1]°D,A[-1]=(1/aij) ,變換后的A矩陣稱之為變換矩陣。 因Hadamard 乘積變換過程結構平衡分類特點不發(fā)生變化,構建像目標結構平衡矩陣G,其中包含負元素。 在矩陣G中的元素可分為。 采取方形處理方式處理任一輸入圖像,獲得正灰度矩陣P,初始結構平衡矩陣設置為P+PT,借助乘積變換獲取像目標結構平衡矩陣G =A°(P + PT),并得到第一、二朋友權值與隔離權值集合的識別特征參量,包括:max |N-|(min |N-|;mean |[6]。
識別計算機視覺系統(tǒng)網(wǎng)絡圖像的關鍵在于選定包含正負元素的適合變換矩陣A, 借助結構平衡網(wǎng)絡將正負權值涵蓋在像目標結構平衡矩陣中,具備分類性質。 對M維列向量e=[11…1]T∈RM進行分組,分組次數(shù)為n,獲取分塊向量,對應表達式為式(4):
記向量:
基于缺氧誘導因子及PI3K-AKT-mTOR信號通路誘導佐劑關節(jié)炎滑膜血管新生的實驗觀察 … …………… 張曉軍 劉健 萬磊 等(1)84
式(5)中,s1,s2,…,sm為m個自然數(shù)。
Hadamard 乘積變換矩陣Ak中,子分塊(處于第i列、第j行)的矩陣為階,表示為元素為對角子分塊的矩陣為方矩陣,表示為元素為1。
考慮到sj會影響矩陣Ak的第一、二個隔離權值集和朋友權值集,需對確定變換矩陣中各子塊元素符號的sj的奇偶性予以分析。 按照分段取值的方式設定sj,假設sj∈{1,2},sj + si∈{2,3,4}[7]。 在分四段取值后,發(fā)現(xiàn)所形成的變換矩陣如圖1 所示。
圖1 結構平衡矩陣
可以發(fā)現(xiàn),所形成的結構平衡矩陣符合四中心陣的井字帶特點,形成的像目標結構平衡矩陣表示為:Gk =Ak°(P + PT) ,子集均具備圖1 所示的結構特點。 所形成的矩陣集合可描述為:第一、二個隔離權值集為:Gk[N-];朋友權值集為:;網(wǎng)絡拓撲參量為:maxGk[N-](minGk[N-];meanGk[N-])、maxGk[8]。
獲取圖像特征參數(shù)后,分類識別不同類別的圖像。 識別環(huán)節(jié)包含采樣、參數(shù)匹配和識別分類3 個步驟。
首先,采樣階段的訓練組集合設定為R,任一目標設定為Si,利用上文所研究的圖像識別改進方法,獲得特征參量,設定為θi。 訓練組和測試組的圖像特征參量分別為θi(R)、θi(M) 。
其次,運用最小距離分類法進行參數(shù)匹配[9]。 判定同一類別的標準為計算任意兩圖像特征參數(shù)的度量距離,若為最小,則為同一類。 待識別目標與測試組圖像特征參量的歐式距離可表示為:F(θi(R),θi(M)) 。
最后,在識別分類階段,當F(θi(R),θi(M)) 最小時,說明待識別目標屬于訓練組,且圖片包含在Si類中[10]。
將所改進的方法應用至實際中要經(jīng)過相機標定環(huán)節(jié),為計算機視覺網(wǎng)絡系統(tǒng)識別作業(yè)提供支持。 相機標定的最終結果為獲得相機內(nèi)參和處理鏡頭畸變問題,其中,轉換相機與圖像間的坐標需借助內(nèi)參,通過尋求合適的數(shù)學模型,實現(xiàn)三維坐標系向二維坐標軸的轉換,進而利用二維圖像展示三維物體。 設定R為正交旋轉矩陣,在世界坐標系中轉換像素坐標系,見圖2,表達式為式(6):
圖2 相機幾何模型
其中,為三維平移向量。
標定板的參考系原點選擇較為關鍵,本文將所采集圖像的右下角第一個角點設定為原點,其余角點分布在順時針方向上。 當發(fā)現(xiàn)真實標定板角點位置與預測角點位置基本吻合時,確定此點為角點提取結果。 如若無法達到高吻合度,需將切向畸變系數(shù)或徑向畸變系數(shù)輸入,以此對角點位置進行調(diào)整。
為驗證改進后所設計的計算機視覺系統(tǒng)網(wǎng)絡圖像識別方法是否可行,需在選定合適視覺系統(tǒng)硬件后,通過判定計算機是否具備識別目標圖像的功能來驗證改進方法的有效性。 視覺系統(tǒng)硬件包含工控機、觸摸顯示屏、圖像處理系統(tǒng)、攝像機、鏡頭和光源,經(jīng)比對,最終的硬件設備參數(shù)及型號見表1。
表1 硬件設備參數(shù)及型號
將系統(tǒng)采集的工件圖像借助所改進的方法進行識別,根據(jù)識別結果進行定位,獲取工件位置信息和工件位置。經(jīng)對比,所獲得的結果與工件狀態(tài)和所處位置相符,證明方法的可行性和有效性。
綜上所述,文章對現(xiàn)階段基于機器學習的計算機視覺系統(tǒng)網(wǎng)絡圖像識別方法進行介紹,發(fā)現(xiàn)在降維處理中存在一定問題,需利用優(yōu)化數(shù)據(jù)結構提升數(shù)據(jù)的直觀度和可視化水平的方式保證降維效果。 為此,設計一種利用結構平衡網(wǎng)絡的改進方法。 所設計的改進方法形成的結構平衡矩陣符合四中心陣的井字帶特點,形成的像目標結構平衡矩陣表示為:Gk =Ak°(P + PT),子集均具備四中心陣的井字帶特點。 通過搭建計算機視覺系統(tǒng),選擇硬件設備,識別工件狀態(tài)和位置,發(fā)現(xiàn)識別結果與工件狀態(tài)和所處位置相符,說明改進方法切實可行,能夠應用于實踐中。