(浙江交通職業(yè)技術學院機電與航空學院,浙江 杭州311112)
機器視覺技術具有快速、精確、直觀、穩(wěn)定等諸多優(yōu)點,在工業(yè)、農業(yè)、交通、醫(yī)學等各種重要領域有著非常廣泛的應用。目前對機器視覺應用的需求越來越多,針對物體識別的機器視覺應用已經成為熱門。目前普遍采用的傳統(tǒng)物體識別框架為先訓練,后識別,訓練和識別過程分開進行[1-3],訓練和識別分離的框架有一定的局限性,針對新物體和變化的環(huán)境,需重新訓練,適應性差,實時性低,自主學習能力弱,這些問題限制了識別系統(tǒng)智能的進一步提高。針對這些問題,研究人員提出的在線識別框架在一定程度上解決了以上問題,但仍然有不少困難。文獻[4]將增量學習向量量化算法和在線向量量化算法結合,提出一種針對在線物體識別的算法,在3 h 內針對50個物體的分層特征進行了在線學習識別。但該方法存在特征提取維度高,計算量大的缺點。文獻[5-7]在特征提取上采用主成分分析方法,較好壓縮數(shù)據量,計算開銷降低,但容易丟失部分重要信息,因此,提出一種既能保證識別精確性又能保證計算實時性的在線識別算法能很大程度改進上述問題。本文提出一種基于自適應仿生網絡的識別算法,算法通過多層神經網絡模擬人類記憶結構,將學習到的物體知識存儲之網絡節(jié)點,使得系統(tǒng)可在線學習新的陌生物體。
目前大多數(shù)分類器或者學習算法以離線學習為主,而非在線形式。針對非特定物體的在線識別,需要根據不同類別的樣本進行自主調整、增加樣本知識。文獻[8]提出一種可變結構的自組織網絡,該網絡可針對一般分布的數(shù)據進行無監(jiān)督的在線和增量式的學習,調整網絡節(jié)點和權值,具有較好的抗噪能力。該網絡符合在線識別中可自適應調整學習類別的要求,且在結構上模擬了人類記憶結構,因此適用于非特定物體在線識別。
自適應仿生神經網絡的結構與學習過程如圖1所示,需要識別的樣本物體圖片作為網絡輸入,網絡分3層,第一層輸入層后,經過兩個競爭層,在第二競爭層中生成聚類,以節(jié)點形式存儲和分類物體類別,即知識,并且該網絡節(jié)點結構可隨著增量的外部識別類別而增加調整,實現(xiàn)自適應的在線識別物體的目的。其中網絡核心競爭原理的數(shù)學描述為其中,x為輸入模式,wj為神經元j的權值向量,?定義了神經網絡,滿足該條件的神經元i為競爭獲勝神經元。
圖1 自適應仿生神經網絡結構
根據網絡學習原理,自適應仿生網絡的學習與識別算法流程如下。
符號定義:ξ為新樣本,l為網絡節(jié)點,Wc為節(jié)點權值向量,ε1(t)是勝者節(jié)點權值學習率,ε2(t)是勝者近鄰節(jié)點權值學習率,ΔW為權值更新量,E為節(jié)點積累誤差,A為網絡節(jié)點集合。
1)自適應仿生網絡輸入新物體圖片樣本ξ;
4)計算輸入信號與勝者節(jié)點的歐氏距離,并進一步計算積累誤差
5)獲得當前物體樣本的類別判斷,如果是新類,那么在網絡中新增類別向量,作為新學習知識;如果是已學習類別,那么作出識別判斷;
6)若達到學習次數(shù)的閾值LT,則輸出類別數(shù)和類別;
7)返回步驟1,新樣本繼續(xù)輸入,進行下一步的學習與識別。
實驗使用150個物體樣本進行實驗,實驗比較本文方法與傳統(tǒng)框架的PCA 方法進行物體識別的效果,主要比較識別率和識別時間,以及對新物體進行學習的系統(tǒng)擴展能力。
實驗結果識別率比較如圖2所示。對本文算法和傳統(tǒng)PCA 方法采用不同的學習方式,本文算法由于有在線學習能力,采用在線遞增新樣本方式,傳統(tǒng)PCA 方法每次學習固定的樣本數(shù),每次增添新樣本,則重新批量學習。隨著學習次數(shù)的增加,每次學習為在線學習新物體,本文方法識別率能隨著學習過程不斷提高,而傳統(tǒng)PCA 每次批量學習后的識別率固定不變,可見本文方法具有對新物體的自適應能力,在前100個樣本的學習過程中,但隨著樣本的增多,識別率得到逐步改善,但識別率比傳統(tǒng)方法略低,在樣本數(shù)從100 增加到150的學習過程中,本文方法的識別率開始好于傳統(tǒng)PCA 方法,可見,本文方法在對新樣本的適應性和識別率方面,經過不斷學習,都好于傳統(tǒng)PCA 方法。
圖2 實驗結果識別率比較
同時,在識別時間上的比較如圖3所示??梢姡疚乃惴芫S持在一定的時間上,不會因為樣本的增加而增加,實現(xiàn)較好的實時性。因此,采用本文提出的基于自適應仿生網絡在線識別算法進行物體的在線識別,可以使得識別在線進行,知識得到不斷更新,遇到新情況不需要重新學習。隨著知識在線積累,識別系統(tǒng)有更好的可擴展性、適應性和魯棒性。
圖3 實驗識別時間比較
本文針對傳統(tǒng)識別框架不能適應新物體,造成可擴展性、實時性、適應性差的問題,提出一種基于自適應仿生網絡的識別算法,以多層神經網絡模擬人類記憶結構,使得系統(tǒng)可在線學習新的陌生物體。本文的研究能有效改變傳統(tǒng)識別框架帶來的局限,能夠在線識別非特定的多種物體。通過算法建立一種在線的非特定物體識別框架,在一定程度上拓展了圖像識別算法的傳統(tǒng)框架,為進一步提高系統(tǒng)智能提供了一種思路。當然本文算法也存在一定的問題,如相比傳統(tǒng)訓練再分類方法,該方法在線存儲節(jié)點方式,需要耗費內存,需要在今后的研究中提出新的解決思路,降低內存消耗。
[1]Je H,Kim J,Kim D.Hand gesture recognition to understand musical conducting action[C]//Robot and Human interactive Communication,2007.RO-MAN 2007.The 16th IEEE International Symposium on.IEEE,2007:163-168.
[2]Fang Y,Wang K,Cheng J,et al.A real-time hand gesture recognition method[C]//Multimedia and Expo,2007 IEEE International Conference on.IEEE,2007:995-998.
[3]Bosch A,Zisserman A,Muoz X.Scene classification using a hybrid generative/discriminative approach[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2008,30(4):712-727.
[4]Kirstein S,Wersing H,K?rner E.A biologically motivated visual memory architecture for online learning of objects[J].Neural Networks,2008,21(1):65-77.
[5]Ozawa S,Pang S,Kasabov N..A Modified Incremental Principal Component Analysis for On-line Learning of Feature Space and Classifier[J].Trends in Artificial Intelligence,2004:231-240.
[6]Jiang X,Motai Y.Learning by observation of robotic tasks using on-line pca-based eigen behavior[C]//Computational Intelligence in Robotics and Automation,2005.CIRA 2005.Proceedings.2005 IEEE International Symposium on.IEEE,2005:391-396.
[7]Artac M,Jogan M,Leonardis A.Incremental PCA for on-line visual learning and recognition[C]//Pattern Recognition,2002.Proceedings.16th International Conference on.IEEE,2002,3:781-784.
[8]Furao S,Hasegawa O.An incremental network for on-line unsupervised classification and topology learning[J].Neural Networks,2006,19(1):90-106.