楊艷菊 黃成鈞
(銅陵學院,安徽銅陵 244000)
人工神經(jīng)網(wǎng)絡的蘋果氣體識別算法研究
楊艷菊 黃成鈞
(銅陵學院,安徽銅陵 244000)
文章介紹了由氣敏傳感器陣列與人工神經(jīng)網(wǎng)絡模式識別技術相結合的人工嗅覺系統(tǒng)對蘋果氣味的定性識別,嘗試運用主成分分析改進BP算法和最近鄰k-均值聚類算法,實現(xiàn)對“好”和“壞”蘋果氣味的定性識別。試驗結果表明:采用主成分分析結合BP算法和最近鄰k-均值聚類算法對“好”和“壞”蘋果氣味準確率為91.67%和95.83%,而且大大的縮短了辨識時間。
人工嗅覺系統(tǒng);主成分分析;氣體傳感器陣列
電子鼻由氣體傳感器陣列、信號預處理和模式識別三大部分組成。電子鼻識別氣味的主要機理是在陣列中的每個傳感器對被測氣體都有不同的靈敏度。但是用于敏感氣體或氣味的傳感器通常存在著嚴重的“交叉敏”問題,因而在實際應用中難以滿足測量精度的要求。近年來,研究人員開始將氣敏傳感器陣列與模式識別技術相結合,形成模擬人類和其他哺乳動物嗅覺機理的人工嗅覺系統(tǒng)。實踐證明,人工嗅覺系統(tǒng)是解決氣敏傳感器“交叉敏”問題的一種有效途徑。目前采用的模式識別法:主成分分析法(PCA)、偏最小二乘法(PLS)、最小鄰域法(KNN)、歐幾里德聚類分析法(ECA)和人工神經(jīng)網(wǎng)絡法(ANN)等在電子鼻領域都有應用。由于人工神經(jīng)網(wǎng)絡能夠處理非線性數(shù)據(jù),能夠容忍傳感器的漂移和誤差,并具有較高的預測精度,因而越來越引起人工嗅覺研究人員們的重視。
本文用八個半導體氣敏傳感器構成傳感器陣列,結合改進BP算法和最近鄰-k均值RBF算法形成人工嗅覺系統(tǒng),并對“好”和“壞”蘋果氣味進行識別[1]。本研究采用日本費加羅(Figro)公司生產的八個厚膜金屬氧化物錫傳感器(TGS800,TGS822、TGS813,TGS824,TGS825,TGS2600,TGS2610,TGS2620)。實驗結果表明用BP算法和RBF算法對蘋果氣味的原始數(shù)據(jù)和主成分分析后的數(shù)據(jù)進行處理,其辨識結果都在91.67%以上。從而證明主成分分析法結合人工神經(jīng)網(wǎng)絡為模式辨識提供了一種有效的方法。
本文設計的電子鼻測量系統(tǒng)由四個基本單元組成:氣體產生室(容積12升的玻璃箱),測量室(容積2升的密封塑料盒),A/D轉換模塊和一臺負責數(shù)據(jù)采集和處理的電腦(見圖1)。蘋果揮發(fā)物主要成分是乙烯、乙醇、丁醇、丙醇等碳氫化合物。通過分析選取對這些氣體比較“敏感”的錫氧化物氣體傳感器組成傳感器陣列對蘋果揮發(fā)氣體進行分析。每一次測量時將氣體室、測量室與空氣充分接觸,達到一個穩(wěn)定的標準狀態(tài),然后在氣體室中放蘋果(大小、重量相當),密封好放置24小時后打開閥門讓氣體通過管道與測量室中的傳感器陣列充分的接觸(約一個小時,這一過程使傳感器在測量階段有足夠的時間與蘋果氣體進行反應)。每一類樣本分析后再讓氣體室和測量室與空氣充分接觸,傳感器恢復初始狀態(tài),以便下次測量。實驗的測量系統(tǒng)如圖1所示。
圖1 測量系統(tǒng)的原理圖
傳感器陣列采集的信號是模擬信號,經(jīng)模數(shù)轉換器(ADAM-4019)轉化為數(shù)字信號后,通過RS-232接口傳送給電腦進行處理。數(shù)據(jù)分析是在CPU主頻為2.4G、內存512 M的計算機上用VC++6.0編程實現(xiàn)的。
圖2 蘋果氣味的數(shù)據(jù)采集
2.1 主成分分析
主成分分析(Principle components analysis-PCA)是把多指標轉化為少數(shù)幾個綜合指標的多元統(tǒng)計分析方法。主成分PCk的表達形式如下:
其中X是輸入數(shù)據(jù)矩陣,K為主成分為主成分序號,n為數(shù)據(jù)的維數(shù),aik為系數(shù)。
在PCA學習中,對原始數(shù)據(jù)矩陣標準化后數(shù)據(jù)的相關矩陣[2]進行分析,得到主成分。主成分分析的主要特點是通過數(shù)據(jù)坐標軸的變化得到新的圖示——得分圖和負荷圖[3]。得分圖經(jīng)常被用來研究數(shù)據(jù)聚類、分類;負荷圖被用來表示原始數(shù)據(jù)和每個主成分的相關性。主成分分析實際上是選取主分量的過程,而分類辨識則要用到模式辨識算法。
2.2 反向傳播學習算法
2.3 徑向基函數(shù)神經(jīng)網(wǎng)絡
徑向基函數(shù)(Radial Basis Function-RBF)神經(jīng)網(wǎng)絡,在選取RBF基函數(shù)中心時采用了最近鄰聚類學習算法[5]和K-均值聚類算法[6]相結合的方法。其訓練規(guī)則如下:
(1)選擇一個適當?shù)母咚购瘮?shù)寬度r,定義一個矢量A(L)用于存放屬于各類的輸入矢量之和,定義一個計數(shù)器B(L)用于統(tǒng)計屬于各類的樣本個數(shù),其中L為類別數(shù)。
(2)從第一個數(shù)據(jù)X1開始,在X1上建立一個聚類中心,令C1=X1,A(1)=C1,B(1)=1。這樣建立的RBF網(wǎng)絡,只有一個隱單元,該隱單元的中心為C1。
輸出層線形權的計算采用梯度下降算法。
3.1 實驗系統(tǒng)
實驗用品是從超市購買的紅富士蘋果,將蘋果分成兩類:一類“好”的富士蘋果15個(大小、顏色相近);一類“壞”的蘋果5個有部分褐斑或腐爛的蘋果和10個好的蘋果。實驗時將蘋果按類分別放入密閉容器內24小時后進行測試。實驗數(shù)據(jù)每類蘋果取20組樣本(12個樣本作為訓練樣本,8個樣本作為測試樣本),兩類蘋果共40組樣本進行分析。
實驗器件采用的半導體傳感器組成傳感器陣列,組成人工嗅覺系統(tǒng)前端的感應部分。傳感器陣列用的是日本費加羅公司的八個傳感器,并加入了溫度傳感器和濕度傳感器模塊,觀測測試過程中的溫度、濕度。
在氣體識別中,為了提高辨識效果,需要對傳感器的輸出信號進行預處理,以基本消除氣體濃度對輸出的影響。假設金屬氧化物半導體的電導用G表示,傳感器i對氣體樣本j產生的響應用Gi,j表示,則n個傳感器組成的陣列對氣體樣本j的響應是n維狀態(tài)空間上的一個矢量Gj:Gj={g1,j,g2,j…,gn,j},預處理算法為:
式中Gi,0-傳感器i在純凈空氣中的電導,經(jīng)過處理后的矢量:Xj={X1,j,X2,j,…,Xn,j}作為網(wǎng)絡的實際輸入。
3.2 辨識結果
圖3顯示了電子鼻[7]檢測和區(qū)分不同程度蘋果的PCA分析圖。在PCA分析中,第一主成分PC1和第二主成分PC2的貢獻率分別為95.46%,3.03%,前兩個主成分累積占到所有信息量的98.49%。由崖底碎石圖[8]確定了主成分適合的個數(shù)為2,即2個主成分即可取代原來8個變量來進行模式識別。
圖3 PCA分析圖
圖4是兩種樣本在PC1和PC2上的得分圖和負荷圖,從圖(a)中可以看出,“好”蘋果和“壞”蘋果可以明顯地分開。在圖(b)中有相似的負荷,相似的負荷代表冗余度,所以在原始數(shù)據(jù)中有冗余的信息,可以用五個傳感器陣列代替原八個傳感器陣列[9]。
圖4 好蘋果和壞蘋果的得分圖和負荷圖
在圖5中橫坐標代表訓練次數(shù),縱坐標代表總的訓練誤差??梢钥闯鯞P經(jīng)過4251次訓練后誤差收斂到0.001;對于RBF算法,最終的訓練次數(shù)為49627,誤差為0.01,兩種算法的辨識結果在網(wǎng)絡輸出值上不同,但識別結果兩者相同,辨識結果見下表。
表1說明BP算法和K均值與最近鄰RBF算法對原始數(shù)據(jù)的分類正確率分別為91.67%,95.83%。在BP和RBF兩種算法中,BP算法訓練用的時間較RBF少,但辨識率較RBF低;經(jīng)過主成分分析后,BP和RBF兩種算法訓練時間都縮短很多。
圖5 訓練的誤差和訓練次數(shù)仿真
表1 BP網(wǎng)絡和K均RBF網(wǎng)絡的計算結果
該研究分別對“好”和“壞”蘋果在測試環(huán)境以及測試溫度相同的條件下,運用8個傳感器陣列構成的8維數(shù)據(jù)作為原始數(shù)據(jù)樣本,在BP和RBF兩種算法中,分類正確率分別為91.67%,95.83%,BP算法訓練用的時間較RBF少,但辨識率較RBF低;通過PCA分析之后,可以將維數(shù)減小到兩維,辨識的時間卻大大的減少。這說明應用PCA分析在處理模式辨識問題上速度更快,同時可以得到滿意的結果,為人工嗅覺系統(tǒng)在實際環(huán)境中的應用打下了基礎。
[1]趙杰文,劉木華,潘胤飛,鄒小波.遺傳算法優(yōu)化BP及RBF神經(jīng)網(wǎng)絡用于蘋果氣味分類[J].江蘇大學學報(自然科學版),2004,25 (2):39-42.
[2]孟德順.PCA應用中的幾個問題[J].西北林學院學報,1995,10(1):89-94.
[3]M.Penza etc.Application of principal component analysis and artificial neural networks to recognize the individual VOCs of methanol/2-propanol in a binary mixture by SAW multi-sensor array[J].Sensors and Actuators B,2003,(89):269-284.
[4]王洪元,史國棟.人工神經(jīng)網(wǎng)絡技術及其應用[M].北京:中國石化出版社,2002.29-40.
[5]朱明星,張德龍.RBF網(wǎng)絡基函數(shù)中心選取算法的研究[J].安徽大學學報(自然科學版),2000,24(1):72-78.
[6]徐秉錚,張百靈,韋崗.神經(jīng)網(wǎng)絡理論與應[M].廣州:華南理工大學出版社,1994.312-316.
[7]J.Brezmes,etc.Fruit ripeness monitoring using an Electronic Nose[J].Sensors and Actuators B,2000,(69):223-229.
[8]J.Brezmes,E.Llobet,X.Vilanova,J.Orts,G.Saiz,X.Correig.Correlation between electronic nose signals and fruit quality indicators on shelf-life measurements with pinklady apples[J].Sensors and Actuators B,2001,(80):41-50.
[9]Richard A.Johnson,Dean W.Wichern.實用多元統(tǒng)計分析[M].北京:清華大學出版社,2003.358-361.
TP21
:A
:1672-0547(2010)02-0076-03
2009-10-19
楊艷菊(1981-),女,河南周口人,銅陵學院電氣工程系教師,碩士。