陳佩峰
摘要:電子鼻是一種模仿生物嗅覺的綜合仿真系統(tǒng),它可以用來辨別許多復雜的樣本,其中用于辨別和分析氣體化學成分的仿真系統(tǒng)應(yīng)用較為廣泛,而對復雜混合氣體的分析判斷和定性識別是電子鼻技術(shù)應(yīng)用的重要方面。本文在分析研究電子鼻原理和基本構(gòu)成的基礎(chǔ)上,重點運用誤差回傳神經(jīng)網(wǎng)絡(luò)(BP)和自組織特征映射網(wǎng)絡(luò)(SOM)神經(jīng)網(wǎng)絡(luò)進行電子鼻系統(tǒng)的定性識別,對三種氣體傳感器(一氧化碳CO、二氧化硫SO2、二氧化氮NO2)輸出的數(shù)據(jù)進行了仿真、分析和識別,仿真結(jié)果表明這兩種方法的識別準確率都能達到100%。并且自組織特征映射網(wǎng)絡(luò)(SOM)算法的識別能力在整體上要優(yōu)于誤差回傳神經(jīng)網(wǎng)絡(luò)(BP)算法。
關(guān)鍵詞:電子鼻;誤差回傳神經(jīng)網(wǎng)絡(luò)(BP)算法;自組織特征映射網(wǎng)絡(luò)(SOM)算法;MATLAB仿真
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2018)11-0168-04
Identify Method for Electronic Nose Based on BP and SOM Neural Network
CHEN Pei-feng
(Jilin Radio and Television University, Changchun 130022,China)
Abstract: Electronic nose ,a novel system ,is used to measure the chemical composition of gas, which is designed like the biological olfactory system .To identify the complicated odor is the important aspect of the application electronic nose. Based on the study of the theory and constituent of the electronic nose system, Back-Propagation Neural Network (BP) and Self-Organizing Feature Map (SOM), the two kinds of neural network models application to the qualitative analysis in an electronic nose system are utilized in the paper. And the dates output from three gas sensors (CO,SO2,NO2) are emulated, analyzed and identified. The result shows that preciseness rate of the two recognitions reaches 100%. Through this emulation, the identify capacity of SOM is better than BP in entirety.
Key words: electronic nose;Back-Propagation Neural Network (BP); Self-Organizing Feature Map (SOM);MATLAB simulation
電子鼻是一種模仿生物嗅覺的綜合仿真系統(tǒng),它可以用來辨別許多復雜的樣本,其中用于辨別和分析氣體化學成分的仿真系統(tǒng)應(yīng)用最為廣泛,而這種應(yīng)用中,對復雜混合氣體的分析判斷和定性識別是電子鼻技術(shù)應(yīng)用的重要方面。研制開發(fā)的一個用來監(jiān)測、識別和分析氣體的系統(tǒng)[1],其主要目的是把幾種氣體傳感器通過微電子集成,形成一個多傳感器的仿真系統(tǒng),通過這個傳感器系統(tǒng),同時感應(yīng)多種氣體成分,達到檢測、識別和分析氣體的功能[2]。
近幾年來,隨著國內(nèi)外對電子鼻系統(tǒng)研究的深入,研究人員對電子鼻的識別算法研究也越來越多,越來越深入。如:針對普通BP網(wǎng)絡(luò)一些缺點,王平[3]等采用了具有側(cè)向聯(lián)想較強識別能力的SOM網(wǎng)絡(luò),實現(xiàn)了七種特殊氣體的辨識分析,其平均識別正確率均為91%以上,達到甚至高于常人的識別能力。盡管如此,但由于SOM采用的是歐氏距離,樣本的相關(guān)性和整體性都較差,為此王平、謝軍[4]等提出了一種把RBF和FCMA結(jié)合起來的算法,該算法具有FCMA的性能好,速度快等優(yōu)點,而且樣本的相關(guān)性和樣本集的整體特性都很強。此外,肖人岳、鄭思平等 [5]針對SOM的網(wǎng)絡(luò)結(jié)構(gòu)中存在對新生成神經(jīng)元的限制和人工需預先給定神經(jīng)元閾值的這兩個缺點,提出了改進的SOM算法。該算法不僅可以排除噪聲和異常數(shù)據(jù),無需預設(shè)神經(jīng)元數(shù)目,解決了新生神經(jīng)元限制,而且可以實現(xiàn)自組織無監(jiān)督式學習。通過對人體細胞樣本特征集的分析,算法可以在剔除異常數(shù)據(jù)點的同時,較好的實現(xiàn)對良性細胞樣本和惡性細胞樣本的聚類。王巖,陳向東,趙靜[6]等人的基于FastICA和神經(jīng)網(wǎng)絡(luò)的模式識別研究更是將電子鼻識別氣體的準確率再次提高。馮偉和胡上序采用的基于神經(jīng)網(wǎng)絡(luò)的雜交算法而進行的3種化學品的實驗識別證明,該方法的識別準確率可以達到95%,是更好的模式分類方法。朱培逸、顧曉云[7]等人利用SOM網(wǎng)絡(luò),對檢測不同儲存時長的大閘蟹所得氣味數(shù)據(jù)進行分析,將多維傳感器特征數(shù)據(jù)作為網(wǎng)絡(luò)輸入層節(jié)點,將樣本所對應(yīng)的不同儲存天數(shù)作為輸出層節(jié)點,其評價準確率為95%,他們認為SOM網(wǎng)絡(luò)模型能夠有效地評價大閘蟹新鮮度,該研究為電子鼻實現(xiàn)活體水產(chǎn)品新鮮度無損檢測提供了理論依據(jù)。
本文運用誤差回傳神經(jīng)網(wǎng)絡(luò)(BP)和自組織特征映射網(wǎng)絡(luò)(SOM)神經(jīng)網(wǎng)絡(luò)進行電子鼻系統(tǒng)的定性識別,對三種氣體傳感器(一氧化碳CO、二氧化硫SO2、二氧化氮NO2)輸出的數(shù)據(jù)進行了仿真、分析和識別。
1電子鼻的結(jié)構(gòu)和工作原理
1.1 電子鼻的結(jié)構(gòu)
電子鼻由軟件部分和硬件部分組成,軟件部分由多個氣敏傳感器組成,硬件部分由信號處理子系統(tǒng)和模式識別子系統(tǒng)兩部分組成。
1.1.1 電子鼻硬件部分
氣敏傳感器是電子鼻檢測氣體的基本單元,電子鼻的氣體檢測部分采用交叉敏感同時具有選擇特異性的氣敏傳感器組成傳感器陣列,利用其對多種氣體的交叉敏感性和對某一特定氣體的特異性敏感特性,將不同的敏感物質(zhì)在傳感器表面的吸附脫落反應(yīng)轉(zhuǎn)化為便于后續(xù)處理分析的物理信號,實現(xiàn)混合氣體分析。
1.1.2 電子鼻軟件部分
1)信號處理子系統(tǒng)
信號處理子系統(tǒng)包括數(shù)據(jù)的預處理,特征提取和特征選擇。該子系統(tǒng)要對采集的樣本信息進行濾波降噪處理消除冗余,然后按照響應(yīng)信號特點進行適當?shù)奶卣魈崛。稍紭颖緮?shù)據(jù)集。數(shù)據(jù)預處理包括中值濾波其數(shù)據(jù)的標準化,適當?shù)牟捎脤?shù)據(jù)的特征選擇與特征提取方法,則有利于提高計算效率、降低模式識別誤差。
2)模式識別子系統(tǒng)
模式識別是對輸入信號進行一系列的仿真處理,通過辨別、分析,獲得樣本的組成信息。
1.2 電子鼻的工作原理
電子鼻的工作原理就是模擬哺乳動物嗅覺系統(tǒng)對氣味進行感知、處理和判斷。氣味分子被單個氣敏傳感器組成的傳感器陣列吸附,發(fā)生吸附脫落反應(yīng)而產(chǎn)生物理信號;生成的物理信號傳遞至信號處理單元進行預處理和加工;并最后由模式識別單元對信號處理的結(jié)果作出判斷。
3 人工神經(jīng)網(wǎng)絡(luò)類型
本文提出了兩種結(jié)構(gòu)類型的人工神經(jīng)網(wǎng)絡(luò)用于電子鼻的定性識別,分別是誤差回傳網(wǎng)絡(luò)模型和自組織特征映射網(wǎng)絡(luò)模型。
3.1 誤差回傳網(wǎng)絡(luò)模型
BP網(wǎng)絡(luò)即誤差回傳神經(jīng)網(wǎng)絡(luò)(Back-Propagation Neural Network), 神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用最為廣泛和成功的神經(jīng)網(wǎng)絡(luò)之一,它是一種無反饋的前向網(wǎng)絡(luò),輸入樣本前向傳播并輸出結(jié)果、誤差的反向傳播更新網(wǎng)絡(luò)權(quán)值。網(wǎng)絡(luò)中的神經(jīng)元分層進行排列,神經(jīng)元層可以分為輸入層、隱含層和輸出層。輸入樣本數(shù)據(jù)前向傳播的時候,傳播順序為:由輸入層傳入,經(jīng)隱含層處理后傳到輸出層,由于網(wǎng)絡(luò)中每一層的層內(nèi)神經(jīng)元并無連接,而是由各相鄰層之間的神經(jīng)元相連接, 使整個網(wǎng)絡(luò)的特性取決于網(wǎng)絡(luò)神經(jīng)元上的閾值以及相鄰層之間神經(jīng)元的連接權(quán)。
設(shè)BP網(wǎng)絡(luò)為三層網(wǎng)絡(luò),輸入神經(jīng)元以i編號,隱蔽層神經(jīng)元以j編號,輸出層神經(jīng)元以k編號,如圖2:
3.2 自組織特征映射網(wǎng)絡(luò)模型
自組織特征映射網(wǎng)絡(luò)(Self-Organizing Feature Map,簡稱SOM網(wǎng)絡(luò))是一個全連接的、由神經(jīng)元陣列組成的,具有無教師自組織、自學習性能的網(wǎng)絡(luò),只有輸入層和輸出層兩層。網(wǎng)絡(luò)的輸出神經(jīng)元之間在被激活的過程中相互競爭,致使在每一時刻只有一個輸出神經(jīng)元,所以,該算法又被稱為勝者為王(winner-takes-all)算法。該算法的目標就是用低維目標空間的點去表示高維原始空間的點,使得這種表示盡可能地保留原始的距離或相關(guān)性。而且,如果從原始空間到目標空間存在非線性映射結(jié)構(gòu),該算法表現(xiàn)得非常出色 [8]。
3.2.1 SOM網(wǎng)絡(luò)結(jié)構(gòu)
3.2.2 SOM網(wǎng)絡(luò)模型
由以下4個部分組成
(1)神經(jīng)單元部分。接受輸入,并對輸入形成相應(yīng)的辨識函數(shù)值(輸出函數(shù)值)。
(2)比較辨識函數(shù)。用于比較辨識處理,并且選擇一個處理單元,此單元的輸出具有最大函數(shù)值。
(3)相互激勵作用。我們選擇刺激處理單元的同時,其相鄰的單元被同時給予刺激。
(4)自我過程調(diào)整。修正被激勵的處理單元的參數(shù)(即連接權(quán)值),以增加其相應(yīng)與特定輸入的辨識函數(shù)的輸出值。
網(wǎng)絡(luò)輸入假定設(shè)為X[∈Rn],輸出神經(jīng)元[i]與輸入單元的連接權(quán)向量[wi∈Rn],則輸出神經(jīng)元[i]的輸出[oi]為:
[oi] = [wiX]
設(shè)網(wǎng)絡(luò)具有響應(yīng)的輸出單元為[k],則通過“贏者通吃”的法則,確定該神經(jīng)元,得到其輸出為:
[ok=maxioi]
4 算法仿真
在對參考文獻[9]中列舉的樣本數(shù)據(jù)進行仿真處理時,采用了一氧化碳氣體傳感器、二氧化硫氣體傳感器、二氧化氮氣體傳感器這三種不同的氣體傳感器,分別對由三種氣體成分組成的混合氣體進行辨別和分析,一共抓取30組數(shù)據(jù),分別為15個訓練樣本,15個樣本測試,然后采用Matlab語言對兩種人工神經(jīng)網(wǎng)絡(luò)進行編程。
4.1 BP模型
先將其中一組數(shù)據(jù)作為實驗采樣輸入神經(jīng)網(wǎng)絡(luò),一氧化碳期望輸出為[1,0,0]、二氧化硫期望輸出為[0,1,0]、二氧化氮期望輸出為[0,0,1],同時規(guī)定,當期望誤差達到0.001時,固定網(wǎng)絡(luò)權(quán)值和節(jié)點閾值。然后再將另外一組數(shù)據(jù)輸入網(wǎng)絡(luò),可以得到預測輸出。對于分類器規(guī)則,預測值>0.7視為1,預測值<0.3視為0,介于兩者之間視為預測無效。
輸入層的神經(jīng)元數(shù)等于氣體檢測傳感器的個數(shù),確定當隱含層的神經(jīng)元數(shù)為4時(如表1),其網(wǎng)絡(luò)誤差最小,而此時輸出的神經(jīng)元個數(shù)為3。
結(jié)果表明,在經(jīng)過24次訓練后,隱含層神經(jīng)元為4的BP網(wǎng)絡(luò)誤差最小,而且只經(jīng)過24次訓練就達到了目標誤差。雖然隱含層神經(jīng)元為7的誤差也比較小,但是它的訓練步數(shù)比隱含層神經(jīng)元為4的訓練步數(shù)多,所以這里將神經(jīng)元數(shù)目設(shè)定為4。
網(wǎng)絡(luò)的結(jié)構(gòu)為3:4:3。網(wǎng)絡(luò)的初始值和節(jié)點閾值固定不變。誤差指標設(shè)定為0.001,訓練步數(shù)最大值為1000。根據(jù)Matlab程序,可知經(jīng)過18次訓練后,網(wǎng)絡(luò)目標就達到了要求。其訓練結(jié)果如圖4。
由此可見,當誤差指標取0.001時,BP網(wǎng)絡(luò)模型訓練步數(shù)是18,氣體識別準確率為100%。
4.2 SOM模型
首先利用三個傳感器輸出響應(yīng)作為神經(jīng)網(wǎng)絡(luò)的輸入,三個氣體傳感器作為神經(jīng)網(wǎng)絡(luò)的輸出,構(gòu)建SOM模型。每一個樣本用3個傳感器輸出響應(yīng)表示其性狀,確定網(wǎng)絡(luò)的輸入模式為:
[Pk=Pk1,Pk2,Pk3]
利用函數(shù)newsom創(chuàng)建一個SOM網(wǎng)絡(luò)。其中,p為輸入向量,minmax(p)指定了輸入向量元素的最大值和最小值,[5 6]表示創(chuàng)建網(wǎng)絡(luò)的競爭層為5*6的結(jié)構(gòu),并且網(wǎng)絡(luò)結(jié)構(gòu)可調(diào)。
然后利用函數(shù)train對網(wǎng)絡(luò)進行訓練,網(wǎng)絡(luò)的仿真則通過函數(shù)sim實現(xiàn)。由于網(wǎng)絡(luò)的聚類性能與算法訓練步數(shù)選取息息相關(guān)。這里設(shè)置訓練步數(shù)為1、2、3、4、5、6,分別觀察其聚類結(jié)果。其運行結(jié)果如表3。
根據(jù)結(jié)果可以看出:在步數(shù)6之前,氣體識別都有一定的誤差。當步數(shù)為6時,氣體分類準確率為100%。SOM算法的訓練時間較短,步數(shù)較少,能準確地識別氣體。
從結(jié)果中可以看到,BP模型學習時間長,訓練步數(shù)多,而SOM模型的學習時間較短,而且其訓練步數(shù)要明顯少于BP模型。在該仿真中,自組織特征映射網(wǎng)絡(luò)(SOM)算法的識別能力在整體上要優(yōu)于誤差回傳神經(jīng)網(wǎng)絡(luò)(BP)算法。
BP算法網(wǎng)絡(luò)具有一定的容錯能力,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)簡單、加速訓練過程,增加網(wǎng)絡(luò)在模式識別應(yīng)用中的推廣能力。而且,識別精度較高,滿足了實際應(yīng)用需要的要求。但是BP算法仍存在一些不足之處:
1)由于它是一種非線性運算,對初始網(wǎng)絡(luò)非常敏感,權(quán)值收斂到局部極小點,從而導致網(wǎng)絡(luò)訓練失敗,得不到最優(yōu)解[10];
2)算法的收斂速度較慢,常需要數(shù)千步運算[11];
3)選擇神經(jīng)網(wǎng)絡(luò)隱含層包含的結(jié)點個數(shù)尚無理論基礎(chǔ),而是依據(jù)經(jīng)驗公式選取[12];
4)網(wǎng)絡(luò)在學習新樣本時,存在遺忘部分已學習樣本的缺陷,并要求每個樣本特征的數(shù)目劃分一致[13];
5)BP算法中兩個重要系數(shù)(學習率[η]和動量系數(shù)[α])全憑經(jīng)驗給定[14]。
SOM神經(jīng)網(wǎng)絡(luò)具有拓撲保持和概率分布保持的優(yōu)良特性,具有無監(jiān)督自學習,非線性問題求解能力強,診斷結(jié)果簡單、直觀的特點。而且SOM網(wǎng)絡(luò)能夠處理不精確、不完全的模糊信息:同時能夠并行分布工作。網(wǎng)絡(luò)總體的運算速度極快。SOM網(wǎng)絡(luò)還可以增加指標權(quán)重判定的客觀性,并可以減少由不同操作者對權(quán)重賦值的不確定性。在SOM網(wǎng)絡(luò)中,輸入初始數(shù)據(jù)矩陣和預設(shè)的函數(shù),經(jīng)過網(wǎng)絡(luò)自身的訓練和學習,不需要任何外界作用,就能得到最終的聚類結(jié)果。自組織映射對存儲容量要求不高。但在越來越多的實踐研究發(fā)現(xiàn),SOM中預設(shè)的網(wǎng)絡(luò)拓撲結(jié)構(gòu)包含對結(jié)果應(yīng)設(shè)的限制,通常只有在訓練結(jié)束之后才發(fā)現(xiàn)網(wǎng)絡(luò)拓撲結(jié)構(gòu)的差異將導致聚類結(jié)果的差異;SOM中的預設(shè)網(wǎng)絡(luò)拓撲結(jié)構(gòu)帶來了神經(jīng)元欠利用、網(wǎng)絡(luò)映射欠準確以及邊緣效應(yīng)等缺陷;大多數(shù)情況下,并沒有先驗理論基礎(chǔ)能讓我們預先去選擇一個合適的網(wǎng)絡(luò)規(guī)模,所以這些因素嚴重地影響了SOM的應(yīng)用。
5 結(jié)論
本文采用BP和SOM神經(jīng)網(wǎng)絡(luò)對電子鼻進行了CO、SO2、NO2三種氣體識別的仿真實驗,仿真結(jié)果表明這兩種方法均可以有效地對氣體進行定性識別,且SOM算法的識別能力在整體上要優(yōu)于BP算法。
參考文獻:
[1] 蔣雪松, 胡立挺, 陳卉卉,等. 食品中農(nóng)藥殘留的電子鼻檢測識別研究[J]. 南方農(nóng)機, 2016(12):22-24.
[2] Baietto M, Wilson A D. Electronic-nose applications for fruit identification, ripeness and quality grading[J]. Sensors, 2015, 15(1):899-931.
[3] 王平,陳裕泉,吳堅,等.人工嗅覺—電子鼻的研究[J].中國生物醫(yī)學工程學報,1996,15(4):346-353.
[4] Wang Ping, Xie Jun. A novel recognition method for electronic nose using artificial neural network and fuzzy recognition [J].Sensors and Actuators, 1996,B37:169-174.
[5] 鄭思平. 一種改進的動態(tài)SOM算法及其在聚類中的應(yīng)用[D].華南理工大學, 2010.
[6] 王巖,陳向東,趙靜.基于Fast ICA和神經(jīng)網(wǎng)絡(luò)的電子鼻模式識別[J].傳感技術(shù)學報,2007,20(1):38-41.
[7] 朱培逸, 顧曉云, 杜潔,等. 基于KPCA和SOM網(wǎng)絡(luò)的電子鼻大閘蟹新鮮度評價[J]. 食品工業(yè), 2017(2):200-203.
[8] 飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與matlab 7實現(xiàn)[M] .北京:電子工業(yè)出版社,2005.
[9] 王瑋.基于氣體傳感器陣列的混合氣體檢測系統(tǒng)[D].西北工業(yè)大學碩士學位論文,2002,3.
[10] 張航. 基于硬件實現(xiàn)BP神經(jīng)網(wǎng)絡(luò)的電子鼻設(shè)計[D]. 西南交通大學, 2015.
[11] 張虹艷, 丁武. 基于Fisher線性判別和BP神經(jīng)網(wǎng)絡(luò)的電子鼻羊奶貯藏時間預測[J]. 中國食品學報, 2012, 12(6):166-173.
[12] Zhang H, Chang M, Wang J, et al. Evaluation of peach quality indices using an electronic nose by MLR, QPST and BP network[J]. Sensors & Actuators B Chemical, 2008, 134(1):332-338.
[13] Yu H, Peng P, Yin Y, et al. Coupled Electronic Nose and BP Neural Network to Study on the Predicting Model of Zearalenone and Aflatoxin B1[J]. Journal of the Chinese Cereals & Oils Association, 2017, 32(5):117-121.
[14] 韋彩虹. 基于電子鼻系統(tǒng)的混合氣體的定性分析和定量估計[D]. 浙江大學, 2012.
[15] Gardner J W,Bartlett P N. A brief history of electronic nose[J]. Sensors and Actuators B,1994,18(19):211-220.
[16] Barbria N E,Llobet E. Application of a portable electronic nose system to assess the freshness of Moroccan sardines [J]. Materials Science and Engineering C,2008 (28):666-670.
[17] 韓力群.人工神經(jīng)網(wǎng)絡(luò)教程[M].北京:北京郵電大學出版社,2006.
[18] 吳春生, 王麗江, 劉清君. 嗅覺傳導機理及仿生嗅覺傳感器的研究進展[J]. 科學通報, 2007, 52(12): 1362—1371.