閆嘉 陳飛越 易若男 王子健
(1.智能傳動(dòng)和控制技術(shù)國家地方聯(lián)合工程實(shí)驗(yàn)室(重慶),重慶 400715;2.西南大學(xué) 人工智能學(xué)院,重慶 400715;3.西南大學(xué) 電子信息工程學(xué)院,重慶 400715)
電子鼻也稱之為人工嗅覺系統(tǒng),其靈感來源于生物嗅覺系統(tǒng),主要用來分析、識(shí)別和檢測(cè)不同氣味。一般的電子鼻系統(tǒng)包含3個(gè)模塊:傳感器陣列、數(shù)據(jù)處理模塊和模式識(shí)別模塊。傳感器陣列由不同選擇性和靈敏度的氣敏傳感器組成,由于金屬氧化物半導(dǎo)體(MOS)傳感器具有良好的交叉敏感性、簡單的調(diào)理電路以及低廉的價(jià)格等優(yōu)點(diǎn),使其成為構(gòu)成電子鼻氣體傳感器陣列最為常用的傳感器。數(shù)據(jù)處理模塊對(duì)收集到的信號(hào)進(jìn)行放大、濾波、特征提取與選擇、歸一化、特征空間重構(gòu)等操作,以改善數(shù)據(jù)分布,提高后續(xù)模式分類的識(shí)別率。模式識(shí)別模塊則通過機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)氣味信息的模式分類。
由于電子鼻在食品安全[1]、環(huán)境污染檢測(cè)[2]、安檢[3]、醫(yī)療[4]等領(lǐng)域的應(yīng)用日益廣泛,因而受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。在過去的20年間,許多的研究人員對(duì)電子鼻的結(jié)構(gòu)、應(yīng)用和算法進(jìn)行了大量的創(chuàng)新。Flammini等[5]提出了一個(gè)大范圍變化的高阻值傳感器的低成本接口設(shè)計(jì),該方法可以有效提高整個(gè)傳感器陣列的分辨率,并且降低陣列的成本;Fernandez等[6]設(shè)計(jì)了一個(gè)具有96個(gè)MOS傳感器的高冗余傳感器陣列,證明了冗余的傳感器信息對(duì)于提高傳感器陣列的性能有一定的幫助;Dutta等[7]設(shè)計(jì)了一個(gè)具有4個(gè)MOS傳感器的電子鼻,通過對(duì)茶葉頂空氣體的檢測(cè),實(shí)現(xiàn)了5種不同工藝下烘培的不同品質(zhì)茶葉的正確分類;Siyang等[8]利用電子鼻對(duì)尿液氣味進(jìn)行檢測(cè)以診斷糖尿??;Yolanda等[9]在電子鼻的模式識(shí)別模塊使用不同的模式識(shí)別算法對(duì)植物油進(jìn)行分類;Yan等[10]討論了3種特征提取方法對(duì)后續(xù)模式分類效果的影響,實(shí)驗(yàn)結(jié)果表明,基于動(dòng)態(tài)響應(yīng)的方法能精確識(shí)別常見的傷口感染病原菌;Herrero-Carron等[11]提出了一種主動(dòng)和被動(dòng)的溫度調(diào)制算法,大量的實(shí)驗(yàn)結(jié)果顯示,該算法具有較強(qiáng)的魯棒性,能夠?yàn)闅怏w識(shí)別提高有效的數(shù)據(jù);殷勇等[12]結(jié)合主成分分析(PCA)和Fisher判別分析研究了由13個(gè)MOS傳感器構(gòu)成的電子鼻對(duì)牛奶品質(zhì)檢測(cè)的效果。
上述方法都是要以傳感器沒有出現(xiàn)漂移為前提才能得到有效的結(jié)果。然而,在實(shí)際的工作情況中,由于傳感器自身的結(jié)構(gòu)參數(shù)發(fā)生改變(例如傳感器中毒、老化)和氣體檢測(cè)工作環(huán)境因素的波動(dòng)(例如溫度、濕度)會(huì)導(dǎo)致氣敏傳感器出現(xiàn)不可預(yù)測(cè)的漂移現(xiàn)象,這種現(xiàn)象會(huì)嚴(yán)重破壞電子鼻系統(tǒng)已構(gòu)建的模式識(shí)別模型,降低電子鼻的檢測(cè)能力[13- 15]。從目前的研究來看,傳感器漂移問題可以從兩個(gè)方向來解決。一種方法是直接對(duì)漂移的數(shù)據(jù)進(jìn)行校正,常用的一些漂移成分校正法有PCA[16]、獨(dú)立成分分析[17]等。但是這些方法的前提是漂移數(shù)據(jù)與原始數(shù)據(jù)具有相同的概率分布,然而由于傳感器漂移的非線性和不穩(wěn)定性,直接校正漂移成分的方法并不適合用來解決電子鼻應(yīng)用中出現(xiàn)的漂移問題。另一種方法是利用遷移學(xué)習(xí)算法來探求不同域之間的關(guān)系,從而實(shí)現(xiàn)跨域?qū)W習(xí)。簡單來說,該類方法的目的是通過數(shù)據(jù)的投影轉(zhuǎn)換來降低源域和目標(biāo)域之間的分布差異,用源域數(shù)據(jù)訓(xùn)練的分類器同樣可以在目標(biāo)域中得到很好的效果。Zhang等[18]考慮到源域和目標(biāo)域的概率分布不同,提出了領(lǐng)域正則化成分分析(DRCA)的子空間投影方法,該方法可以使兩個(gè)域的投影子空間具有更相似的分布。在DRCA的基礎(chǔ)上,Yi等[19]又對(duì)該算法進(jìn)行了改進(jìn),稱為判別域正則化成分分析D-DRCA,該算法考慮了源域數(shù)據(jù)的標(biāo)簽信息,進(jìn)一步提高了源域數(shù)據(jù)的利用率。此外,Zhang等[20]提出了一種新的跨域判別子空間學(xué)習(xí)(CDSL),該方法進(jìn)一步保障了數(shù)據(jù)的完整性,從而有效地提高了電子鼻的分類準(zhǔn)確率。
近些年,Huang等[21]提出了極限學(xué)習(xí)機(jī)(ELM),由于其在分類和回歸問題中的良好性能受到了大量學(xué)者的關(guān)注。由于傳統(tǒng)的ELM只適用于處理訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)具有相同分布的理想情況,因此研究人員提出了多種方法對(duì)ELM進(jìn)行改進(jìn),以使其可以解決圖像分類問題中的域遷移問題[22- 24]?;贓LM框架,Liu等[25]提出了跨域極限學(xué)習(xí)機(jī)模型(CdELM)來處理電子鼻的漂移問題,該模型可以有效減少源域與目標(biāo)域在公共子空間中的分布差異,從而獲得更好的分類效果。
雖然上述方法在領(lǐng)域遷移問題上取得了不錯(cuò)的效果,但均是利用最大均值差異(MMD)作為衡量兩個(gè)域之間分布差異的指標(biāo)。然而,就電子鼻數(shù)據(jù)而言,最大均值差異忽略了單個(gè)樣本對(duì)全局分布差異度量的貢獻(xiàn)度,為此,文中提出一種基于樣本分布加權(quán)的跨域極限學(xué)習(xí)機(jī)框架(SDW-CDELM)。該算法以基于樣本分布加權(quán)的最大均值差異作為衡量領(lǐng)域間樣本分布差異的度量,將源域和目標(biāo)域數(shù)據(jù)輸入基于ELM的特征空間中,然后尋找一個(gè)合適的投影方向?qū)LM特征空間中的數(shù)據(jù)映射到一個(gè)公共子空間,并且在投影后提高源域數(shù)據(jù)的類間可分離度,同時(shí)盡可能保留目標(biāo)域數(shù)據(jù)中可用的判別信息。投影的最終目的是縮小源域和目標(biāo)域之間的分布差異,使其滿足一般的分類學(xué)習(xí)算法所需要的數(shù)據(jù)分布要求。
給定一組訓(xùn)練數(shù)據(jù)集[x1x2…xN]及其對(duì)應(yīng)的輸出[y1y2…yN],N為訓(xùn)練樣本個(gè)數(shù),xi=[xi1…xim]T∈R1×m,yi=[yi1…yin]T∈R1×n,m和n分別代表ELM網(wǎng)絡(luò)的輸入和輸出節(jié)點(diǎn)數(shù)。h(xi)=g(x;wi,bi),wi∈R1×L,bi(bi∈R)代表隱含層的輸出,L代表隱含層神經(jīng)元個(gè)數(shù),g(·)代表激活函數(shù),例如g(t)=1/(1+e-t)。在隱含層到輸出層之間的輸出權(quán)重矩陣用β∈RL×n表示。在ELM學(xué)習(xí)網(wǎng)絡(luò)中輸入權(quán)重和偏置都是隨機(jī)產(chǎn)生的且不需要進(jìn)行調(diào)整,所以ELM學(xué)習(xí)網(wǎng)絡(luò)僅僅只需要計(jì)算輸出權(quán)重。因此,ELM的模型如下所示:
(1)
s.t.h(xi)β=yi-ξi,i=1,2,…,N。
式中:ξi∈R1×n,為第i個(gè)訓(xùn)練樣本的預(yù)測(cè)誤差;P為懲罰參數(shù);‖·‖為Frobenius范數(shù)。
從式(1)中可以得到如下等價(jià)的無約束優(yōu)化問題:
(2)
式中,H=[h(x1)T…h(huán)(xN)T]T∈RN×L,Y=[y1…yN]T∈RN×d。
式(2)是一個(gè)正則化最小二乘問題。最優(yōu)解β可以通過設(shè)置目標(biāo)函數(shù)相對(duì)于β的梯度為零來獲得,由此得到式(3):
β*-PHT(T-Hβ*)=0
(3)
式(3)的封閉解為
(4)
式中,IN和IL分別為N維和L維單位矩陣。
一般來說,對(duì)于使用ELM的分類問題可以直接通過等式(3)或等式(4)來計(jì)算輸出權(quán)重,而這僅僅取決于訓(xùn)練數(shù)據(jù)樣本數(shù)量和隱層神經(jīng)元個(gè)數(shù),所以ELM中的其他參數(shù)不會(huì)通過迭代反向傳播來進(jìn)行更新。
隨著機(jī)器學(xué)習(xí)應(yīng)用場景的增加,想要訓(xùn)練一個(gè)性能較好的機(jī)器學(xué)習(xí)模型需要大量的數(shù)據(jù)標(biāo)簽信息,然而標(biāo)注數(shù)據(jù)是一項(xiàng)復(fù)雜又成本高的任務(wù),因此大量的研究人員開始關(guān)注遷移學(xué)習(xí)問題。遷移學(xué)習(xí)的目的是利用大量已知標(biāo)簽信息的源域數(shù)據(jù)去解決與之相關(guān)但又不同的目標(biāo)域問題[26- 27]。對(duì)于圖像分類,許敏等[28]提出一種基于支持向量機(jī)(SVM)的遷移學(xué)習(xí)算法TL-SVM,該算法利用少量的目標(biāo)域標(biāo)簽信息和大量的源域數(shù)據(jù)構(gòu)建了一個(gè)性能良好的分類模型;Duan等[29]針對(duì)跨域視頻檢測(cè)和文本分類等域適應(yīng)問題,提出了域遷移支持向量機(jī)(DTSVM);Li等[30]基于ELM框架提出了ELM的遷移學(xué)習(xí)算法TL-ELM和一種基于核極限學(xué)習(xí)機(jī)(TL-DAKELM)的遷移模型。本文所提出的SDW-CDELM模型通過減小源域和目標(biāo)域數(shù)據(jù)投影后的樣本分布加權(quán)距離,來實(shí)現(xiàn)不同域之間的知識(shí)遷移,使得該模型能夠有效地解決電子鼻應(yīng)用中的漂移問題。
SDW-CDELM框架的基本思想是:首先將源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)映射到ELM特征空間中,然后求解一個(gè)最優(yōu)輸出權(quán)重矩陣β,該權(quán)重可以將ELM特征空間中的數(shù)據(jù)投影到一個(gè)公共子空間,在這個(gè)子空間中兩個(gè)領(lǐng)域之間的樣本分布差異盡可能滿足傳統(tǒng)的分類方法對(duì)數(shù)據(jù)分布的要求。
SDW-CDELM框架的設(shè)計(jì)主要基于以下3個(gè)方面考慮:①最小化投影后源域和目標(biāo)域的分布距離;②增強(qiáng)源域數(shù)據(jù)的類間分離性和類內(nèi)聚集性;③保持投影后數(shù)據(jù)結(jié)構(gòu)不被破壞,以便在新的子空間中保留更多的可用判別信息。
2.1.1 最小化樣本加權(quán)邊緣分布距離
我們希望由投影矩陣β投影后的公共子空間中,源域數(shù)據(jù)HS和目標(biāo)域數(shù)據(jù)HT之間的數(shù)據(jù)分布得到修正。為了能有效反映出全局的分布差異性,且能體現(xiàn)出單個(gè)樣本對(duì)兩個(gè)領(lǐng)域之間的差異度量的貢獻(xiàn),受文獻(xiàn)[31]的啟發(fā),文中將樣本的白化余弦相似性作為加權(quán)因子引入SDW-CDELM模型中,構(gòu)造基于樣本分布加權(quán)的跨域分布差異度量的方法,用以衡量極限學(xué)習(xí)機(jī)子空間中源域和目標(biāo)域樣本的分布差異,使之盡可能減小?;跇颖痉植技訖?quán)的跨域邊緣分布差異最小化表述為式(5):
(5)
對(duì)源域和目標(biāo)域數(shù)據(jù)權(quán)重向量進(jìn)行如下補(bǔ)充:
(6)
(7)
則式(5)可以改寫為
(8)
式中,
HS=[h(xS(1))h(xS(2)) …h(huán)(xS(NS))],
HT=[h(xT(1))h(xT(2)) …h(huán)(xT(NT))]。
令H=[HSHT],代入式(8)有:
(9)
2.1.2 最小化樣本加權(quán)條件分布距離
事實(shí)上,由于沒有利用源域數(shù)據(jù)的標(biāo)簽信息,僅僅減小兩個(gè)領(lǐng)域之間的邊緣分布差異的算法往往不能得到很好的效果。為此,文中在提出的SDW-CDELM模型中加入了一個(gè)條件分布差異最小化項(xiàng),以減小極限學(xué)習(xí)機(jī)子空間中源域和目標(biāo)域各類樣本的分布差異性之和。由于目標(biāo)域樣本都是未標(biāo)記的,算法在運(yùn)算過程中先給目標(biāo)域數(shù)據(jù)賦予偽標(biāo)簽,然后通過迭代優(yōu)化其標(biāo)簽。目標(biāo)域數(shù)據(jù)初始偽標(biāo)簽由邊緣分布形式SDW-CDELM模型及分類算法得到。基于樣本分布加權(quán)的跨域條件分布差異最小化目標(biāo)函數(shù)為
(10)
同理,將條件樣本分布差異權(quán)重向量進(jìn)行補(bǔ)充:
(11)
(12)
將式(11)和(12)代入式(10)可以得到式(13):
(13)
受到線性判別分析(LDA)的啟發(fā),最小化極限學(xué)習(xí)機(jī)子空間源域數(shù)據(jù)類內(nèi)離散度,同時(shí)最大化類間離散度,使得源域數(shù)據(jù)的可分離性在學(xué)習(xí)的線性子空間中可以得到保證,其目標(biāo)函數(shù)如式(14)所示:
(14)
為了學(xué)習(xí)最大化式(14)中的子空間β,還應(yīng)確保投影不會(huì)使數(shù)據(jù)本身失真,不會(huì)破壞目標(biāo)域的數(shù)據(jù),從而可以在新的子空間中保留更多的可用信息。因此,目標(biāo)域樣本在新的子空間中的方差(能量)被最大化,這樣目標(biāo)域數(shù)據(jù)就不會(huì)失真,原始數(shù)據(jù)中的大多數(shù)可用信息都可以得以保留。目標(biāo)函數(shù)為
(15)
2.4.1 邊緣分布形式SDW-CDELM模型
根據(jù)式(9)、(14)和(15),可以得到邊緣分布形式SDW-CDELM模型:
(16)
對(duì)于最小化問題式(16),由于存在多個(gè)可行的β,因此為了得到唯一解,可以對(duì)優(yōu)化問題施加一個(gè)約束項(xiàng),則式(16)可以改寫為式(17):
(17)
式中,η為正常數(shù)。構(gòu)造拉格朗日函數(shù):
(18)
式中,ρ為拉格朗日乘子。通過設(shè)置L(β,ρ)對(duì)β的偏導(dǎo)為0,可以得到:
(19)
由式(19)可知,最優(yōu)解β可以通過對(duì)式(20)進(jìn)行特征值分解得到:
Gβ=ρβ
(20)
因此最優(yōu)的投影子空間β*可以由矩陣G的前d個(gè)最小特征值所對(duì)應(yīng)的特征向量表示:
β*=[β1β2…βd]
(21)
2.4.2 條件分布形式SDW-CDELM模型
根據(jù)式(13)-(15),可以得到條件分布形式SDW-CDELM模型:
(22)
同理,根據(jù)邊緣分布形式的SDW-CDELM優(yōu)化過程,可以得到:
Bβ=γβ
(23)
對(duì)矩陣B進(jìn)行特征值分解可以得到最佳投影矩陣:
基于SDW-CDELM的漂移補(bǔ)償算法步驟如算法1和算法2所示。
算法1SDW-CDELM
步驟1隨機(jī)生成權(quán)重W∈RD×L,b∈R1×L并選擇激活函數(shù)g(·);
步驟4計(jì)算邊緣分布差異權(quán)重矩陣L;
步驟5計(jì)算矩陣G,并對(duì)矩陣G進(jìn)行特征值分解;
步驟6選取前d個(gè)最小特征值對(duì)應(yīng)的特征向量構(gòu)成投影矩陣β*;
步驟8計(jì)算條件分布差異矩陣L(c);
步驟9計(jì)算矩陣B并對(duì)矩陣B進(jìn)行特征值分解;
算法2分類
輸入:源域數(shù)據(jù)集DS及其對(duì)應(yīng)的標(biāo)簽YS,目標(biāo)域數(shù)據(jù)集DT,子空間投影矩陣β*,隱含層神經(jīng)元個(gè)數(shù)L。
為了驗(yàn)證本文提出的方法,采用文獻(xiàn)[18]中所采集的電子鼻實(shí)驗(yàn)數(shù)據(jù)對(duì)SDW-CDELM模型進(jìn)行驗(yàn)證。該數(shù)據(jù)集由3個(gè)部分組成:5年前采集的主板數(shù)據(jù)集和近期采集的從板1數(shù)據(jù)集和從板2數(shù)據(jù)集,其中主板、從板1、從板2是由3個(gè)相同的電子鼻系統(tǒng)收集。由此可見,從板數(shù)據(jù)集中不僅包含有傳感器隨時(shí)間老化引起的長期漂移,還包括了系統(tǒng)之間的板間漂移。該電子鼻系統(tǒng)由4個(gè)TGS系列傳感器、1個(gè)溫度和濕度傳感器模塊構(gòu)成,每個(gè)樣本共有6維特征。在這些數(shù)據(jù)中,包括了甲醛、苯、甲苯、一氧化碳、二氧化氮和氨氣共6種氣體檢測(cè)數(shù)據(jù)。數(shù)據(jù)集樣本詳細(xì)信息見表1。
表1 電子鼻數(shù)據(jù)集分布Table 1 Distribution of e-nose data
為了更好地驗(yàn)證SDW-CDELM算法的可行性,文中將SDW-CDELM與主成分分析(PCA)、線性判別分析(LDA)、支持向量機(jī)(SVM)、極限學(xué)習(xí)機(jī)(ELM)、領(lǐng)域正則化成分分析(DRCA)、跨域極限學(xué)習(xí)機(jī)(CDELM)、跨域判別子空間學(xué)習(xí)(CDSL)7種相關(guān)方法進(jìn)行比較。將主板數(shù)據(jù)作為源域,從板1和從板2數(shù)據(jù)作為目標(biāo)域。SVM和ELM作為兩種基準(zhǔn)分類器,不經(jīng)過任何漂移補(bǔ)償,直接用源域數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,然后對(duì)目標(biāo)域數(shù)據(jù)進(jìn)行分類測(cè)試。對(duì)于SDW-CDELM、DRCA、CDELM、CDSL、LDA、PCA這6種子空間學(xué)習(xí)方法,將ELM作為分類器,分別計(jì)算ELM隱含層神經(jīng)元個(gè)數(shù)為10和100時(shí)的識(shí)別率,并將二者中較高的識(shí)別率作為最終識(shí)別率進(jìn)行對(duì)比。
使用量子粒子群優(yōu)化算法(QPSO)來對(duì)SDW-CDELM、DRCA、CDSL、CDELM這4種方法中的權(quán)衡參數(shù)進(jìn)行尋優(yōu),并且每種方法運(yùn)算10次,求其平均分類準(zhǔn)確率作為實(shí)驗(yàn)結(jié)果。其中設(shè)置量子粒子群數(shù)為60,迭代次數(shù)為200,實(shí)驗(yàn)結(jié)果見表2。
從表2中的對(duì)比結(jié)果來看,SDW-CDELM方法在兩個(gè)任務(wù)中的識(shí)別率都是最高的,并且當(dāng)利用了目標(biāo)域數(shù)據(jù)的偽標(biāo)簽信息時(shí),SDW-CDELM的性能最佳。這些都有力證明了本文所提出的SDW-CDELM方法能夠有效地對(duì)電子鼻系統(tǒng)的漂移進(jìn)行補(bǔ)償。
表2 不同方法的分類準(zhǔn)確率
為了更好地考察模型參數(shù)對(duì)SDW-CDELM算法的影響,文中討論在不同的參數(shù)配置下的模型性能。圖1和2分別給出了不同的ELM隱含層神經(jīng)元個(gè)數(shù)L和子空間維數(shù)d在上述兩個(gè)任務(wù)設(shè)定下的實(shí)驗(yàn)結(jié)果。從圖中可以看出:①ELM空間中的維度對(duì)整個(gè)模型的效果有著非常重要的影響;②在L設(shè)置較小的時(shí)候整個(gè)模型的識(shí)別率隨著L的增加而上升,但當(dāng)整個(gè)模型的識(shí)別率達(dá)到峰值時(shí),模型的識(shí)別率隨著L的增加而降低;③SDW-CDELM模型的識(shí)別率隨著子空間維數(shù)的增加而上升。導(dǎo)致這種現(xiàn)象的原因在于:在進(jìn)行域適應(yīng)的過程中,我們希望找到原始數(shù)據(jù)具有較少漂移量且包含豐富分類信息的特征表達(dá)。ELM空間維數(shù)較低時(shí),特征表達(dá)能力不足,需要將特征映射到一個(gè)更高維度的空間中去。但是ELM空間的維度不能無限升高,這樣會(huì)引入冗余信息,增加數(shù)據(jù)樣本中的判別信息尋找難度,當(dāng)特征維度相對(duì)于數(shù)據(jù)集中的樣本量來說很大時(shí),容易出現(xiàn)過擬合現(xiàn)象,從而影響到整個(gè)模型的泛化能力。而子空間投影則相當(dāng)于對(duì)ELM空間的降維,當(dāng)維數(shù)過低時(shí),導(dǎo)致子空間中特征信息大量丟失,當(dāng)維數(shù)逐漸增大時(shí),特征表達(dá)在抑制漂移的同時(shí)保留了大量有用信息,因此模式分類效果提高。
針對(duì)電子鼻應(yīng)用中出現(xiàn)的漂移問題,文中提出了一種基于樣本分布加權(quán)的跨域極限學(xué)習(xí)機(jī)(SDW-CDELM)模型,SDW-CDELM在同時(shí)滿足最小化源域和目標(biāo)域分布距離、保留源域數(shù)據(jù)中的判別信息和維持目標(biāo)域數(shù)據(jù)結(jié)構(gòu)的前提下,尋找一個(gè)合適的子空間,在這個(gè)子空間中源域與目標(biāo)域具有盡可能相似的分布,從而能滿足傳統(tǒng)機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)分布的要求。SDW-CDELM能夠有效轉(zhuǎn)移源域和目標(biāo)域中的相似信息,并且SDW-CDELM能夠保持較高速的運(yùn)算,同時(shí)實(shí)現(xiàn)了具有較高精度的跨域分類。其在電子鼻漂移補(bǔ)償問題上的優(yōu)越性在大量的電子鼻數(shù)據(jù)集上得到了驗(yàn)證。但該模型仍然存在泛化能力有限,且對(duì)數(shù)據(jù)的內(nèi)在信息考慮不足的問題。例如對(duì)數(shù)據(jù)的流形結(jié)構(gòu)、數(shù)據(jù)與其標(biāo)簽之間的相關(guān)性等因素對(duì)模型表現(xiàn)的影響,這些將是我們下一步的研究目標(biāo)。
華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年12期