• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于LLE-RF的中藥三維熒光光譜分類識別

      2020-04-11 04:34:04樊鳳杰軒鳳來紀(jì)會芳
      計量學(xué)報 2020年2期
      關(guān)鍵詞:特征提取光譜熒光

      樊鳳杰, 軒鳳來, 白 洋, 紀(jì)會芳

      (1.燕山大學(xué) 電氣工程學(xué)院,河北 秦皇島 066004;2.解放軍第二六一醫(yī)院,北京 100094)

      1 引 言

      中藥指紋圖譜技術(shù)是中藥鑒定與中藥質(zhì)量控制的關(guān)鍵技術(shù)[1],三維熒光光譜由于靈敏、快速等優(yōu)點正逐漸成為中藥指紋圖譜研究的有力工具,因此,對中藥三維熒光譜信號進(jìn)行特征提取是中藥光譜分類識別的關(guān)鍵。

      目前,常用的三維熒光光譜特征提取方法有參量化方法以及主成分分析(principal components analysis,PCA)等方法[2]。胡澤建等[3]于1998年提出了參量化方法,通過提取三維熒光光譜的平均值、標(biāo)準(zhǔn)差、z值的累積率分布、原點矩、中心矩、重心等特征參量作為光譜特征,該方法雖然有明確的幾何特征意義,但只是將提取的特征簡單的組合。PCA算法是在不丟失主要信息的基礎(chǔ)上進(jìn)行數(shù)據(jù)降維,用維數(shù)較少的新變量代替原來維數(shù)較多的變量[4]。

      局部線性嵌入(locally linear embedding,LLE)作為一種非線性的流形學(xué)習(xí)算法,通過尋找高維數(shù)據(jù)中所隱藏的低維流形結(jié)構(gòu)進(jìn)行特征提取,該算法復(fù)雜度低,便于實現(xiàn)[5]。

      本文提出了LLE-RF組合算法,采用LLE算法對補(bǔ)虛類中藥三維熒光光譜數(shù)據(jù)進(jìn)行特征提取,并將LLE算法提取的特征向量輸入隨機(jī)森林(random forest,RF)分類器進(jìn)行分類識別。

      2 數(shù)據(jù)預(yù)處理

      2.1 樣品配制

      分別配制24味補(bǔ)虛類中藥(表1所示)5個不同濃度的溶液制劑。

      表1 24味補(bǔ)虛類中藥Tab.1 24 tonifying herbs

      具體配制過程如下:首先稱取24味補(bǔ)虛類中藥各1 g,分別放入250 mL燒杯中,加入100 mL蒸餾水浸泡30 min,用武火煮沸,再用文火熬煮35 min,冷卻至室溫,過濾至100 mL容量瓶,加蒸餾水稀釋,得到每味中藥的10 mg/mL溶液制劑;再用膠頭滴管從10 mg/mL的溶液制劑中提取 8 mL 溶液至25 mL量筒中,加蒸餾水至10 mL,即得到濃度為8 mg/mL的溶液制劑。按上述方法依次配制6 mg/mL、4 mg/mL、2 mg/mL的溶液制劑,進(jìn)而得到24味中藥5個不同濃度的溶液制劑。

      2.2 實驗過程

      使用英國Edinburgh Instruments公司生產(chǎn)的FS920號穩(wěn)態(tài)熒光光譜儀,分別測量不同濃度的補(bǔ)虛類中藥溶液的熒光光譜。為保證光源的使用壽命,測量時需將儀器冷卻降溫至-19 ℃后再進(jìn)行測量。測量前需設(shè)置熒光光譜儀的測量參數(shù),設(shè)置積分時間0.1 s,激發(fā)波長EX掃描范圍為220~550 nm,發(fā)射波長EM掃描范圍為240~570 nm。為盡量避免瑞利散射的干擾,設(shè)置發(fā)射掃描波長起點始終滯后激發(fā)波長20 nm,激發(fā)與發(fā)射步長均為10 nm。

      2.3 光譜去噪

      每一濃度下中藥三維熒光光譜數(shù)據(jù)均采用總體平均經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)[6]算法降噪,以6 mg/mL的人參溶液為例,測量得到如圖1、圖2所示的人參溶液三維熒光光譜圖以及等高線圖。等高線圖是三維熒光光譜圖在激發(fā)波長與發(fā)射波長所在平面的投影。

      圖1 人參溶液三維熒光光譜圖Fig.1 Three dimensional fluorescence spectrum of ginseng solution

      圖2 人參溶液等高線圖Fig.2 Contour map of ginseng solution

      由圖1、圖2可以看出,在激發(fā)波長270~370 nm、發(fā)射波長240~440 nm范圍內(nèi)存在主熒光峰與次熒光峰,在激發(fā)波長220~320 nm、發(fā)射波長440~540 nm范圍內(nèi)存在噪聲。利用EEMD對熒光光譜數(shù)據(jù)降噪,降噪后的三維熒光光譜圖及等高線圖如圖3、圖4所示。由圖3、圖4可以看到在激發(fā)波長220~320 nm、發(fā)射波長440~540 nm范圍內(nèi)的噪聲已經(jīng)消除。經(jīng)EEMD降噪后的數(shù)據(jù)格式為34×34,將每個樣本矩陣首尾相接,構(gòu)成1×1 156形式,并將120個不同濃度的樣本數(shù)據(jù)整理成 120×1 156矩陣形式。

      圖3 降噪后的人參溶液三維熒光光譜圖Fig.3 Three dimensional fluorescence spectra of ginseng solution after denoising

      3 特征提取與分類識別

      3.1 特征提取

      3.1.1 LLE算法

      LLE是用局部的線性逼近整體的非線性,能夠使降維后的數(shù)據(jù)保持原有的拓?fù)浣Y(jié)構(gòu),具有平移、旋轉(zhuǎn)和伸縮不變性,并且有整體最優(yōu)解,不需要迭代,避免了局部極值問題[7~9]。

      設(shè)中藥三維熒光光譜信號為X,其中,X=[x1,x2,…,xn],xi∈Rm,i=1,2,…,n;m為信號維數(shù),Rm為m維空間的樣本數(shù)據(jù);映射到低維空間的信號Y=[y1,y2,…,yn],yi∈Rd,d為光譜信號降維后的維數(shù),Rd為映射到d維空間的樣本數(shù)據(jù)。

      LLE算法主要步驟如下:

      (1) 采用k近鄰法尋找每個濃度下中藥光譜的k個近鄰點;

      (2) 依據(jù)近鄰點計算出該樣本點的局部重建權(quán)值矩陣,要求誤差函數(shù)最小,即:

      (1)

      圖4 降噪后的人參溶液等高線圖Fig.4 Contour map of ginseng solution after denoising

      (3) 由該中藥光譜的局部重建權(quán)值矩陣和其近鄰點計算出該樣本點的輸出值,即d維嵌入值,并且映射條件應(yīng)該滿足:損失函數(shù)最小,即

      (2)

      為了保證上式有唯一解,低維嵌入應(yīng)該滿足

      (3)

      3.1.2 LLE算法提取特征數(shù)據(jù)

      采用RF對LLE算法不同嵌入結(jié)果進(jìn)行分類識別,確定合理的近鄰點數(shù)以及本征維數(shù)。同時,為了驗證LLE的有效性,將其與PCA進(jìn)行比較。為解決原始數(shù)據(jù)維數(shù)問題,選擇累積貢獻(xiàn)率為95%的前8個特征量PC1、PC2、PC8代表原始樣本的光譜特征,即每個中藥光譜樣本選擇8個特征量代替原來高維空間的樣本數(shù)據(jù)。當(dāng)LLE中k=8,d=8時,LLE及PCA得到的部分特征數(shù)據(jù)分別如表2、表3所示。

      3.2 分類識別

      RF算法是一種集成學(xué)習(xí)算法,將多個決策樹組合在一起達(dá)到分類識別的目的[10,11]。

      建立RF算法的步驟如下[12,13]:

      (1) 通過Bootstrap法按不同的比例從原始數(shù)據(jù)中有放回地抽取X個訓(xùn)練樣本建立X棵決策樹,剩余的樣本數(shù)據(jù)形成OOB數(shù)據(jù),構(gòu)成測試樣本;

      (2) 在生成每棵樹的過程中,通常需要在每個節(jié)點處從所有的特征變量中隨機(jī)抽取N個變量,然后選擇出最具有分類能力的變量對樣本分類;

      (3) 每棵樹都完全生長,不進(jìn)行剪枝;

      (4) 根據(jù)生成的多個樹分類器對新的數(shù)據(jù)進(jìn)行分類,分類結(jié)果按照每個樹分類器的投票多少而定。

      表2 LLE提取的特征數(shù)據(jù)Tab.2 Features data extracted from LLE

      表3 PCA提取的特征數(shù)據(jù)Tab.3 Features data extracted from PCA

      3.3 實驗結(jié)果和分析

      采用LLE及PCA對降噪后的中藥三維熒光光譜數(shù)據(jù)進(jìn)行特征提取,然后分別構(gòu)建LLE-RF、PCA-RF組合算法分類模型,即將LLE、PCA提取的特征向量輸入到RF分類器中進(jìn)行分類識別。由于訓(xùn)練樣本和測試樣本比例不同時,RF分類器有不同的分類效果,因此,設(shè)置訓(xùn)練樣本和測試樣本的比例分別為3:2、7:3、4:1、21:4時,觀察分類識別的正確率,記訓(xùn)練集的比重r分別為0.6、0.7、0.8、0.84時從原始數(shù)據(jù)中有放回地抽取訓(xùn)練樣本,建立相應(yīng)的決策樹,剩下的樣本作為測試樣本。

      當(dāng)采用LLE算法時,為了得到較好的嵌入結(jié)果,即尋找合理的k和d,當(dāng)固定d取6時,k依次取2、3、4、5、6、7、8、9、10、11、12,分析RF分類正確率變化情況。按照同樣的方法,分別固定d取7、8、9、10,k依次取2、3、4、5、6、7、8、9、10、11、12時,分析隨RF分類正確率變化情況。圖5為當(dāng)比例r=0.6、0.7、0.8、0.84時,LLE-RF分類正確率變化情況。

      由圖5可看出,RF的分類效果與r、k以及d有關(guān)。k值越大,LLE得到的嵌入結(jié)果所代表的信息越豐富,同時要求本征維數(shù)d也要相應(yīng)增大,因此,圖5中的4個圖都呈現(xiàn)波動性增長。由圖5(d)可以看出,當(dāng)r=0.84、k=8,d=8時,LLE-RF可以得到較好的分類效果,達(dá)到95%。

      因此,本文選擇LLE算法中k=8,d=8,RF中r為0.84時構(gòu)建LLE-RF組合算法分類模型。為了驗證LLE的有效性,將其與主成分分析進(jìn)行比較,構(gòu)建PCA-RF組合算法分類模型。

      分類模型中均標(biāo)記補(bǔ)氣類為第1類,補(bǔ)陽類為第2類,補(bǔ)陰類為第3類,補(bǔ)血類為第4類,利用分類準(zhǔn)確率與運行時間評價分類性能,分類效果如表4所示,兩種算法分類模型預(yù)測結(jié)果如圖6與圖7所示。

      圖5 r不同時LLE-RF分類正確率變化情況Fig.5 The change ofLLE-RF classification accuracy rate with different r

      由表4可以看出,LLE-RF與PCA-RF模型分類精度不同。LLE-RF模型的分類準(zhǔn)確率達(dá)到95%,PCA-RF模型的分類準(zhǔn)確率為90%。此外,LLE-RF模型運行時間較PCA-RF短。

      表4 不同分類模型識別效果Tab.4 Recognition effect of different classification models

      圖6 LLE-RF模型預(yù)測結(jié)果Fig.6 LLE-RF model prediction results

      圖7 PCA-RF模型預(yù)測結(jié)果Fig.7 PCA-RF model prediction results

      由圖6可以看出,LLE-RF模型中有一個樣本被錯誤識別,實際類別為第3類,但被錯誤識別為第4類。

      由圖7可以看出,PCA-RF模型中有2個樣本被錯誤識別,實際類別為第2類和第4類,但被錯誤識別為第1類和第3類。由于采用LLE提取特征時,通過局部的線性逼近整體的非線性,使降維后的特征數(shù)據(jù)仍然保持原有數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu),而PCA提取特征時,是從線性的角度提取了互不相關(guān)的特征來代表原始數(shù)據(jù),因此,當(dāng)提取中藥三維熒光光譜特征時,對于RF分類器,采用LLE比PCA分類準(zhǔn)確率高。

      4 結(jié) 論

      針對中藥三維熒光光譜數(shù)據(jù)特征提取問題,本文在采用LLE算法提取補(bǔ)虛類中藥三維熒光光譜的非線性特征基礎(chǔ)上,構(gòu)建了LLE-RF組合算法分類模型。實驗結(jié)果表明:LLE特征提取算法在選擇合理的近鄰點數(shù)和本征維數(shù)基礎(chǔ)上,可以得到較好的嵌入結(jié)果。在RF分類器中,通過選擇合理的訓(xùn)練集與測試集比例,LLE-RF組合算法分類準(zhǔn)確率優(yōu)于PCA-RF算法。因此,采用LLE算法可以發(fā)現(xiàn)中藥三維熒光光譜數(shù)據(jù)中的非線性結(jié)構(gòu)。在后續(xù)的研究中,將對LLE算法進(jìn)一步優(yōu)化,更好地提取中藥三維熒光光譜特征,提高分類精度。

      猜你喜歡
      特征提取光譜熒光
      基于三維Saab變換的高光譜圖像壓縮方法
      干式熒光發(fā)光法在HBV感染診療中應(yīng)用價值
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      高熒光量子產(chǎn)率BODIPY衍生物的熒光性能研究
      Bagging RCSP腦電特征提取算法
      星載近紅外高光譜CO2遙感進(jìn)展
      基于MED和循環(huán)域解調(diào)的多故障特征提取
      苦味酸與牛血清蛋白相互作用的光譜研究
      鋱(Ⅲ)與PvdA作用的光譜研究
      熒光增白劑及其安全性和環(huán)保性
      绵阳市| 怀远县| 阜南县| 西丰县| 晋中市| 历史| 贵州省| 夹江县| 高淳县| 秦皇岛市| 合水县| 安阳市| 扎鲁特旗| 白水县| 涞源县| 中方县| 三河市| 全州县| 清河县| 武平县| 绥宁县| 崇阳县| 哈尔滨市| 通城县| 大荔县| 马山县| 宁化县| 合肥市| 双鸭山市| 永年县| 含山县| 石林| 福鼎市| 宁德市| 固原市| 麻城市| 栾城县| 南宁市| 白银市| 东莞市| 巴楚县|