• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      模糊協(xié)方差學習矢量量化的茶葉品種分類研究

      2023-02-22 06:27:16梅武軍武小紅馮亞杰
      光譜學與光譜分析 2023年2期
      關(guān)鍵詞:協(xié)方差紅外光譜

      李 曉, 陳 勇, 梅武軍, 武小紅*, 馮亞杰, 武 斌

      1. 江蘇大學卓越學院, 江蘇 鎮(zhèn)江 212013 2. 江蘇大學電氣信息工程學院, 江蘇 鎮(zhèn)江 212013 3. 浙江大學臺州研究院, 浙江 臺州 317700 4. 滁州職業(yè)技術(shù)學院信息工程學院, 安徽 滁州 239000

      引 言

      茶葉作為全球的最受歡迎飲品之一, 在人們生活中占有重要地位。 茶葉具有豐富的營養(yǎng)成分, 如: 茶多酚、 茶色素、 茶多糖、 茶氨酸等, 應(yīng)用于食品、 醫(yī)學、 化工等多個領(lǐng)域。 從茶葉中提取的茶多酚具有良好的抗氧化性和抑菌活性, 利用這一特點可以用于食品保鮮領(lǐng)域, 滿足健康綠色的發(fā)展理念[1]。 綠茶加工產(chǎn)生的黃酮醇和多糖等副產(chǎn)品可以阻止輕微細胞的脂質(zhì)腸吸收和積累[2]; 普洱茶里的碳水化合物通過抑制葡糖糖苷酶有降低血糖的功效。 隨著茶葉市場的不斷擴大, 出現(xiàn)了魚龍混雜的現(xiàn)象。 此外, 目前鑒別茶葉主要是感官鑒別和化學分析法。 感官鑒別的評價者是根據(jù)自己的經(jīng)驗和判斷來辨別茶葉的質(zhì)量, 然而感覺器官容易受到外界的干擾, 主觀性較強, 鑒別準確率有一定的局限性。 化學分析方法會對檢測樣本造成破壞且費時費力。 因此為了維護消費者的利益, 找到一種簡單快速的鑒別方法尤為重要。

      目前, 國內(nèi)外諸多學者在茶葉檢測方面取得了一定的研究成果。 Lin等提出利用多通道發(fā)光二極管誘導熒光系統(tǒng), 并結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的方法對茶葉品種進行分類[3]; 通過電子鼻和電子舌收集的信息可以直接拼接融合進行定性和定量分析茶葉質(zhì)量等級[4]; 利用高效液相色譜-二極管陣列檢測方法快速定量分析西湖龍井樣本的十個主要成分[5]; 王麗等利用高效液相色譜法建立不同種類的茶葉的指紋圖譜, 采用指紋圖譜的相似度軟件對數(shù)據(jù)進行分析, 結(jié)果表明不同品種的茶葉樣本能夠有效的區(qū)分[6]; Li等采用熒光高光譜成像技術(shù), 結(jié)合優(yōu)化的支持向量機(support vector machines, SVM)模型進行快速無損的茶葉鑒別[7]; 武小紅等采用模糊非相關(guān)鑒別C均值聚類算法, 并結(jié)合近紅外光譜技術(shù)實現(xiàn)快速有效的茶葉品種鑒別[8]。 Mishara等利用高光譜成像數(shù)據(jù)中的空間信息實現(xiàn)茶葉品種分類[9]; Bakhshipour等基于模糊決策樹的計算機視覺系統(tǒng), 將多種茶葉的圖像信息引入到分類器中用于實現(xiàn)茶葉分類, 準確率高達95.0%[10]。

      近些年來, 紅外光譜技術(shù)因具有快速無損、 安全高效等特點, 在食品檢測應(yīng)用較為廣泛[11-12]。 大多數(shù)化合物的基頻吸收帶出現(xiàn)在中紅外區(qū), 因此可以通過中紅外光譜的吸收強度、 吸收峰值信息進行食品鑒別。 結(jié)合多種分類方法, 例如: K近鄰、 SVM、 人工神經(jīng)網(wǎng)絡(luò)、 決策樹等進行食品的產(chǎn)地溯源、 真?zhèn)舞b定、 品種鑒定、 品質(zhì)檢測等。 Adenan等利用中紅外衰減全反射結(jié)合數(shù)據(jù)處理有效地篩選出食用燕窩的結(jié)構(gòu)摻雜物[13]。 Wei等提出氧化石墨烯的中紅外光譜與化學計量學相結(jié)合的分類方法, 對12種普洱茶的品種進行鑒別, 可實現(xiàn)100%的品種分類準確率[14]。 本文提出了一種模糊協(xié)方差學習矢量量化, 采用基于模糊協(xié)方差矩陣的自適應(yīng)距離測度, 對三類茶葉的中紅外光譜數(shù)據(jù)進行分類, 并與模糊C均值聚類算法(fuzzy C-means clustering, FCM)[15], GK聚類[16], 模糊Kohonen聚類網(wǎng)絡(luò)(fuzzy Kohonen clustering, FKCN)[17]算法的分類結(jié)果進行對比。

      1 實驗部分

      1.1 茶葉光譜數(shù)據(jù)采集

      1.1.1 材料

      試驗樣本均在四川省樂山市當?shù)夭枞~市場上購買, 包括峨眉山茶葉、 優(yōu)質(zhì)竹葉青茶葉、 劣質(zhì)竹葉青茶葉, 每類樣本各32份, 共96份。

      1.1.2 光譜儀器與分析軟件

      采用配有高靈敏度DLATGS檢測器和多層鍍膜溴化鉀分束器的FTIR-7600型傅里葉紅外光譜分析儀。 開機預(yù)熱1 h, 掃描32次, 掃描波數(shù)4 001~401 cm-1, 掃描間隔為1.928 cm-1, 分辨率為4 cm-1。 將購買的茶葉經(jīng)研磨粉碎, 再用40目篩進行過濾后, 各取0.5 g分別與溴化鉀1∶100均勻混合; 每個樣本取混合物1 g進行壓膜, 然后用光譜儀掃描3次, 為減小誤差, 取3次的平均值作為樣本光譜數(shù)據(jù)。 采集光譜時環(huán)境溫度和相對濕度保持相對穩(wěn)定, 最終得到三類茶葉樣本, 每類含32個傅里葉中紅外光譜數(shù)據(jù), 共96個樣本。

      1.1.3 光譜數(shù)據(jù)處理

      由于樣本顆粒不均勻以及樣本大小、 儀器的噪聲等都會對采集到的光譜數(shù)據(jù)產(chǎn)生一定的影響, 因此利用多元散射校正(multiplicative scattering correction, MSC)對采集到的數(shù)據(jù)進行相應(yīng)處理。 茶葉數(shù)據(jù)維數(shù)較高, 包含大量的冗余信息, 通過主成分分析(principal component analysis, PCA)提取其大量有效信息, 從而減小建模的難度。 在PCA處理之后, 為了提高數(shù)據(jù)之間的區(qū)分度, 使不同種類的數(shù)據(jù)投影點盡可能遠離, 故采用線性判別分析(linear discriminant analysis, LDA)對數(shù)據(jù)進一步處理。

      1.2 模糊協(xié)方差學習矢量量化(fuzzy covariance learning vector quantization, FCLVQ)

      在GK聚類和學習向量量化(learning vector quantization, LVQ)的基礎(chǔ)上設(shè)計了一種模糊協(xié)方差學習矢量量化, 該算法步驟描述如下:

      (1) 初始化參數(shù): 設(shè)置品種數(shù)c=3; 初始權(quán)重指數(shù)m0=2; 最大迭代數(shù)rmax=100; 誤差上限值ε=0.005 ; 測試樣本數(shù)n2=66; 初始類中心設(shè)置為FCM算法運行后的聚類中心VFCM, 并將樣本與該聚類中心的歐式距離進行式(1)運算, 求得初始模糊隸屬度矩陣U0

      (1)

      式(1)中,uik, 0表示算法開始運行時第k(k=1, 2, …,n2)個樣本xk對第i(i=1, 2, …,c)類的模糊隸屬度,Dik, 0表示樣本xk到第i類聚類中心的初始歐氏距離。

      (2) 計算第i類數(shù)據(jù)的模糊協(xié)方差矩陣Sfi, r

      (2)

      式(2)中,r為迭代次數(shù);mr-1為第r-1次迭代的權(quán)重指數(shù),uik, r-1表示算法第r-1次迭代時樣本xk對第i類的模糊隸屬度,vi, r-1表示第r-1次迭代時第i類的類中心。

      (3) 計算第i個聚類中心的范數(shù)矩陣Ai, r

      (3)

      式(3)中,d為測試樣本的維數(shù)。

      (4) 計算第r次迭代時的距離范數(shù)Dik, r

      (4)

      (5) 給定權(quán)重指數(shù)的變化量

      (5)

      (6) 更新第r次迭代時的權(quán)重指數(shù)mr

      mr=m0-rΔm

      (6)

      (7) 更新模糊隸屬度值uik, r

      (7)

      (8) 計算學習速率αik, r

      αik, r=(uik, r)mr

      (8)

      (9) 更新聚類中心vi, r

      (9)

      (10) 定義迭代誤差限Er

      Er=‖vi, r-vi, r-1‖

      (10)

      (11) 當Er<ε或r>rmax時, 停止迭代, 并記錄最終模糊聚類中心Vf與模糊隸屬度矩陣Uf; 否則令Vr-1=Vr,Ur-1=Ur, 返回步驟(2)繼續(xù)迭代運算。 當?shù)V购螅?根據(jù)最終的模糊隸屬度uik, r, 若uik為uk中最大值, 則判定樣本xk屬于第i類。

      2 結(jié)果與討論

      2.1 中紅外光譜數(shù)據(jù)的預(yù)處理

      將96個樣本分為訓練集與測試集。 訓練集共3類, 每類10個樣本; 測試集共3類, 每類22個樣本。 在采集茶葉樣本的光譜數(shù)據(jù)時, 散射水平的差異以及周圍的環(huán)境因素將產(chǎn)生光譜噪聲、 基線漂移等。 為了有效地消除噪聲影響, 增強與組分含量相關(guān)的光譜吸收信息, 利用MSC對得到的初始中紅外光譜數(shù)據(jù)進行預(yù)處理。 由于不同類別光譜數(shù)據(jù)特征信息的區(qū)分度直接體現(xiàn)在光譜的吸收率上, 最終發(fā)現(xiàn)不同類別的茶葉光譜吸收率上存在明顯差異, 故有效利用該差異提取茶葉光譜數(shù)據(jù)的特征鑒別信息對于茶葉分類有重要意義。

      2.1.1 中紅外光譜的主成分分析

      由于中紅外光譜數(shù)據(jù)維數(shù)為1 868, 包含大量的冗余信息和噪聲, 大大增加了建模的難度, 因此采用主成分分析對數(shù)據(jù)進行降維, 降維后數(shù)據(jù)的主成分得分圖如圖2。 根據(jù)主成分個數(shù)不同, 計算出其累計貢獻率大小, 圖1指出當數(shù)據(jù)維數(shù)降至14維時, 14個主成分的貢獻率達到了99.74%。

      圖1 主成分的累計貢獻率Fig.1 Cumulative contribution rate of principal components

      圖2 主成分得分圖Fig.2 Principal component score plot

      由主成分得分圖可以看出三種茶葉重疊度較高, 難以僅根據(jù)圖像進行分類, 因此采用線性判別分析對數(shù)據(jù)提取特征鑒別信息。

      2.1.2 中紅外光譜的線性判別分析

      由于測試集數(shù)據(jù)用于最終準確率的計算, 故此處對訓練集數(shù)據(jù)進行LDA算法提取鑒別信息。 在使用LDA提取特征的過程中, 選取兩個特征鑒別向量, 使得各類樣本在特征空間中的投影滿足類間距離最大, 類內(nèi)距離最小, 以提高數(shù)據(jù)分類的準確率。 將測試集數(shù)據(jù)投影到二維特征空間后樣本分布如圖3所示。 三類茶葉區(qū)分度較高, 為后續(xù)茶葉品種的識別奠定了良好的基礎(chǔ)。

      圖3 線性判別分析后的數(shù)據(jù)Fig.3 Data processed by LDA

      2.2 聚類分析

      2.2.1 模糊聚類相關(guān)參數(shù)的初始化

      通過主成分分析和線性判別分析對數(shù)據(jù)處理后, 分別采用FCM, GK, FKCN和FCLVQ算法對66個測試樣本進行聚類, 比較其準確率。 由于四種聚類算法均為迭代運算, 故對參數(shù)進行初始化: 設(shè)置類別數(shù)c=3; 初始權(quán)重指數(shù)m0=2; 最大迭代次數(shù)rmax=100; 誤差上限值ε=0.005。 首先運行FCM算法得到其最優(yōu)聚類中心VFCM與模糊隸屬度矩陣UFCM, 將VFCM作為FKCN與FCLVQ的初始聚類中心, 同時將VFCM代入式(1)求得矩陣U0作為GK, FCLVQ算法的初始模糊隸屬度矩陣。

      2.2.2 模糊隸屬度值的計算與分類結(jié)果

      分別運行FCM, GK, FKCN和FCLVQ算法, 在滿足迭代停止條件后終止計算, 得到模糊隸屬度矩陣UFCM,UGK,UFKCN,UFCLVQ。 根據(jù)模糊隸屬度判斷樣本所屬類別, 例如: 若uik, FCLVQ為uk, FCLVQ中最大值, 則FCLVQ算法將樣本xk歸屬于第i類。 FCM, GK與FKCN算法的分類準確率分別為90.91%, 90.91%, 92.42%; 而FCLVQ算法的分類準確率達到了95.45%。 模糊隸屬度值如圖4所示, 其中(a), (b), (c), (d)分別表示FKCN, GK, FCM和FCLVQ算法。

      圖4 四種模糊聚類算法的模糊隸屬度值Fig.4 Fuzzy membership values of four fuzzy clustering algorithms

      2.2.3 權(quán)重指數(shù)m對算法準確率的影響

      當權(quán)重指數(shù)m發(fā)生變化時模糊聚類的準確率也會發(fā)生變化。 對權(quán)重指數(shù)m進行從2變到8時的變化, 從表1中可以發(fā)現(xiàn)當m由2變?yōu)?時, FCM、 GK聚類、 FKCN三種算法準確率均得到了改善; 當m由3變化到6時, 四種聚類算法的準確率均沒有發(fā)生變化, FCM和FKCN兩種算法的準確率均保持92.42%, GK聚類和FCLVQ兩種算法準確率保持在95.45%; 當m繼續(xù)增大至8時, 除了FKCN之外的三種算法的準確率均有所下降。 特別地, 當m從7增大到8時, FCM和FCLVQ兩種算法的準確率發(fā)生驟然下降, 說明當m值增大到一定值時, 算法的誤差就會增大, 所以m的取值對于樣本種類的識別起著重要的作用。 當m在2~7之間變化時, 四種算法的準確率均基本高于90%, 模糊協(xié)方差學習矢量量化的準確率高達95.45%, 說明主成分分析與線性判別分析結(jié)合四種聚類算法是一種比較好的鑒別茶葉種類的方法, 可以有效地實現(xiàn)茶葉品種的分類。

      表1 不同m時各算法分類準確率Table 1 Classification accuracy of each algorithm at different m-values

      2.2.4ε值對算法準確率的影響

      在程序運行的過程當中, 隨著誤差上限ε約束的松弛程度不同, 算法的迭代次數(shù)也會相應(yīng)發(fā)生變化, 從而導致模糊隸屬度的變化。 研究了ε介于0.000 05~0.001 65之間, 步長為0.000 1情況下FCM, GK, FKCN, FCLVQ算法的分類準確率的變化, 其結(jié)果參見圖5。

      圖5 不同ε時各算法分類準確率Fig.5 Classification accuracy of each algorithm at different ε-values

      3 結(jié) 論

      獲取三類不同品種茶葉的光譜數(shù)據(jù)后, 先后使用MSC, PCA, LDA對數(shù)據(jù)進行預(yù)處理, 較好地對數(shù)據(jù)進行了降噪, 降維與特征鑒別信息提取。 最后選擇了合適的初始化參數(shù)后, 利用提出的FCLVQ聚類算法對數(shù)據(jù)進行聚類分析, 并與FCM聚類, GK聚類, FKCN聚類算法的分類效果進行對比。 結(jié)果表明: MSC, PCA, LDA結(jié)合FCLVQ算法有著更好的分類效果。 例如: 在權(quán)重指數(shù)m=2,ε=0.005的情況下對茶葉中紅外光譜數(shù)據(jù)的分類準確率為95.45%, 故FCLVQ算法可以被用來進行茶葉的品種鑒別。

      猜你喜歡
      協(xié)方差紅外光譜
      基于三維Saab變換的高光譜圖像壓縮方法
      網(wǎng)紅外賣
      閃亮的中國紅外『芯』
      金橋(2021年4期)2021-05-21 08:19:20
      TS系列紅外傳感器在嵌入式控制系統(tǒng)中的應(yīng)用
      電子制作(2019年7期)2019-04-25 13:17:14
      基于快速遞推模糊2-劃分熵圖割的紅外圖像分割
      不確定系統(tǒng)改進的魯棒協(xié)方差交叉融合穩(wěn)態(tài)Kalman預(yù)報器
      自動化學報(2016年8期)2016-04-16 03:38:55
      一種基于廣義協(xié)方差矩陣的欠定盲辨識方法
      星載近紅外高光譜CO2遙感進展
      中國光學(2015年5期)2015-12-09 09:00:28
      苦味酸與牛血清蛋白相互作用的光譜研究
      鋱(Ⅲ)與PvdA作用的光譜研究
      班玛县| 昌吉市| 阿克陶县| 泾阳县| 泌阳县| 台中市| 阿尔山市| 漳州市| 崇州市| 惠州市| 漳州市| 平度市| 河池市| 抚远县| 平顺县| 长丰县| 安图县| 嘉鱼县| 萝北县| 乡宁县| 乌鲁木齐市| 安化县| 东山县| 宁都县| 富阳市| 龙川县| 萨嘎县| 错那县| 磴口县| 东阿县| 黑龙江省| 龙游县| 颍上县| 乐东| 大埔区| 本溪| 志丹县| 尚义县| 垦利县| 桐庐县| 泰来县|