• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      近紅外光譜結(jié)合無參數(shù)校正增強(qiáng)實(shí)現(xiàn)不同年份煙葉總糖含量模型更新

      2022-07-22 08:11:10耿瑩蕊沈歡超何倪文鴻苗飛陳王勇輝劉吳雪繼松忠張立立李永生
      分析測(cè)試學(xué)報(bào) 2022年7期
      關(guān)鍵詞:總糖年份煙葉

      耿瑩蕊,沈歡超,2,何倪文鴻苗飛,,陳王 勇輝,,劉吳雪繼松忠*,張立立,李永生,

      (1.浙江大學(xué) 藥學(xué)院,浙江 杭州 310058;2.浙江大學(xué) 智能創(chuàng)新藥物研究院,浙江 杭州 310018;3.浙江中煙工業(yè)有限責(zé)任公司技術(shù)中心,浙江 杭州 310008)

      在過去幾十年,近紅外光譜(NIRS)技術(shù)因具有快速高效、無損、低成本的優(yōu)勢(shì),已成功應(yīng)用于各個(gè)領(lǐng)域[1-2]。煙草作為一種復(fù)雜的天然產(chǎn)物,利用其近紅外光譜信息結(jié)合化學(xué)計(jì)量學(xué)方法可實(shí)現(xiàn)煙葉定量分析、品質(zhì)分類、質(zhì)量控制等,具有重要的應(yīng)用價(jià)值[3-5]。

      建立一個(gè)穩(wěn)健準(zhǔn)確且能在實(shí)際生產(chǎn)中應(yīng)用的校正模型是NIRS技術(shù)的關(guān)鍵,目前常用的模型校正方法有偏最小二乘回歸(PLSR)[6]、最小二乘支持向量機(jī)(LS-SVM)[7]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[8]等,通過這些方法建立校正模型,可實(shí)現(xiàn)未知樣品目標(biāo)成分的定量分析。但檢測(cè)條件、儀器狀態(tài)以及煙葉培育環(huán)境的變化均會(huì)造成光譜特性與質(zhì)量屬性的差異[9-10],這些新變化可導(dǎo)致原有模型預(yù)測(cè)能力下降。

      為維持原始模型在新樣本中的良好預(yù)測(cè)性能,目前已開發(fā)了較多的模型轉(zhuǎn)移算法[11-12]。傳統(tǒng)的模型轉(zhuǎn)移方法側(cè)重于對(duì)數(shù)據(jù)的調(diào)整和修正,如分段直接標(biāo)準(zhǔn)化(PDS)[13]、斜率/截距修正算法[14]等,此類方法對(duì)不同儀器間的模型轉(zhuǎn)移效果顯著,但其標(biāo)準(zhǔn)樣品的選擇和獲取在實(shí)際應(yīng)用中存在一定難度,因此有標(biāo)樣的模型轉(zhuǎn)移算法應(yīng)用存在局限性。模型轉(zhuǎn)移的第二種途徑是模型更新[15],即添加新樣本進(jìn)行校正,優(yōu)化現(xiàn)有的模型[16],該方法往往需要挑選具有代表性的樣本,考慮新樣本權(quán)重以優(yōu)化模型[17-18]。此外,還有一些算法可通過消除外部影響因素達(dá)到模型更新的目的,但這類方法涉及大量參數(shù)的調(diào)整和優(yōu)化[19-21],對(duì)日常使用而言復(fù)雜耗時(shí)。

      為解決上述方法的不足,有學(xué)者提出一種無參數(shù)校正增強(qiáng)框架(PFCE)算法[22],其通過對(duì)回歸系數(shù)進(jìn)行相關(guān)性約束,從而增強(qiáng)原始模型對(duì)新樣本的預(yù)測(cè)能力[23]。該方法不僅減少了對(duì)標(biāo)準(zhǔn)樣品的需求,還省去模型更新需要多參數(shù)優(yōu)化的步驟,大大提高了模型的更新效率。本文旨在通過PFCE 模型更新策略消除采收時(shí)間對(duì)煙葉總糖含量預(yù)測(cè)結(jié)果的影響,以期維持主模型在不同年份煙葉樣本中定量分析的性能。

      1 實(shí)驗(yàn)部分

      1.1 數(shù)據(jù)采集及參考值的測(cè)定

      本研究使用的煙葉樣本分別采收于2016 年、2017 年、2018 年以及2020 年,均由浙江中煙工業(yè)有限責(zé)任公司提供。煙葉樣本在相同測(cè)試條件下采用Antaris II FT-NIR(Thermo Fisher Scientific)分析儀進(jìn)行光譜測(cè)量,光譜的采集范圍為10 000 ~3 800 cm-1,分辨率為8 cm-1,每個(gè)光譜包含1 609個(gè)變量。本研究選擇煙葉中總糖含量建立定量分析模型,樣品的參考值由浙江中煙技術(shù)中心依照煙草標(biāo)準(zhǔn)YC/T159—2002測(cè)定[24]。

      1.2 實(shí)驗(yàn)設(shè)計(jì)及軟件

      采用2016年煙葉樣本建立總糖含量預(yù)測(cè)的PLSR主模型,以2017年、2018年和2020年樣品的光譜用于校正和更新主模型。主模型樣本使用基于x-y距離樣本集劃分(SPXY)算法劃分為校正集(70%)和測(cè)試集(30%),用于更新主模型的樣本劃分為模型更新集(30%)和測(cè)試集(70%)。在研究中,采用半監(jiān)督無參數(shù)校正增強(qiáng)(SS-PFCE)方法對(duì)主模型進(jìn)行更新,另外比較了2017、2018 及2020 年樣本重新建模的效果。對(duì)于所有定量模型,使用校正相關(guān)系數(shù)(Rc)、預(yù)測(cè)相關(guān)系數(shù)(Rp)、校正均方根誤差(RMSEC)、預(yù)測(cè)均方根誤差(RMSEP)和殘差預(yù)測(cè)偏差(RPD)對(duì)其性能進(jìn)行評(píng)價(jià)[25]。

      所有算法和畫圖操作均使用MATLAB R2018 b軟件完成。

      1.3 理論與算法

      1.3.1 偏最小二乘回歸(PLSR) PLSR是一種經(jīng)典的定量建模方法,它將m個(gè)樣本在n個(gè)變量處的光譜X與m個(gè)樣本的相關(guān)參考值Y投影到新空間中構(gòu)建線性回歸模型。在本文中,采用留一交叉驗(yàn)證方法確定PLS模型中的最佳潛在變量(Latent variables,LV)數(shù)[26]。

      1.3.2 半監(jiān)督無參數(shù)校正增強(qiáng)(SS-PFCE) 用于光譜校正增強(qiáng)的無參數(shù)框架(PFCE)是Zhang 等[22]最新提出的模型維護(hù)方法,其根據(jù)模型傳遞中標(biāo)準(zhǔn)品的有無分為非監(jiān)督PFCE(NS-PFCE)、半監(jiān)督PFCE(SS-PFCE)和全監(jiān)督PFCE(FS-PFCE)。其中SS-PFCE 方法僅需新樣品的部分光譜和屬性參考值對(duì)模型進(jìn)行校正更新,無需額外挑選標(biāo)準(zhǔn)品,SS-PFCE的目標(biāo)函數(shù)采用公式(1)進(jìn)行計(jì)算。

      公式(1)中,Xnew代表新批次樣本中被選為更新集的光譜,ynew表示參考值,b0,new和bnew分別表示更新模型的截距和回歸系數(shù);公式(2)中,bm代表主模型的回歸系數(shù),為約束新舊模型回歸系數(shù)的閾值,保證更新模型獲得適當(dāng)?shù)幕貧w系數(shù)和截距,已有研究均將閾值設(shè)定為0.98[22]。

      使用SS-PFCE方法實(shí)現(xiàn)不同年份煙葉模型的更新可概括為以下3個(gè)步驟:

      (1)選擇某一年份樣本的光譜,構(gòu)建PLSR主模型,從中獲得主模型回歸系數(shù)bm。

      (2)使用新年份樣本的部分光譜和參考值對(duì)主模型進(jìn)行維護(hù)和校正,從主模型回歸系數(shù)bm中得到新模型的bnew。

      (3)用新樣本測(cè)試集的光譜驗(yàn)證更新后的模型,以RMSEP和Rp對(duì)模型更新效果進(jìn)行評(píng)估。

      2 結(jié)果與討論

      2.1 不同年份煙葉樣本的近紅外平均光譜

      不同年份煙葉樣本的近紅外平均光譜如圖1所示。不同年份煙葉樣本具有相似的吸收峰趨勢(shì),但吸收強(qiáng)度存在差異,說明煙葉的光譜信息很大程度上受采收年份的影響。

      表1 數(shù)據(jù)表明,不同年份煙葉中總糖含量差異較大,除2020 年外,2017 年和2018 年煙葉樣本的總糖含量均超出2016 年總糖含量的覆蓋范圍。結(jié)合圖1 可知,不同采收年份造成樣本的化學(xué)信息和光譜特征產(chǎn)生差異,這些差異可能嚴(yán)重影響主模型預(yù)測(cè)新樣本的準(zhǔn)確性,因此需進(jìn)行模型維護(hù)以提高主模型的穩(wěn)健性。

      表1 不同年份煙葉樣本匯總Table 1 Summary of tobacco samples in different years

      圖1 不同年份煙葉樣本的近紅外平均光譜圖Fig.1 The average raw NIR spectra of tobacco samples in different years

      2.2 煙葉樣本主模型的建立

      采用SPXY 方法將2016 年193 個(gè)煙葉樣本按照7∶3 的比例劃分為校正集和測(cè)試集,劃分結(jié)果及總糖含量匯總于表2。通過內(nèi)部交叉驗(yàn)證,以最小的交叉驗(yàn)證均方根誤差(RMSECV)為指標(biāo),確定最優(yōu)潛在變量數(shù)(LV),建立2016年煙葉的PLSR 主模型。模型預(yù)測(cè)性能如表3所示,可以看出,主模型Rp值接近1,說明模型預(yù)測(cè)結(jié)果與參考值相關(guān)性很高,RMSEP值較小,RPD大于15,證明主模型性能較優(yōu),可實(shí)現(xiàn)相同年份間煙葉總糖含量的準(zhǔn)確預(yù)測(cè)。

      表2 主模型樣本的劃分結(jié)果Table 2 Statistics of reference quality measurements for tobacco samples

      表3 主模型總糖含量的預(yù)測(cè)性能Table 3 Total sugar content prediction performance obtained by original PLSR model

      2.3 SS-PFCE模型更新

      將2017 年、2018 年以及2020 年的煙葉樣本按照“1.2”所述進(jìn)行樣本劃分,更新集參與SSPFCE 方法對(duì)主模型回歸系數(shù)的校正,劃分結(jié)果匯總于表4。使用“2.2”中2016 年樣本建立的主模型分別對(duì)2017、2018及2020年的樣本進(jìn)行總糖含量預(yù)測(cè),圖2展示了2016年主模型更新前對(duì)不同年份煙葉總糖的預(yù)測(cè)結(jié)果。

      表4 用于模型更新的樣本劃分結(jié)果Table 4 A summary of total sugar content range for model updating and testing sets for different years of tobacco

      圖2 采用2016年主模型預(yù)測(cè)2017年(A)、2018年(B)及2020年(C)煙葉樣本的總糖含量Fig.2 Total sugar contents of tobacco made on samples in 2017(A),2018(B)and 2020(C)years predicted with the master model for 2016 year

      以2016 年樣本建立的主模型Rp 值為0.997 8,RMSEP 值為0.310 8,而使用該模型直接預(yù)測(cè)其他年份樣品時(shí),Rp 值下降,RMSEP 值升高,預(yù)測(cè)能力均下降(見表5)。結(jié)合表2 和表4 的數(shù)據(jù),盡管2020年樣本的總糖含量未超出2016年主模型的定量范圍,但模型的預(yù)測(cè)效果下降,說明即使預(yù)測(cè)集樣本含量在模型定量范圍內(nèi),由于樣本批次差異,其預(yù)測(cè)準(zhǔn)確度難以保證,因此需對(duì)主模型進(jìn)行模型更新以適用新批次樣本的定量分析。

      表5 采用SS-PFCE方法模型更新后對(duì)不同年份的預(yù)測(cè)效果Table 5 Prediction effects of SS-PFCE method on model updating in different years

      表5 結(jié)果顯示,使用SS-PFCE 方法更新后,主模型對(duì)3 個(gè)年份的預(yù)測(cè)結(jié)果均明顯提高,2017 年、2018 年和2020 年的Rp 值分別升高了0.13%、1.32%和4.29%,RMSEP 值分別下降了15.26%、58.69%和36.53%,證明SS-PFCE方法對(duì)主模型進(jìn)行更新后,可提高新批次樣本的預(yù)測(cè)準(zhǔn)確性。

      2.4 與重新建模方法的比較

      為進(jìn)一步驗(yàn)證SS-PFCE 方法對(duì)主模型的更新效果,使用表4 中2017、2018 和2020 年的更新集分別重新建立定量校正模型,模型預(yù)測(cè)性能與SS-PFCE更新結(jié)果的對(duì)比如表6所示。數(shù)據(jù)表明,相比于重新建模,采用SS-PFCE方法對(duì)主模型進(jìn)行更新后,3個(gè)年份測(cè)試集的Rp值分別升高3.53%、0.25%、3.01%,RMSEP值分別下降70.24%、28.69%和30.32%,表明模型預(yù)測(cè)性能有大幅提升。

      表6 模型預(yù)測(cè)性能對(duì)比Table 6 Total sugar content predictions for different years based on two different model updating approaches

      圖3 更直觀地對(duì)比了兩種方式對(duì)不同年份煙葉中總糖含量的預(yù)測(cè)結(jié)果,其中綠色“△”代表重新建模效果,紅色“○”代表采用SS-PFCE 方法對(duì)主模型進(jìn)行更新后的預(yù)測(cè)效果,可明顯看出紅色“○”更加緊密地分布于擬合直線上。相比之下,SS-PFCE 方法進(jìn)行模型更新不僅可得到更好的模型預(yù)測(cè)性能,同時(shí)大大減少了重新建模所需的時(shí)間和計(jì)算成本,在實(shí)際應(yīng)用中具有較大的價(jià)值和意義。

      圖3 重新建模和SS-PFCE對(duì)2017年(A)、2018年(B)及2020年(C)煙葉樣本總糖含量的預(yù)測(cè)結(jié)果比較Fig.3 Comparison of prediction results for total sugar content of tobacco samples in 2017(A),2018(B)and 2020(C)years by the rebuild model and SS-PFCE

      3 結(jié) 論

      針對(duì)定量模型應(yīng)用于新場(chǎng)景導(dǎo)致模型性能下降的問題,本研究采用半監(jiān)督無參數(shù)校正增強(qiáng)(SSPFCE)的模型更新策略對(duì)3個(gè)不同年份的煙葉樣本進(jìn)行模型更新。結(jié)果表明SS-PFCE 方法可以顯著地改善主模型對(duì)新樣本的預(yù)測(cè)結(jié)果,通過對(duì)回歸系數(shù)的約束優(yōu)化,可直接使用新樣本的光譜數(shù)據(jù)進(jìn)行預(yù)測(cè)。與重新建模方法相比,SS-PFCE 方法可在更新過程中以更少的時(shí)間和成本達(dá)到較高的預(yù)測(cè)精度。此外,PFCE是一種基于歷史數(shù)據(jù)量化的模型維護(hù)方法,不涉及模型中其他復(fù)雜參數(shù)的優(yōu)化,也無需挑選具有代表性的標(biāo)準(zhǔn)樣品,這種更新策略在消除外部影響時(shí)具有高效低成本的優(yōu)勢(shì),對(duì)未來實(shí)際應(yīng)用中多種變化場(chǎng)景的模型共享和模型更新均具有重要意義。

      猜你喜歡
      總糖年份煙葉
      直接滴定法測(cè)總糖含量時(shí)檢測(cè)標(biāo)準(zhǔn)的統(tǒng)一性研究
      特殊的一年
      關(guān)于新形勢(shì)下煙葉生產(chǎn)可持續(xù)發(fā)展的思考
      活力(2019年15期)2019-09-25 07:21:56
      煙葉主要真菌病害的發(fā)生與防治
      什么是閏年?
      一樣的年份
      林下參片中總糖、還原糖及糖醛酸的含量測(cè)定
      一種降低造紙法再造煙葉平滑度的方法
      天津造紙(2015年2期)2015-01-04 08:18:13
      更正
      湘西上部煙葉化學(xué)成分特征及聚類分析
      作物研究(2014年6期)2014-03-01 03:39:04
      临城县| 浏阳市| 柳林县| 吉水县| 汕尾市| 彝良县| 岑溪市| 遵义县| 天气| 布尔津县| 从化市| 德庆县| 石首市| 乐山市| 阳春市| 西峡县| 正阳县| 武鸣县| 蒙城县| 舞阳县| 靖安县| 蚌埠市| 突泉县| 疏勒县| 渝北区| 连云港市| 化德县| 永顺县| 峡江县| 高陵县| 临朐县| 天镇县| 江孜县| 宁津县| 同心县| 怀远县| 贵港市| 安多县| 阜宁县| 淮北市| 古田县|