• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      凈信號(hào)的局部建模算法及其在近紅外光譜分析中的應(yīng)用

      2016-06-15 16:37:28張紅光盧建剛
      光譜學(xué)與光譜分析 2016年2期
      關(guān)鍵詞:歐式子集校正

      張紅光,盧建剛

      浙江大學(xué)工業(yè)控制技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310027

      凈信號(hào)的局部建模算法及其在近紅外光譜分析中的應(yīng)用

      張紅光,盧建剛*

      浙江大學(xué)工業(yè)控制技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310027

      提出了一種基于凈信號(hào)分析的局部建模算法,以克服光譜定量分析中樣本間差異性過(guò)大和樣本待測(cè)性質(zhì)與光譜之間存在非線性等問(wèn)題。首先利用凈信號(hào)分析方法得到校正樣本和待測(cè)樣本的凈信號(hào),然后用待測(cè)樣本凈信號(hào)和校正樣本凈信號(hào)之間的歐式距離作為樣本相似性判據(jù),選取一定數(shù)量的與待測(cè)樣本最相似的校正樣本組成局部校正子集,建立局部PLS回歸模型。針對(duì)一組豬肉近紅外光譜數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,該方法的預(yù)測(cè)精度顯著優(yōu)于全局建模方法和基于光譜歐式距離的局部建模方法。

      光譜定量分析; 局部校正方法; 凈信號(hào); 偏最小二乘; 近紅外光譜

      引 言

      近紅外光譜分析技術(shù)發(fā)展很快,已經(jīng)被廣泛應(yīng)用于食品、農(nóng)業(yè)、醫(yī)藥、石化等領(lǐng)域[1-5],這主要是因?yàn)槠渚哂锌焖?、無(wú)損、無(wú)需或只需少量樣本預(yù)處理等優(yōu)點(diǎn)。然而,近紅外光譜往往存在背景漂移,噪聲干擾嚴(yán)重,譜帶重疊以及信號(hào)弱等問(wèn)題[6],無(wú)法直接從光譜獲取有用信息,必須依賴多元數(shù)據(jù)分析。從而,多元數(shù)據(jù)分析一直是近紅外光譜分析中的研究熱點(diǎn)。目前,常用的多元數(shù)據(jù)分析方法有多元線性回歸(MLR)[7]、主成分回歸(PCR)[8]、偏最小二乘(PLS)[9]、人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量機(jī)(SVR)[10]。其中,PLS是應(yīng)用最廣泛的一種方法。作為一種線性方法,PLS通過(guò)建立光譜響應(yīng)與待測(cè)性質(zhì)之間的線性模型進(jìn)行定量分析。但近紅外光譜響應(yīng)與物性之間往往會(huì)存在非線性,此時(shí),PLS模型的精度就不是很理想。此外,因校正樣本數(shù)目過(guò)多和校正樣本性質(zhì)值分布較廣而引起樣本間差異顯著,也會(huì)使PLS模型的精度下降。為了克服以上問(wèn)題,一些非線性方法,包括ANN、SVM和高斯過(guò)程回歸(GPR)[11[12-14]。

      局部建模方法的關(guān)鍵在于選取合適的相似判據(jù),根據(jù)相似判據(jù)選取與待測(cè)樣本相似的校正樣本組成局部校正子集,建立局部回歸模型。通常采用樣本光譜間的歐式距離作為相似判據(jù)[12],樣本光譜間歐式距離越小,樣本相似度越高。然而,由于近紅外光譜往往包含噪聲,背景等與性質(zhì)無(wú)關(guān)的信息,在很多情況下樣本光譜間的歐式距離并不能真實(shí)體現(xiàn)樣本間的相似度,這時(shí)如果采用光譜歐式距離作為樣本相似判據(jù),需要選取更多的校正樣本來(lái)包含待測(cè)樣本所在的性質(zhì)變化區(qū)間,非線性問(wèn)題無(wú)法得到很好的解決,而進(jìn)一步影響基于局部校正子集建立的局部回歸模型的預(yù)測(cè)精度。

      為了消除近紅外光譜中噪聲背景等無(wú)關(guān)信息對(duì)樣本相似性判斷的影響,提出一種基于凈信號(hào)分析[15]的局部建模算法,對(duì)樣本近紅外光譜進(jìn)行凈信號(hào)分析,得到不含噪聲背景等無(wú)關(guān)信息的凈信號(hào),利用樣本凈信號(hào)間的歐氏距離作為樣本相似性判據(jù),選取局部校正子集并建立局部回歸模型。最后通過(guò)一組公開(kāi)的近紅外光譜數(shù)據(jù)集驗(yàn)證了本方法的有效性。

      1 原理與算法

      1.1 凈信號(hào)分析

      Lorber將凈信號(hào)定義為樣本光譜的一部分,正交于樣本光譜中其他的干擾信息[15]。目前有多種方法用于凈信號(hào)的計(jì)算,本文將采用Lorber所提出的方法[16],其計(jì)算過(guò)程如下:

      1)首先對(duì)校正樣本集R進(jìn)行主成分分析,并利用前P個(gè)主成分進(jìn)行光譜重構(gòu),得到重構(gòu)光譜集RP。

      2)基于RP計(jì)算出與待測(cè)成分k子空間正交的其他信息組成的子空間RP, -k,計(jì)算方式為

      RP, -k=RP-αykdk

      (1)

      3)yk是待測(cè)組分的估計(jì)值,計(jì)算方式為

      (2)

      其中上標(biāo)“+”表示Moore-Penrose偽逆,y是校正樣本集的濃度矩陣。

      4)式(1)中的α是標(biāo)量,可通過(guò)式(3)計(jì)算

      (3)

      5)式(1)和式(3)中的dk表示的是待測(cè)組分的光譜信息,可由重構(gòu)光譜集RP的平均光譜代替,通過(guò)式(1),式(2)和式(3),可以得到正交于RP, -k的映射矩陣

      H=I-(RP, -k)+RP, -k

      (4)

      6)樣本光譜的凈信號(hào)NAS (net analyte signal)可由式(5)得到

      NAS=Hr

      (5)

      如上所述,凈信號(hào)分析方法通過(guò)獲得包含所有干擾信號(hào)的子空間,然后從樣本光譜中去除無(wú)用信息,得到表征樣本待測(cè)組分的有效信息。由于樣本的凈信號(hào)已經(jīng)消除了噪聲背景等干擾因素,基于樣本凈信號(hào)間的歐式距離能更好地表征樣本間的相似度。

      1.2 基于凈信號(hào)的局部回歸模型

      基于凈信號(hào)的局部PLS回歸模型建立流程如圖1所示。首先對(duì)校正樣本集進(jìn)行凈信號(hào)分析,得到校正樣本集的凈信號(hào)和凈信號(hào)映射矩陣H。利用樣本凈信號(hào)間的歐式距離作為樣本相似性判據(jù),選取一定數(shù)目與待測(cè)樣本最為相似的校正樣本組成局部校正子集,建立局部回歸模型,得到待測(cè)樣本的預(yù)測(cè)值。

      為了便于簡(jiǎn)明地比較各模型結(jié)果,將經(jīng)典的全局PLS (Global PLS)記為G-PLS,將常用的基于光譜歐式距離的局部PLS(euclidean-distance local PLS) 記為EL-PLS,將工作新提出的基于樣本凈信號(hào)間的歐式距離的局部PLS (NAS euclidean-distance local PLS) 記為NAS-EL-PLS。

      Fig.1 Procedure of local PLS model based on net analyte signal

      1.3 局部PLS模型參數(shù)優(yōu)化

      在局部PLS模型的建立過(guò)程中,需要確定的參數(shù)包括校正子集數(shù)目Nlocal和局部模型的潛變量個(gè)數(shù)A。采用留一法交叉驗(yàn)證方式進(jìn)行參數(shù)優(yōu)化,評(píng)價(jià)指標(biāo)為交叉驗(yàn)證均方根誤差(RMSECV)。N-PLS模型參數(shù)優(yōu)化具體步驟如下: 根據(jù)G-PLS模型確定最大潛變量個(gè)數(shù)Amax,然后每次取出一個(gè)校正樣本,用剩下的校正樣本根據(jù)式(1)—式(5)求出剩下的校正樣本的凈信號(hào)和留出樣本的凈信號(hào),然后計(jì)算出留出樣本與剩余校正樣本凈信號(hào)間的歐氏距離作為樣本相似性判據(jù)。局部模型的潛變量個(gè)數(shù)A從1到Amax,對(duì)應(yīng)每個(gè)潛變量個(gè)數(shù)A,定義一個(gè)校正子集數(shù)目的取值表: [A+1,A+2,A+5,A+10, …,Nlocal, …,N-1],N是校正樣本個(gè)數(shù)。進(jìn)行留一法交叉驗(yàn)證,考察潛變量個(gè)數(shù)和校正子集數(shù)目對(duì)RMSECV的影響。留一法交叉驗(yàn)證過(guò)程中,依次留出一個(gè)校正樣本,根據(jù)留出的校正樣本與剩下的校正樣本間相似性判據(jù)的大小,選取校正子集。最終確定使RMSECV最小的潛變量個(gè)數(shù)A和校正子集數(shù)目Nlocal。

      EL-PLS模型參數(shù)優(yōu)化與NAS-loc-PLS模型類似,只是采用光譜間的歐氏距離作為光譜相似性判據(jù),在此不再贅述。

      2 實(shí)驗(yàn)部分

      2.1 樣本數(shù)據(jù)集

      實(shí)驗(yàn)所用數(shù)據(jù)為一組由一臺(tái)Tecator近紅外光譜儀測(cè)得的豬肉近紅外光譜數(shù)據(jù)集。每條光譜包含100個(gè)波長(zhǎng)點(diǎn),范圍為850~1 050 nm。該數(shù)據(jù)集由225個(gè)樣本組成,并且該樣本集被獲取時(shí),已經(jīng)分成了一個(gè)包含172個(gè)樣本的校正樣本集和一個(gè)包含43個(gè)樣本的測(cè)試樣本集[17]。前期研究工作表明[17-18],該數(shù)據(jù)集尤其是脂肪含量與光譜響應(yīng)之間存在明顯的非線性。這主要由于豬肉樣本成分復(fù)雜性以及樣本的脂肪含量變化范圍較大(0.9~49.1 wt%)。這里選取豬肉樣本的脂肪含量作為研究對(duì)象。所有程序均采用Matlab 7.1 編寫(xiě),在Windows 7環(huán)境下運(yùn)行。

      2.2 性能評(píng)價(jià)指標(biāo)

      通過(guò)G-PLS,EL-PLS以及NAS-loc-PLS模型預(yù)測(cè)性能的對(duì)比,驗(yàn)證本方法的有效性。這里,模型預(yù)測(cè)性能由交叉驗(yàn)證均方根誤差(RMSECV)和預(yù)測(cè)均方根誤差(RMSEP)評(píng)價(jià)。

      3 結(jié)果與討論

      3.1 模型參數(shù)的選取

      如前文所述,NAS-loc-PLS模型需要確定的參數(shù)為校正子集數(shù)目Nlocal和局部模型的潛變量個(gè)數(shù)A。由于G-PLS的最優(yōu)潛變量數(shù)為13,所以NAS-EL-PLS和EL-PLS的所能用的最大潛變量數(shù)Amax=13?;诮徊骝?yàn)證的方式,得到NAS-EL-PLS模型參數(shù)NL和A與RMSECV之間的關(guān)系,如圖2所示。

      從圖2中可以得知當(dāng)A=7,NL=23時(shí),NAS-EL-PLS的RMSECV最小,達(dá)到最優(yōu)性能。類似的可以得到EL-PLS的最優(yōu)模型參數(shù)為:A=10,NL=41。

      3.2 模型預(yù)測(cè)性能的對(duì)比

      使用RMSECV作為評(píng)價(jià)指標(biāo)來(lái)比較各個(gè)模型的性能。同時(shí)為了比較各模型的對(duì)未知樣本的預(yù)測(cè)能力,使用各模型對(duì)測(cè)試集里的未知樣本進(jìn)行預(yù)測(cè),得到各個(gè)模型的RMSEP。表1中給出了各個(gè)模型性能的對(duì)比。

      Fig.2 Influence of model parameters on RMSECV of NAS-EL-PLS model

      Table 1 Comparison of performance among three models

      如表1所示,兩種局部模型的主因子數(shù)和所需校正樣本數(shù)均顯著小于全局模型,同時(shí)RMSECV也顯著小于全局模型。比較三種模型對(duì)未知樣本的預(yù)測(cè)性能,NAS-EL-PLS模型顯著優(yōu)于G-PLS和EL-PLS模型。EL-PLS模型對(duì)未知樣本的預(yù)測(cè)能力最差。所以無(wú)論從模型的復(fù)雜度,以及模型的預(yù)測(cè)性能,NAS-EL-PLS模型均顯著優(yōu)于G-PLS和EL-PLS模型。NAS-EL-PLS模型只需選用很少的校正樣本就能夠獲得比全局模型更好的預(yù)測(cè)性能。EL-PLS模型的預(yù)測(cè)能力很差,表明了基于樣品光譜間歐式距離作為樣本相似判據(jù),有時(shí)并不能真實(shí)體現(xiàn)樣本的相似性,因此基于光譜歐式距離的局部模型的預(yù)測(cè)性能很可能比全局模型還差。而樣本凈信號(hào)由于已經(jīng)去除了噪聲背景等無(wú)關(guān)因素的干擾,樣本凈信號(hào)間的歐氏距離能夠更好的表征樣本間的相似性。

      為了進(jìn)一步比較各模型的預(yù)測(cè)性能,圖3給出了各模型對(duì)測(cè)試集預(yù)測(cè)時(shí)預(yù)測(cè)值與真實(shí)值的對(duì)比圖??芍珿-PLS和EL-PLS模型的預(yù)測(cè)有較大的偏差,而NAS-EL-PLS模型預(yù)測(cè)性能最好,且顯著優(yōu)于其他模型。

      Fig.3 Comparison of models

      4 結(jié) 論

      提出了一種基于凈信號(hào)的局部建模算法,利用凈信號(hào)分析方法得到樣本的凈信號(hào)。通過(guò)凈信號(hào)分析方法能夠消除樣本光譜里噪聲背景等無(wú)關(guān)信息,因而以樣本凈信號(hào)間的歐式距離能夠更好體現(xiàn)樣本間的相似性。將該方法應(yīng)用于一組公開(kāi)的近紅外光譜數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果表明該方法顯著優(yōu)于全局偏最小二乘算法和基于光譜歐式距離的局部偏最小二乘算法。

      [1] Guy F, Prache S, Thomas A, et al. Food Chemistry, 2011, 127: 1280.

      [2] ZHANG Hong-guang, YANG Qin-min, LU Jian-gang, et al(張紅光,楊秦敏,盧建剛,等). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2014, 34(4): 972.

      [3] Roggo Y, Chalus P, Maurer L, et al. Journal of Pharmaceutical and Biomedical Analysis, 2007, 44: 683.

      [4] Balabin R M, Safieva R Z. Analytica Chimica Acta, 2011, 689: 190.

      [5] Zhang H G, Yang Q M, Lu J G. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2014, 120: 625.

      [6] Shao X G, Du G R, Jing M, et al. Chemometrics and Intelligent Laboratory Systems, 2012, 114: 44.

      [7] Ben-Gera I, Norris K H. Journal of Food Science, 1968, 33: 64.

      [8] HOU Zhen-yu, CAI Wen-sheng, SHAO Xue-guang(侯振雨,蔡文生,邵學(xué)廣). Chinese Journal of Analytical Chemistry(分析化學(xué)), 2006, 34(5): 617.

      [9] Chen D, Hu B, Shao X G, et al. Analytical and Bioanalytical Chemistry, 2005, 381: 795.

      [10] BAO Xin, DAI Lian-kui(包 鑫,戴連奎). Chinese Journal of Analytical Chemistry(分析化學(xué)), 2008, 1: 75.

      [11] Chen T, Morris J, Martin E. Chemometrics and Intelligent Laboratory Systems, 2007, 87: 59.

      [12] Xie Y L, Kalivas J H. Analytica Chimica Acta, 1997, 348: 29.

      [13] Center V, Massart D L. Analical Chemistry, 1998, 70: 4206.

      [14] SHI Xue, CAI Wen-sheng, SHAO Xue-guang(石 雪,蔡文生,邵學(xué)廣). Chinese Journal of Analytical Chemistry(分析化學(xué)), 2008, 8: 1093.

      [15] Lorber A. Analytical Chemistry, 1986, 58: 1167.

      [16] Lorber A, Faber K, Kowalski B R. Analytica Chimica Acta, 1997, 69: 1620.

      [17] Borggaard C, Thodberg H H. Anal. Chem., 1992, 64: 545.

      [18] Thodberg H H. IEEE Transactions on Neural Networks, 1996, 7: 56.

      *Corresponding author

      Local Regression Algorithm Based on Net Analyte Signal and Its Application in Near Infrared Spectral Analysis

      ZHANG Hong-guang, LU Jian-gang*

      State Key Laboratory of Industrial Control Technology, Zhejiang University, Hangzhou 310027, China

      To overcome the problems of significant difference among samples and nonlinearity between the property and spectra of samples in spectral quantitative analysis, a local regression algorithm is proposed in this paper. In this algorithm, net signal analysis method(NAS) was firstly used to obtain the net analyte signal of the calibration samples and unknown samples,then the Euclidean distance between net analyte signal of the sample and net analyte signal of calibration samples was calculated and utilized as similarity index. According to the defined similarity index, the local calibration sets were individually selected for each unknown sample. Finally, a local PLS regression model was built on each local calibration sets for each unknown sample. The proposed method was applied to a set of near infrared spectra of meat samples. The results demonstrate that the prediction precision and model complexity of the proposed method are superior to global PLS regression method and conventional local regression algorithm based on spectral Euclidean distance.

      Spectral quantitative analysis; Local regression; Net analyte signal; Partial least square; Near infrared spectra

      Jul. 29, 2014; accepted Nov. 15, 2014)

      2014-07-29,

      2014-11-15

      國(guó)家(973計(jì)劃)項(xiàng)目(2012CB720500),國(guó)家自然科學(xué)基金項(xiàng)目(61590925)資助

      張紅光,1987年生,浙江大學(xué)控制系博士研究生 e-mail: hgzhang@iipc.zju.edu.cn *通訊聯(lián)系人 e-mail: jglu@iipc.zju.edu.cn

      O657.3

      A

      10.3964/j.issn.1000-0593(2016)02-0384-04

      猜你喜歡
      歐式子集校正
      由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
      拓?fù)淇臻g中緊致子集的性質(zhì)研究
      劉光第《南旋記》校正
      關(guān)于奇數(shù)階二元子集的分離序列
      基于Creo軟件的石材歐式壁爐三維造型設(shè)計(jì)
      石材(2020年2期)2020-03-16 13:12:56
      一類特殊混合跳擴(kuò)散Black-Scholes模型的歐式回望期權(quán)定價(jià)
      歐式城堡——木炭與色彩的碰撞
      對(duì)我國(guó)小城鎮(zhèn)建設(shè)過(guò)程中歐式古典風(fēng)格建筑興起的思考
      一類具有校正隔離率隨機(jī)SIQS模型的絕滅性與分布
      機(jī)內(nèi)校正
      五华县| 保定市| 宁蒗| 淮南市| 万山特区| 德化县| 崇左市| 天祝| 广宁县| 分宜县| 乌鲁木齐县| 项城市| 潼关县| 巧家县| 徐汇区| 宜宾市| 唐山市| 云安县| 香港| 萨迦县| 枣庄市| 香港| 邢台市| 济宁市| 海南省| 靖西县| 仙桃市| 井研县| 甘孜县| 文化| 龙泉市| 台安县| 罗甸县| 临泉县| 山丹县| 兴海县| 江川县| 修文县| 柘荣县| 嘉义县| 应城市|