• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      聯(lián)合區(qū)間高斯過程的近紅外光譜波長選擇方法及應用

      2016-06-15 16:40:58尹燕燕
      光譜學與光譜分析 2016年8期
      關鍵詞:高斯波長區(qū)間

      徐 琛, 尹燕燕, 劉 飛

      江南大學輕工過程先進控制教育部重點實驗室, 自動化研究所, 江蘇 無錫 214122

      聯(lián)合區(qū)間高斯過程的近紅外光譜波長選擇方法及應用

      徐 琛, 尹燕燕, 劉 飛*

      江南大學輕工過程先進控制教育部重點實驗室, 自動化研究所, 江蘇 無錫 214122

      針對近紅外光譜應用, 提出了一種基于高斯過程(GP)模型的波長選擇算法, 即聯(lián)合區(qū)間高斯過程(synergy interval gaussian process, siGP)算法。 首先將全光譜區(qū)域劃分為一系列無重復且間距相等的區(qū)間, 再選取最優(yōu)的若干個區(qū)間聯(lián)合建立GP模型, 由于GP模型具有非線性處理能力, 因此該方法可以減少非線性的影響。 以紅曲菌固態(tài)發(fā)酵過程中過程參數(shù)水分含量和pH值的檢測為例, 新算法對水分含量、 pH值的預測集相關系數(shù)(rp)分別為0.956 4和0.977 3, 預測均方根誤差(RMSEP)分別為0.012 7和0.161 0, 參與建模的數(shù)據點由全譜的1 500個分別減少到225個、 375個, 在對獨立樣本的預測上, 表現(xiàn)出較好的精度。 與傳統(tǒng)聯(lián)合區(qū)間偏最小二乘(siPLS)波長選擇算法對比, siGP算法預測效果更好: 對水分含量和pH值,rp在GP模型預測時提高了3.37%和3.51%, RMSEP在GP模型預測時提高了29.4%和34.8%。 表明siGP結合GP模型能夠有效選擇波長區(qū)間以及提高近紅外模型的準確性, 對進一步實現(xiàn)近紅外光譜技術在線檢測具有參考價值。

      近紅外光譜; 高斯過程模型; 聯(lián)合區(qū)間高斯過程(siGP); 紅曲菌; 水分含量; pH值

      引 言

      近年來, 近紅外光譜技術(NIR)作為一個過程分析工具, 被廣泛應用于石油、 環(huán)境、 食品、 醫(yī)藥、 工業(yè)等領域[1-4]。 與傳統(tǒng)實驗室分析方法相比, NIR具有高效、 快速、 無損、 無污染等特點。

      建立NIR定量分析模型, 以往大多使用線性回歸方法, 如主成分回歸(PCR)、 偏最小二乘(PLS); 但由于光譜數(shù)據中, 不可避免的會出現(xiàn)非線性因素, 一些非線性建模方法被提出, 如人工神經網絡(ANN)[5]、 最小二乘支持向量機(LS-SVM)[6]等。 波長選擇是NIR建模中非常重要的步驟, 可以減少無效信息對NIR模型的影響, 降低模型復雜度。 目前, 被廣泛應用的波長選擇算法有遺傳算法(GA)、 連續(xù)投影算法(SPA)、 無信息變量消除(UVE)、 間隔偏最小二乘(iPLS)等。

      iPLS算法是將NIR模型建立在全光譜區(qū)域中最優(yōu)的一個區(qū)間上, 但在全光譜區(qū)域, 有效的波長區(qū)間不止分布在一個區(qū)間, 因此聯(lián)合區(qū)間(si)的思想被提出[7], 通過選取幾個(通常是2, 3, 4)區(qū)間聯(lián)合建立NIR模型。 在實際過程中, 過程參數(shù)與光譜數(shù)據之間常常具有一定的非線性, 因此, 為了提高模型精度, 須在波長選擇時考慮非線性因素。

      作為一種新的機器學習方法, 高斯過程(GP)模型可以處理復雜的非線性問題, 且泛化能力強[8-10]。 與ANN和LS-SVM相比, GP模型作為一種非參數(shù)概率模型, 在給出模型預測值的同時, 還可以給出預測值對模型的精度函數(shù); GP模型的優(yōu)化參數(shù)相對較少, 學習速度快, 而且更易收斂。 近幾年, 國內外學者逐步重視這一研究熱點, 并在一些領域得到了成功應用[11-12]。

      將GP方法引入近紅外光譜檢測, 提出一種融合GP模型和聯(lián)合區(qū)間策略的波長選擇算法: 聯(lián)合區(qū)間高斯過程(siGP)算法, 為近紅外光譜技術建立定量分析模型, 在波長選擇階段, 提供了一種處理光譜非線性因素的新思路, 并應用到紅曲菌固態(tài)發(fā)酵過程參數(shù)水分含量和pH值的快速檢測中。

      1 siGP波長篩選原理及方法

      1.1 GP算法描述

      對于給定光譜數(shù)據樣本集A={(xi,yi)},i=1,…,n,xi∈Rd,yi∈R,n表示訓練樣本數(shù),d表示輸入向量維數(shù)。 對于一個新的樣本輸入x, 預測分布的均值和方差如式(1)所示

      (1)

      (2)

      其中,c(x)=[c(x,x1),…,c(x,xn)]T是訓練樣本和測試樣本之間的協(xié)方差向量,C是訓練樣本之間的協(xié)方差矩陣,c(x,x)是測試樣本自身的方差,y=[y1,y2,…,yn]T。

      GP模型可以選擇不同的協(xié)方差函數(shù), 我們選擇高斯協(xié)方差函數(shù)

      (3)

      其中,ν是控制協(xié)方差的量度,ωd為每個輸入的測度權重。

      (4)

      為了得到最優(yōu)的參數(shù)θ, 首先在合理范圍內選擇一個隨機值, 再用共軛梯度法搜索得到一個最優(yōu)的θ[12]。 確定參數(shù)θ之后, 對于測試樣本x, 用式(1)和式(2)來估計均值和方差, 高斯過程的輸出即為估計的均值。

      1.2 siGP算法

      siGP算法類似于siPLS算法的思想, 篩選波長區(qū)間步驟如下:

      (1)采用間隔策略將全譜數(shù)據劃分為n個區(qū)間, 區(qū)間無重復且間距相等;

      (2)選取n個區(qū)間中2, 3和4個子區(qū)間, 排列組合后分別建立GP校正模型, 并求解每個組合的交叉驗證均方根誤差(RMSECV);

      (3)重復以上步驟, 對全光譜區(qū)域劃分的不同的n個區(qū)間進行求解;

      (4)尋找最小的RESECV對應的區(qū)間數(shù)及對應的子區(qū)間組合數(shù);

      (5)輸出最優(yōu)波長變量數(shù)據。

      此處, RMSECV的計算公式如下

      (5)

      2 實驗部分

      2.1 樣本制備

      實驗室制備單個樣本的過程為: 首先, 培養(yǎng)基的斜面孢子用接種鏟刮取, 放入20 mL無菌生理鹽水中, 獲得孢子懸浮液, 取500 mL三角瓶, 里面盛有100 mL種子培養(yǎng)基, 將孢子懸浮液接種到其中, 在32 ℃, 150 r·min-1恒溫振蕩培養(yǎng)36~48 h后, 得到種子液。 在250 mL三角瓶中裝入固態(tài)發(fā)酵培養(yǎng)基, 滅菌后, 用三角瓶盛放5 mL的種子液, 在培養(yǎng)箱中培養(yǎng)108 h。

      實驗樣本分5個批次進行制備, 前4個批次共制備148個樣本, 構成建模所需的校正集和預測集, 第5批次制備10個樣本, 作為獨立批次驗證模型的準確性。

      2.2 光譜采集

      實驗室選用Thermo Antaris MX傅里葉-近紅外快速分析儀, 采集范圍10 000~4 000 cm-1, 分辨率為8.0 cm-1, 掃描次數(shù)為16次。 采集光譜時, 將樣本壓實, 光纖探頭緊貼樣本表面, 通過TQ軟件完成光譜采集。 圖1為前4個批次148個樣本的原始光譜圖。 表1為這148個樣本水分含量和pH值的分布情況。

      圖1 原始光譜圖

      ComponentNo ofsamplesMaxMinMeanStandDeviationMoi Con1480 68020 37110 52810 0479pH1488 085 777 09570 7888

      3 結果與討論

      3.1 樣本集的選擇與光譜預處理

      建模樣本集為實驗最終獲得的148個樣本。 選用基于變量間歐氏距離的K-Stone(K-S)方法劃分校正集和驗證集, 該方法在特征空間中均勻選取樣本, 很好的解決了人為選取的盲目性。 最終選取了校正集樣本100個, 驗證集樣本48個。

      由圖1可知, 在4 000 cm-1附近, 存在很大的無規(guī)律儀器噪聲, 因此, 選取波長4 219~10 000 cm-1間1 500個光譜數(shù)據作為建模所需數(shù)據點。 對選中的光譜數(shù)據分別運用標準正態(tài)變量變換、 多元散射校正、 一階導數(shù)、 二階導數(shù)以及其組合進行預處理, 比較發(fā)現(xiàn), 不做預處理的光譜數(shù)據, 得到的效果最好。 出現(xiàn)這種情況的原因可能為: 對數(shù)據進行預處理的同時, 伴隨著有效信息的丟失, 以及高斯過程建??梢院芎玫臏p少噪聲的影響。

      3.2 siGP波長選擇

      對光譜數(shù)據進行適當?shù)牟ㄩL選擇, 可以降低模型復雜度, 獲得預測精度高的模型。 分別將1 500個波長點劃分為6~20個波長區(qū)間, 子區(qū)間組合數(shù)為2, 3, 4, 圖2和圖3為RMSECV得到的關系圖。

      圖2 水分含量siGP選擇不同區(qū)間組合的RMSECV

      圖3 pH值siGP選擇不同區(qū)間組合的RMSECV

      由圖2和圖3可知, 對于水分含量, 當RESECV獲得最小值0.013 6時, siGP算法選擇了將光譜劃分為20個區(qū)間并按[5, 10, 20]區(qū)間組合的波長區(qū)間。 對于pH值, 當RESECV獲得最小值0.161 2時, siGP算法選擇了將光譜劃分為16個子區(qū)間并按[1, 5, 8, 16]區(qū)間組合的波長區(qū)間。 表2為選擇區(qū)間組合對應的波段區(qū)間。

      表2 siGP選擇的波長區(qū)間(cm-1)

      由表2中可得出: 對于水分含量, siGP算法選取的波段區(qū)間6 824.2~7 109.4 cm-1在水分子對稱伸縮振動組合頻吸收峰6 900 cm-1附近, 5 379.4~5 664.5 cm-1波段區(qū)間包含5 620 cm-1附近一個比較弱的組合頻吸收; 固態(tài)培養(yǎng)基中有機氮被菌體消耗后產生的氨類物質會導致pH的變化, siGP算法選取的4 223.5~4 581.8 cm-1包含氨類物質N—H鍵4 525 cm-1處的強吸收峰, 6 731.8~7 090.1 cm-1包含6 803 cm-1附近的一級倍頻吸收峰。

      3.3 模型建立與分析

      對校正集樣本中的水分含量、 pH值, 分別用siGP算法優(yōu)選的波長變量建立GP模型, 并對預測集樣本進行預測, 預測結果如圖4和圖5。 評價指標為均方根誤差和相關系數(shù)[13]。 從圖中可以看出, 兩個模型的擬合度和預測精度均較好, 相關系數(shù)達到0.95以上, 預測精度可以滿足在紅曲菌發(fā)酵過程中的條件。 表3和表4給出了與傳統(tǒng)方法偏最小二乘建模的對比分析。

      圖4 NIR預測值與參考值(水分)對比

      圖5 NIR預測值與參考值(pH)對比

      從表3和表4的結果可以得出: siGP方法選取波段所建的GP模型取得了最好的預測效果。 在對水分含量和pH值建模過程中, 波長點數(shù)分別從1 500個數(shù)據點減少到225和375個數(shù)據點。 對比傳統(tǒng)線性波長選擇方法及建模方法, 從RMSEP上看, 水分含量的預測精度分別比全譜PLS模型、 siPLS選取波段的PLS模型和全譜GP模型提高了23.5%, 29.4%和13.0%, pH值的預測精度分別比全譜PLS模型、 siPLS選取波段的PLS模型和全譜GP模型提高了22.7%, 34.8%和5.2%, 表明siGP算法選取波段所建的GP模型, 減少了光譜數(shù)據非線性的影響。

      表3 siGP方法和傳統(tǒng)方法得到的水分結果對比

      表4 siGP和傳統(tǒng)方法得到的pH結果對比

      3.4 獨立樣本預測

      采用獨立的第5批次樣本, 進一步驗證所建模型準確性和適用性。 取第5批次10個樣本, 分別測定這10個樣本的水分含量和pH值以及光譜數(shù)據, 采取siGP算法選擇波長后, 用已建成的GP模型對水分含量和pH值進行預測, 獲得的發(fā)酵時間曲線如圖6和圖7。

      由圖6和圖7可知, 近紅外光譜法和常規(guī)理化方法取得了較為一致的結果, 采用高斯過程所建模型的適用性和預測精度都較好, 可用于快速檢測紅曲菌固態(tài)發(fā)酵過程參數(shù)水分含量及pH值。

      4 結 論

      以紅曲菌固態(tài)發(fā)酵過程中水分含量和pH值的快速檢測為例, 提出了一種近紅外光譜非線性波長選擇算法, 即聯(lián)合區(qū)間高斯過程(siGP)算法, 減少了非線性的影響, 并表現(xiàn)出比傳統(tǒng)siPLS波長選擇算法更好的性能。 研究結果表明, siGP結合GP模型在紅曲菌固態(tài)發(fā)酵過程參數(shù)建模上, 提高了模型的預測精度, 降低了模型的復雜度。 近紅外光譜技術結合高斯過程方法可以實現(xiàn)過程參數(shù)的快速檢測, 對實現(xiàn)過程參數(shù)在線檢測具有參考價值。

      圖6 水分含量發(fā)酵時間曲線

      圖7 pH值發(fā)酵時間曲線

      [1] Zou Xiaobo, Zhao Jiewen, Povey M J W, et al. Analytica Chimica Acta, 2010, 667(1): 14.

      [2] Agelet L, Hurburgh C. Jr. Critical Reviews in Analytical Chemistry, 2010, 40(4): 246.

      [3] Balabin R, Smirnov S. Analytica Chemica Acta, 2011, 692(1): 63.

      [4] Chen M L, Khare S, Huang B, et al. Industrial & Engineering Chemistry Research, 2013, 52(23): 7886.

      [5] Blanco M, Coello J, Iturriaga H, et al. Chemometrics and Intelligent Laboratory Systems, 2000, 50(1): 75.

      [6] Chauchard F, Cogdill R, Roussel S, et al. Chemometrics and Intelligent Laboratory Systems, 2004, 71(2): 141.

      [7] Chen Q S, Zhao J W, Liu M H, et al. Journal of Pharmaceutical and Biomedical Analysis, 2008, 46(3): 568.

      [8] Chen T, Morris J, Martin E. Chemometrics and Intelligent Laboratory Systems, 2007, 87(1): 59.

      [9] Rasmussen C E, Williams C K I. Massachusetts Institute of Technology: The MIT Press, 2006.

      [10] HE Zhi-kun, LIU Guang-bin, ZHAO Xi-jing, et al(何志昆, 劉光斌, 趙曦晶, 等). Control and Decision(控制與決策), 2013, 28(8): 1121.

      [11] Chen T, Wang B. Neurocomputing, 2010, 73(13): 2718.

      [12] LEI Yu, YANG Hui-zhong(雷 瑜, 楊慧中). CIESC Journal(化工學報), 2013, 64(12): 4434.

      [13] Peng Jiangtao, Jiang An, Peng Silong. Analytica Chemica Acta, 2010, 667(1): 14.

      *Corresponding author

      Near Infrared Spectroscopy Wavelength Selection Method and the Application Based on Synergy Interval Gaussian Process

      XU Chen, YIN Yan-yan, LIU Fei*

      Key Laboratory of Advanced Process Control for Light Industry (Ministry of Education), Institute of Automation, Jiangnan University, Wuxi 214122, China

      Based on Gaussian Process (GP), a wavelength selection algorithm named Synergy Interval Gaussian Process (siGP) model is proposed in this paper by using near infrared spectroscopy technology. Full spectrum is divided into a series of unique and equal spacing intervals, before selecting optimal several intervals to establish GP model. Due to the GP model with nonlinear processing ability, the method reduces the disadvantages of nonlinear factor. Taking the near infrared spectrum data of moisture content and pH in solid-state fermentation of monascus as performance verification object of this new algorithm, the prediction correlation coefficient (Rp) of moisture content and pH are 0.956 4 and 0.977 3, respectively. The root mean square errors for prediction set (RMSEP) are 0.012 7 and 0.161 0, respectively. Data points participating in modeling decrease respectively from the original 1 500 to 225 and 375. In the prediction for independent samples, it shows good accuracy. Comparing with traditional synergy interval partial least squares (siPLS) algorithm, the results show that the siGP achieves the best prediction result. The prediction correlation coefficient of moisture content and pH in new algorithm has increased respectively by 3.37% and 3.51% under the model of Gaussian Process, with increases of 29.4% and 34.8% in the root mean square errors for prediction set. This study shows that the combination of siGP and GP model can select wavelength effectively and improves the prediction accuracy of the NIR model. This method is reference for realizing the online detection and optimization control.

      NIR; GP model; siGP; Monascus; Moisture content; pH

      Mar. 7, 2015; accepted Jul. 25, 2015)

      2015-03-07,

      2015-07-25

      國家自然科學基金項目(NSFC 61273087), 江蘇省產學研前瞻性聯(lián)合研究項目(BY2013015-27)資助

      徐 琛, 1990年生, 江南大學自動化研究所博士研究生 e-mail: wxjnxc@163.com *通訊聯(lián)系人 e-mail: fliu@jiangnan.edu.cn

      O657.33

      A

      10.3964/j.issn.1000-0593(2016)08-2437-05

      猜你喜歡
      高斯波長區(qū)間
      小高斯的大發(fā)現(xiàn)
      解兩類含參數(shù)的復合不等式有解與恒成立問題
      HPLC-PDA雙波長法同時測定四季草片中沒食子酸和槲皮苷的含量
      特產研究(2022年6期)2023-01-17 05:06:16
      你學會“區(qū)間測速”了嗎
      天才數(shù)學家——高斯
      雙波長激光治療慢性牙周炎的療效觀察
      日本研發(fā)出可完全覆蓋可見光波長的LED光源
      中國照明(2016年4期)2016-05-17 06:16:15
      區(qū)間對象族的可鎮(zhèn)定性分析
      便攜式多用途光波波長測量儀
      物理實驗(2015年9期)2015-02-28 17:36:46
      有限域上高斯正規(guī)基的一個注記
      云安县| 阿瓦提县| 新源县| 江华| 射阳县| 普兰县| 永登县| 进贤县| 郎溪县| 河津市| 齐齐哈尔市| 临朐县| 松溪县| 庆阳市| 六安市| 石嘴山市| 花莲市| 会理县| 麦盖提县| 勐海县| 太康县| 大足县| 浦县| 锦屏县| 梨树县| 类乌齐县| 福建省| 左云县| 孝义市| 武陟县| 台湾省| 恩施市| 扎兰屯市| 阿拉善盟| 灵丘县| 桐柏县| 来安县| 尚义县| 武川县| 保山市| 中方县|