• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于深度信念網(wǎng)絡與混合波長選擇方法的藍莓糖度近紅外檢測模型優(yōu)化

      2022-12-05 11:20:04朱金艷朱玉杰馮國紅曾明飛劉思岐
      光譜學與光譜分析 2022年12期
      關鍵詞:糖度藍莓波長

      朱金艷,朱玉杰,馮國紅,曾明飛,劉思岐

      東北林業(yè)大學工程技術學院,黑龍江 哈爾濱 150040

      引 言

      基于近紅外光譜技術對果蔬內(nèi)部品質(zhì)定量分析的報道中,大多數(shù)學者采用偏最小二乘回歸(PLSR)和多元線性回歸(MLR)等方法。然而,由于近紅外光譜的吸收峰重疊、存在共線、光譜數(shù)據(jù)與含量值之間呈現(xiàn)復雜的非線性關系等,傳統(tǒng)的線性方法有很大的局限性[7]。深度信念網(wǎng)絡(deep belief network,DBN)是一種半監(jiān)督深度學習網(wǎng)絡,利用對比梯度(contrastive divergence,CD)算法對每層受限玻爾茲曼機(restricted Boltzmann machines,RBM)進行快速訓練,模擬人腦進行分析學習,有極強的學習能力,能很好地解決近紅外光譜高維度與非線性問題[8-9]。本研究對“藍豐”和“瑞卡”兩個品種藍莓的糖度進行分析,建立了藍莓糖度深度信念網(wǎng)絡近紅外檢測模型,實現(xiàn)了藍莓糖度快速準確檢測,為藍莓糖度的無損檢測方法提供了新的參考。

      1 實驗部分

      1.1 材料與儀器

      藍莓品種:“藍豐”130個、“瑞卡”150個。采自遼寧丹東,大小基本一致,且無外部缺陷,4 ℃貯藏于生化培養(yǎng)箱中。

      試驗儀器:LabSpec 5000光譜儀,美國ASD公司產(chǎn)品;LYT-330手持式折光儀,上海淋譽公司產(chǎn)品;SPX-70BⅢ型生化培養(yǎng)箱-天津市泰斯特儀器有限公司產(chǎn)品。

      1.2 方法

      1.2.1 光譜采集

      使用LabSpec 5000光譜儀采集藍莓樣品近紅外光譜,掃描次數(shù)32,采集的范圍為350~2 500 nm,采集間隔為1 nm。開機預熱30 min,在掃描樣品之前先用標準白板校正,對每個樣品掃描5次后,取均值作為該樣本的近紅外漫反射光譜,共得到280組藍莓樣本的光譜。

      1.2.2 糖度測定

      藍莓樣品采集光譜后立即測定糖度。藍莓糖度的測定使用LYT-330手持式折光儀,將藍莓樣品榨汁后滴于折光儀鏡面上讀數(shù),為減小誤差,以三次測量結果的平均值作為該樣本的糖度值。

      1.3 光譜數(shù)據(jù)處理

      由于采集到的藍莓樣本光譜在350~420 nm范圍內(nèi)噪聲較大,故選擇420~2 500 nm作為建模全波段進行處理。采用基于聯(lián)合X-Y的異常樣本識別方法(outlier samples detection based on joint X-Y distances,ODXY)篩選并剔除異常數(shù)據(jù),利用SPXY算法劃分樣本集;將光譜數(shù)據(jù)導入Unscrambler X 10.4軟件中,進行多元散射校正、標準正態(tài)變換、卷積平滑、中心化等11種預處理,以交叉驗證均方根誤差最小原則選擇藍莓糖度近紅外檢測最優(yōu)預處理方法;利用組合區(qū)間偏最小二乘(synergy interval partial least square,SiPLS)方法對最優(yōu)預處理后的光譜篩選特征波段,無信息變量消除法(uninformative variable elimination,UVE)、競爭性自適應重加權(competitive adaptive reweighted sampling,CARS)和連續(xù)投影算法(successive projection algorithm,SPA)進行二次波長優(yōu)選。

      1.4 模型建立及評價

      深度信念網(wǎng)絡(DBN),是由多層受限玻爾茲曼機(RBM)和一層BP神經(jīng)網(wǎng)絡組成的一種深層神經(jīng)網(wǎng)絡。與其他神經(jīng)網(wǎng)絡不同,DBN是一種半監(jiān)督學習網(wǎng)絡,無監(jiān)督地訓練每一層RBM,利用BP神經(jīng)網(wǎng)絡接收最后一層RBM的輸出作為其輸入有監(jiān)督地對整個DBN網(wǎng)絡進行微調(diào)[10-11]。以篩選的藍莓樣本近紅外光譜的特征變量作為輸入,所測糖度作為輸出數(shù)據(jù)建立藍莓糖度的PLSR和DBN模型。以訓練集相關系數(shù)(RC)、測試集相關系數(shù)(RP)、訓練集均方根誤差(RMSEC)和測試集均方根誤差(RMSEP)對模型進行評估,得出藍莓糖度的最優(yōu)近紅外檢測模型。

      2 結果與討論

      2.1 異常數(shù)據(jù)剔除

      由于試驗過程中操作不當及測量儀器異常等因素的影響,個別樣本的測定結果出現(xiàn)異常,異常數(shù)據(jù)的存在會使模型精度降低,因此本研究采用聯(lián)合X-Y的異常樣本識別方法(ODXY)篩選并剔除異常數(shù)據(jù),以提高藍莓糖度近紅外檢測模型的預測精度[12]。分別對“藍豐”的130組數(shù)據(jù)和“瑞卡”的150組數(shù)據(jù)計算ODXY距離,如圖1所示,“藍豐”和“瑞卡”分別有2個和4個樣本的ODXY距離值遠遠超過閾值,故將其看作異常樣本剔除。

      圖1 ODXY方法判定藍莓樣本異常值

      2.1 樣本集劃分

      對剔除異常樣本后的藍莓樣本數(shù)據(jù)采用SPXY算法計算每個樣本光譜到平均光譜的距離以及其糖度到平均值的距離,以3∶1的比例劃分訓練集和測試集。劃分結果見表1,將兩個品種的藍莓劃分的樣本集進行合并,糖度最大最小值都在訓練集里,且測試集的糖度范圍均在訓練集的范圍內(nèi),樣本具有代表性,能提高藍莓糖度近紅外檢測模型的穩(wěn)定性。

      表1 SPXY算法劃分樣本集結果

      2.2 光譜預處理

      藍莓樣本原始近紅外光譜如圖2(a)所示,兩個品種藍莓光譜的趨勢一致,在波峰位置吸光度有所不同,因此可建立光譜數(shù)據(jù)和糖度之間的關系模型,達到快速無損檢測藍莓糖度的目的。

      圖2 藍莓樣品近紅外光譜圖

      由于采集光譜的過程中存在儀器背景環(huán)境造成噪音、樣品外觀形狀的影響等因素的干擾,故采用標準正態(tài)變換(SNV)、多元散射校正(MSC)、Savitzky-Golay平滑(S-G)、中心化、一階導數(shù)(1st)等處理方法對原始光譜降噪、消除基線漂移等,提高模型穩(wěn)健性。訓練集建模評價結果見表2,對模型進行10折交叉驗證,以訓練集相關系數(shù)(RC)和交叉驗證均方根誤差(RMSECV)作為評價所建模型是否良好的指標,RC越接近1表示模型預測結果與實際值更接近,RMSECV越小表明模型穩(wěn)定性越好[13]。從表2可以看出,經(jīng)S-G平滑處理后的模型RMSECV最小,為0.675 0,且RC最大,值為0.895 0,因此藍莓糖度近紅外光譜最優(yōu)預處理方法為S-G平滑,預處理后的光譜見圖2(b),對比原始光譜圖可以看出經(jīng)S-G平滑預處理的光譜噪聲明顯減少,且更加平滑。

      表2 不同光譜預處理方法建模結果

      2.3 光譜特征波長選擇

      2.3.1 SiPLS篩選特征波段

      首先將經(jīng)S-G處理后的全光譜分別劃分為7,10,12和15個子區(qū)間,在每個子區(qū)間內(nèi)建立PLS模型(即iPLS),如圖3所示。對劃分不同子區(qū)間數(shù)時得到的RMSECV值最小的前3個區(qū)間對應的波段進行對比分析,結果見表3。結合圖3和表3可知,當劃分12個區(qū)間時以第2個子區(qū)間建模得到的RMSECV達到最小,為0.637 3,由此可知,劃分為12個區(qū)間是較為理想的。

      然后采用組合區(qū)間偏最小二乘(SiPLS)方法對劃分不同區(qū)間數(shù)時RMSECV最小的前3個區(qū)間進行組合建模,以減少采用單一區(qū)間建模時特征信息的遺漏,組合建模結果見表4,SiPLS方法得到的藍莓糖度最優(yōu)區(qū)間為劃分12個區(qū)間時第2個和第7個子區(qū)間波段的組合,其RMSECV最小,為0.587 2,對應波段為593~765和1 458~1 630 nm。

      圖3 iPLS篩選特征波段

      表3 劃分不同區(qū)間iPLS建模結果

      表4 SiPLS組合建模結果

      2.3.2 SiPLS-UVE篩選特征波長

      無信息變量消除法(UVE),是添加與建模自變量數(shù)相同的隨機變量到光譜矩陣中,即增加干擾光譜信息的噪聲,通過逐一剔除法建立偏最小二乘模型[14],將回歸系數(shù)矩陣B按列計算平均值和標準偏差,平均值與標準偏差的比值作為該變量的穩(wěn)定性,將穩(wěn)定性絕對值大的變量作為有效建模變量用于最后的回歸模型中。

      為從藍莓近紅外光譜中篩選出與糖度相關度較高的波長,減少無關變量對建模的干擾,用UVE對SiPLS算法篩選的特征波段共346個變量做進一步的篩選,以期精簡模型的輸入變量,降低模型復雜程度。如圖4所示,縱向點劃線的左側為實際光譜變量,右側為添加的隨機噪聲,橫向的兩條虛線為閾值,虛線內(nèi)的變量均為藍莓糖度建模的無信息變量,在虛線以外用“*”號標記的變量為篩選出的藍莓糖度建模特征變量,共計159個,此時以SiPLS-UVE方法篩選的特征波長建立的PLS模型的RMSECV=0.535 9。

      圖4 SiPLS-UVE篩選特征波長

      2.3.3 SiPLS-CARS篩選特征波長

      CARS是一種結合蒙特卡洛(Monte Carlo,MC)采樣與PLS模型回歸系數(shù)的特征變量篩選方法,利用自適應重加權采樣(adapative reweighted sampling,ARS)和指數(shù)衰減函數(shù)(exponentially decreasing function,EDF)刪掉PLS模型中回歸系數(shù)絕對值權重較小的波長[15],保留回歸系數(shù)絕對值大的變量,經(jīng)過多次計算,選擇RMSECV最低對應子集中的波長組合作為最終提取的特征波長。

      CARS方法提取變量時設置采樣次數(shù)為50次,交叉驗證組數(shù)為5。SiPLS-CARS提取特征波長的結果見圖5。從圖5(b)可以看出,在第1~26次采樣過程中,PLS模型中與藍莓糖度無關的變量逐漸被剔除,RMSECV逐漸降低,最低達到0.881 0;26次采樣后RMSECV增加,可能是由于剔除了與糖度有關的信息。圖5(c)是每個變量在迭代時回歸系數(shù)的變化曲線,星垂線處RMSECV最低。故以MC采樣第26次選擇的變量子集作為藍莓糖度預測的特征波長,包含25個變量。

      圖5 SiPLS-CARS法特征波長提取過程

      2.3.4 SiPLS-SPA篩選特征波長

      為進一步提取光譜數(shù)據(jù)中與藍莓糖度相關性較大的波長,采用連續(xù)投影算法(SPA)對經(jīng)過SiPLS初步篩選的波長變量進行二次優(yōu)選。設置波長數(shù)范圍為3~40,根據(jù)RMSECV值確定最終選擇的變量個數(shù)。選擇不同變量數(shù)時模型的RMSECV變化曲線見圖6,當選擇19個變量建模時RMSECV最小,值為0.545 1。

      圖6 SiPLS-SPA方法提取特征波長

      2.4 基于DBN的藍莓糖度檢測模型建立

      2.4.1 DBN模型參數(shù)確定

      粒子群優(yōu)化算法(particle swarm optimization,PSO),是一種模擬鳥群的覓食行為的啟發(fā)式智能算法[16]。在PSO算法中,把粒子看作鳥,每個粒子在飛行的時候都不斷地調(diào)整自己的方向,改變其位置,向著當前最優(yōu)的粒子靠近,這個過程靠粒子的速度和位置的迭代實現(xiàn),迭代公式如式(1)

      (1)

      式(1)中,ω為慣性權重;rand()為[0,1]之間的隨機數(shù);C1和C2為學習因子;Pi(t-1)為粒子i在迭代第t-1次后得到的最好的位置,即局部最優(yōu)解;G(t-1)為所有粒子迭代第t-1次后最好的位置,即全局最優(yōu)解;Xi(t)為粒子i迭代第t次時的位置;Vi(t)為粒子i在迭代第t次時的速度。

      由2.3可以得出,SiPLS-UVE方法提取的159個波長變量包含了本試驗中藍莓糖度的最佳信息,故將該159個特征波長對應的光譜數(shù)據(jù)作為輸入,對應的糖度值作為標簽輸出。由于DBN網(wǎng)絡沒有固定的隱含層和隱含層節(jié)點數(shù)量,需要依據(jù)建模樣本數(shù)據(jù)確定,本工作選擇了3種不同隱含層數(shù)測定隱含層數(shù)設定對藍莓糖度定量分析模型的影響,如表5所示。設定DBN網(wǎng)絡的隱含層數(shù)為3時,其均方根誤差為0.397 7,當隱含層數(shù)增加到4時,模型的誤差沒有減小反而增加,說明藍莓糖度的DBN分析模型的隱含層數(shù)并非越多越好。同時,各隱含層神經(jīng)元的個數(shù)對模型的影響也較大,為避免人為設定節(jié)點數(shù)的片面性,利用粒子群優(yōu)化算法對DBN網(wǎng)絡各隱含層的節(jié)點數(shù)在[1,100]之間進行尋優(yōu)[17],設定PSO算法的種群規(guī)模N=20;最大迭代次數(shù)G=10;ωmax=0.9,ωmin=0.5;Cmax=0.9,Cmin=0.5。結果見表5,當設置3個隱含層時,模型預測效果最好,此時各隱含層節(jié)點數(shù)為67-43-25。

      表5 隱含層數(shù)及隱含層節(jié)點數(shù)選擇

      2.4.2 DBN模型建立及分析

      以SiPLS-UVE篩選的最佳特征波長、SiPLS篩選的特征波段以及全光譜分別作為DBN網(wǎng)絡的輸入建立模型并預測藍莓糖度,隱含層設置為3層,各隱含層節(jié)點數(shù)分別為67,43和25。為驗證DBN方法建立藍莓糖度近紅外檢測模型的有效性,將建模結果與PLSR方法進行比較,結果如表6所示。

      表6 DBN及PLSR模型比較

      從表6可以看出,無論是以全光譜建模還是特征波長建模,DBN的預測效果均優(yōu)于PLSR,說明DBN模型更適用于非線性且復雜的近紅外光譜數(shù)據(jù);SiPLS篩選出的特征波段共包含346個波長,與全光譜建模相比,在減少建模變量的基礎上還改善了預測效果;并且經(jīng)過二次波長選擇后,藍莓糖度的有效特征變量減少到159個,減少了無關信息變量的干擾,PLSR模型和DBN模型的預測精度都得到進一步提高。藍莓糖度的最優(yōu)模型為SiPLS-UVE-DBN,RC,RP和RMSEP分別為0.967 2,0.954 2和0.310 5。

      3 結 論

      基于近紅外光譜技術,對“藍豐”和“瑞卡”兩個品種藍莓的糖度進行分析,采用中心化、S-G平滑等11種預處理方法對藍莓原始光譜進行降噪;選用三種復合波長篩選方法選出了與檢測藍莓糖度相關的近紅外特征波長,結合深度信念網(wǎng)絡(DBN)建立了藍莓糖度近紅外檢測模型。S-G平滑預處理結果最好,其模型相關系數(shù)RC為0.895 0,在S-G預處理的基礎上,對其分別采用SiPLS,SiPLS-CARS,SiPLS-UVE和SiPLS-SPA算法選擇特征波長。從建模結果來看,利用DBN建立的檢測模型比PLSR模型的效果更佳,其中以SiPLS-UVE篩選出的159個變量建立的藍莓糖度DBN模型,在減少建模所用波長變量的同時提高了模型預測精度,網(wǎng)絡模型結構為159-67-43-25-1時預測效果達到最優(yōu),最優(yōu)模型的RC,RMSEC,RP和RMSEP分別為0.967 2,0.249 0,0.954 2和0.310 5。結果表明,深度信念網(wǎng)絡比線性方法建模效果更好,測試集均方根誤差較PLSR全光譜建模降低54%,說明基于DBN方法建立的藍莓糖度近紅外檢測模型,可以實現(xiàn)藍莓糖度在線快速準確檢測,為藍莓糖度檢測提供了新的參考。

      本試驗僅選取了兩個品種的藍莓進行建模分析,在下一步研究中,會增加試驗藍莓的品種及樣本數(shù),以增強模型的穩(wěn)定性和普適性,以期為更多物質(zhì)應用近紅外光譜技術進行定量檢測提供技術依據(jù)。

      猜你喜歡
      糖度藍莓波長
      HPLC-PDA雙波長法同時測定四季草片中沒食子酸和槲皮苷的含量
      糖度高、類型多、瓜味足 “炫彩”系列小西瓜 畝產(chǎn)值3.5萬元
      藍莓建園技術
      河北果樹(2021年4期)2021-12-02 01:15:08
      藍莓姑娘
      雙波長激光治療慢性牙周炎的療效觀察
      西海岸的藍莓名片
      商周刊(2017年5期)2017-08-22 03:35:22
      甜甜的藍莓果
      甜菜塊根糖度檢測使用重復檢測進行質(zhì)量控制的方法
      中國糖料(2016年1期)2016-12-01 06:49:07
      日本研發(fā)出可完全覆蓋可見光波長的LED光源
      中國照明(2016年4期)2016-05-17 06:16:15
      基于不同物候期蘋果樹葉片光譜特征預測果實糖度
      分析化學(2015年6期)2015-06-18 10:37:24
      麟游县| 泰来县| 剑阁县| 栾川县| 大同市| 博兴县| 会东县| 普陀区| 张掖市| 南华县| 灵丘县| 登封市| 驻马店市| 唐河县| 汤阴县| 高青县| 瓮安县| 洛南县| 灵石县| 博罗县| 高唐县| 花莲市| 伊金霍洛旗| 遂溪县| 松阳县| 信丰县| 江西省| 韶关市| 牙克石市| 瓦房店市| 孙吴县| 朝阳市| 西乌珠穆沁旗| 拉萨市| 台前县| 揭西县| 于都县| 武清区| 鄢陵县| 射洪县| 卢龙县|