蘇 虹 宋 楠 全鶯歌 宮會麗
(1.中國海洋大學信息科學與工程學院,山東 青島 266100;2.山東煙草研究院,山東 濟南 250000;3.山東中煙工業(yè)有限責任公司,山東 濟南 250000)
近年來近紅外光譜分析技術已成為發(fā)展最為迅速的光譜技術之一。隨著近紅外光譜分析技術在各行業(yè)飛速發(fā)展,解決模型傳遞問題成為各行業(yè)的重中之重。模型傳遞也稱為儀器標準化,是指經(jīng)過數(shù)學處理后,使一臺儀器上的模型能夠用于另一臺儀器,從而減少重新建模所帶來的巨大工作量,實現(xiàn)樣品和數(shù)據(jù)資源的共享。目前,模型傳遞大多使用的是有標模型傳遞算法,主要有斜率/截距(B/S)算法 [1]、shenk’s算法 [2]和直接校正(DS)算法[3]等,其中應用最為普遍和最為成功的方法是B/S算法和DS算法。DS算法所需標樣多,其光譜只是在波長很小的范圍內(nèi)發(fā)生變化,有時會存在“過校正”現(xiàn)象。而shenk’s算法利用某波長點小窗口范圍的光譜數(shù)據(jù)來計算該波長的校正參數(shù),標樣少,可以避免過校正現(xiàn)象。所以本文將shenk’s算法和B/S算法應用于煙葉在Nicolet AntarisII上模型轉(zhuǎn)移,并比較兩種轉(zhuǎn)移算法優(yōu)劣。
圖1 兩條光譜轉(zhuǎn)換前
圖2 兩條光譜轉(zhuǎn)換后
表1 主機子機轉(zhuǎn)換前后評價
表2 t檢驗評價,臨界值t(48,0.05)=2.009
nicolet AntarisII傅立葉變換近紅外光譜儀(美國Thermo Nicolet儀器公司),配有積分球漫反射采樣系統(tǒng)、InGaAs檢測器、Result光譜采集軟件和半徑6cm石英杯等。兩臺儀器分別作為主機和子機。儀器的工作參數(shù)為:光譜范圍10000cm-1~3999cm-1, 分 辨 率 8cm-1, 掃描次數(shù)設為64次,旋轉(zhuǎn)樣品杯且掃描樣品前均掃描背景。
采集山東、云南、四川、廣西四個產(chǎn)區(qū)的395個樣品,將這些樣品在烘箱中60°C烘干,去梗磨碎,過60目篩,稱量50g分別在兩臺相同型號的儀器上掃描近紅外光譜。從中選出206個代表性樣品作為校正集, 48個樣品作為驗證集,選取誤差較小、且重復性較好的15個樣品作為模型轉(zhuǎn)移樣本。
將測定樣品的總糖、還原糖、總氮、煙堿和cl的值與主機采集的NIR譜圖按一一對應的原則,導入化學計量學軟件。通過光譜處理、光譜范圍選擇、SG導數(shù)濾波和偏最小二乘(PLS)回歸建模,建立四個產(chǎn)區(qū)烤煙煙葉的5種主要化學成分定量預測模型。
圖3 主機和子機轉(zhuǎn)換前預測值對比
圖4 主機和子機B/S轉(zhuǎn)換后預測值對比
從兩個方面來看模型的轉(zhuǎn)移效果,一是:用shenk’s算法對光譜進行轉(zhuǎn)移,將轉(zhuǎn)移后的光譜數(shù)據(jù)用于主機模型上進行預測烤煙煙葉的5項指標;二是:用B/S算法對子機上的預測值進行轉(zhuǎn)移預測烤煙煙葉的5項指標。并通過ICCA國際標準和t檢驗評估模型的轉(zhuǎn)移效果。
由圖1可見,同一個樣品分別在主機和子機上采集到的兩條原始光譜的形狀雖然非常相似,但兩臺儀器的吸光度強度明顯看出區(qū)別。從圖2中看到,光譜經(jīng)過shenk’s算法轉(zhuǎn)移之后與主機光譜幾乎不存在差異。以總糖為例,從圖3和圖4來看經(jīng)B/S算法轉(zhuǎn)換后,主機和子機預測值的差距變大。
(1)按照ICCA國際標準模型轉(zhuǎn)移判斷設備的傳輸性標準偏差是否小于2/3*SEP。
根據(jù)表1所示:主機和子機直接傳遞預測值的標準偏差均大于2/3*SEP,所以主機和子機之間需要轉(zhuǎn)移。分別通過shenk’s算法和斜率/截距進行轉(zhuǎn)移,主機和shenk’s算法轉(zhuǎn)移預測值偏差的標準偏差均小于2/3*SEP,達到了模型轉(zhuǎn)移的效果;主機和B/S算法轉(zhuǎn)移預測值偏差的標準偏差均大于2/3*SEP,沒有達到轉(zhuǎn)移的效果。
(2)t檢驗評價分析
根據(jù)表2所示,主機和子機直接傳遞的t檢驗值均大于臨界值,所以主機和子機存在顯著性差異,故主機和子機之間需要轉(zhuǎn)移。主機和子機shenk’s算法轉(zhuǎn)移預測值的t檢驗值均小于臨界值,所以主機和子機shenk’s算法轉(zhuǎn)移不存在顯著性差異,達到轉(zhuǎn)移的效果;主機和子機B/S算法轉(zhuǎn)移預測值的t檢驗值只有總糖達到了轉(zhuǎn)移效果,不存在顯著性差異。
本文基于Nicolet AntarisII系列近紅外光譜儀實際應用中在線檢測煙葉化學成分分析模型的轉(zhuǎn)移,應用shenk’s算法使預測結(jié)果得到明顯的改善,并且由于shenk’s算法是一元全光譜校正法,其計算過程是利用原光譜進行的,基本無信息的丟失。而從分析結(jié)果上來看,斜率截距法也使預測結(jié)果得到了改善,但沒達到預期的結(jié)果,斜率截距轉(zhuǎn)移后還存在顯著性差異,并且斜率截距只是在預測值上對結(jié)果進行了校正,不能從根本上解決問題。綜上所述,shenk’s算法用于煙葉各項指標模型傳遞更具優(yōu)勢,能夠較好解決煙草行業(yè)內(nèi)模型無法統(tǒng)一共享等問題。
[1]Bouveresse E,Casolino C,de la Pezuela C.Journal of pharmaceutical and biomedical analysis,1998:18-35.
[2]褚小立.化學計量學方法與分子光譜分析技術[M].北京:化學工業(yè)出版社,2011:109.