于瑋,周卓彥,孫仲謀,張興龍,劉玉柱,2,3?
(1南京信息工程大學,江蘇省大氣海洋光電探測重點實驗室,江蘇 南京 210044;2江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京 210044;3南京信息工程大學,江蘇省氣象光子學與光電探測國際合作聯(lián)合實驗室,江蘇 南京 210044)
薔薇屬植物在日常生活中較為常見,主要包括玫瑰、薔薇和月季。薔薇屬植物不僅可以用于園林觀賞[1],同時也具有重要的食用價值[2]、經(jīng)濟價值[3]和藥用價值[4]。例如,在香料行業(yè)中,薔薇屬植物是重要的花香來源,從薔薇屬植物中提取的精油具有重要的香料價值[5]。而我國薔薇屬芳香資源具有多樣性,因此,快速、準確地辨別薔薇屬植物具有重要意義。
辨別薔薇屬植物的方法有很多,如細胞學[6]通常利用染色體的結(jié)構(gòu)、數(shù)目和核型來進行區(qū)分,孢粉學[7]借助光鏡和掃描電子顯微鏡對花粉的孔、溝數(shù)目、花粉壁以及紋飾等特點進行探討,形態(tài)學[8]通過觀察葉片或種皮的微形態(tài)來探討和劃分植物間的親緣關(guān)系,分子生物學[9]在DNA序列的基礎(chǔ)上為植物辨別提供了可靠證據(jù)。但這些方法大都比較復雜,需要對樣品進行預處理,過程繁瑣,且檢測時間較長,對實驗環(huán)境要求也較高。
激光誘導擊穿光譜(LIBS)技術(shù)是一種全新的物質(zhì)元素分析方法,其可以分析元素周期表中幾乎所有的元素,同時又具有實時、原位、在線、靈敏度高、可多元素同時分析的優(yōu)點[10,11],可用于定性[12,13]和定量[14]分析,在多個領(lǐng)域得到了廣泛應用[15?18]。廣義回歸神經(jīng)網(wǎng)絡(GRNN)是一種神經(jīng)網(wǎng)絡模型,最早由Specht[19]提出。GRNN是徑向基神經(jīng)網(wǎng)絡的一種,具有很強的非線性映射能力和學習速度,網(wǎng)絡最后收斂于樣本聚集較多的優(yōu)化回歸[20]。在樣本數(shù)據(jù)量少時,GRNN也能達到不錯的預測效果,還可以處理不穩(wěn)定數(shù)據(jù)。
本文將LIBS技術(shù)與GRNN相結(jié)合,用于檢測和辨別薔薇屬植物。首先,利用LIBS技術(shù)原位在線探測薔薇屬花,從光譜數(shù)據(jù)中可觀察到三種花共有的元素包括C、H、O、N、Mg、Ca、Na和K,并且在月季和玫瑰的光譜中還可以觀測到Mn的特征譜線。此外,在玫瑰、薔薇和月季的光譜中都觀察到了CN,通過計算三種花光譜中CN的振動溫度和轉(zhuǎn)動溫度,驗證了實驗條件的相似性。其次,通過對比分析玫瑰、薔薇和月季的光譜圖,選取強度差異較顯著的特征譜線作為變量。本研究基于Mn、Ca、Na的15條特征譜線建立非線性判別模型GRNN。挑選玫瑰、薔薇和月季的各100個光譜數(shù)據(jù),其中90個作為訓練集,剩余10個作為測試集。結(jié)果顯示,GRNN可以很好地區(qū)分三種花,預測判別的正確率可達93.3%。
實驗裝置示意圖如圖1所示。本研究采用Continuum公司的Nd:YAG單脈沖激光器。激光器波長為1064 nm,脈沖持續(xù)時間為6 ns,調(diào)Q時間為1.5μs,脈沖重復頻率為10 Hz。實驗樣品為購買于商店的玫瑰、薔薇和月季,如圖2所示。其中,玫瑰和薔薇產(chǎn)自云南,月季產(chǎn)自江蘇。樣品僅作烘干處理,未經(jīng)任何化學處理。調(diào)節(jié)激光脈沖能量到260.34 mJ,使信號穩(wěn)定并達到理想的實驗效果。激光通過三個反射鏡改變光路,再通過聚焦透鏡(焦距為150 mm)聚焦于花瓣上,產(chǎn)生高溫等離子體,通過光纖探頭耦合進入光纖,傳輸?shù)剿耐ǖ拦庾V儀,再將信號傳送到計算機進行光譜分析。采用的光譜儀產(chǎn)自Avantes公司,光譜窗口范圍是200~890 nm,分辨率為0.1 nm。
圖1 實驗裝置示意圖Fig.1 Schematic diagram of experimental setup
圖2 實驗樣品圖(玫瑰,薔薇,月季)Fig.2 Picture of experimental samples(Rosa rugosa Thunb.,Rosa sp.and Rosa chinensis Jacq.)
將激光打在玫瑰、薔薇和月季的花瓣內(nèi)側(cè),得到三種花的光譜信息。由于光譜儀存在漂移現(xiàn)象,要對得到的光譜數(shù)據(jù)進行校正。與NIST數(shù)據(jù)庫中的特征譜線進行比對后,對光譜進行標定。薔薇屬植物的花香成分主要是醇類、萜烯類和芳香烴類物質(zhì)。因此,玫瑰、薔薇和月季的光譜圖中都有C、H、O的特征譜線,分別如圖3、圖4和圖5所示。此外,三種花中都含有N、Mg、Ca、Na和K元素。圖6將玫瑰、薔薇和月季的光譜圖進行對比,由圖可見玫瑰和月季的光譜中都有Mn的特征譜線,而薔薇的光譜圖中未曾發(fā)現(xiàn)。其中,玫瑰中有257.61、259.37、260.57、293.31、293.93、294.92、403.08、403.31、403.45 nm這9條Mn的特征譜線,月季中只有257.61、259.37、260.57、403.08、403.31、403.45 nm這6條特征譜線。通過對比,還可觀察到玫瑰中Mn特征譜線的相對強度要高于月季中的。以上差異表明利用LIBS技術(shù)來辨別薔薇屬植物是可行的。不同植物具有不同的生長習性,因此本實驗所選用的三種花并不是產(chǎn)自同一地區(qū)的。而通過圖3和圖4可以看出,同一產(chǎn)地的玫瑰和薔薇的光譜具有一定差異。本實驗設(shè)計作為一種研究方法存在一定的局限性,涉及后續(xù)的應用,還可考慮產(chǎn)地氣候、土壤等因素,從而來提高檢測的準確率。
圖3 玫瑰在240~875 nm波段的LIBS光譜。(a)240~300 nm;(b)350~440 nm;(c)500~675 nm;(d)700~875 nmFig.3 LIBS spectrum of Rosa rugosa Thunb. in the band of 240-875 nm (a) 240-300 nm;(b)350-440 nm;(c)500-675 nm;(d)700-875 nm
圖4 薔薇在240~875 nm波段的LIBS光譜。(a)240~300 nm;(b)350~440 nm;(c)500~675 nm;(d)700~875 nmFig.4 LIBS spectrum of Rosa sp. in the band of 240-875nm.(a)240-300 nm;(b)350-440 nm;(c)500-675 nm;(d)700-875 nm
圖5 月季在240~875 nm波段的LIBS光譜。(a)240~300 nm;(b)350~440 nm;(c)500~675 nm;(d)700~875 nmFig.5 LIBS spectrum of Rosachinensis Jacq. in the band of 240-875 nm(a)240-300 nm;(b)350-440 nm;(c)500-675 nm;(d)700-875 nm
圖6 玫瑰(a)、薔薇(b)和月季(c)的光譜對比圖Fig.6 Spectral comparison of Rosa rugosa Thunb.(a),Rosa sp.(b)and Rosa chinensis Jacq.(c)
如圖3(b)、4(b)、5(b)所示,實驗在玫瑰、薔薇和月季的光譜中探測到了CN。為了更好地說明探測過程的物理參數(shù),還進一步研究了CN的振動溫度和轉(zhuǎn)動溫度。CN形成的主要過程如下:
而薔薇屬植物中的CN是由花中的C元素和N元素反應以及由花中的C元素和空氣中的N2反應形成的。利用雙原子分子光譜仿真軟件LIFBASE對薔薇屬植物光譜中的CN進行模擬,校正基線和波長偏移,調(diào)節(jié)振動溫度和轉(zhuǎn)動溫度,使得模擬值盡可能地接近實驗值。最終得到玫瑰、薔薇和月季光譜中CN的振動溫度分別為7600、7800、7600 K,而轉(zhuǎn)動溫度分別為7700、7800、7800 K。該結(jié)果表明測量三種花的光譜時實驗條件具有相似性。其中,月季中CN的模擬和實驗光譜如圖7所示。
圖7 月季中CN的模擬光譜(a)和實驗光譜(b)Fig.7 Simulation spectrum(a)and experimental spectrum(b)of CN in the Rosa chinensis Jacq.
本研究利用玫瑰、薔薇和月季光譜中的特征譜線并結(jié)合GRNN來識別三種花。GRNN是一種有監(jiān)督學習、非線性回歸的神經(jīng)網(wǎng)絡,其使用徑向基函數(shù)作為激活函數(shù),具有良好的泛化性能和較高的正確率。傳統(tǒng)的鑒別薔薇屬植物的方法都過于繁雜,因此,將GRNN應用到薔薇屬植物的分類識別中具有重要意義。
首先采集薔薇屬植物的光譜數(shù)據(jù),選擇特征譜線作為特征變量,接著產(chǎn)生訓練集和測試集并創(chuàng)建GRNN模型,然后通過仿真測試,最后輸出性能評價,得到預測正確率。從玫瑰、薔薇和月季的光譜數(shù)據(jù)中各選擇單個花朵的100個測量光譜作為樣本。在光譜選擇過程中要注意篩查是否存在純空氣譜,從而避免這些異常數(shù)據(jù)對模型建立產(chǎn)生影響,模型建立的好壞會直接影響預測結(jié)果的接近程度。由于等離子體的不穩(wěn)定性和背景噪聲的干擾,直接分析整個波段的數(shù)據(jù)會導致辨別效果不佳。此外,一個光譜包含8192個數(shù)據(jù),數(shù)據(jù)量較大,直接計算耗時較長。因此,對比三種花的光譜圖,選擇差異較明顯的15個特征峰作為變量,如表1所示。本研究采用隨機法產(chǎn)生訓練集和測試集,從三類中隨機挑選90個樣本作為訓練集,每類中剩下10個樣本則自動成為測試集,這種方法不失一般性。因為GRNN隱含層節(jié)點的激活函數(shù)采用了高斯函數(shù),它對輸入信息具有局部激活特性,所以對接近于局部神經(jīng)元特征的輸入信息具有較強的吸引力,準確率會大大提高。
表1 選取的15條特征譜線Table 1 The selected 15 characteristic spectral lines
30個測試集的預測結(jié)果如圖8所示,其中標簽1、2、3分別表示玫瑰、薔薇和月季,從圖中可看出1個薔薇數(shù)據(jù)集和1個月季數(shù)據(jù)集被誤判為玫瑰,正確率可達93.3%。
圖8 玫瑰、薔薇和月季的預測結(jié)果Fig.8 Forecast results for Rosa rugosa Thunb.,Rosa sp.and Rosa chinensis Jacq.
利用LIBS技術(shù)探測玫瑰、薔薇和月季這三種薔薇屬植物,實驗觀察到三種花中都含有C、H、O、N、Mg、Ca、Na和K元素。此外,還在玫瑰和月季中探測到了Mn元素。薔薇屬植物中的CN是由花中的C元素和N元素反應以及由花中的C元素和空氣中的N2反應形成的。通過LIFBASE軟件模擬CN光譜,得到了玫瑰、薔薇和月季中CN的振動溫度和轉(zhuǎn)動溫度。三種花振動溫度和轉(zhuǎn)動溫度的近似證明了探測過程中實驗條件具有相似性。GRNN不同于反向傳播神經(jīng)網(wǎng)絡(BPNN),其權(quán)值和閾值只與訓練樣本有關(guān),無需迭代,計算量小,計算速度快,且具有良好的預測能力,在識別薔薇屬植物方面有一定的優(yōu)越性。將LIBS技術(shù)與GRNN相結(jié)合,選取光譜中的15條特征譜線作為變量,三種花各挑選100個測量光譜,90個作為訓練集,10個作為測試集,得到預測結(jié)果的正確率達到93.3%。綜上所述,本實驗將LIBS技術(shù)和GRNN相結(jié)合應用到薔薇屬植物的識別中進行方法研究是具有可行性的。實際上,具體應用于探測薔薇屬植物時,還需考慮樣品產(chǎn)地的氣候、土壤等因素對光譜產(chǎn)生的影響。