趙 曼,郭一新,何玉青*,郭 宏,金偉其,任林茂,2
1.北京理工大學(xué)光電學(xué)院,光電成像技術(shù)與系統(tǒng)教育部重點實驗室,北京 100081 2.鐵道警察學(xué)院,河南 鄭州 450053
拉曼光譜分析作為一種分子光譜檢測方法,具有無需樣品前處理和制備過程、操作簡便、不損傷樣品、測定時間短、靈敏度高等優(yōu)點[1]。但其往往伴隨熒光背景,增加了獲取拉曼光譜信息的難度,直接影響樣品定性定量分析。因此,拉曼光譜分析需進行基線校正來消除熒光干擾。
常用的基線校正方法有多項式擬合[2]、小波變換[3]、平滑法等,其中多項式擬合法基于最小二乘法確定多項式系數(shù)得到擬合基線,原理簡單但存在階數(shù)選擇的問題。小波變換法的實質(zhì)是將信號分解成一系列不同頻率正弦波疊加,可將光譜中的低頻和高頻信號分開,難點是選擇最佳分解方法,計算量和難度較大。平滑法利用循環(huán)迭代平滑的方法不斷逼近基線,每次迭代都需判斷是否滿足條件,計算量較大。另一種常用方法是分段線性擬合,覃趙軍等針對特征峰定義擬合數(shù)據(jù)點,通過線性擬合方法分段擬合背景基線,達到了較好的校正效果,不足之處在于需要人工定義擬合數(shù)據(jù)點,也存在目標(biāo)點定位不準(zhǔn)導(dǎo)致的過校正現(xiàn)象,且處理過程繁瑣,不利于光譜信息的快速提取。
實際上,良好的基線校正應(yīng)結(jié)合可能的光譜特征,為此,在對紫外拉曼與熒光光譜特征分析的基礎(chǔ)上,通過改進相對簡單的分段線性擬合基線法,研究一種自動識別目標(biāo)點位置的分段線性擬合方法,以實現(xiàn)從樣品的混合光譜中有效分離出拉曼光譜。
從拉曼頻移譜來看,不同激發(fā)波長的拉曼光譜分布相近,但是相較于可見光和紅外拉曼光譜,紫外拉曼光譜還具有一些重要的特點:紫外拉曼光散射強度高[4];受環(huán)境干擾影響?。蝗搜郯踩愿遊5-6];可用于爆炸性材料;易于熒光光譜分離:激光照射會產(chǎn)生拉曼和熒光,通常拉曼光譜約有200~4 000 cm-1的拉曼位移,熒光光譜則在280~370 nm較強。采用波長較短的紫外激光可望在光譜上形成拉曼和熒光光譜的分離[7-8],有利于拉曼光譜的分析。研究表明[9]:當(dāng)激光波長在250 nm以下時,拉曼光譜與其徹底分離(如圖1)。
圖1 拉曼響應(yīng)與熒光光譜(Laser Line為激光發(fā)射源)[10]Fig.1 Raman response and fluorescence spectrum (Laser Line is the response of the laser source)
以上特性表明,日盲紫外拉曼光譜檢測適合白天自然環(huán)境下遠距離的遙測,在諸如爆炸物、毒品以及食品和藥品安全等的非接觸無損檢測方面具有廣泛的應(yīng)用前景。
本文所用的紫外拉曼光譜儀采用波長266 nm的激光器,根據(jù)前面的分析,它激發(fā)出的拉曼和熒光光譜有部分重疊,即距離激發(fā)波長較近部分幾乎無重疊,波長增加之后開始重疊且熒光成分逐漸增加,接近分段線性遞增的特點,因此,利用分段線性函數(shù)擬合熒光光譜基線比較簡捷。傳統(tǒng)方法[5]采用人為預(yù)定義基線點,再在其前后三點中取最小值作為目標(biāo)點。此方法需經(jīng)驗豐富的操作人員,否則將造成基線點偏差,出現(xiàn)過校正現(xiàn)象,此外定義基線點過程中選取最小值的方式容易引入噪聲干擾,導(dǎo)致特征峰強度異常增大。
為此,本文研究了一種自動基線點選擇方法,通過對不同次平滑迭代后光譜強度偏差的比較確定準(zhǔn)有效基線點位置,然后利用線性迭代擬合法提取并修正過校正基線點,再對所有相鄰有效基線點進行逐段直線連接得到基線,最后用平滑去噪后的光譜減去基線得到拉曼光譜。
(1)首先求原始信號經(jīng)不同次平滑迭代后的光譜數(shù)據(jù)
選擇Savitzky-Golay算法作平滑迭代[3],在這個過程中光譜波峰位置附近逐漸下降且變化較大,基線部分逐漸上升且相對變化很小[圖2(a)]。如果只根據(jù)經(jīng)某次平滑迭代后的光譜數(shù)據(jù)與原光譜數(shù)據(jù)的偏差來判定基線點,很容易受到噪聲的干擾直接導(dǎo)致誤判[圖2(b)],因此,本文通過求不同次迭代后光譜數(shù)據(jù)之間的標(biāo)準(zhǔn)差來達到避免噪聲干擾的目的。首先介紹S-G平滑迭代原理。
圖2 平滑迭代過程(a):波峰與基線位置處的變化; (b):單次平滑迭代判定基線點易受噪聲干擾Fig.2 Smooth iteration(a):The changes at the peak and baseline position; (b):The effect of noise
設(shè)原始信號為S(x)=p0(x),x(j) (j=1,2,…,J)為光譜采樣點;2M+1的平滑窗口,用K<(2M+1)階多項式pt[x(j+i)](i=-M,…0,…,M)對pt-1(x)(t=1,2,3,…,T)平滑濾波
(t=1,2,3,…,T)
(1)
(t=1,2,3,…,T)
(2)
將第t次平滑濾波函數(shù)在中心點i=0處x(j)的值pt[x(j)](j=M+1,M+2,…,J-M)作為濾波結(jié)果。對于光譜兩端的2M個點,分別利用第M+1個點和倒數(shù)第M+1個點為中心擬合的多項式求解。
平滑窗口在光譜中移動,每移動一次去掉最左邊一個點加上最右邊一個點,利用式(1)求得平滑后的拉曼光譜數(shù)據(jù)pt(x)。
(3)
(2) 然后通過對光譜強度偏差的比較確定準(zhǔn)有效基線點位置
為減小噪聲影響,將原始光譜S(x)經(jīng)一次平滑濾波的p1(x)作為后續(xù)處理的光譜數(shù)據(jù)。經(jīng)不同次迭代平滑的光譜波峰和基線點處的光譜強度標(biāo)準(zhǔn)差SD差別較大[圖2(a)],定義
(4)
(5)
(3) 再利用線性迭代擬合法提取并修正過校正基線點
準(zhǔn)有效基線點區(qū)間將整個拉曼光譜分成N個特征峰區(qū)間(圖3),設(shè)特征峰區(qū)間為[xl(n),xr(n)] (n=1,2,3,…,N),直線連點(xl(n),yl(n))和(xr(n),yr(n))得
(xl(n) (6) 若h1(x)≤p1(x),直接得基線h1(x)[圖3(a)中紅線];若h1(x)>p1(x),該特征峰區(qū)間兩側(cè)存在過校正[圖3(b)中紅虛線],需把兩端點即(xl(n),yl(n))和(xr(n),yr(n))分別朝特征峰方向移動,哪個端點移動取決于過校正點集E與相應(yīng)特征峰(特征峰區(qū)間連峰時取較近峰)的位置關(guān)系,根據(jù)二階導(dǎo)數(shù)極小值與譜峰中心x0(n)重合[10]得x0(n),一二階導(dǎo)數(shù)的計算式 (7) (8) 若E全在特征峰左側(cè)[x(E) 圖3 模擬光譜基線擬合過程(a):第3個特征峰區(qū)間;(b):第2個特征峰區(qū)間Fig.3 Baseline fitting process of the simulated spectrum(a):The 3rd characteristic peak intervals; (b):The 2nd characteristic peak intervals 圖4 改進的分段線性擬合方法流程圖Fig.4 Flow chart of improved piecewise linear fitting method (4)逐段直線連接所有相鄰有效基線點 根據(jù)邊界條件 (9) 和式(6)得到該特征峰區(qū)間的基線h1(x)[圖3(b)紅實線]。由特征峰區(qū)間確定基線區(qū)間[xr(n),xl(n+1)] (n=1,2,3…,N)和[xa,xl(1)](xa是首個基線區(qū)間的起點),分別用直線連接各基線區(qū)間點得基線區(qū)間的基線h2(x)。最后,得到整個光譜的基線(算法流程如圖4) (n=1,2,…,N) (10) 為驗證本文方法的有效性,引入由多個洛倫茲函數(shù)疊加而成的模擬拉曼光譜。根據(jù)紫外混合光譜基線的特點,選用反曲線形函數(shù)模擬漂移較小和較大的熒光基線,并疊加信噪比為20 dB的高斯白噪聲,得到具有熒光和噪聲的模擬拉曼光譜[圖5(a)與(c)藍色譜線]。 綜合考慮簡便程度和算法效果,選取窗口大小為5的一階多項式,迭代次數(shù)分別取5,10和20次,經(jīng)過平滑迭代后的光譜分別為p5(x),p10(x)和p20(x),設(shè)定閾值SD0,滿足SD 對比分析傳統(tǒng)方法與本文方法的基線校正效果(圖5,綠線—傳統(tǒng)方法,紅線—本文方法),大體看兩種方法都取得良好校正效果,但傳統(tǒng)方法對某些特征峰出現(xiàn)過校正[如圖5(a) 800 cm-1處的特征峰左側(cè),由右側(cè)基線較高而左半側(cè)基線抬高不明顯導(dǎo)致],造成臨近位置的特征峰強度降低[圖5(b),標(biāo)準(zhǔn)光譜、本文和傳統(tǒng)方法校正后光譜在800和880 cm-1處強度分別為39.51,38.94,36.02;31.93,30.98,28.34],進一步計算校正后光譜與標(biāo)準(zhǔn)光譜峰強度間的均方根誤差,本文方法較傳統(tǒng)方法分別由1.22和1.69降低為0.36和0.85,說明本文擬合方法得到了更好的校正效果。 為檢驗本文校正方法效果,采用自研的紫外拉曼光譜儀(激光波長266 nm,功率30 mW,分辨率12 cm-1,光譜范圍350~4 000 cm-1)對典型的小蘇打藥片、阿司匹林粉末、維生素C泡騰片等樣品進行了拉曼光譜檢測。紫外拉曼光譜儀原理和實物如圖6所示,266 nm紫外光經(jīng)反射鏡M照射到雙向色鏡BS1上,經(jīng)BS1反射通過顯微物鏡L1聚焦到樣品產(chǎn)生拉曼散射;拉曼散射以相同路徑返回BS1(濾除266 nm光);之后經(jīng)BS2反射、BS3長通濾光片二次濾除、接收物鏡L2,通過光纖耦合到光譜儀,獲得拉曼+熒光混合光譜,基線校正由PC機專用處理軟件完成,可進行樣品的拉曼光譜特征峰檢測和識別出樣品的種類。 圖5 模擬紫外拉曼光譜的基線校正(a),(b):漂移較小的基線擬合及校正效果; (c),(d):漂移較大的基線擬合及校正效果Fig.5 Baseline correction of simulated UV Raman spectra by traditional method and method of this paper 圖7給出實測小蘇打藥片、阿司匹林粉末、VC泡騰片拉曼光譜及其基線校正曲線(綠線為傳統(tǒng)方法,紅線為本文方法)??煽闯觯?1)光譜在波數(shù)較大處的基線被抬高,兩種方法校正后都取得較好效果;(2)傳統(tǒng)方法對某些拉曼特征峰過校正 (如小蘇打1 845 cm-1、阿司匹林836 cm-1、VC 1 125 cm-1處特征峰左側(cè)),造成臨近位置的特征峰強度降低(表1)。(3)傳統(tǒng)方法受噪聲影響導(dǎo)致校正基線后的特征峰強度異常增大(阿司匹林2 906和2 957cm-1的特征峰,由于傳統(tǒng)方法定義基線點時只選最小值一點,易選到噪聲的最低點,導(dǎo)致特征峰異常增大),而本文方法通過光譜強度偏差的比較,設(shè)定適當(dāng)?shù)拈撝底詣哟_定基線點位置區(qū)間,然后經(jīng)多次線性迭代校正,成功避免了上述過校正現(xiàn)象和噪聲干擾獲得了更好的校正效果。 圖6 紫外拉曼光譜儀(a):光路設(shè)計;(b):裝置實物Fig.6 Ultraviolet Raman spectrometer(a):Optical path design;(b):Experimental device 圖7 傳統(tǒng)方法和本文方法的紫外拉曼光譜基線校正(a),(b),(c):小蘇打、阿司匹林和VC泡騰片的混合光譜;(d),(e),(f):對應(yīng)的基線校正效果Fig.7 Baseline correction of UV Raman spectra(a),(b),(c):The mixed spectrum of baking soda,aspirin and VC effervescent tablets; (d),(e),(f):Corresponding baseline correction effect 表1 傳統(tǒng)方法和本文方法在過校正處的特征峰強度對比Table 1 Comparison of characteristic peak intensities at the over-fitting position 作為算法驗證對比,采用中天鋒公司近紅外拉曼光譜檢測儀RM-ZTF-600 (激光波長785 nm,功率50 mW,分辨率4 cm-1,光譜范圍200~1 500 cm-1)對上述樣品檢測,并與本文結(jié)果對比(圖8):由于紫外拉曼光譜儀設(shè)計的光譜范圍較寬(利于提取更豐富的光譜信息)造成光譜分辨率降低,某些特征峰密集處出現(xiàn)峰的包絡(luò),但其位置與近紅外拉曼光譜一致 (小蘇打1 450 cm-1,阿司匹林1 294和1 336cm-1處以及VC 706和734 cm-1等處),除此之外的特征峰位置也均與之對應(yīng),表明本文實驗及校正方法是正確可行的。紫外與近紅外拉曼光譜特征峰的差異與激發(fā)波長有關(guān),不同激發(fā)波長下,樣品吸收、激光穿透深度和拉曼截面不同引起特征峰強度的變化[11-12],它們之間的關(guān)系有待后續(xù)進一步研究。 紫外拉曼檢測可在自然環(huán)境下實施,但其帶來的信號小和干擾強等問題需要更佳的基線校正和噪聲濾除方法來解決。本文針對傳統(tǒng)分段線性基線校正方法需要人工定義初始擬合數(shù)據(jù)點,過度依賴操作人員經(jīng)驗、自動化水平程度較低等問題,根據(jù)266 nm紫外拉曼光譜的特點,研究了一種改進的紫外拉曼光譜分段線性擬合基線校正方法,基于原始混合光譜數(shù)據(jù)經(jīng)過Savitzky-Golay濾波平滑迭代,利用光譜強度偏差比較自動確定準(zhǔn)有效基線點位置;然后不斷線性迭代擬合修正,直到特征峰上的所有點都在基線及其以上位置,自動得到最終的基線分布;最后混合光譜減去基線分布即得到校正的紫外拉曼光譜。通過對模擬和實際測量的紫外混合拉曼光譜基線校正,證明了方法的有效性,可為下一步的紫外拉曼光譜分析提供準(zhǔn)確的光譜數(shù)據(jù),對實現(xiàn)諸如爆炸物、毒品以及食品和藥品等的定性定量檢測具有重要意義。 圖8 紫外與近紅外拉曼光譜基線校正效果(a):小蘇打;(b):阿司匹林;(c):VC泡騰片F(xiàn)ig.8 Baseline correction effect of ultraviolet and near-infrared Raman spectrum(a):The baking soda;(b):Aspirin; (c):VC effervescent tablets2 結(jié)果與討論
2.1 模擬光譜驗證校正效果
2.2 實驗及光譜校正
3 結(jié) 論